Сведения о вопросе

Htmlщик

23:23, 20th August, 2020

Теги

HTML    

Очистка HTML кода от тегов Microsoft Word (2000-2007)?

Просмотров: 314   Ответов: 11

Подскажите пожалуйста метод очистки HTML кода от тегов Word-a
Кода много, вручную не предлагать. (~10MB)

(юзер не использовал кнопку очистки от тегов в TinyMCE )


Необходимо обработать файл/базу для дальнейшего использования


пробовал: tidy, Word2003 web-filtered и еще пару инструментов, но результата ожидаемого не дало



  Сведения об ответе

prince

15:16, 15th August, 2020

В своё время отлично работала функция HTML Cleanup — MS Word Cleanup в Dreamweaver MX, ещё от Macromedia, до этих Adobe Creative Suite. Умело само определять версию ворда (97, 2000, ХР/2003) и очень круто работало…


  Сведения об ответе

DINO

01:10, 4th August, 2020

держите макрос для MSO 2003 (в 2007-2010 не проверял на работоспособность)
старенький, но рабочий.
www.businesssite.ru/content.php?id=5


  Сведения об ответе

SKY

10:46, 6th August, 2020

вот это www.artlebedev.ru/tools/technogrette/etc/reformator/ не смотрели? Мне Реформатор на ура помогал с такими вещами всегда.


  Сведения об ответе

dumai

08:45, 20th August, 2020

Для отдельных файлов, я раньше использовал вот этот сервис:
www.weare.ru/cgi-bin/clearhtml.cgi


  Сведения об ответе

$DOLLAR

23:26, 16th August, 2020

  Сведения об ответе

SKY

15:35, 22nd August, 2020

вот сервис, прекрасно работает www.sh14.ru/utils/avtomaticheskaya-ochistka-html-k...
принцип работы - удаляет весь мусор от ворда и все запрещенные атрибуты(а не теги, поэтому работает корректно с html 5)


  Сведения об ответе

PIRLO

19:32, 7th August, 2020

Посмотреть как работает очистка в tinymce, переписать на PHP и обработать все данные.


  Сведения об ответе

SEEYOU

23:56, 24th August, 2020

Вот еще один сервис, чистит почти все атрибуты тэгов
www.dataved.ru/2013/08/ms-word-document-filter.html


  Сведения об ответе

davran

00:11, 5th August, 2020

опробую и отпишусь


  Сведения об ответе

crush

01:40, 13th August, 2020

Есть хорошее решение для Django, которое мы разработали и активно используем на своих сайтах, чтобы клиенты не «пачкали» сайт.


  Сведения об ответе

PIRLO

10:22, 4th August, 2020

странно что никто не додумался, но попробуй регулярные выражения


Ответить на вопрос

Чтобы ответить на вопрос вам нужно войти в систему или зарегистрироваться