Существует ли конвертор DOC -> HTML?

vijrel7878

который бы генерил приемлемый html?

mr82

MS Word
Ещё OpenOffice вроде.

poshta

MS Word
А что ты понимаешь под "приемлемым html"?

Elina74

Ворд мне не нравится, например тем:
Есть длинный текст, набранный одним и тем же шрифтом. Ворд всегда в начале каждого абзаца пишет:
</p><p align="justify"><font face="Times New Roman" size="NNN">
Хотя было бы достаточно написать это один раз в начале текста.

vlfdimir58

word + dreamweaver

peter1dav

Это смертельно?

mr82

Да мне он тоже совсем не нравиться. Но если что-то этакое надо сделать, то Word'ом конвертить в html, а дальше ручками убирать мусор.

Elina74

лишние килобайты текста = мусор => раздражает.

vijrel7878

может я что не так делаю, но dreamweaver у меня нагенерил какую-то пургу... (делал импорт)

vijrel7878

word генерит xml.
Мне нужна прога, в которй бы я смог задать какое форматирование оставлять, какие таги можно использовать...
Что б всяких там font вооще, к примеру, не было.
В общем, как можно больший контроль над происходящим нужен.
Помниться что-то Голубицкий в компутерре писал по этому поводу, но найти не могу...

dus1970

wvHtml

viktor_09

Сохраняешь вордом, а потом Дримвейвером открываешь. Там есть специальная опция для очистки вордовского html от лишних тегов. Работает эта штука медленно, но и чистит более менее приемлемо.

vijrel7878

именно так и делал.
Получилась херня полная

varya_no

wvHtml - реально хорошая штука. еще в крайних случаях может catdoc помочь, но он только в текст переводит.

vijrel7878

а где его взять? lorien что-то не находит...

renozarip

поставь 97 Word

dsv087

html tidy попробуй. там есть опция "убить вордовские излишки", "заменить теговое форматирование на стилевое", "убить все форматирование"(т.е. оставить только смысловые, типа P, B, H1, и тп..) и тд.
Оставить комментарий
Имя или ник:
Комментарий: