RTF 2 HTML

kruzer25

Посоветуйте, плз, чем (по возможности полегче) переконвертировать rtf в html?
Насклоько я понимаю, это практически одинаковые языки, только с разным синтаксисом - так что конвертирование, наверное, может делаться вообще через какие-нибудь регулярные выражения, без всякого там разбора...
Гугль вывалил кучу вариантов, но я не знаю, какой из них лучше...
Что скажете насчёт http://sourceforge.net/project/showfiles.php?group_id=93635 или http://www.w3.org/Tools/HTMLGeneration/rtf2html.html (интересно, скомпилируется ли оно под интериксом?)?

kruzer25

Ладно, хрен с ним, с форматированием, буду, как и раньше, в txt сохранять.
Программа с sourceforge забила на абзацы - в результате, хоть все заголовки и выдавались правильно, основной текст на строки не бился вообще; а unrtf с w3 после обработки пары килобайт исходного текста валился с segfault-ом

igorpopkoff

присылай себе ртфки аттачами на gmail и выбирай view as html, лол.
Я так дома читаю экселевские листки, поскольку ненавижу редакторы спредшитов всей душой

kruzer25

Данунах.
Кстати, а в каком из вариантов 2007 офиса есть экспорт в пдф?

juliuzz

ни в каком
адобе зажопила

igorpopkoff

нашёл чо спросить. У меня на работе 2003 офис и какой-то гнутый пдф-ный принтер, который отлично с этим справляется. Зачем морочиться с вариантами этими - хз.

kruzer25

Уже разобрался, похоже, во всех вариантах (2007го, естественно).
Так что мне хватит basic-офиса...

juliuzz

ставь PDFCreator
он халявный
возьми на sourceforge

kruzer25

и какой-то гнутый пдф-ный принтер
Тут был длинный пост, но его тут нет, потому что упс, сцуко, в первый раз не сработал.
В общем, для 2метрового (в утф-8) хтмл файла с книжкой, например, right pdf printer (для других принтеров, скорее всего, будет так же) выдаёт 50метровый pdf без сжатия или 5метровый со сжатием; кроме того, этот получившийяс pdf очень медленно обрабатывается (на порядок-два медленнее нормальных пдф и на слабых устройствах (например, мой ридер, для которого это всё и делается при переходе на следующую страницу думает 10-20 сеунд, прежде чем начать её отрисовывать).
При этом, подправленный для работы с русским текстом dompdf (при использовании cpdf как, скорее всего, и любая другая подобная программа, выдаёт 1.5/0.5 (без сжатия/со сжатием) результат, который мгновенно обрабатывается тем же ридером.

igorpopkoff

дай мне ссылку на книжку двухмеговую хтмл-ную, я проверю

kruzer25

Да хотя бы это, хотя там в утф8 будет уже метра 3 с половиной, наверное...

igorpopkoff

Я уже Улисса ему скормил, PDFCreator пока тупит, ща расскажу о результатах.

igorpopkoff

http://lib.ru/DVOJS/ulysses.txt
# огл(1810k) [ 677] Ulysses
пдф весит 2351к

igorpopkoff

или надо было ещё конвертировать в утф-8?

kruzer25

Это тебе пдф-принтер такую пдфку сделал?
Можешь его настроить так, чтобы он сжатие не использовал, и выложить куда-нибудь результат? (Интересно посмотреть, что там будет внутри - мб он тогда и мне подойёдт).

igorpopkoff

лень что-то искать настройки и выкладывать, скачай да посмотри: http://sourceforge.net/projects/pdfcreator/
думаю, не убудет. 13 мегов.

kruzer25

думаю, не убудет. 13 мегов.
Ты слишком хорошо обо мне думаешь
Похоже, эксперименты с этим pdf creator-ом откладываются на несколько недель...

igorpopkoff

Ну ёп, тебе же надо =)

kruzer25

Но возможности выкачать 15 метров у меня от этого не появляется
Оставить комментарий
Имя или ник:
Комментарий: