rtf(doc) 2 xml (html)

dennis789

Возникла сабжевая проблема.
После изучения вопроса в инете нашел несколько возможных вариантов.
1. Ставить Java и вперед. С этим трахаться неохота. Java спецов нету, все рухнет.
2. Для виндовых серверов есть разные утилитки, но совершенно непонятно, насколько они окажутся эффективными. В принципе вариант получше предыдущего.
3. Парсер на Perl'e или PHP. В принципе это был бы идеальный вариант, но тут вообще мало инфы.
Здесь наверняка есть люди, работающие в интернет конторах. Посоветуйте, как решать эту проблему.
Бесплатность не есть критерий. Главное решить проблему.

Aleksei66

Тебе один раз сконвертировать или на поточной основе? Если 1 раз, то KWord умеет, если несколько, то ХЗ, можно в исходниках KWord узнать, как он это делает.

Aleksei66

Кстати, можно через Word Automation работать, только точно надо архитектуру doc документа надыбать.

Aleksei66

Кстати, я стормозил. Word сам умеет сохранять в html. Поэтому все, что нужно, это написать на C++, C#, VB или еще чем-нибудь макрос для ворда, который открывает документ и сохраняет его в html. Вот например сохранение -


Sub Macros1
ChangeFileOpenDirectory _
"E:\Documents and Settings\Me\Desktop\"
ActiveDocument.SaveAs FileName:="m.htm", FileFormat:= _
wdFormatHTML, LockComments:=False, Password:="", AddToRecentFiles:=True, _
WritePassword:="", ReadOnlyRecommended:=False, EmbedTrueTypeFonts:=False, _
SaveNativePictureFormat:=False, SaveFormsData:=False, SaveAsAOCELetter:= _
False
ActiveWindow.View.Type = wdWebView
End Sub

dennis789

Ворд в ужасном виде умеет сохранять.
А нужно, чтобы добавлять документы на сайт. Чтобы пользователь сделал туда аплоад .rtf файла, и содержимое само добавилось на сайт.

Aleksei66

На мой взляд он сохраняет нормально. Но если так, то я бы стал действовать так
1) поискал бы конвертер rtf в html. Rtf не особо сложный, по сравнению с doc, формат и конвертеры наверняка должны быть.
2) если бы не нашел, написал бы сам.
Оставить комментарий
Имя или ник:
Комментарий: