Что за разметка текстового файла? \b \i \p ...
RTF?
Судя по всему, это разметка для читалки наладонника.
Самый лёгкий способ прочитать это - написать за пять минут на коленке парсер этой фигни в html, как я, собственно, и сделал.
скорее всего да - разметка для читалки. вопрос - что за читалка.
чистить и писать парсер ломает.
Там же всё элементарно - \aNNN - это символ с кодом NNN, абзацы бьются по строкам, всякие там \i, \b - модификаторы "включить/выключить режим i, включить/выключить режим b", то есть, просто помнишь текущее состояние, и, самый простой вариант, когда встречается новая команда - закрываешь все открытые теги модификаторов, меняешь у нужного текущее состояние и открываешь по новой (хотя можно и без таких излишеств а \p\C0="..." - это <h2>...</h2>, можно простым регэкспом обойтись.
\C0 - чаптер уровня 0
\БУКВА - открыть/закрыть тэг, это и так всё видно.
Такую разметку кушает eReader.
http://ebooks.palm.com/product/detail/19286
Есть ли он под отличные от PalmOS ОСи и чем конвертировать, не знаю.
\C0 - чаптер уровня 0Там других и нету. Кроме того, перед \C0 (и только перед ним) всегда стоит \p.
не надо мне формат разъяснять он и так тривиальный.Ну так напиши парсер, там дел действительно на пять минут, дольше в интернете ответ искать будешь.
там есть \C1
Да?
А может, проще найти нормальный текст поттера?
Ну, убрать из этого всё форматирование даже легче, чем преобразовать его в нормальный вид
Оставить комментарий
yolki