Подскажите вменяемый конвертер PDF->text
можно конечно и самим Acrobat'ом делать, но могут возникнуть косяки со шрифтами.
нужно 20 документов по 400 страниц перевести в нечто подобное HTML
перед этим склей pdf в один файл.
и мноооооого места в темпе
узкое место - таблицы, причём во множестве. их-то и нужно вручную размечать в FineReader-е.
на 400 страниц ~50 таблиц. размером по страницу-две.
хочется, чтобы разметка взялась как должна быть, а не как придумает FR.
PDF2TXT пробовал ?
Закинь в мне в шару документ, я конвертну PDF2TXT и посмотришь результат - вдруг подойдет.
пробовал ABBYY PDF Transformer, Solid PDF COnverter.
Пока самый хороший результат у ABBYY Fine Reader-a, но я уже заколебался таблицы выравнивать
Это невменяемый конвертер - навернул кодировки и форматирование.
даже Ctrl-Ins+Shift-Ins в адоберидере вменяемее..
Оставить комментарий
yolki
размеченный. любой, HTML, XML...важно сохранить начертание, разбиение на абзацы и структуру таблиц.
ну может, цвет ещё.