Подскажите вменяемый конвертер PDF->text

yolki

размеченный. любой, HTML, XML...
важно сохранить начертание, разбиение на абзацы и структуру таблиц.
ну может, цвет ещё.

AlexV769

лучше FineReader'а не видел пока.
можно конечно и самим Acrobat'ом делать, но могут возникнуть косяки со шрифтами.

yolki

Fine reader задалбывает.
нужно 20 документов по 400 страниц перевести в нечто подобное HTML

AlexV769

на ночь оставь.
перед этим склей pdf в один файл.

AlexV769

и мноооооого места в темпе

yolki

а смысл? производительность не узкое место.
узкое место - таблицы, причём во множестве. их-то и нужно вручную размечать в FineReader-е.
на 400 страниц ~50 таблиц. размером по страницу-две.
хочется, чтобы разметка взялась как должна быть, а не как придумает FR.

Alexey1977

PDF2TXT пробовал ?

Alexey1977

Закинь в мне в шару документ, я конвертну PDF2TXT и посмотришь результат - вдруг подойдет.

yolki

держи, пробуй.
пробовал ABBYY PDF Transformer, Solid PDF COnverter.
Пока самый хороший результат у ABBYY Fine Reader-a, но я уже заколебался таблицы выравнивать

Alexey1977

Это невменяемый конвертер - навернул кодировки и форматирование.

yolki

я уже заметил .
даже Ctrl-Ins+Shift-Ins в адоберидере вменяемее..
Оставить комментарий
Имя или ник:
Комментарий: