Подскажите вменяемый конвертер PDF->text
лучше FineReader'а не видел пока.
можно конечно и самим Acrobat'ом делать, но могут возникнуть косяки со шрифтами.
можно конечно и самим Acrobat'ом делать, но могут возникнуть косяки со шрифтами.
Fine reader задалбывает.
нужно 20 документов по 400 страниц перевести в нечто подобное HTML
нужно 20 документов по 400 страниц перевести в нечто подобное HTML

на ночь оставь.
перед этим склей pdf в один файл.
перед этим склей pdf в один файл.
и мноооооого места в темпе
а смысл? производительность не узкое место.
узкое место - таблицы, причём во множестве. их-то и нужно вручную размечать в FineReader-е.
на 400 страниц ~50 таблиц. размером по страницу-две.
хочется, чтобы разметка взялась как должна быть, а не как придумает FR.
узкое место - таблицы, причём во множестве. их-то и нужно вручную размечать в FineReader-е.
на 400 страниц ~50 таблиц. размером по страницу-две.
хочется, чтобы разметка взялась как должна быть, а не как придумает FR.
PDF2TXT пробовал ?
Закинь в мне в шару документ, я конвертну PDF2TXT и посмотришь результат - вдруг подойдет.
держи, пробуй.
пробовал ABBYY PDF Transformer, Solid PDF COnverter.
Пока самый хороший результат у ABBYY Fine Reader-a, но я уже заколебался таблицы выравнивать

пробовал ABBYY PDF Transformer, Solid PDF COnverter.
Пока самый хороший результат у ABBYY Fine Reader-a, но я уже заколебался таблицы выравнивать

Это невменяемый конвертер - навернул кодировки и форматирование.
я уже заметил
.
даже Ctrl-Ins+Shift-Ins в адоберидере вменяемее..
.даже Ctrl-Ins+Shift-Ins в адоберидере вменяемее..
Оставить комментарий
yolki
размеченный. любой, HTML, XML...важно сохранить начертание, разбиение на абзацы и структуру таблиц.
ну может, цвет ещё.