Help как правильно выдрать из PDF текст.?

babairus

Выдираю текстб а там глюки с кодировкой - получаются каракули... Что сделать?

alshevskaya

1) Использовать русскоязычный Acrobat
2) Использовать FineReader

maggi14

к сожалению, ничего легкого.

zxcv

Я же уже писал по этому поводу!
Самый лучший способ это ABBYY PDF Transformer!
www.abbyy.ru

gsharov

Зодлбал его рекламировать Тот же файн ридер, только без возможности проверки

AlexV769

у тебя hot-key на эту фразу забинден что ли?

flaoxo

Самый лучший способ это ABBYY PDF Transformer!
Вчера опробовал - толку мало. Текст + таблица + 1-2 картинки в тексте и становиться жалко потраченного времени. Fine Reader заруливает его однозначно.

AlexV769

[hint] PDF Transformer == обрезанный FineReader

flaoxo

Это понятно. Но надеялся на лучшее.

AlexV769

ииз нормальных pdf всё экспортирется в rtf без проблем. напрямую в Adobe Acrobat "Save as..." "rtf"

flaoxo

Просто в тексте было 5 табличек и рисунков несколько, остальное текст - коряво очень получилось. Пришлось Fine Reader'ом делать.
Оставить комментарий
Имя или ник:
Комментарий: