Достать текст из пдфа

Dmitry08

КАк можно достать текст из пдф файла, который был набран предположительно в техе и потом сделан пдфом?
Когда текст выделяется и копируется, в блокноте вообще ничего нет - только курсор убегает.

stm5643616

Попробуй повставлять текст в другие места, КРОМЕ БЛОКНОТА.

Dmitry08

Ворд не справился. В качестве блокнота использую bred - достаточно хорошая вещь

stm5643616

Аплоадь сюда свою пдфку, посмотрим

slonishka

он юникод не поддерживает вроде. или уже поддерживает?

stm5643616

чето не получается. попытался перекодировать, не вышло. документик небольшой у тебя: пренаберешь за пару часов с нуля

Dmitry08

Это один из 14

yolki

похоже, этот документ специально сделали таким, чтобы его было не разобрать

Viktory-s

Да текст оригенальный.
Информация о фонтах:

pdffonts Nld07.pdf
name type emb sub uni object ID
------------------------------------ ------------ --- --- --- ---------
ECMICC+Academy.Boldi0133429 Type 1C yes yes no 319 0
ECMINJ+Dixieland0117430 Type 1C yes yes no 325 0
ECMIPJ+Academy0117431 Type 1C yes yes no 311 0
ECMJCD+Academy.Bold0133432 Type 1C yes yes no 313 0
ECMJKH+Wingdings0108433 Type 1C yes yes no 314 0
ECMKBH+Times.New.Roman.......0116.813435 Type 1C yes yes no 342 0
Symbol Type 1 no no yes 333 0
Times-Roman Type 1 no no no 331 0
ECMLND+Decor.Bold0116.813439 Type 1C yes yes no 334 0
ECMMGB+MT.Extra0116.688442 Type 1C yes yes no 346 0
ECMNDF+Times.New.Roman0116.688449 Type 1C yes yes no 352 0
ECMNFP+Fences.Plain0233.313451 Type 1C yes yes no 357 0
ECMNIJ+Symbol075452 Type 1C yes yes no 368 0
[none] Type 3 yes no no 365 0
[none] Type 3 yes no no 388 0
[none] Type 3 yes no no 392 0
[none] Type 3 yes no no 374 0
[none] Type 3 yes no no 381 0
ECNAAC+Arial0117493 Type 1C yes yes no 60 0
[none] Type 3 yes no no 61 0
[none] Type 3 yes no no 62 0
[none] Type 3 yes no no 63 0
[none] Type 3 yes no no 64 0
[none] Type 3 yes no no 65 0
[none] Type 3 yes no no 66 0
[none] Type 3 yes no no 67 0
ECNEHK+Arial...........0100551 Type 1C yes yes no 68 0
ECNFHG+Academy.Italic0117552 Type 1C yes yes no 69 0
[none] Type 3 yes no no 70 0
[none] Type 3 yes no no 71 0
[none] Type 3 yes no no 72 0
[none] Type 3 yes no no 73 0
[none] Type 3 yes no no 74 0
[none] Type 3 yes no no 75 0
[none] Type 3 yes no no 76 0
[none] Type 3 yes no no 77 0
AvantGarde-Book Type 1 no no no 93 0
[none] Type 3 yes no no 94 0
[none] Type 3 yes no no 95 0
[none] Type 3 yes no no 96 0
[none] Type 3 yes no no 97 0
[none] Type 3 yes no no 98 0
[none] Type 3 yes no no 99 0
[none] Type 3 yes no no 100 0
[none] Type 3 yes no no 101 0
AvantGarde-Demi Type 1 no no no 106 0
[none] Type 3 yes no no 107 0
[none] Type 3 yes no no 108 0
[none] Type 3 yes no no 109 0
ECOHPJ+Times.New.Roman0116.563785 Type 1C yes yes no 112 0
ECOIFP+Fences.Plain0233.125782 Type 1C yes yes no 113 0
ECOIHP+Academy0117675 Type 1C yes yes no 114 0
ECOJBH+Times.New.Roman.......0116.875788 Type 1C yes yes no 115 0
ECOJHO+Symbol0116.375792 Type 1C yes yes no 116 0
ECOJOE+Dixieland0117804 Type 1C yes yes no 117 0
ECOKIG+MT.Extra0116.375808 Type 1C yes yes no 118 0
ECOLJG+MT.Extra.Plain0116.563816 Type 1C yes yes no 119 0
[none] Type 3 yes no no 120 0
[none] Type 3 yes no no 121 0
[none] Type 3 yes no no 122 0
ECOMKH+Arial0117828 Type 1C yes yes no 174 0
ECONOD+Arial...........0100833 Type 1C yes yes no 175 0
ECONIF+Academy.Italic0117842 Type 1C yes yes no 176 0
ECONLJ+Wingdings0100821 Type 1C yes yes no 177 0

sub рулит. хрен получится такое чудо вытащить.

pansveta

Пробовал достать текст Акробатом, вот что он выдал:

Текст он нормально выдрал, а с формулами капут.

Yyuri73

Даже странно, что еще никто не предложил воспользоваться FineReader`ом? вроде бы текст распознается, ну а формулы перенабрать?
Оставить комментарий
Имя или ник:
Комментарий: