Почему из PDF на русском языке копируется так? win7

Fimida

"RASHODY NA WNEDRENIE SREDSTW TEORII UPRAWLENIQ I ISSLEDOWANIQ
OPERACIJ W OPREDELENNOJ MERE TSQ ODNOJ IZ FORM INWESTICIJ W NOWYE PROIZWODSTWA. pRED-
PRIQTIE, GDE \TI SREDSTWA TSQ I, ZNA^IT, SOWER[TSQ, ^EREZ NEKOTOROE WREMQ BUDET
SPOSOBNO PROIZWODITX TO, ^TO BEZ \TI SREDSTW PROIZWESTI NELXZQ. tO^NO TAKVE OBSTOIT DELO S -
BYMI DRUGIMI INSTRUMENTAMI ISPOLXZUEMYMI W BOJ OBLASTI DEQTELXNOSTI"
- пример.

durka82

Потому, что глаза читают не распознанный текст, а в текстовый слой можно засунуть что угодно.

Fimida

Да, но как получить копирование русских букв в русские буквы же?

yolki

ABBYY PDF Transformer

durka82

Скорее всего придётся распознавать текст.

Fimida

Почему?

alfadred

Ну, судя по примеру, может помочь просто транслит.

durka82

Потому что сейчас в этом документе русского текста нет.
Конечно можно попробовать сделать обратную транслитерацию, но не факт, что поможет на 100% + ещё не факт, что это именно транслитерация.

SPARTAK3959

А это точно не отбрасывание старшего бита в koi8-r?

Serab

ты крут, почему-то не подумалось, давно не видел странички в этом транслите :grin:

$ iconv -f KOI-7 txt
"расходы на внедрение средств теории управления и исследования
операций в определенной мере являются одной из форм инвестиций в новые производства. Пред-
приятие, где эти средства используются и, значит, совершенствуются, через некоторое время будет
способно производить то, что без эти средств произвести нельзя. Точно также обстоит дело с лю-
быми другими инструментами используемыми в любой области деятельности"

Serab

Денис, вот это тебе поможет, копируй текст сюда
http://www.artlebedev.ru/tools/decoder/

Fimida

Спасибо.
Оставить комментарий
Имя или ник:
Комментарий: