Возможно ли преобразование форматов:*.djvu -> *.doc/txt
файнридер
"FineReader открывает файлы следующих форматов:
PDF:
Файлы в формате PDF, версии 1.4 или ранней
BMP:
2-битный - черно-белый
4- и 8-битный - Palette
16-битный
24-битный - Palette и TrueColor
32-битный
PCX, DCX:
2-битный - черно-белый
4- и 8-битный - Palette
24-битный - TrueColor
JPEG:
серый и цветной
JPEG 2000:
серый и цветной
TIFF:
черно-белый - несжатый, CCITT3, CCITT3FAX, CCITT4, Packbits, ZIP
серые - несжатый, Packbits, JPEG, ZIP
TrueColor - несжатый, JPEG, ZIP
Palette - несжатый, Packbits, ZIP
многостраничный TIFF
PNG:
черно-белый, серый, цветной"
что тебе надобно ? текст выдрать ? воспользуйся OCR
И что? Ты не можешь перегнать из ДежаВю в стандартные графические форматы?
не могу
да, текст.. спасибо! сейчас попробую
ой, ты прав(а) получилось
Есть спец прога в комплекте для OCR. OCR в данном контексте (ХЗ как аббревиатура расшифровывается) - введене в дежавю файл инфы о том где какая буква на странице, что в итоге позволяет искать в файле текст.
Действия следующие: сделать из дежавюшки кучу графических файлов, распознать в файнридере и потом внедрить полученное в исходную дежавюшку. Размер файла увеличивается где-то на 20%. Если делаешь для себя - то это один из лучших вариантов, т.к. некорректно распознанное файнридером можно прочитать в оригинале.
Софт с описаловом смотри здесь
(Если интересно: OCR - Optical Character Recognition)
Там ставить ничего не надо. Все,что там есть - это консольные проги. Одна - делает из дежавюшки графику, вторая - выдирает из временных файлов файнридера инфу о распознанном тексте (самое прикольное, что файнридер даже регить для этого не надо %) а третья - добавляет в дежавюшку файл с распознанным.
Оставить комментарий
areol77
ПОДСКАЖИТЕ PLZ ПРОГУ (если такая есть, конечно, ОСУЩЕСТВЛЯЮЩУЮ :*.djvu -> *.doc/txt )