Предварительная обработка сканов перед DjVu
http://bolega.hotmail.ru/ - там сама программа и инструкция к ней.
Не проверял, как она справляется, но в описании указано, что она умеет это делать.
Программа предназначена для автоматизации обработки изображений страниц книг,
полученных в результате сканирования.
Основные функции:
- конвертация формата и DPI изображений;
- разворот изображений на 90, -90, 180 градусов;
- автоматическое исправление наклона страниц;
- разрезание разворотов страниц на две отдельные страницы;
- автоматическое определение ширины книги и приведение размеров всех ее страниц к
единому значению, автоматическое исправление полей страниц;
- убирание лишних или «грязных» полей;
- убирание черных полос на развороте страниц;
- полу-автоматическая чистка черных полос (как правило, на развороте «налезающих»
на текст (в настоящей версии функция работает, но не совсем стабильно, поэтому
вынесена в пост-обработку);
- гибкие правила по именования выходных файлов (добавление префикса, нумерация с
шагом, нумерация начиная с определенного значения);
- smart-сортировка имен исходных файлов: правильно расположит файлы типа
[xxx]1.tif, [xxx]1[x].tif, [xxx]2.tif, …, [xxx]100.tif, …
где [xxx] – произвольный опциональный префикс, [x] – произвольный опциональный
однобуквенный суффикс;
- высокая скорость обработки: от 7 (600dpi – исходный, 300dpi – конечный) до 30
(300dpi-300dpi) разворотов страниц в минуту. (Данные для P-IV-2400).
Поддерживаемый формат исходных файлов: BMP (сжатый и несжатый TIFF (все
форматы включая LZW GIF.
Поддерживаемый формат конечных файлов: BMP (несжатый TIFF (сжатый и
несжатый).
Поддерживаемое значение DPI исходных файлов: все.
Поддерживаемое значение DPI конечных файлов: 300, 600, а также режим сохранения
DPI равным его значению в исходном файле.
Поддержка серых (256) и цветных изображений: есть, но практически не
тестировалась.
Программа работает в пакетном режиме, но с полной визуализацией исходного и
конечного результатов. Процесс обработки проходит в два этапа: на первом этапе
пользователь формирует задание: задает для каждой станицы или целой группы страниц
определенное правило обработки. На втором этапе происходит собственно сама обработка
изображений в соответствии с построенными правилами. Процесс составления задания
полностью интерактивный и визуальный. Задания можно сохранять в файл для повторного
использования или корректировки. После завершения обработки задания пользователь имеет
возможность тут же просмотреть результат, сверить его с оригиналом, и при необходимости
вернуться к заданию и отредактировать его правила, целиком, или для любых выборочных
страниц.
Круто, вроде то, что надо, щас проверю.
Оставить комментарий
Lenchans
Есть 1,5 гига сканов, хочу перевести это добров дежавю. Посканено не особо качественно: некоторые сканы довольно сильно наклонены и по-разному расположены на странице. Хочется как-то это дело обрезать, чтобы потом поменьше ненужного попало в дежавю.Наклон страницы меня не особо напрягает, но наклоненную страницу нужно обрезать пошире. Та прога, которой я сейчас пользуюсь, позволяет поворачивать/обрезать только на одинаковый для всех картинок угол.В связи с этим интересно, что можно сделать, чтобы найти допустимые границы обрезания. Или может кто знает прогу, чтобы она сама находила, как можно обрезать картинку, чтобы все нужное в кадр попало.