Предварительная обработка сканов перед DjVu

Lenchans

Есть 1,5 гига сканов, хочу перевести это добров дежавю. Посканено не особо качественно: некоторые сканы довольно сильно наклонены и по-разному расположены на странице. Хочется как-то это дело обрезать, чтобы потом поменьше ненужного попало в дежавю.
Наклон страницы меня не особо напрягает, но наклоненную страницу нужно обрезать пошире. Та прога, которой я сейчас пользуюсь, позволяет поворачивать/обрезать только на одинаковый для всех картинок угол.В связи с этим интересно, что можно сделать, чтобы найти допустимые границы обрезания. Или может кто знает прогу, чтобы она сама находила, как можно обрезать картинку, чтобы все нужное в кадр попало.

elena-kotenok75

М.б. ScanKromsator`ом?
http://bolega.hotmail.ru/ - там сама программа и инструкция к ней.
Не проверял, как она справляется, но в описании указано, что она умеет это делать.
Программа предназначена для автоматизации обработки изображений страниц книг,
полученных в результате сканирования.
Основные функции:
- конвертация формата и DPI изображений;
- разворот изображений на 90, -90, 180 градусов;
- автоматическое исправление наклона страниц;
- разрезание разворотов страниц на две отдельные страницы;
- автоматическое определение ширины книги и приведение размеров всех ее страниц к
единому значению, автоматическое исправление полей страниц;
- убирание лишних или «грязных» полей;
- убирание черных полос на развороте страниц;
- полу-автоматическая чистка черных полос (как правило, на развороте «налезающих»
на текст (в настоящей версии функция работает, но не совсем стабильно, поэтому
вынесена в пост-обработку);
- гибкие правила по именования выходных файлов (добавление префикса, нумерация с
шагом, нумерация начиная с определенного значения);
- smart-сортировка имен исходных файлов: правильно расположит файлы типа
[xxx]1.tif, [xxx]1[x].tif, [xxx]2.tif, …, [xxx]100.tif, …
где [xxx] – произвольный опциональный префикс, [x] – произвольный опциональный
однобуквенный суффикс;
- высокая скорость обработки: от 7 (600dpi – исходный, 300dpi – конечный) до 30
(300dpi-300dpi) разворотов страниц в минуту. (Данные для P-IV-2400).
Поддерживаемый формат исходных файлов: BMP (сжатый и несжатый TIFF (все
форматы включая LZW GIF.
Поддерживаемый формат конечных файлов: BMP (несжатый TIFF (сжатый и
несжатый).
Поддерживаемое значение DPI исходных файлов: все.
Поддерживаемое значение DPI конечных файлов: 300, 600, а также режим сохранения
DPI равным его значению в исходном файле.
Поддержка серых (256) и цветных изображений: есть, но практически не
тестировалась.
Программа работает в пакетном режиме, но с полной визуализацией исходного и
конечного результатов. Процесс обработки проходит в два этапа: на первом этапе
пользователь формирует задание: задает для каждой станицы или целой группы страниц
определенное правило обработки. На втором этапе происходит собственно сама обработка
изображений в соответствии с построенными правилами. Процесс составления задания
полностью интерактивный и визуальный. Задания можно сохранять в файл для повторного
использования или корректировки. После завершения обработки задания пользователь имеет
возможность тут же просмотреть результат, сверить его с оригиналом, и при необходимости
вернуться к заданию и отредактировать его правила, целиком, или для любых выборочных
страниц.

Lenchans

Круто, вроде то, что надо, щас проверю.
Оставить комментарий
Имя или ник:
Комментарий: