Чем бы обработать сканы принтерных документов для улучшения качества?

Решил заняться уборкой и повыкидывать бумаги для которых ненужны оригиналы, предварительно их оцифровав (отсканировав).

Документы в основном печатные а-ля Word/Excel — всякие фактуры (соответственно текст и таблички из чёрных линий на белом листе плюс печать с подписью (обычно синие, но это не очень принципиально)), старые договора и т.п.

Проблема в том, что после сканирования фон получается не белым, а сероватым частично или полностью. Если снижать яркость — портится качество линий/текста. Если сохранять в честное Ч/Б — то появляются некрасивые зазубрины и т.п.

Соответственно задача — сделать серый фон чисто-белым (#FFFFFF в RGB), а текст/линии — чёткими и чёрными (может неплохо даже немного сгладить (anti-aliasing)).

При желании я, конечно, могу сделать это вручную через выделение грязи инструментами типа «magic wand», но это влом и что-то мне подсказывает что эта задача должна сравнительно легко автоматизироваться.

Из ОС в наличии Windows и Linux, командной строки не боюсь :-) но и опыта с автоматической обработкой графики раньше не имел. Сканирование ручное (в смысле не потоковое), форматы предпочтительно JPEG или TIFF.

Подскажите, если кто знает, инструмент.

UPDATE: Вот пример — imgur.com/emxvgKc
— это лучшее, чего удалось добиться от сканера (HP ScanJet 2400). Обратите внимание на серую линовку на белом фоне, в оригинале её, разумеется, не было, это каретка сканера гонит. В принципе если просто её удалить — уже хорошо.
  • Вопрос задан
  • 24730 просмотров
Решения вопроса 1
@Graube
Есть статья: www.djvu-soft.narod.ru/scan/twdragon_djvu.htm
В частности раздел про программу scankromsator
Ответ написан
Пригласить эксперта
Ответы на вопрос 4
@Chii
Если серьёзно и понормальному, то OCR

А если не серьёзно, то просто надо гамму подредактировать, отрезав светлую часть до уровня серого фона и вытянув остаток до упора.
imagemagick это умеет делать для небоящихся консоли и скриптов.
www.imagemagick.org/script/command-line-options.php

Если консоль таки сильно пугает или объём работы не большой, то в гимпе есть цветофильтр levels (уровни в русской локали) – очень наглядно и просто делают именно то, что надо.
Ответ написан
@Eddy_Em
Да хотя бы медианный фильтр 3х3 поможет (если, конечно, не сильно мелкое разрешение сканирования).
Ответ написан
Gimp + bimp. Далее либо гауссово размазывание, либо билетеральный фильтр.
Ответ написан
Комментировать
ValdikSS
@ValdikSS
ScanKromsator — то, что вам нужно.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
Wanted. Санкт-Петербург
от 80 000 до 150 000 ₽
Wanted. Санкт-Петербург
До 120 000 ₽
от 60 000 до 120 000 ₽
25 нояб. 2024, в 02:45
2000 руб./за проект
24 нояб. 2024, в 23:46
20000 руб./за проект