@0xC0CAC01A

Как надёжно распознавать старинные тексты под линуксом из командной строки?

Как например, сѣй тѣкстъ. Там, кстати, присутвует слой распознонного текста, но вы можете видеть, насколько это распознавание безобразно, а ведь нужен поиск по фамилиям.
  • Вопрос задан
  • 620 просмотров
Пригласить эксперта
Ответы на вопрос 1
eapeap
@eapeap
Сисадмин, Беларусь
Дело было давно - нужно было распознать белорусские тексты (в кирилических текстах символы i, ў), а ФайнРидер этого тогда еще не умел, но в нем есть обучение. Провел обучение на 2-х страницах, остальное он распознал сам без проблем.
Так что как-то так: берете ФайнРидер или другую распознавалку, которая есть для Линукса, обучаете вручную, а потом из командной строки натравливаете обученную распознавалку на сканы.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы