Задать вопрос
@0xC0CAC01A

Как надёжно распознавать старинные тексты под линуксом из командной строки?

Как например, сѣй тѣкстъ. Там, кстати, присутвует слой распознонного текста, но вы можете видеть, насколько это распознавание безобразно, а ведь нужен поиск по фамилиям.
  • Вопрос задан
  • 623 просмотра
Подписаться 3 Оценить 1 комментарий
Помогут разобраться в теме Все курсы
  • Яндекс Практикум
    Системный администратор
    6 месяцев
    Далее
  • Skillfactory
    DevOps-инженер
    6 месяцев
    Далее
  • Хекслет
    DevOps-инженер с нуля
    14 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 1
eapeap
@eapeap
Сисадмин, Беларусь
Дело было давно - нужно было распознать белорусские тексты (в кирилических текстах символы i, ў), а ФайнРидер этого тогда еще не умел, но в нем есть обучение. Провел обучение на 2-х страницах, остальное он распознал сам без проблем.
Так что как-то так: берете ФайнРидер или другую распознавалку, которая есть для Линукса, обучаете вручную, а потом из командной строки натравливаете обученную распознавалку на сканы.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы