Задать вопрос
@ProgerFromGod

Как добиться распознавания текста и цифр в 99,9%?

У меня задача, распознавать текст и цифры с видео.
Пока реализация такая, делается скриншот, и подключена библиотека tesseract ocr. Но точность распознания примерно 95%. Платные библиотеки выходят очень дорого. (так как получается большое количество скриншотов)

А мне надо достичь 99-100%. Как это сделать?? Если обучить самому нейронку это поможет?
  • Вопрос задан
  • 60 просмотров
Подписаться 1 Средний Комментировать
Пригласить эксперта
Ответы на вопрос 2
GavriKos
@GavriKos
Посмотреть чем нераспознанные скрины отличаются от распознанных, какие у них уникальные признаки, и дальше уже думать можно ли их привести к виду тех которые распознаются.
Ответ написан
@rPman
Низкое качество каждого кадра видео по отдельности, но человеческий мозг вытягивает из нескольких соседних кадров информацию и распознает

У тебя условно два пути:
1. попытаться из видео какими-то методами, не обязательно нейронной сетью, вытянуть повышение качества изображения, и уже на нем проводить распознавание
2. собрать 3d обучающую выборку, где одним примером является серия соседних кадров одного и того же участка (можно кстати комбинировать методы из 1 пути, для центрирования искомой части изображения, что бы можно было распознавать в движении)

Второй метод универсальнее, и в каком то смысле проще, если ты сможешь собрать большую обучающую выборку.. но первый даст прогнозируемое качество.

Для первого, пример использования - stacking, используемый в астрофотографии
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы