Как лучше находить и распознавать в изображении текст известного шаблона?

На белом фоне напечатаны номера: всегда N символов из ограниченного алфавита, исключающего смешение: нет единиц и маленьких «L», нет нулей и букв «O». Шрифт — похоже, моноширинный, матричный принтер низкого разрешения, почти Брайль, отдельные точки.
пример кода
5eff713b03334878857954.jpeg


Хочется находить на фото и распознавать такие коды. Фотографии под разными углами, в разных масштабах, где-то код занимает всю ширину кадра, где-то он скромно-мелко наискосок в углу снимка. Лишние тени и блики.

Какая модель-сеть умеет искать шаблон на изображении в разных масштабах и под разными углами, чтобы потом в определившемся четырёхугольнике распознать ровно N символов?

Читал про multi-scale CNN – по сути несколько конволюционных сетей работают параллельно, с картинкой в разных разрешениях: 1:1, 1:2, 1:4. Не уверен, самое ли это эффективное решение, когда известны пропорции разыскиваемого принта.

Чем-то задача похожа на распознавание автомобильных номеров, и даже проще в том, что точно известен шаблон, длина, и фон почти без лишних деталей.
  • Вопрос задан
  • 29 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы