Задать вопрос

Сергей Соколов @sergiks

♬♬

машинное-обучение

Машинное обучение

Как лучше находить и распознавать в изображении текст известного шаблона?

На белом фоне напечатаны номера: всегда N символов из ограниченного алфавита, исключающего смешение: нет единиц и маленьких «L», нет нулей и букв «O». Шрифт — похоже, моноширинный, матричный принтер низкого разрешения, почти Брайль, отдельные точки.

пример кода

Хочется находить на фото и распознавать такие коды. Фотографии под разными углами, в разных масштабах, где-то код занимает всю ширину кадра, где-то он скромно-мелко наискосок в углу снимка. Лишние тени и блики.

Какая модель-сеть умеет искать шаблон на изображении в разных масштабах и под разными углами, чтобы потом в определившемся четырёхугольнике распознать ровно N символов?

Читал про multi-scale CNN – по сути несколько конволюционных сетей работают параллельно, с картинкой в разных разрешениях: 1:1, 1:2, 1:4. Не уверен, самое ли это эффективное решение, когда известны пропорции разыскиваемого принта.

Чем-то задача похожа на распознавание автомобильных номеров, и даже проще в том, что точно известен шаблон, длина, и фон почти без лишних деталей.

Вопрос задан более трёх лет назад
30 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+3 ещё

Простой
Как повысить точность классификации по табличным документам?
- 2 подписчика
- 19 мая
- 258 просмотров
1

ответ
Машинное обучение

+2 ещё

Средний
Какие виды эмбединга используется в nlp?
- 1 подписчик
- 10 мая
- 89 просмотров
1

ответ
Машинное обучение

Средний
В чем преимущество позиционного кодирования синусами?
- 1 подписчик
- 25 апр.
- 103 просмотра
1

ответ
Машинное обучение

Простой
Как обучается трансформер?
- 1 подписчик
- 25 апр.
- 90 просмотров
1

ответ
Python

+2 ещё

Средний
GeForce GTX 1650 > RTX A2000 — как такое возможно?
- 2 подписчика
- 15 апр.
- 735 просмотров
2

ответа
Машинное обучение

+2 ещё

Средний
Какие архитектуры с механизмом внимания появились после transformer?
- 2 подписчика
- 11 апр.
- 168 просмотров
1

ответ
Python

+4 ещё

Средний
Как реализовать фарм-бота для игры Rush Royale?
- 1 подписчик
- 01 апр.
- 701 просмотр
2

ответа
Регулярные выражения

+2 ещё

Простой
Поиск оптимальной регулярки для бинарной классификации строк. Как?
- 1 подписчик
- 22 мар.
- 196 просмотров
1

ответ
Нейронные сети

+1 ещё

Простой
Какие есть способы сделать динамическое квантование LLM в GGUF?
- 1 подписчик
- 29 янв.
- 122 просмотра
0

ответов
Машинное обучение

+2 ещё

Средний
Как обучить локальную модель своему голосу?
- 1 подписчик
- 26 янв.
- 367 просмотров
1

ответ
Показать ещё Загружается…

React-разработчик (frontend) с опытом работы в области ML

DevTeam.Space

от 2 000 до 3 000 $

ML-разработчик (CV, LLM, Python backend)

brAInwave

от 200 000 до 500 000 ₽

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽