Задать вопрос

Сергей Соколов @sergiks

♬♬

машинное-обучение

Машинное обучение

Как лучше находить и распознавать в изображении текст известного шаблона?

На белом фоне напечатаны номера: всегда N символов из ограниченного алфавита, исключающего смешение: нет единиц и маленьких «L», нет нулей и букв «O». Шрифт — похоже, моноширинный, матричный принтер низкого разрешения, почти Брайль, отдельные точки.

пример кода

Хочется находить на фото и распознавать такие коды. Фотографии под разными углами, в разных масштабах, где-то код занимает всю ширину кадра, где-то он скромно-мелко наискосок в углу снимка. Лишние тени и блики.

Какая модель-сеть умеет искать шаблон на изображении в разных масштабах и под разными углами, чтобы потом в определившемся четырёхугольнике распознать ровно N символов?

Читал про multi-scale CNN – по сути несколько конволюционных сетей работают параллельно, с картинкой в разных разрешениях: 1:1, 1:2, 1:4. Не уверен, самое ли это эффективное решение, когда известны пропорции разыскиваемого принта.

Чем-то задача похожа на распознавание автомобильных номеров, и даже проще в том, что точно известен шаблон, длина, и фон почти без лишних деталей.

Вопрос задан более трёх лет назад
33 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Инженер машинного обучения

4 месяца

Далее
Skillbox

Профессия Machine Learning Engineer

12 месяцев

Далее
Нетология

Машинное обучение

10 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Машинное обучение

+1 ещё

Средний
Есть ли готовая архитектура модели, которая принимает на вход подобный формат данных?
- 3 подписчика
- 27 сент.
- 164 просмотра
0

ответов
Машинное обучение

+1 ещё

Простой
Поиск по образцу. Как сделать быстрый поиск вхождения картинок-символов на большом чертеже?
- 2 подписчика
- 19 сент.
- 193 просмотра
1

ответ
Нейронные сети

+1 ещё

Простой
С помощью чего проанализировать данные и построить свою нейронную сеть для бана пользователей?
- 1 подписчик
- 09 сент.
- 188 просмотров
2

ответа
Нейронные сети

+1 ещё

Средний
Как повысить macro f1 в задаче классификации изображения?
- 1 подписчик
- 03 сент.
- 61 просмотр
0

ответов
Веб-разработка

+1 ещё

Простой
Какие есть ML-инструменты, которые по структуре или изображению лендинга предсказывают зоны внимания пользователей?
- 1 подписчик
- 28 авг.
- 399 просмотров
3

ответа
Видеокарты

+1 ещё

Средний
Целесообразно ли использование двух RTX 5080 для обучения нейросетей?
- 1 подписчик
- 24 авг.
- 402 просмотра
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 467 просмотров
3

ответа
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 65 просмотров
0

ответов
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 148 просмотров
3

ответа
Python

+3 ещё

Простой
Как повысить точность классификации по табличным документам?
- 2 подписчика
- 19 мая
- 308 просмотров
1

ответ
Показать ещё Загружается…

Разработчик Blender / 3D Technical Artist

Академия Компьютерных Технологий и Дизайна

от 94 000 ₽

QA automation (C#)

Альфа-Банк • Москва

от 200 000 до 350 000 ₽

Senior full stack node.js , react

Jiffy

от 2 000 до 3 000 $