Как добиться распознавания текста и цифр в 99,9%?

Question

ProgerFromGod @ProgerFromGod

Как добиться распознавания текста и цифр в 99,9%?

У меня задача, распознавать текст и цифры с видео.
Пока реализация такая, делается скриншот, и подключена библиотека tesseract ocr. Но точность распознания примерно 95%. Платные библиотеки выходят очень дорого. (так как получается большое количество скриншотов)

А мне надо достичь 99-100%. Как это сделать?? Если обучить самому нейронку это поможет?

Вопрос задан 14 янв.
250 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Инженер машинного обучения

4 месяца

Далее
Skillbox

Профессия Machine Learning Engineer

12 месяцев

Далее
Stepik

Машинное обучение: Кросс-валидация и оптимизация гиперпараметров

2 недели

Далее

Пригласить эксперта

Ответы на вопрос 3

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Машинное обучение

+1 ещё

Средний
Есть ли готовая архитектура модели, которая принимает на вход подобный формат данных?
- 3 подписчика
- 27 сент.
- 164 просмотра
0

ответов
Машинное обучение

+1 ещё

Простой
Поиск по образцу. Как сделать быстрый поиск вхождения картинок-символов на большом чертеже?
- 2 подписчика
- 19 сент.
- 192 просмотра
1

ответ
Распознавание текста

Простой
Какое есть ПО для обработки (распознавания) информации?
- 3 подписчика
- 19 сент.
- 355 просмотров
1

ответ
Нейронные сети

+1 ещё

Простой
С помощью чего проанализировать данные и построить свою нейронную сеть для бана пользователей?
- 1 подписчик
- 09 сент.
- 188 просмотров
2

ответа
Нейронные сети

+1 ещё

Средний
Как повысить macro f1 в задаче классификации изображения?
- 1 подписчик
- 03 сент.
- 61 просмотр
0

ответов
Веб-разработка

+1 ещё

Простой
Какие есть ML-инструменты, которые по структуре или изображению лендинга предсказывают зоны внимания пользователей?
- 1 подписчик
- 28 авг.
- 398 просмотров
3

ответа
Видеокарты

+1 ещё

Средний
Целесообразно ли использование двух RTX 5080 для обучения нейросетей?
- 1 подписчик
- 24 авг.
- 394 просмотра
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 465 просмотров
3

ответа
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 65 просмотров
0

ответов
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 147 просмотров
3

ответа
Показать ещё Загружается…

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 350 000 ₽

Answer 1 · 2025-01-14 22:52:31

Посмотреть чем нераспознанные скрины отличаются от распознанных, какие у них уникальные признаки, и дальше уже думать можно ли их привести к виду тех которые распознаются.

Answer 2 · 2025-01-14 23:18:18

Низкое качество каждого кадра видео по отдельности, но человеческий мозг вытягивает из нескольких соседних кадров информацию и распознает

У тебя условно два пути:
1. попытаться из видео какими-то методами, не обязательно нейронной сетью, вытянуть повышение качества изображения, и уже на нем проводить распознавание
2. собрать 3d обучающую выборку, где одним примером является серия соседних кадров одного и того же участка (можно кстати комбинировать методы из 1 пути, для центрирования искомой части изображения, что бы можно было распознавать в движении)

Второй метод универсальнее, и в каком то смысле проще, если ты сможешь собрать большую обучающую выборку.. но первый даст прогнозируемое качество.

Для первого, пример использования - stacking, используемый в астрофотографии

Answer 3 · 2025-01-15 20:46:21

Делать скриншот с видео - скорее всего неправильно. Скрин будет иметь шумы.
А видео обычно имеет свойство компенсации шумов если изучать не один кадр а несколько.
И особенно важно если съемка была в движении.

Как добиться распознавания текста и цифр в 99,9%?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт