Распознать текст на скриншотах

Question

d43 @d43

Распознать текст на скриншотах

Привет!
Мне нужно распознать текст на нескольких тысячах скриншотах. Основная проблема в том, что этот текст написан мелким пиксельным шрифтом и состоит из случайных букв (в т.ч. с диакритическими знаками), цифр, знаков пунктуации, специальных символов (из-за чего с задачей не справляются OCR-программы типа FineReader и Tesseract).

Упрощает задачу то, что текст хорошо виден, а также меня есть шрифт со всеми этими знаками.

Знаете ли вы какие-нибудь готовые решения для распознания такого текста? Как бы вы сами решили такую задачу?

Спасибо!

Вопрос задан более трёх лет назад
18099 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 8

2 комментария

Комментировать

1 комментарий

Комментировать

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Сделай сам

+1 ещё

Средний
Кто имеет опыт в создании калькулятора с камерой и нейросетью?
- 1 подписчик
- 03 мар.
- 431 просмотр
2

ответа
Искусственный интеллект

+1 ещё

Средний
Что лучше зоопарк или VLM для извлечения данных из ЖД накладных (грязные сканы, печати, рукопись)?
- 4 подписчика
- 05 февр.
- 514 просмотров
2

ответа
Скриншоты

Простой
Есть ли скриншотер с selfhosted размещением и клиентами под разные ОС?
- 2 подписчика
- 23 дек. 2025
- 178 просмотров
2

ответа
Скриншоты

Средний
Где скачать прошлую/старую версию Скриншотера?
- 2 подписчика
- 12 дек. 2025
- 1318 просмотров
2

ответа
Программное обеспечение и интернет-сервисы

+1 ещё

Простой
Как убрать артефакты на скриншотах в ShareX?
- 1 подписчик
- 21 нояб. 2025
- 129 просмотров
1

ответ
Windows

+1 ещё

Простой
Как удалить неудаляемые ножницы Win11?
- 2 подписчика
- 16 окт. 2025
- 693 просмотра
2

ответа
Распознавание текста

Простой
Какое есть ПО для обработки (распознавания) информации?
- 3 подписчика
- 19 сент. 2025
- 394 просмотра
1

ответ
Python

+3 ещё

Простой
Извлечение таблиц со спецификациями из PDF чертежей металлоконструкций — решаемо? Или я встрял?
- нет подписчиков
- более года назад
- 525 просмотров
2

ответа
JavaScript

+1 ещё

Простой
Как улучшить OCR-парсер билетов на основе Tesseract.js?
- 2 подписчика
- более года назад
- 2066 просмотров
2

ответа
Права доступа

+1 ещё

Простой
Программа для скриншотов без прав администратора существует?
- 1 подписчик
- более года назад
- 258 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2011-07-19 07:12:42

Утиль специально для этой цели. Староват, но в своё время никто лучше него с этой проблемой не справлялся.
www.structurise.com/kleptomania/russian.shtml

Answer 2 · 2011-07-18 23:46:34

Я для таких целей писал собственную распознавалку. Работала примитивно — шинковала исходное изображение на троки, строки на символы, символы распознавала путем сранения с шаблонами. Про существование готовых инструментов для подобного не слышал.

Answer 3 · 2011-07-19 01:10:36

JoeyHere @JoeyHere

Можно попробовать через OneNote прогнать, правда, за спецсимволы не ручаюсь.

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2011-07-19 01:20:30

osby @osby

FineReader вроде бы обучать можно.

Ответ написан более трёх лет назад

1 комментарий

Answer 5 · 2011-07-19 16:23:32

Согласен с вариантом обучения FineReader — попробуйте. Распознавал несколько сотен страниц напечатанного на печатной машинке и ксерокопированного текста в не самом лучшем состоянии так:
1. Разбил текст на «главы» в зависимости от плачевности состояния (рваные, кофе, мятые)
2. Прогонял в режиме обучения первые пару листов (занимало минут 20)
3. Прогонял распознавание

Answer 6 · 2011-07-18 23:18:30

А разьве Abby fine reader и подобные программы распознования текста не помогут. Я распознавал с картинок, правда обычный крупный текст и все работало нормально.