Как сделать распознавание цифр на изображении?

И так, здравствуйте кто смотрит эту тему.
Хотел сделать распознавание цифр капчи в одной игре.
Для начало я хотел сделать хотябы распознавание цифр по скриншоту, что не получилось даже это.
Кстати, делал это я всё на языке пайтон.
Использовал модуль pytesseract, искал разные сурсы, проверял, то вообще не работало, то просто ничего не выдавало или же выдавало, но не правильные символы.
Пробовал вот этот сурс, выдает пустую строчку, но если допустим пробовать ровный текст, то всё работает. А именно разпознавание капчи в игре - не распознает.
Если это не сильно сложно, то сможет кто-то сделать. Если это сложнее чем я думаю, могу предложить какое-то вознаграждения за это.
Примеры капчи: https://imgur.com/a/lWUwsZl
import pytesseract as tess
tess.pytesseract.tesseract_cmd = r'C:\Users\Святослав\AppData\Local\Tesseract-OCR\tesseract.exe'
from PIL import Image

img = Image.open('photo')
text = tess.image_to_string(img)

print(text)
  • Вопрос задан
  • 527 просмотров
Решения вопроса 4
trapwalker
@trapwalker
Программист, энтузиаст
У вас несложная капча. Этапы распознавания следующие:
  1. Находим зоны связности по цвету.
  2. Пересекающиеся AABB ограничивающими прямоугольниками зоны объединяем в одну.
  3. Вырезаем зоны, масштабируем к единому размеру.
  4. Пастеризуем до монохромного.
  5. Цифры у нас семисегментные. Нужно 7 линейных детекторов: это линейные риски (черточки), которые гарантированно перечеркнут сегмент. Метрикой детектора будем считать количество закрашенных пикселей под риской. Детекторы с метрикой меньше пороговой считаем не обнаружили сегмента.
  6. По отдельному словарю декодируем набор включенных сегментов в цифру.
Ответ написан
@AiR_WiZArD
Мне кажется здесь идеально подходит библиотека opencv, преобразуем в монохром, кадрируем, оставляем только толстые линии, ищем цифры. Задача не сложная. За пару вечеров вполне можно изучить функционал либы и написать распознаватель.
Ответ написан
@Zolg
Много вам распознавать нужно ?
Несмотря на простоту капчи, возможно проще, быстрее и выгоднее воспользоваться какм либо капча-сервисом с простым API и примерами кода: засылаете картинку, через короткое время забираете ответ. Стоит счастье около 1$ за тысячу капч
Ответ написан
profesor08
@profesor08
Я вот навел камеру телефона на картинку, и получил весь текст. Это можно автоматизировать, скармливая картинку в Google Cloud Vision API, там даже на питоне примеры есть. Дерзай, развивайся. Телефон для этого не понадобится.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@Alex2080
Интересная задача. А подскажите, что это за игра? Хочу попробовать написать свой алгоритм по распознаванию.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы