Распознавание капчи на python, как улучшить результат?

Question

flexpc @flexpc

Распознавание капчи на python, как улучшить результат?

captha = images[i]

    scale_percent = int(300)

    image = cv2.imread(captha) #Открываю капчу

    width = int(image.shape[1] * scale_percent / 100)
    height = int(image.shape[0] * scale_percent / 100)

    dim = (width, height)

    resized = cv2.resize(image, dim, interpolation = cv2.INTER_AREA)
    gray = cv2.cvtColor(resized, cv2.COLOR_BGR2GRAY)        #
    ret, threshold_image = cv2.threshold(gray, 160, 150, 1, cv2.THRESH_BINARY)

    cv2.imshow('', threshold_image)
    cv2.waitKey(0)

    capthaStr = pytesseract.image_to_string(threshold_image, config='--psm 11') #Преобразовываю в текст

имею вот такой код, капча вот такая

spoiler

Она вроде бы не сложная, но я получаю вот такой вывод с кода

Правильный ответ: 3FWS
Ответ программы: 3A NWS



Правильный ответ: 6BYC
Ответ программы: 6 YC



Правильный ответ: A8ES
Ответ программы: SES



Правильный ответ: DY69
Ответ программы: DY 69



Правильный ответ: GD8F
Ответ программы: GOS



Правильный ответ: LBYR
Ответ программы: LB YR



Правильный ответ: X87D
Ответ программы: X8 /D



Правильный ответ: Y9X3
Ответ программы: Y 9X3



Правильно 0 из 8

а вот так ее преобразует cv2

spoiler

UDP: вот небольшой пак с этими капчами, если понадобиться

Вопрос задан более года назад
194 просмотра

1 комментарий

Подписаться 2 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
SF Education

Бэкенд-разработчик на Python

3 месяца

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 164 просмотра
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 90 просмотров
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 100 просмотров
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 116 просмотров
0

ответов
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 225 просмотров
2

ответа
Python

Простой
Не могу разобраться почему не работает код python?
- 1 подписчик
- 22 окт.
- 383 просмотра
1

ответ
Python

Простой
Какие есть удобные API для генерации картинок через AI?
- 3 подписчика
- 20 окт.
- 258 просмотров
1

ответ
Python

Простой
Дублирование логов в python logging?
- 2 подписчика
- 19 окт.
- 305 просмотров
1

ответ
Python

+1 ещё

Средний
Как сделать чтоб аккаунт писал при подписке на канал?
- 1 подписчик
- 16 окт.
- 182 просмотра
0

ответов
Python

+1 ещё

Простой
Какие есть простые легковесные LLM для локального использования?
- 2 подписчика
- 14 окт.
- 682 просмотра
3

ответа
Показать ещё Загружается…

Backend developer (Python, FastAPI)

BCraft

До 4 000 $

Python Developer

Strikt

от 100 000 до 150 000 ₽

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

а чем апи для решения не подходят? быстрее и проще будет

Answer 1 · 2024-05-15 11:00:20

Не бойтесь экспериментировать. Вот на скорую руку:

scale_percent = 30
image = cv2.imread(captcha)

dim = (image.shape[1] * scale_percent // 100, image.shape[0] * scale_percent // 100)

resized = cv2.resize(image, dim, interpolation = cv2.INTER_AREA)
gray = cv2.cvtColor(resized, cv2.COLOR_BGR2GRAY)        #
ret, threshold_image = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)
threshold_image = np.invert(threshold_image)

Answer 2 · 2024-05-14 23:23:21

Ну так ты хреначишь BGR2GRAY+пороговое преобразование с фиксированным порогом, и думаешь что оно само сработает? Волшебную кнопку ждёшь?
Попробуй перегнать в HSV и поэкспериментируй с каналами, посмотри, какой наиболее информативный. Используй алгоритм Otsu для определения порога.
Попробуй разбить текст на символы, например, через connected components with stats. Если символы не касаются друг друга, должно сработать. Если касаются, то будет сложнее - нужно будет как-то разделять их ДО порогового преобразования.
Потом уже пробуй распознать каждый символ. Если шрифт всегда один и тот же, то может и pytesseract не понадобится, просто собери образцы символов и ищи их через generalized Hough-Guil.

Распознавание капчи на python, как улучшить результат?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт