Как повысить точность распознавания цифр pytesseract?

Question

motya88 @motya88

Как повысить точность распознавания цифр pytesseract?

Добрый день!
Пытаюсь распознать номера договоров на сканах с использованием pytesseract.
Столкнулся с неточностью распознавания.
Исходная картинка:

Картинка после обработки:

При выводе выдает: €6E96T09810/SEEGIZET

Мой код:

import os
import pytesseract
from pdf2image import convert_from_path


import cv2

# перейти в папку test_folder
os.chdir('./test_folder')
# получить список файлов в папке RandomFiles

for file in os.listdir('.'):
    print(file)
    PDF_file = "./"+file
    images = convert_from_path(PDF_file)

    for image in images:
        filename = str(file.replace('.pdf','')) + ".jpg"
        image.save(filename, 'JPEG')

    cropped4 = image.crop((249, 3253, 397, 3869))
    result4 = filename.replace('.jpg','') + '_crop_4.jpg'
    cropped4.save(result4)
    k1 = cv2.imread('./' + result4)
    gray = cv2.cvtColor(k1, cv2.COLOR_BGR2GRAY)
    gray = cv2.threshold(gray, 0, 255,
                         cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]

    rr = 'g_' + result4
    cv2.imwrite(rr, gray)

    text4 = pytesseract.image_to_string(rr)
    print(text4)

Какую нужно сделать подготовку изображения, чтобы распознать корректно номер?

Вопрос задан более трёх лет назад
667 просмотров

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 199 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 521 просмотр
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 486 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 276 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 498 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 211 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 124 просмотра
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 330 просмотров
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 660 просмотров
5

ответов
Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 2 подписчика
- 23 мая
- 345 просмотров
1

ответ
Показать ещё Загружается…

я конечно не эксперт, но когда я писал такую прогу, мне очень сильно помогло добавление шрифтов, которые используются на скане. В принципе с цифрами на 1-ой пикче должно отлично работать.
Если опять будут не понятки, то поиграйся с размерами самого скана, мне больше всего подошло разрешение с 200-300dpi (с 600 и выше dpi тесеракт просто не хотел читать 60прц букв)
ЭТО НЕ ОТВЕТ, просто на водка на то как можно поступить пока ждёшь ответа!

Answer 1 · 2020-11-05 11:51:51

pytesseract неплохой инструмент, но ты должен понимать, что точность 100% практически недостижима. Ты можешь добавить свои шрифты, переобучить на нужных тебе данных, как описано выше. Но это достаточно проблематично, по крайней мере было для меня. Лучше смотри в сторону написания своей нейронки на каком-нибудь TF keras.
Если все-таки решил pytesseract пользоваться, то подбирай фильтры и размер изображения.

Answer 2 · 2020-11-05 12:41:17

Как минимум, стоило бы повернуть картинку, чтоб она была в горизонтальном формате.
После поворота сразу выдало 1329335/07860196393

img = Image.open(filename)
rotated = img.transpose(Image.ROTATE_270)
print(pytesseract.image_to_string(rotated))

Как повысить точность распознавания цифр pytesseract?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт