Hcuy
@Hcuy
Профессионально считаю ворон.

Распознавание цифровых цифр в tesseract?

Мне нужно распознать эту картинку
5edd00a59bb17400614431.jpeg
Для этого нужно её обработать.
Вот код обработки и распознавания tesseract. (сори за глупые коментарии, быстренько их написал специально для вопроса)
import pytesseract as tess
tess.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
import cv2
import matplotlib.pyplot as plt
import numpy as np


image = cv2.imread('image/1.2.jpeg')

foto = cv2.GaussianBlur(image,(11,11), 0) # размытие

kernel = np.ones((1,1), np.uint8)  #делает объекты на фото тоньше
foto = cv2.dilate(foto,kernel,iterations = 9)

foto = cv2.cvtColor(foto, cv2.COLOR_BGR2GRAY) #изменение цвета

(thresh, foto) = cv2.threshold(foto,95,155,cv2.THRESH_BINARY) # простой порог

foto = cv2.cvtColor(foto, cv2.COLOR_BGR2RGB) # изменение в серый цвет

result = tess.image_to_string(foto) #результат tess



cv2.imwrite('image/3.4.jpeg',foto)

plt.imshow(foto)
plt.show()

print (result)


Вот фото вывода.
5edd01c5638bd800461995.png
И вроде бы норм. Но tesseract никак фот не читает. Когда начинаю играться со значениями в функции cv2.threshold(foto,95,155,cv2.THRESH_BINARY)
Чаще всего ничего не прочитывает,иногда что-то прочитывает, но совсем не правильное.
Возможно я что-то упустил в обработке фото, или в распознавании его.
Спасибо
  • Вопрос задан
  • 1618 просмотров
Решения вопроса 2
erniesto77
@erniesto77
oop, rb, py, php, js
Давайте не делать велосипед. Задача то старая.

https://github.com/topics/number-recognition
Ответ написан
fox_12
@fox_12 Куратор тега Python
Расставляю биты, управляю заряженными частицами
Тессеракт не знает такой набор символов. Обучите его своему набору.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы