Ответы пользователя по тегу Tesseract
  • Почему возникает ошибка в tesseract python?

    @DmitryKyd
    Студент специальности ИАСБ
    Дополню ответ Александра.

    Во-первых нужно установить сам tessaract(ссылку Александр уже дал), а потом в самом скрипте python указать путь к tessaract'у, в моем случае это выглядит так:
    pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'


    После выполнения данных действий, всё заработает.
    Ответ написан
    2 комментария
  • Почему pytesseract не распознает цифры?

    @DmitryKyd Автор вопроса
    Студент специальности ИАСБ
    Сам вопрос задал, сам отвечу)

    Проблема была в полученной картинке, её формат не принимал tessaract. Поменяв метод сохранения картинки, получилось добиться распознавания.

    Теперь другой вопрос, как указать tessaract'у распозновать только цифры. В интернете находил решение через config и в нем указывать whitelist.
    text = pytesseract.image_to_string(new_image, lang='eng', config='--psm 6 -c tessedit_char_whitelist=0123456789')

    Но он почему-то не работает. Всё равно периодически выскакивают буквы.
    Ответ написан
  • Как повысить точность считывания текста с картинки?

    @DmitryKyd
    Студент специальности ИАСБ
    Обрезать все лишнее (в данном случае изображение оружия), увеличить резкость, убрать фон (серый цвет) и полученное изображение перевести в черно-белое изображение. После таких манипуляций получите белый фон и черный текст на нем. Его тессеракт распознает на много лучше.
    Ответ написан
    Комментировать