Как до обучить Pytesseract под свой шрифт?

Question

lStarLexl @lStarLexl

Искусственный интеллект

Как до обучить Pytesseract под свой шрифт?

Я хотел бы до обучить pytesseract. Мне нужно что-бы он видел буквы и их вводил на клаве. В итоге 36-50% Он распознаёт не правильно. То вместо “I” выдаёт «1». Или вместо “J” говорит что это «7» или какой-то греческий символ. «S” большую и «s” маленькую часто путает. Делаю скрин с экрана поэтому изображение нормального качества. Просто шрифт немного угловатый. Вот как-бы мне немного доучить pytesseract под свой шрифт. Весь инет облазил и особо инфы нет на этот счёт. Например:

https://wdho.ru/856776 Вот эту фотку он считывает как: fffj434 ffjfji jf

Вопрос задан более трёх лет назад
219 просмотров

2 комментария

Подписаться 2 Средний 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Аналитика данных и использование искусственного интеллекта в психологии с МИП

24 месяца

Далее
Skillbox

Нейросети: практический курс

3 месяца

Далее
GB (GeekBrains)

Искусственный интеллект. Специалист

12 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Искусственный интеллект

Простой
Как сделать синхронный перевод с английского на русский, локально?
- 3 подписчика
- 06 дек.
- 283 просмотра
1

ответ
Искусственный интеллект

Простой
Сравнение стилей двух разных текстов: один или разные люди их писали или вообще ИИ?
- 2 подписчика
- 05 дек.
- 179 просмотров
1

ответ
Программное обеспечение и интернет-сервисы

+1 ещё

Простой
Какую нейронку с API (чтоб оплата принималась в рублях) выбрать?
- 3 подписчика
- 22 нояб.
- 438 просмотров
3

ответа
Искусственный интеллект

Простой
Как скормить весь проект нейросети (grok, chatgpt, deepseek) чтобы она понимала в нём и чтоб можно было просить ее доработать что -то?
- 1 подписчик
- 02 нояб.
- 566 просмотров
4

ответа
Google

+1 ещё

Простой
Бесплатная альтернатива Gemini 2.0 Flash preview image generation?
- 3 подписчика
- 28 окт.
- 274 просмотра
2

ответа
Железо

+3 ещё

Простой
Какие есть готовые умные очки, которые можно прошить?
- 2 подписчика
- 15 окт.
- 368 просмотров
1

ответ
Python

+1 ещё

Простой
Какие есть простые легковесные LLM для локального использования?
- 3 подписчика
- 14 окт.
- 783 просмотра
5

ответов
Видеокарты

+1 ещё

Простой
Выбрать ли RTX 3060 12 Гб или RTX 5060 8 Гб для бюджетного AI?
- 2 подписчика
- 01 окт.
- 791 просмотр
4

ответа
Искусственный интеллект

Сложный
Stable Diffusion генерит, а по итогу картинки нет, не показывает?
- 1 подписчик
- 29 сент.
- 109 просмотров
0

ответов
Искусственный интеллект

Средний
Как обучить нейросеть используя API от DeepSeek/ChatGPT?
- 1 подписчик
- 14 сент.
- 206 просмотров
1

ответ
Показать ещё Загружается…

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Database Administrator / DBA

Playerok

от 300 000 ₽

Backend Developer

Playerok

от 400 000 ₽

Картинку, которую пытаетесь распознать, дайте(желательно через файлообмен, чтоб конвертация не произошла). Попробую у себя.
С ГУЕМ повеселей, чем из консоли.

Весь инет облазил и особо инфы нет на этот счёт.

Вообще-то есть.

Answer 1 · 2022-09-10 18:26:06

Системы, распознающие текст содержат обычно несколько уровней распознавания. Один - это собственно нейросеть которая видит с разной вероятностью символы-кандидаты. Второй уровень - это семантика слов и предложений. Тоесть когда ты распознаешь осмысленный текст - то ты обладаешь бОльшей информацией о том как достроить неверно распознанные символы.

В случае с билибердой написанной как

fffjjj ....

второй уровень даёт сбой. Он не видит знакомых слов.

На самом деле я не знаю как работает тессеракт. Надо читать его настройки. Но если-бы я распознавал билиберду из символов - то я-бы искал именно эти языковые семантические настройки.

Как до обучить Pytesseract под свой шрифт?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт