Как работает распознавание текста?

Question

slip31 @slip31

Как работает распознавание текста?

Есть документы (накладные), в которых есть шапка (не нужна для распознавания) и непосредственно данные с товаром, количеством и мерой измерения.
"Товар1 10 ящиков
Товар2 15 штук
Товар3 200 шариков".
Я хочу их распознать, учитывая, что у меня есть список этих товаров (т.е. я могу сравнивать то, что распознал с базой".
Как это вообще работает (я не сталкивался). Мне надо с помощью какого-то инструмента выделить строки в котором есть товар, количество, мера измерения (они всегда идут в одну строку), потом распознать с помощью Tesseract в одну строку и оттуда с помощью базы товаров, которая у меня есть, вытащить название товара, выделить то, что следует за ним как количество и потом после количества выделить меру измерения? А каким инструментом можно выделить строки на изображении? они могут находиться в разных местах документа. Я что-то первый раз вообще подошел к распознаванию текста, попробовал Tesseract, ну что то он распознает, модели для распознавания я могу нагенерить сам с помощью Image от php разными шрифтами, с ошибками и т.д. (ну это в том случае, если надо для этого использовать какую-нибудь нейронку). С чего начать-то?

Вопрос задан более трёх лет назад
318 просмотров

8 комментариев

Подписаться 4 Простой 8 комментариев

Армянское Радио @gbg

Прость взять ABBYY Form Reader не вариант?

Написано более трёх лет назад
slip31 @slip31 Автор вопроса

Армянское Радио, Нет, не вариант. Хочется написать что-то вроде приложения. Ну и желательно на PHP (ну это я так, что знаю о том и говорю)

Написано более трёх лет назад
Армянское Радио @gbg

slip31, ну, если для вас это экономически оправданно (вкладывать время в разработку лисапеда вместо покупки готового),

0. Похапе это не первый инструмент в списке выбора вариантов для написания такого, первый все же Питахон.

1, Вот вам многабукав по теме. Буквы на английском просто потому, что 80% пригодного материала по IT в интернетике - именно на этом языке.

2. Еще раз подумайте о выборе подходящих инструментов и общей целесообразности колхозинга распознавания. Никакое распознавание не дает отсутствия ошибок - будет нужна ручная верификация. Если данные можно получить в цифровом виде - их нужно получить в цифровом виде.

Написано более трёх лет назад
slip31 @slip31 Автор вопроса

Армянское Радио, Да, это проект чисто для дома. Мой личный, некоммерческий. Про питон да, 80%, конечно, про распознавание и ии для него. Проанглийский я согласен, конечно, ибо да, это язык IT.

Написано более трёх лет назад
Ипатьев @ipatiev

вопрос "как работает распознавание текста" или "как мне распознать текст на накладных"?

Написано более трёх лет назад
slip31 @slip31 Автор вопроса

Ипатьев, Наверное да "Как распознать текст на накладных")

Написано более трёх лет назад
Дмитрий Гординский @DmitriyGordinskiy

Откуда берётся накладная?

Если есть доступ к источнику накладных - имеет смысл перед печатью сохранять их в базу, а на саму накладную добавить штрих-код с идентификатором из базы. Считать штрих код куда проще, ну а точные данные можно будет забрать прямо из базы, или через API.

Написано более трёх лет назад
Ипатьев @ipatiev

slip31, тогда именно это и надо писать в заголовке.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Инженер по информационной безопасности + ИИ

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Сделай сам

+1 ещё

Средний
Кто имеет опыт в создании калькулятора с камерой и нейросетью?
- 1 подписчик
- 03 мар.
- 353 просмотра
2

ответа
Искусственный интеллект

+1 ещё

Средний
Что лучше зоопарк или VLM для извлечения данных из ЖД накладных (грязные сканы, печати, рукопись)?
- 4 подписчика
- 05 февр.
- 495 просмотров
2

ответа
Распознавание текста

Простой
Какое есть ПО для обработки (распознавания) информации?
- 3 подписчика
- 19 сент. 2025
- 385 просмотров
1

ответ
Python

+3 ещё

Простой
Извлечение таблиц со спецификациями из PDF чертежей металлоконструкций — решаемо? Или я встрял?
- нет подписчиков
- 23 июн. 2025
- 507 просмотров
2

ответа
JavaScript

+1 ещё

Простой
Как улучшить OCR-парсер билетов на основе Tesseract.js?
- 2 подписчика
- более года назад
- 2057 просмотров
2

ответа
Нейронные сети

+1 ещё

Простой
Хорошо ли распознают современные версии FineReader по сравнению со старыми?
- 1 подписчик
- более года назад
- 235 просмотров
1

ответ
Python

+1 ещё

Простой
Как исправить ошибку при выполнении кода с Tesseract-OCR (не видит русский язык)?
- 1 подписчик
- более года назад
- 501 просмотр
1

ответ
Машинное обучение

+2 ещё

Средний
Как добиться распознавания текста и цифр в 99,9%?
- 1 подписчик
- более года назад
- 274 просмотра
3

ответа
Tesseract

Средний
Как обработать изображение к EasyOCR и удалить на нем шумы, python?
- 1 подписчик
- более года назад
- 208 просмотров
1

ответ
Python

+2 ещё

Простой
Распознавание капчи на python, как улучшить результат?
- 2 подписчика
- более двух лет назад
- 195 просмотров
2

ответа
Показать ещё Загружается…

Прость взять ABBYY Form Reader не вариант?
Армянское Радио, Нет, не вариант. Хочется написать что-то вроде приложения. Ну и желательно на PHP (ну это я так, что знаю о том и говорю)
slip31, ну, если для вас это экономически оправданно (вкладывать время в разработку лисапеда вместо покупки готового),

0. Похапе это не первый инструмент в списке выбора вариантов для написания такого, первый все же Питахон.

1, Вот вам многабукав по теме. Буквы на английском просто потому, что 80% пригодного материала по IT в интернетике - именно на этом языке.

2. Еще раз подумайте о выборе подходящих инструментов и общей целесообразности колхозинга распознавания. Никакое распознавание не дает отсутствия ошибок - будет нужна ручная верификация. Если данные можно получить в цифровом виде - их нужно получить в цифровом виде.
Армянское Радио, Да, это проект чисто для дома. Мой личный, некоммерческий. Про питон да, 80%, конечно, про распознавание и ии для него. Проанглийский я согласен, конечно, ибо да, это язык IT.
вопрос "как работает распознавание текста" или "как мне распознать текст на накладных"?
Ипатьев, Наверное да "Как распознать текст на накладных")
Откуда берётся накладная?

Если есть доступ к источнику накладных - имеет смысл перед печатью сохранять их в базу, а на саму накладную добавить штрих-код с идентификатором из базы. Считать штрих код куда проще, ну а точные данные можно будет забрать прямо из базы, или через API.
slip31, тогда именно это и надо писать в заголовке.

Answer 1 · 2021-11-12 22:21:14

С чего начать то?)

Ну конечно же с официальной документации))

На самом деле возьмите тот самый Tesseract OCR и грамотно его настройте. Затем подкрутите парсинг текста. Но лучше всего делать накладные на компьютере, а затем печатать.

Answer 2 · 2021-11-14 00:11:45

Читать про document layout analysis. Касательно поддержки в Tesseract: tesseract-ocr.github.io/docs/das_tutorial2016/5Lay...

Библиотека на Питоне: https://gitlab.gnome.org/World/OpenPaperwork/pyocr

Как работает распознавание текста?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт