Как работает распознавание текста?

Question

slip31 @slip31

Как работает распознавание текста?

Есть документы (накладные), в которых есть шапка (не нужна для распознавания) и непосредственно данные с товаром, количеством и мерой измерения.
"Товар1 10 ящиков
Товар2 15 штук
Товар3 200 шариков".
Я хочу их распознать, учитывая, что у меня есть список этих товаров (т.е. я могу сравнивать то, что распознал с базой".
Как это вообще работает (я не сталкивался). Мне надо с помощью какого-то инструмента выделить строки в котором есть товар, количество, мера измерения (они всегда идут в одну строку), потом распознать с помощью Tesseract в одну строку и оттуда с помощью базы товаров, которая у меня есть, вытащить название товара, выделить то, что следует за ним как количество и потом после количества выделить меру измерения? А каким инструментом можно выделить строки на изображении? они могут находиться в разных местах документа. Я что-то первый раз вообще подошел к распознаванию текста, попробовал Tesseract, ну что то он распознает, модели для распознавания я могу нагенерить сам с помощью Image от php разными шрифтами, с ошибками и т.д. (ну это в том случае, если надо для этого использовать какую-нибудь нейронку). С чего начать-то?

Вопрос задан более трёх лет назад
305 просмотров

8 комментариев

Подписаться 4 Простой 8 комментариев

Армянское Радио @gbg

Прость взять ABBYY Form Reader не вариант?

Написано более трёх лет назад
slip31 @slip31 Автор вопроса

Армянское Радио, Нет, не вариант. Хочется написать что-то вроде приложения. Ну и желательно на PHP (ну это я так, что знаю о том и говорю)

Написано более трёх лет назад
Армянское Радио @gbg

slip31, ну, если для вас это экономически оправданно (вкладывать время в разработку лисапеда вместо покупки готового),

0. Похапе это не первый инструмент в списке выбора вариантов для написания такого, первый все же Питахон.

1, Вот вам многабукав по теме. Буквы на английском просто потому, что 80% пригодного материала по IT в интернетике - именно на этом языке.

2. Еще раз подумайте о выборе подходящих инструментов и общей целесообразности колхозинга распознавания. Никакое распознавание не дает отсутствия ошибок - будет нужна ручная верификация. Если данные можно получить в цифровом виде - их нужно получить в цифровом виде.

Написано более трёх лет назад
slip31 @slip31 Автор вопроса

Армянское Радио, Да, это проект чисто для дома. Мой личный, некоммерческий. Про питон да, 80%, конечно, про распознавание и ии для него. Проанглийский я согласен, конечно, ибо да, это язык IT.

Написано более трёх лет назад
Ипатьев @ipatiev

вопрос "как работает распознавание текста" или "как мне распознать текст на накладных"?

Написано более трёх лет назад
slip31 @slip31 Автор вопроса

Ипатьев, Наверное да "Как распознать текст на накладных")

Написано более трёх лет назад
Дмитрий Гординский @DmitriyGordinskiy

Откуда берётся накладная?

Если есть доступ к источнику накладных - имеет смысл перед печатью сохранять их в базу, а на саму накладную добавить штрих-код с идентификатором из базы. Считать штрих код куда проще, ну а точные данные можно будет забрать прямо из базы, или через API.

Написано более трёх лет назад
Ипатьев @ipatiev

slip31, тогда именно это и надо писать в заголовке.

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+3 ещё

Простой
Извлечение таблиц со спецификациями из PDF чертежей металлоконструкций — решаемо? Или я встрял?
- нет подписчиков
- 23 июн.
- 291 просмотр
2

ответа
JavaScript

+1 ещё

Простой
Как улучшить OCR-парсер билетов на основе Tesseract.js?
- 2 подписчика
- 08 мая
- 2000 просмотров
2

ответа
Нейронные сети

+1 ещё

Простой
Хорошо ли распознают современные версии FineReader по сравнению со старыми?
- 1 подписчик
- 04 февр.
- 160 просмотров
1

ответ
Python

+1 ещё

Простой
Как исправить ошибку при выполнении кода с Tesseract-OCR (не видит русский язык)?
- 1 подписчик
- 03 февр.
- 273 просмотра
1

ответ
Машинное обучение

+2 ещё

Средний
Как добиться распознавания текста и цифр в 99,9%?
- 1 подписчик
- 14 янв.
- 208 просмотров
3

ответа
Tesseract

Средний
Как обработать изображение к EasyOCR и удалить на нем шумы, python?
- 1 подписчик
- 04 окт. 2024
- 136 просмотров
1

ответ
Python

+2 ещё

Простой
Распознавание капчи на python, как улучшить результат?
- 2 подписчика
- более года назад
- 191 просмотр
2

ответа
Нейронные сети

+2 ещё

Простой
Какие есть нейросети для распознавания русского/английского?
- 5 подписчиков
- более года назад
- 1834 просмотра
1

ответ
Искусственный интеллект

+1 ещё

Простой
Какая нейросеть лучше подойдёт для распознавания слов из mp3?
- 3 подписчика
- более года назад
- 700 просмотров
1

ответ
Распознавание текста

Средний
Существует бесплатная OCR-программа с поддержкой якутского языка?
- 2 подписчика
- более года назад
- 283 просмотра
1

ответ
Показать ещё Загружается…

Delivery manager

Zampa

от 200 000 до 300 000 ₽

Системный администратор

Planta Rosa • Москва

До 180 000 ₽

Системный аналитик

Selecty • Москва

До 350 000 ₽

Прость взять ABBYY Form Reader не вариант?
Армянское Радио, Нет, не вариант. Хочется написать что-то вроде приложения. Ну и желательно на PHP (ну это я так, что знаю о том и говорю)
slip31, ну, если для вас это экономически оправданно (вкладывать время в разработку лисапеда вместо покупки готового),

0. Похапе это не первый инструмент в списке выбора вариантов для написания такого, первый все же Питахон.

1, Вот вам многабукав по теме. Буквы на английском просто потому, что 80% пригодного материала по IT в интернетике - именно на этом языке.

2. Еще раз подумайте о выборе подходящих инструментов и общей целесообразности колхозинга распознавания. Никакое распознавание не дает отсутствия ошибок - будет нужна ручная верификация. Если данные можно получить в цифровом виде - их нужно получить в цифровом виде.
Армянское Радио, Да, это проект чисто для дома. Мой личный, некоммерческий. Про питон да, 80%, конечно, про распознавание и ии для него. Проанглийский я согласен, конечно, ибо да, это язык IT.
вопрос "как работает распознавание текста" или "как мне распознать текст на накладных"?
Ипатьев, Наверное да "Как распознать текст на накладных")
Откуда берётся накладная?

Если есть доступ к источнику накладных - имеет смысл перед печатью сохранять их в базу, а на саму накладную добавить штрих-код с идентификатором из базы. Считать штрих код куда проще, ну а точные данные можно будет забрать прямо из базы, или через API.
slip31, тогда именно это и надо писать в заголовке.

Answer 1 · 2021-11-12 22:21:14

С чего начать то?)

Ну конечно же с официальной документации))

На самом деле возьмите тот самый Tesseract OCR и грамотно его настройте. Затем подкрутите парсинг текста. Но лучше всего делать накладные на компьютере, а затем печатать.

Answer 2 · 2021-11-14 00:11:45

Читать про document layout analysis. Касательно поддержки в Tesseract: tesseract-ocr.github.io/docs/das_tutorial2016/5Lay...

Библиотека на Питоне: https://gitlab.gnome.org/World/OpenPaperwork/pyocr

Как работает распознавание текста?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт