Есть документы (накладные), в которых есть шапка (не нужна для распознавания) и непосредственно данные с товаром, количеством и мерой измерения.
"Товар1 10 ящиков
Товар2 15 штук
Товар3 200 шариков".
Я хочу их распознать, учитывая, что у меня есть список этих товаров (т.е. я могу сравнивать то, что распознал с базой".
Как это вообще работает (я не сталкивался). Мне надо с помощью какого-то инструмента выделить строки в котором есть товар, количество, мера измерения (они всегда идут в одну строку), потом распознать с помощью Tesseract в одну строку и оттуда с помощью базы товаров, которая у меня есть, вытащить название товара, выделить то, что следует за ним как количество и потом после количества выделить меру измерения? А каким инструментом можно выделить строки на изображении? они могут находиться в разных местах документа. Я что-то первый раз вообще подошел к распознаванию текста, попробовал Tesseract, ну что то он распознает, модели для распознавания я могу нагенерить сам с помощью Image от php разными шрифтами, с ошибками и т.д. (ну это в том случае, если надо для этого использовать какую-нибудь нейронку). С чего начать-то?
slip31, ну, если для вас это экономически оправданно (вкладывать время в разработку лисапеда вместо покупки готового),
0. Похапе это не первый инструмент в списке выбора вариантов для написания такого, первый все же Питахон.
1, Вот вам многабукав по теме. Буквы на английском просто потому, что 80% пригодного материала по IT в интернетике - именно на этом языке.
2. Еще раз подумайте о выборе подходящих инструментов и общей целесообразности колхозинга распознавания. Никакое распознавание не дает отсутствия ошибок - будет нужна ручная верификация. Если данные можно получить в цифровом виде - их нужно получить в цифровом виде.
Армянское Радио, Да, это проект чисто для дома. Мой личный, некоммерческий. Про питон да, 80%, конечно, про распознавание и ии для него. Проанглийский я согласен, конечно, ибо да, это язык IT.
Если есть доступ к источнику накладных - имеет смысл перед печатью сохранять их в базу, а на саму накладную добавить штрих-код с идентификатором из базы. Считать штрих код куда проще, ну а точные данные можно будет забрать прямо из базы, или через API.
На самом деле возьмите тот самый Tesseract OCR и грамотно его настройте. Затем подкрутите парсинг текста. Но лучше всего делать накладные на компьютере, а затем печатать.