Как достать данные из изображения документа(паспорт, права..)?

Question

IceJOKER @IceJOKER

Web/Android developer

Как достать данные из изображения документа(паспорт, права..)?

Здравствуйте, собственно вопрос в заголовке, есть изображения документов, нужно оттуда вытащить данные(ФИО, дата рождения и так далее).
Для себя нашел два варианта:
1. Просто image => text конвертация и регулярками выдергивать нужные данные, но к сожалению https://github.com/tesseract-ocr/tesseract плохо справляется с русскими символами, какую библиотеку можно использовать, которая хорошо справится с русским текстом?
2. Более сложный подход: feature extraction (выдернуть из изображения нужную часть, где находится документ) и научить нейросеть находить нужные области и выдергивать текст оттуда. Ранее не сталкивался с подобным, поэтому есть только поверхностные знания.

Буду рад любым предложениям - библиотеки, статьи, проекты.

p.s. рассматриваю только бесплатный вариант

Вопрос задан более трёх лет назад
4164 просмотра

1 комментарий

Подписаться 2 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Профессия Python-разработчик + ИИ

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 191 просмотр
2

ответа
C#

+2 ещё

Простой
Как заставить кнопки в ScrollView корректно перераспределять остальные элементы при анимации?
- 1 подписчик
- 10 апр.
- 60 просмотров
1

ответ
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 209 просмотров
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 73 просмотра
1

ответ
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 102 просмотра
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 96 просмотров
1

ответ
C#

Простой
Как прочесть без блокировок в многопоточном приложение 16 байт структурное значение?
- 1 подписчик
- 30 мар.
- 144 просмотра
1

ответ
Python

Простой
Почему может не отображаться страница во view(flet)?
- 1 подписчик
- 25 мар.
- 117 просмотров
1

ответ
C#

+1 ещё

Средний
Как убрать проблему, из-за которой карта не возвращается в руку?
- 1 подписчик
- 18 мар.
- 242 просмотра
1

ответ
Python

Средний
Asyncio + PySide6 + Telethon: список чатов и треды грузятся 30 минут — где искать причину?
- 2 подписчика
- 16 мар.
- 462 просмотра
2

ответа
Показать ещё Загружается…

Python Developer

ITK academy • Краснодар

от 75 000 ₽

Python разработчик

DimaTech Ltd • Краснодар

от 140 000 до 140 000 ₽

Junior AI Automation Engineer / AI-инженер (junior)

OPENCITY • Москва

от 50 000 ₽

на хабре кто то пиарился.. чуть ли не облачное решение.. паспорты РФ точно там были.. но за 15 минут не смог сформулировать удачный запрос

скажем так ABBYY уж точно не единственное решение, и если порыться на хабре, возможно удастся найти вариант бесплатного старта.. если это имеет значение

Answer 1 · 2019-03-01 12:49:48

longclaps @longclaps

PassportReader

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2019-03-01 14:43:45

Владислав Лысков @Vlatqa

https://pypi.org/project/PassportEye/

Ответ написан более трёх лет назад

Комментировать

Как достать данные из изображения документа(паспорт, права..)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт