Необходима библиотека для распознавание текста с документа на PHP?

Question

gitdev @gitdev

Необходима библиотека для распознавание текста с документа на PHP?

Через форму загружаются изображения и далее необходимо сканировать текст с изображений. Как реализовать на PHP (нужны готовые бесплатные библиотеки и анализаторы).

Вопрос задан более года назад
804 просмотра

Комментировать

Подписаться 5 Простой Комментировать

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+1 ещё

Простой
Как улучшить OCR-парсер билетов на основе Tesseract.js?
- 2 подписчика
- 12 часов назад
- 567 просмотров
1

ответ
PHP

+1 ещё

Простой
Отправка промта с сайте в телеграм бота, генерация картинок, как реализовать?
- 1 подписчик
- 16 часов назад
- 105 просмотров
0

ответов
PHP

+1 ещё

Простой
Google ReCapcha сменить на сайте после увольнения админа?
- 1 подписчик
- 03 мая
- 198 просмотров
1

ответ
PHP

+1 ещё

Средний
Filament и мультиязычность кто подружил?
- 1 подписчик
- 02 мая
- 113 просмотров
1

ответ
PHP

Простой
Почему PHP считает int числа после математических операций как float?
- 1 подписчик
- 02 мая
- 171 просмотр
5

ответов
JavaScript

+2 ещё

Простой
Скрипт замены языковой раскладки и скрипт автозаполнение для одного input'а работает некорректно, как поправить?
- 2 подписчика
- 01 мая
- 634 просмотра
0

ответов
PHP

Простой
Как сделать правильно скорректировать запрос в RedBeanPHP?
- 1 подписчик
- 28 апр.
- 114 просмотров
1

ответ
PHP

Простой
Как добавить русский текст в fpdf?
- 1 подписчик
- 24 апр.
- 202 просмотра
2

ответа
PHP

+1 ещё

Простой
Где хранить ключи api используемые для тестирования открытого по?
- 1 подписчик
- 23 апр.
- 328 просмотров
2

ответа
PHP

+1 ещё

Средний
Как удалить весь текст кроме ссылок?
- 1 подписчик
- 20 апр.
- 213 просмотров
3

ответа
Показать ещё Загружается…

Middle PHP-developer / PHP-разработчик

Wanted.

До 250 000 ₽

PHP-разработчик

Stoking • Пермь

от 200 000 ₽

PHP-разарботчик

Wanted.

До 130 000 ₽

Answer 1 · 2023-06-04 18:09:15

открытый бесплатный готовый к использованию - tesseract
недостаток, если документ не распознается, то нужно будет тюнить его шрифты

на английский язык и некоторые другие языки есть современные языковые OCR модели, гуглить на huggingface.co ocr multilang, на русский я не нашел. Но куча готового софта, подбираешь датасет, обучаешь,...

Answer 2 · 2023-06-13 13:09:58

Тессеракт всё криво распознаёт. Распознать содержимое табличек или что-то рукописное даже не пытайтесь - будет куча мусора.
Используйте windows сервер и finereader. Всё будет работать из php.

$cmd = "\"C:\\Program Files (x86)\\ABBYY FineReader 15\\FineCmd.exe\" \"$file_full_patch\" /lang Mixed /out \"$file_save_patch\"";
proc_open($cmd, [], $pipe);

Необходима библиотека для распознавание текста с документа на PHP?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт