Распознавание русского текста с отсканированных изображений, как реализовать?

Есть задача, распознать русский текст с отсканированных изображений/документов (*.jpg или *.pdf) и потом занести эти данные в базу.
Вопрос в следующем, кто имел опыт подобной разработки и какими средствами это лучше реализовать?

P.S. если есть библиотеки подобные под PHP, то это преимущественное решение для меня, как начинающего )
Заранее спасибо за консультации и ответы!
  • Вопрос задан
  • 1370 просмотров
Решения вопроса 1
@aol-nnov
tesseract есть от гугла, cuneiform там.. (хотя, последний я уже не знаю, как советовать. кажется, он давно протух)
сходу нашел байндинги к питону и джаве.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
Это точно делается никак не на php потому что операция ресурсозатратная php для этого слишком медленный.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы