Сам же себе и отвечу: в tesseract 3.0 есть опция «hocr», которая позволяет возвращать не просто распознанный текст, а страницу в html формате, содержащую распознанные слова и их координаты.
Ответ написан
Комментировать
Комментировать
Оценили как «Нравится»
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.