Уважаемые знатоки!
Поделитесь опытом работы с GOCR или Tesseract с использованием php.
Дело в том, что мне необходимо написать php скрипт, который распознает цифры с картинки. Цифры одинакового шрифта, чёткие и без искажений (это номер телефона).
Подскажите как использовать библиотеку GOCR или Tesseract на локальном компьютере, а именно в связке с denwer'ом.
Или посоветуйте другие решения распознавания цифр с картинки на PHP.
P.S. Сначала написал скрипт, который разбивает картинку на части (на цифры) и считает количество черных (закрашенных) пикселей для каждой цифры... но всё закончилось неудачей, кол-во закрашенных пикселей в некоторых цифрах совпадало, даже после манипуляций с контрастом и яркостью картинки цифры совпадали, но уже другие)) так что такая идея неудачная.
Использовал для распознования номеров телефонов с картинок. Для меня подошёл больше GOCR, но не тот и не тот не идеальны. Надо ещё поработать с картинкой, перед тем как скормить ocr.
Пробовал вариантов 6 ocr, остановился на нем.
так а как его вообще подключить и пользоваться?) я скачивал последнюю source версию, но там куча файлов и ничего не понятно...
Я читал только о том, что необходимо его закинуть на сервер, в моем случае на денвер, и в php вызывать $output = shell_exec('/usr/local/bin/gocr -i ' . escapeshellarg($image_file));
но файла gocr я в сборке не нашел)) и какой путь к файлу будет на денвере, тоже без понятия...
slavabars: .bin ни одного файла... или я туплю или лыжи не едут... можешь тыкнуть какой дистрибутив скачать и где в нем бинарник, который нужно вызывать?
P.S. я про GOCR =)