Задать вопрос
@aopil

Как можно улучшить обработку изображения?

Пытаюсь прочитать капчу через tesseract.
Обрабатываю изображение перед отправкой в tesseract.

оригинал
5f9f04a4f3bae163675691.png


После обработки
5f9f05810641e845840032.jpeg


Результат: U4E2\.
Т.е. не распознает - 1

Сам код:
$image = new \Imagick('test.jpg');
$image->SharpenImage($radius = 5, $sigma = 1);
$image->gaussianBlurImage($radius = 2, $sigma = 1);
$brightness = 120;
$saturation = 100;
$hue = 60;
$image->modulateImage($brightness, $saturation, $hue);


Подскажите, что еще можно применить, чтобы распознавать с большим шансом?

=========
Согласно документации, можно использовать whitelist, тем самым ограничивая Tesseract, чтобы он искал только буквы/цифры, а не символы.
Пробовал так(как в документации):
echo (new TesseractOCR('img.png'))
    ->whitelist(range('a', 'z'), range(0, 9))
    ->run();

Но почему-то он игнорирует эти требования..
  • Вопрос задан
  • 158 просмотров
Подписаться 1 Простой 9 комментариев
Помогут разобраться в теме Все курсы
  • Skillfactory
    Профессия Fullstack веб-разработчик на JavaScript и PHP
    20 месяцев
    Далее
  • Хекслет
    PHP-разработчик
    10 месяцев
    Далее
  • Нетология
    Веб-разработчик с нуля: профессия с выбором специализации
    14 месяцев
    Далее
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
FoodSoul Калининград
от 180 000 до 250 000 ₽
IT-Spirit Москва
от 230 000 до 320 000 ₽
от 200 000 до 290 000 ₽