Добрый день друзья!
Задался целью расшифровать капчу
И вот как я это делаю:
1. Конвертим в бинарный вид приводя все к 1 и 0 (grayscale конечно же да)
2. Убираем фот
3. Делим по буквам - здесь у меня и начинается проблемка. Сейчас я бегаю по матрице и смотрю есть ли единицы в столбце, если нет то добавляю новую букву в массив. Этот метод был бы хорош, если бы не было шумов.
4. Дальше с помощью библиотеки PHP-ML я все это обрабатываю и получаю результат.
Дело в том, что у капчи этой есть шумы и из-за них несколько букв сливаются в одну. Для этого изображения (rf6c) я получаю результат "rf". И это не единственный минус. Для определения буква это или шум мне приходится брать среднее количество единиц в массиве и выкидывать все что меньше или больше этого количества.
Подскажите какими методами можно убрать штрихи на изображении или может есть другие варианты разбить по буквам это изображения?