У вас несложная капча. Этапы распознавания следующие:
- Находим зоны связности по цвету.
- Пересекающиеся AABB ограничивающими прямоугольниками зоны объединяем в одну.
- Вырезаем зоны, масштабируем к единому размеру.
- Пастеризуем до монохромного.
- Цифры у нас семисегментные. Нужно 7 линейных детекторов: это линейные риски (черточки), которые гарантированно перечеркнут сегмент. Метрикой детектора будем считать количество закрашенных пикселей под риской. Детекторы с метрикой меньше пороговой считаем не обнаружили сегмента.
- По отдельному словарю декодируем набор включенных сегментов в цифру.