Капча слабая:
- шрифты не варьируются,
- размер фиксированный,
- линии однопиксельные,
- шум однотипный.
Не парьтесь с лишним от линиями. Переводите изображение в lab; работайте в монохромном канале яркости. Подберите похожий шрифт и размер, обучите 10 нейронок на свою цифру каждая. Сканируйте окном с пиксельных шагом. Этого будет достаточно
Но! Линии однопиксельные толщиной, контрастные и обычно отличаются по цвету от фоновой цифры.
Прям хочется убрать, правда?
Можно это сделать алгоритмически.
Перебираем все пиксели и анализируем соседние. При нахождении контрастного пикселя запускаем алгоритм "короеда" с дополнительным условием. Если углы между первым пикселем и последующими предокрашенными начинают отличаться более чем на пороговый епсилон, который ещё и от расстояния может уменьшаться, то процесс короеда останавливаем, линия не подтверждена. По факту естественного завершения короеда берём для каждой точки средний цвет из двух в перпендикулярном линии направлении.