Как распознать кириллический экранный текст на изображении?
День добрый, как распознать кириллический экранный текст на изображении?
Часть шрифтов известна, но хотелось бы как-то самому попробовать обучить сеть или воспользоваться каким-нибудь готовым инструментом. Сейчас пробую tesseract, но качество пока не радует.
Берете в качестве примера обучение сети некирилическому тексту (скорее всего, вам будет доступен английский), разбираетесь и сами (если уж хочется самостоятельности) по аналогии делаете распознавание кириллицы.
А то, что качество не радует - ну так сравните, на скольких РАЗМЕЧЕННЫХ примерах обучались английские распознавалки и сколько вы им можете подсунуть за разумное время кириллических размеченных образцов.
в целом чтобы нормально обучить антигейт можно условно ддосить любой сервис использующий РУ капчу и с этими изображениями капчи идти на платные антигейт сервисы и там получать ответ на каждую капчу. в копейку упадёт, но думаю получив решение с десяток тысяч капч не разоритесь)