Добрый день. Есть wav файл, капча. Подскажите, пожалуйста, как я могу ее распознать? Возможно ли нарезать слово по буквам, чтобы автоматически распознавать данную капчу?
1. Слово нужно резать не на буквы, а на фонемы.
2. Дальше, ассоциировать фонемы в буквосочетания.
3. Затем обучить нейросеть распознавать фонемы из wav-файла капчи и переводить последовательность буквосочетаний, ассоциированных с частями из wav-файла капчи, в слово.
Profit!
Владимир Фокин: "sh" - звук1, "sch" - звук2, "sc" - звук3 и т.д.
boost - [б][у:][с][т] и т.д.
все звуки из буквосочетаний - нужно собрать в фонему.
фонема - это уникальная область звуковых данных в звуковом потоке, имеющая свою определённую уникальную форму звуковой волны.