Какая нейросеть лучше подойдёт для распознавания слов из mp3?
У меня есть mp3 трек и мне нужен ИИ который обработает трек и вернёт его слова (ОБЯЗАТЕЛЬНО с временными отметками). Я хочу запустить ИИ у себя локально. На счёт языков хотелось бы на русском в первую очередь, но на английском тоже неплохо. Подскажите какая нейронка лучше подойдёт. Если есть уже обученная модель то вообще шикарно.