Условная ситуация: нужно позвонить человеку, который говорит, например, только по-французски, а я, соответственно, не шибко говорю на французском. Если бы дело было не по телефону, а tête-à-tête, то гугл-транслейт почти справляется. А вот нормально распознать речь собеседника через телефонный канал - не может. Есть какие-то уже прорывы в этой области? Ожидается, что апп будет распознавать речь собеседника через спикерфон, и писать перевод на русском (или можно на английском), а потом будет распознавать мой голосовой ответ, переводить его и проговаривать на французском.
Лучший аудио переводчик а реальном времени, как я понимаю, это openai gpt в реальном времени. Как минимум их chatgpt при наличии подписки в 20$ на презентации этот функционал показывали. Бесплатно можно посмотреть у Майкрософт их copilot.microsoft.com (только что проверил, промпт - 'переводи каждую мою фразу на русском на английский, а с английского на русский', заработало даже без авторизации в google chrome на android, но не в россии) или он же встроенный в edge, просто вслух попросив переводить указанные языки в нужном направлении.
Точно помню были железные стартапы.
Буквально месяц/другой как открыли realtime api, на гит есть примеры аудио чата
Но есть проблема работы на смартфонах с телефонным аудио каналом, официально к нему нет доступа (можно эмулировать bluetooth гарнитуру в лучшем случае, это значит тебе нужен отдельный смартфон для перевода), поэтому не уверен что готовый софт именно для телефонного разговора кто то уже опубликовал.