Создание голосового ассистента, что стоит учитывать в первую очередь?

Question

yessetw @yessetw

Голосовой контроль

Создание голосового ассистента, что стоит учитывать в первую очередь?

Собираемся создавать голосового ассистента на языке Python. Хотелось бы узнать что стоит учитывать перед началом проекта и какие вообще есть нюансы

Вопрос задан более двух лет назад
135 просмотров

3 комментария

Подписаться 2 Простой 3 комментария

Павел Рысев @rysevpd

Мало вводных. Приложение на какой тип устройств, есть ли деньги на платное API гугла или яндекса для распознавания речи. хотите распознавать в режиме реального времени или же "записал предложение - нажал ок - получил результат". Клиент-серверная архитектура или все развернуто на стороне клиента. Какой в принципе функционал хотите. Основная проблема в данном типе проектов, на мой взгляд - именно четкое распознавание слов, хотяб ключевых. Последний раз занимался этим вопросом 4 года назад - тогда у python были с этим проблемы - готовых решений под русский язык не было толком, а те что были - распознавали оч коряво, не всегда ключевые слова удавалось распознать, также были проблемы с производительностью. Попробуйте, если не пробовали, поиграться с перечисленными библиотеками здесь:
https://pythonpip.ru/examples/raspoznavanie-rechi-...
https://proglib.io/p/reshaem-zadachu-perevoda-russ...
https://habr.com/ru/articles/529590/

устраивает ли вас результат. Если денег хватает, можно посмотреть в стороны платных сервисов для распознавания речи:
https://www.tinkoff.ru/software/voicekit/ - вроде самое дешевое раньше было, но апи тупило часто, как сейчас не знаю.
https://cloud.yandex.ru/services/speechkit - от яндекса сервис качественнее, но подороже.

Хотя возможно уже есть хорошее бесплатное и готовое решение для русского языка, не встречал.
Можно упороться и натренировать свою нейронку конечно, но как по мне это точно будет очень долго и сложно.

Написано более двух лет назад
Модератор @TosterModerator

Не надо ставить как можно больше тэгов. Лучше оставить один, но конкретный, с которым проблема.
См.п.3.1 Регламента. Также обратите внимание на п.3.6

Написано более двух лет назад
Сергей Горностаев @sergey-gornostaev

Смотря что именно вы хотите создать. Если скрипт, использующий готовую библиотеки для записи с микрофона, готовый сервис для распознавания слов и запуск программ по наличию некоторых слов среди распознанных, то всё относительно просто. А вот если вы хотите с нуля написать систему, которая понимает человеческую речь на уровне яндексовской Алисы, то стоит учитывать, что такие системы годами пишутся большими командами спецов экстра-класса и требуют инфраструктуры стоимостью в миллиарды долларов.

Написано более двух лет назад

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как реализовать Python-код, который будет распознавать речь, но будет реагировать только тогда, когда будет упомянуто определенное слово?
- 1 подписчик
- более двух лет назад
- 206 просмотров
2

ответа
Веб-разработка

+1 ещё

Простой
Какие есть способы голосового управления сайтом?
- 5 подписчиков
- более двух лет назад
- 2665 просмотров
1

ответ
iPhone

+2 ещё

Средний
Как запускать скрипт/команду через Siri?
- 1 подписчик
- более двух лет назад
- 214 просмотров
1

ответ
Голосовой контроль

Простой
Как сделать свою колонку с Алисой?
- 1 подписчик
- более двух лет назад
- 1618 просмотров
4

ответа
Asterisk

+3 ещё

Простой
Можно ли как-то распознать конец фразы в Asterisk?
- 1 подписчик
- более трёх лет назад
- 215 просмотров
1

ответ
C#

+1 ещё

Простой
Какая библиотека лучше всего использовать для голосового ассистента (бесплатно без регистрации) на C#?
- 1 подписчик
- более трёх лет назад
- 349 просмотров
2

ответа
C#

+4 ещё

Средний
Голосовой ассистент на c#. С чего начать? Что надо изучить? Как реализовать(это мой первый проект)?
- 2 подписчика
- более трёх лет назад
- 361 просмотр
4

ответа
Голосовой контроль

Средний
Делаю голосовой помощник, выдает ошибку: 'NoneType' object has no attribute 'close'? И еще как сюда нормально код вставить, чтобы он всем понятен был?
- 1 подписчик
- более трёх лет назад
- 151 просмотр
0

ответов
Голосовой контроль

Средний
Пытаюсь сделать голосового ассистента, но выводит вот такую ошибку в чем может быть причина?
- 1 подписчик
- более трёх лет назад
- 105 просмотров
0

ответов
Показать ещё Загружается…

Не надо ставить как можно больше тэгов. Лучше оставить один, но конкретный, с которым проблема.
См.п.3.1 Регламента. Также обратите внимание на п.3.6
Смотря что именно вы хотите создать. Если скрипт, использующий готовую библиотеки для записи с микрофона, готовый сервис для распознавания слов и запуск программ по наличию некоторых слов среди распознанных, то всё относительно просто. А вот если вы хотите с нуля написать систему, которая понимает человеческую речь на уровне яндексовской Алисы, то стоит учитывать, что такие системы годами пишутся большими командами спецов экстра-класса и требуют инфраструктуры стоимостью в миллиарды долларов.

Создание голосового ассистента, что стоит учитывать в первую очередь?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт