Как разработать распознаватель речи?

Мне нужно что то не стандартное, не просто апи или сервис в интернете.
Мне нужна сама технология.
Допустим я записываю свои фразы, своим голосом, и делаю ассоциации с текстом или командами.
Как сделать чтобы распозновался не просто мой голос но и голоса других людей с разными интонациями.
Давным давно был телефон с черно белым экраном, он умел обучаться и выполнять команды.
Вот нужно тоже самое чтобы сделать джарвина :)

Что почитать? посмотреть?
  • Вопрос задан
  • 2039 просмотров
Пригласить эксперта
Ответы на вопрос 2
@guras256
https://habrahabr.ru/post/226143
main-qimg-0a08673613281869f6b80d3e05754c
на вскидку нашел такие источники.
задача, кстати, сложная и для новичка вероятно неподъемная
Ответ написан
Комментировать
@AlexSku
не буду отвечать из-за модератора
Технология может быть такой. Сначала разбивка по времени и спектральный анализ. Советую применить вейвлеты. Затем выделение фонем (составьте словарь). А из фонем составляйте слова. Но это долгий путь. Самое лучшее - как раз API (напр. Speech API от Microsoft).
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы