@ekifox
Пора идти спать

Какие проекты позволяют распознавать говорящего по голосу?

Собственно вопрос в названии...
Делаю небольшую самоделку для "умного дома" и хочется чтобы некое API могло различать членов семьи.
Хотелось бы сделать проверку прав на какие-либо действия (например выключить свет в моей комнате смогу только я).
API должно возвращать внутренний идентификатор говорящего.
Хочу завязать это на api.ai :)

Ответ найден в документации к SpeechKit Cloud:
https://tech.yandex.ru/speechkit/cloud/doc/guide/c...
  • Вопрос задан
  • 497 просмотров
Решения вопроса 1
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Посоветую немного другой подход: это пересечение коридоров средней несущей сигнала для пиковых значений (или коридор отклонений).
1. Берём нормализованный сигнал (ось x: время, ось y: амплитуда) и строим среднюю кривую.
2. Затем, делаем допуск на погрешности: увеличиваем толщину кривой и получаем доверительную зону, в которой мы будем рассматривать сигнал.
3. Затем, пересекаем зону из только что полученного входного сигнала (с микрофона) со всеми хранимыми эталонными зонами (одна такая зона - один заранее записанный голос человека с применёнными преобразованиями из п.1 и п.2).
Максимальное совпадение зон при пересечении (наложении) даст искомого члена семьи.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
compibox
@compibox
Full-Stack Developers
https://habrahabr.ru/post/144491 - почитайте поверхностно для начала))
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы