Нейросеть для распознавания речи/громкости звука?

Question

Ening_apps @Ening_apps

Нейросеть для распознавания речи/громкости звука?

Доброго времени суток, уважаемые тостеровцы.
В качестве одного pet-project мне захотелось сделать что-то похожее на игру, которую я увидел в одной музыкальной юмористической программе на некотором федеральном канале. Суть игры довольна проста - чем громче ты орёшь, тем выше прыгает мячик.
Начав думать о том, как бы я мог что-то этакое реализовать, я застопорился на том, что не знаю, как реализовывать часть с обработкой звука. Есть два варианта:
1) Определять только громкость звука, что должно быть проще.
2)speach-to-text recognition как дальнейшее развитие идеи.
Подскажите, пожалуйста, в какую сторону посмотреть, чтобы всё-таки воплотить идею. Должна ли эта быть какая-нибудь нейросеть или другая ML-модель?
Заранее всем большое за советы!

Вопрос задан более трёх лет назад
956 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Хранение данных

+3 ещё

Средний
Как организовать обучение нейронной сети?
- 1 подписчик
- вчера
- 71 просмотр
2

ответа
Машинное обучение

+1 ещё

Средний
Как устроены Нейрохам и подобные ему боты с точки зрения ML?
- 1 подписчик
- 24 июн.
- 383 просмотра
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 275 просмотров
2

ответа
Нейронные сети

Средний
Как в AI ToolKit для тренировки LorA указать свои модели?
- 1 подписчик
- 09 июн.
- 68 просмотров
1

ответ
Мобильная разработка

+2 ещё

Средний
Как сделать в своём мобильном приложении подписание с помощью ЭЦП?
- 1 подписчик
- 05 июн.
- 163 просмотра
3

ответа
Машинное обучение

+1 ещё

Простой
Какие темы в статистике нужно изучить прежде всего, чтобы начать решать простые задачи машинного обучения?
- 2 подписчика
- 25 мая
- 217 просмотров
2

ответа
IT-образование

+1 ещё

Простой
Важны ли алгоритмы и структуры данных для ML-инженера?
- 2 подписчика
- 25 мая
- 499 просмотров
2

ответа
Нейронные сети

Простой
Есть ли нейросети для интерактивной работы с изображениями?
- 2 подписчика
- 13 мая
- 281 просмотр
2

ответа
Карьера в IT

+1 ещё

Простой
Стоит ли беспокоится, если иду в NLP, но я плох на числовых табличных данных?
- 1 подписчик
- 11 мая
- 460 просмотров
1

ответ
Python

+3 ещё

Средний
Как перенести позу SMPL модели на игровую 3д модель?
- 2 подписчика
- 10 мая
- 361 просмотр
1

ответ
Показать ещё Загружается…

Answer 1 · 2018-07-31 23:13:00

Громкость - это обычная амплитуда сигнала. Извлекается из любого медиаформата или напрямую с микрофона чуть ли не как первичные данные - там даже никакой обработки не надо. Так и гуглите - "получение амплитуды с микрофона". Какая к черту нейросеть?