always-prog
@always-prog
Я программист. Python, JavaScript, Django.

Сколько нейронов оптимально для различения звуков?

Привет.
Я делаю нейросеть по распознованию звуков.
Я подбираю оптимальное количество нейронов, и сейчас остановился на вот такой структуре:
72 -> 2000 -> 1000 -> 500 -> 200 -> 100 -> 2
72 -> это chroma_stft фичи, достаю с помощю librosa.
2 выходных, это 2 звука которые мне нужно различить.
Обучаю я так что режу звук на равные кусочки по 300 мл секунд, и эти кусочки подаю в нейросеть.
Допустим от звука в 1 секунду я получаю 3 кусочка, и этих 3 кусочка я три раза подаю в нейросеть, и просто если нейросеть выдала больше в пользу какого-то типа звуков, то это он.

Также хочу узнать какую функцию активации использовать, опять же, судя по экспериментам лучше всего работает Tanh, а sigmoid в этом случае очень плохо себя показывает.
  • Вопрос задан
  • 49 просмотров
Пригласить эксперта
Ответы на вопрос 1
@dmshar
У вас есть нейросеть. У вас есть данные. Вы можете запустить сеть, получить ответ, посчитать ошибку. Отлично.

Если вы реально понимаете, что вы делаете, то вы должны провести эксперименты, каждый раз меняя конфигурацию сети, меняя функции активации, проводя пару сотен экспериментов с разными данными и сравнивая результаты - т.е. сравнивая ошибки, полученные в каждом эксперименте. А потом нам рассказать, что-же получилось в качестве оптимального решения. Ну или опубликовать свои результаты хоть в виде научной работы, хоть в качества статьи на Хабре.
А какой ответ в плане оптимальности вы ожидаете услышать на форуме? Что бы кто-то предугадал ответ? Ну кто-то от большой фантазии вам скажет какие-то цифры. Вы им слепо поверите?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы