Сколько нейронов оптимально для различения звуков?

Question

Stepan Sidorov @always-prog

Я программист. Python, JavaScript, Django.

Нейронные сети

Сколько нейронов оптимально для различения звуков?

Привет.
Я делаю нейросеть по распознованию звуков.
Я подбираю оптимальное количество нейронов, и сейчас остановился на вот такой структуре:
72 -> 2000 -> 1000 -> 500 -> 200 -> 100 -> 2
72 -> это chroma_stft фичи, достаю с помощю librosa.
2 выходных, это 2 звука которые мне нужно различить.
Обучаю я так что режу звук на равные кусочки по 300 мл секунд, и эти кусочки подаю в нейросеть.
Допустим от звука в 1 секунду я получаю 3 кусочка, и этих 3 кусочка я три раза подаю в нейросеть, и просто если нейросеть выдала больше в пользу какого-то типа звуков, то это он.

Также хочу узнать какую функцию активации использовать, опять же, судя по экспериментам лучше всего работает Tanh, а sigmoid в этом случае очень плохо себя показывает.

Вопрос задан более трёх лет назад
50 просмотров

Комментировать

Подписаться 2 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Анимация

+1 ещё

Простой
Существет ли AI делающая промежуточную анимацию между 2 кадрами?
- 1 подписчик
- 09 авг.
- 90 просмотров
1

ответ
Нейронные сети

Простой
Существуют ли нейросети делающие видео с персонажем по эскизу фото?
- 1 подписчик
- 08 авг.
- 85 просмотров
1

ответ
Видео

+1 ещё

Простой
Есть ли видео-нейросеть, дорисовывающая объекты к реальному видео?
- 1 подписчик
- 03 авг.
- 170 просмотров
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 290 просмотров
3

ответа
Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 42 просмотра
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 56 просмотров
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 67 просмотров
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 63 просмотра
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 229 просмотров
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 174 просмотра
2

ответа
Показать ещё Загружается…

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Стажер Моушен дизайнер для контента в соцсетях музыкального стартапа

Vocaberry

от 15 000 до 15 000 ₽

JS Fullstack Инженер (Node.js + Vue.js)

SteadyControl • Воронеж

от 100 000 до 250 000 ₽

Answer 1 · 2020-10-04 15:33:54

У вас есть нейросеть. У вас есть данные. Вы можете запустить сеть, получить ответ, посчитать ошибку. Отлично.

Если вы реально понимаете, что вы делаете, то вы должны провести эксперименты, каждый раз меняя конфигурацию сети, меняя функции активации, проводя пару сотен экспериментов с разными данными и сравнивая результаты - т.е. сравнивая ошибки, полученные в каждом эксперименте. А потом нам рассказать, что-же получилось в качестве оптимального решения. Ну или опубликовать свои результаты хоть в виде научной работы, хоть в качества статьи на Хабре.
А какой ответ в плане оптимальности вы ожидаете услышать на форуме? Что бы кто-то предугадал ответ? Ну кто-то от большой фантазии вам скажет какие-то цифры. Вы им слепо поверите?

Сколько нейронов оптимально для различения звуков?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт