Задать вопрос
@AlexBoss

Зачем несколько слоев в tensorflow и как они работают?

Добрый день. При решении одной и той же задачи встречаю такие вариации:
1) model.add(keras.layers.Dense(800, activation='relu'))

2)model.add(keras.layers.Dense(500, activation='relu'))
model.add(keras.layers.Dense(150, activation='relu'))

Какой в данном случае смысл второго слоя, и, если не сложно, просьба объяснить на пальцах как он работает.
Я понимаю, что нейроны первого слоя связаны каждый с каждым второго слоя и что это повышает качество сети, но почему не проще в данном случае сделать один масштабный слой?
  • Вопрос задан
  • 682 просмотра
Подписаться 1 Простой Комментировать
Решения вопроса 1
origami1024
@origami1024
went out for a night walk
На пальцах не объяснить, это не доказанный вопрос. Теоретически любая функция может быть построена и обучена на одном слое, если там достаточно много нейронов. Но эмпирически более сложная функция может быть построена и легче обучена на 6 нейронах в виде двух слоев 3-3, чем 6 нейронах в одном слое.
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
@TriKrista
ИМХО, если на пальцах, в общем случае, каждый слой можно заменить одной кривой на графике, к примеру для разделения груш от яблок, хватит одной кривой, и того один слой, а для решения задачи "ИЛИ" нужно две кривые, итого два слоя.

Так же, в общем случае, для решения одной и той же задачи, многослойная сеть потребует меньше синапсов чем однослойная.
Ответ написан
@ivodopyanov
NLP, python, numpy, tensorflow
https://playground.tensorflow.org/
Тут можно поиграться с количеством слоев и нейронов в тривиальной сети и посмотреть, как эти параметры влияют на выразительность модели.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы