Как строить нейронную сеть?

Question

Денис @lacredin

Программист

Нейронные сети

Как строить нейронную сеть?

Здравствуйте.
Мне необходимо разобраться в работе нейронных сетей для своей дипломной работы.
Прочитав несколько статей и часть книги, я так и не смог понять, как же они строятся.
Общий принцип работы понятен: множество входных данных, которые через весовые коэффициенты входят во все нейронны нейронного слоя сразу. В них сигналы складываются, потом преобразуются активационной функцией и идут на вход нейронов следующего нейронного слоя. В конце концов всё это активирует какой-то выходной нейрон(ы), которые и будут результатом работы.

Но вот сколько должно быть нейронов, сколько должно быть слоёв, несёт ли каждый из нейронов какую-то смысловую нагрузку(проверяет какой-то конкретный параметр исходя из входных данных) или всё случайно. На что опираться при подборе этого всего, не понятно!
Прошу помочь разобраться с этим на примере простой задачи.
Предположим что я хочу написать нейронную сеть для сложения/вычитания чисел от 0 до 9.
В этом случае(как я понимаю) у меня будет три входных нейрона(первое число, знак плюс или минус и второе число) и 28 выходных нейронов (числа от -9 до 18).
Но что должно быть по середине?
Сколько нейронов, сколько слоёв, по какому принципу надо подбирать это всё?

Вопрос задан более трёх лет назад
695 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Пригласить эксперта

Ответы на вопрос 2

Комментировать

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 30 просмотров
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 50 просмотров
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 48 просмотров
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 49 просмотров
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 188 просмотров
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 101 просмотр
1

ответ
Нейронные сети

Простой
Flowise, как подключить эмбендингс?
- 1 подписчик
- 05 июл.
- 58 просмотров
1

ответ
Нейронные сети

Простой
Flowise error 500?
- 1 подписчик
- 04 июл.
- 70 просмотров
0

ответов
Нейронные сети

Простой
Нейросеть на ПК для обработки книжной литературы с последующей выдачей ответов по запросам?
- 1 подписчик
- 28 мая
- 197 просмотров
4

ответа
Arduino

+1 ещё

Средний
Сможет ли нейросеть написать скетч для Arduino mini мультиплексор нескольких COM портов в один?
- 2 подписчика
- 26 мая
- 320 просмотров
1

ответ
Показать ещё Загружается…

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Эксперт по транспортной сети/Сетевой инженер

НТЦ ПРОТЕЙ • Санкт-Петербург

от 200 000 ₽

Сетевой инженер

МТС • Владивосток

от 100 000 ₽

Answer 1 · 2017-02-04 20:18:12

Есть первое приближение, сложность задачи практически линейно влияет на количество нейронов, но вот как именно оценить численно эту сложность - зависит от задачи.
Есть предположение, что каждый последующий слой (для deep learning) это фактически отдельная задача преобразования данных в другую форму, выделение критериев, внутренняя классификация и т.п., а количество нейронов в слое - это сложность именно этого преобразования.
Если зависимость между входами и выходами имеет сложную форму (не просто если-то), то каждый лишний слой - определяет именно эту зависимость, но все они работают сразу для всех условий в зависимостях...

И вообще, нейроны в нейронной сети это как голограмма, они все одновременно влияют на результат. Я поверхностно копался в доступной информации, в основном все гуляют вокруг изучения конкретной задачи.

Еще одно направление исследования сложности нейронной сети - ее модификация. Сначала вы делаете сеть достаточно сложной по вашему мнению, для того чтобы она описывала вашу предметную область, а затем ее уменьшаете, удаляя отдельные веса и нейроны (после каждой модификации необходимо повторное до обучение).

Вполне возможна игра с входными обучающими данными, их можно группировать, выделять для их группировки отдельные нейронные сети, и обучать разные сети для разных групп.

А еще фишкой последних лет является использование тензоров, для того чтобы обучать не саму нейронную сеть а ее упрощенный вариант (тензор, это я так понял, мы преобразовываем веса нейронной сети в упрощенное дерево, проводим обучение на его основе а затем результат приводим обратно к сети ) - это позволяет уменьшить требования ресурсов на обучение на порядок. К сожалению красивых примеров в русскоязычном сегменте интернета нет, да и на английском... только пара открытых библиотек имеет готовую реализацию по работе с тензорами, tensorflow от гугла и theano

Answer 2 · 2017-01-11 15:36:41

Как строить нейронную сеть?
Прочитав несколько статей и часть книги, я так и не смог понять, как же они строятся.

Прочитайте статьи еще раз и дочитайте книгу.

Как строить нейронную сеть?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт