Вопросы про нейронную сеть?

Question

mIka01 @mIka01

Нейронные сети

Вопросы про нейронную сеть?

Здраствуйте, в университете начался курс по нейросетям и у меня появились вопросы.
Так как сижу на карантине у преподавателя задать вопросы не могу.

Нам выдали методичку где было сказано советы для выбора количество слоев и нейронов в слои. Основные тезисы:

0 - Способен только представлять линейные отделимые функции или решения.
1 - может аппроксимировать любую функцию, которая содержит непрерывное отображение
из одного конечного пространства в другое.
2 - может представлять произвольную границу решения с произвольной точностью
с рациональными функциями активации и может аппроксимировать любой гладкий
отображение с любой точностью.

Это понятно, однако сразу же задача с 4 скрытыми слоями. Это что тогда такое ?

Так же сказано про выбор нейронов в слои.

Количество скрытых нейронов должно быть между размером входного слоя и размером выходного слоя.
Количество скрытых нейронов должно составлять 2/3 размера входного слоя плюс размер выходного слоя.
Количество скрытых нейронов должно быть менее чем в два раза больше размера входного слоя.

Однако непонятно как выбирать количество нейронов в каждом скрытом слои?

Так же из книжки "Штеффен Б. Петерсен" есть цитата про "ваша сеть становится банком памяти"
В контексте переизбытка нейронов и при этом в интернете поднимается задача по уменьшения нейронов, а если я хочу наоборот.
Как посчитать нейросеть для тупого запоминания выборки?
Пример для чего она нужна: если мне надо передать информацию с потерями, но много. Тем самым мне порой легче передать веса нейросети которая восстановит информацию.

Если у меня есть огромная выборка на подобии 10`000 разных данных. Вход и выход выедят так.

2 Вход
3 Выход

Тогда правила выше нарушаются и мне надо будет делать большие слои. А как тогда посчитать их количество?

Еще вопрос про скорость обучения. Всегда говорится о том что чем меньше этот коэффициент тем точнее нейросеть, но медленно обучается и наоборот.
А как понять как зависит коэффициент от выборки?
Например при малой сети и соответственно выборки коэффициент можно повысить и не потеряете в точности, а когда наоборот есть кокаете эмпирическая формула.

Почему обучая нейросеть она может менять свой процент правильности? То есть я конечно помню что она находит точки экстремума, однако она разве не должна в них застревать. Потому что у меня иногда она повышает ошибку, а потом стремительно понижает ошибку на порядок от предыдущего минимума.

Почему при увеличении слоев сеть порой тупеет.
Как нам преподаватель на лекции говорил, что можно запомнить чем больше слоев тем больше возможностей может решать нейросеть и тем дольше она обучается. Это понятно так как линейную функции можно описать и квадратичным уравнением (аналогия на количество слоев). Но как я заметил повышая количество слоев сеть сначала умнеет, а потом тупеет при этом быстрее чем умнела?

Заранее благодарю за ответы.
P.S. Извините если вопросы были глупыми. Но сокурсники вообще еще за лабораторные работы не притрагивались. Так что спросить у них я не могу.

Вопрос задан более трёх лет назад
680 просмотров

Комментировать

Подписаться 3 Средний Комментировать

Помогут разобраться в теме Все курсы

Skypro

Нейросети с 0

9 месяцев

Далее
Stepik

AI-программирование | Экспресс-курс

2 недели

Далее
Skillfactory

Курс по нейронным сетям

10 недель

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Системное администрирование

+2 ещё

Средний
Сервер с GPU предназначен ли для запуска фронтенда/бэкенда или он для вычислений?
- 1 подписчик
- 08 нояб.
- 313 просмотров
1

ответ
Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 131 просмотр
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 106 просмотров
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 94 просмотра
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 77 просмотров
0

ответов
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 100 просмотров
1

ответ
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 91 просмотр
1

ответ
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1485 просмотров
5

ответов
Нейронные сети

Простой
Отечественные нейронки для кодинга и не только сентябрь 2025?
- 1 подписчик
- 22 сент.
- 269 просмотров
4

ответа
Нейронные сети

Простой
Какая AI модель дешевле в пересчете на решение задачи в программировании?
- 1 подписчик
- 21 сент.
- 288 просмотров
3

ответа
Показать ещё Загружается…

IT-архитектор

АВ Софт • Москва

от 300 000 ₽

Маркетинговый аналитик

МТС Web Services • Грозный

от 60 000 ₽

Senior DWH Analyst

Анвио Парк

от 200 000 до 300 000 ₽

Answer 1 · 2021-10-17 01:02:25

Отвечу на что смогу.
> Как посчитать нейросеть для тупого запоминания выборки?
> Почему обучая нейросеть она может менять свой процент правильности?
> Почему при увеличении слоев сеть порой тупеет.
Это называется переобучение. Если очень наглядно, то это можно представить так:
underfitting_and_overfitting_in_machine_learning_image.png

underfitting_and_overfitting_in_machine_learning_image.png

Слева - недостаточно сложная сеть. Она не может приспособиться к сложности данных, и даёт только грубое подобие той закономерности, которую мы моделируем.
Справа - чрезмерно сложная сеть. Она очень хорошо вписывается в обучающую выборку (точки на графики), но если ей дать промежуточные точки (т.е. те. которых не было в обучаяющей выборке), она будет давать сильно отличающиеся от реальных ответы. Это и есть "сеть зазубрила выборку" (подразумевается "вместо того, чтобы понять её закономерности").
Твоя задача как архитектора сети - выбрать такие гиперпараметры (это то, что ты выбираешь до обучения - число слоёв, размер слоёв, скорость обучения, функция активации и т.д.), чтобы сеть не переобучалась.
Собственно, на графике ошибки сети это как раз выглядит так:
overfitting-and-underfitting-wrt-model-error-vs-complexity.png

overfitting-and-underfitting-wrt-model-error-vs-complexity.png

Синяя кривая - ошибка на обучающей выборке. Желтая - на контрольной. По оси X - сложность сети.
Тогда твоё поведение объясняется так. Сложная сеть сначала быстро приспосабливается к выборке (быстро падает ошибка на обоих выборках), а потом начинает зазубривать обучающую выборку (и набирать ошибку на контрольной, так как перестаёт понимать закономерности). Если ты это наблюдаешь - сеть слишком сложная.

Вопросы про нейронную сеть?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт