Как подобрать начальные входные весовые коэффициенты (веса) для нейронной сети?

Question

atomnato @atomnato

Нейронные сети

Как подобрать начальные входные весовые коэффициенты (веса) для нейронной сети?

Вопрос в следующем: я только начал изучать нейронные сети и для меня стало непонятно по какому методу подбираются начальные веса для нейронной сети. Буду благодарен если в ответе дополнительно приведете пример.

Вопрос задан более двух лет назад
258 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

Простой
Нейросеть на ПК для обработки книжной литературы с последующей выдачей ответов по запросам?
- 1 подписчик
- 28 мая
- 169 просмотров
4

ответа
Arduino

+1 ещё

Средний
Сможет ли нейросеть написать скетч для Arduino mini мультиплексор нескольких COM портов в один?
- 2 подписчика
- 26 мая
- 265 просмотров
1

ответ
Python

+1 ещё

Средний
Как разработать нейросеть для антиспуфинга (Face-antispoofing)?
- 1 подписчик
- 24 мая
- 169 просмотров
0

ответов
Нейронные сети

Простой
В какой нейросети можно делать видеофильмы?
- 1 подписчик
- 22 мая
- 188 просмотров
2

ответа
Нейронные сети

Простой
Как сделать чтобы Grok2 была доступной на бесплатном аккаунте?
- 1 подписчик
- 21 мая
- 171 просмотр
0

ответов
Нейронные сети

Простой
Локальные нейросети для автоматизации. Что лучше использовать?
- 6 подписчиков
- 18 мая
- 4319 просмотров
2

ответа
WordPress

+2 ещё

Средний
Можно ли развернуть многошаговую ИИ-генерацию контента на WP?
- 1 подписчик
- 16 мая
- 273 просмотра
2

ответа
Нейронные сети

Простой
Где скачать TinySD для 32-бит Windows?
- 1 подписчик
- 11 мая
- 148 просмотров
2

ответа
Нейронные сети

+1 ещё

Простой
Какая нейросеть умеет в дизайн?
- 1 подписчик
- 04 мая
- 224 просмотра
2

ответа
Python

+1 ещё

Средний
В Coqui TTS есть поддержка русского языка для озвучки текста?
- 1 подписчик
- 04 мая
- 116 просмотров
1

ответ
Показать ещё Загружается…

Разработчик CV

БИОРГ • Москва

от 140 000 ₽

Инженер эксплуатации сети/Начинающий специалист

beeline • Владивосток

от 70 000 ₽

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Answer 1 · 2023-05-28 21:34:42

Ну это инженерное решение, тут единственного правильного подхода нет. Случайная выборка, как от 0 до 1 например или случайная выборка от -1 до 1. Или по формулам разным Случайная выборка осуществляется из равномерного распределения или из нормального.

В общем вот маленькая статья что бы не повторятся, там от простой выборки и до выборок по формулам в зависимости от функции активации, заодно там и пару коротеньких примеров на python имеется.

Answer 2 · 2023-05-30 09:01:34

Веса инициализируют случайно, в каких то случаях нужно смотреть, какая функция стоит у нейрона (какую операцию проводишь после умножения вектора входов слоя на матрицу весов), нужно смотреть, какой интервал значений ожидается после нее и на следующем слое (0..1 или -1..1 или 0..inf), причем допускаю что возможны конфигурации сетей, в которых на разных слоях эти пороговые значения разные (хотя на практике лучше нормализовать до 1 так или иначе). Это нужно чтобы первоначальное наполнение для нейронной сети имело смысл, тупой пример, если все веса инициализировать такими значениями что значения на выходе всех нейронов станет одним значением (близким к 1 например) то такая сеть скорее всего не сможет обучиться.

Еще момент, первые слои нейронной сети можно инициализировать, скопировав таковые из другой сети по проще, которую обучали на ваших данных, даже с использованием алгоритмов без учителя

Отличный пример, нейронную сеть, обрабатывающую изображения, можно предварительно пропустить через попытку обучить простую нейронную сеть, на вход и выход которой подаются одни и те же данные - изображение, но размерность одного из внутренних слоев заметно ниже входа, т.е. попытка заставить нейронную сеть рисовать по исходному изображению то же самое, но описывая это изображение вектором меньшей размерности, пример такой топологии - бутылочное горлышко.

spoiler

Т.е. в данном случае такую сеть обучить будет проще чем под вашу задачу (и данные для нее проще собрать, ведь не нужно искать смысл в них, только закономерности), так вот первые слои этой предварительной нейронной сети можно в последствии скопировать в целевую нейронную сеть, дозаполнив остальные веса случайными значениями.

Как подобрать начальные входные весовые коэффициенты (веса) для нейронной сети?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт