@qqqaa

Как именно работают рекурентные нейронные сети?

Изучаю нейронные сети, а точнее, рекурентные нейронные сети, и столкнулся с вопросом, ответ на который нигде в интернете не нашел. Ниже представлена картинка 3-х циклов работы рекурентной нейронной сети.6437bde5f228c312556304.jpeg
Как видно, к каждому скрытому слою подходит по 2 стрелочки - изменяющиеся входные данные и данные с предыдущей итерации. Как взаимодействуют эти данные между собой? Эти 2 вектора просто почленно складываются, или что?
  • Вопрос задан
  • 106 просмотров
Пригласить эксперта
Ответы на вопрос 2
@AlexSku
не буду отвечать из-за модератора
Конкатенация. Т.е. ко входному вектору добавьте (соедините) предыдущий выход. Тогда матрица весов это соединение двух матриц.
Самое лучшее, приведите пример из какой-нибудь библиотеки Питона, тогда будет понятнее.
Сейчас же они обычно используются в виде LSTM, GRU.
Ответ написан
Комментировать
@kamenyuga
Шолле "Глубокое обучение на Пайтон" - содержит краткое объяснение принципа работы рекуррентных нейросетей - простейших и реальных, а потом прикладной код на питоне. Больше теории и матана - Гудфеллоу "Глубокое обучение".

Если в двух словах, то на каждый нейрон рекуррентного слоя приходят входной вектор данных, вектор данных скрытого слоя и вектор данных керри-слоя. Для каждого свои веса. В итоге все складывается, добавляется вес-байас. Все это оборачивается в функцию активации. Все, выход с одного нейрона готов. Потом считаем новые керри-данные, новые данные скрытого слоя, берем следующие входные данные, повторяем. Так применяется ЛСТМ.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы