Некорректный результат умножения или логическая ошибка?

Question

Никита Миронов @NEzyaka

линуксоид; начинающий разработчик C++/Qt, Python

Некорректный результат умножения или логическая ошибка?

Доброго времени суток! Решил для себя заняться нейросетями. Прочитал книгу Тарика Рашида "Make Your Own Neural Network", там в конце есть пример реализации трёхслойного перцептрона для классификации рукописных цифр с использованием матриц. Если кратко, то при таком подходе выход слоя нейронной сети - это произведение матриц весов связей с предыдущим слоем на матрицу входов этого слоя. И в той, и в другой матрице диапазон значений от нуля до единицы. Интереса ради решил переписать реализацию из книги на C++ с использованием Boost. В реализации на C++ сигнал всех нейронов выходного слоя (что является, по сути, вероятностью принадлежности к какому-либо классу) почему-то равен 1.0, получается что то, что подали на вход на 100% относится ко всем классам, чего быть не может. Затем переписал с Python на C++ с Eigen, который используется в TensorFlow, то же самое. Переписал на Go + Gonum, то же самое. Первое расхождение уже после первого умножения матриц: умножения матрицы весов связей входного слоя со скрытым. В результате получается матрица со значениями типа 3.27362482790, 5.4859804, 6.4859834 и т.д. Но как такое возможно, если максимальные значения в умножаемых матрицах не превышают единицы? Ссылки на реализации:

Вопрос задан более трёх лет назад
433 просмотра

1 комментарий

Подписаться 2 Средний 1 комментарий

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как получить views сообщения на канале через бота aiogram?
- 1 подписчик
- 40 минут назад
- 13 просмотров
1

ответ
Python

+1 ещё

Простой
Из-за чего возникает ошибка неверный дескриптор?
- 1 подписчик
- 6 часов назад
- 58 просмотров
1

ответ
Python

Простой
Непонимание ошибки yolo8?
- 1 подписчик
- 7 часов назад
- 35 просмотров
0

ответов
Python

+1 ещё

Простой
Как грамотно изначально сделать телеграмм бота на Python с помощью aiogram чтобы выдерживал как минимум 10к пользователи и можно было масштабировать?
- 1 подписчик
- 21 час назад
- 143 просмотра
2

ответа
Python

Простой
Как сделать lock для двух асинхронных программ?
- 1 подписчик
- вчера
- 119 просмотров
1

ответ
C++

+2 ещё

Простой
Можно ли использовать не парные Acquire/Release порядки памяти?
- 1 подписчик
- 16 авг.
- 154 просмотра
2

ответа
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- нет подписчиков
- 16 авг.
- 125 просмотров
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- 16 авг.
- 127 просмотров
1

ответ
C++

Простой
Сборник задач на C++?
- 1 подписчик
- 16 авг.
- 94 просмотра
1

ответ
Python

Простой
Что можно ускорить в коде решателя игры крестики нолики?
- 1 подписчик
- 16 авг.
- 195 просмотров
0

ответов
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python-разработчик (Senior)

BCraft

от 3 500 до 4 500 $

Что-то мне подсказывает что умножение работает правильно. Ошибка скорее всего в исходных данных.

Answer 1 · 2018-02-06 12:44:52

Первое расхождение уже после первого умножения матриц: умножения матрицы весов связей входного слоя со скрытым. В результате получается матрица со значениями типа 3.27362482790, 5.4859804, 6.4859834 и т.д. Но как такое возможно, если максимальные значения в умножаемых матрицах не превышают единицы?

возьми матрицу 2х2 cо значениями 0.9(<1). И умножь её саму на себя. Получишь матрицу 2х2 со значениями 1.62(>1). Магия, правда?

Некорректный результат умножения или логическая ошибка?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт