Как исправить ошибку в обучении нейросети?

Question

Андрей Пренрек @Frotryi

Живу не тужу

Как исправить ошибку в обучении нейросети?

Я учусь писать нейронные сети, но у меня возникает ошибка в этой части кода, когда я хочу отредактировать весы к первому скритому слою.

Код

error_layer_1 = weights_delta_layer_2 * self.weights_1_2
gradient_layer_1 = result_1 * (1 - result_1)
weights_delta_layer_1 = error_layer_1 * gradient_layer_1
self.weights_0_1 -= np.dot(inputs.reshape(len(inputs), 1), weights_delta_layer_1).T * self.learning_rate

Ошибка:

Traceback (most recent call last):
  File "main.py", line 77, in <module>
    neiron.train(np.array([1, 0, 1, 0]), 1)
  File "main.py", line 60, in train
    error_layer_1 = np.dot(weights_delta_layer_2 * self.weights_1_2)
ValueError: operands could not be broadcast together with shapes (1,2) (2,3)

Ввесь код:

import numpy as np
import sys


class ByCar:
    def __init__(self, learning_rate=0.05):
        self.weights_0_1 = np.random.normal(0.0, 2 ** -0.5, (3, 4))
        self.weights_1_2 = np.random.normal(0.0, 2 ** -0.5, (2, 3))
        self.weights_2_3 = np.random.normal(0.0, 1, (1, 2))

        self.sigmoid_mapper = np.vectorize(self.sigmoid)
        self.learning_rate = np.array([learning_rate])

    def sigmoid(self, x):
        return 1 / (1 + np.exp(-x))

    def print_weights(self):
        print(f"Веса первого слоя: \n{self.weights_0_1}")
        print(f"Веса второго слоя: \n{self.weights_1_2}")
        print(f"Веса третьего слоя: \n{self.weights_2_3}")

    def predict(self, inputs):
        inputs_1 = np.dot(self.weights_0_1, inputs)
        result_1 = self.sigmoid_mapper(inputs_1)

        inputs_2 = np.dot(self.weights_1_2, result_1)
        result_2 = self.sigmoid_mapper(inputs_2)

        inputs_3 = np.dot(self.weights_2_3, result_2)
        result_3 = self.sigmoid_mapper(inputs_3)

        return result_3

    def train(self, inputs, expected_predict):
        inputs_1 = np.dot(self.weights_0_1, inputs)
        result_1 = self.sigmoid_mapper(inputs_1)

        inputs_2 = np.dot(self.weights_1_2, result_1)
        result_2 = self.sigmoid_mapper(inputs_2)

        inputs_3 = np.dot(self.weights_2_3, result_2)
        result_3 = self.sigmoid_mapper(inputs_3)

        actual_predict = result_3[0]

        error_layer_3 = np.array([actual_predict - expected_predict])
        gradient_layer_3 = actual_predict * (1 - actual_predict)
        weights_delta_layer_3 = error_layer_3 * gradient_layer_3
        self.weights_2_3 -= (np.dot(weights_delta_layer_3, result_2.reshape(1, len(result_2)))) * self.learning_rate


        error_layer_2 = weights_delta_layer_3 * self.weights_2_3
        gradient_layer_2 = result_2 * (1 - result_2)
        weights_delta_layer_2 = error_layer_2 * gradient_layer_2
        self.weights_1_2 -= np.dot(result_1.reshape(len(result_1), 1), weights_delta_layer_2).T * self.learning_rate


        error_layer_1 = weights_delta_layer_2 * self.weights_1_2
        gradient_layer_1 = result_1 * (1 - result_1)
        weights_delta_layer_1 = error_layer_1 * gradient_layer_1
        self.weights_0_1 -= np.dot(inputs.reshape(len(inputs), 1), weights_delta_layer_1).T * self.learning_rate

        print(self.weights_0_1)








neiron = ByCar()
neiron.train(np.array([1, 0, 1, 0]), 1)

Вопрос задан более трёх лет назад
142 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Средний
Как обучится и понять ООП?
- 1 подписчик
- 4 часа назад
- 14 просмотров
0

ответов
Python

+1 ещё

Простой
Что не так с моими асинхронными запросами?
- 1 подписчик
- 12 часов назад
- 71 просмотр
0

ответов
Python

Простой
Как в питоне генерировать (создавать+заполнять значениями по умолчанию) вложенный словарь так, чтобы вложенные элементы не были копиями друг друга?
- 1 подписчик
- 16 часов назад
- 90 просмотров
1

ответ
Python

+1 ещё

Простой
Из-за чего возникает ошибка неверный дескриптор?
- 1 подписчик
- вчера
- 88 просмотров
1

ответ
Python

Простой
Непонимание ошибки yolo8?
- 1 подписчик
- вчера
- 45 просмотров
0

ответов
Python

+1 ещё

Простой
Как грамотно изначально сделать телеграмм бота на Python с помощью aiogram чтобы выдерживал как минимум 10к пользователи и можно было масштабировать?
- 1 подписчик
- 18 авг.
- 189 просмотров
2

ответа
Python

Простой
Как сделать lock для двух асинхронных программ?
- 1 подписчик
- 18 авг.
- 122 просмотра
1

ответ
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- нет подписчиков
- 16 авг.
- 135 просмотров
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- 16 авг.
- 132 просмотра
1

ответ
Python

Простой
Что можно ускорить в коде решателя игры крестики нолики?
- 1 подписчик
- 16 авг.
- 207 просмотров
0

ответов
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python-разработчик (Senior)

BCraft

от 3 500 до 4 500 $

Answer 1 · 2022-04-06 16:09:04

ValueError: operands could not be broadcast together with shapes (1,2) (2,3)

- здесь явно написано в чём проблема. Ты не можешь выполнить операцию dot между такими массивами. Читаем доку:

При работе с двумя массивами NumPy сравнивает их формы по элементам. Он начинается с конечных (то есть самых правых) измерений и идет влево. Два измерения совместимы, если они равны или одно из них равно 1. Если эти условия не выполняются, возникает исключение ValueError: operands could not be broadcast together with shapes(ValueError: операнды не могут быть переданы вместе, указывая на то, что массивы имеют несовместимые формы).

p.s. Кстати, могу лишь предположить т.к. у новичков такая проблема часто возникает, что ты забыл какой -то из массивов транспонировать: например транспонировав 2, 3 в 3, 2 или 1, 2 в 2,1 - ты сможешь применить к ним dot.

Как исправить ошибку в обучении нейросети?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт