Почему моя нейросеть по распознованию цифр MNIST не работает?

Question

Dimchik @Dimpik

Почему моя нейросеть по распознованию цифр MNIST не работает?

пытаюсь сделать свою Нейросеть которая угадывает цифры MNIST. Я пишу на Python, используя 1 скрытый (128 нейронов) слой, Softmax, Relu. Сначала я попытался написать его без библиотек. Он работал, но учился медленно, а у меня нет 10 часов на его обучение. Затем я добавляю Numpy. Ничего не работает. У меня огромные числа на выходе и как следствие Math Range Error(Числа на подобие 2.74512381e+10). Изменение скорости обучения не влияет на ошибку.

В части кода с предсказанием я уверен на все 100, поэтому вот код обучения:

def Education(): # f() обучения
	global par
	for i in range(15):
		sumOfErrs = 0
		trLen = len(x_train)
		for a in range(trLen):
			it = normalize(x_train[a])
			array = nn.NeuralNetwork(par.weights_0_1, par.weights_1_2, par.biases1, par.biases2, it)
			predN = array[0] # Выход с учетом Softmax
			pred = array[1] # Выход без учета Softmax
			Layer1 = array[2] # Скрытый слой
			goalclasspred = predN[y_train[a]] # Значение выхода для верного класса
			par.error = math.log(goalclasspred)*(-1)
			w1_2Len = len(par.weights_1_2)
			for k in range(w1_2Len):
				layer_1_deltas = np.array([fa.CrossEntropyDeriv(goalclasspred) for i in range(w1_2Len)])
				if k == y_train[a]:
					layer_1_deltas[k] *= goalclasspred*(1-goalclasspred)
				else:
					layer_1_deltas[k] *= (-1)*goalclasspred*predN[k]
			
			print(layer_1_deltas)
			layer_0_deltas = np.zeros((10, 128))
			layer_0_deltas = np.dot(par.weights_1_2.T, layer_1_deltas)*fa.ReLUDeriv(Layer1)
			par.weights_1_2 = par.weights_1_2 - np.outer(layer_1_deltas*par.alpha, Layer1)
			par.biases2 = par.biases2 - layer_1_deltas*par.alpha
			
			delta_alfa1 = [num * par.alpha for num in layer_0_deltas]
			par.weights_0_1 = par.weights_0_1 - np.outer(layer_0_deltas*par.alpha, it)
			par.biases1 = par.biases1 - layer_0_deltas*par.alpha

Вопрос задан 24 июл. 2023
102 просмотра

2 комментария

Подписаться 1 Средний 2 комментария

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Сложный
Интерпретация результатов модели lambdamart?
- 1 подписчик
- 24 апр.
- 41 просмотр
0

ответов
IT-образование

+3 ещё

Простой
Какая есть литература полезная и понятная по Data Science на русском?
- 4 подписчика
- 17 апр.
- 1071 просмотр
1

ответ
Машинное обучение

+2 ещё

Простой
Создание нейронной сети для определения сортов яблок. Как осуществить?
- 1 подписчик
- 11 апр.
- 99 просмотров
0

ответов
Машинное обучение

+1 ещё

Средний
Как работает адаптивный бустинг для регрессии?
- 1 подписчик
- 05 апр.
- 24 просмотра
0

ответов
Машинное обучение

+1 ещё

Средний
Чем отличается стекинг от блендинга?
- 1 подписчик
- 02 апр.
- 49 просмотров
1

ответ
Python

+1 ещё

Средний
Как можно добавить и протрансформировать изображение на другое изображение?
- 1 подписчик
- 30 мар.
- 71 просмотр
1

ответ
NumPy

Простой
Как собрать видео из list[np.array]?
- 1 подписчик
- 26 мар.
- 28 просмотров
0

ответов
Машинное обучение

+2 ещё

Простой
Что технически(какие it решения, технологический стек) нужны для создания ии ,который сможет на основе жалоб ставить диагноз?
- 1 подписчик
- 21 мар.
- 118 просмотров
3

ответа
Машинное обучение

Средний
Какой метод машинного обучения применить и как?
- 1 подписчик
- 19 мар.
- 62 просмотра
1

ответ
Машинное обучение

Средний
Как исправить переобучение сверточной нейронной сети(keras)?
- 1 подписчик
- 18 мар.
- 49 просмотров
0

ответов
Показать ещё Загружается…

Прикладной администратор

Outlines Tech

от 260 000 до 310 000 ₽

Data Scientist (Финтех)

Intelinvest

от 60 000 ₽

Senior ML Engineer (Computer Vision)

Gradient

от 450 000 ₽

Разработка модуля на WordPress

27 апр. 2024, в 11:22

10000 руб./за проект

Разработать дизайн игры (VR)

27 апр. 2024, в 10:46

1000 руб./в час

Разработать Lisp или другим способом в AUTOCAD

27 апр. 2024, в 10:42

20000 руб./за проект

А где ошибку выдает? и полный текст ошибки можно увидеть. Откуда у вас в принципе там берутся большие числа?
Не надо ставить как можно больше тэгов. Лучше оставить один, но конкретный, с которым проблема.
См.п.3.1 Регламента. Также обратите внимание на п.3.4

Answer 1 · 2023-07-24 16:23:50

Несколько соображений. Я думаю что для решения MNIST задач никакие огромные числа не нужны.
НС идеологически способны работать на малом диапазоне плавающей точки. И функции активации
(если таковые есть) обычно этому способствуют.

Numpy в данном случае имеет преимущество вовсе не в больших числах а в операциях над векторами и матрицами.

С твоей ситуацией низкого перформанса никто разбираться не будет. Нет ошибки - и нет ответа.
Если медленная скорость - ищи гиперпараметр η (греческая буква) - он регулирует скоросить.
алгортмов обратного распространения ошибки. (В разной литературе он может и по другому называться)

Учись по курсам. Потому что учить тебя нейросетям здесь бесплатно точно никто не будет. И это
технически невозможно в формате ответов.

Почему моя нейросеть по распознованию цифр MNIST не работает?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт