Почему нейросеть при использовании функции активации выдает одинаковый результат?

Question

qqqaa @qqqaa

Почему нейросеть при использовании функции активации выдает одинаковый результат?

Учусь создавать свои нейросети. Написал простенький очень нативный алгоритм по работе с нейросетью. Это консольная программа, суть которой в том, что при вводе значений активаций нейронов 1-ого слоя нейросети она выдает выходной результат - активации нейронов последнего слоя. Веса нейросети представлены json файлом, в нем есть 1 объект, в котором хранится многомерный массив с весами. При вводе чисел в консоль в формате 1, 0, 1 (у нейросети 3 входа (и 2 выхода)) сигналы перемножаются через веса, проходят через функцию активации и проходят через следующий слой весов и так до конца - собственно, обычный перцептрон.

Проблема: нейросеть при использовании на всех нейронах функции активации всегда выдает практически идентичный результат на выходном слое, а если не использовать функции активации - результат разный. Почему так и как сделать так, чтобы результат выполнения нейросети был, как и должно быть, разный при использовании функций активации?

Если что-то не понятно - просто запустите у себя код, и поймете, как все работает

Главный файл:

import numpy as np
import json

def sygm(x):     #функция сигмоиды
 return 1/(1 + np.exp(-x))


def calc(arr, wheights):     #функция, возвращяющая массив чисел - результат перемножения входного вектора нейронов на матрицу весов
  arr_1 = np.array(arr)
  wheights_1 = np.array(wheights)

  new_arr = wheights_1.dot(arr_1)

  for i in range(len(new_arr)):
    new_arr[i] = sygm(new_arr[i])
    new_arr[i] = round(new_arr[i], 2)

  return new_arr


def get_wheights(n):     #функция, возвращяющая массив нейронов определенного слооя
  with open("wheights.json", "r") as file:
    res_text = file.read()
  res_json = json.loads(res_text)
  return res_json[str(n)]


def go_trought_the_network(inputs):
  print("Значение входного слоя и его выходные веса", inputs, get_wheights(1))
  layer_2 = calc(inputs, get_wheights(1))
  print("Значение 2 слоя и его выходные веса", layer_2, get_wheights(2))
  layer_3 = calc(layer_2, get_wheights(2))
  print("Значение 3 слоя и его выходные веса", layer_3, get_wheights(3))
  layer_4 = calc(layer_3, get_wheights(3))
  print("Значение 4 слоя и его выходные веса", layer_4, get_wheights(4))
  outputs = calc(layer_4, get_wheights(4))
  print("Значение выходного слоя", outputs)


while 1:     #главный цикл программы, постоянное считывание того, что приходит в консоль
  inp = input()
  print("Введенные данные", inp.split(', '))
  arr = []
  for i in range(len(inp.split(', '))):     #перобразование массива входных строковых чисел в массив "численных" чисел
    arr.append(float(inp.split(', ')[i]))
  go_trought_the_network(arr)

Json файл с весами (они случайные) (сделан для удобства):

Вопрос задан более двух лет назад
194 просмотра

5 комментариев

Подписаться 1 Средний 5 комментариев

freeExec @freeExec

Не может я не разобрался в твоём коде, но надо перемножить входные значения на веса, а потом их все сложить, и только затем применять функцию активации к этому числу. Ну и надо добавлять смещение без этого всё работает ужасно, так как разделение происходит через начало координат.

Написано более двух лет назад
mayton2019 @mayton2019
А зачем здесь используется numpy, когда достаточно math ?

def sygm(x): #функция сигмоиды return 1/(1 + np.exp(-x))
Написано более двух лет назад
Luka83 @Luka83

А какие значения вы в нее передавали?
Сигмоида с насыщением работает, может на ваших тестовых данных ее результат всегда около 1?

Написано более двух лет назад
qqqaa @qqqaa Автор вопроса

Luka83, про какое насыщение вы говорите?

Написано более двух лет назад
Luka83 @Luka83

qqqaa, я имею в виду, что сигмоида асимптотически стремится к 1 по мере роста х. Так что если аргумент велик по абсолютной величине, результат один и тот же, 10 вы подставляете или 100.

Написано более двух лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Видеокарты

+2 ещё

Средний
Целесообразно ли использование двух RTX 5080 для обучения нейросетей?
- 1 подписчик
- 3 часа назад
- 57 просмотров
1

ответ
Python

+1 ещё

Простой
Как бороться с отступами в сформированном шаблоне Django python?
- 2 подписчика
- 6 часов назад
- 125 просмотров
1

ответ
Python

+2 ещё

Простой
Как правильно спроектировать эту функцию?
- 1 подписчик
- 20 часов назад
- 103 просмотра
2

ответа
Python

+1 ещё

Простой
Что не так с моими асинхронными запросами?
- 1 подписчик
- 20 авг.
- 159 просмотров
0

ответов
Python

Простой
Как в питоне генерировать (создавать+заполнять значениями по умолчанию) вложенный словарь так, чтобы вложенные элементы не были копиями друг друга?
- 1 подписчик
- 20 авг.
- 133 просмотра
1

ответ
Python

+1 ещё

Простой
Из-за чего возникает ошибка неверный дескриптор?
- 1 подписчик
- 19 авг.
- 109 просмотров
1

ответ
Python

Простой
Непонимание ошибки yolo8?
- 1 подписчик
- 19 авг.
- 71 просмотр
0

ответов
Python

+1 ещё

Простой
Как грамотно изначально сделать телеграмм бота на Python с помощью aiogram чтобы выдерживал как минимум 10к пользователи и можно было масштабировать?
- 1 подписчик
- 18 авг.
- 240 просмотров
2

ответа
Python

Простой
Как сделать lock для двух асинхронных программ?
- 1 подписчик
- 18 авг.
- 136 просмотров
1

ответ
Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- нет подписчиков
- 16 авг.
- 147 просмотров
2

ответа
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python разработчик

ITK academy • Казань

от 75 000 ₽

Не может я не разобрался в твоём коде, но надо перемножить входные значения на веса, а потом их все сложить, и только затем применять функцию активации к этому числу. Ну и надо добавлять смещение без этого всё работает ужасно, так как разделение происходит через начало координат.
А зачем здесь используется numpy, когда достаточно math ?

def sygm(x): #функция сигмоиды return 1/(1 + np.exp(-x))
А какие значения вы в нее передавали?
Сигмоида с насыщением работает, может на ваших тестовых данных ее результат всегда около 1?
Luka83, про какое насыщение вы говорите?
qqqaa, я имею в виду, что сигмоида асимптотически стремится к 1 по мере роста х. Так что если аргумент велик по абсолютной величине, результат один и тот же, 10 вы подставляете или 100.

Почему нейросеть при использовании функции активации выдает одинаковый результат?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт