Нейросеть без библиотек. Как можно реализовать?

Question

D A @DigitalAgonist

Студент

Нейросеть без библиотек. Как можно реализовать?

Наверное, буду реализовывать на С++ (возможно на другом ЯП, поддерживающем ООП).
По моему плану я выделил следующие классы:

neuron
layer
network

neuon содержит следующий код:

#pragma once
#include <math.h>

enum activation_function {
	GAUSSIAN,
	SOFTMAX,
	SINC
	// и т.д.
};

class neuron
{
public:
	double value;
	double error;
	const char* activation_function;

	neuron();
	neuron(double value, double error, const char* activation_function);

	void activation();

	double gaussian(double x);
	double softmax(double x);
	double sinc(double x);
	// и т. д.

	void save(); // для сохранения
	void restore(); // для восстановления из файла
	
};

Если я здесь ошибся, подскажите что исправить =). Ну и не совсем понятно что должно быть в других двух классах. Кто разбирается подскажите =)

Вопрос задан более года назад
206 просмотров

2 комментария

Подписаться 1 Средний 2 комментария

Пригласить эксперта

Ответы на вопрос 3

2 комментария

4 комментария

D A @DigitalAgonist Автор вопроса

Как-то сложно всё объяснено...
1.
Если нетворк будет состоять из одного скрытого слоя, то обратное распространение ошибки (backpropagation) не сложно. А вот если из нескольких то подсчет градиента будет происходить при помощи chain rule - это сложно реализовать.
- по заданию количество слоев не ограничено, но для задачи, которую должна будет решать эта сеть, по идее 1 скрытый слой и может быть даже 1 выход с набором значений от 0 до 1 принадлежности к i-тому классу

Ну ищи примеры и от них отталкивайся.
— искал, может плохо, но ничего более менее похожего не нашел, что можно скачать, посмотреть код, запустить и «пощупать»
3.
Model нетворк, это коллекция слоев, имеет методы compile где ты указываешь loss функцию, то что ты будешь минимизировать, ну и наблюдаемые метрики. также имеет метод fit где ты не посредственно, обучаешь, имеет параметры batch (какими частями ты будешь подавать на вход (количество рядов в матрице)) количество эпох (сколько итераций по каждому batch), ну и данные не посредственно.
loss я так понимаю ошибка (что-то, что не правильно посчитано), которую надо минимизировать

Написано более года назад
Максим Припадчев @Maksim_64

D A, У всех нейронок, есть выходной слой. Его конфигурация это отдельная история, она зависит от задачи которую модель будет решать. Например для классификации на 5 классов это будет, softmax(dot(A,W) + b), c размерностью 5. То есть он трансформирует данные из предпоследнего слоя в котором активация будет relu. В вектор размерностью 5 И значениями между 0-1 сумма которых 1.

loss- это функция подсчета ошибки которую будут минимизировать за счет настройки значений матриц весов (W и b) посредством обратного распространения ошибки. Для задач регрессии обычно MSE используют. Для классификация cross entropy.

Написано более года назад
D A @DigitalAgonist Автор вопроса

Максим Припадчев, функция активации по задаче: сигмоид на входном и гауссова функция на скрытых, почему именно так — не знаю...

Написано более года назад
Максим Припадчев @Maksim_64

D A, На выходном а не на входном. Сигмоид. Значит ты будешь решать задачу бинароной классификации. То есть класса всего два. Это облегчает жизнь.

Написано более года назад

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

+2 ещё

Простой
Можно ли использовать не парные Acquire/Release порядки памяти?
- 1 подписчик
- вчера
- 113 просмотров
2

ответа
C++

Простой
Сборник задач на C++?
- 1 подписчик
- вчера
- 72 просмотра
1

ответ
C++

Простой
Почему requires !std::is_void_v работает только для шаблона?
- 1 подписчик
- 15 авг.
- 46 просмотров
0

ответов
C++

Простой
Почему возникает ошибка C2512 в конструкторе с std::initializer_list?
- 1 подписчик
- 12 авг.
- 92 просмотра
1

ответ
C++

+1 ещё

Простой
Почему окружность получается отрисованной не ровно?
- 1 подписчик
- 11 авг.
- 167 просмотров
2

ответа
Анимация

+1 ещё

Простой
Существет ли AI делающая промежуточную анимацию между 2 кадрами?
- 1 подписчик
- 09 авг.
- 79 просмотров
1

ответ
C++

Средний
Как инициализировать TCHAR*?
- 1 подписчик
- 08 авг.
- 83 просмотра
2

ответа
Нейронные сети

Простой
Существуют ли нейросети делающие видео с персонажем по эскизу фото?
- 1 подписчик
- 08 авг.
- 79 просмотров
1

ответ
C#

+1 ещё

Средний
Где найти чистые исходники мобильного сервера SAMP / CRMP?
- 1 подписчик
- 06 авг.
- 143 просмотра
1

ответ
C++

+1 ещё

Сложный
Не работает поиск через Массив байтов, как исправить?
- 1 подписчик
- 03 авг.
- 113 просмотров
1

ответ
Показать ещё Загружается…

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Database Administrator

Wanted

До 5 000 $

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

У тебя странны вопрос, почти как "Я пишу игру, вот сделал класс и методы объявил Новая Игра, Сохранить, Загрузить, что надо ещё добавить?"
Начни делать, и всё сам поймешь, хватит тебе этого или нет.
freeExec, дело в другом, я никогда этого не делал, поэтому по многочисленным гайдам накидал объявления методов, (собственно h файл), в cpp куча всего, частично копи-пастченного, но почему-то не рабочего =)

Answer 1 · 2023-10-01 11:30:49

Если сфокусироваться на решении задач про созданию простой двухслойной нейросети то тебе
нужна матрица и вектор и операции над ними. И активационная функция. И функция обучения.

Вот это все

neuron
layer
network

я-бы на твоем месте не делал. Это уже архитектура и интеграция. Если развивать проект дальше.

И ты должен сам себе ответить на вопрос - что ты хочешь изучать. ООП или нейросети.
Нейросети это тяжелая тема. Там много экспериметов. Много разочарований. Много работ
дата-инжениринга по сбору и фильтрации входных данных. И этого всего настолько много
что для ООП там уже сил не остается. Тоесть твоя декомпозиция задачи на 3 класса на старте
тебе ничего пока не дает. Но обязывает тебя очень многому.

Я-бы предложил делать прототип в олипиадном стиле.

По поводу примерв. На гитхабе я находил много туториалов и пробных нейросетей на сях
созданных в рамках обучения. Я искать их не будут. Я думаю ты сам найдешь.

Answer 2 · 2023-10-01 11:22:49

Ну ищи примеры и от них отталкивайся. Если нетворк будет состоять из одного скрытого слоя, то обратное распространение ошибки (backpropagation) не сложно. А вот если из нескольких то подсчет градиента будет происходить при помощи chain rule - это сложно реализовать.

Слой из параметров функция активации и выходная размерность.
Внутри слоя activation_fumction(dot(A,W) + b). где A - это входная матрица, W это изначально случайно инициализированная матрица весов с количеством рядов равных количеству колонок в матрице А и количеством колонок равных (output_size) параметр у слоя, размерность. то есть например A(10,3) то W должно быть (3,m) где m это то что ты укажешь в параметре выходная размерность каждого слоя. Та размерность которую ты получаешь на выходе после каждого слоя (10,m) в данном случае, b- вектор, с подходящей размерностью просто выполнить по элементное сложение, так же инициализируется случайно. Ну и dot - математическое умножение матриц.

Model нетворк, это коллекция слоев, имеет методы compile где ты указываешь loss функцию, то что ты будешь минимизировать, ну и наблюдаемые метрики. также имеет метод fit где ты не посредственно, обучаешь, имеет параметры batch (какими частями ты будешь подавать на вход (количество рядов в матрице)) количество эпох (сколько итераций по каждому batch), ну и данные не посредственно.

В целом ищи гайд. Так тут все сложно объяснить, и это сильно зависит сколько слоев. backpropagation на нескольких слоях это реально самый сложный момент. И он реально сложный.

Answer 3 · 2023-10-01 18:28:22

Александр Скуснов @AlexSku

не буду отвечать из-за модератора

Андрей Карпатый всё выложил на блюдечке (особенно автоградиент а-ля PyTorch).
Плейлист NN: from Zero to Hero.

Ответ написан более года назад

2 комментария

Нейросеть без библиотек. Как можно реализовать?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт