Как с этим разобраться?

Question

BitNeBolt @BitNeBolt

Нейронные сети

Как с этим разобраться?

Только недавно начал заниматься нейросетями. В целях обучения хочу написать её с нуля, без фреймфорков. Но не понимаю следующие моменты: Результат обучения должен куда-то записываться(не быть же ему в оперативке), но какой тип данных и вид записи должен быть у этого файла? А как потом обращаться к этим результатам(не пробегом же по всему файлу каждый раз, если там больше 3000 строк)? И как должна вести себя сеть, если ввелись данные, которых не было при обучении?

Вопрос задан более трёх лет назад
66 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Решения вопроса 2

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Видео

+1 ещё

Простой
Есть ли видео-нейросеть, дорисовывающая объекты к реальному видео?
- 1 подписчик
- 03 авг.
- 103 просмотра
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 157 просмотров
3

ответа
Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 36 просмотров
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 52 просмотра
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 58 просмотров
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 51 просмотр
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 195 просмотров
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 111 просмотров
1

ответ
Нейронные сети

Простой
Flowise, как подключить эмбендингс?
- 1 подписчик
- 05 июл.
- 60 просмотров
1

ответ
Нейронные сети

Простой
Flowise error 500?
- 1 подписчик
- 04 июл.
- 70 просмотров
0

ответов
Показать ещё Загружается…

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Эксперт по транспортной сети/Сетевой инженер

НТЦ ПРОТЕЙ • Санкт-Петербург

от 200 000 ₽

JS Fullstack Инженер (Node.js + Vue.js)

SteadyControl • Воронеж

от 100 000 до 250 000 ₽

Answer 1 · 2019-03-06 22:56:54

но какой тип данных и вид записи должен быть у этого файла

Нужно записать/загрузить только значения весов между нейронами - результат обучения.
Ну и сам код твоей программы содержит все глобальные параметры сети: как располагаются и ведут себя нейроны, сколько их и тп.

А как потом обращаться к этим результатам(не пробегом же по всему файлу каждый раз, если там больше 3000 строк)

Все весы и другие параметры должны находиться в оперативке, и читаться и перезаписываться каждую итерацию обучения.
Вот, например, репликация обученной Alexnet (прорывная модель сети из 2012),
https://github.com/BVLC/caffe/tree/master/models/b...
233мб.
В Alexnet 62 миллиона параметров, 650 тыс нейронов, и чтобы ее обучить столько же эпох как в оригинальной статье, нужно потратить 5-6 дней на двух GTX 580 3GB видеокартах (Хотя современный рекорд на более быстром оборудовании и оптимизированном коде - 24 минуты).

И как должна вести себя сеть, если ввелись данные, которых не было при обучении?

Сеть это, грубо говоря, просто функция, которую изменяют алгоритмом обучения на основании определенных данных. Она считает что-то. При каждой итерации обучения получается готовая функция, которая тупо считает из входных данных выходные.

Answer 2 · 2019-03-07 00:09:09

Нейронные сети с нуля - нет проблем, изучайте:
https://neurohive.io/ru/tutorial/nejronnaja-set-na...
https://datascience.org.ua/articles/kak-postroit-t...
https://towardsdatascience.com/step-by-step-tutori...
https://habr.com/ru/post/312450/
https://www.datasciencecentral.com/profiles/blogs/...
https://habr.com/ru/post/313216/
https://towardsdatascience.com/how-to-build-your-o...

Как с этим разобраться?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт