Возможно ли обучить GAN без batchnorm?

Question

Prizm @PrizmMARgh

Возможно ли обучить GAN без batchnorm?

Пишу свой инструментарий для создания нейросетей. FeedForward модели на нём учатся нормально (часто довольно медленно, свёрточный классификатор рисованных нулей-единиц размера 30*30 может учиться до минуты, но меня это устраивает). Проблемы начинаются, когда я пытаюсь реализовать GAN. Распространение ошибок и прочее работает правильное, но обучение ни к чему не приводит. Пытался обучить на примерно 300 вручную нарисованных окружностях, в качестве выборок брал случайные поднаборы размера от 5 до 200, методы оптимизации так же перепробовал все, что только мог, ждал достаточно долго - до 2 часов, пробовал разные архитектуры, перенастраивал операции pool и т.п., как советуют - ничего не выходит. Пришёл к выводу, что нужно использовать batchNorm, но в моей реализации он невозможен, т.к. прогонка вычислений по нейросети проходит только для одного значения одновременно. (а чтобы это исправить нужно будет исправлять примерно 4к строк кода либо писать заново). Так вот - действительно ли дело может быть в отсутствии batchnorm? Если нет, то какие оптимальные архитектуры генератора и дискриминатора и методы оптимизации градиентного спуска необходимо использовать? И почему?

Вопрос задан более трёх лет назад
106 просмотров

2 комментария

Подписаться 1 Сложный 2 комментария

freeExec @freeExec

Ну в вашем случае просто batch = 1. А чтобы понять нужен или нет, посмотрите, что у вас на выходе у слоя, такая ли большая разница между разными входными данными.

Написано более трёх лет назад
Prizm @PrizmMARgh Автор вопроса

freeExec, у меня не совсем batch = 1., у меня batch произвольного размера, т.к. градиент считается всё равно суммарный, просто считается не всё параллельно, а по очереди. На старте обучения фотографии на выходе генератора получаются почти монотонные. Также ещё проверил на примитивных данных (просто один скаляр) - он учится относительно нормально на перцептронах (порядка 20к итераций наборами по 5 значений), если давать, как пример значения из одного диапазона, но если давать из двух диапазонов - уже не учится.

Написано более трёх лет назад

Решения вопроса 1

5 комментариев

Prizm @PrizmMARgh Автор вопроса

А разве FeedForward - обязательно полносвязная? Я подразумевала, что у меня нейросети имеют простую архитектуру и все слои (слои сложения, умножения на матрицу, свёртки, применения функций) вычисляются строго поочерёдно и ровно единожды. В любом случае, спасибо за ответ, хотя уже и поздно. Я поняла, что для нейросетей была слишком неопытна и мне не стоило писать подобие библиотеки для них на плюсах без должного знания языка и библиотек для математики (от которых по глупости решила отказаться).

Написано более трёх лет назад
imageman @imageman

Да, строго говоря полносвязность не обязательное условие (подозреваю, что 99% полносвязных).

Для обработки картинок стоит смотреть convolutional neural network (CNN) https://ru.wikipedia.org/wiki/%D0%A1%D0%B2%D1%91%D...

Написание собственных библиотек слишком затратно по времени (слишком!), особенно когда есть хорошие бесплатные альтернативы. К сожалению я по неопытности тоже написал свой велосипедик (реализацию обучения деревья решений).

Написано более трёх лет назад
Prizm @PrizmMARgh Автор вопроса

imageman, Да, я знаю, что такое свёрточные слои и свёрточная нейросеть. Она в GAN и была использована. А насчёт бесплатных альтернатив - это всё равно не так интересно (ведь всё это делалось, как досуг, а не как что-то коммерческое), но если есть какая-то библиотека на c++, которая позволяет использовать свёртку/развёртку (желательно вместе с другими операциями типа pool) и, соответственно, применять к ней шаг backpropagation, то хотелось бы узнать - какая? (если не считать opencv, т.к. там уже реализовано и всё остальное для нейросетей)

Написано более трёх лет назад
imageman @imageman

прогонка вычислений по нейросети проходит только для одного значения одновременно
а какое значение скорости обучения используешь?

Кстати, SGD, RMSprop, Adam пробовал? https://habr.com/ru/company/skillfactory/blog/525214/

Пробовал написать процедуру подбора гиперпараметров?

А не GAN обучается нормально (со всеми функциями, что ты используешь)?

Пробовал отслеживать значения градиентов? Нет взрывных или затухающих?

Пробовал дискриминатору ставить меньший learning rate (или вообще обучать не каждый раз)?

Написано более трёх лет назад
Prizm @PrizmMARgh Автор вопроса

imageman, из всего этого только значения градиентов не отслеживала. Оптимизатор использовала adam и его варианты, gan всё равно обучался очень плохо - у него выходные значения имели сильную дисперсию. Думаю, не стоит подобным заниматься без батчей, к тому же без них и скорость сильно падает. В любом случае, в ваших ответах много полезного, обозначу их как правильные.

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Анимация

+1 ещё

Простой
Существет ли AI делающая промежуточную анимацию между 2 кадрами?
- 1 подписчик
- 09 авг.
- 78 просмотров
1

ответ
Нейронные сети

Простой
Существуют ли нейросети делающие видео с персонажем по эскизу фото?
- 1 подписчик
- 08 авг.
- 78 просмотров
1

ответ
Видео

+1 ещё

Простой
Есть ли видео-нейросеть, дорисовывающая объекты к реальному видео?
- 1 подписчик
- 03 авг.
- 146 просмотров
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 246 просмотров
3

ответа
Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 41 просмотр
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 55 просмотров
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 65 просмотров
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 62 просмотра
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 221 просмотр
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 160 просмотров
2

ответа
Показать ещё Загружается…

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

JS Fullstack Инженер (Node.js + Vue.js)

SteadyControl • Воронеж

от 100 000 до 250 000 ₽

Сетевой инженер

МТС • Владивосток

от 100 000 ₽

Ну в вашем случае просто batch = 1. А чтобы понять нужен или нет, посмотрите, что у вас на выходе у слоя, такая ли большая разница между разными входными данными.
freeExec, у меня не совсем batch = 1., у меня batch произвольного размера, т.к. градиент считается всё равно суммарный, просто считается не всё параллельно, а по очереди. На старте обучения фотографии на выходе генератора получаются почти монотонные. Также ещё проверил на примитивных данных (просто один скаляр) - он учится относительно нормально на перцептронах (порядка 20к итераций наборами по 5 значений), если давать, как пример значения из одного диапазона, но если давать из двух диапазонов - уже не учится.

Answer 1 · 2021-08-11 20:54:04

Да, можно без нормализации.

Вот тут https://github.com/eriklindernoren/PyTorch-GAN собрано довольно много реализаций нейросетей (я оттуда с ESRGAN экспериментировал).

FeedForward (это те, что полносвязные) практически тупиковый путь. Посчитайте сколько вы весов заложили в свою нейросеть. Для картинок пробуйте сверточные нейросети.

Возможно ли обучить GAN без batchnorm?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт