PyTorch CUDA out of memory как исправить?

Question

jikrpython @jikrpython

CUDA

PyTorch CUDA out of memory как исправить?

Запускаю код, который работает на Stable Diffusion и получаю ошибку:

RuntimeError: CUDA out of memory. Tried to allocate 512.00 MiB (GPU 0; 6.00 GiB total capacity; 5.36 GiB already allocated; 0 bytes free; 5.37 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation.  See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

Как исправить? уже все перепробовал

Вопрос задан более двух лет назад
4229 просмотров

3 комментария

Подписаться 1 Простой 3 комментария

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Видеокарты

+2 ещё

Простой
Существует ли софт, позволяющий задействовать всю мощь CUDA при кодировании видеофайлов?
- 2 подписчика
- 19 июл.
- 741 просмотр
2

ответа
Python

+2 ещё

Средний
GeForce GTX 1650 > RTX A2000 — как такое возможно?
- 2 подписчика
- 15 апр.
- 754 просмотра
2

ответа
NVIDIA

+2 ещё

Простой
Проблемы с обучением Flux LoRA (персонаж) локально. Как это делается?
- 2 подписчика
- 10 мар.
- 475 просмотров
0

ответов
Нейронные сети

+2 ещё

Простой
Возможен ли запуск нейросети на видеокарте для майнинга?
- 2 подписчика
- 10 сент. 2024
- 1048 просмотров
1

ответ
3D

+2 ещё

Средний
Какой принцип в Ray Trasing рендеринге, как работает подробно?
- 1 подписчик
- 28 авг. 2024
- 104 просмотра
3

ответа
Алгоритмы

+3 ещё

Простой
Как в вершинjм буфере вычисляются глобальные координаты?
- 1 подписчик
- более года назад
- 72 просмотра
0

ответов
GPGPU

+1 ещё

Средний
Что конкретно такое Streaming Multiprocessor?
- 1 подписчик
- более года назад
- 133 просмотра
1

ответ
C++

+2 ещё

Простой
Какая память быстрее локальная или разделямая cuda?
- 1 подписчик
- более года назад
- 99 просмотров
0

ответов
MP3

+2 ещё

Сложный
Ядра CUDA. Эффективность в кодировании/декодировании mp3 файлов?
- 1 подписчик
- более года назад
- 65 просмотров
1

ответ
C#

+3 ещё

Сложный
Почему паралельная сортировка слиянием выполняется на cpu быстрее чем на gpu в 100 раз?
- 4 подписчика
- более года назад
- 576 просмотров
1

ответ
Показать ещё Загружается…

Senior Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

ML/CV python backend разработчик

Алсофт-Центр • Москва

от 300 000 до 400 000 ₽

Менеджер по развитию ключевых клиентов (ИТ-проекты, B2B)

Eltex • Новосибирск

от 80 000 ₽

уже все перепробовал

А если поточнее?
Lord_of_Rings, set "PYTORCH_CUDA_ALLOC_CONF = max_split_size_mb:100"
пробовал разные значения

Answer 1 · 2023-06-14 22:33:16

Столкнулся с такой же проблемой, почитал интернет и понял одну штуку. Да, хочется сразу всё загрузить в память и данные, и модель сети пожирнее и хотелось, чтобы torch сам управлял памятью/порциями данных и т.д. Фиг вам - это делаете вы сами своими ручками.
Если данных много и они не помещаются в память, то вы подгружаете их частями из файла. Так же и с видеопамятью - если туда всё не влазит, то это ваша проблема по разделению всего этого на минимально приемлемые части и подгрузка/выгрузка из памяти видеокарты. Если ваша модель НН очень большая, то вы должны своими ручками разделить её на части и обрабатывать её послойно загружай/выгружая в память gpu. Ну и всё остальное в таком же духе.
Короче, torch сам менеджментом памяти на gpu не занимается. Если данные в память видеокарты не влазят, то он просто выпадает в ошибку.
Есть какие-то библиотеки, которые работаю обёрткой для torch и занимаются этим менеджментом, но я в ту сторону ещё не копал.
Если у кого-то есть другая информация, то с радостью почитаю.

P.S. В частности про Stable Diffusion. Там есть такая настройка как "Low memory mode (for 8Gb GPUs)", что можно интерпретировать как "режим для отстойных видях, у которых всего 8Гб памяти" ... а вы пытаетесь запустить на 6Гб ... сомневаюсь.

PyTorch CUDA out of memory как исправить?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт