Возможно ли выгрузить часть слоёв в VRAM видеокарты AMD, если основная — NVIDIA?

Question

d00m911 @d00m911

Нейронные сети

Возможно ли выгрузить часть слоёв в VRAM видеокарты AMD, если основная — NVIDIA?

Имеются две видеокарты - AMD и NVIDIA. Хотелось бы узнать, существует ли теоретическая возможность выгрузить часть слоёв в память видеокарты, а не в RAM?
Если это невозможно в Windows, может быть, есть способы сделать это в Linux-подобных системах? Заранее спасибо за ответы.

Вопрос задан более года назад
127 просмотров

5 комментариев

Подписаться 1 Простой 5 комментариев

Wexter @Wexter

а зачем?

Написано более года назад
d00m911 @d00m911 Автор вопроса

Wexter, потому что VRAM намного быстрее RAM, и неплохо было бы если не использовать вместе два разных gpu (что сложно по объективным причинам), то хотя бы просто расширять память видеоадаптера за счёт памяти другого

Написано более года назад
Wexter @Wexter

d00m911, осталось дождаться когда NVIDIA и AMD научатся между собой данные гонять в обход RAM и наступит счастье

Написано более года назад
kamenyuga @kamenyuga

На практике берут, например, линукс, тензорфлоу и несколько одинаковых видеокарт нвидиа, а затем распределяют модель по ним. Руками задают, какие слои куда помещать. Конечно, для этого модель должна быть реализована/сконверитрована в тензорфлоу/керас. И надо еще код руками писать, скачать все готовое из интернетов вряд ли получится. У кого-то работает, у кого-то нет, зависит от версии тф и конкретных багов в ней.

Написано более года назад
d00m911 @d00m911 Автор вопроса

Wexter, а я думал, что Vulkan может объединять устройства в пул и использовать всю видеопамять как единый буфер без оперативы

Написано более года назад

Помогут разобраться в теме Все курсы

Нетология

Нейросети для анализа данных

9 недель

Далее
Яндекс Практикум

Нейросети для работы

2 месяца

Далее
Skillfactory

Курс по нейронным сетям

10 недель

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Чтобы сделать несколько запросов к OpenAI серверу из Python, нужно каждый раз вызывать client.chat.completions.create?
- 1 подписчик
- 15 часов назад
- 58 просмотров
2

ответа
Мобильные устройства

+1 ещё

Простой
Какой девайс взять, чтоб за границей говорить и слушать иностранцев?
- 6 подписчиков
- 08 дек.
- 660 просмотров
6

ответов
Системное администрирование

+2 ещё

Средний
Сервер с GPU предназначен ли для запуска фронтенда/бэкенда или он для вычислений?
- 1 подписчик
- 08 нояб.
- 334 просмотра
1

ответ
Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 138 просмотров
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 122 просмотра
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 102 просмотра
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 82 просмотра
0

ответов
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 104 просмотра
1

ответ
Нейронные сети

Средний
Каков объём данных, передаваемых между узлами ComfyUI и где они хранятся (RAM/VRAM/...)?
- 1 подписчик
- 28 сент.
- 95 просмотров
1

ответ
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1519 просмотров
5

ответов
Показать ещё Загружается…

Full-stack разработчик (Node.js + React)

HR агентство А2 • Москва

от 100 000 ₽

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Data Analyst (команда SberCampaigning)

Сбер • Москва

от 250 000 до 400 000 ₽

Wexter, потому что VRAM намного быстрее RAM, и неплохо было бы если не использовать вместе два разных gpu (что сложно по объективным причинам), то хотя бы просто расширять память видеоадаптера за счёт памяти другого
d00m911, осталось дождаться когда NVIDIA и AMD научатся между собой данные гонять в обход RAM и наступит счастье
На практике берут, например, линукс, тензорфлоу и несколько одинаковых видеокарт нвидиа, а затем распределяют модель по ним. Руками задают, какие слои куда помещать. Конечно, для этого модель должна быть реализована/сконверитрована в тензорфлоу/керас. И надо еще код руками писать, скачать все готовое из интернетов вряд ли получится. У кого-то работает, у кого-то нет, зависит от версии тф и конкретных багов в ней.
Wexter, а я думал, что Vulkan может объединять устройства в пул и использовать всю видеопамять как единый буфер без оперативы

Answer 1 · 2024-06-11 15:44:56

Да, но поддержку пилить придется самому.

Например llama.cpp есть поддержка нескольких видеокарт, на сколько я знаю есть возможность с разными вендорами через opencl.

Там есть библиотека ggml, чтобы свои сети пилить и даже конвертировать их их pytorch

Возможно ли выгрузить часть слоёв в VRAM видеокарты AMD, если основная — NVIDIA?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт