@Filipp42

Как запустить LLM на встроенной видеокарте?

У меня на ноутбуке имеется вот такая видеокарта:
Intel 4th Gen Core Integrated graphics.
Mesa Intel(R) HD Graphics 4600 (HSW GT2)
Я хочу запускать на моём ноутбуке локальный языковые модели, но беда в том, что запускаются они только на CPU через GPT4ALL. Пытался устанавливать веб-интерфейс, но работает только ещё медленнее.
Не могли бы вы подсказать, как запустить квантованную языковую модель, задействуя мощности GPU? Может быть, нужно повозиться с настройкой? Или с установкой драйверов?
  • Вопрос задан
  • 157 просмотров
Пригласить эксперта
Ответы на вопрос 1
@rPman
На встроенной видеокарте не запустить большие языковые модели, потому что не хватит оперативной памяти. Но даже если умудриться выделить в биосе для встроенной gpu нужный объем памяти, работать это будет медленнее чем llama.cpp на процессоре.

При использовании llama.cpp требования можно снизить за счет квантизации (на самом деле код есть и для python tensorflow реализации, но там не так удобно все организовано, придется изучать и ковырять), но даже в этом случае начальный обем vram где то 8Gb (с 4бит квантизацией и 7B модели, будут работать плохо, минимально рекомендованная это 5_1 квантизация, штатный tensorflow код с которым релизятся модели, без проблем умеет 8бит квантизацию), не жди от 7B моделей хорошего качества, и тем более при использовании квантизации, они и так уже уменьшены по максимуму.

p.s. llama.cpp умеет часть матриц переносить в gpu, это имеет смысл если vram не хватает чуть чуть, т.е. модель влезает почти полностью добавляй ключ --n-gpu-layers N где N число слоев нейронки, которые нужно перенести в vram, подбирать экспериментально пока не начнет ругаться на нехватку памяти.

скорее всего тебе придется пересобрать ее с ключом OPENBLAS или CLBLAS
mkdir build
cd build
cmake .. -DLLAMA_BLAS=ON -DLLAMA_BLAS_VENDOR=OpenBLAS
cmake --build . --config Release

(полистай документацию возможно еще ключи добавлять)
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
28 апр. 2024, в 20:14
700 руб./за проект
28 апр. 2024, в 20:09
9000 руб./за проект
28 апр. 2024, в 19:54
2000 руб./за проект