Какое железо подобрать для локального тестирования LLM (ChatGPT На ПК)?

Question

Agatnet @Agatnet

Какое железо подобрать для локального тестирования LLM (ChatGPT На ПК)?

Хочу попробовать погонять различные языковые модели, которые позволяют это делать на локальной машине.
Оговорки:
1. Чисто из любопытства. Конкретной цели нет. Но может и появится в процессе.
2. Не в теме LLM. Информация только из обзорных статей. (читаю регулярно).
3. В железе разбираюсь на уровне - знаю что и для чего. Когда дело касается тонкостей и нюансов - я чайник.
=====
Как я вижу подбор для себя.
- выбор платформы (синяя, красная)
- выбор матери по параметру максимально поддерживаемый объём памяти (64 , 128 , 256 gb ?)
- выбор процессора.
- подпункт (новое/б.у./устаревшее) - цель максимальная минимизация фин затрат
=====
В общем, цель - собрать комп с объёмом памяти необходимым для запуска LLM, с возможностью наращивания этой памяти по мере необходимости. Без ненужных переплат. Актуальность машины на год-два вперёд. Далее - или откажусь от этой идеи, или, уже разбираясь в теме, перейду на что-то другое.

Вопрос задан 09 янв.
837 просмотров

6 комментариев

Подписаться 2 Простой 6 комментариев

historydev @historydev

256 мб

Столько памяти даже для браузера не хватит :)

Написано 09 янв.
Agatnet @Agatnet Автор вопроса

historydev, ))))) очепятка

Написано 09 янв.
alexalexes @alexalexes

Берите любое предтоповое/топовое игровое решение - не ошибетесь.
Там, где заканчивается игровой комп, начинается минимальный конфиг для нейронок.
Игрушка для одного человека недешевая, поэтому пользуются нейронками по подписке, либо одалживают мощности в облаках. Держать мощности в своем железе - это самый дорогой вариант.

Написано 09 янв.
Agatnet @Agatnet Автор вопроса

alexalexes, по подписке это типа https://vsegpt.ru/ ? А про облака что? Как это реализуется?

Написано 09 янв.
alexalexes @alexalexes

Арендуете конфиг с видеокартой, большим объемом ОЗУ, SSD. Заливаете свое окружение и работаете.
Типа такого (см. конфиг с GPU): https://selectel.ru/prices/calculator/

Написано 09 янв.
Telcontar @Lord_of_Rings

Не проще ли в Google Colab?

Написано 09 янв.

Помогут разобраться в теме Все курсы

Нетология

1С-программист

10 месяцев

Далее
Skillbox

Профессия 1C-разработчик

8 месяцев

Далее
Hi-TECH Academy

KL 004.2.4 Kaspersky SD-WAN

2 дня

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Железо

Простой
Как называются кнопки на гибком приводе?
- 2 подписчика
- вчера
- 265 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 228 просмотров
1

ответ
Железо

Средний
Хочу обновить железо не знаю что и как лучше сделать?
- 2 подписчика
- 13 дек.
- 473 просмотра
5

ответов
Железо

Простой
Не работает 1 из 3 корпусных кулеров в системном блоке?
- 2 подписчика
- 05 дек.
- 243 просмотра
1

ответ
Железо

+1 ещё

Простой
Подойдет ли блок питания MSI MAG A850GL PCIE5 [306-7ZP8A24-CE0] под мою систему?
- 1 подписчик
- 29 нояб.
- 217 просмотров
1

ответ
Android

+2 ещё

Средний
Возможно ли перенести внутренние компоненты xiaomi redmi note 7 в другой корпус этой же модели с сохранением данных?
- 2 подписчика
- 22 нояб.
- 351 просмотр
2

ответа
Программирование

+2 ещё

Средний
Возможно ли написать программу, которая будет удалять все данные с дисков?
- 3 подписчика
- 19 нояб.
- 1045 просмотров
11

ответов
Linux

+2 ещё

Простой
Какие подходящие характеристики для VPN?
- 1 подписчик
- 19 нояб.
- 1210 просмотров
3

ответа
Железо

Сложный
Компьютер включается только после сброса BIOS, на зажатую кнопку включения не реагирует, как лечить?
- 3 подписчика
- 15 нояб.
- 521 просмотр
5

ответов
Железо

+1 ещё

Простой
Как установить NZXT cam?
- 1 подписчик
- 12 нояб.
- 366 просмотров
1

ответ
Показать ещё Загружается…

Flutter Developer

DevTeam.Space

от 1 500 до 3 000 $

Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

Fullstack-разработчик (Go + React Native)

SMALL • Алматы

До 390 000 ₽

256 мб

Столько памяти даже для браузера не хватит :)
Берите любое предтоповое/топовое игровое решение - не ошибетесь.
Там, где заканчивается игровой комп, начинается минимальный конфиг для нейронок.
Игрушка для одного человека недешевая, поэтому пользуются нейронками по подписке, либо одалживают мощности в облаках. Держать мощности в своем железе - это самый дорогой вариант.
alexalexes, по подписке это типа https://vsegpt.ru/ ? А про облака что? Как это реализуется?
Арендуете конфиг с видеокартой, большим объемом ОЗУ, SSD. Заливаете свое окружение и работаете.
Типа такого (см. конфиг с GPU): https://selectel.ru/prices/calculator/

Answer 1 · 2025-01-09 14:33:45

Есть два направления в приложениях инференса (запуск нейронки для получения ответа но не обучение и тюнинг) и соответственно для каждого свои минимальные требования к железу.

По умолчанию, каждая открытая модель, доступная для локального запуск, поставляются с проектом с исходниками и подробными инструкциями по их запуску, для самых новых и топовых решений это обычно единственный способ. Для этого решения требования к железу самые высокие, а именно, много оперативной памяти gpu, на одной материнской плате. Обычно это по одному байту на вес сети (8бит квантизация) плюс память на размер контекстного окна, размера вопроса и ответа (зависит от модели, от 2гб до десятков), например llama70b будет требовать 70гб+ещё 10гб+-.). Я покупал nvidia 4060ti 16gb vram, у них самая дешёвая память за гигабайт и работает достаточно быстро именно для нейронок (она дешёвая потому что для геймеров тормозная).

Некоторые (многие, даже топовые, с задержкой в месяц) появляются в llama.cpp или основную на ней ollama, которая очень эффективно работает без видеокарты и даже если оперативной памяти видеокарты чуть чуть не хватает. Я запускал lllama70b на 64гб обычной ram, 5бит квантизация, скорость 1.5токена в секунду... Всякие 8б летают но они глупые.

Answer 2 · 2025-07-16 16:40:12

ОЗУ побольше
Карты только NVIDIA. Там два типа драйверов. Ставить неигровой драйвер. Не помню как он называется. Но стек знаний у меня вроде такой же, так что разберетесь.
Все современные фреймворки LLM работают с CUDA. И выбирать среди марок не ту которая под игры, а ту у которой побольше локальной памяти. Если хотите хорошую модель то лучше смотреть от 24ГБ
Я в свое время выбрал 3060 с 12ГБ вместо 3060ti с 8ГБ чтобы кино смотреть. Пригодилось.
Я всё пытаюсь собрать локального кодера на своем амд7700bx + 24гб ОЗУ + 3060-12ГБ
У Вас что-нибудь получилось? :)

Какое железо подобрать для локального тестирования LLM (ChatGPT На ПК)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт