Какой сервер собрать для ИИ?

Question

dobromin @dobromin

Искусственный интеллект

Какой сервер собрать для ИИ?

Добрый день!
Для проекта на 5-10 человек перебираю сервера читаю примеры и пока нет понимания какое железо нужно.
Задачи такие.
Анализировать документы от 10 до 50 (100) страниц docx
Документация, анализ своей документации и на основе ее выдача информации по запросу
Редактировать документы, формировать документы на основе шаблонов на основе информации полученной при анализе уже существующей документации.

Картинки и видео пока не необходимости.

Вижу много сервисов есть платных рабочих, но нет, у меня данные и не хотелось бы передавать, и мне кажется они подключаются к ИИ за бугром что уже не реально, передавать данные и еще в другую страну такое себе решение.

Может кто уже что то реализовал похожее и может поделиться опытом? или может есть формула как рассчитать какие мощности нужны?
Спасибо!

Вопрос задан 10 апр.
219 просмотров

3 комментария

Подписаться 1 Простой 3 комментария

alexalexes @alexalexes

Документация, анализ своей документации и на основе ее выдача информации по запросу

У вас уже что-то по полнотекстовому поиску реализовано?

Редактировать документы, формировать документы на основе шаблонов на основе информации полученной при анализе уже существующей документации.

Вы хотите, чтобы ИИ создавал новые шаблоны документов, или делал сопоставление существующих документов и шаблонов к ним?

Написано 10 апр.
dobromin @dobromin Автор вопроса

alexalexes,
Существующих шаблонов.

Нет по поиску ничего не реализовано, пока пользуемся готовыми стараясь не наполнять пер данными или доработками. Примерное понимание что нужно тоже есть. Цена на разработку дальнейшую и вообще процесс тоже примерно ясен. Остался вопрос с железом, чтобы не было так сделали (уже что то) а железо которое даже для простых реализаций стоило нам уже +100500 а чтобы работало в итоге нужно добавить еще + 10000005000000

Написано 10 апр.
Василий Банников @vabka

dobromin, зависит от того, что именно подразумевается под анализом документов.

Если хочется что-то мощное на уровне того же deepseek с ризонингом + файнтюн, то для запуска вроде 6шт Nvidia A100 надо либо что-то сопоставимое.

Так что советую вам сначала потестировать в тех же облаках/арендных машинах, какие модели способны ваши задачи решать, а уже потом от требований модели отталкиваться.

Возможно вам будет достаточно на арендной машине дообучить небольшую модель, а уже потом её гонять на вашем собственном сервере, который будет сильно меньше.

Лучше пусть в этом копается чувак, который шарит.

Написано 10 апр.

Пригласить эксперта

Ответы на вопрос 1

2 комментария

StasTukalo @StasTukalo

Здравствуйте! По Вашему ответу вижу, что у Вас есть опыт работы multi-GPU системами. Подскажите пожалуйста такие два момента:
1. как работатьс несколькими картами в пределах одного сервера- например есть 5штук А5000 и хочется уметь использовать их как один гпу с 24*5=120 гб врам?
2. как работать с несколькими гпу серверами - каким софтом объединять их в кластер?

Работаю с pytorch 2.5.

Заранее признателен за ответ.
С уважением.

Написано 14 апр.
rPman @rPman

опыта у меня мало, исключительно с образовательной инициативой работал с нескольками видеокартами через opencv, т.е. самостоятельно разделял задачи где что запускать.

pytorch так же имеет механизмы выбора, куда именно загружать веса и обучающую выборку, нужно правильно понимать структуру нейронной сети, что как и в какой последовательности используется, что бы правильно выбрать, куда что загружать. Конкретно с позиции больших нейронных сетей, в т.ч. llm, нагрузку на ведеокарты распределяют универсально самым простым способом - каждую большую матрицу размазывают по нескольким gpu, и в результате за счет большей нагрузки на pci-e (а на серверах она быстрая), эффективно используют все вычислительные мощности очень эффективно, но это имеет смысл только в пределах одного сервера (tensor parallelism).

так же, при использовании серверных видеокарт, при наличии (аппаратно) nvlink соединения между ними, они могут восприниматься как единая gpu автоматически, но я бы не надеялся на эффективное распределение нагрузки в этом случае.

Написано 14 апр.

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Видеокарты

+1 ещё

Простой
Выбрать ли RTX 3060 12 Гб или RTX 5060 8 Гб для бюджетного AI?
- 1 подписчик
- 01 окт.
- 342 просмотра
4

ответа
Искусственный интеллект

Сложный
Stable Diffusion генерит, а по итогу картинки нет, не показывает?
- 1 подписчик
- 29 сент.
- 91 просмотр
1

ответ
Искусственный интеллект

Средний
Как обучить нейросеть используя API от DeepSeek/ChatGPT?
- 1 подписчик
- 14 сент.
- 162 просмотра
1

ответ
Обработка изображений

+1 ещё

Средний
Возможен ли сегодня пакетный анализ изображений при помощи ИИ-моделей?
- 1 подписчик
- 02 сент.
- 135 просмотров
3

ответа
Искусственный интеллект

Простой
ChatGPT генерация естественных комментариев / как оживить сайт?
- 1 подписчик
- 28 авг.
- 688 просмотров
2

ответа
Аналитика

+1 ещё

Простой
Какие есть эффективные средства анализа больших данных?
- 1 подписчик
- 20 авг.
- 164 просмотра
3

ответа
Видео

+1 ещё

Простой
Нейросеть для перевода видео?
- 2 подписчика
- 07 авг.
- 417 просмотров
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 283 просмотра
4

ответа
Искусственный интеллект

Простой
Необходим инструмент либо схема (nocode) для поиска решений по доработке химических рецептов продуктов (не пищевых). Необходим пилот, кто сталкивался?
- 1 подписчик
- 14 июл.
- 118 просмотров
0

ответов
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 225 просмотров
2

ответа
Показать ещё Загружается…

ML-разработчик (Machine Learning)

DevTeam.Space

от 2 000 до 4 000 $

DevOps-инженер

DevTeam.Space

от 1 000 до 2 500 $

Менеджер продукта, внутренняя ERP-системы

Mосфлай

от 160 000 до 400 000 ₽

Документация, анализ своей документации и на основе ее выдача информации по запросу

У вас уже что-то по полнотекстовому поиску реализовано?

Редактировать документы, формировать документы на основе шаблонов на основе информации полученной при анализе уже существующей документации.

Вы хотите, чтобы ИИ создавал новые шаблоны документов, или делал сопоставление существующих документов и шаблонов к ним?
alexalexes,
Существующих шаблонов.

Нет по поиску ничего не реализовано, пока пользуемся готовыми стараясь не наполнять пер данными или доработками. Примерное понимание что нужно тоже есть. Цена на разработку дальнейшую и вообще процесс тоже примерно ясен. Остался вопрос с железом, чтобы не было так сделали (уже что то) а железо которое даже для простых реализаций стоило нам уже +100500 а чтобы работало в итоге нужно добавить еще + 10000005000000
dobromin, зависит от того, что именно подразумевается под анализом документов.

Если хочется что-то мощное на уровне того же deepseek с ризонингом + файнтюн, то для запуска вроде 6шт Nvidia A100 надо либо что-то сопоставимое.

Так что советую вам сначала потестировать в тех же облаках/арендных машинах, какие модели способны ваши задачи решать, а уже потом от требований модели отталкиваться.

Возможно вам будет достаточно на арендной машине дообучить небольшую модель, а уже потом её гонять на вашем собственном сервере, который будет сильно меньше.

Лучше пусть в этом копается чувак, который шарит.

Answer 1 · 2025-04-10 19:16:51

Если вариант 'только ИИ и никакими другими адекватными способами' уже решен и вас не перспорить то...

Забудьте про анализ на процессоре, будете ждать часами документ. Вам нужна видеокарта, а точнее достаточный объем vram что бы вместить и веса сети (ориентируйтесь на исходные веса и 8бит квантизацию) и kv-cache для контекстного окна (а его объем значимый) и кеша желательно 4-х кратно, что бы batching работал лучше.

Адекватные серверные GPU купить в россии (да и не только) за адекватные деньги не возможно.

Адекватные деньги - это только десктопное железо, самое доступное это 4060ti 16gb vram (по 55т.р. они тормозные для игр поэтому и дешевые). В самом лучшем варианте их можно будет вставить 4шт (можно и больше но почти наверняка будут проблемы в других местах) и при этом работать они будут максимум pci-e 4x (это повлияет на время загрузки весов но не на их работу!)

Если готовы переплатить, берите любые nvidia с 24gb vram. В принципе будет работать и amd, но по софту будете ограничены только llama.cpp, а он с видеокартами не самый эффективный (он заточен на работу на процессоре, но зато лучше всех)

С двумя gpu например отлично работает 14b сеть qwen и qwen distiled r1, я пока еще не пробовал но 27b гугловская так же будет работать. С четырьмя gpu можно пробовать 70b модели (c 4бит квантизацией точно), что llama что qwen.

Какой сервер собрать для ИИ?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт