Ответы пользователя rPman по тегу «Видеокарты»

Выбрать ли RTX 3060 12 Гб или RTX 5060 8 Гб для бюджетного AI?

rPman @rPman

для бюджетного AI

очень малоинформативно, но от этого может зависеть выбор железа.

С точки зрения сырой производительности, видеокарты отличаются на 25% (а тензорных ядер разница на 10%), и 5060 должна быть незначительно быстрее. Так же есть момент, в прошлом nvidia была замечена в 'умышленном' замедлении старых видеокарт в драйверах, вынуждая подбирать еще и правильную версию, ничто не мешает делать это в будущем, что бы продавать никому не нужные новые видеокарты.

Но есть еще момент, который может быть важнее скорости железа, причем меняя картину на порядок - количество оперативной памяти видеокарты. В тот момент, когда ее станет недостаточно, скорость падает, а точнее время, необходимое до получения результата вырастает на порядок.

Типовая ситуация - если веса нейронной сети и вся обучающая выборка полностью влезает в vram, то мощности видеокарты будут утилизированы на 100% и скорость сходимости при обучении (количество циклов прогона) будет наилучшей). Если обучающая выборка целиком не помещается в видеокарту, то ее размещают туда по частям, прогоняя цикл не по всем данным а по каждой части. Это так же позволит нагрузить видеокарту на 100% но итоговое количество циклов прогона увеличится (сходимость ухудшится, но это кстати может зависеть от алгоритма разделения обучающей выборки на части).

Если же веса нейронной сети не помещаются в оперативную память, то скорость тем более падает драматически (на порядок), даже если не помещается только небольшой процент, что очень заметно при использовании gpt нейронок.

Поэтому я рекомендую выбирать больше оперативной памяти чем производительность.

Ответ написан 01 окт.

Комментировать

Очень странные артефакты на мониторе, есть ли решение или стоит попытаться сдать по гарантии?

rPman @rPman

А монитор ли виноват? посмотрите onscreen сообщение (число 200) видно без проблем, а вот за ним косяки, выглядит как глюк либо кабеля либо видеокарты.

лучший тест, подключить монитор к заведомо рабочему оборудованию.

p.s. попробуй сменить тип подключения с dp на hdmi, тоже для теста

Ответ написан 18 авг.

Комментировать

Как загрузить драйвера на видеокарту если монитор и сеть вырубается вне безопасного режима?

rPman @rPman

Устанавливай deb пакет из консоли, загрузившись в режим восстановления.
Так же можешь загрузиться как обычно, но затем, переключившись в консоль (ctrl+alt+shift+f1) остановить графическую подсистему
service lightdm stop
если у тебя kde, то скорее всего сервис управления грфическим режимом будет kdm (ну или что ты там вручную поставил, тогда ты сам знаешь)

Ответ написан 07 авг.

1 комментарий

Стоит ли самому делать замену Жидкого Металла в ноутбуке?

rPman @rPman

Нет, это совершенно не имеет смысла, не изменится ничего связанного с:

бывает что панель над системой охлаждения горяченькая, и вызывает дискомфорт,

Так как это уже отведенное тепло, тут нужна система внешнего охлаждения, типа подставки.

60 градусов процессора в нагрузке это идеальное состояние!

Если вам зачем то нужен разгон, то это ещё более бессмысленное действие, во даже а идеальном случае производительность изменится на считанные проценты а синтетических тестах но не реальных задачи

Ответ написан 22 июл.

4 комментария

Существует ли софт, позволяющий задействовать всю мощь CUDA при кодировании видеофайлов?

rPman @rPman

Cuda это язык верхнего уровня, компилируемый в байт-код видео процессора. Видеокодек nvenc это проприетарный кодек, байт-код которого поставляется с bios видеокарты (и/или с драйверами), т.е. никакого специфического железа там не должно быть, плюс там много что огорожено патентами, я помню читал в ~2011г. когда в ffmpeg пилили поддержку opencl... В общем лучи поноса отправлять nvidia или шире, группе компаний (там все топы типа майкрософта, оракла и т.п.), они же патенты на всякие видеокодеки держат.

Т.е. софт в принципе может существовать, но при попытке на нем заработать придут 'бандиты а законе' и сделают атата

Ответ написан 20 июл.

4 комментария

Что позволяет GPU эффективно работать с LLM и как соответственно выбрать видеокарты подешевле для инференса?

rPman @rPman

две причины
- больше ядер, включая специализированные (для матричных операций - тензорные ядра)
- быстрее память и главное, она 'ближе' к процессору и больше 'каналов' (6 - 12 против 2-4 у x86 архитектуры)

Если что, пока веса модели влезают в кеш L3 процессора (он сейчас десятки мегабайт), то процессор внезапно работает сравнимо по скорости с gpu, но первая буква в LLM означает Large (большие) и речь идет о миллиардах параметров, т.е. гигабайтах оперативной памяти, что значит - главный параметр видеокарты для инференса LLM - это ОБЪЕМ видеопамяти. Скорость и количество ядер видеопроцессора тоже важны но дальше вступает жадность nvidia, и там либо все ограничено, либо кастрировано,.. в общем gtx4060ti будет чуть чуть медленнее 5060ti с тем же объемом видеопамяти, на грани погрешности (а там и тензорных ядер на треть выше и память ddr6 против ddr7 и т.п.).

Скорость шины pci-e почти совсем не влияет (есть алгоритмы, которые постоянно туда сюда гоняют веса, у таких скорость шины будет критична, но это когда ты хочешь запустить модели с весами превышающими объем видеокарты, типа deepseak на 600b параметров на 24gb, ужимая ее 1битной квантизацией что бы получить 5tps)

Большее количество памяти в одной видеокарте лучше чем несколько видеокарт по меньше (объединить их вычислительные мощности редко когда удается эффективно) но когда смотришь на цены видеокарт с 24гб и 16гб (примерно в три раза дороже) начинаешь чесать репу... если веса и контекстное окно влезают в vram то нет проблем с несколькими gpu (там уже проблема с материнкой)

p.s. у китайцев есть решения gtx4090 с перепаянной памятью на 48гб, специально для нейронок делали

Ответ написан 12 июл.

2 комментария

Какая видеокарта лучше всего для Llm в 2025 году?

rPman @rPman

Скажу непопулярное.

за 150т.р. можно приобрести три 16gb видеокарты, например 4060ti или 5060ti (в розницу правда они стоят чуть выше 55т.р. т.е. немного в бюджет не помещаетесь, но на ozon или aliexpress можно найти, правда гарантий ноль). Их производительность впримерно в полтора или даже на треть ниже топовых десктопных, в задачах LLM но все перекрывается ценой и возможностями, ведь это будет 48Гб!

НАСТОЯТЕЛЬНО рекомендую выбирать nvidia, так как софт заточен и оптимизирован именно под них.

upd. от цены в dns от 50т.р.

Почему это тоже подходит, в некоторых (ЧАСТЫХ) случаях можно распределить нагрузку на оперативную память нескольких видеокарт чисто программными средствами. Например генерацию изображения распределить по видеокартам сложно (для изображений это не критично, но видео к сожалению требует, у меня не получилось, но я не пробовал еще copmify ui, там говорят можно). GPT LLM почти всегда можно распределить по видеокартам (vllm, llama.cpp), и практически без понижения производительности (даже несколько процентов добавится)

Недостаток - материнскую плату с тремя 8x pci-e найти не просто (их цены от 30т.р. начинаются а скорее пришлось бы брать серверную, но там 16х полноценные), а это значит, иначе видеокарты будут работать на 4х pci-e подключении, и это может сказаться на производительности

upd. материнка с 2 - 8х pci-e 3.0 и 1 - 16х pci-e 3.0 за 30т.р.
Процессоры на этот сокет с 48 pci-e линиями от 67т.р.
оперативки до 256гб (саппорт лист материнки), если брать наборы по 128гб порядка 35т.р. за каждый, т.е. 70т.р. за 256гб.

Ответ написан 11 июл.

Комментировать

Почему программы мылит, после подключения второго монитора?

rPman @rPman

Скорее всего мылит потому что ppi у мониторов разный и масштабирование выбрано не совпадающее с их различием
т.е. разница между 157 ppi / 108 ppi = 1,453703704 а масштаб у вас 150/100 = 1,5 (проценты получаем умножением на 100)

Попробуйте поставить масштаб 145 (я сейчас в win11 в виртуалке проверил, не дает указывать дробные значения)

Ответ написан 08 июл.

9 комментариев

Процесс вывода кадра из Front buffer на матрицу монитора. Как это работает?

rPman @rPman

VGA, монитор не хранит ничего, в момент установки видеоразрешения частоты монитора и видеокарты синхронизируются, и монитор ожидает по vga кабелю значение текущего rgb пиксела, в зависимости от типа видеорежима, interlaced через строку или по очереди каждая строка, пикселы ожидаются слева направо снизу вверх (или сверху вниз уже не принципиально), видеорежим подразумевает не только время на кадр, но и к примеру сколько времени нужно ожидать между строками, как кодируется цвет (монохромный или цветной) и т.п..

Когда то очень давно были даже хитрые выкрутасы, когда процессор напрямую управляя rgb цветами, позволял выдавать изображение, лучше качеством чем в принципе позволяла видеокарта (из за маленького видеобуфера старые видеокарты не умели попиксельные картинки, но умели текстовые, так как текст требует меньше памяти)

Современные lcd панели, или при использовании vga-hdmi переходника, симулируют работу crt монитора, для чего вынуждены хранить свой буфер текущего кадра, по техническим причинам lcd панель меняет значение пиксела тысячи раз в секунду (они так ШИМ-ом яркость меняют), для этого буфер и нужен.

dp/hdmi передают данные, кодировав в цифровом виде, но в мониторе уже есть буфер для их хранения.

Ответ написан 20 июн.

20 комментариев

Как подключить монитор в компьютер без видеовыхода?

rPman @rPman

Съехидничаю, linux помню может в качестве терминала использовать что-нибудь, подключенное на com или lpt порт, например принтер, или другой компьютер. Пользы сегодня от этого не густо но возможность такая есть до сих пор (ее используют к примеру что бы запускать linux в вируталке, перенаправляя вывод в консоль хост машины)

Ответ написан 01 мар.

1 комментарий

Проблема с видеокартами в пк?

rPman @rPman

Если видеокарты в другом железе работают а в вашем нет, установка драйверов не помогает (повисания), значит это аппаратная проблема, и с высокой вероятностью с питанием - материнская плата или блок питания (второе вероятнее). Достаточно без сборки в корпусе, попробовать другой, заведомо рабочий блок питания, это проще чем менять материнку для теста.

Само собой, обязательно провести тест, по одному исключая оперативную памяти и удалив любые другие не важные комплектующие (для работы компьютеру нужны минимум - блок питания + материнская плата + процессор + оперативная память + видеокарта, если нет встроенной). Тестовое действие - установка драйвера на видеокарту, ведь это подвешивает систему.

Еще, настоятельно рекомендую, для исключения программных причин, установить чистую систему для теста (сделав резервную копию предыдущей установки либо используя другой диск), в качестве простого эксперимента - установить linux, он хоть с флешки без проблем запустится,.. протестировать видеокарту под нагрузкой можно и там.

Ответ написан 03 февр.

3 комментария

Как получить бесплатные вычислительные мощности для исследований?

rPman @rPman

Университеты могут предлагать мощности своим сотрудникам, при условии что будет публикация с аффиляцией этого университета.

Ты как бы покупаешь мощности за то что университет подмажется к твоим достижениям... Но нужно понимать что могут совсем уж кабальные условия выставить.

Помню ТГУ предлагал свои мощности (там уже слабый суперкомп, вам не подойдёт) но права на результат универу нужно было отдавать

P s. Глупо гадать, обзвонит университеты, поспрашивайте

Ответ написан более года назад

Комментировать

Как в Linux полностью программно сменить основную видеокарту?

rPman @rPman

Уходите от Wayland, например к xfce или gnome, бонусом возвращения будет возможность, используя штатный loginctl, настроить два рабочих места, по отдельности на каждую видеокарту (и не важно что второе рабочее место с intel ark не будет использоваться). Доступ к второй видеокарте в числодробилках останется, а вот графический интерфейс будет привязан к указанному gpu железно.

spoiler

Исключение wine (ну и его потомки типа proton), я столкнулся с проблемой именно со вторым рабочим местом, wine видит первую видеокарту и часть работы перекладывает на нее, как не указывай.

Ответ написан более года назад

Комментировать

Есть ли вариант сочетания игровой и профессиональной видеокарты?

rPman @rPman

Процессор слабый, игры с ним могут тупо не смочь утилизировать возможности видеокарты.

Но, если речь идет о покупке железа на вырост, хотя бы на ближайшие пару лет, и нет денег на топовое то рекомендую nvidia 3060 12Gb (12гб ключевой момент) либо 4060ti 16гб.

Почему?
* потому что в будущем требования к оперативной памяти будут расти, сильнее чем к процессору gpu (процессор будет тратиться на 4k, но никто не мешает играть fullhd 1080 или просто hd 720)
* потому что 16гб позволяют запускать современные нейронки локально, не топовые конечно но даже 13b помещаются (8бит квантизация), а llama.cpp позволит запускать с 4битной квантизацией (потеря качества 3-5%) частично на процессоре и 30b модели

не игровые задачи пойдут на любой gpu, плюс минус в 2-3 раза разница во времени вычислений не критична.

Ответ написан более года назад

Комментировать

Видеокарта не работает без драйверов, что делать?

rPman @rPman

Такое (включая отсутствие изображения в биосе) возможно если на материнке (с поддержкой процессора) есть встроенная видеокарта и в настройках биоса прописано инициализировать ее в первую очередь.

В windows же можно указывать любую видеокарту как основную, поэтому после загрузки все видно.

Решение - вставить старую карту чтобы зайти в биос, и включить в биосе настройку - инициализировать первым pcie (хотя вопрос, почему тогда со старой видеокартой такое, но могу предположить что встроенная вместе с ней не может работать, конфликты какие то)

Ответ написан более года назад

Комментировать

Разница в нагреве компонентов при разной нагрузке системой?

rPman @rPman

На холостых в windows уже со времен 8-ки работает много лишнего софта, гиагабайтами, фоном, я молчу про мусорный софт от вендоров ноутбуков (вендроские декстопные компьютеры не видел и видеть не хочу, там по разговорам еще хуже), весь этот хлам потребляет процессор а тот в свою очередь греется.

Чистить дело неблагодарное, хоть и реальное, примерно раз в год, с крупными обновлениями от майкрософта, все очищенное возвращается назад с изменениями от автоочищалок,.. какая то борьба с ветряными мельницами.

Попробуй зайди в bios материнки и понаблюдай за температурой, на сколько я помню это единственное место где можно получить минимальную нагрузку и наблюдать за ней. Если и там температура будет заметной, то настоятельно рекомендую провести чистку системы охлаждения и замену термопасты.

Ответ написан более года назад

3 комментария

Как запустить LLM на встроенной видеокарте?

rPman @rPman

На встроенной видеокарте не запустить большие языковые модели, потому что не хватит оперативной памяти. Но даже если умудриться выделить в биосе для встроенной gpu нужный объем памяти, работать это будет медленнее чем llama.cpp на процессоре.

При использовании llama.cpp требования можно снизить за счет квантизации (на самом деле код есть и для python tensorflow реализации, но там не так удобно все организовано, придется изучать и ковырять), но даже в этом случае начальный обем vram где то 8Gb (с 4бит квантизацией и 7B модели, будут работать плохо, минимально рекомендованная это 5_1 квантизация, штатный tensorflow код с которым релизятся модели, без проблем умеет 8бит квантизацию), не жди от 7B моделей хорошего качества, и тем более при использовании квантизации, они и так уже уменьшены по максимуму.

p.s. llama.cpp умеет часть матриц переносить в gpu, это имеет смысл если vram не хватает чуть чуть, т.е. модель влезает почти полностью добавляй ключ --n-gpu-layers N где N число слоев нейронки, которые нужно перенести в vram, подбирать экспериментально пока не начнет ругаться на нехватку памяти.

скорее всего тебе придется пересобрать ее с ключом OPENBLAS или CLBLAS

mkdir build
cd build
cmake .. -DLLAMA_BLAS=ON -DLLAMA_BLAS_VENDOR=OpenBLAS
cmake --build . --config Release

(полистай документацию возможно еще ключи добавлять)

Ответ написан более года назад

Комментировать

Какую видеокарту выбрать для машинного обучения, майнинга, гейминга и 3д-моделирования?

rPman @rPman

К сожалению, весь современный софт заточен на nvidia решения. С некоторыми оговорками на amd и скорее всего не на долго (т.е. скоро окончательно будет все), например stable diffusion еще запускают на топовых amd, с заметной деградацией скорости (т.е. карта в играх будет типа быстрее nvidia но в нейронках будет хуже, это вопрос исключительно софта и скорее всего политики).

Самое главное для нейронок - это vram видеокарты, все остальное - частоты, количество процессоров, шина и прочее конечно важно, но обычно идет в комплекте если выбирать решения с большой памятью.

Если денег мало, то имеет смысл обратить взор на медленную (еще вопрос на сколько, в играх это ~30%..50% от топовых но для нейронок возможно не так плохо) но с большим объемом vram - nvidia geforce rtx 3060 16gb с ценами порядка 35т.р. когда как остальные решения стартуют от 50т.р. а заканчиваются на 300т.р. (я про потребительские решения, серверные найти вообще нереал и цены там зашкаливают, соотношение цена/производительность у серверных хуже всего)

Если денег меньше, то бери любую nvidia с максимумом vram, построив табличку цена, fps и выбирая наибольшее соотношение цена/fps или индекс производительности (бери один и тот же тест).

ВАЖНЫЙ момент! почти все алгоритмы нейронных сетей могут быть распаралелены на несколько gpu (либо легко модифицированы для этого), я имею в виду когда размер самой нейросети такой огромный либо нейросеть маленькая но обучающая выборка большая, отсюда интересный вариант, если нужно больше чем 16гб vram, может оказаться дешевле набить материнку несколькими 3060 (она вообще самая дешевая за гигабайт), и за счет возможности загружать данные в несколько gpu одновременно, это даст интересный буст на решения, которые упираются в pci-e (не говоря о цене, nvidia 24гб начинаются по ценам от 110т.р., а 2x3060 обойдутся в 70т.р.)

p.s. вопросы энергопотребления даже не рассматриваю, пока у тебя нет кластера на сотни gpu (или если тебе не повезло жить в какой-нибудь 'жопе мира', где энергия стоит порядка 1евро за киловат час)

upd. минимальное требование по vram к stable diffusion - 3gb (минимальный размер картинок меньше 512x512, batch меньше 4, опции --xformers и --lowvram и невозможность генерации видео), рекомендуется 6Gb

для генерации видео на stable diffusion нужно минимум 8gb лучше больше

минимальный размер адекватной языковой модели 7Gb mistral может заработать на 8Gb с 8бит квантизацией, так же я слышал что llama13b тоже работает на 8gb видеокартах

чтобы дообучать, потребуется больше vram, так как квантизация недоступна (можно использовать peft с 8-битной, но это только тюнинг качества для конкретного промпта)

Ответ написан более двух лет назад

Комментировать

Видеокарта для обучения нейросетей, Palit P104-100 8Gb?

rPman @rPman

Если выбирать при работе с нейронными сетями - больше памяти = лучше почти всегда (чтобы в память влезали нейронки, обучающая выборка и тесты и еще осталось), в идеале конечно и кеш больше но это архитектура (новее = лучше почти всегда). Выбор nvidia почти всегда для нейронок лучше, вопрос не железа, оно у них даже может быть хуже (соотношение цена/результат), вопрос софта, почти весь популярный ЛУЧШЕ или вообще работает с nvidia.

Если тебе для обучения, видеокарта не нужна, она только экономит время (от 10х до 100х кратно быстрее на gpu). pytorch это не единственное место, где можно использовать ускорение gpu, скорее может оказаться что стартовая подготовка данных будет занимать значимо больше времени чем само обучение, и возможность ускорить этот этап с помощью gpu (используй напрямую opencl чтобы хотя бы на этом этапе не привязываться к зеленым, для начинающих разницы нет) будет значима... именно тут можно получить 100х кратное ускорение по сравнению с cpu

p.s. стоимость видеокарты намекает на покупку с рук БУ, почти наверняка с майнинга, будь осторожен, можешь получить горелую.

Ответ написан более двух лет назад

2 комментария

Хорошие ли видеокарты от таких брендов как asus, hp, msi и ТД?

rPman @rPman

видеокарта это:
1. чип - их производят пока только nvidia/amd/и не давно intel
2. плата + система охлаждения - вот это всякие hp, asus, msi, gigabyte,..
3. софт и драйвера - драйвера производят nvidia/amd/intel только для себя, но вот софт (например поддержка gpu в cad приложениях) пилят каждый себе сам

Всегда приходится при выборе оглядываться на эти три пункта, исходя из третьего пункта - по задаче, и второго - по отзывам, принципиальные возможности тебе даст только первый пункт, т.е. производительность решений с одним и тем же чипом от разных 'производителей' будет идентична, с оговорками на систему охлаждения (редко), если ее не хватит будет немного хуже (одно время разные производители чуть чуть тюнили частоты и вольтаж, теперь такое редко встретишь, все под одну гребенку работают).

Но очень иногда, под конкретные чипсеты, у некоторых производителей получаются проблемы, либо с подсистемой питания, либо с системой охлаждения, либо с ремонтопригодностью. Эту информацию приходится выуживать по форумам и обзорам.

Очень часто слышу хорошее про msi, очень часто слышу о проблемах у palit... гугли конкретные модели

Ответ написан более двух лет назад

1 комментарий

Войдите на сайт