Задать вопрос

freeExec

Участник OpenStreetMap

1341

вклад
0

вопросов
2215

ответов
36%

решений

Ответы пользователя по тегу CUDA

Почему паралельная сортировка слиянием выполняется на cpu быстрее чем на gpu в 100 раз?

freeExec @freeExec
Участник OpenStreetMap

Выигрыш на GPU будет если нужно перемалывать гигабайты за один вызов. А на массивах в тысячу элементах ты теряешь больше времени на копирование в GPU и обратно, и на запуск ядра. И это не говоря о том, что код для GPU надо писать так, чтобы в шину уместились все данные нужные на данной итерации, а у тебя выходит, что первому потоку нужен 0 элемент, а второму не второй элемент, который бы закешировался при запросе, а тысячный. В итоге мы получаем нужные данные, не за один запрос, а за 32 (ну или столько там потоков в варпе).

Ответ написан более года назад

Комментировать

Комментировать
Какой есть многопточный gpu алгоритм заливки треугольника цветом? Линейный,Без проверок, и условных переходов?

freeExec @freeExec
Участник OpenStreetMap

https://compgraphics.info/2D/triangle_rasterization.php

Ответ написан более года назад

1 комментарий

1 комментарий
Можно ли портировать программу на CUDA на Metal?

freeExec @freeExec
Участник OpenStreetMap

https://developer.apple.com/documentation/metal/ba...

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как запустить приложение на питоне с CUDA на Windows 10, когда пишет device: 0?
freeExec @freeExec
Участник OpenStreetMap
Но ведь nvidia-smi нашел какой-то gpu, все равно не получится запустить с cuda?

GPU-то есть, но CUDA не установлена.
Если она есть, то smi в верхней строке напишет и её версию.

+-----------------------------------------------------------------------------+ | NVIDIA-SMI 456.71 Driver Version: 456.71 CUDA Version: 11.1 | |-------------------------------+----------------------+----------------------+

Ответ написан более трёх лет назад

1 комментарий
1 комментарий
Совместимы ли программы CUDA с различными поколениями видеокарт?

freeExec @freeExec
Участник OpenStreetMap

Совместимость не у самой программы, а у kernel, что выполняются на GPU. И вот они реализуются под конкретные архитектуры видюх. И при отсутствии ядра под нужную архитектуру на видюхе ничего не запуститься, так что логи ваши или врут, или вы не правильно их интерпретируете.
https://arnon.dk/matching-sm-architectures-arch-an...

Ответ написан более трёх лет назад

Комментировать

Комментировать
Почему CUDA работает на Intel?

freeExec @freeExec
Участник OpenStreetMap

Если бы это работало исключительно на CUDA, то третий пункт выглядел бы по-другому.

Ответ написан более трёх лет назад

3 комментария

3 комментария
Как наиболее быстро совершить брутфорс AES, посредством Python?

freeExec @freeExec
Участник OpenStreetMap

Незачем строить велосипед - Hashcat

Ответ написан более трёх лет назад

Комментировать

Комментировать
Какова максимальная скорость чтения данных для GPU Kepler?

freeExec @freeExec
Участник OpenStreetMap

Если очень оптимально, то сверху тебя ограничивает пропускная способность шины. В реальных же примерах, это что-то около 30Гб/с.

Ответ написан более трёх лет назад

2 комментария

2 комментария
Компиляция с/с++ на gpu есть ли какие то проекты?

freeExec @freeExec
Участник OpenStreetMap

Компиляция - это 100500 условных переходов внутри. И GPU придётся перебрать все эти варианты, даже если условие никогда не выполнилось. О каком приросте можно тут говорить.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Самые активные сегодня

Вячеслав Васильев
- 6 ответов
- 0 вопросов
Сережа Молодец
- 4 ответа
- 1 вопрос
As56
- 1 ответ
- 0 вопросов
smple
- 1 ответ
- 0 вопросов
#
- 0 ответов
- 1 вопрос
microfrog
- 1 ответ
- 0 вопросов

Войдите на сайт