Почему при меньшем размере блока потоков в группе, скорость такая же?

Question

SergeySerge11 @SergeySerge11

C++
GPGPU

Почему при меньшем размере блока потоков в группе, скорость такая же?

В принципе весь вопрос. Да нет, Зависит ли линейно скорость кода, от числа потоков в группе? Примеры неожиданно для меня сказали что не особо, и может как быстрее так и медленнее.
Например их максимально 1024 на видеокарте. Я думал что чем больше тем лучше.
Если запускать ядро с 512, то наверное я ожидаю(ожидал), снижение скорости до 2 раз, так как 512 потков простаивают на видеокарте, но этого не происходит? Они не простаивают получается?
И так и 256, размером группы. и 128, а вот дальше уже спад иногда идет, а иногда нет, в зависимости от кода. Например при размере группы 1, до 8 раз скорость падает. Но на 128, нет просадок. тогда что делают другие 900 потоков.

Ответ в принципе я догадываюсь какой, но лучше точно знать. Типа куча групп одновременно запускаются, но я не понимаю, тогда если каждая группа внтури должна выделить максимум разделямой памяти на группу, то как ее хватает на все группы. Например каждая группа, должна загрузить в разделяемую память тайл 64*64 пиксела 40кб информации, А если допустим размер группы, 128, то как тогда происходит. Ее получается намного в 20ки раз больше физически на кристале. и даже в характеристиках нигде найти не могу, что бы узнать сколько shared memory, кроме с пометкой на группу?

Я и так уже от степеней свободы сбился, что малейшее исправление кода, и в 10 раз разница, а тут еще одна.

Вопрос задан более года назад
138 просмотров

1 комментарий

Подписаться 2 Сложный 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Разработчик на C++: Профессия + специализация + нейросети

12 месяцев

Далее
Skillbox

Разработчик на C++

7 месяцев

Далее
Яндекс Практикум

Разработчик C++

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

+1 ещё

Средний
Web scaping с использованием C++ для wb. Какие библиотеки подойдут?
- 1 подписчик
- 2 часа назад
- 10 просмотров
1

ответ
C++

Простой
Почему не работает передача контекста между приложениями?
- 1 подписчик
- вчера
- 59 просмотров
1

ответ
C++

Простой
Какой контейнер выбрать для поиска по ключу для разных размеров?
- 2 подписчика
- 14 дек.
- 144 просмотра
0

ответов
C++

+2 ещё

Простой
Как прочитать данные из пайпа в C++ не перепутав с TTY stdin?
- 1 подписчик
- 14 дек.
- 90 просмотров
1

ответ
C++

Простой
Почему function wrapper с ссылкой в сигнатуре может принимать pointer to member function?
- 1 подписчик
- 11 дек.
- 76 просмотров
0

ответов
C++

Простой
Как лучше реализовать асинхронную задержку?
- 2 подписчика
- 04 дек.
- 212 просмотров
2

ответа
C++

+2 ещё

Простой
Как скомпилировать рабочую dll библиотеку?
- 3 подписчика
- 26 нояб.
- 333 просмотра
1

ответ
C++

+1 ещё

Простой
Как узнать, хранятся числа в компьютере в прямом, дополнительном или обратном коде?
- 1 подписчик
- 23 нояб.
- 479 просмотров
6

ответов
C++

+1 ещё

Средний
Имя массива это адрес первого элемента или указатель на его первый элемент в Си?
- 2 подписчика
- 12 нояб.
- 490 просмотров
5

ответов
C++

+1 ещё

Простой
Почему Project Dependencies не работает?
- 1 подписчик
- 10 нояб.
- 101 просмотр
1

ответ
Показать ещё Загружается…

Мобильный разработчик (React Native / другие)

App Company

от 200 000 до 300 000 ₽

Разработчик Telegram-бота с ИИ (TypeScript / Node.js)

App Company

от 200 000 до 300 000 ₽

Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

Answer 1 · 2024-07-21 08:22:17

Производительность кода на gpu сильно зависит от динамики обращения к оперативной памяти, достаточности кеша и аппаратных возможностей железа (сколько банков памяти).

Например последовательный доступ к данным значительно эффективнее случайного.

Если процессор не используется, то в худшем количество потоков должно быть не больше банков памяти (десятки).

...

Почему при меньшем размере блока потоков в группе, скорость такая же?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт