Gpu вычисления, groupId theradId gridId что означают, как пользоваться?

Question

SergeySerge11 @SergeySerge11

Gpu вычисления, groupId theradId gridId что означают, как пользоваться?

Использую ILGPU, и еще ComputeSharp CudaManager, там везде в принципе все похоже.
Хочу понять какие есть техи.

Как написать самый быстрый в мире код суммы 2 массивов.

Вот для аналогии приведу пример Самого медленного кода в мире.
На GPU вычисления по дефолту типа Такой аналогии???
Parallel.For(0, nn, i => arr1[i] += arr2[i]);

Типичная функция gpu вычислений в любой документации, Один в один как самый медленный код.

// Kernel definition
__global__ void VecAdd(float* A, float* B, float* C)
{
    int i = threadIdx.x;
    C[i] = A[i] + B[i]; 
}

Это же тоже самое. мелкая функция будет вычисляется. да еще наверное, не использует локальность данных.
Как вот эту функции из документации оптимизировать до предела?
То есть вставить туда

__global__ void VecAdd(float* A, float* B, float* C)
{
    int i = threadIdx.x;
    for( ? ; ? ; ? )
          C[i] = A[i] + B[i]; 
}

Там есть вот эти group grid thead block id X,Y,Z измерениях. И страшно даже перебирать все варианты.
Зачем они вообще нужны. Кто это придумал, зачем. Почему нельзя, как Везде, и всегда на CPU.
Просто передать индекс, ну может еще множитель и уже самому вычислить регион внутри регион, это же и проще и понятнее

__global__ void VecAdd(  int index,   int len,  float* A, float* B, float* C)
{   
     int beg=index*len;
     int end=beg+len;
     for(;;)...
}

Вопрос задан более года назад
107 просмотров

1 комментарий

Подписаться 2 Сложный 1 комментарий

Помогут разобраться в теме Все курсы

Skillfactory

Профессия C#-разработчик

12 месяцев

Далее
Merion Academy

C# разработчик с нуля

4 месяца

Далее
Stepik

PRO C#. Профессия "Backend разработчик"

4 месяца

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C#

+1 ещё

Средний
Как наиболее просто игроку изменять модель игрового объекта в Unity?
- 1 подписчик
- 10 дек.
- 53 просмотра
1

ответ
C#

+2 ещё

Простой
Каков вектор развития legacy-проекта на WinForms?
- 1 подписчик
- 03 дек.
- 177 просмотров
1

ответ
C#

+1 ещё

Простой
Как создать копию предмета и добавить ему компонент?
- 1 подписчик
- 08 нояб.
- 136 просмотров
1

ответ
C#

+1 ещё

Простой
Как сделать постраничную навигацию в Avalonia UI MVVM?
- 2 подписчика
- 08 нояб.
- 106 просмотров
0

ответов
C#

Простой
Почему одинаковые делегаты работают по разному, В 10 Раз разница в скорости?
- 1 подписчик
- 27 окт.
- 297 просмотров
0

ответов
C#

+1 ещё

Простой
Почему не работает обратная привязка в Avalonia UI?
- 1 подписчик
- 22 окт.
- 150 просмотров
1

ответ
C#

+1 ещё

Средний
При каких входных данных моя программа работает неверно и как мне научиться самому это понимать? Как научиться искать ошибки?
- 2 подписчика
- 20 окт.
- 367 просмотров
3

ответа
C#

+2 ещё

Простой
Как универсализировать обычный ViewList в WPF C# XAML?
- 1 подписчик
- 20 окт.
- 101 просмотр
2

ответа
C#

+1 ещё

Простой
Как проверить, наследует ли объект в обобщённом методе?
- 1 подписчик
- 16 окт.
- 119 просмотров
1

ответ
C#

+1 ещё

Средний
Пермач после авторизации [WTelegram,TDLib] как исправить?
- 1 подписчик
- 10 окт.
- 324 просмотра
0

ответов
Показать ещё Загружается…

C# WinForms .Net разработчик

Ляпунов и Резниченко • Санкт-Петербург

от 350 000 ₽

QA automation (C#)

Альфа-Банк • Москва

от 200 000 до 350 000 ₽

Senior Pentester / Red Team Specialist

Ubiex

от 300 000 ₽

Потому что один поток команд на все данные, который выполняется на множестве маленьких cpu.
Поэтому локальность данных не особо помогает.
Хотя насколько помню там всё хорошо будет с данными: они пачкой грузятся, пачкой обрабатываются.

Там есть вот эти group grid thead block id X,Y,Z

Хочешь скорости - изучай архитектуру целевой платформы.
Я когда матрицы умножал, получал прирост производительности, если размер был кратен 32-м.

Gpu вычисления, groupId theradId gridId что означают, как пользоваться?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт