@NeoZeed

Как использовать локальную память видеокарты и быстрее ли она по сравнению с разделяемой?

Для разделяемой и константной памяти есть идентификаторы.
Верно ли, что переменные, объявленные внутри ядра, используют локальную память? И какая у неё скорость в сравнении с разделяемой и константной?
  • Вопрос задан
  • 2391 просмотр
Решения вопроса 1
Fesor
@Fesor
Full-stack developer (Symfony, Angular)
Локальная и глобальная память самая медленная. Регистровая самая быстрая, переменные объявленные внутри ядра по идее в ней хранятся. shared память разделяется на пул тредов (варп в контексте CUDA).

www.microway.com/hpc-tech-tips/gpu-memory-types-pe...

Самое сложное по началу добиться транзакций при копировании памяти из глобальной в shared, что бы данные копировались блоками.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы