Задать вопрос
@NeoZeed

Как использовать локальную память видеокарты и быстрее ли она по сравнению с разделяемой?

Для разделяемой и константной памяти есть идентификаторы.
Верно ли, что переменные, объявленные внутри ядра, используют локальную память? И какая у неё скорость в сравнении с разделяемой и константной?
  • Вопрос задан
  • 2394 просмотра
Подписаться 2 Оценить Комментировать
Помогут разобраться в теме Все курсы
  • Яндекс Практикум
    Python-разработчик
    10 месяцев
    Далее
  • Skillfactory
    DevOps-инженер
    6 месяцев
    Далее
  • Хекслет
    Фронтенд-разработчик
    10 месяцев
    Далее
Решения вопроса 1
Fesor
@Fesor
Full-stack developer (Symfony, Angular)
Локальная и глобальная память самая медленная. Регистровая самая быстрая, переменные объявленные внутри ядра по идее в ней хранятся. shared память разделяется на пул тредов (варп в контексте CUDA).

www.microway.com/hpc-tech-tips/gpu-memory-types-pe...

Самое сложное по началу добиться транзакций при копировании памяти из глобальной в shared, что бы данные копировались блоками.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы