Задать вопрос
@SergeySerge11

Какая память быстрее локальная или разделямая cuda?

не могу придумать пример что бы затестить.
Почему то-везде где видел пишется такая иерархия
  1. Регистры,
  2. Локальная память
  3. Разделяемая
  4. Глобальная


Логично подумать, что раз она ниже, значит медленнее. Так ли это, Но тут я уже не раз читаю, что она там где-то на каком-то кристале ближе чем локальная, находится.

Когда допустим итератор в цикле не вмещается в регистры, сбрасывается в стек, он идет в локальную память, то его чтение становится медленнее, чем если бы он был в разделяемой, или за счет того что он наверное будет в l1 кеше быстрее.
  • Вопрос задан
  • 104 просмотра
Подписаться 1 Простой 1 комментарий
Помогут разобраться в теме Все курсы
  • Яндекс Практикум
    Разработчик C++
    9 месяцев
    Далее
  • Нетология
    Специалист по информационной безопасности + нейросети
    12 месяцев
    Далее
  • Компьютерная академия «TOP»
    Учебная программа “Разработка программного обеспечения”
    30 месяцев
    Далее
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы