Какова максимальная скорость чтения данных для GPU Kepler?
Я только недавно начал изучать эту тему, поэтому вопросы глупые наверно. Так вот, мне интересно, какова максимальная скорость чтения из Global Memory? Допустим я читаю 32битные числа, читаю их очень оптимально, использую coalesced доступ - сколько чисел я смогу считать за секунду? Если не сложно, то с формулами, чтобы можно было потом считать самостоятельно.
Встречал пример, где на Maxwell у человека было 40Гб/с, но там частично автокеширование использовалось. А пропускная способность шины это те самые 256Гб/с, которые пишут везде для кеплеров?
А в реальных примерах что так сильно будет влиять на уменьшение скорости? Допустим я скрываю латенси тем что пока один поток(?) читает, другой совершает рассчеты.