CUDA 共享内存精粹:Bank Conflict 优化与数据布局技巧 点评
20
1
0
匿名
点评文章CUDA 共享内存精粹:Bank Conflict 优化与数据布局技巧
点评评分5
点评内容
假设我们有一个二维数组 float data[32][32] 需要存储在共享内存中。如果按照行优先的方式存储,那么同一行的 32 个元素会位于同一个 Bank,导致 Bank Conflict。 这句话是不是有问题?
行优先的话,同一行的32个元素应该是连续的,所以应该会处于不同的Bank,怎么会有Bank Conflict呢?