WEBKT

CUDA 共享内存精粹:Bank Conflict 优化与数据布局技巧 点评

20 1 0 匿名

点评文章CUDA 共享内存精粹:Bank Conflict 优化与数据布局技巧

点评评分5

点评内容

假设我们有一个二维数组 float data[32][32] 需要存储在共享内存中。如果按照行优先的方式存储,那么同一行的 32 个元素会位于同一个 Bank,导致 Bank Conflict。 这句话是不是有问题?
行优先的话,同一行的32个元素应该是连续的,所以应该会处于不同的Bank,怎么会有Bank Conflict呢?

热门文章