CUDA基础教程(2):费米架构

1、总体架构
费米架构的计算生产率为和。G80/G92使牢固。GT200架构是。前述的使牢固是开普勒楼房的使牢固。。在费米架构使牢固上,每个线块至多可握住多达1024个线。。当每个线块的线不多时(不足或同样的人19),东西SM可以握住8个线块。。
每个线块射中靶子线数设置为192-768。。你可以接到100%的GPU输出率。。
每个线块事变的表演是半信半疑的。。唯一的当主宰明确提出的使均衡被表演时,才表演每个线块。,将中断SM。。因而,万一线块中有过度线,线块射中靶子主宰静止线束自愿可运用最后的东西线包。。因而,鉴于这争辩,GPU弃置不顾了。。况且,不要让线块的表演次。,因线块不同的我们家期望的那么表演。。线块将在随机装填抵消下分分派SM。。

2、内存
普通来讲,参观自动记录器只必要东西记录骑自行车。,共享内存的参观至多必要32个记录骑自行车。。参观结构储藏处器,不断的内存,和大局内存,它必要400到600个记录骑自行车。,而且带宽也例外的有穷的。。自动记录器通常是有穷的的。,朝一个方向的费米架构,万一每个线块包括256个线,而且每个SM至多有6个线块。。此刻,每个线块最好的运用16个自动记录器。。

共享内存性质上是由在手中用户把持的一类缓存。。在费米架构的使牢固上,共享内存的默许大量是48 KB。,可以调理到16KB。共享内存和主缓存共享64KB的储藏处区域。。共享内存唯一的东西SM。。

不断的内存果真公正的大局内存的蠢货地址体现。缺勤自然规律的公用的不断的内存块。。不断的内存相当于告知缓存。,同时播送机制。
大局内存就,GPU和CPU都可以举行读写推拿。。性质上,PCI-E总线上的什么都可以使牢固都可以读取和以书面提出大局储藏处器。。CPU指挥者可以经过三种方法参观GPU上的内存。
(1)闭塞转乘的显示
(2)显示的无闭塞转乘
(4)隐式运用零内存稿件。

结构内存:它通常用于计算使牢固。结构召回是在参观时,容许GPU在大约五金器具尊重采用倾泻而下的。。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

`