NVIDIA最新的Pascal架构产品不论是专业卡领域,还是民用桌面级显卡产品都是相当受到玩家们的关注,而Pascal架构的首款产品为Tesla P100计算卡,采用GP100代号核心芯片组,属于Pascal旗舰级芯片组,推测顶级的显卡将会使用同一核心,发表时日也越来越近。
Pascal GP100采用TSMC台积电16nm FinFET制程生产,虽然芯片组面积比起Maxwell GM200大9mm2,但其Transistors晶体管却多上许多,Pascal GP100 15.3 billion晶体管,而Maxwell GM200晶体管则是8 billion,在制程进步对于核心芯片有了很大的帮助。
完整的Pascal架构具有60个SMs,每个SM内会有64个 CUDA核心,因此总共会有3840个,每个SM内会有64个单精度CUDA核心和32个双精度CUDA核心,TPCs计算处理群集为30个(每个裡面有两个SMs),还具有240个纹理单元,具有八个512 bit记忆体控制器,总共4096 bit,且每个记忆体控制器具512KB L2快取,全核心共4096KB L2快取,比起前几代L2都还大,降低对DRAM的需求来提升整体效能。
从这张比较表可以发现Tesla P100计算卡的GP100核心仅开启56个SMs,并非完整开启60SMs,因此总CUDA核心为3584个,纹理单元为224个,核心频率1382MHz,Boost频率1480MHz,使用4096 bit HBM2显存类型,显存容量16GB,TDP为300W。
作为计算卡,这张Tesla P100拥有10600 GFLOPs单精度运算能力,具有5300 GFLOPs双精度运算能力,从表上看来效能高出前两代许多。