关于下代架构“帕斯卡”(Pascal)的英伟产品,NVIDIA目前只宣布了一款大核心的布帕白皮高性能计算卡Tesla P100,其他各种GeForce游戏卡都还得等一段时间,斯卡书不过近日,架构NVIDIA很慷慨地公布了一份帕斯卡架构白皮书,规格曝光几乎完全公开了GP100核心与Tesla P100的英伟各种规格。
GP100是布帕白皮帕斯卡家族的旗舰核心,预计桌面上的斯卡书GTX 1080 Ti、新版GTX Titan X也会使用它。架构
它采用台积电16nm FinFET工艺制造,规格曝光集成了153亿个晶体管,英伟比麦克斯韦GM200多了超过90%,布帕白皮核心面积达610平方毫米,斯卡书只比28nm工艺的架构GM200大了区区9平方毫米。
三代架构顶级计算卡规格对比
完整的规格曝光GP100核心拥有60个SM(流式多处理器)单元,Tesla P100只开启了其中的56个。每个SM单元内有64个FP32单精度CUDA核心(麦克斯韦、开普勒架构分别有128个、192个),总计3840个。
GP100核心架构图
每个SM单元分为两部分,每部分有32个FP32 CUDA核心、一个指令缓冲器、一个Warp调度器、两个分派单元。
GP100核心每个SM单元的CUDA核心数量虽然只有麦克斯韦架构的一半,但是拥有相同的寄存器文件尺寸(256KB),支持类似的Warp和线程模块。
GP100 SM单元架构图
GP100核心的每个SM单元内还有32个FP64双精度CUDA核心,总计1920个,是单精度的1/2,这种比例可以更好地配合GP100核心新的数据路径配置,更高效地处理双精度负载。
GP100核心还有统一的4096KB二级缓存,超过开普勒GK110 1536KB、麦克GM200 3702KB,可以减少对GPU DRAM的请求,从而降低整体功耗、内存带宽,提升性能。
GP100核心与HBM2显存堆叠示意图
整个核心还配备了240个纹理单元。
Tesla P100计算卡拥有3584个FP32单精度、1792个FP64双精度CUDA核心,核心基础频率1328MHz,加速频率高达1480MHz,峰值单精度性能10600GFlops,比起上代提升了足足55%,而双精度性能也达到了5300GFlops,是开普勒架构的3.2倍,更是麦克斯韦架构的25.2倍。
它搭配了4096-bit HBM2高带宽显存,容量16GB,热设计功耗300W。
(责任编辑:娱乐)
远东发展(00035.HK)获执行董事邱达昌增持33万股 涉资约92.1万港元
按里程计价的车联网车险平台Metromile获得1.915亿美元融资
照片分享应用Snapchat更名为Snap 发布智能太阳眼镜Spectacles
骁龙865 Plus新机发布:翻转镜头 OELD屏+侧面指纹
赛生药业(06600.HK)年度实现纯利7.5亿元 每股基本盈利约为人民币1.38元
春光科技(603657.SH):拟使用不超2.亿元闲置自有资金进行委托理财