【700W功耗+800亿晶体管 NVIDIA的H100核心定制4nm工艺:更省电】前两天NVIDIA在GTC 2022大会上发布了H100 GPU核心,没有使用传闻的台积电5nm,而是定制版的台积电4nm工艺,名字为4N,而台积电的4nm官方命名是N4,所知的差异主要是能效,4N工艺重点优化了省电,虽然SXM版H100最高功耗有700W,但是PCIe 5.0版的功耗是350W,相比目前的A100核心的400W还低了,但性能提升是数倍的,可见能效之高。
【NVIDIA发布新一代H100 GPU核心】今天凌晨,黄仁勋公布了NVIDIA新一代架构与核心,当然这次是面向HPC高性能计算、AI人工智能的“Hopper”,对应核心编号“GH100”,同时发布的还有基于新核心的加速计算卡“H100”、AI计算系统“DGX H100”。
GH100核心采用的是台积电定制版的4nm工艺,采用CoWoS 2.5D晶圆级封装,单芯片设计,集成多达800亿个晶体管,号称世界上最先进的芯片。
完整版有8组GPC(图形处理器集群)、72组TPC(纹理处理器集群)、144组SM(流式多处理器单元),而每组SM有128个FP32 CUDA核心,总计18432个。
显存支持六颗HBM3或者HBM2e,控制器是12组512-bit,总计位宽6144-bit。
Tensor张量核心来到第四代,共有576个,另有60MB二级缓存。
扩展互连支持PCIe 5.0、NVLink第四代,后者带宽提升至900GB/s,七倍于PCIe 5.0,相比A100也多了一半。整卡对外总带宽4.9TB/s。
性能方面,FP64/FP32 60TFlops(每秒60万亿次),FP16 2000TFlops(每秒2000万亿次),TF32 1000TFlops(每秒1000万亿次),FP8 4000TFlops(每秒4000万亿次)。
H100计算卡采用SXM、PCIe 5.0两种形态,其中后者功耗高达700W。
GH100核心采用的是台积电定制版的4nm工艺,采用CoWoS 2.5D晶圆级封装,单芯片设计,集成多达800亿个晶体管,号称世界上最先进的芯片。
完整版有8组GPC(图形处理器集群)、72组TPC(纹理处理器集群)、144组SM(流式多处理器单元),而每组SM有128个FP32 CUDA核心,总计18432个。
显存支持六颗HBM3或者HBM2e,控制器是12组512-bit,总计位宽6144-bit。
Tensor张量核心来到第四代,共有576个,另有60MB二级缓存。
扩展互连支持PCIe 5.0、NVLink第四代,后者带宽提升至900GB/s,七倍于PCIe 5.0,相比A100也多了一半。整卡对外总带宽4.9TB/s。
性能方面,FP64/FP32 60TFlops(每秒60万亿次),FP16 2000TFlops(每秒2000万亿次),TF32 1000TFlops(每秒1000万亿次),FP8 4000TFlops(每秒4000万亿次)。
H100计算卡采用SXM、PCIe 5.0两种形态,其中后者功耗高达700W。
【NVIDIA第一款5nm GPU H100真身首曝】今晚,NVIDIA将召开GTC 2022春季开发者大会,NVIDIA公司创始人兼首席执行官黄仁勋也将发表主题演讲,几乎肯定会发布基于Hopper架构的新一代高性能计算GPU和相关产品。就在发布前的最后时刻,H100加速计算卡的渲染图曝光了:SXM样式,整体异常紧凑,整个电路板几乎满满的都是各种元器件,中间自然就是GH100核心。从渲染图上可以看到8组GPC(图形处理集群),144组SM,也就是对应18432个CUDA核心,相比于Ampere架构大核心GA100 6912个多出足足1.67倍。当然,按惯例应该不会开启所有核心,势必要屏蔽一部分以确保良品率。
本次大会上,NVIDIA应该还会推出基于Hopper GH100核心的工作站、个人超级计算机等相关产品,甚至可能会公布PCIe接口样式的H100计算卡。
本次大会上,NVIDIA应该还会推出基于Hopper GH100核心的工作站、个人超级计算机等相关产品,甚至可能会公布PCIe接口样式的H100计算卡。
✋热门推荐