2022年10月11日,NVIDIA正式发布了Ada Lovelace架构的第一款游戏显卡——GeForce RTX 4090,同时也是RTX 40系列的旗舰产品,和上一代Ampere架构的RTX 30系列显卡相比,RTX 4090凭借着Ada Lovelace架构优势再次实现了性能的飞跃式提升,成为当代性能最强的游戏显卡,没有之一,搭配上专属的DLSS3技术,能够在理论性能的基础上进一步提升游戏帧数,让玩家可以有机会流畅体验8K分辨率游戏。
Ada Lovelace架构的旗舰核心为AD102,由台积电4N工艺制作,集成了763亿集体管,是上代GA102的2.7倍,核心面积大小为608mm²。
RTX 4090所使用的AD 102-300核心架构示意图
RTX 4090作为RTX 40系列显卡的首发旗舰产品,并没有采用完整规格的AD102芯片,而是关闭了8组TPC,在完整AD102芯片72组TPC的基础上保留了64组TPC,每个TPC内有2组SM簇,共128组SM簇。
Ada lovelace架构的SM簇
每个SM簇里包含了64个FP32单元和64个FP32/INT32混合单元,可视作为128个FP32单元,因而每个SM簇内为128个CUDA;每个SM簇还配置了4个纹理单元、1个RT单元、4个Tensor单元,所以RTX 4090显卡拥有16384个流处理器单元、512个纹理单元、128个三代RT单元、512个Tensor单元。
如果单纯比较流处理器数量,RTX 4090是上一代旗舰RTX 3090Ti的1.52倍,理论上性能最大提升幅度大约在50~60%左右,但NVIDIA为Ada Lovelace架构重新设计第三代RT单元和第四代Tensor单元,其中三代RT单元进一步提升光追性能表现,这也是Ada Lovelace架构最大的升级。
2代RT单元
3代RT单元
和Ampere的2代RT单元相比,Ada Lovelace架构的3代RT单元新增加了“不透明微遮盖引擎”(OME)和“微网络位移引擎”(DM-ME)。
这两个引擎能够将光追计算中常遇到的操作进一步分工处理,提高整体效率,在节省更多计算资源的同时提高光追计算效率。
除了架构上的升级之外,DLSS3技术无疑是RTX 40系列显卡的最大卖点,DLSS3也被NVIDIA官方称为神经网络渲染新时代。DLSS 3技术包含帧生成技术、超分辨率和NVIDIA Reflex,其中帧生成技术为RTX 40系列显卡所独享,该技术可以将光流估计和DLSS相结合,在现有帧之间插入精确的合成帧,实现帧数“翻倍”提升,让玩家获得更流畅的游戏体验。
目前已有38款已发布的游戏支持DLSS3技术,超过300款游戏和应用支持DLSS技术,并且数量还在持续不断的增加,在这次的RTX 4090显卡50款游戏性能实际测试中,我们就节选了30款支持DLSS的游戏作品,其中接近半数支持DLSS3技术。
接下来就让我们一起来看看,在RTX 4090已经发布半年之后究竟能为我们带来怎样的游戏帧数体验。