英伟达RTX 30系列显卡性能
本次上市的有三个型号GPU,分别是GeForce RTX 3070、RTX3080以及RTX3090,总体来看,RTX 30系列显卡包揽GPU界的多项第一,首款搭载镁光24G GDDR6X 显卡的游戏图形卡,是有史以来最快的存储装置;首批支持最新显示标准HDMI 2.1的PC CPU,能实现4k高刷新率和运行8k游戏;首批带有AV1解码器的离散GPU,使用户能在台式机和媒体中心中使用AV1。
另外,相比于上一代旗舰级显卡GeForce RTX 2080 Ti,GeForce RTX 3090的性能要强大很多。具体而言,RTX 3090的等效CUDA核心数为10496个,大约是RTX 2080 Ti的两倍以上。同前代泰坦一样,RTX 3090 拥有24G的显存,但型号从DDR6升级为DDR6X,显存速度19.6Gbps,显存位宽384bit。在散热效率方面,RTX 3090的TDP达到350W,比前代泰坦增加了100W,这是因为RT3090采用了正反双面风扇的散热设计。
另外,RTX 3080等效核心8704个,显存速度19Gpbs,显存位宽320bit,TDP320w。RTX 3070 的等效CUDA核心数为5888,比2080和核心数多1536颗,同时前者TDP比后者低30w。基于安培架构,三项技术性能翻倍。与上一代RTX不同的是,新一代RTX是基于安培架构而非图灵架构,这使得GeForce RTX 30 系列显卡性能得到了提升。
不过,此次发布的GeForce RTX 30 系列属于消费级显卡,采用的是三星8nm制程工艺,集成280亿个晶体管。根据黄仁勋的介绍,RTX GPU 拥有三项基础处理技术:英伟达在15年前首次推出的可编程着色器、用于加光线三角形和光线边界框相交的RT Core,以及称为Tensor Core的AI处理管线。Tensor Core可加速用于深度神经网络功能的线性代数,这也是现代AI的基础所在。尤其是在图形领域,可以使用Tensor Core通过英伟达研究多年的DLSS将低分辨率的图像还原称高分辨率,从而提高画面帧率,增强视频的画质。具体而言,在游戏中增加光线追踪会增加计算工作负载,使用着色器会降低帧速率,增加RT core可将着色器工作负载减少60%。RT Core 实际上每秒执行34 TFLOPS 浮点运算的着色器,而在进行光线追踪时,图灵相当于每秒执行45 TFLOPS浮点运算。即使是使用RT Core ,也要消耗大量时间,因此RT Core和着色器必须同时运行。同时使用时,即使是20毫秒,每秒也只有50帧,这对前几代产品而言,性能仍然落后,例如,2018年,英特尔基于图灵架构的GeForce RTX 20系列GPU就在光线追踪方面引起过许多争议。不过,要是加上Tensor Core,就可以实现高分辨率和高帧率,TRX的性能得以提升。
黄仁勋表示,新款RTX GPU 基于安培架构在性能方面实现了巨大飞跃,安培架构每个时钟执行2次着色器计算,执行一次着色器算力为30 TFLOPS ,图灵架构为11,安培架构翻倍了吞吐量。另外,安培架构的RT Core可达58 RT TFLOPS,图灵架构为34。安培架构全新的Tensor Core硬件处理稀疏网络的速率是图灵的两倍,可自动识别并忽略次要的DNN权重,相较于图灵 tensor Core 的89tensor TFLOPS ,安培为238。在这三项基础技术上,新一代RTX性能提升均为上一代的两倍。搭配新工具,游戏爱好者的新选择。除了新一代图像显卡,英伟达还推出了Nvidia Reflex、Nvidia Broadcast、Omniverse Machinima和图像增强工具DLSS 2.0,这对游戏玩家而言意味着更优质的画面、更低的延迟以及更安静的环境。
黄仁勋表示,Nvidia Reflex可在CPU和GPU中优化渲染管道,最多可将延迟时间减少50%,该项工具将同Game Ready Driver一起推出。Nvidia Broadcast可以实现虚拟背景和音频降噪,还可以实时追中主播头部,让主播居于画面正中央。Omniverse Machinima是一款面对动画特效制作人员的动画制作专业软件,支持Maya、3D max等主流动画软件。在光追技术方面,黄仁勋表示,“现在,全球排名前二的最受欢迎游戏,《我的世界》和《堡垒之夜》,都已支持光追。”
另外,英伟达还宣布推出专为电竞设计的拥有360Hz刷新率 G-SYNC显示器,内置精确的延迟分析工具,今年秋天宏基、华硕、微星、外星人等品牌将上市这款显示器。在英伟达的测试比较中,360Hz显示器能够帮助玩家更好地定位和追踪对手。
总体看来,RTX 30系列显卡的性能强劲,如此性能强大的游戏显卡,简直就是游戏爱好者的福音。