AMD Radeon RX 9070 GRE显卡首测:游戏性能超越RTX 5060 Ti 30%
3月5日,AMD正式发布了基于RDNA4架构的全新Radeon RX 9000系列显卡,包括RX 9070 XT和RX 9070。其中,RX 9070 XT凭借更强的性能和4999元的定价,成功超越了竞争对手NVIDIA的RTX 5070 Ti。而RX 9070则以4599元的价格,在性价比方面遥遥领先。
两个月后,AMD再次推出了一款RDNA 4架构的显卡——RX 9070 GRE,专为中国玩家打造。这款“特供版”显卡在核心规格上略有缩减,旨在以更低的价格满足预算有限的游戏玩家需求。
那么,全新的,独属于中国玩家们的RX 9070 GRE显卡究竟会给我们带来怎样的惊喜?让我们一起来看一下吧!
本次评测的显卡是来自华硕的ATS RX9070GRE O12G,属于巨齿鲨系列,也是华硕首款采用RDNA4架构巨齿鲨显卡。其核心频率超过公版标准,性能表现值得期待。本文将对比NVIDIA的RTX 5070和RTX 5060 Ti 16G,全面展示RX 9070 GRE的游戏性能。
产品规格及核心介绍:
按照惯例,我们还是列了一个规格表,以便大家对这代显卡的无后缀版RX 9070及上代的RX 7900 GRE显卡有一个比较直观的了解。
需要说明的是,虽然上表格参与对比的上代显卡是,RX 7900GRE,但是在RX 7000系显卡中,RX 7900系列定位是高端,而新一代的RX 9070系列定位则是中端,因此上图仅做参考即可。
通过上图可以发现,RX 9070 GRE仍沿用Navi 48核心,只是在流处理器等方面有所减少,显存也由16GB变成了12GB,无限缓存则是由64MB变成了48MB。但是奇怪的是,该卡与RX 9070一样供电功耗仍为220W。
相较于RDNA3架构,RDNA4除了重新整合成一个完整的核心Die之外,在CU单元方面也做了升级。
CU单元的提升主要体现在4个方面:增强型的显存管理,动态的寄存器分配,扩展的标量指令集以及更高的效率和时钟速度。
新的存储架构将通过优化排队机制,来更高效地处理显存的请求以达到减少延迟和提高带宽利用率的效果。
在SIMD向量单元中,RDNA4采用了全新的动态寄存器分配制度,来提高程序执行的效率。
在标量单元指令集中,加入了浮点运算指令。
注意,在前边表格中我们提到的CU单元类型为“双CU单元”,这是因为RDNA4架构中2个CU单元共享Memory以及Cache,这样的物理设计优化,可以显著的提升运算效率和时钟速度。
在第三代光追加速器方面,RDNA4采用了全新的光线变换引擎(Ray Transform)和两个光线交叉引擎(Intersection Engine)的设计,1+2的设计使得对于光线变换的处理和光线交叉测试的性能直接翻倍。
并且,RDNA4引入了一个全新的技术“定向包围盒”,该技术能够增加光线穿越的效率且降低显存的消耗,更好的利用显存的容量和带宽。
在第二代AI加速器方面,新的RDNA4可以支持16bit、8bit以及4bit的低精度计算。
华硕RX 9070 GRE巨齿鲨外观(一):
本次收到的华硕RX 9070 GRE巨齿鲨显卡为3风扇设计,其整体采用了板正的长方形造型,并在四个角加入了装饰作为点缀,使其非常有科技感。
其显卡正面采用了3个直径90cm的双滚珠轴承风扇,并且为正反转设计,其中中间的风扇顺时针旋转,两边的风扇则是逆时针旋转设计。在给显卡带来足够进风量的同时,也起到了防止风扇之间产生扰流的作用。
显卡顶部可以看到大面积的散热鳍片区域,该卡采用了MaxContact 镜面直触技术,相比传统的GPU镜面底座,该底座要多出 5%的面积,能够起到更好的导热作用。同时该显卡设有4根直径6mm的热管来进行导热。
顶部左侧印有ASUS的英文标识,右侧则是RADEON的标识。
该显卡为双8Pin GPU辅助供电接口。
华硕RX 9070 GRE巨齿鲨外观(二):
在显卡的背面可以看到一个金属背板,该金属背板在显存以及供电的PCB背面设有导热硅脂垫,能够将显存及供电的一部分热量传递到背板上面,以起到辅助散热的作用。
同时在显卡的右侧,华硕的RX 9070 GRE巨齿鲨做了穿透式设计,风扇吹出来的风可以经由此处直接吹透显卡,以起到加强散热和辅助理顺机箱风道的作用。
在背面靠显卡顶部的地方可以看到一个BIOS切换开关,该显卡为双BIOS设计,其中P为性能档,Q则是静音档,一档散热性能更为强悍,能够使显卡保持长期高性能运行,另一档则是风扇转速较为静音,适合安逸的环境。
最后,该显卡为2.5槽设计,并配有3个DP 2.1a及1个HDMI 2.1b的接口。
测试平台及测试项目介绍:
整体测试平台如上图所示,为了让显卡性能更加直观,我们特别加入了NVIDIA的RTX 5070及RTX 5060 Ti显卡作为对比评测。
同时,由于是显卡性能测试,所以我们尽可能的将其它配件拉高,以免对显卡的性能发挥造成干扰。
在测试方面,除了3DMark基准测试之外,我们选择了17款游戏,分别是带插帧的4款,带FSR的4款以及标准模式下的9款。17款游戏均带有Benchmark,以最大程度减少误差。
3DMark基准性能测试(一):
3DMark基准性能测试(二):
帧生成游戏测试《赛博朋克2077》:
注意:在这项测试中,AMD显卡我开启帧生成并开启FSR质量模式,NVIDIA显卡我仅开启帧生成(DLSS 4则是2X),并开启DLSS质量模式。
帧生成游戏测试《COD21》:
注意:在这项测试中,AMD显卡我开启帧生成并开启FSR质量模式,NVIDIA显卡我仅开启帧生成,并开启DLSS质量模式。
帧生成游戏测试《F1 24》:
注意:在这项测试中,AMD显卡我开启帧生成并开启FSR质量模式,NVIDIA显卡我仅开启帧生成,并开启DLSS质量模式。
帧生成游戏测试《怪物猎人:荒野》:
注意:在这项测试中,AMD显卡我开启帧生成并开启FSR质量模式,NVIDIA显卡我仅开启帧生成,并开启DLSS质量模式。
FSR/DLSS游戏测试(一):
FSR/DLSS游戏测试(二):
标准游戏性能测试(一):
标准游戏性能测试(二):
标准游戏性能测试(三):
标准游戏性能测试(四):
工况测试:
照例我们进行了工况测试,测试采用Furmark单烤显卡的形式,测试室温为24度,测试时间在44分钟左右。
在华硕RX 9070巨齿鲨显卡性能模式的烤机测试中,显卡的当前GPU核心频率为2236MHz,GPU温度为51度,热点温度则是74度,显卡的风扇转速在47%左右,显卡的功耗则是229W。
测试感想:
按照惯例,我们还是对前边的数据进行了一下总结,并列出了一个表,以便大家该显卡及其友商RTX 5070和RTX 5060 Ti 16G两款显卡的性能表现有一个直观的了解。
同时,我们将本次测试的主角华硕RX 9070 GRE巨齿鲨显卡作为目标,其性能设置为100%,以便大家对。
值得一提的是,为了保证测试合理性,在两张图结尾的综合对比(百分比)时,我们去掉了一个最高百分比和一个最低百分比,然后再求平均,以此得出两块显卡各在3个分辨率下的不同百分比。
通过测试可以发现,在4K分辨率下,RTX 5070的表现是最强,要比华硕RX 9070 GRE巨齿鲨高了5%。而随着分辨率的下降,其领先幅度也随之下降,到了2K分辨率下则仅高2%。在1080P分辨率下就只有1%幅度的差距了。
同时,在对比RTX 5060 Ti 16G方面,华硕RX 9070 GRE巨齿鲨则是拿出了更大优势,其友商的RTX 5060 Ti 16G性能在4K和2K分辨率下仅为RX 9070 GRE的77%,到了1080P下其性能则略有上升,达到了79%。
因为AMD的FSR 4采用了与FSR 3.1相同API的设计,所以,原本支持FSR 3.1的游戏可以轻松的支持到FSR 4,这样节约开发者成本的方式使得目前为止支持FSR 4的游戏变得越来越多,就比如本次测试中新加入的《COD21》,相较于FSR 3.1,FSR 4除了对画质的提升之外就是性能(帧率)的进一步提高,使其整体过程会变得更加的流畅,自然。
AMD其实并不打算像友商那样开启“多帧生成”,在AMD的理念中,单帧生成已经是很好的提升了,插入过多的 “虚拟”帧则会进一步的增加帧延迟,导致用户在玩游戏时会出现“不顺畅”的感觉。
毕竟,帧生成的根本是原生帧嘛,当原生帧足够流畅时,何必去追求额外加入“虚拟”帧呢?
其实,这次的RX 9070 GRE定位是中国特供版,也是为了让手头预算不算非常富裕的玩家们有一个更好的选择。
而RX 9070 GRE的定位是2K或是1080P分辨率的用户群体,事实上,通过上边的测试大家也不难发现,就算是RTX 5070,在2K分辨率下也只比RX 9070 GRE高了2%,1080P下也仅仅是拉开了1%的差距而已,几乎可以忽略不计。
综上所述,RX 9070 GRE其本身拥有比RTX 5060 Ti 16G高了30%的性能,再加上更容易适配新游戏和老游戏升级的FSR 4技术,使其在中、低端显卡中有了一个很强的竞争力。因此,如果你的预算不是非常充足,且仅仅是希望2K或是1080P畅玩3A大作的话,RX 9070 GRE是一个非常不错的选择。
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。