一、前沿:三年三次飞跃 锐龙几近完美
时至今日,仍然对2017年2月22日发生在美国旧金山的那一幕记忆犹新:AMD CEO苏姿丰博士手持一颗零售版的Ryzen锐龙处理器,对来自全世界的几十家科技媒体宣布,AMD Zen架构成功取得了52%的IPC(每时钟周期指令数)性能提升,远超最初设定的40%的目标。
顿时,全场掌声雷动、欢呼四起,因为这一刻,整个行业都等了太久太久……
在那之前的几乎十年时间里,AMD处理器被Intel一直狠狠地摁在地上摩擦,推土机架构在酷睿架构面前根本抬不起头来,AMD甚至一度在桌面、笔记本和服务器市场上都完全放弃了高性能CPU的竞争,任由对手蹂躏,“i3默秒全”的耻辱更是始终伴随着AMD。
知耻而后勇,就在Intel常年慢悠悠挤牙膏、每年性能提升只有个位数的时候,AMD暗中积蓄力量、厚积而薄发,最终实现了华丽丽的转身。
全新Zen架构的锐龙处理器、霄龙处理器让AMD终于重返高性能计算市场,尤其是大打“核战”,迫使Intel不得不匆忙应战,双方你来我往好不热闹,两年之间的进步幅度已经远超之前十年的总和,而且又恰好赶上了对手架构和工艺两个方面的“青黄不接”,天时地利人和之下的AMD始终牢牢掌握着主动权,从曾经跟在对手后边土都吃不到,变成如今一路狂奔向前让对手苦苦追赶。
技术和性能上整体领先,价格上坚持超高性价,AMD锐龙不但叫好,更加叫座,市场份额稳步提升,在德国、日本等地区的零售市场占比甚至已经常态化反超Intel,去年双11期间在天猫京东两平台的全网份额也超过了50%!
过去两年多的时间里,AMD锐龙带给整个PC处理器行业的精彩和变革,已经无需赘言,而更让人惊叹的是,AMD这次并非逞一时之威风,从一开始就做好了打“持久战”的准备。
Zen诞生之初,无论是桌面还是笔记本抑或数据中心,AMD就大方公布了未来数年的技术和产品路线图,从不讳言正在打造Zen+、Zen 2、Zen 3、Zen 4……等一系列后续架构,工艺上也是14nm、12nm、7nm、7nm+……一步一个脚印。
14nm Zen的第一代锐龙让整个世界看到了AMD吹响的反击号角,12nm Zen+的第二代锐龙显示了AMD坚定不移、死磕到底的决心,而今天7nm Zen 2的第三代锐龙的到来,可以说是翻开了全新的篇章,不想废话的AMD向所有人扔出了一个近乎毫无短板的“木桶”。
核心架构、制造工艺、单核性能、多核性能、功耗发热、零售价格、平台兼容……无论从哪个方面看,三代锐龙都有点无可挑剔,“i3默秒全”俨然要变成“R5默秒全”的节奏。
Zen架构才诞生的第三年,就能打磨到如此境界,还有7nm工艺的神助攻,苏妈这炉火纯青的刀法,老黄也得自叹弗如。
二、技术解析:三代锐龙的花式神奇
有关Zen 2架构的特性、三代锐龙处理器的性能、X570主板和AM4平台的规格,之前我们已经做过全面、深入的解读,这里就不再过度赘述,仅总结一下其中最值得关注的亮点,也是为了展示新平台的提升之巨大。
Zen 2架构是Zen的第三个进化版本,也是第一个大改版,其整体设计目标有三:
一是追求更极致的性能,而且任何一个计算节点都要有更充裕的带宽;二是结合最领先的制造工艺(7nm),在集成度、能效方面实现飞跃;三是灵活的扩展性,可以在既有AM4封装下无缝实现更多核心、更多I/O,并满足各个领域的需求。
从最终的规格和性能表现看,Zen 2完美达成了预期水平,甚至可以说超额完成了任务:IPC架构性能提升达到了约15%,在任何应用上都有显著进步;缓存容量直接翻番,作为最大软肋的内存延迟和游戏性能得到了极大的改观;浮点性能直接翻倍,对于创作性应用来说旧貌换新颜。
Zen 2架构整体设计图和提升概览:可以说,在之前Zen+优化完善增强的基础之上,Zen 2将整个架构的每一个模块、每一处细节都进行了精心的打磨,整体焕然一新。前端、预取、解码、浮点单元、整数执行、载入存储、缓存、安全,Zen 2没有放过任何一个角落。
于是,我们看到了全新的TAGE分支预测器、重塑的一致性缓存体系、翻番的三级缓存、4K指令微操作缓存、全面扩大的整数单元、翻了一番的浮点单元、更高带宽更低延迟的载入存储、更快的安全虚拟化、硬件增强的安全防御、新的缓存与安全指令、强化的Infinity Fabric总线……等等等等。
最值得重点说道的地方有四个地方,一是预取部分,这里是一个架构执行效率和性能高低的关键所在。
三代锐龙采用了chiplet多个小芯片组合的设计方式,而为了协调分散的不同模块,不但彼此之前有加强版的Infinity Fabric总线(高带宽低延迟)、翻番的三级缓存(高命中率),还特别强化了分支预测,尤其是增加了新的TAGE分支预测器,同时加大了BTB(分支目标缓冲器)容量,加大了1K ITA(间接目标阵列),优化了32KB一级缓存,,从而将预测错误率降低了大约30%,使得处理器可以花更少的时间完成前端分派工作,提高效率的同时也能节省功耗。
浮点单元的变化也非常大,吞吐量和性能直接翻了一番,关键就在于浮点和载入存储带宽从128bit翻倍到256bit,支持AVX2指令集,单个周期就可以一次性完成256bit指令,不必再像以前那样拆分成两个128bit指令再耗费两个周期分别执行。
很多人说Zen 2不支持AVX-512,但是一方面512bit指令非常稀少,除了部分专业领域日常应用中是基本没有的,而且执行512bit指令非常耗电,打开之后功耗至少增加20%——不信的话试试用i9-9900K跑几分钟AVX-512满载拷机,不尿崩回来找我。
当然,并不是说AVX-512毫无用处,只是需要分场合、分情况,目前消费级处理器支持它的使用价值还太低,架构设计的时候必须有所取舍,或许随着形势的变化,未来的Zen架构也会加入它。
Zen 2的缓存架构也有极大调整,支持各级缓存一致性,可以大大降低有效延迟,并加入了新的缓存指令。
一级指令缓存从4-way 64KB调整为8-way 32KB,和一级数据缓存保持一致,关联性更强,预取和利用率都得到改进。
二级缓存保持每核心8-way 512KB不变,三级缓存则翻番到了每核心对应4MB(16核心就是64MB),可以很好地提升命中率和游戏性能。
对于多芯片设计,最关键的因素就是能不能保证不同模块之间足够高的带宽和足够低的延迟,AMD为此设计了Infinity Fabric总线(可以视为当年赫赫有名的HyperTransport总线的超级进化版),是如今和未来AMD CPU、GPU、APU的根基。
三代锐龙上,Infinity Fabric总线也进化到了第二代,在扩展性、延迟、能效各个方面都有显著提升。
其中扩展性上,特别针对消费级客户端应用做了优化调整(之前更多还是数据中心上),并且总线宽度从256-bit翻番到512-bit,从而更好地支持PCIe 4.0,能效上则将单位功耗降低了多达27%。
延迟更是多芯片互连的致命所在,一旦处理不好会导致整体效率的低下,包括核心、缓存、内存等各个模块都必须保持最高效率和最低延迟。IF总线如今解绑了Fclk时钟频率、Uclk非核心频率,可让内存运行在更高频率,同时降低了突发负载下的内存延迟,加速了缓存与缓存之间的传输。
说到内存,Zen架构的内存延迟一直是个痛点,但也在不断改进,Zen 2架构更是在内存频率和延迟之间设置了巧妙的平衡,根据实际需要可以有多种选择。
三代锐龙官方支持的标准内存频率为DDR4-3200(前两代分别为DDR4-2667/2933),但可以轻松超到DDR4-4200乃至更高,极限情况下甚至做到过DDR4-5133。
但内存频率并非绝对的越高越好。三代锐龙的IF总线频率与内存频率有两种比例,DDR4-3733及更低频率的时候,二者是1:1,继续提高内存频率,就变成了1:2,IF总线频率反而会降低,所以延迟会反弹增加。
DDR4-3733的时候,内存延迟是最低的只有67ns,提高到DDR4-3866的时候延迟会增加到80ns,之后缓慢降低,但就算到了DDR4-4400延迟依然有75ns,甚至高于DDR4-3200。
AMD推荐三代锐龙搭配的最佳内存频率是DDR4-3600(CL16),这时候综合性能、价格是最为平衡的。除非你需要对内存频率特别敏感的地方,否则不建议超太高。
说到频率,还有锐龙处理器本身的频率。受制于架构和工艺属性,第一代锐龙的频率不算高,自动超频加速最多也不过4.1GHz,二代则来到了4.35GHz,最新的三代凭借架构和工艺的双重改进最高可以跑到4.6GHz。
相比于竞品,这似乎仍然还不是足够高,很多人可是期待5GHz的,但是一方面,Zen 2架构和7nm工艺也都有自己的限制,不可能随拔高频率,否则功耗就吃不消(7nm也还不是专门针对高性能计算的工艺),另一方面即便是现在的频率,也足够对手喝一壶了,尤其是游戏性能。
架构说完了,来看看产品层面。如前所述,三代锐龙(和数据中心上的二代霄龙)采用了chiplet小芯片设计理念,模块化组合不同单元实现不同规格,但比当年的“胶水封装”高明和复杂多了,不只是简单地叠加芯片,而是要把不同工艺、架构、功能的模块按需搭配在一起,还得有利于整体性能发挥。
为什么要这么麻烦而不是单独设计一个芯片?根本原因就是——钱!
随着半导体公司的急剧复杂化,不但设计和量产一种新的制造工艺成本急剧增加,新的处理器也是如此,有说法称在7nm工艺上设计一款芯片的费用超过3亿美元。
即便不差钱真的设计出来,也要面临制造成本、良品率的问题,因为越大、越复杂的芯片越容易有大量缺陷而无法正常使用。
chiplet小芯片设计就可以分担风险,大大降低成本并提高良品率,而且还有更多好处:一是每一个芯片模块可以使用最适合自己的工艺,比如Zen 2 CPU部分使用最好的7nm工艺,尽可能提升性能,I/O输入输出部分则使用足够好的12nm(霄龙里还是14nm),优化电路并控制成本。
二是将I/O部分单独拿出来之后,再结合新的高速低延迟IF总线,可以确保所有核心、缓存通信的一致性,肯定要比全部原生集成要差一些,但是仍然可以有足够好的性能,而且综合设计、制造各方面的因素,这无疑是最佳选择。
三代锐龙处理器内部有两颗(锐龙7 3700X及之下)或三颗(锐龙7 3800X及之上)芯片,其中一颗是I/O Die,基本相当于曾经的北桥芯片,集成内存控制器、IO Hub控制器(包括PCIe/USB/时钟发生器/安全等等),另外一颗或两颗是CPU Die,每一颗里边有两个CCX模块,各有4个物理核心和16MB三级缓存,合计每颗就是8个物理核心和32MB三级缓存。
同时,I/O Die以及每个CPU Die里都有IF总线端口实现高速互通,但注意两个CPU Die之间是没有直接联系的,比如经过IF总线和I/O Die来交流,这样的好处是CPU Die可以根据需要添加或减少,比如霄龙上就有多达八个,从而做到64核心,下一代线程撕裂者应该会有最多四个也就是32核心。
三代锐龙chiplet设计的详细架构图和电路走线图,尤其后者可以清晰地看到I/O Die与CPU Die之间的各种通道,而两个CPU Die之间并无直接关联。
得益于新工艺、新架构和chiplet设计,三代锐龙的每个CPU Die面积只有74平方毫米,制造起来易如反掌,同时里边的每个CCX模块面积仅31.3平方毫米,比二代锐龙缩小了足足47%,从而可以更轻松地做到更多核心。
AMD还宣称,Zen架构的多核扩展性极佳,性能几乎是随着核心数量的增加而线性提升,比如从6核心到12核心,性能就增加了98%!
由于Zen系列架构的设计和以往截然不同,除了硬件本身的优化,也非常需要操作系统、软件程序的支持和优化。
AMD也在持续与微软合作,最新发布的Windows 10 v1903五月更新版就有两项针对锐龙的重要功能,可有效提升性能。
一是拓扑感知,它会指示Windows 10进程计划程序优先在单个CCX(四核心)内生成和分配线程,直到用完这部分之后才会将线程迁移到第二个或者第三个CCX,这将有利于大部分游戏性能的提升。
二是UEFI CPPC2接口(协同电源和性能控制),是一种较新的时钟速度选择方法,对短时间和突发的工作负载特别有益,比如如网页渲染和应用程序启动。
三代锐龙依然是AM4接口,从2016年的第七代APU引入开始已经使用了四年,而且官方一直承诺至少会延续到2020年,目测对应Zen 3架构的第四代锐龙,而再往后由于要支持DDR5内存的缘故,不换就不行了。
从28nm到7nm甚至到7nm+,从4核心4线程到16核心32线程甚至更多,从DDR4-2400到DDR4-3200甚至更高,从12条PCIe 3.0到24条PCIe 4.0甚至更多,一种接口能用这么多年,也是相当的不易和良心。
三代锐龙继续兼容300/400系列主板(入门级的A320除外),不过最佳拍档当然是新的顶级X570,二者组合才能实现PCIe 4.0,以及更多扩展。
三代锐龙处理器本身支持24条PCIe 4.0,保留4条用于连接X570,其余20条中有16条固定给显卡,另外4条可以全部分给NVMe SSD,也可以2条给NVMe、2条做成SATA。
X570芯片组本身支持20条PCIe 4.0,同样保留4条用于连接三代锐龙,其余16条来自四个PHY物理层,可以灵活组合为1条x16、2条x8、4条x4、8条x2、16条x1,任由主板厂商灵活配置,并且分为两部分,其中8条为通用目的可连接网卡、声卡、扩展卡等设备,另外8条还可以配置为8个SATA 6Gbps。
USB接口方面,三代锐龙支持最多4个USB 3.1 10Gbps,X570支持最多8个USB 3.1、4个USB 2.0 480Mbps。
三代锐龙家族型号、定位、规格与价格,大家都比较熟悉了。
本次我们测试的一个是首发旗舰锐龙9 3900X,12核心24线程,对标8核心16线程的酷睿i9-9900K,3999元对4099元。
另一个是锐龙7 3700X,8核心16线程,对标8核心8线程的酷睿i7-9700K/9700F,价格2599元对3099元。
三、外观:坚持AM4接口多年不变
一块主板用三代处理器, AMD此种做法为DIY玩家所称道,毕竟大大节约了升级换代的成本。锐龙3000这一代处理器依然采用的AM4接口,一共有1331个针脚,可以兼容大部分AMD 300/400主板。
我们快科技收到了锐龙7 3700X和锐龙9 3900X这2款处理器,下面为大家展示。
首先是锐龙9 3900X:
锐龙 9 3900X作为准旗舰,包装盒也与众不同,抽取式设计,质地也更硬朗。
多年不变的AM4接口。
侧面照,可以看到PCB基板厚度很足。
接下来是锐龙7 3700X:
幽灵棱镜散热器
盒装的锐龙9 3900X与锐龙7 3700X都标配了幽灵棱镜散热器(WraithPrism),采用四条纯铜热管加大面积纯铜底座直触设计,并加入了独立的RGB光环。
四、测试平台:座驾为最强X570主板+最强RTX 2080 Ti显卡
微星MEG X570 GODLIKE超神板主板:
微星MEG X570 GODLIKE超神板主板是微星在AM4平台最为顶级的主板,采用EATX板型构造,8+8Pin供电接口,18相供电电路设计,可以为处理器提供超过千瓦的供电功率,不要说锐龙9 3900X,即便是未来16核的锐龙9 3950X也能轻松应对。
4条全速PCIe 4.0 x16插槽,以及2个M.2 22110以及1个M.2 2280接口。南桥散热片与CPU供电的散热片以热管连接,因此南桥风扇同样也可以辅助供电电路散热。实测在锐龙9 3900X超频满载到200W的时候,供电模块的温度也被压制在60度以内。
南桥风扇特写,支持智能启停,低负载时自动停转。
这个很像显卡的配件其实是M.2扩展卡,可以额外再接2块全速NVMe协议的M.2 SSD。由于锐龙3000系列处理器的PCIe通道数远远多于同级别的Intel酷睿处理器,插多个PCIe设备也能跑满速。
内存使用的是影驰HOF OC Lab DDR4-4000MHz 8GBx2套装。HOF OC Lab DDR4每一条内存都精选三星B-die优质颗粒,经过影驰超频实验室精心调试,拥有强劲且稳定的超频性能。
影驰HOF PRO PCIe 4.0 SSD 2TB。要测试X570的PCIe 4.0的性能,怎么能少得了这块顶级的SSD呢。
这块SSD采用了一条纯铜热管连接散热面的正面和背面,可以有效降低主控的温度。
五、理论性能测试:锐龙7 3700X多核战平i9-9900K
以下所有的测试项目都未开启PBO功能,也即是锐龙9 3900X的功耗会被限制在145W以内,而锐龙7 3700X的功耗会被限制在90W内。
1、CPU-Z v1.89
锐龙3900X单线程分数为534,多线程分数为8220。
锐龙7 3700X单线程分数为524,多线程分数为5582。
在CPU-Z v1.89的测试中,2款锐龙3000系列处理器的单线程性能与i9-9900K之间有6%左右的差距。但是多线程方面,频率更低的锐龙 7 3700X可以与i9-9900K打平;锐龙9 3900X则能领先i9-9900K 48%。
2、wPrime v2.10
在wPrime 32M单线程性能测试中,锐龙9 3900X耗时28.4秒;多线程跑完wPrime 1024M则用掉了57.5秒。
锐龙7 3700X单线程跑完wPrime 32M耗时28.4秒;使用多线程在wPrime 1024M则用掉了83.6秒。
以往在wPrime v2.1的测试中,锐龙2000系列处理的单线程性能表现并不好,而锐龙3000系列处理器的单线程性能却可以媲美Intel的顶级处理器。
在wPrime 32M单线程性能测试中,锐龙7 3700X相比上代的锐龙7 2700X足足少用了6.5秒的时间,提升幅度将近20%。
而在wPrime 1024M多线程测试中,频率更低的锐龙7 3700X再次与i9-9900K战平,锐龙9 3900X相比i9-9900K则少用了26.2秒。
3、7-zip
锐龙9 3900X的多线程成绩为106288MIPS,单线程则为7188MIPS。
锐龙7 3700X的多线程成绩为74449MIPS,单线程则为7023MIPS。
在单线程方面,2颗锐龙3000系列的处理器与i9-9900K之间仍然有10%左右的差距。
不过到了多线程,新锐龙彻底翻身,锐龙73700X可以领先i9-9900K将近5%,而锐龙9 3900X则能领先i9-9900K将近50%。
4、AIDA64 GPGPU
AIDA64 GPGPU测试可以较为准确的反映CPU的单精度、双精度浮点运算能力。这是临时增加的测试项目,由于时间有限,就仅仅对比了锐龙9 3900X与锐龙7 2700X的性能表现。
锐龙9 3900X的单精度浮点性能达到了1596GFLOPS(1.7万亿FLOPS),双精度浮点性能则为796GFLOPS。
锐龙72700X的单精度浮点性能为512GFLOPS,双精度浮点性能则为256 GFLOPS。
很明显的差异,虽然锐龙9 3900X的核心数只比锐龙7 2700X多了50%,但是浮点性能却提升了3倍有余。
另外说一点,锐龙9 3900X的浮点性能已经与32核的ThreadRipper 2990WX相差无几。
5、3DMark
在3DMark Fire Strike Extreme中,锐龙9 3900X的物理分数为29239。
锐龙7 3700X的物理分数为24316。
锐龙7 3700X的物理分数基本与i9-9900K持平。
六、生产力工具效能测试:Zen 2构架远远优于酷睿构架
1、CineBench R15
锐龙9 3900X单线程分数为202cb,多线程成绩则为3099cb。
锐龙7 3700X单线程分数为200cb,多线程则为2052cb。
在单线程性能方面,锐龙3000远远强于前代,和i9-9900K相比也没多少差距。
而在多线程性能方面,锐龙7 3700X则略微领先i9-9900K,锐龙9 3900X是毫无疑问的性能王者。
2、CineBench R20
锐龙9 3900X单线程分数为511cb,多线程成绩则为7118cb。
锐龙7 3700X单线程分数为505cb,多线程则为4804cb。
单线程方面,锐龙3000同样有非常大的进步,和i9-9900K之间的差距已经微乎其微。
多线程方面,锐龙 7 3700X罕见的落后于i9-9900K,虽然仅仅是差了121分。
3、POV-Ray
锐龙9 3900X的多线程成绩为6100PPS,单线程则为478PPS。
锐龙7 3700X的多线程成绩为4296PPS,单线程则为464PPS。
在单线程方面,锐龙3000系列与i9-9900K之间存在着8%的差距,但是和前代的锐龙7 2700X相比,提升了将近20%。
至于多线程性能,锐龙7 3700X成绩与i9-9900K相当。
4、X264 FHD Benchmark
X264 FHD Benchmark最多只能支持到16个线程,不过好在可以多开,我们同时开启2个程序并行测试,取总和作为测试成绩。
锐龙9 3900X的成绩为95.5FPS。
锐龙7 3700X的成绩为56.7FPS。
锐龙7 3700X惜败给了i9-9900K,差距为4帧,不过锐龙9 3900X表现生猛,达到了95.5FPS,几乎是锐龙7 2700X的二倍。
5、X265 FHD Benchmark
X264 FHD Benchmark同样也是最多只能支持到16个线程,我们开启2个程序同时进行编码测试。(现在主流的X265视频压缩制作软件都支持多开并行运行处理,因此我们的测试方式有一定的参考价值)。
锐龙9 3900X的成绩为98FPS。
锐龙7 3700X的成绩为64.4FPS。
在X265转码方面,锐龙9 3900X几乎是锐龙7 2700X 2.5倍的性能。
一般来说压制一部X265编码的4K电影使用锐龙7 2700X或者i9-9900K需要1~2天的时间,装备锐龙9 3900X可以大大节省用户的时间成本。
我们将所有理论测试的成绩汇总如下:
1)、单核性能:
锐龙3000系列处理器相比前代有了相当大的提升,锐龙7 3700X相比锐龙7 2700X提升了16%,而锐龙9 3900X的提升幅度更是达到了18%。
和Intel主流平台最强的i9-9900K相比,锐龙7 3700X还有的8%的差距,而锐龙9 3900X只有不到6%的性能差距。
2)、多核性能:
到了多核性能方面,锐龙3000系列处理器则是有了天翻地覆的变化。
首先和前代的锐龙7 2700X相比,锐龙7 3700X的全核频率提升了5%(4175MHz vs 3975MHz),但是性能却提升了23%之多,也就是说IPC足足提高了18%。
和Intel i9-9900K相比,锐龙7 3700X的多核性能还能领先1%,但是要知道的是,前者的全核频率可是高达4700MHz,而后者只有4175MHz。锐龙7 3700X以13%的频率差距,却达到了对手同样的性能。
在IPC方面Zen 2构架彻底超越了Intel的引以为傲的酷睿构架。
七、磁盘性能测试:磁盘读写速度飙到5GB/s
PCI Express发展到3.0之后,到现在已经过去了将近10年的时间,这个标准其实早已不能满足玩家对于速度的需求,特别是搭载多个PCIe通道的设备时,更是如此。
PCIe版本和传输速度:
PCIe 1.0 :250MB/s
PCIe 2.0 :500MB/s
PCIe 3.0: 984.6MB/s
PCIe 4.0 :1.969GB/s
显卡若采用全尺寸的PCIe x16接口,3.0版本可以达到接近16GB/s的带宽,而4.0则能达到32GB/s。
现在大部分NVMe协议的M.2 SSD都是PCIe x4通道,3.0版本最高可以达到4GB/s(实际上大部分只能达到3.2GB/s);而4.0版本则可以达到8GB/s的理论传输带宽。
锐龙3000+X570的组合,PCIe 4.0是一个亮点,我们使用了影驰最新推出的HOF PRO PCIe 4.0 SSD 2TB来测试磁盘性能。
以上是在锐龙9 3900X+X570主板上的测试成绩。
在AS SSD中,最高顺序读写速率分别超过了4200MB/s、3900MB/s。
在CrystalDiskMark中,HOF PRO PCIe 4.0 SSD 2TB最大读取速度可以达到4900MB/s,写入速度可以达到4262MB/s,远远超越了目前所有的PCIe 3.0 SSD。
要注意的是,我们在微星MEG X570 GODLIKE超神板主板上插满了3个M.2 SSD,磁盘的性能并没有任何的损失。
这是在锐龙7 2700X+X570主板上的测试成绩。
可以看到,在搭配2代锐龙之后,HOF PRO PCIe 4.0 SSD 2TB被降级到了PCIe3.0,在读写速度上有比较大的损失。要体验PCIe 4.0的极速只能使用锐龙9 3900X+X570的搭配组合。
这是在华硕MXH+i9-9900K上的测试成绩,MXH主板在接入2个NVMe SSD之后,第二个M.2插槽会降到PCIe 3.0x2,最高读写速度只能达到1700MB/s。如果是PCIe 4.0x2,读写速度则能超越3400MB/s。
八、内存性能测试:最佳内存频率是3600MHz
内存性能一直是AMD的心结所在,一代锐龙在发布时连支持双通道2400MHz都很困难。后来经过AMD不断的优化,到了二代锐龙,已经可以支持DDR4 3466MHz,但是相比Intel还是有不小的差距。
到了3代锐龙,按照AMD的说法,最高可以支持5000MHz+的高频内存条,下面让我们用实际测试要验证一下。
我们测试平台所使用的内存是影驰HOF OC Lab DDR4-4000MHz 8GBx2套装。
首先是2400MHz,在这个频率上,读取、写入以及复制速度分别为36GB/s、35GB/s、37GB/s。三级缓存的读写速度则接近1TB/s,缓存延迟为9.7ns,延迟相比前代降低了一半。另外还需要关注的是此时Infinity Fabric总线也就是传统北桥频率为1200MHz,与内存频率为1:1关系。
超频到3200MHz之后,读取、写入以及复制速度分别为48GB/s、47GB/s以及50GB/s,内存延迟为74.9ns,三级缓存的延迟为10ns,北桥频率1600MHz。
超频到了3600MHz之后,读取、写入以及复制速度分别为55GB/s、53GB/s以及55GB/s,内存延迟为67.6ns,三级缓存的延迟为9.9ns,北桥频率1800MHz。
超频到3733MHz之后,内存的性能并没有提高。读取、写入以及复制速度分别为55GB/s、53.7GB/s以及55GB/s,内存延迟为81.1ns,三级缓存的延迟为10nmns,北桥频率933MHz。
这个3733MHz这个频率上,内存的延迟反而变高了,从3600MHz的67.6ns增加到了81.1ns。主要的原因是此时北桥频率不再与内存频率保持1:1的比例,而且变更为1:2,也就是北桥频率只有内存频率的1/2,这样的好处就是内存频率不再受北桥频率的约束,可以让X570主板可以很轻松的支持高频内存条。但是副作用也很明显,过低的北桥频率导致了更高的内存延迟,对系统的性能也有一定的影响。
最后我们直接在XMP的默认时序下(19-25-25-25)将内存频率超频至4400MHz,内存的读取、写入以及复制速度分别为56GB/s、56GB/s以及62GB/s,内存延迟依旧较高,达到了78.1ns,北桥频率1100MHz,与内存频率保持1:2的关系。
我们将测试的结果汇总如下:
从上表可以看出,锐龙3000系列处理器的确可以很轻易的上到更高的内存频率。但在内存频率超过3600MHz之后,北桥将不再保持与内存保持1:1的同步频率,而是变成1:2的异步频率。北桥频率的大幅度降低,也导致了内存延迟变高,实际游戏的帧率表现反而更低了。
因此对于Zen 2构架的锐龙3000系列处理器来说,3600MHz是最合适的频率,这个频率拥有最低的内存延迟,最高的游戏性能。
九、游戏性能测试:终于追上 几乎无差距
第一、二代的锐龙处理器虽然拥有强悍的理论性能,但是由于单核性能的弱势以及一些其他的原因,导致其游戏表现不尽如人意。
那么IPC得到了大幅度提升的锐龙3000系列处理器能不能实现彻底翻盘呢?
为了尽可能消除显卡瓶颈,我们使用了一块索泰RTX 2080 Ti玩家力量至尊PGF显卡,这是目前的顶级非公RTX 2080 Ti之一(感谢索泰提供测试显卡)。
绝地求生
在锐龙3000系列处理器诞生之前,Intel的处理器在《绝地求生》有着最好的帧率表现,但是现在不一样了。
锐龙9 3900X在1080P分辨率下达成了235FPS的帧率,比i9-9900K还要快了9帧;锐龙7 3700X的表现则与i9-9900K相同,略强于i7-8086K。
APEX 英雄
《Apex英雄》没有提供测试程序,为了减少测试时变量的干扰,我们选取在训练场进行帧数测试,测试时手动调整为最高画质。我们在训练场录得的帧率与实战时的帧率较为接近,因此有一定的参考价值。
这款游戏对显卡的要求大过处理器,5款处理器的结果没有太大区别,不过总体来说,Intel的这边略占优势,可以领先锐龙处理器10帧的样子。
GTA V
这是一款传统的A黑游戏,AMD处理器在《GTA 5》中的表现一向不太好。
就帧率来说,2款锐龙3000处理器相比前代的锐龙7 2700X有了巨大的进步,甚至可以媲美i7-8086K,不过与i9-9900K之间还是有13帧的差距。
刺客信条:奥德赛
在《刺客信条:奥德赛》中,锐龙9 3900X的帧率表现超越了i7-8086K,与i9-9900K之间有2帧的差距;锐龙7 3700X相比锐龙7 2700X则提高了7帧。
孤岛惊魂5
《孤岛惊魂5》一直都是Intel的优势项目,锐龙2 2700X与i9-9900K之间有着巨大的性能鸿沟,虽然三代锐龙已经有了巨大的提升,但仍不足以弥补差距。
锐龙9 3900X的帧率为135FPS,与i7-8086K之间有12帧的差距,与i9-9900K则相差了23帧。但是与锐龙 2700X相比,则有这19帧的提升。
古墓丽影:暗影
索泰RTX 2080 Ti玩家力量至尊PGF显卡太强了,在《古墓丽影:暗影》中1080P分辨率下,以上五款处理器都不同程度上的存在一些瓶颈,无法完全发挥这块显卡的全部性能。
锐龙9 3900X的帧率为141FPS,表现与i7-8086K完全相同,比i9-9900K则少了11帧。
鬼泣5
《鬼泣5》这款游戏不太需求处理器性能,拿它来测试CPU其实是不太合适。
以上5款处理器的表现并没有太大差异,锐龙9 3900X稍强一些。
奇点灰烬
很多人认为《奇点灰烬》是AMD的专用游戏,其实它只是对多核的支持更好一些,但是也只能支持到6核。
除了锐龙7 2700X之外,其他4款处理器的性能差距不大,锐龙9 3900X表现更好。
文明6
《文明6》是一款特别需求处理器性能的游戏,同时对多核的支持也非常到位。
锐龙9 3900X在1080P分辨率下跑出了90FPS的帧率,比i9-9900K快了8帧,比i7-8086K则快了16帧。
巫师3
《巫师3》是一款需求显卡的游戏,即便是在1080P分辨率下,他都能让索泰RTX 2080 Ti玩家力量至尊PGF显卡的占用率达到100%,因此5款处理器同样也没有测出太多的差别。
在这5款处理器中,锐龙9 3900X的帧率更加稳定一些,帧率表现也更好。
为了方便大家对比,我们将游戏的测试结果汇总如下:
首先说明,测试处理器的真实游戏性能必须使用顶级显卡以消除显卡的瓶颈,不同档次的显卡测试出来的结果会有区别,比如《古墓丽影:暗影》,如果使用GTX 1080级别的显卡,以上5款处理器都只能跑出90FPS的帧率,测试的结果并没有多大的意义。
当然,测试项目的选择也会影响整体的结果,《绝地求生》、《GTA V》以及《孤岛惊魂5》这三款游戏可以称作是A黑游戏,大部分媒体在测试AMD处理器游戏性能时会尽量回避这3款游戏。
好了,让我们来看结果。
锐龙3000系列处理器的表现确实让人吃惊,锐龙9 3900X的游戏性能已经超越了酷睿i7-8086K,与i9-9900K之间仅仅有2%的差距;而锐龙7 3700X的表现则能持平i7-8086K。
在热门游戏《绝地求生》中,最新的锐龙处理器的表现甚至要比Intel最强的i9-9900K更好。
十、超频测试:锐龙9 3900X可以稳定4.4GHz
1、全核频率
在超频之前,必须要知道锐龙9 3900X与锐龙7 3700X在默频下的全核最高频率可以达到多少,这样才能知道最终的超频幅度是多少。Intel的处理器可以通过各种软件查看全核频率,而AMD不仅从来不公布锐龙处理器的全核频率,也无法直接在软件中查看到。
在这里我们选择运行一些压力相对较小的项目来检测处理器的全核最高频率,测试项目我们选择的是wPrime并跑满全部线程。
在未开启PBO的情况下,锐龙7 3700X的功耗上限为90W,在wPrime 1024M多线程测试中,处理器的最大的功耗为80.4W,离功耗墙还有一段距离,此时处理器的频率为4150~4175MHz之间徘徊。由此判断锐龙7 3700X在默频下的全核最高频率为4.175GHz。
接下来是锐龙9 3900X:
很幸运,在wPrime 1024M多线程测试中,锐龙9 3900X的最大功耗为135W,没有触碰到功耗墙(未开启PBO时,功耗上限145W)。此时处理器的频率在4075MHz~4099MHz之间徘徊,由此判断锐龙9 3900X在默频下的全核最高频率为4.075GHz(或者4.1GHz)。
2、Precision Boost Overdrive
Precision Boost Overdrive精确增压超频(简称PBO),这是AMD为新手玩家而准备的超频功能,作用类似于NVIDIA的Boost 4.0。它能在安全的电压、安全的温度之内尽可能的增加处理器功耗,突破功耗墙限制,让处理器运行在更高的频率上。
PBO功能在BIOS中默认是关闭的,需要玩家手动打开。
锐龙7 3700X未开启PBO时,功耗上限为90W,而锐龙9 3900X的功耗上限则为145W。
下面让我们来看看开启PBO之后能给锐龙9 3900X带来多大的提升,测试项目为CineBench R15。
在未开启PBO时,测试CineBench R15 时,锐龙9 3900X已经触碰到了功耗墙,此时处理器功耗为145W,核心频率在3.9GHz~3.925GHz之间徘徊。
在开启PBO之后,锐龙9 3900X可以跑满4.075GHz的全核频率,功耗也相应的上升到了177W。
开启PBO后CineBench R15最后的得分为3204分,比未开启时的3099分多了105分,提升幅度为3%。
3、超频测试
由于时间所限,超频测试并没有做的很详细。
在MEG X570 GODLIKE超神板主板的BIOS中设置3级防掉压,我们手上这块锐龙9 3900X可以在1.41V的电压下稳定的在4.4GHz的频率上。但是此时运行CineBench R15时,处理器核心功耗已经达到了230W,温度也高达93度。
最终CineBench R15的得分为3356cb,比默频的3099提高了257分,提升幅度接近9%。
另外有一点需要注意,我们所使用的散热器为玩家风暴船长240Pro水冷散热器,在R15的测试中,处理器的温度已经高达93度,锐龙9 3900X的温度墙为95度,且无法修改。想要在4.4GHz下稳定运行,必须使用更高加高端的散热器,否者触碰温度墙后,主机会瞬间重启。
另外一款锐龙7 3700X的超频表现有点辣眼睛。
测试锐龙7 3700X时,我们使用的散热器为猫头鹰U12S风冷散热器。
经过多次尝试,发现锐龙7 3700X的超频上限竟然只能到4.3GHz,即便将电压调到1.41V也没有改善。
要知道锐龙7 3700X默认全核就有4.175GHz,结果却只能超频到4.3GHz,100MHz的超频幅度实在不够看。
十一、温度与功耗测试:锐龙7 3700X烤机功耗仅有i9-9900K一半
1、温度测试
使用AIDA64 FPU程序测试默频时2款锐龙处理器的温度表现,测试使用猫头鹰U12S风冷散热器,硅脂为Arctic MX-4,室温27度。
运行AIDA64 FPU 5分钟之后,处理器的温度为73度,运行频率为4.0GHz,核心功耗90W。微星MEG X570 GODLIKE超神板的供电区域MOSFET温度为46度。
接下来是锐龙9 3900X:
测试时打开了PBO,于是测试时处理器的功耗便达到了161W,核心温度为95度,运行你频率3.9GHz。
对于锐龙9 3900X而言,想要在高功耗下运行,最好以一款240mm或者更高规格的水冷散热器。
2、功耗测试:
分别测试使用待机、拷机的功耗。测试使用的电源为酷冷至尊V850铂金牌电源。以下数据是平台整机功耗。
测试时我们在X570主板上将内存频率超频到了3600MHz,导致待机功耗有些偏高。
待机时锐龙平台的功耗整体上比酷睿平台要高15W左右。
但是在烤机时,锐龙7 3700X的功耗表现令人惊喜,在性能与i9-9900K相当的情况下,整机功耗竟然只有对手的一半。而锐龙9 3900X的烤机功耗虽然达到了250W,但依然不及i9-9900K。
十二、总结:Intel还有机会吗?
在大多数人固有思维中,锐龙处理器的长处是就是暴力堆核心数量,以数量打倒对手,但在单核性能以及游戏帧率方面却无力对抗对手。
锐龙3000系列处理器给了我们足够的惊喜!
经过重新设计的Zen 2构架在IPC方面相比前代至少 有15~18%的提升,虽然在频率方面仍然不及对手,但是单核性能已经与Intel最强的i9-9900K相差不多。而在多核性能方面,新的锐龙处理器展现了强大的性能优势,锐龙7 3700X即便频率比i9-9900K低了500MHz,但多核性能还能与对手持平。
锐龙9 3900X更加不用说了,多核性能1.5倍于Intel主流平台最强的i9-9900K处理器。
对于时间就是金钱的用户来说,锐龙9 3900X强大的性能可以大大提高生产力相关的运算效率。锐龙9 3900X在压制X265编码的视频时,性能是锐龙7 2700X的2.5倍,i9-9900K的1.7倍。
在游戏性能方面,AMD也终于扬眉吐气!锐龙9 3900X在主流游戏中的帧率表现超越了i7-8086K,与i9-9900K之间仅有2%的差距;而锐龙7 3700X则能打平i7-8086K。如果AMD能够改进锐龙处理器在《孤岛惊魂5》中的帧率表现,那么锐龙9 3900X的游戏性能就能一举超越对手最强的i9-9900K(至少也能持平吧)。
另外请记住,锐龙9 3900X的运行频率是大大低于i9-9900K的,能有这样的表现,也不得不叹服于Zen 2构架的强大!
锐龙3000系列处理器的超频表现很谜!核心数更少的锐龙7 3700X超频能力竟然不如锐龙9 3900X。猜测锐龙7 3700X应该是体制较差的一批,好体质的8核Zen 2处理器可能被做成了锐龙7 3800X,只是暂时还未推向市场。
锐龙9 3900X的超频表现还算说得过去,在1.41V的电压下可以达到4.4GHz的稳定运行频率,能比默频高出了8~10%的性能。不过想给锐龙9 3900X超频的玩家,需要准备一款强力的散热器来伺候。
在7nm制程工艺的加持下,锐龙9 3900X/7 3700X的功耗表现也相当的亮眼!锐龙7 3700X的烤机功耗竟然只有相同性能的i9-9900K的一半;即便是12核心的锐龙9 3900X,其烤机功耗也比i9-9900K更低!
14nm Intel挤牙膏玩了这么多年,终于被AMD完全超越了,功耗、价格、性能方面都处于全面的劣势!如果Intel不尽快推出10nm的桌面处理器,将很难对抗如此强大的锐龙3000处理器。
给Intel加油吧!
三代锐龙京东购买链接:
PC:https://pro.jd.com/mall/active/2WEJdLjKNHBQLwFskwjqCqrv6xyM/index.html
APP:https://pro.m.jd.com/mall/active/2WEJdLjKNHBQLwFskwjqCqrv6xyM/index.html
三代锐龙天猫购买链接:
PC: http://amddnyj.tmall.com/p/rd355380.htm
APP:https://mo.m.tmall.com/page/2488501?shop_id=360283198
首发期间,锐龙7 3700X、锐龙5 3600X在京东、天猫分别有180元、90元的优惠,实际到手价分别为2419元、1909元。