AMD锐龙5000系列CPU发布之后,大家就发现了一个比较有趣的现象:通过一定的系统设置,可以让处理器的三级缓存速度翻倍。
AMD最近又发布锐龙5000H系列笔记本处理器,可以看到一些测试中三级缓存的速度还是比较低的,所以相应地就产生了诸多的讨论。
那么,AMD锐龙的三级缓存到底发生了什么事?今天就为大家带来AMD 三级缓存的测试报告。
与平时的测试不同,这次的测试只有一个模糊的目标这次测试的数据量十分庞大,大约有270种不同的设置组合。
整个文章的测试目的其实并非在挖掘我手上这几颗CPU的极限体质,而是希望可以更多的厘清这些选项互相之间的关系,为大家的超频扫除一些障碍。
也是由于整个测试其实一直处在一边找资料一边与一些大佬交流讨论的状态,所以相比最终的结论过程会因为枚举式的测试有些冗余。
最后的结果我会提炼成折线图,尽可能简练的呈现给大家。并提供一个简单易读的总结。
本文目录:
- 锐龙5000系列的四分之三——测试平台介绍
- 从超频到翻车——AMD PBO小百科
- 看表必读——测试项目介绍
- 流言终结者——快速排查测试
- 枚举式测试——PBO三选项测试
- 甜党还是咸党——AMD PBO组合对比测试
- 降压超频真香——AMD PBO超频建议
测试平台介绍:
本次的测试重点是在CPU上,这次分别测试了锐龙9 5950X、锐龙9 5900X、锐龙7 5800X。R5 5600X实在借不到所以只测了这三款。
CPU现在无论Intel或AMD,超频时都会在电压电流过载前先遇到温度问题,所以散热器成了比较关键的环节,这里用的是 ROG STRIX LC 飞龙 II 280 ARGB。
ROG飞龙二代官方宣称改进了冷头水道,希望是可以帮助本次测试挖掘出更多东西。
底座还是可以看到细密的纹路,貌似一体式水冷厂商都不太爱搞镜面。
相对而言,AMD CPU其实绝对满载功耗会明显低于Intel,所以冷排规模倒是没必要强行追求极限,280冷排应对我们这次的测试绰绰有余。
风扇规格是12V 0.6A,也就是说ROG给的这个风扇理论上可以很暴力。
硅脂是乔思伯的CTG-2。
测试项目介绍:
为了尽可能压缩最终呈现的图表数量,这边先提供数据图表具体项目的对照表格,便于后续阅读。
AMD PBO小百科:
这边针对还不是特别了解AMD超频机制的小伙伴来做一下科普。PBO是Precision Boost Overdrive的简称,中文翻译为:精确增压超频。这是AMD为新手玩家而准备的超频功能,作用类似于NVIDIA的Boost 4.0。
- PBO一般认为是包含三个选项:PPT、TDC和EDC。但是PBO实际还会受到Tj MAX的限制也应该一并纳入考虑。
- PPT:Package Power Tracing,追踪CPU插座能给处理器提供的功率(W)。
- TDC:Thermal Design Current,因温度限制能由供电模块提供的电流(A)。
- EDC:Electrical Design Current,因电气限制能由供电模块提供的电流(A)。
- Tj MAX:Platform Thermal Throttle Limit,过热保护温度,对CPU的运行温度做出限制。Tj MAX默认下是设置为CPU Package 90度,只能向下调节不能向上调节,所以直接无视这个选项。以上四项其实也是AMD DPTC的核心内容。
快速排查测试:
测试按照主板BIOS内的设置EDC分为EDC-默认和EDC-400A两组。每组分别测试目前主流的三种微码和相应的内存组合,合计18种组合方式。
- 这个环节主要测试之前看到有很多关于三级缓存的各种说法,快速验证各种流言的真实性。
- 主板BIOS升级微码到1.2.0.0导致L3降速:
从测试来看,三个版本微码下L3的速度大致相仿,与主板微码没有明显的关联。
- 内存频率设置导致L3降速:
从测试来看,内存频率设置为2133、3200、4266、4600,L3的速度大致相仿。内存时序设置为C14、C15、C20、C22,L3的速度大致相仿,所以与内存频率或时序设置没有明显的关联。
- CPU FLCK分频导致L3降速:
从测试来看,CPU FLCK不分频的内存2133、3200与L3速度与FLCK分频的内存4266、4600CPU FLCK相比,L3的速度大致相仿。CPU FLCK分频没有明显的关联。
- 主板BIOS下调整EDC设置可提升L3速度:
从测试来看,EDC在主板BIOS中固定为400确实大幅提升了L3的运行速度,但是R20跑分显示在这个设置下,CPU性能并没有提升,反而还出现了下滑。
主板BIOS下手动设置PPT-395W、TDC-200A、EDC-400A与PPT-600W、TDC-600A、EDC-600A来对比,无脑放大到最后L3速度和R20跑分都出现下滑。CPU功耗也从145W下滑到115W,还是比较奇怪的。
- 如果用主板自带的PBO来测试,可以看到L3速度虽然不高,但是R20的跑分显著提升。
- 如果按照PBO设置在BIOS下手动固定设置,可以看到L3速度会大幅下降,但是R20的跑分与默认大致接近。
在主板BIOS下手动设置PBO,PPT、TDC、EDC是可以设置并显示为任意值。
而当使用RYZEN MASTER一类的软件在系统下进行设置,最高只能设置到PPT-395W、TDC-255A、EDC-200A。
在测试过程中技嘉的1.2.0.0版本BIOS也更新了出来,这边也做了一些验证测试。可以看到RYZEN MASTER下的最大设置值为PPT-900W、TDC-480A、EDC-600A。但是PBO ENABLE参数为PPT-900W、TDC-480A、EDC-215A。用RYZEN MASTER这类软件在WINDOWS下手动固定PBO参数的情况则并不相同。相当于华硕主板在BIOS中手动固定PBO参数,实际跑分只是改善三级缓存速度,对R20跑分同样起反效果。
按照之前微星林大视频《板廠沒有說的秘密~ZEN3上市後兩大謎團之L3緩存減半上篇》来看,微星主板的情况应该与华硕类似。也就是在WINDOWS下通过RYZEN MASTER一类的软件调整时仍然会保留节能策略。
我们从另一个针对笔记本的软件RYZEN Controller来观察,可以看到在这个软件中就能看到更多的选项。但是RYZEN Controller并不支持AMD锐龙5000系列桌面级处理器,无法拿来测试使用。
初步结论:
这里我们先有一些初步的结论。
- L3的速度受到主板BIOS内部的一些参数制约,但是目前来看大部分主板都选择隐藏相关参数。根据现有的资料来看,主板上至少会有“L3 QoS”这个隐藏选项。
- 如果我们要简单实现L3速度的调整,可以通过调整EDC的值来实现。
- 但是不同主板的策略会有明显的不同,例如华硕在PBO AUTO或ENABLE时“L3 QoS”等节能设置依然会比较强力的实行限制,但是技嘉会选择大幅放开或关闭相关的限制。当华硕主板在BIOS下手动固定PBO参数时,“L3 QoS”等节能设置也会被大幅放开或关闭。
- 在节能选项放开的情况下,对PBO参数按照默认去设置,L3的速度反而大幅下降,可以进而猜测“L3 QoS”只是其中一个部分,实际的选项会更多更复杂。
- 当CPU设置非常不合理时,CPU的频率可能会被强制限制在0.5GHz。正常进系统不会有问题,但是性能极低。
- RYZEN MASTER的调节幅度会受到很大的限制,且放开幅度会取决于不同主板厂商的选择。在C8DH主板下限制为PPT-395W、TDC-255A、EDC-200A。
- 根据这个环节的测试结论,C8DH在WINDOWS下进行调节带来的CPU性能、功耗和频率变化幅度更大,也就让测试结果更有可观察性。接下来的测试项目会围绕C8DH在WINDOWS下调节PBO参数来展开。
- 为了能够突破RYZEN MASTER的参数限制,这边采用了相同软件接口的其他软件来设置参数。不过在RYZEN MASTER下显示最大值依然是PPT-395W、TDC-255A、EDC-200A。这里还是会往上去设置,看会不会有额外的效果。
- 按照最开始的初步测试,对比华硕的参数PPT-395W、TDC-255A、EDC-200A与微星的参数PPT-500W、TDC-130A、EDC-215A。微星的参数效果似乎更好一点,所以下面的测试先是采用了PPT-500W、TDC-130A、EDC-215A作为基准之一。
PBO三选项单项测试:
接下来我们就以枚举的方式来对PBO的三个选项进行测试,并绘制出相应的性能曲线。这个部分主要用到的测试CPU还是锐龙9 5900X,依照PPT、TDC、EDC,每个参数各两套设置。
第一套参数是依照主板默认的设置PPT-142W、TDC-95A、EDC-200A,第二套设置PPT-500W、TDC-130A、EDC-215A(模仿微星的PBO)。测试时根据需要每次固定其中两个,变化其中一个。由于要枚举式的撒网覆盖,这个环节的测试项目会相对简单,以AIDA64的L3速度和R20 xCPU两个为主。
在这里要强调一个概念,就是以下的PBO参数设置均会被Tj MAX温度墙所限制,且这个墙的限制是最高级的。只有在调整倍频的手动超频模式下才能解开。只调节PBO的话是无法逾越的。
PPT参数测试:
如前文所述,PPT为控制CPU整体的功耗水平,在PBO中的权限排名第一,但是会被温度墙限制。也就是当不触及温度墙时,CPU触发到PPT的限制都会向下降低功耗。从目前测试的情况来看华硕主板的fPPT与sPPT选项似乎是不起作用的,顶到PPT限制之后就会立即维持在相应的设置上。
第一组测试变量为PPT 0.001W-500W,固定TDC与EDC为默认值。
- 可以看到一个很有意思的现象L3速度的顶点并没有如预想的一样出现在PPT设置较高的位置,相反是出现在PPT-100W的时候。
- 超出默认值之后,L3速度反而是一路下滑并在PPT-160W时进入比较稳定的状态。
- R20 xCPU的分数在达到默认的PPT-142W时也基本接近顶点,后续基本持平。
第二个测试变量为PPT 100W-600W,固定TDC-130A与EDC-215A。
- 整体上与上一个表格的情况接近,L3速度整体呈先下降后持平的状态。稳定后的速度与BIOS默认设置较为接近。
- R20 xCPU的分数在PPT-200W时达到峰值,后续大致也是持平。但是PPT-550W开始似乎又有一点提升,这个提升比较奇怪,但是限于测试庞大没有更多验证,且CPU实际不可能跑到这个功耗,建议先忽略。前后对比分数从80XX提升到83XX。
TDC参数测试:
TDC目前来看是最有意思的一个选项,虽然官方的说法是“根据温度设置的电流墙”。但实际上的作用反而在认知上显得很模糊,从测试结果上看TDC应该跟CPU的核心供电有很强的关联度。而且当CPU真的撞到温度墙时,TDC设置较高也不会帮助到突破温度墙。所以TDC在整个测试中被认为是CORE的电压限制解释起来显得更为自恰。
第一组测试变量为TDC 0.001A-200A,固定PPT与EDC为默认值。整体曲线与PPT有些类似,但是也有明显的不同。
- 在图表上L3速度上升十分迅速,在TDC大于20A之后L3速度几乎就完全恢复,甚至很快达到了峰值。出现峰值的TDC 40A-50A位置速度甚至高于默认TDC-95A下的速度。
- R20 xCPU的分数则是比较稳步的上升,在默认的TDC-95A达到拐点。但是当TDC进一步提升到150A时在真正达到峰值,之后就维持比较平稳的水平。
第二组测试变量为TDC 90A-350A,固定PPT-500W与EDC-215A。整体曲线与PPT的曲线相当类似。
- L3速度也是呈先下降后稳定。稳定后的L3速度与BIOS默认设置下较为接近。
- R20 xCPU的分数在TDC-120A时达到拐点,后续大致持平。前后对比,分数从82XX提升到84XX。
EDC参数设置:
EDC是针对整个CPU打包的电流限制选项,也是这次被猜测可以解决L3速度的神奇选项。从测试结果来看EDC与UNCORE的关联度更高,虽然不能简单粗暴的划上等号,但是EDC电流是否充足会很大程度上影响到L3速度的发挥。同时还有一个很关键的结论当EDC>TDC的前提下,即使EDC很接近TDC,对R20 CPU的分数也不会有负面影响。甚至在低EDC压制UNCORE功耗的情况下,R20 CPU的分数还会更高。当然此时L3速度就会显得颇为难看。
第一组测试变量为EDC 0.001A-500A,固定PPT与TDC为默认值。
- EDC的曲线与PPT和TDC有很大的差异。L3速度会很明显的受到EDC收紧的压制,大致在默认设置的EDC-140A接近峰值,之后基本持平。
- R20 xCPU的分数提升速度很快,在EDC-100A时就会达到峰值,EDC继续增加反而会小幅降低跑分,但达到EDC-140A之后也大致持平。
第二组测试变量为EDC 100A-500A,固定PPT-500W与TDC-130A。曲线与上一个EDC曲线较为类似。
- L3速度的提升速度稍慢于上一个测试,在EDC-150A达到比较么,明显的拐点,之后基本持平。
- R20 xCPU的分数在EDC-125A就大致达到拐点,之后基本持平。分数也可以维持在84XX。
做一下简单的小结:
- AMD CPU受到最大的限制还是在核心温度,当核心温度达到温度墙时,无论PBO如何设置都要受到这条的限制。
- PTT是PBO三个参数中权限最高的,当CPU能跑到超过PPT预设的功耗就会自动限制整体的功耗。
- TDC主要会影响CPU CORE功耗,表征就是TDC的变化对R20 xCPU的影响是最明显的。
- EDC主要会影响CPU UNCORE功耗,表征就是会明显改变L3速度的大小。
AMD PBO组合对比测试:
有了上述的测试,我们就可以进行更复杂的组合和测试项目覆盖面更复杂的测试。为了控制测试规模,我们就不再以线性的方式来枚举,而是直接来抓一些典型的数据。
测试项目上会进一步扩大,除了包含之前的AIDA64 L3速度、R20 xCPU分数外,还会增加CPU-Z 1CPU分数、CPU-Z xCPU分数、刺客信条:英灵殿 1080P极高 1% LOW FPS、R20 xCPU下的CPU 频率、R20 xCPU下的CPU 功耗和R20 xCPU下的CPU 电压。
另外会用比较简单的方式来统计R20 xCPU分数除以CPU Package功耗、CPU EDC设置值乘以CPU电压、CPU功耗减去CPU EDC设置值乘以CPU电压。
需要注意的是由于CPU频率的测定是基于包含AVX指令集使用的R20,主要是为了便于把CPU拉到较大的负载观察极限差异,不能代表CPU在一般nonAVX下实际能达到的频率值。
这个部分的测试主要分为四个部分:
- 验证上一环节测试,测试默认状态、对PBO三个参数只提升其中一个选项。合计4个测试组合。
- 提升PBO三个参数中的两个,另一个保持默认状态。合计测试3个组合。
- 同时提升PBO三个参数,合计测试4个组合。
- 手动定频并调整PBO三个参数,合计测试3个组合。
按照测试的环节也分四个部分来分析:
- 从测试1来看,提高TDC很明显的提升了一定的CPU性能。
- 从测试2来看,同时提高PPT和TDC可以显著提高R20的分数,甚至高于同时提升三个选项的情况,但是会明显恶化L3速度。
比较不能自恰的是此时CPU整体的功耗已经明显大于EDC乘以CPU电压的值,这个后面会再来分析。当同时提高TDC和EDC时,则CPU功耗会明显受到PPT设置的限制固定在142W上。
当同时提升PPT和EDC时,可以发现CPU的功耗提升很有限,CPU-Z和R20的分数还双双出现了下滑。
此时的CPU功耗不过137W,温度上也远没有达到温度墙,所以我认为TDC看起来更像是在控制CPU核心部分的电流。
- 从测试3来看,开启PBO或手动提高PBO三个参数都可以让CPU的性能有比较明显的提升,L3速度则没有明显的提升。
- 从测试4来看,当手动固定频率后L3速度就可以被直接解锁,同时PBO三个参数对CPU的影响就相对不明显了。
- 锐龙9 5900X默认的能耗比指数大约是59,当开启PBO后能耗比指数会下滑到48左右。
- 针对游戏的部分,英灵殿自动记录的1% LOW FPS大体上没有明显的差异。
接下来对锐龙7 5800X与锐龙9 5950X来进行类似的组合测试,来对比不同CPU的状况。
锐龙7 5800X PBO组合测试:
- 我手上的这颗锐龙7 5800X看起来表现并不好,在默认环境下CPU功耗一直都在135W以下徘徊。各种组合对测试结果的影响都不大。在手动定频之后可以看到功耗可以进一步提升,L3速度也可以明显提升。
- 锐龙7 5800X 默认的能耗比指数大约是48,当开启PBO后能耗比指数会下滑到46。
- 针对游戏的部分,英灵殿自动记录的1% LOW FPS大体上没有明显的差异。
锐龙7 5800X EDC测试:
这里将PPT和TDC设置为CPU的预设值,只变化EDC。
- L3速度也是大致呈先增长后持平的模式。
- R20 xCPU的分数则是较为平缓,也不存在一个提前出现的峰值。可见单CCD的锐龙7 5800X与双CCD的锐龙9 5900X,策略上有明显的差异性。
- 在锐龙7 5800X EDC测试中加入了电压测试,这样就可以对比EDC设置的理论值与实际CPU功耗的关系。
- 在测试的前面一段当EDC设置为0.001A~60A这段,EDC设置计算出的功耗(EDC*V)是会小于CPU实际看到的功耗,同时EDC*V-POWER的值是固定在45W不到。这个数字很有意思,后续我们还会分析。看起来AMD会为CPU的UNCORE部分预留一部分功耗。
- EDC继续提升的时候,EDC*V-POWER的值逐步降低。当EDC-100A时EDC略大于TDC-95A,EDC*V-POWER的值就非常接近于0。
- 我手上这颗锐龙7 5800X的体质挺难看的,CPU电压最高接近1.3V。同时可以看到CPU电压大致会随EDC的提升来提升。
锐龙9 5950X PBO组合测试:
- 锐龙9 5950X的调教非常的激进,所以与我原来的估计相悖。原来认为绝对功耗较低的锐龙7 5800X比较容易观察相关的变化,而规格最高的锐龙9 5950X比较不容易跑出区别,但是实际测试结果恰恰相反。锐龙9 5950X具有非常大的挖掘空间,也就更能在我们的测试中看出差异性。
- 总体的趋势上锐龙9 5950X与锐龙7 5800X和锐龙9 5900X是高度相似,最大的差异是在开启PBO后CPU对UNCORE部分的限制更深,以此来优先保证核心部分。
- 锐龙9 5950X 默认的能耗比指数大约是77,当开启PBO后能耗比指数会下滑到55。从能耗比看明显是优于锐龙9 5900X和锐龙7 5800X。
- 针对游戏的部分,英灵殿自动记录的1% LOW FPS大体上没有明显的差异。
锐龙9 5950X EDC测试:
这里将PPT和TDC设置为CPU的预设值,只变化EDC。
- L3速度也是大致呈先增长后持平的模式。
- 与锐龙9 5900X类似,R20 xCPU分数也是提前到达峰值,大约也是在EDC-100A。
- 在EDC-0.001A~80A这个区间也可以发现CPU会预留45W左右的功耗给UNCORE部分,这个差值归零的位置也被延后到EDC-120A的位置,相比锐龙7 5800X也明显延后。
- 大致可以推算在默认状态下,锐龙9 5950X的电流会比锐龙7 5800X大20A,与锐龙9 5900X基本一致。这显然是不够的,所以我们在前面一个表可以看到开启PBO之后会对UNCORE部分进行更深的限制,来保证CPU性能的发挥。
测试小结:
测试进行到这里其实已经颇为清晰,PBO玩到最后给我一股白学的味道。
- PPT就好比是最终裁判的男主,只要触及PPT设定的底线就一定会出手控制,左右整个局面。不过在大部分时候PPT直接拉到顶,然后让他没存在感就好,相对来说是PBO中存在感最为稀薄的。
- Tj MAX就好比是番剧的作者,不管PPT放宽到多少依然要受制于CPU温度墙的限制。众所周知芯片的功耗都是以废热的方式转化,所以CPU的导热能力就直接制约了CPU的功耗上限。即使是强行解锁温度墙,在物理上依然会面临过热宕机的问题。原则上也不建议解锁温度墙,毕竟那样对CPU的伤害比较大。
- TDC很意外的被证明在CPU性能中扮演了很关键的角色,可以大幅影响CPU CORE的性能。很显然在调试中应该要尽可能优先保证TDC而不是EDC。
- EDC本来在测试前是被寄予厚望,以为会类似显卡的EDC那样对高频的稳定性,L3的速度等等都有巨大的影响,可以通过正确调整EDC来实现CPU性能的优化。结果却主要体现在了UNCORE性能上,EDC-TDC的数值很大程度上会影响UNCORE性能,但是对整个CPU性能的影响并没有预想的大。
- 另外一个比较重要的发现是随着EDC的增长会比较明显的提高CPU电压,对于比较精细的性能调教来说,较高的电压会大量挤占功耗,导致宝贵的功耗池被过高的电压虚耗。
所以可能还是会有人更倾向于优先保证EDC使L3速度来让整个CPU跑分的效果更加好看,但是我个人会更重视TDC来让CPU最终的性能表现更好。或许AMD在PBO上也会有EDC党与TDC党之争了。
AMD PBO超频建议:
根据上一节的测试,我们可以进一步发现一个现象,就是AMD的CPU在EDC电流不足的情况下会额外保留45W的功耗。
- 锐龙9 5950X的电压大致在1V上下,这里就按照EDC=TDC+45来设置。
- 相比主板默认PBO R20 xCPU分数10900左右,按照这个设置可以让R20 xCPU分数超过11000。相对来说是会有进一步的提升。
- ROG的PBO设置是让TDC-255A大于EDC-200A,会反而降低了一点CPU功耗并不能让CPU完全拉满了跑,基本就卡在这个水平。用了EDC=TDC+45之后如果解锁温度墙,或想办法提升散热的话理论上可以跑得更高。
- TDC-5A~95A这个区间内,可以计算出EDC*V-POWER的值一直都是-13。所以桌面上的EDC与TDC差在30A~45A是最合理的区间。
CTR验证测试:
上一个表格中已经尽可能优化了CPU内部不同部分之间的功耗配比,那么主要矛盾自然是转移到了如何在有限的功耗里塞进更高的电流。
那就是通过降压的方式人为改变CPU的电压曲线,相当于变相提升了CPU的体质。这个对默认电压偏高的CPU会尤其有帮助。采用CTR一类的软件是比较靠谱的帮手。
这边没有很仔细的去调试,只是按照默认的设置随便跑一下。手上这个锐龙9 5900X被调试到4.6G 1.15V,R20 xCPU分数被拉到8800多,相比PBO下最高能折腾到8500多又有了进一步的提升。
最后总结:
- 针对桌面级CPU,三级缓存的速度对游戏和CPU性能都没有明显的影响,可以忽略。
- 在测试细节中可以发现锐龙9 5950X相比锐龙9 5900X对UNCORE的功耗限制更严格,UNCORE性能的释放可能是锐龙9 5900X可以在游戏性能上略好于锐龙9 5950X的原因。但是差距其实很小,没有纠结的必要。
- 考虑正常的使用,AMD的默认设置是选在不错的平衡点上,其实已经十分合理。对于绝大多数人来说调整的意义不大。
- 要进行PBO超频,主板自带的设置一般不会差到哪里去。
- 要进行PBO手动设置(针对华硕主板)不建议在主板BIOS内进行调节以保留节能设置。PPT建议直接拉满,EDC与TDC保持30A~45A的差距。
- 想要挖掘极限建议尝试降压法来挖掘电流扩大的潜力。但是会明显增大CPU的电流可能会损伤CPU。