一、前言:用100MB缓存夺回最强游戏处理器称号
“唯一能战胜整合内存控制器的武器是处理器缓存。”Intel前CEO奥特里尼语录!
当年,初代Athlon 64首次在处理器内部革命性地整合了内存控制器之后,极大地降低了内存延迟并提升了内存带宽。
对此,Intel唯一的应对办法就是拼死增加处理器缓存,以至于酷睿2 Q9550四核处理器史无前例地集成了12MB二级缓存。
时过境迁,如今Intel的12代酷睿i9-12900KS处理器毫无悬念的登上最强游戏处理器宝座,而AMD的应对举措也与当年的Intel如出一辙。
今晚解禁的AMD锐龙7 5800X3D,在原有4MB二级缓存、32MB三级缓存的基础上堆叠了64MB 3D V-Cache,拥有整整100MB的缓存,誓言要重新夺回最强游戏处理器的称号!
那么缓存到底有什么作用呢?
从早期的SDR 133MHz到现在的DDR4 4000MHz,内存的带宽提升了25倍左右。而同期的处理器则从单核的奔腾3 700MHz发展到了16核的i9-12900K/KS,整体性能提升百倍以上。
如今内存的带宽以及延迟,已经远远无法满足处理器海量的数据吞吐需求,如果CPU直接从内存读取数据,将会有95%以上的时间处于等待状态。
于是在CPU和内存之间,高速缓存就起到了桥梁作用,依靠算法将CPU所需的数据提前从内存预读到缓存,这样CPU就可以直接从缓存里面读取数据。
但是缓存容量有限,不可能保存CPU所需的全部数据,因此想要提升CPU缓存命中率,最直接最粗暴的方法,就是增大缓存容量。
其实大部分日常应用, L1+L2+L3(8MB)缓存的总命中率可以到达到95%以上,那么是什么应用需要用到96MB三级缓存呢?
简单地说就是游戏,场景越复杂的游戏,所需求的缓存容量越大。
特别是在电竞游戏中,在玩家人数非常多的复杂场景下,当数十上百玩家同时攻击BOSS,数据的运算量和传输量会数倍提升,此时8MB的三级缓存早已不堪重负,缓存命中率会急剧降低。
当缓存命中率降低到50%以下,由于内存延迟和带宽不到缓存1/10,如果有50%的数据要直接从内存读取,CPU的运算效率将会降低95%以上。这也就是为什么百人屠龙、或者大规模团战时会卡成幻灯片的最根本原因。
而锐龙7 5800X3D的诞生,将让你在这些极端复杂的场景下获得无与伦比的流畅运行帧率,别人1~2帧幻灯片,你60帧屠龙!
如果按照往常的设计思路,加入更多的缓存需要重新设计处理器内核构架,需要付出巨大的时间成本和研发投入。
而天才的AMD攻城狮另辟蹊径,直接在8核Zen3 CCD之上堆叠了64MB3D V-Cache。
3D V-Cahce的制造工艺也是台积电7nm,面积为41平方毫米,包括13层铜、1层铝堆叠而成,然后通过TSV硅穿孔、混合键合(Hybrid Bonding)、两个信号界面等渠道与三级缓存直接相连,通过RVDD、VDDM为其供电。
3D V-Cahce是分区块(slice)设计的,每块容量8MB,一共八块,总容量64MB。为了让所有CPU核心都能访问这些额外的缓存,三级缓存层面增加了一个共享的环形总线。
毕竟不是原生内置缓存,如何控制3D V-Cahce的读写延迟也是极具挑战的事情!
AMD的攻城狮在每个3D V-Cahce区块与每个CPU核心之间设计了1024个接触点,八块和CCX(CCD)里的八个核心分别相连,接触点总共多达8192个。
在全双工模式下,每个区块的带宽超过2TB/s,这就让3D V-Cache有了媲美原生三级缓存的高带宽,保证足够高的性能。
因此,完全不必担心64MB 3D V-Cahce的性能会比不上原生的32MB L3 Cache。
当然,64MB 3D V-Cahce也不是完全没有缺陷!
3D V-Cache缓存的安全电压范围是1.3-1.35V,也就是说锐龙7 5800X3D的核心电压也需要控制在这个范围之内。
而锐龙处理器超频时可以加到1.45-1.6V,远远超过了3D V-Cache的承受范围,因此AMD干脆就关闭了锐龙7 5800X3D处理器的超频功能。
由于电压所限,锐龙7 5800X3D无法像锐龙7 5800X、锐龙9 5900X那样达到5.0GHz的加速频率,AMD对它的频率以及功耗进行了严格的限制!
锐龙7 5800X3D的加速频率最高4.55GHz、全核频率4.45GHz、TDP 105W,实际运行功耗最高120W。
但在如此苛刻功耗以及频率限制下,锐龙7 5800X3D却爆发出了令人难以想象的强悍游戏性能。
好了,下面正式进入处理器测试环节!