Intel Panther Lake深度揭秘：P+E+LPE混合架构日臻完美！功耗低得惊人-快科技-科技改变生活

【GPU核显：Xe3架构首秀迎来多帧生成】

Intel Xe一直坚持独显、核显两条腿走路，而且核显还走到了独显的前头，比如Lunar Lake率先集成了第二代Battlemage Xe2架构，锐炫B580/B570之后才跟上。

Panther Lake则率先集成了新一代Celestial Xe3架构，不过命名上却划归锐炫B系列。

至于新架构独显，还不知道什么时候发布的下一代锐炫C系列才会跟上，但从路线图上看独显版Xe3架构将会叫做Xe3P，应该是代表性能更强。

核显版Xe3主要是增强了架构灵活性，并在性能上进行了深度优化，包括第三代Xe核心、增强光追单元、提升XVE矢量引擎利用率、增强图形固定功能，等等。

Xe核心的基本内部结构完全没变，还是包含8个512-bit XVE矢量引擎、8个2048-bit XMX AI加速引擎，不过两种引擎都做了增强，共享一级缓存容量也增大了1/3，来到342KB。

XVE矢量引擎的线程增加了最多25％，新增支持可变寄存器分配、FP8量化，同时继续支持SIMD16原生ALU逻辑计算、3路并发、拓展数学与FP4。

XMX引擎继续提升性能，每时钟周期操作数分别提高到TF32 1024、FP16/BF16 2048、INT8 4096、INT4/INT2 8192，整体算力提高到了最多120TOPS，但不支持FP4。

光追单元变化不是很大，支持异步光追的动态光线管理。

图形固定功能方面，支持URB管理器，AF各向异性过滤行提升2倍，模板测试速率提升2倍。

同样频率下，Xe3的诸多微架构理论指标都有了长足的进步，比如色彩混合+10％、GEMM +50％、FP32/INT32 +50％、光线与三角形交互+1倍、16x AF sRGB +1倍、网格渲染+1.4倍、离散读取+1.7倍、高寄存器压力着色器+2.1倍、深度写入+6.4倍。

当然，这些都是纯理论性能指标，不代表实际渲染性能，但也可以看出Xe3作为一次小改，仍有着显著的提升。

反映到实际性能上，Intel官方宣称Panther Lake Xe3对比Lunar Lake Xe2的性能可提升超过50％，当然功耗也高得多。

对比Arrow Lake Xe则将能效提升了超过40％，只需要少得多的功耗，就能达成后者的峰值性能。

Xe3的基本组成单元还是渲染切片(Render Slice)，不过增大了规模，每一组从4个Xe核心、4个光追单元加强为6个Xe核心、6个光追单元。

Panther Lake的核显有两种版本，一种是4个Xe核心，搭配8/16核心CPU，但不清楚是6核心精简下来的，还是原生4核心，如果后者和Xe2架构的就一样了。

它有32个XMX引擎(大致相当于传统32个传统流处理器)、32个XVE引擎、4个光追单元、1条几何流水线、4个采样器、2个像素后端、4MB三级缓存。

另一种是12个Xe核心，搭配16核心CPU，但规格上不是4核心版本简单乘4，而是重新配置过的，包括96个XMX引擎、96个XVE引擎、12个光追单元、2条几何流水线、12个采样器、4个像素后端、16MB二级缓存。

大缓存可以显著降低GPU与CPU之间的互连拥堵问题，实际游戏中最多可节省达36％。

此外，Xe3架构还带来了一项重磅技术，XeSS3 MFG多帧生成，甚至AMD都还没有做到这一点！

它和NVIDIA DLSS 4的多帧生成类似，也是提取已有帧画面中的运动矢量、深度信息，利用XMX引擎的AI处理能力，结合光流、运动矢量信息进行混合重建，生成新的帧画面。

它也是一帧可生成最多四帧，能将帧率提升4倍左右，并且可以在驱动中选择强制2x、3x、4x帧生成，或者由游戏控制。

结合XeSS SR超分技术，它同样能让画面中15/16的像素都是AI生成的，而非原生渲染的。

凡是已经支持XeSS2 FG帧生成的游戏，都可以直接支持XeSS3 MFG多帧生成，无需单独适配。

至于多帧生成能否适配老显卡，暂未可知。

当然，帧生成、多帧生成都必须配合XeSS LL低延迟技术，要么同时打开，要么同时关闭，从而降低帧生成后的高延迟。

XeSS LL低延迟也有两种实现方式，一是游戏内置原生支持，效果最好，二是通过驱动强制打开，不算完美但总比没有强。

有趣的是，Intel还开发了一个小软件，可以分别显示原生渲染帧率、多帧生成帧率，可以看到确实做到了4倍提升。