Intel Panther Lake深度揭秘:P+E+LPE混合架构日臻完美!功耗低得惊人
  • 上方文Q
  • 2025年10月09日 21:00
  • 0

【GPU核显:Xe3架构首秀 迎来多帧生成】

Intel Panther Lake深度揭秘:P+E+LPE混合架构日臻完美!功耗低得惊人

Intel Xe一直坚持独显、核显两条腿走路,而且核显还走到了独显的前头,比如Lunar Lake率先集成了第二代Battlemage Xe2架构,锐炫B580/B570之后才跟上。

Panther Lake则率先集成了新一代Celestial Xe3架构,不过命名上却划归锐炫B系列。

至于新架构独显,还不知道什么时候发布的下一代锐炫C系列才会跟上,但从路线图上看独显版Xe3架构将会叫做Xe3P,应该是代表性能更强。

Intel Panther Lake深度揭秘:P+E+LPE混合架构日臻完美!功耗低得惊人

Intel Panther Lake深度揭秘:P+E+LPE混合架构日臻完美!功耗低得惊人

核显版Xe3主要是增强了架构灵活性,并在性能上进行了深度优化,包括第三代Xe核心、增强光追单元、提升XVE矢量引擎利用率、增强图形固定功能,等等。

Xe核心的基本内部结构完全没变,还是包含8个512-bit XVE矢量引擎、8个2048-bit XMX AI加速引擎,不过两种引擎都做了增强,共享一级缓存容量也增大了1/3,来到342KB。

XVE矢量引擎的线程增加了最多25%,新增支持可变寄存器分配、FP8量化,同时继续支持SIMD16原生ALU逻辑计算、3路并发、拓展数学与FP4。

XMX引擎继续提升性能,每时钟周期操作数分别提高到TF32 1024、FP16/BF16 2048、INT8 4096、INT4/INT2 8192,整体算力提高到了最多120TOPS,但不支持FP4。

光追单元变化不是很大,支持异步光追的动态光线管理。

图形固定功能方面,支持URB管理器,AF各向异性过滤行提升2倍,模板测试速率提升2倍。

Intel Panther Lake深度揭秘:P+E+LPE混合架构日臻完美!功耗低得惊人

同样频率下,Xe3的诸多微架构理论指标都有了长足的进步,比如色彩混合+10%、GEMM +50%、FP32/INT32 +50%、光线与三角形交互+1倍、16x AF sRGB +1倍、网格渲染+1.4倍、离散读取+1.7倍、高寄存器压力着色器+2.1倍、深度写入+6.4倍。

当然,这些都是纯理论性能指标,不代表实际渲染性能,但也可以看出Xe3作为一次小改,仍有着显著的提升。

Intel Panther Lake深度揭秘:P+E+LPE混合架构日臻完美!功耗低得惊人

反映到实际性能上,Intel官方宣称Panther Lake Xe3对比Lunar Lake Xe2的性能可提升超过50%,当然功耗也高得多。

对比Arrow Lake Xe则将能效提升了超过40%,只需要少得多的功耗,就能达成后者的峰值性能。

Intel Panther Lake深度揭秘:P+E+LPE混合架构日臻完美!功耗低得惊人

Intel Panther Lake深度揭秘:P+E+LPE混合架构日臻完美!功耗低得惊人

Xe3的基本组成单元还是渲染切片(Render Slice),不过增大了规模,每一组从4个Xe核心、4个光追单元加强为6个Xe核心、6个光追单元。

Intel Panther Lake深度揭秘:P+E+LPE混合架构日臻完美!功耗低得惊人

Intel Panther Lake深度揭秘:P+E+LPE混合架构日臻完美!功耗低得惊人

Panther Lake的核显有两种版本,一种是4个Xe核心,搭配8/16核心CPU,但不清楚是6核心精简下来的,还是原生4核心,如果后者和Xe2架构的就一样了。

它有32个XMX引擎(大致相当于传统32个传统流处理器)、32个XVE引擎、4个光追单元、1条几何流水线、4个采样器、2个像素后端、4MB三级缓存。

另一种是12个Xe核心,搭配16核心CPU,但规格上不是4核心版本简单乘4,而是重新配置过的,包括96个XMX引擎、96个XVE引擎、12个光追单元、2条几何流水线、12个采样器、4个像素后端、16MB二级缓存。

大缓存可以显著降低GPU与CPU之间的互连拥堵问题,实际游戏中最多可节省达36%。

Intel Panther Lake深度揭秘:P+E+LPE混合架构日臻完美!功耗低得惊人

Intel Panther Lake深度揭秘:P+E+LPE混合架构日臻完美!功耗低得惊人

此外,Xe3架构还带来了一项重磅技术,XeSS3 MFG多帧生成,甚至AMD都还没有做到这一点!

它和NVIDIA DLSS 4的多帧生成类似,也是提取已有帧画面中的运动矢量、深度信息,利用XMX引擎的AI处理能力,结合光流、运动矢量信息进行混合重建,生成新的帧画面。

它也是一帧可生成最多四帧,能将帧率提升4倍左右,并且可以在驱动中选择强制2x、3x、4x帧生成,或者由游戏控制。

结合XeSS SR超分技术,它同样能让画面中15/16的像素都是AI生成的,而非原生渲染的。

凡是已经支持XeSS2 FG帧生成的游戏,都可以直接支持XeSS3 MFG多帧生成,无需单独适配。

至于多帧生成能否适配老显卡,暂未可知。

当然,帧生成、多帧生成都必须配合XeSS LL低延迟技术,要么同时打开,要么同时关闭,从而降低帧生成后的高延迟。

XeSS LL低延迟也有两种实现方式,一是游戏内置原生支持,效果最好,二是通过驱动强制打开,不算完美但总比没有强。

Intel Panther Lake深度揭秘:P+E+LPE混合架构日臻完美!功耗低得惊人

有趣的是,Intel还开发了一个小软件,可以分别显示原生渲染帧率、多帧生成帧率,可以看到确实做到了4倍提升。

Intel Panther Lake深度揭秘:P+E+LPE混合架构日臻完美!功耗低得惊人


文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0