这两年,Intel越来越“超前”,以往新一代产品发布才会公布的诸多技术细节,都会提前几个月公诸于世。在今天的年度架构日活动上,Intel就公布了Alder Lake 12代酷睿的架构、技术细节。
第一篇先来看12代酷睿的整体设计、技术特性、大小核调度,之后我们会单独分析大核心、小核心的架构设计。
Intel此前的Lakefield处理器第一次采用了大小核混合架构设计(Intel Hybrid Technology),但只是一次试水之作,12代酷睿才是真正的起点。
其中,大核心叫做“性能核心”(Performance Cores),或者“P核心”(P-Cores),Golden Cove架构,最多8核心16线程,AVX-512指令集、DLBoost深度学习加速也只有大核心才支持。
小核心则叫做“能效核心”(Efficiency Ccores),或者“E核心”(E-Cores),Gracemont架构,最多8核心8线程,对,不支持超线程。
为了解决大小核调度问题,Intel发明了新的“Thread Director”(线程调度器),并与微软全力合作,搭配Windows 11的任务调度器,将合适的负载分配给不同核心、线程。
12代酷睿都嵌入了一个微控制器,负责监视每个线程的性质和性能需求,衡量其载入、存储、分支、内存访问延迟、指令类型等,然后报告给Windows 11系统调度器,由后者结合运行环境,将此线程分配到最合适的核心。
Intel宣称,该技术可以在最短30微秒的时间里确定一个线程的性质、归属,而传统的系统调度器需要上百甚至几百微秒,还可能分配错误。
另外,Thread Director还会针对性地优化频率,尤其是在移动端,保证效率的同时还能提高能效,而且可以在微秒级别调整频率。
Windows 10呢?自然不会有Thread Director,只有一个基础版的Intel HGS(硬件指引调度),具体细节不详,但效率肯定不会高到哪里去。
Linux呢?Intel说目前的优化重点是Windows 11,也会和业界合作对Linux内核进行优化,但需要时间。
12代酷睿将有三种封装版本:
一是桌面高性能版的LGA1700独立封装,也就是S系列,最多8大8小16核心24线程,核显最对32EU单元,功耗最高125W;
二是移动低功耗版的BGA Type3整合封装,也就是UP3系列,尺寸50×25×1.3毫米,最多6大8小14核心20线程,核显最多96EU单元,功耗12-35W(此前曝料还有45/55W);
三是超低功耗版的BGA Type4整合封装,也就是UP4系列,尺寸28.5×19×1.1毫米,最多2大8小10核心12线程,核显最多96EU单元,功耗可以低至9W。
三种版本除了核心规模不同,本质上相同的,多个IP模块也是通用的,比如都集成新一代GNA 3.0高斯神经加速器,执行AI加速。
不过,IPU(图像处理器单元)、雷电4、Wi-Fi 6E都是移动端才有,其中UP3系列支持四个雷电4端口,UP4系列则是两个。
三级缓存增至最大30MB,而现在的11代移动版最多24MB,桌面版则是只有16MB。
内存方面,桌面版同时支持DDR5-4800、DDR4-3200、LPDDR5-5200、LPDDR4X-4266,而且所有版本都是同时支持四种内存,硬件层面没有区别,因此在一些迷你机平台上,应该会看到直接搭配LPDDR5/4X。
此外,还会支持内存的动态电压频率缩放,并强化超频。
但是,移动端的内存支持规格没有公开,估计和桌面版差不多。
PCIe连接方面,桌面版处理器会支持16条PCIe 5.0、4条PCIe 4.0,配套的芯片组(Z690)则最多支持12条PCIe 4.0、16条PCIe 3.0。
这一次Intel可是极为慷慨了,尤其是在PCIe 4.0上被对手抢先,终于扳回了一局,即便是PCIe 5.0全部给显卡,也可以同时搭配最多四块顶级SSD。
内部互连方面,12代提供了三种高速通道。
一是Compute Fabric,主要连接CPU核心、高速缓存,带宽可达惊人的1TB/s,并支持动态缓存优化。
二是Memory Fabric,连接内存和其他模块,带宽最高204GB/s,支持动态位宽和频率。
三是I/O Fabric,用户输入输出,最高带宽64GB/s,正好对应PCIe 5.0 x16,支持基于需求的实时带宽控制。
不过,内存带宽有点疑问:12代酷睿支持128-bit内存位宽,可以做到四个32-bit DDR5通道,而要想达到204GB/s的带宽,必须支持到DDR5-12750的高频率,但实际只有DDR5-4800,一半都没有。暂时还不知道Intel是如何算出这个带宽数字的。