Intel将会在明年推出新一代的Haswell处理器,那么它究竟有什么特别的地方呢?来看看同行超能网给我们带来的详细解析吧。
古龙的《七种武器》系列小说中留给我印象最深的两篇分别是《孔雀翎》和《拳头》,拳头看起来比不了长生剑、碧玉刀这样的冷兵器,但却是最有力的武器,最值得信赖的武器,所以有“拳头产品”一说而“刀剑无眼”,弄不好还伤了自己。
孔雀翎的存在更为神秘,以致于到最后都没有说明这个武器是否还在孔雀山庄,但是武器本身已经不重要了,孔雀翎代表的是信心,有了信心再强大的敌人都是浮云。
拳头+信心是可以打出自己的一片天下的。
本来七种武器跟本文的内容其实毫不相干,因为今天写的是Intel下一代处理器架构Haswell,用七种武器开头只是不想提Intel那个Tick-Tock战略,因为每写Intel处理器介绍或者评测总是免不了要提到这个钟摆策略,次数之多以致于自己都觉得太过无聊。
可惜绕来绕去还是绕不过这个坎,实践证明Intel这几年来靠着Tick-Tock战略已经远远甩开了AMD,无论是CPU架构还是制程工艺上都看不到AMD能给Intel带来压力了,反倒有差距越来越大的趋势。
架构+工艺就是Intel自己的拳头和孔雀翎。
将于明年正式发布的Haswell处理器是Intel的Tock战略点,这意味着它将使用成熟的22nm制程工艺,同时还会使用新的架构设计,前者保证了CPU的功耗和发热,后者则会进一步提高CPU的性能。
Intel早在2011年的IDF大会上就高调展示了Haswell处理器,并且是实际运行状态,只不过当时22nm 3D晶体管工艺还不够成熟,Haswell还需要等等。
作为拳头产品的Haswell也不仅仅是一次架构升级,Intel还需要用它串联起各个战略,性能不断提升的图形核心要抵御AMD APU的进攻,低功耗、高续航特性要支撑起第三代超极本,还要试水SOC化的Haswell单芯片......
Intel给Haswell的口号:重塑笔记本,当然这还只是针对移动平台的,整个处理器市场上Haswell依然要承担推陈出新的重任,没有了AMD的羁绊,Haswell还有自己要超越。
变与不变 Haswell架构概览虽然Haswell在大大小小的新闻、爆料中出场多次,但是系统性的资料还是凤毛麟角,我们只能从先前的报道中追踪Haswell架构中那些将会改变或者继承的设计。
CHH网友Bigpao007曝光过一份Haswell处理器的文档
综合性最强的资料还是先前CHH网友Bigpao007爆出的一组Haswell PDF资料,从中我们可以一窥Haswell秘境。
先来看改变的地方,首先是封装方式变了,移动平台将使用Socket G3插槽,947针脚,而桌面平台使用Socket H3插槽,1150针脚。第二则是指令集变化了,支持TSX扩展指令、AVX 2.0,这部分后面还要分别讲述。第三就是集成性更高,原来五部分的VR调压模块现在整合为一个。
原来的调压模块有Core、显卡、SA、I/O、PLL之分,现在统一为输入VR
不变的地方似乎更多,四核心八线程设计、Turbo加速、PCI-E 3.0、双通道DDR3/DDR3L内存支持等技术与目前的SNB、IVB架构基本相同。
日本PCwatch网站曾专门介绍过Haswell的架构设计,这也是目前比较全面的Haswell架构图,官方版的还没见到过。
在这份图表上可以看到Haswell继续为长方形封装,内部集成4个核心,共享8MB L3缓存。CPU核心之外占用面积最大的就是新一代图形核心了,支持DX11.1、OpenGL 3.2以及OpenCL 1.2标准。
南桥方面则是代号Lynx Point的芯片组,最大特点是使用45nm工艺生产,相比目前65nm工艺的6系和7系主板来说更省电。
CPU架构方面可用资料不多,从先前报道过的各种晶圆核心来看,因为同为22nm工艺,其核心面积与目前的Ivy Bridge基本相同,但是晶体管数量之类的消息就无从得知了。
Haswell内核上变化最大的是指令集,一个是针对多线程应用的TSX扩展指令,来一个是就是现有AVX指令的进阶版AVX 2.0,它们对Haswell的性能提升至关重要,如果没有这两点,Haswell相对于IVB还真没什么重要升级可言了。
多线程多核处理器问世几年来,在AMD和Intel的轮番推动下双核、双核四线程CPU已经是最基本的配置,四核以及四核八线程也不是少数人的玩物了,总之就是多线程在物理基础上已经普及,但是日常应用中八线程并不能总是比双线程要快。
其中的原因有软件/游戏开发商对多核优化不够造成的,但是CPU自身也存在一定限制,比如传统操作中一个线程访问了某部分内存数据之后就会通过一个“lock”锁操作来保证数据的统一性,又分出粗粒度锁定(Coarse-grained thread lock)以及细粒度锁定(Fine-grained thread lock),无论是哪种锁都存在多线程并行的效率问题,因为锁操作是互斥的。
Intel早在2006年的IDF上就公布了这一问题的解决方案,那就是改用Transactional Memory(事务型内存),这一技术早在服务器处理器上应用多年,但在桌面CPU中还没有应用过,要等到Haswell这一代才能有实际应用。
Intel早前在其官方Blog上发表了一篇名为“Transactional Synchronization in Haswell”的文章,介绍了Haswell架构将会支持TSX扩展指令,简单来说就是TSX将允许程序员指定事务型同步代码空间,使得目前使用粗粒度线程锁定的程序更自由地使用细粒度线程锁定,进而提高多线程效率和性能。
举个简单的例子,你在编辑excel表格,如果你打算同时编辑两份拷贝,excel就会提示你该文件正在编辑,只能以只读方式打开但不能编辑,这种情况叫做粗粒度线程锁定,这种锁定比较简单,很容易实现,但是效率不高。
细粒度线程锁定则可以实现自由度更高的数据同步,还是前面的例子,如果使用细粒度线程锁定,那么每个线程都可以操作不同纵列的数据,明显提高了CPU效率,不过这样做也有更大的风险,比如数据出错的几率更大,特别是多个线程同时向一个区域写入数据时,而粗粒度线程锁定则可以避免这个问题,同时保持不需要的核心处于休眠状态,更节能。
为了避免出错,程序员往往钟爱粗粒度线程锁定,而TSX扩展的设计目的就是评估软硬件状况并为程序员提供无错的细粒度线程锁定。
Intel在当时的软件仿真演示中表示使用事务内存技术后性能可以提升1-3倍,比如基于锁操作的测试需要10.4秒,而使用事务内存处理只需要4.6秒,性能是前者的2倍还多。
Haswell将是消费级处理器中首次使用事务内存技术的架构,虽然Intel已经展示了该技术的良好前景,特别是在复杂的多线程应用中其理应有更好的表现,不过回到现实中这一技术还需要系统在内存管理和线程调度上做相应的优化,具体性能提升只能拭目以待。
TSX指令是新增功能,Haswell架构上已知的指令集变化还有就是AVX 2.0了,这是AVX指令集的更新版,后者从2011年初发布的Sandy Bridge架构上首次开始应用,之后的Sandy Bridge-E、现在的Ivy Bridge架构都有使用。
AVX(Advanced Vector Extensions,高级矢量扩展)指令集的详细介绍之前有过文章,Haswell架构上的AVX 2.0主要是升级更新,新增了几项指令更新,Intel在其官网也做了介绍。
AVX原先主要是256bit浮点指令集,AVX 2.0中整数数据也扩展到256bit SIMD阵列,而整数指令在图像及视频处理器中使用较多。
新增的3操作数通用位处理指令(3-operand general-purpose Bit manipulation instructions)主要用在数据压缩、Hash、大规模数据运算以及各种通用计算中。
此外,AVX 2.0指令还支持寻址Gather/Scatter指令、矢量位移(Vector-Vector Shifts)、任意到任意排列(Any-to-Any permutes)、浮点乘积累(Floating Point Multiply Accumulate,FMA)指令等。
AVX 2.0支持的FMA指令依然是3操作数,但是Intel表示新版FMA3指令极大地提升了峰值速度,并且改进数学算法以提供更高的精度,适用于高性能计算、专业图形处理以及脸部追踪等应用。
AVX 2.0指令集不仅应用在Haswell架构上,2014年14nm工艺升级版的Broadwell架构处理器也会使用AVX 2.0,这与目前AVX指令贯穿SNB、IVB两代架构的做法一脉相承。
CPU架构升级的同时,整合的GPU核心也在稳步前进,从早前泄露的资料来看,Intel对Haswell图形核心的描述是“明显的3D及多媒体性能提升,并支持AS3D立体显示”,自信心爆棚。
此外,图形核心将完整支持DX11.1、OpenGL 3.2、OpenCL 1.2标准,支持数字视频输出以及VGA模拟信号输出,并可实现独立3屏输出。
不过三屏输出功能早在Ivy Bridge架构中就有这样的描述,但是Z77主板中除了使用第三方方案的主板外都不能实现3屏输出,不知Haswell能否真正实现这个功能。
Haswell的图形核心源自Ivy Bridge的第七代架构,算是7+
具体到GPU架构上,目前的IVB架构的GPU单元其实变化已经很大了,因为要支持DX11,Intel需要为IVB显卡设计硬件曲面细分单元,架构改进还是蛮大的,所以在IVB使用的HD 4000显卡相比上一代的HD 3000性能提升非常明显。
PCwatch网站对Haswell图形架构的分析(点击放大)
Haswell的图形核心中EU执行单元的数量一直没有确切消息,日本PCWatch网站所做的分析中认为Haswell有三种不同级别的图形核心,分别是GT1、GT2、GT3,其中GT1定位最低,只有6个EU单元,24个ALU单元,1个曲面细分单元,与目前的HD 2500显卡基本相同。
GT 2核心的EU单元提高到20个,80个ALU单元,2个曲面细分单元,与目前HD 4000显卡的16个EU单元相比多了四分之一,而SNB到IVB提升了三分之一。
此外,Haswell还有GT3核心,EU单元大幅升至40个,是GT 2的两倍,虽然还不知道具体性能数据,但是这么大规模的硬件提升已经让Haswell超越了入门级显卡的水平,甚至具备叫板中端显卡的能力,这对AMD或者NVIDIA来说可不是什么好消息。
Haswell已经不再使用xx Brdige命名了,不过配套芯片组还是会延续原有的xx Point,继7系主板的Pather Point之后,Haswell御用的平台名为Lynx Point,按惯例它正式上市后将成为8系主板。
在Lynx Point特性总揽中,Intel表示其在四个方面进行了优化升级,分别是I/O、管理&安全、存储&响应以及平台性能,其中管理&安全主要是Intel博锐vPro、身份验证之类侧重商业性,平台性能也不过是降低TDP功耗,换用体积更小的封装方式,这两项没什么亮点,有新意的主要是I/O性能优化。
首先是新技术接口数量更多,原生USB 3.0接口从目前的4个提高到6个(先别高兴的太早,下边还有矛盾的地方),SATA接口也全面升级到SATA III标准,持续几年的SATA II*4+SATA III*2的配置终于结束了,而AMD早在SB850南桥之后就开始全面支持SATA III接口了。
第二个变化是提升了PCI-E通道的分配弹性,加快了存储设备的响应速度。
Lynx Point总计有18条PCI-E通道,主要分配给USB 3.0、PCI-ESATA接口以及网络接口使用,现在的分配方式更加灵活,可以按需分配,比如在ATX规格主板需要更多的PCI-E通道,uATX主板可能需要更多的USB 3.0接口。
这18条通道中,#5、#6和#13、#14的角色非常灵活,前两者可以用作USB 3.0或单纯的PCI-E通道,后两者可以作为SATA 6G通道或者单纯的PCI-E通道,通过合理调节USB 3.0和SATA 6Gbps的接口数,最多可预留8条PCI-E通道。
此外,14个USB 2.0通道并不影响PCI-E通道分配,任何一条PCI-E通道都可以用作千兆网通道,mSATA接口可以使用#13、#14这样的通道。
目前的RST软件最高还是11.5 beta,到了Lynx Point芯片组时将会升级到12.0版,会有Intel许诺了已久的SSD RAID阵列TRIM支持功能(新消息称7系列主板已支持RAID阵列下的TRIM),此外在SRT智能响应技术、Rapid Start快速启动功能也有小幅更新。
新增的功能主要是Fast Synch Streaming(快速同步流)、完整的UEFI支持以及Lake Tiny,除第二个之外其他两项都事关I/O性能,特别是Lake Tiny颇有新意。
Lake Tiny可以最大化提升I/O吞吐性能,有助于SSD提速,其工作原理在于根据功耗配置和负载调节动态调节使用正确的功耗状态策略,测过SSD的都知道要把Intel CPU的节能设置关掉,Lake Tiny作用类似于此。
来看Intel自己举的例子,RST 10.0中SSD的速度曲线比较平稳,平均157.6MB/s,而在支持Lake Tiny技术的RST测试中,基本速度还是157.6MB/s,但是个别时段速度还会提升到185MB/s甚至220MB/s,相当于提高了SSD的突发速度。
除了旗舰级的X79主板不会有变化之外,Z77、H77都有各自的继任者,值得注意的是Intel终于把定位尴尬的Z75给革掉了,高不成低不就的定位是没有出路的。
商业级市场上Q77、Q75以及B75也都有同定位的产品出现,而经典的H61在伺奉了SNB、IVB两代之后也要被H81取代了。
具体的每款主板规格就不再赘述了,唯一要提的就是USB 3.0接口问题,Intel在同一份文档中前面说Lynx Point会提供6个USB 3.0接口,具体的主板规格上就变成4个了,维持目前水准不变,要么是那里印错了,要么就是理论上支持6个,实际主板产品还是只给4个。
综合来看,Lynx Point芯片组更多的像是在现有芯片组上升级,并没有什么激动人心的新功能,每一代芯片组升级Intel都会推出一批所谓的优化技术,比如7系芯片组就增加了Rapid Start快速启动、Smart Connect智能连接之类的新技术,到现在也没多少人了解或者使用,8系主板新增的Lake Tiny、Fast Synch Streaming之类的功能也很难说是什么结果。
反过来看,8系主板也没得选择,因为Haswell的接口换了,现有主板不再兼容,想升级就必须要上Lynx Point平台,而且USB 3.0、SATA 6Gbps接口的增多对日常使用还是大有裨益的。
前面主要介绍的是一些理论技术上的变化,但是个人认为这些变化影响的还是性能、功耗这样的问题,真正值得重视或者称得上革命性进化的应该是Haswell的SOC封装变化,它影响的可是使用方式。
Intel在CPU高集成化已经前进了一大步,三年前Lynnfield架构处理器以及P55芯片组发布时,习惯上的南桥+北桥+CPU的概念就已经发生变化,CPU已将传统北桥集成的PCI-E控制器、内存控制器、集成显卡等部分整合进CPU内部,P55芯片组实际上只负责提供SATA、USB、网络接口等功能。
从P55之后南北桥+CPU的概念就不复存在了,只剩一个南桥芯片
这种局面一直持续到目前的Z77和IVB处理器上,但是Haswell架构上Intel将会加大SOC(System on a Chip,片上芯系统)步伐,推动处理器+南桥的整合力度,初期采用的方式很可能延续Lynnfield那样直接封装在一起的方式,后续再进行电路级的整合。
Computerbase网站报道显示Intel将在Haswell这一代使用MCP封装
Intel在今年IDF会议上公布的芯片组路线图显示将从14nm工艺节点启用Multi-Chip Package多芯片封装,形成CPU+南桥+北桥的三位一体。
日本PCwatch网站之前刊文介绍过Haswell SOC方案
在Haswell的各种封装就有一个使用MCP方案的,它主要用于低电压ULT处理器,除了双核CPU、图形核心之外还把低功耗版的Lynx Point-LP芯片组封装进去,外观上看就是一个芯片,主板上也不需要南桥了。
按照Intel的规划,主流市场的Haswell的SOC芯片还要等到14nm工艺阶段,因为制程越先进,核心面积越小,对SOC封装越有利,明年即便是有SOC化的Haswell芯片也主要是针对移动市场的。
试想一下,一旦主流CPU实现了SOC化,不仅减少了南桥芯片的发热,降低了主板成本,最重要的是平台升级时候不用考虑芯片组搭配了,直接换新CPU就行了,不过这一美好愿望的前提是Intel不再频繁更换CPU接口。
今年是Intel的制程工艺升级Tick之年,虽然22nm 3D晶体管工艺是CPU生产中跨越式的发展,但是人们对首次使用新工艺的CPU往往有一些担心,因此对架构升级+成熟版工艺的Tock处理器有着更多的期待,事实也证明了这一点,比如第二代智能处理器SNB架构相比第一代Core i3/i5/i7就全面胜出,目前的第三代智能处理器IVB相比Core i7-2600K那一代就没有太大变化。
Haswell就是这样一个架构升级+工艺更成熟的产品,所以很多人对它的期望值比较高,那么Haswell是否能回报玩家这份诚挚的期盼呢?
期望1:CPU性能提升多少?
这个问题应该是最多关注的,回想Sandy Bridge架构的2600K相对Bloomfield核心的920在同为4GHz的频率下CPU性能领先15%左右,那么我们可以预期Haswell相对目前的IVB处理器同频下也要有10-15%的提升,如果再算上TSX指令、AVX 2.0指令以及更高频率的加成,那么实际领先幅度还会更高,能提升20%就非常逆天了。
期望2:图形核心性能几何?
图形核心性能相对来说是Intel的软肋,但是从Graphics HD 4000/HD 3000一路走来的过程来看,Intel在这方面其实进步明显,HD 4000显卡不仅可以轻松胜任各种高清播放加速,而且一般的3D游戏也能跑得比较流畅了,至少对50%的玩家来说Intel集显已经达到可以接受的地步了。
Haswell的图形核心比CPU架构还要神秘,迄今也没有准确的说法,有说EU执行单元从目前16个暴增到40个,就算不能等比例提升性能,提升50-100%的性能还是有可能的,再加上对DX11.1、OpenGL 3.2等主流规范的支持,这些仍然会大大改善Haswell的3D性能。
期望3:8系主板有啥新变化?
最后一个期待就着落在主板上,明年的8系主板相对来说升级非常小,USB 3.0接口数量是4个还是6个都没有确定,全SATA 6Gbps接口对主流应用也没什么影响,Lake Tiny对SSD的优化也不一定能测得出来。
不过8系主板只需要一个理由就能秒杀所有不足,因为LGA1150接口不兼容其他主板,这一点没得选择,想用Haswell处理器就必须换8系主板。
每个人的需求并不一样,所以这三个期待也无法代表所有人的选择。仅就目前的资料来看,Haswell还只是画了个大饼,TSX多线程优化、AVX 2.0指令能发挥多大威力尚未得知,距离传闻中的明年4月份发布只有几个月的时间,也许过不了多久就开始有各种测试爆料了,等数据来说话吧。
Haswell,你能对得住大家的期待吗?