Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心
  • 上方文Q
  • 2021年04月08日 21:54
  • 0

说到处理器,对于大众用户而言,关注最多的自然是距离最近的桌面、笔记本消费级产品,而作为厂商最新技术的最强代表,服务器、数据中心才是真正的杀场。

3月16日,AMD发布了第三代霄龙7003系列(代号Milan),拥有7nm工艺、Zen3架构、64核心128线程等傲人规格。近几年,AMD在数据中心领域也是不断取得突破,市场份额已经从当初的0.7%,来到了7%之上。

但在这个庞大的市场上,Intel依然是王者一般的存在。虽然单看产品性能参数可能有些不敌,但无论是多达13倍的市场份额领先,还是全面丰富的技术特性,抑或更广阔的生态应用系统,都不是一个数量级。

事实上,这么多年来,Intel至强几乎已经等于服务器、数据中心的代名词,2013年至今累计云端部署超过10亿个核心,云服务商超过800家,发展了三代的可扩展至强累计出货也已超过5000万颗。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

现在,Intel终于带来了第三代至强可扩展平台Ice Lake-SP,再次将自己的优势展现得淋漓尽致,尤其是丰富的产品矩阵。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心 本次中国区发布会选在了首钢园三高炉,颇有赛博朋克气息,也是冬奥会场地,往昔与未来在这里交织

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心 Intel副总裁兼中国区总经理王锐发表主题演讲

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

新至强拥有全新的10nm制造工艺、最多40核心80线程、全新Sunny Cove CPU架构、20% IPC性能提升、46%平均性能提升、74% AI推理性能提升,堪称Intel至强近年来最大的一次飞跃。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

但是,新至强不是单打独斗,周边围绕着Intel GPU、XPU、FPGA、内存、存储、连接、安全等等各条产品线和技术,从而构成一个软硬结合的完整解决方案。

此前已经陆续发布的傲腾持久内存Pm200系列、傲腾SSD P5800X、闪存SSD D5-P5316/D7-P5510、20万兆以太网卡E810、Agilex FPGA等等,这些都是新至强的得力助手,互相结合大大拓展了整体平台的实力。

按照Intel的说法:“我们没有把至强称作一个服务器产品,它是一个数据中心产品。”

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

需要指出的是,去年6月19日发布的Cooper Lake,也是属于第三代至强可扩展家族,区别在于Cooper Lake只用于四路、八路市场,而新的Ice Lake-SP则是针对单路、双路市场。

说起来,Ice Lake-SP可谓命运多舛,发布时间一再延迟,主要是和新上的10nm工艺有关,而且引入了全新架构(Cooper Lake还是14nm和老架构),导致同一家族的两个系列产品间隔了将近10个月。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

当然了,对于数据中心平台而言,正式发布并不是开始,事实上在发布之前,Ice Lake-SP已经出货了20多万颗,拥有了极为丰盛的产品、方案。

王锐也表示:“至强处理器的出货有保证,特别是数据中心。我们在全力提升产能,实际的提升比计划更高。”

另外在新的CEO帕特·基因格上任后,Intel已经在大刀阔斧地变革自己,包括加速推进新架构新工艺新产品,强化制造和产能,开放代工和外包。

接下来,我们就从架构技术、性能、生态三个方面,深入了解一下Ice Lake-SP。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心 Intel市场营销集团副总裁兼中国区数据中心销售总经理陈葆立展示Ice Lake-SP

一、架构技术:全面翻新、延迟优秀

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel提出,新至强最值得关注的变化,主要有三个方面,一是目前唯一內建AI加速的x86数据中心处理器,二是高级先进的安全解决方案,三是可扩展性、灵活性、可定制性。

接下来的解读中,我们也会逐一涉及这三个方面。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

架构方面,新至强引入了Sunny Cove,也就是轻薄笔记本上Ice Lake-U 10代低功耗酷睿平台的同款(事实上二者处理器代号都是相通的),都是首次结缘10nm,当然这次针对数据中心应用做了调整优化。

至于为何二者发时间错开了一年半,笔记本端去年都已经进化到第二代10nm Tiger Lake,架构也已升级为Willow Cove,你应该懂的。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

简单来说,Sunny Cove架构改进了前端部分,容量更大,分支预测更精准,加宽加深了流水线,结构和执行资源上规模更大,同时增强了TLB、单线程执行、预取等环节,还针对数据中心重点优化了缓存、矢量吞吐等部分。

对比二代可扩展至强Cascade Lake,新至强的最大核心数从28个增加到40个。

对于为何选择40核心这个节点,陈葆立表示,这是根据整个产品迭代所做的一个比较好的平衡,无论是核心数,还是不同工作负载的加速指令、配套的产品,设计芯片需要做很多事情,尤其是把功能做好是最优先的,能够更好地满足客户需要,而不是纯粹选一个核心数。

当然,不同的设计策略也决定了核心数量。AMD霄龙是多个小芯片组成,虽然每个小芯片最多也才8个核心,但可以通过“并联”轻松堆砌更多核心。

Intel则依然坚持单芯片设计,再加上制造工艺、内部架构,天然决定了不容易扩展太多核心,不过Intel也在不断推进各种先进封装技术,未来的芯片规模有望实现突飞猛进。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

每核心缓存一级从32KB增大一半来到48KB,二级从1MB增大四分之一来到1.25MB,三级而从1.375MB小幅增大1.5MB,并支持Hemisphere高性能交错模式。

内存支持从六通道DDR4-2933扩展到了八通道DDR4-3200,并改进内存调度器实现更低的延迟、更高的带宽,而且还有傲腾持久内存200系列这个杀手锏。

处理器间互连通道还是两条或三条UPI总线,但是带宽从10.4GT/s扩大到11.2GT/s,同时首次原生支持PCIe 4.0,通道数也从48条增加到64条。

独家的AVX-512指令集这次增加了大量的新指令,涉及到加解密、压缩解压、安全等各个方面,可扩大应用范围、提升性能,这也是Intel一贯的长项。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel还和新发布的AMD三代霄龙做了正面对比,强调了自己在缓存延迟、内存延迟方面的优势。

缓存延迟方面,新至强的一二级其实比三代霄龙还稍微高一些,但三级就完全不一样了,毕竟一个是单Die,一个是多芯片,不再同一个数量级,尤其是霄龙涉及到跨Die通信、跨处理器的时候,延迟可以达到新至强的两倍甚至五倍。

内存方面,新至强的通道数、频率算是追平对手,但是延迟低得多,而且有独家的傲腾持久内存加持,单颗处理器支持最多4TB DDR4内存,或者4TB DDR4+2TB傲腾内存。

三代霄龙最多支持3TB DDR4,其实也可以搭配傲腾内存,但最大容量仅为1.5TB,而且关乎运行模式、平台联动、指令和应用优化,估计几乎不会有客户会去这么搭配,AMD也坦承一切取决于客户自己的部署。——有点像Thunderbolt雷电技术。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

指令集这个东西,一直都是Intel占据领导地位,这次也新增了大量新指令,包括大数算数(AVX-512整数IFMA)、矢量AES、Caryy-less乘法指令、伽罗华域新指令、SHA-NI、VBMI等等,就不展开讲了,大家只要看看后边的性能提升就明白它们的威力了。

很多时候,一条指令的加入,很容易就可以在特定负载中带来数倍乃至数十倍的性能提升,远不是单纯改进硬件就能媲美的。

Intel技术专家表示:“工作负载加速器指令就好比性能倍增器,它提供的增益要比仅向处理器添加核心所能带来的增益高很多。”

Intel副总裁兼至强处理器与存储事业部总经理Lisa Spelman也强调说:“几年前开始我们就开始早早投资指令集和软件,这个战略正在产生巨大的回报。”

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

安全也是数据中心必不可少的关键一环,新至强的一大重点就是支持SGX软件防护扩展技术,它面世已经好几年,这是第一次登陆至强可扩展平台,用于双路系统。

它具备持续增强的安全能力,并通过了数百次的调研和生产部署,可大大缩小系统内的攻击层面,抵御各种攻击途径,保护敏感代码和数据,而且指定位址空间可隔离并处理最多达1TB的代码与数据,满足主流工作负载的需求。

尤为值得一提的是,SGX安全技术是独立于操作系统、硬件配置的,不受软硬件变动的影响和约束,部署更方便,效果也更明显,即便是操作系统、BIOS、驱动、虚拟机都被攻击了,它依然能保护数据。

再结合全内存机密技术、平台固件弹性技术,新至强可以真正解决敏感的数据保护问题。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

说了半天,大家可能会问,这次到底发布了什么产品?真的是相当相当丰盛。

如上图,最左侧一列是此前发布的四路、八路Cooper Lake,中间和右侧是新发布的单路、双路Ice Lake-SP,按照产品线分为铂金、金牌、银牌三个序列(没有了最低端的铜牌)。

按照应用方向,则分别注重单核性能、扩展性能、SGX安全性能、网络优化、云优化、媒体处理优化、长寿命、单路型、液冷散热等等,划分得非常细致,当然不同类型有所交错,有的型号可适用于多个方面。

Intel还为不同版本加上了不同的字母后缀,包括V(SaaS云)、P(IaaS云)、S(512GB SGX)、Q(液冷散热)、Y(SST-PP 2.0)、N(网络/网络虚拟优化)、M(媒体处理优化)、T(长寿命与扩展温度范围)、U(单路)等等,着实有点眼花缭乱。

顶级旗舰是至强铂金8380,40核心80线程,基准频率2.3GHz,全核加速3.0GHz、单核加速3.4GHz,二级缓存50MB,三级缓存60MB,热设计功耗270W,批发价8099美元。

相比之下,上代旗舰至强铂金8280 28核心56线程,频率2.7-4.0GHz,二级缓存28MB,三级缓存38.5MB,热设计功耗205W,批发价10009美元。

这代最强的28核心是至强金牌6348,频率2.6-3.5GHz,二级缓存35MB,三级缓存42MB,热设计功耗235W,价格3072美元。

两相对比,同样核心的时候,新一代频率低了不少,热设计功耗反而高了,这也是这代的普遍趋势,10nm对比炉火纯青的14nm还是差点劲,不过价格降到了只要三成!40核心也比上代28核心便宜了两成!

4/6核心型号取消,改为直接8核心起步,而基准频率最高3.6GHz的至强金牌6334,就是一款8核心,但这已经是极限了,最高加速此时也只有3.7GHz,而热设计功耗达到了165W,上代可是还有多款型号加速到了4.5GHz。

热设计功耗最低的也有105W,包括8核心的至强银牌4309Y、10核心的至强银牌4310T,频率分别为2.8-3.6GHz、2.3-3.4GHz。

另外注意有个特殊的液冷散热型至强铂金8368Q,38核心,频率2.6-3.7GHz,热设计功耗270W,可能是偏向OEM定制。

其他型号就不一一解读了,感兴趣的可以自己慢慢对比。

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心

Intel 10nm至强隆重登场:46%飙升、40核心25倍性能碾压64核心


文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0