AI时代的基石是什么?是硬件与算力。
AI时代的发展靠什么?靠合作与应用。
英特尔的AI战略特点鲜明,一直坚持基于开放、可扩展的软硬件平台,打造全面覆盖云、边、端的解决方案,CPU通用处理器、GPU加速计算卡、AI加速器、NPU神经处理器等联合组成庞大的XPU阵营,可全面满足深度学习、机器学习、训练推理、生成式AI的多重需求。
最近,阿里云举办了盛大的云栖大会,芯片行业龙头英特尔也参加了此次大会,并且干了两件大事:
一是首次公开预览了下一代至强6性能核处理器的亮点,展示了其强大实力;
二是与阿里云联合预发布了基于该处理器的阿里云ECS第九代企业级计算实例,展示了其全面出众的能力。
【至强6处理器预览:兵分两路 各有所长】
CPU处理器方面,至强6在英特尔历史上有着“划时代”的意义,这可不是因为它改了新的名字,也不仅仅是首次引入了全新的Intel 3制程工艺,而是兵分两路,两手抓,满足用户和行业的多样化需求:
一是基于性能核的Granite Rapids,承袭了至强的一贯传统,面向计算密集型应用、高强度AI负载等场景,满足其对高算力、高性能的需求。
二是基于能效核的Sierra Forest,特别针对高密度计算、可扩展负载等场景做优化,能效更加突出。
同时,二者共享硬件平台、通用软件堆栈,不但大大简化了硬件设计与开发,还简化了硬件平台、系统固件软件的部署与管理。
至强6能效核已经发布了首批产品至强6700E系列,最多144核心144线程,性能核则即将推出,最高能做到128核心256线程,都支持DDR5内存、PCIe 5.0通道、UP链接、数据中心与AI加速器等先进技术。
至强6性能核针对AI负载做了全方位的针对性设计,比如最多12个内存通道,对比四代至强带宽提升最高达2.8倍,同时引入了新的MCR DIMM内存形态,带宽再次增加30-40%,从而可以从容运行对内存敏感的超大规模LLM模型。
比如内置AMX、QAT、AVX-512等加速器,配合oneAPI跨平台标准编程模型,AI推理训练负载的性能可提升多达2-3倍。
比如多达128个内核,结合AVX-512技术,可以更好地满足计算密集型AI与科学融合负载的性能,提升幅度最高达2.9倍。
而对于功耗、能效有特别要求的应用场景,至强6能效核则是完美之选,简单地说就是性能更好、功耗更低。
举例来说,144核心的至强6780E对比64核心五代至强铂金8592+,性能提升了多达18%,但是热设计功耗从350W降低到了330W。
同时,至强6能效核的功耗随负载强度呈基本线性增加,尤其是当负载率在40-60%的时候,能够节省多达280W的功耗,综合能效提升了2.4倍。
这意味着什么?
以往需要200个机架才能达成的算力性能,如今只需66个,节省了超过2/3的空间,而且在4年的使用周期内可节省8万兆瓦的能耗,相当于二氧化碳减排3.4万吨。
总之,英特尔通过“两条腿走路”的至强6性能核、能效核产品路线图,再次彰显了它对于AI的坚定承诺和深入布局:
围绕CPU处理器这一通用平台,打造结合开放、统一的软硬件平台,并针对不同应用场景和需求优化设计,满足千行百业的广泛需求。
当然,很多人说起AI,往往会首先想到GPU加速器,诚然其性能强劲,但随之而来的是无法控制的极高功耗、极高价格,一般企业难以承受,而且缺乏足够的通用性与灵活性,而这正是CPU处理器的强项,也正是英特尔坚定推进的。
至强6改变了以往的传统处理器设计理念,在AI的浪潮下快速转身,分为性能核、能效核,各取所长,针对性地满足不同AI应用负载与场景,更加凸显了CPU的灵活性。
与此同时,英特尔也并非只抱着CPU处理器不放,XPU战略的远景就是打造多硬件、一体化、开放灵活的硬件算力平台,再加上丰富、弹性的软件开发平台,以及广泛、深入的行业合作,为各行各业提供强大、丰富的解决方案,让AI真正无处不在。
【阿里云第九代企业级计算实例:数据中心迈进一大步】
说到行业影响力,英特尔一直堪称执牛耳者,与阿里云也有着持久、深厚的友谊,尤其是在服务器技术、计算产品、云产品上持续深度合作,为客户提供安全、稳定、高性能、弹性的云上算力服务。
回顾历史,阿里云联合英特尔率先在国内部署了浸没式液冷技术,打造了磐久高性能存储服务器,推出了高级RAS、硬件动态内存刷新控制等先进的软件创新,共同推动CXL、UCle、UALink等开放互连标准建设,并联合推动Alinux、OpenAnolis社区的发展。
阿里云ECS第七代实例与英特尔联合开发,并在全球范围内率先发布基于SGX的安全增强型实例。
第八代实例充分利用了英特尔AMX矩阵加速引擎、QAT技术等,并发布业界领先的TDX机密虚拟机。
本次预发布的第九代企业级计算实例,又率先引入了至强6性能核处理器,算力性能、能效比、扩展连接性以及安全、稳定性等各方面都再上新台阶,性价比也大幅提升多达30%,可满足企业用户多层次、多场景的AI业务需求。
因为至强6性能核处理器还没有正式发布,具体规格公布的不多,只知道有12个内存通道,内存频率6400MT/s,三级缓存增大50%等等。
不过官方给出了一系列性能指标,堪称全方位的性能飞跃,比如对比上代实例数据库性能提升17%,Web应用性能提升20%,Java应用性能提升15%。
另外,IO性能也获得了极大的飞跃,包括连接数提升200%,云盘密度提升100%,整机IOPS随机能力提升20%,等等。
至强6性能核内置的AI加速器也威力不小,比如AMX高级矩阵扩展加速引擎,支持INT8、BF16、FP16等多种数据类型和矩阵运算加速,ResNet50性能提升2倍,Bert性能提升1.7倍。
再比如QAT支持原生硬件加解密,减轻CPU负担,web加解密性能可提升4-6倍。
本次云栖大会上,英特尔还分享了与阿里云合作的基于至强平台的多个AI实践案例。
比如视频领域的画质修复、一键生成、视频搜索等,药物研发等生命科学领域的多个面向不同场景的AI大模型,等等。
可以说,AI会像当初的互联网革命一样,再次从根本上颠覆几乎每一个科技相关行业:教育、医疗、金融、零售、政企、能源、汽车、制造、电信……
预计到2026年,超过80%的企业都会使用生成式AI,50%的边缘部署都会涉及AI,全球生成式AI相关支出将超过3000亿美元。
预计到2040年,生成式AI将为全球经济贡献4.4万亿美元价值。
谁能把握住这一生成式AI的浪潮,谁就能掌握主动权,站在时代的最前列,这也与英特尔“让AI无处不在”的战略不谋而合,而至强6,恰恰是推动新一代数据中心演进的“核动力”。