今年年初,AMD正式宣布了锐龙7000系列移动处理器,包含多条不同的产品线,7045、7040、7035、7030、7020……应有尽有。
其中,锐龙7045、锐龙7040无疑是最受关注的。
锐龙7045或者说锐龙7045HX系列代号Dragon Range,基本上就是桌面上的锐龙7000系列移植到笔记本平台上,可以说是迄今最强悍的移动处理器.
它拥有5nm制造工艺、chiplet小芯片架构、Zen 4 CPU架构、最高16大核32线程、最高5.4GHz加速频率、双单元RDNA 2架构内置显卡,热设计功耗55W+。
锐龙7040或者说锐龙7040H/HS/U系列代号Phoenix,可以说是整个家族中最闪亮的明星,是主流游戏本、高性能轻薄本的上佳之选,因为它集成了AMD乃至整个移动行业迄今最先进的技术特性。
这不但包括4nm制造工艺、Zen 4 CPU架构、RDNA 3 GPU架构,其中全新的Radeon 780M核显达到了前所未有的高度,更是在x86处理器中第一个集成了独立的AI引擎单元,可为诸多应用场景提供高能效的加速效果。
针对不同应用设备和场景,锐龙7040系列还可以在35-54W、15-28W的不同热设计功耗范围内调节,甚至衍生出了专为掌机优化的Z1系列,热设计功耗9-30W。
锐龙7040系列的特点乃至性能大家应该都不陌生了,这里我们重点聊一聊它集成的锐龙AI引擎。
AI无疑是当下最为火爆的科技话题,有着无限广阔的未来,同时也有着多样化的实现方式、应用场景,整个行业都在深度耕耘。
事实上,AI本身无论概念还是技术,都处在一个不断演化的过程中,也在随着应用需求的变化而不断拓展提升自己,是技术与应用相互促进、持续升级的一个典型。
最早的AI,只能处理一些传统的固定编码算法,必须由人类编程,比较死板。
如今的AI则基于神经网络,越来越接近人脑在海量神经元之间传输、处理数据的模拟运作方式,再加上机器学习的反复、海量训练,能够越来越灵活、弹性地处理数据,展现出来的结果越来越像是一个真正的人在说话、做事,而不是冷冰冰的、死板的机器。
正是越来越聪明的AI,改变着人类的工作、生活、娱乐,影响着人类的方方面面,甚至可以说关乎人类未来的发展。
AI做得好不好,关键是看用户体验,而用户体验做得好不好,要看基础硬件、核心算法、生态优化等多个层面的综合实力,而拥有这种综合实力的厂商,屈指可数。
作为基础芯片大厂的AMD,不但同时拥有高性能CPU、GPU产品,在收购了赛灵思之后,更是组建了全套的AI解决方案,无论是云侧还是端侧,都正在大展拳脚.
锐龙7040系列的AI引擎就是其中在端侧一个爆发点,可能会深刻影响未来人们使用笔记本的方式。
首先的问题是,我们为什么需要在x86处理器中加入一个本地的、独立的AI引擎?
对于很多端侧AI推理应用来说,一方面,依赖云侧的话必须等待相应资源和服务的到位,而且不可避免地会受到互联网速度、延迟的影响,体验很不稳定。
另一方面,传统的CPU处理器虽然完全可以搞定,只不过基于缓存、内存体系的CPU架构,本身就不是为AI推理而生的,效率和能效自然高不到哪里去。
尤其是缓存和内存之间固定的、共享的互联通道和有限的带宽,会成为数据传输和处理的瓶颈,也无法提供足够的专用算力。
AMD的锐龙AI引擎基于专门设计的XDNA AI架构,核心是多个独立的AIE单元,加上多个独立的内存电压单元以及对应的内存控制器,并有独立的高速互连通道。
XDNA AI架构可以脱离云侧依赖,直接在本地无延迟地灵活处理不同的AI神经网络,包括CNN(卷积神经网络)、RNN(循环神经网络)、LSTM(时间递归神经网络)等,并支持INT8、FP16、FP32、BF16等各种数据类型,还具备实时多任务能力,可处理最多4条并发空间流。
峰值算力可以达到10TOPS(每秒10万亿次计算),而且因为是专为AI推理负载设计的,因此具备远超CPU/GPU的能效。
这样的架构设计也完美解决了CPU架构处理AI时的劣势,一方面拥有独立的互连通道,不存在任何阻碍,应用可以确切地知道自己可利用的资源和可达成的效果。
另一方面AI引擎单元有专属的本地内存空间,不但可以提供更充裕的带宽,也不存在缓存命中缺失的问题。
同时,AMD锐龙AI引擎改变了推理模型的处理方式,不再像传统神经网络那样,只能在多个“神经元”之间一层一层地逐次流动,而是采用了全新的适应性数据流架构和适应性互连。
这种设计可以针对不同负载、模型、数据,由不同单元、层级进行同步处理,从而大大提高性能、效率和能效,还可以由开发者进行定制,找到更适合特定负载的处理方式,实现效率最大化。
硬件和架构再优秀,算力再强大,最终还是要看用户体验,取决于系统、应用如何将AI能力落到实处。
目前,AMD已经与微软联合做了大量工作,Windows 11系统正在逐步释放锐龙AI引擎的能力,并直接集成在系统设置中,使用方法异常简单。
比如对于摄像头的使用,可以直接开启增强背景模糊、自动跟随、眼球识别等等,这些功能在视频会议中非常实用,现在可以交给锐龙AI引擎高效处理。
未来,锐龙AI引擎还会在更多领域大战拳脚,比如内容创作,几句话就能将概念设想变成实际的艺术品,Adobe Premiere Pro等生产力软件也可以利用AI硬件加速。
比如智能工作助手,安排日程、撰写演讲稿与邮件、整理预算、制作PPT、语音转文字等等,都可以让AI帮助你高效完成。
比如生活助手,AI可以精准、快速地整理归档大量照片、图片、视频,方便家庭回忆或朋友分享。
比如视觉与游戏增强,AI生成的画面可以直接插入游戏中,提升帧率还有同样出色的画质,AI驱动的NPC角色与实时对话、互动,可以让游戏更有真实感,更有“人性”。
当然,以上很多场景现在也已经能够实现,但要么依赖云端大模型,要么依赖高性能CPU/GPU,而现在有了独立的AI引擎,可以随时随地高效完成,尤其对于笔记本来说,可以彻底解放CPU/CPU资源,提升系统性能,也可以大大延长电池续航。
另外,锐龙AI引擎在安全性、隐私保护上也更优秀,因为本地AI网络不依赖云端,数据都是直接在本地完成,不用担心个人数据和内容泄露,更不会成为神经网络模型的一部分。
AI应用是需要生态培养的,锐龙AI也正处于起步阶段,目前还不能发挥全部实力,但到了今年晚些时候,就会基本成熟起来,开发者使用起来也会更加得心应手。
届时,一体化的AMD AI堆栈,可以综合利用CPU处理器、XDNA引擎的算力与能力,支持ONNX、TensorFlow、PyTorch等多种模型,微软、OEM厂商、ISV独立软件开发商、个人开发者都可以自由使用它们。
目前,华硕、宏碁、惠普、联想、雷蛇、机械革命等厂商正在陆续推出各自的锐龙7040笔记本产品,带来全新的移动AI体验。
比如雷蛇灵刃14,标配高端的锐龙9 7940HS处理器,同时还有1.84kg/17.99mm好身材、RTX 4060/4070 140W满功耗显卡、VC真空腔散热、14英寸240Hz高刷屏、最高64GB DDR5-5600内存、最高4TB SSD、68.1Whr大电池和最长10小时续航等。
RTX 4060、16GB、1TB 2399.99美元,RTX 4070、16GB、1TB 2699.99美元、RTX 4070、32GB、1TB 2799.99美元,6月20日上市,届时快科技也会为大家带来首发评测。