新架构×1、新芯片×3、新整机×2、新集群×1:5岁的摩尔线程彻底爆发了!
  • 上方文Q
  • 2025年12月26日 10:52
  • 0

【十万卡集群的基础:AI训推一体芯片“华山”】

新架构×1、新芯片×3、新整机×2、新集群×1:5岁的摩尔线程彻底爆发了!

新架构×1、新芯片×3、新整机×2、新集群×1:5岁的摩尔线程彻底爆发了!

“华山”芯片基于花港架构而来,是一款专门面向AI训练与推理一体化的加速计算产品,可以支撑万卡级智算集群,构建下一代“AI工厂”。

按照官方说法,它的性能上已经全面超越NVIDIA上一代Hopper架构(图中Hxxx),并且能与NVIDIA新一代Blackwell架构(图中Bxxx)打得有来有回。

新架构×1、新芯片×3、新整机×2、新集群×1:5岁的摩尔线程彻底爆发了!

“华山”最突出的特性就是支持新一代异步编程技术,可以充分发挥每一个核心的算力。

该技术可以利用各种不同线程的同步效应,将负载任务自动、平衡地分配到每一个计算单元,确保它们都能始终高效率工作,不至于部分单元累死、部分单元空闲。

为此摩尔线程做了大量的工作,包括设计各种不同的调度机制等,从而让开发者可以无感去操作芯片,不用操心具体的负载分配细节。

新架构×1、新芯片×3、新整机×2、新集群×1:5岁的摩尔线程彻底爆发了!

“华山”还集成了新一代高性能Tensor张量计算系统。

首先是支持全精度,从32位到4位各种整数、浮点、张量数据格式都支持,尤其是大幅提升了FP6、FP4张量运算的性能,支持MTFP8/6/4混合精度计算。

新增TCE-PAIR模式,可以让两个TCE单元彼此共享同样的数据,增强内部数据重用,提升算子效率。

新架构×1、新芯片×3、新整机×2、新集群×1:5岁的摩尔线程彻底爆发了!

基于“华山”芯片进行横向、纵向的扩展,可以轻松打造十万卡级别的智算集群,每个节点的加速卡就有最多1024块。

为此,“华山”不仅支持摩尔线程自研的MTLink 4.0互连技术,还支持更多类型的开发互联协议,兼容不同硬件生态。

内置RAS 2.0以增强集群可靠性,包括支持SRAM奇偶校验、ECC、强化错误检测上报与隔离、全面升级调试能力等等。

新一代异步通信引擎ACE 2.0,则在每一个计算单元里面设计一个小的ACE,让更多的通信和计算可以并行执行,极大提升整体效率。


文章纠错

  • 好文点赞
  • 水文反对

此文章为快科技原创文章,快科技网站保留文章图片及文字内容版权,如需转载此文章请注明出处:快科技

观点发布 网站评论、账号管理说明
热门评论
查看全部评论
相关报道

最热文章排行查看排行详情

邮件订阅

评论0 | 点赞0| 分享0 | 收藏0