近日,新一代旗舰开源大模型GLM-5.2发布,海光DCU产品已实现Day 0极速适配。国内开发者无需经历漫长的等待与代码重构,即可在搭载海光DCU的国产算力平台上体验其完整性能与满血实力。
GLM-5.2是智谱面向Coding与长程任务打造的旗舰开源模型,代码能力位居开源模型之首。在全球百万开发者参与的Code Arena前端盲测中,GLM-5.2位列全球可用模型第一。在Terminal-Bench 2.1(AI Agent命令行操作评测)中,GLM-5.2比Claude Opus 4.8低4%,较前代GLM-5.1提升17.5%;在MCP-Atlas(工具使用评测)上距Opus 4.8仅0.8%差距。综合Coding实力大致位于Opus 4.7至4.8区间,主流编程基准保持开源SOTA。
![[MD:Title]](http://img1.mydrivers.com/img/20260617/e3243c16-f818-4957-beb0-8bb3ff4c7057.png)
本次适配的核心亮点在于对Solid 1M(100万)无损上下文的完美支持。过去,受限于算力带宽与显存管理效率,长上下文往往在实际应用中出现性能劣化。而海光DCU凭借其高带宽内存访问能力和针对长序列推理的优化指令集,成功支撑了GLM-5.2模型在1M上下文窗口下的稳定表现,为“长程任务”提供了坚实的物理基础,这种能力让AI从“辅助对话”进化为“自主执行”,极大地释放了开发者的生产力。
海光DCU针对GLM-5.2的双核心场景进行了深度优化。长上下文推理方面,通过内存调度机制优化与IndexShare技术(在每四层稀疏注意力层之间复用索引器),1M上下文下单位Token的FLOPs消耗显著降低,确保超大规模序列处理的稳定性与效率。代码生成方面,对关键算子专项调优,保障复杂系统工程中的推理性能。
![[MD:Title]](http://img1.mydrivers.com/img/20260617/0f41e086-cfd6-4e3b-8d10-67577b703697.png)
在实际长程任务中,海光DCU为GLM-5.2提供了持续稳定的算力底座。模型可在平台上连续完成覆盖Web、移动端与小程序的多端应用开发,累计处理88万以上的tokens。此外,凭借IndexShare架构与海光DCU硬件特性的深度契合,双方共同实现了在有限算力资源下处理超大规模任务的可能。这不仅意味着国内开发者无需等待即可在国产平台上体验到媲美国际顶尖水平的模型性能,更意味着核心数据与关键业务逻辑可以在完全自主可控的算力底座上安全运行。
海光信息与智谱正持续推进GLM-5.2的深层优化,进一步释放硬件潜力。双方后续将围绕长程任务与代码能力展开更多场景化验证,推动模型在真实软件开发与系统优化中的规模化落地。

