快科技5月11日消息,随着AI需求转向推理时代,算力不再是主要瓶颈,内存墙的问题愈发严重,高带宽低延迟的内存架构成为挑战,现在国内公司也通过架构创新实现了飞跃。
日前新紫光集团宣布推出“紫弦”三维化近存计算(PNM)架构,以3D DRAM为核心,首创3.5D异质异构集成方案,存储带宽可达30TB/s。
这是什么概念呢,目前AMD及NVIDIA再用的HBM3e显存单个带宽也就1.2TB/s,B200显卡带宽也就做到了8TB/s,紫弦的30TB/s带宽可以说碾压性领先。
不仅如此,该架构的延迟也非常低,PNM近存计算模式下访存延迟最大降低18倍。
与NVIDIA的B200显卡相比,模拟仿真显示同等算力下Token吞吐率较B200系列高出1.5至2倍以上。
这次发布的技术也不只是纸上谈兵,新紫光强调该技术可规模化量产,更重要的一点是不会被国外技术限制,它是基于国内领先供应链做的可规模化量产。
不过该技术具体什么时候量产上市还没消息,只能说国产的AI系统完全可以在先进制程受限制的情况下,通过架构和技术创新走一条不同的路。


