在中国信息通信研究院举办的“2024可信云大会”上,阿里云飞天企业版凭借“一云多算”能力拿下“可信云技术最佳实践”奖。此外飞天企业版还通过了《“云+应用”一体化运维能力要求》、《行业云平台一体化运营平台评估L4卓越级》等多项评估。
随着大模型的爆发,政企领域迎来新一轮算力需求。一方面,不同架构GPU芯片统一管理调度已成大势所趋,算力共池、统一调度成为普遍面临的挑战;另一方面在并行计算性能上,由于GPU服务器和集群的网络性能仍待提高,模型计算的实际效率目前相比理论计算效率仍有较大提升空间。
阿里巴巴研究员、阿里云专有云总经理刘国华表示,政企业务的多元性需要底层多样化算力资源的支持。为了充分利用云计算灵活弹性的优势,“一云多算”已成为专有云必须建设的核心能力。
阿里云飞天企业版“一云多算”具有以下能力:
-异构资源,统一管理:
针对多种GPU资源、不同工作任务负载,飞天企业版可实现异构资源统一管理与优化。
-多元算力,统一调度:
通过将多样化算力在同一VPC网络内统一调度,飞天企业版可实现秒级供给,数据无缝打通、冷热分层存储,多租户安全隔离。
-软硬件性能优化,加速模型推理:
基于软硬件性能优化,飞天企业版支持多种国产GPU芯片的的训练和推理场景,千POD级推理任务分钟级启动,推理任务加速比可优化50%以上。
-原生混合云解决方案:
基于飞天企业版混合云管理平台,可打通公共云AI算力资源池,支持在统一AI平台调度下的公共云训练+专有云推理的AI任务调度,支持模型+数据+镜像的统一数据管理,用户可以对接ModelScope和三方MaaS平台,下载社区模型和镜像,并在本地专有云进行推理。
在安全方面,飞天企业版可以通过专线连接公共云安全中心,支持模型文件加密、数据传输加密,充分做好大模型应用的安全防护。
-可运营的云:
飞天企业版为客户提供统一运营运维系统,基于完善的计量能力和运营支撑能力,支持AI算力及模型的运营,同时提供智算运营门户,帮助政企客户构建可持续运营的AI云平台。
十年来,阿里云飞天企业版已服务超过1000家大型政企客户,包括30+部委及直属单位、31个省/自治区/直辖市,以及超90%央企,成功保障了杭州亚运会等大型活动。目前,飞天企业版“一云多算”技术已广泛应用于高校科研、智算中心、行业大模型平台等。