9月21日,华为云CTO张宇昕在华为全联接大会2023主题演讲中表示,大模型重塑千行万业的背后,是众多复杂的技术挑战,需要核心技术的持续创新和突破。华为云以全局的系统性创新,不断攻坚克难,构建AI时代最佳云底座。
华为云CTO张宇昕
张宇昕指出,随着大模型出现能力涌现、多模态融合、MOE等趋势,模型参数将从现在的5400亿很快超过数万亿,对海量的稳定算力、大规模并行训练、以及整体的架构设计都提出了更高要求;同时,数据集规模和Token长度的激增也将带来新的挑战。这些挑战相互影响、环环相扣,可以说大模型及相关应用是迄今为止最复杂的软硬件系统工程。
为应对AI时代的挑战,华为云实现了软硬件结合的系统性创新:
在系统架构层,华为云QingTian架构全新升级分布式QingTian架构,通过打破计算、存储、网络的边界,把过去主从式架构升级为对等架构,极大地提升了AI算力。
基于分布式QingTian架构,华为云昇腾AI云服务提供了算力集群、计算引擎CANN、AI开发框架MindSpore和AI开发平台ModelArts,为大模型和AI应用的开发、运行提供最佳算力服务。
在数据处理层,华为云提供云上全流程一站式能力,包括数据存储、分析、共享、标注方案,让企业实现大模型数据“找得到”“存得下”“记得住”“用得了”。
在AI云存储方面,华为云独创了具备220TB超大带宽和微秒级超低时延的内存服务EMS,以此支持NPU/GPU的内存扩展,可以容纳PB级超大规模参数,让参数存得下;同时,基于SFS Turbo文件存储的大并发、高吞吐缓存服务,可提供千万级IOPS,将10亿条数据和元数据的准备时间从100小时缩短至5小时,让数据准备速度快;此外,基于OBS对象存储构建的低成本大容量知识湖服务,通过深度归档、智能存储分级和存储管理统计平台实现数据精细化管理,数据和向量的存储TCO降低30%,让海量数据存得起。
作为大模型的“超级外脑”,向量数据库是AI时代的刚需产品。华为云GaussDB向量数据库具备千亿级大规模向量数据快速查询更新的能力,检索规模提升10倍,查询时延<10ms,响应速度提升2倍。另外,GaussDB向量数据库具有千维查询能力,查询结果更精准,助力企业业务更智能。
数据是大模型的源泉,华为云数智融合平台通过统一的数据资源和元数据技术LakeFormation等四大关键技术为大模型提供更高效、高质量的数据底座。同时,华为云全新发布智能数据洞察产品DataArts Insight,对数据资产进行了语义扩展和领域知识关联,让大模型在消费阶段的调优和推理效率倍增。
为了给大模型高质量“供数”、让大模型高安全“用数”,华为云推出了高质量、高安全的数据要素流通解决方案:基于TICS隐私计算和区块链BCS服务,提供可信数据开发环境,帮助客户把高价值数据变成高质量数据集产品,实现可用不可见、全流程可溯。EDS交换数据空间支持20多种控制策略,让数据在授权范围内可信地流通。
此外,为了给大模型训练打造安全高效的AI标注环境,华为云推出AI标注云桌面,让分散在各地的标注员可以远程接入;敏感数据始终保存在云端安全专区,满足安全合规的要求;同时,云端实时加载,结合华为云HDP高清显示协议毫秒级传输,实现图像本地显示时延降低50%以上。
在模型训练层,华为云通过盘古大模型的“5+N+X”的架构实现分层解耦,赋能千行万业,让每个行业、每个企业基于自己的场景都可以拥有自己的大模型。盘古大模型L0层提供了5个基础大模型,包括自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型,提供满足行业场景的多种技能;L1层包括N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,也可以基于行业客户的自有数据,在盘古大模型L0或L1层基础上,为客户训练自己的专有大模型;L2层为客户提供更多专注于具体应用场景或特定业务的模型,提供开箱即用的模型服务。
在应用开发层,华为云整合了应用开发需要的开发生产线、低码/无码平台、AI应用框架及全新的AI应用工程套件,让客户轻松实现基于大模型的AI原生应用的零门槛构建。
例如,大模型应用既需要多样化的AI原生技术,又需要强大的工程能力,同时也要具备小颗粒、敏捷部署能力。为此华为云打造了AI应用框架:首先,将一系列的AI原生技术构筑成后端服务,形成BaaS for AI能力,调用即可得;其次,将大模型的工程经验做成工程平台,让开发者以5倍速全链路开发行业大模型及应用;最后,基于Serverless技术,通过面向AI全新升级的FunctionGraph 3.0提供AI的前端开发框架,利用其“胶水”式拼接能力,将BaaS for AI 后端和大模型工程套件快速拼接、无缝集成。
张宇昕表示,华为云这些系统性创新的云服务能力,可以跨云、网、边、端等多平台,以及公有云,边缘云、混合云等多形态,实现灵活自由的部署和应用。对于建立专属AI平台和大模型的需求,企业可通过华为云Stack平台,在自有数据中心部署AI云服务和大模型的关键产品,一站式建设专属大模型。会上,张宇昕正式发布华为云Stack 8.3,相关服务将于9月底全面上市商用。