“京东言犀大模型 ‘源于产业、服务产业’,具有更高的产业属性、更强的泛化能力和更多的安全保障。”7月18日,京东集团技术委员会主席、京东云事业部总裁曹鹏在2023中国互联网大会开幕式演讲时表示。
就在几天前,京东对外推出言犀大模型及言犀AI开发计算平台。与通用大模型相比,这一参数达千亿级“高效率、低成本、低门槛”的产业大模型,源于产业土壤,更懂产业诉求,致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。
言犀大模型瞄准产业价值
早在2017年,京东就旗帜鲜明地提出“技术!技术!技术!”战略。京东认为,研发技术不应当只关注商业价值,更要承担起产业和社会责任。对此,曹鹏详细阐释了京东的技术追求:成本、效率、体验、可信、普惠、突破。
成本、效率和体验是从京东的经营理念传承而来,也是零售的第一性原理。可信、普惠和突破则是技术服务于产业和社会的承诺。这些技术追求的内涵,在以大模型为代表的AI技术领域,能够让产业伙伴更放心和信赖地实用技术,帮助技术走出实验室和公司围墙,在产业场景发挥价值。
天然具有产业基因的京东,为产业大模型提供了“最佳试验田”。言犀大模型源于产业、服务产业,在京东自有的健康、物流、零售等产业场景磨炼成熟后,将陆续对外开放服务,让大模型的价值在产业场景真正落地。
基于此,曹鹏介绍了言犀大模型三步走战略:现阶段,基于京东集团核心产业数据,京东于7月13日推出言犀大模型与大模型计算开放平台;今年内,应用于京东域内多项核心业务,通过模型精调提升专业域任务能力;在明年上半年,将面向京东域外重点产业场景全面开放大模型能力,向产业输出可用、可控、可信、可负担的定制化模型。这背后是言犀大模型对于算力、场景、产品的扎实实践。
会上,曹鹏介绍了大模型和营销的结合如何带来全新的营销模式:AI增长营销平台,是京东科技市场和平台运营团队,依托日常的金融营销工作,结合大模型应用的探索。通过对营销的理解,以及用户运营经验的持续积累,大模型解决了诸如关键性任务,动态适应性、用户体验等问题,大幅优化了营销运营流程,降低运营人员的学习成本与操作成本,实现方案生产效率上百倍提高;将过去涉及产品/研发/算法/设计/分析师等5类以上职能才能完成的流程,压缩至1人;同时,一个入口的全新交互模式,让人机交互次数从2000次降低至少于50次,将操作效率提升了超过40倍。
数字基础设施助推大模型服务千行百业
为了降低企业享受大模型技术红利的门槛,京东把大模型的底层能力解耦出来,推出了言犀AI开发计算平台,该平台将于8月上线。
将大模型能力迁移到产业领域,实现垂直行业的“智能涌现”,并非易事。高质量的行业知识作为稀缺要素,决定了大模型的“智商”。言犀AI开发计算平台沉淀了京东在零售、物流、健康、金融等行业多年积累的知识,通过算法工具集成到平台,并部署了京东技术团队开发出的100多种训练和推理优化工具,结合低代码应用平台,为客户提供从数据建设到模型应用的一站式服务。不到一周时间,用户即可完成从数据准备、模型训练到模型部署的全流程;之前需要10余人的科学家团队工作,现在只需要1-2个算法人员;通过平台模型加速工具优化,节约90%的推理成本。
为了应对大模型训练对AI算力的迫切需求,最新升级的混合多云操作系统云舰,通过创新的异构计算池化技术,实现GPU/NPU资源成本下降50%,全面支持多云多芯多活,助力企业渐进式完成国产化替代;最新版存储平台云海,单集群每秒读写性能提升5倍,达到行业领先的千万级,延迟时间低至百微秒,存算分离技术使成本降低30%。
传统数据库面对大模型训练的图片、音频、视频等非结构化数据,显得捉襟见肘,此时,专门针对此类场景的向量数据库应运而生。京东从2019年开始自主研发向量数据库,目前,向量数据库Vearch已经实现大规模落地实践:平稳支撑京东百亿级向量数据高性能检索,延迟时长降低到毫秒级,降低60%存储成本降低和80%推理成本。
大模型的难点,不仅在技术追赶,更在产业突破。京东云作为“更懂产业的云”,也将面向千行百业,以更智能的产业应用,助力数实融合,服务经济社会高质量发展。