2023年无疑是人工智能的“爆发年”,各种基于AI的新技术如雨后春笋般拔地而出,其中AI大模型成为了全球科技公司的“角逐场”。简单来说,AI大模型就是基于AI的Foundation Model(基础模型),这是一种在大规模宽泛的数据上进行训练后能适应一系列下游任务的模型。AI大模型兼具“大规模”和“预训练”两种属性,面向实际任务建模前需要在海量通用数据上进行预先训练,这样才能大幅提升AI的通用性和泛化性。
但是,AI大模型需要的参数量和数据量非常庞大,以OpenAI基于深度学习的自然语言处理模型ChatGPT为例。它最初的GPT-1参数量只有1.17亿,到了2020年GPT-3发布的时候,其参数规模就达到了惊人的1750亿。如今,人工智能模型体量已跃升至“万亿级”参数规模,大算力、强算法共同筑起了一道“高不见顶”的技术壁垒,只有深耕AI赛道的大公司才有“入场”的资格。
根据小编整理的人工智能大事件日历,二季度华为、商汤科技、阿里巴巴、科大讯飞等国内科技公司都发布AI大模型新产品,它们的技术路线各不相同,既有采用类ChatGPT模式的,也有采用多模态混合模式的。比如华为盘古大模型就包括NLP(自然语言处理)大模型、CV(机器视觉)大模型和科学计算大模型,其中CV大模型首次兼顾图像判别与生成能力,可结合科学计算大模型对气象进行预报,这是典型的多模态混合模式。
阿里巴巴即将发布与百度“文心一言”类似的“通义千问”,这是一款类似ChatGPT的大型预训练语言模型,具有广泛的知识储备和普适性,在训练过程中学习大量文本数据,从而具备跨领域知识和语言理解能力,适用于不同场景下的需求。
科大讯飞将于5月6日发布的“1+N认知智能大模型”,“1”是指1个通用认知智能大模型算法研发及高效训练底座平台,“N”是指应用多个行业领域的专用大模型版本,并且将有望带来“N”个场景的示范性产品,或将推动AI认知大模型从“可用”阶段迈入“常用”阶段。同时据了解科大讯飞基于认知智能全国重点实验室,已在核心算法、行业数据、算力支撑及团队组建等方面建立了优势保障。
目前,我国在AI认知智能领域已取得长足进展。根据第三方研究报告显示,中国在认知智能领域论文发表量仅次于美国,相关专利数量2017年超过美日韩,产业应用也呈现出AI+教育、AI+医疗、AI+金融等领域的“多点开花”,技术应用探索位居世界前列。认知智能可以赋予机器理解和模拟人类行为的能力,使得机器“能说会道有情感”。因此认知大模型是“兵家必争之赛道”,包括科大讯飞在内的巨头率先布局,目前已进入成果产出期。
展望未来,随着AI大模型在千行百业的深入应用,人工智能将在垂直领域有更多的落地机会。我国也将在“数字中国”战略框架下,通过政策扶持助力AI技术创新和应用探索,推动整个AI产业加速驶入“深水区”。