最近,由人工智能实验室OpenAI发布的对话式大型语言模型ChatGPT在各大中外媒体平台掀起了一阵狂热之风。短短4天时间,其用户量到达百万级,注册用户之多导致服务器一度爆满,甚至连特斯拉CEO马斯克也参与相关话题讨论,热度可见一斑。作为人工智能的重要发展区域,国内也有多个机构和企业也加速相关产品落地,一场关于AI大模型赛跑已经开始,学院派、大厂派、创业派等势力逐鹿中原。
学院派-清华大学
智谱AI由清华大学计算机系唐杰教授创立,团队核心成员曾参与清华大学与智源研究院合作项目「悟道」的研发工作,具有丰富的大模型经验。2022年8月,清华大学知识工程实验室与智谱AI合作研发的超大规模预训练语言模型GLM-130B正式上线,在多个公开评测集上性能超过GPT-3。自成立以来,智谱的目标是做中国最好的大模型,团队提出“model as a service(MaaS)”的行业理念。基于GLM,智谱随后推出聊天机器人chatGLM,在电商、金融理财、心理咨询等打造多种落地场景。致力于打造数据与知识双轮驱动的认知智能,智谱AI目前已完成数亿人民币B轮融资,将持续投入到打造高性能千亿级普惠大模型。
学院派-清华大学
隶属于清华大学计算机系人工智能学院的交互式人工智能课题组(CoAI)由朱小燕教授和黄明烈副教授指导,主要研究方向为开放式闲聊对话系统、推理与问答和语言生成与评价。黄明烈副教授于2021年创立聆心智能,专注心理咨询赛道,致力于打造“超拟人底层大模型”。2022年团队上线「AI乌托邦」对话机器人,支持自定义AI人设进行聊天交互。作为国内具备训练超大规模语言模型能力的团队之一,聆心智能将自己定位为"中国的 Character AI",旨在提供情感陪伴的文本生成服务,公司目前已完成Pre-A轮融资。
学院派-复旦大学
2月20日,复旦大学自然语言处理实验室的邱锡鹏教授团队携上海人工智能实验室发布“国内第一个对话式大型语言模型MOSS”,通过模型与真人和其他模型进行任务交互而进行算法优化。邱锡鹏教授为自然语言处理领域的资深学者(谷歌学术引用量xxx),曾主导开发NLP工具FudanNLP,团队主要研究方向为自然语言处理和深度学习。
根据对外发布的信息,MOSS的参数量依然较小(小ChatGPT一个量级),目前希望在百亿级别参数量上进行学术级别探索。MOSS模型一经对外发布,立刻引来火爆关注,当前服务器已无法支撑访问量,内测窗口(https://moss.fastnlp.top/)已关闭。同时邱锡鹏表示会尽可能在3月底开源。
大厂派-百度
国内的“中国版ChatGPT”预备赛一触即发,百度是最先公开表态并发力的大厂之一,2月初正式官宣百度版ChatGPT“文心一言(ERNIE Bot)”将于3月上线,迅速引发全网热议。针对关于“中国版ChatGPT”的讨论,百度回应:“ChatGPT相关技术,百度都有”。据了解,百度「文心(ERNIE)」系列大模型已于2019年内部开发,具备跨语言和多模态的生成能力。百度搜索将直接接入文心大模型相关能力,在搜索场景上提升上亿用户的使用效率。百度CEO李彦宏认为百度已做好接受ChatGPT相关技术带来的颠覆式变革的准备,李彦宏2023年一季度的OKR为“引领搜索体验的代际变革”。业界普遍认为百度可能是国内目前最有实力与OpenAI竞争的公司之一。
大厂派-阿里巴巴
阿里巴巴达摩院布局大模型多年,2021年对外介绍了超大规模中文多模态预训练语言模型“M6”,目前参数量已拓展迭代到万亿至十万亿规模。2022年,达摩院提出业界首个通义大模型“M6-OFA”,目标为高效整合多模态任务和架构,提升训练和部署效率。据公开信息,通义大模型“M6-OFA”将深入涵盖医疗、金融、电商、物流等多个行业,从底层模型底座覆盖到各应用场景。同时,阿里版聊天机器人目前也已进入内测阶段,将部署到钉钉。
心识宇宙
「心识宇宙」(Mindverse),于2022年1月在杭州成立,是一家专注于通用人工智能技术的创业公司。公司自主研发以大模型为底座的脑启发AI模型(Unified Mind Model)系统,通过模拟大脑宏观架构,提供有思考、情感、记忆及服务的AI能力。2022年11月,团队发布MindOS内测版本,开放给少数B端客户。MindOS是一个AI角色生成引擎,通过简单的填写配置、拖拽上传,就能完成一个具备专业知识、记忆和人格的AI角色,大大提升应用交互的体验。仅2023年1月,MindOS就获得了百万元订单。拥有VBS拟人的次世文化、拥有顶尖虚拟人IP柳夜熙的创壹科技都与其达成深度战略合作。据悉,MindOS将与3月发布升级版,新版将会有更强的对话可控性和复杂场景解析能力等。
创业派-澜舟科技
2021年6月,前清华大学教授,中国计算机学会 CCF 副理事长、创新工场首席科学家周明博士创立澜舟科技,并于隔月公布其中文语言模型—孟子轻量大模型。孟子模型由团队联合创新工场团队、上海交通大学、北京理工大学等单位共同研发,性能超越腾讯、搜狗等公司,在中文语言理解评测 CLUE 榜单上登顶第一,效果比肩千亿参数大模型。基于孟子模型,澜舟科技随后推出了“孟子认知服务引擎”,包括搜索、生成、翻译、对话等功能,还能提供针对垂直行业的SaaS产品,主要覆盖机器翻译、智能辅助写作、智能文档处理场景中的应用。其中「澜舟熊猫小说家」依靠丰富的故事风格和快捷的 AI 写作方式已成为公司爆款产品。据了解,基于当前模型能力,澜舟科技将与拥有海量数据的中文在线合作,同步打造类ChatGPT产品。
上一次人工智能技术革新带来了个性化推荐这种交互方式,未来大模型的普及也将诞生新的应用场景,在正真的成熟商业化建立前,学院派、大厂派以及创业派能还有很大的想象空间。