没有“华为Chat” 但华为却给所有大厂上了一课-快科技-科技改变生活

7月6日－8日，2023世界人工智能大会（WAIC 2023）在上海举办，大会主题“智联世界生成未来”直截明了地给出了今年最热门的话题——生成式人工智能

。而它的技术基础——大模型也成为今年以来最热门的科技话题，可能没有之一。根据大会官方数据，今年有超过400家企业参展，比去年接近翻番，比前年多了 1/3。

要说这届人工智能大会谁最风光，华为如果说第二，恐怕没人敢认第一。如何直观感受华为在WAIC 2023的影响力，只需看看它的展台：面积约等于百度展台+腾讯展台+阿里巴巴展台。

7月6日，世界人工智能大会开幕当天，“华为云盘古登上《Nature》正刊”的新闻登上热搜。一句话总结它的意义：这是中国科技公司近十年首篇作为唯一署名单位发表的《Nature》正刊论文。

7月7日，华为发布盘古大模型3.0，前一天登上《Nature》的“华为云盘古”正是盘古大模型。

虽然外界没能等来“华为Chat”“盘古Chat”，但华为却为大模型的真正落地提供了新的范式。

盘古大模型3.0是什么？

据不完全统计，截至目前国内至少超过20家互联网大厂公布或发布了自己的大模型，包括但不限于百度、腾讯、阿里巴巴、华为、小米、360等。

但似乎就像造电车不对标特斯拉就不能彰显自己的技术一样，在大部分已公布的大模型中，都喜欢把ChatGPT作为对标，比如百度的“文心一言”，阿里巴巴的“通义千问”。虽然他们在推广自己的产品时，大多也会强调其B端能力，但真正落地商用化还迟迟没有到来。当然，华为除外。

和ChatGPT完全不同，华为盘古3.0从立项之初针对的就是工业和科学领域。

具体来说，2021年华为开始立项做盘古大模型，并在当年4月发布了盘古NLP（自然语言）大模型、盘古CV（视觉）大模型、盘古科学计算大模型；2021年9月，推出用于药物研发细分场景的大模型。这是盘古大模型1.0。

2022年，盘古大模型2.0发布。华为与能源集团合作发布了盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型，开始将大模型初步应用于企业、工业和科学研究。

7月7日发布的盘古大模型3.0则更进一步，不仅模型参数更大，针对的行业也更多，更具有实用性。华为云CEO张平安表示，盘古大模型3.0是一个面向行业的大模型系列，包括“5+N+X”三层架构。

其中，L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型，提供满足行业场景中的多种技能需求；

L1层是N个行业大模型，华为云既可以提供使用行业公开数据训练的行业通用大模型，包括政务，金融，制造，矿山，气象等大模型；也可以基于行业客户的自有数据，在盘古大模型的L0和L1层上，为客户训练自己的专有大模型；

L2层为客户提供了更多细化场景的模型，主要专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景，为客户提供“开箱即用”的模型服务。

华为大模型实力几许？

从盘古大模型的发展历程也能看出一点，华为对大模型的商业化探索从开发之初起，立足点就一直在B端市场。

对于这轮人工智能浪潮，华为创始人任正非也曾作出自己的判断，“未来在AI大模型方面会风起云涌，不只是微软一家。人工智能软件平台公司对人类社会的直接贡献可能不到2%，98%都是对工业社会、农业社会的促进。”

这段话也可以解释为何华为不执着于“华为Chat”，而是坚定走自己的工业大模型之路。

并且和其他采用英伟达等外部算力提供商的方案不同，华为大模型的算力基础来自自己的昇腾计算平台——昇腾910和昇腾310处理器。其中昇腾910发布于2019年8月，华为称同等功耗下其算力是英伟达V100芯片（英伟达A100上一代产品）的两倍。并且，昇腾计算不仅是华为盘古大模型的基础，也可外供。

华为轮值董事长胡厚崑在7月6日的2023世界人工智能大会上表示，目前华为已经孵化了20多个基础大模型，适配了10多个业界主流大模型，“当前中国的大模型中有一半的是由AI昇腾算力来支持的”。例如科大讯飞的星火大模型。

华为昇腾计算业务CTO周斌前不久也表示，昇腾AI基础软硬件平台已可承载ChatGPT或GPT-4的算力需求，实现了20倍模型压缩、1%精度损失、推理时延小于50ms能力。

任正非曾表示，模型的应用有时比模型本身还有前途，华为会做AI的底层算力平台，但应用平台不是华为的选项，“在2%的平台贡献里，我们占一点点就行。ChatGPT对我们的机会是什么？它会把计算撑大，把管道流量撑大，这样我们的产品就有市场需求。”

既研发大模型，也掌握底层的算力平台，等于华为既要做英伟达，也要做OpenAI——当然，主要是工业和科学领域。在美国对华芯片政策日益严苛的情况下，华为的做法显然更安全可控，并且有利可图。

华为昇腾计算业务总裁张迪煊在接受采访时也把美国禁售英伟达A100等GPU视作华为昇腾计算的机会，“现在国内算力需求旺盛，许多大厂能拿到算力，但许多小企业拿不到”。言外之意是，许多小企业需要昇腾，但大厂很多都避开了华为。例如今年6月就有消息称，字节跳动向英伟达订购了价值近10亿美元的GPU。

尽管字节跳动也许是出于性能的考虑而选择了英伟达，但对那些实力强大且可能与华为存在竞争的大模型来说，又当裁判又做运动员的华为，可能会引发其他大厂的忌惮。

不过，不管怎样，和其他停留在“计划”“PPT”“演示”里的大模型相比，华为将大模型的商业化又往前推进了一大步，并且验证了其可行性。对还处于商业化探索期的ChatGPT，以及国内众多类似大模型而言，这都是一次宝贵经验。

AI大模型势不可当

和曾经“深度赋能传统行业”的互联网“黑话”一样，大模型已然成为一门显学。虽然互联网黑话褒贬不一，但如今已没人怀疑互联网对各行各业的改造，无数企业转型数字化无疑证明了它的影响力。现在，大模型被普遍视为下一个互联网，无数大佬为其摇旗呐喊，盛况空前。

李彦宏说大模型将渗透更多领域，重构全球数字化产业；周鸿祎说大模型不是风口和泡沫，将引领新工业革命；雷军说AI大模型带来的革命正扑面而来……

在本届世界人工智能大会上，国家标准委指导的国家人工智能标准化总体组宣布，我国首个大模型标准化专题组组长，将由上海人工智能实验室与百度、华为、阿里、360 集团、科大讯飞、中国移动研究院等企业联合担任，并正式启动大模型测试国家标准制定。

1889年，巴黎举办世博会。博览会上最引人注目的展品是高320米、重9000吨、由18000多个钢制构件和数百万个铆钉组装而成的埃菲尔铁塔。后来历史书上写，“埃菲尔铁塔成为席卷世界的第二次工业革命的象征”。

或许很多年后我们再看今天的世界人工智能大会，也发现它也成为了一个时代的印迹。