对于整个自动驾驶行业而言,“自动驾驶竞争下半场”这一概念已被不少自动驾驶企业所认可,而“下半场”的标志就是自动驾驶的规模化商业落地,实际上主要还是以乘用车辅助驾驶的落地为主。
现在,打造基于渐进式技术路线的高阶辅助驾驶技术,成为越来越多自动驾驶企业的共识,由此也诞生了诸多头部自动驾驶赛道玩家。
比如,特斯拉,作为最早坚持渐进式路线的自动驾驶企业,特斯拉早早就打通了FSD的城市与高速场景,现已拥有16万参与FSD Beta测试的用户量产车队。
而在国内,同样在成立之初就确立渐进式路线的毫末智行,也将高阶辅助驾驶场景由高速域拓展至了城市域,并积累了超过1700万公里的用户辅助驾驶行驶里程。
此外,造车新势力之一的小鹏汽车更是多线并进,不仅先后推出了基于高精地图的高速NGP与城市NGP,还在最近正式向外界展示了基于重感知的XNGP。
不难发现,在围绕自动驾驶的众多技术路线中,唯有采用渐进式路线的自动驾驶企业的表现最为亮眼,这一方面归功于头部玩家具备的规模化量产能力,另一方面,则是由此带来的海量数据,逐渐促成了其自动驾驶数据闭环的建成。
数据究竟对自动驾驶有多重要?显而易见的是,由于在数据获取效率方面更具优势,包括百度Apollo等L4自动驾驶企业也逐渐将战场拓展至渐进式路线中,并借助乘用车高阶辅助驾驶产品的数据优势为其自动驾驶技术赋能,加速迭代速度。
对于这一趋势,毫末智行将其总结为,辅助驾驶是通往自动驾驶的必由之路。只有大规模前装辅助驾驶系统,才有能力收集到足够规模和足够多样的数据。
“以数据驱动的自动驾驶3.0时代已经到来,只有感知、认知、模式、数据4个技术条件并行成立才能称为真正进入自动驾驶新时代。我们所做的一切,都是为了能够做出数据通道和计算中心,以便可以更高效地获取数据,并把数据转化为知识。”
在第六届HAOMO AI DAY上,毫末智行CEO顾维灏公开发表了名为《毫末智行与自动驾驶3.0时代》的主题演讲。不同于以往的是,顾维灏的重点并非单纯聚焦于毫末智行的自动驾驶技术突破,而是对自动驾驶技术发展的历史回顾和观点总结。
在顾维灏看来,自动驾驶已经进入到“数据驱动”的3.0时代,而毫末之所以能得出这一结论,则是在第一性原理的帮助下,从自动驾驶短暂但却极为复杂的历史中发现并总结出的。
在此基础上,顾维灏将自动驾驶的既有历史分为了两个时代,分别为“硬件驱动”的1.0时代和“软件驱动”的2.0时代,而“数据驱动”作为未来,则是3.0时代。
特斯拉可以被看作是率先进入了自动驾驶3.0时代的代表。辅助驾驶行驶规模及数据驱动的技术模式是其能够鹤立鸡群的关键,而毫末智行则是从成立起便确立了“数据驱动”的技术发展方向,这也是其能够领先国内众多自动驾驶企业的重要原因。
当然,“自动驾驶3.0时代”这一逻辑闭环的成立少不了关键理论的支撑,而特斯拉、毫末智行恰好也都有着同一个核心支点,这就是第一性原理。
第一性原理强调,世间万物的发展都建立在其各自的基石假设之上,这也是驱动万物发展的本质;只要找到属于自动驾驶的基石假设,就能在其基础上建立并推动自动驾驶发展。
这也就意味着,在“自动驾驶3.0时代”之前,很多人实际并没能发现驱动自动驾驶技术发展的真正本质;而寻找这一本质的关键,就隐藏在自动驾驶的发展历史中。
硬件驱动的1.0时代:摸着石头过河
俗话说“前人栽树,后人乘凉”,但对于尚处萌芽阶段的自动驾驶来说,彼时的科技与工程界并没有什么可供参考与借鉴的,这使得“摸着石头过河”成为了这一阶段的主题。
不过在技术路线未定、发展方向未知、可靠性不成熟的情况下,有一点还是可供自动驾驶开发者确认的,那就是发展“基本盘”硬件。作为载体,自动驾驶需要一套硬件系统提供感知和计算能力,而硬件性能自然也是也高越好。
从最早的几届DARPA大赛中,我们能够发现,制约众多参赛队伍能否完赛的关键,就在于其自动驾驶车辆的硬件水平。一套好的硬件器材,足以起到决定性的作用。
这对很多自动驾驶企业的发展起到了很大的引导作用,并驱使大家将自动驾驶的发展重点聚焦在硬件性能上,依靠各种堆料的硬件方案来做自动驾驶。
谷歌Waymo是最早投身自动驾驶技术研发的企业,在经历DARPA的“启蒙”后,谷歌Waymo开始研发基于跃进式路线的L4自动驾驶技术,并搭载至量产乘用车及自研自动驾驶汽车上。
在谷歌Waymo的推动下,很多专属于自动驾驶技术的硬件设备开始定型,并有了快速发展,例如激光雷达和摄像头。在第一届DARPA大赛中,这些设备原本还只是从其他领域东拼西凑而来的,不仅体积庞大笨重,性能与匹配程度也非常糟糕。
自动驾驶硬件生态的形成,不仅帮助谷歌Waymo快速进入了Robotaxi的测试,也吸引了诸如Uber等新玩家的加入。Uber的想法与谷歌Waymo类似,通过向量产车型加装L4自动驾驶技术,实现Robotaxi运营。
在小范围的测试与试运营中,谷歌Waymo与Uber均获得了一定的成绩。其中谷歌Waymo的无人驾驶汽车就曾在无人知晓的情况下借助自动驾驶技术积累了不少路测里程,Uber也在划定的电子围栏内实现了初步运营。
但二者很快也遇到了新的瓶颈,那就是:虽然“看得见”了,但“走”得并不顺畅,具体表现在二者很难针对各种场景快速给出合理的规控策略。这使其难以突破电子围栏的束缚。
总结来看,就如同木桶效应一样,在自动驾驶技术尚未成熟的初期,由自动驾驶硬件带来的提升是非常明显的,因为此时的硬件性能恰好就是木桶的最大短板。
但对于自动驾驶这个木桶来说,短板却是相对且动态的,因为此时人们对自动驾驶技术的目标是“能走就行”,所以只为其匹配了简单的人工规则。
而当自动驾驶技术越走越快、越走越远时,简单的人工规则再也无力再应对更多场景,于是在100万公里后,硬件不再是决定自动驾驶技术发挥的下限,软件取而代之、又成了自动驾驶技术在2.0时代的新短板。
软件驱动的2.0时代:挖掘算力潜能,让AI真正发挥价值
硬件的提升让自动驾驶能够更清晰地“看到”世界,而在这之后,怎么让自动驾驶技术“走起来”,则又对自动驾驶的“大脑”提出了越来越高的要求。
首先的压力来自感知硬件。在得到长足发展后,高性能感知硬件对算力的要求也越来越高;同样,想要充分发挥感知硬件的全部实力,也需要一套更精密的算法进行匹配。
而后的压力则来自算法。在深度学习得到大规模应用后,人们希望自动驾驶能够逐渐摆脱人工规则,拥有自己思考、学习的能力,这同样需要更高的算力支持。
在推动硬件升级的同时,谷歌Waymo也加速了软件升级的进度。具体来看,谷歌Waymo将AI引入了自动驾驶中,其为各类场景设置了众多模型,这些模型会在每次遭遇对应场景时被筛选出来,并通过算法评估,选择其中最合适的一个。
在被选中确认后,这些模型也会在之后借助新获取并标注的数据进行再次评估,然后再进行验证、测试、部署,从而保证模型的准确性。
可以看到,在AI算力升级后,以谷歌Waymo为代表的自动驾驶企业加大了对算法模型的应用,这使得其产品最终能够落地,让自动驾驶“走”了起来。
另外,在英伟达、高通、Mobileye等企业先后推出多种大算力芯片的同时,特斯拉又提出了一个新想法,那就是:算力不仅要大,而且还要更匹配。这有助于进一步挖掘自动驾驶的算力潜能,从而提升软件性能。
在特斯拉看来,由算力供应商提供的通用架构,在应对不同自动驾驶企业的算法时,并不能彻底发挥其算力性能与算法优势,所以在结束与Mobileye的合作后,特斯拉转而开始自研芯片,由此推出了D1芯片。
特斯拉自研芯片的举动虽然大胆,但很快便成了众多自动驾驶企业的新发展目标。而以特斯拉与谷歌Waymo为代表,算法的逐步完善又让采用“渐进式路线”与“跃进式路线”的自动驾驶企业出现了越来越大的差距,由此,我们又得以发现自动驾驶木桶效应中的又一个短板。
具体来看,虽然大量算法模型的应用让自动驾驶有了自主决策的能力,但各模型之间缺乏一个统一的逻辑进行协调与衔接,导致Robotaxi的输出动作较为僵硬、机械,对很多场景也缺乏正确、高效的反馈,由此引发了长尾难题。
此外,就像人类需要通过不断学习才能增长知识一样,算法模型也需要不断学习与训练,才能让规控效果越发成熟,但采用“跃进式路线”的有限车队规模与数据获取成本却限制了其自动驾驶技术的学习速度,导致算法模型很难发挥其全部实力。
而另一方面,采用“渐进式路线”的自动驾驶企业则在规模化落地中掌握了海量的数据优势,其自动驾驶技术的迭代速度也由此得到了快速推进。
在大算力与深度学习的赋能下,算法模型已经成为驱动自动驾驶进化的关键,但算法模型也只是组成自动驾驶技术的骨架,只有用海量数据填充才能让其牢固起来,真正满足人类对自动驾驶的期待。
也就是说,数据才是驱动自动驾驶技术迭代的核心,只有拥有高效率、低成本获取海量数据的能力,才能推动自动驾驶技术不断快速发展。
数据驱动的3.0时代:用大数据与大模型化解长尾难题
如果说1.0与2.0时代是自动驾驶技术实现从0到1的阶段,那么从3.0时代起,自动驾驶就将进入从1到N的阶段,也就是如何让自动驾驶技术成熟起来。
那么如何评价自动驾驶技术成不成熟?从自动驾驶在2.0时代的表现,我们能够发现:彼时自动驾驶技术很难对连续场景做出符合人类预期的规控策略,不仅不够高效,也不够舒适,甚至无法保证安全。
换句话说,2.0时代的AI还不能有效应对自动驾驶的长尾难题。至于如何应对,第一性原理则为我们提供了一个方向:效仿人类驾驶从生疏到老练的过程,加速并提升AI的学习效率与学习效果。
这首先要求有足够的数据量。人类司机每天都会在不同天气、不同路况甚至不同心情的情况下产生各种驾驶数据,这些数据不仅包括了各种道路与环境信息,也包含了不同司机的驾驶风格与不同场景下的博弈策略,对于自动驾驶技术的成长至关重要。
特斯拉就是这样一家极端重视数据的自动驾驶企业。截至2022年第二季度,FSD累计行驶里程就已经超过了3500万英里;而如果考虑“影子模式”的助攻,特斯拉早在2021年就已经实现了超过72亿公里的行驶总里程,这能够为特斯拉贡献海量的数据。
其次是算法模型。就像大流量的水龙头需要搭配更粗的水管一样,只有大模型才能更好发挥海量数据的优势;另外,通过大模型预训练出的算法模型与规控策略,其风格也更加统一协调,这也满足人类对自动驾驶拟人化的需求。
在这方面,特斯拉则是率先引入了Transformer,这一具备Attention机制的算法大模型不仅天生具备时序融合和多模态感知融合方面的优势,在面对海量数据时,更能发挥高效的数据处理优势,这使得特斯拉能够融合摄像头感知信息,并生成带有时序特征的真实世界场景,再由此统一输出规控策略。
上亿公里的海量数据、Transformer大模型的运用、多传感器数据的融合感知,特斯拉不仅率先开启了数据驱动下自动驾驶3.0时代的大门,也为其他自动驾驶企业的下一步发展提供了参考范例,更为化解长尾难题带来了希望。
然而,伴随着自动驾驶产品落地速度的加快,可以预见的是,自动驾驶的数据总量与数据获取速度也将突破数据标注与训练效率的临界点,届时,自动驾驶技术不仅将很难快速消化海量数据,一些有价值的新增数据也可能会因此被现有数据稀释,导致最终被遗漏。
另外,深度神经网络天生自带的“黑箱”难题,也在几次自动驾驶交通事故中被越来越多的人所关注,如果不尽早解决,“黑箱”难题也将随着数据的增长而加剧。
对于这些问题,顾维灏在《毫末智行与自动驾驶3.0时代》中做出了解答。
想要步入自动驾驶3.0时代,第一步是要保证拥有至少1亿公里的累计数据量。尽管如今毫末智行的辅助驾驶累计行驶里程才刚刚突破1700万公里,但在长城汽车的量产能力支持下,毫末智行很快就能实现百万量级的车队。
毫末智行是国内第一家应用Transformer大模型的自动驾驶企业,但与特斯拉不同,基于对国内复杂交通环境的理解,毫末进一步压榨了Transformer的极限,使其能够将包括摄像头、激光雷达在内的多模态传感器数据进行前融合输出。
此外,毫末智行也一直在利用Transformer,对筛选海量数据中优质驾驶数据的大模型进行不断的预训练,由此得到的大模型不仅能够输出更接近人类驾驶风格的规控策略,也能将原本各种小模型场景进行融合,保证整个自动驾驶过程的流畅性与舒适性。
为了应对1亿公里以后暴涨的数据量,毫末智行提出了一个新观点,如果连自动标注都无法消化海量数据,那为什么不干脆给数据“解绑”,让自动驾驶直接用未标注的数据进行训练?只要保证Backbone统一,所有数据就都能得到快速且有效地运用。
在这一过程中,各模型都已通过统一Backbone被赋予了可理解的任务,这相当于赋予了其一定的可解释性,从而能够为其后续的数据获取和输出提供有效的参考。
俗话说“知识就是力量”,在明白数据就是自动驾驶知识的载体后,特斯拉与毫末智行以数据为核心,建立起了一套高效率、低成本获取&学习数据的数据智能体系,而毫末智行更是为此推出了中国第一个数据智能体系MANA,可见其对于“数据驱动”的重视。
而对其他自动驾驶企业来说,虽然进入自动驾驶3.0时代尚需时日,但“未雨绸缪”也未尝不是件好事。
透过现象看本质,数据驱动的3.0时代即将全面开启
从自动驾驶过去十年的发展历程中,我们可以发现一条规律:那些肉眼可见的表象并非就是影响事物发展的核心。在硬件与软件的影响被逐层拨开后,数据这一驱动自动驾驶迭代的核心才真正水落石出。
这也是同样作为AI的延伸,为何能够将自动驾驶2.0与3.0时代区分开来的原因——AI虽然是实现自动驾驶的关键技术,但在算法模型、尤其是大模型成为新的技术基石后,AI对数据的需求发生了根本性的变化。
作为自动驾驶3.0时代的核心,数据驱动自动驾驶迭代、建立数据闭环将成为所有自动驾驶企业能否生存下来的关键,越早领悟到这一点,就越有可能从竞争中活下来,并看到3.0时代的曙光。
而想要实现这一点,最理想的方法就是借助真实场景下的海量数据驱动,只有借助辅助驾驶产品的量产优势,不断在开放式道路上扩大道路行驶场景,才有可能突破自动驾驶的长尾难题,让自动驾驶真正成熟、落地。
不过,话虽如此,属于自动驾驶的3.0时代依旧只是刚刚开始,除特斯拉、毫末智行外,越来越多的自动驾驶企业也将因此而开始调转船头,真正精彩卓绝的高手对决,才正式鸣锣开场。