联系我们登录
二维码登录过期
点此刷新
联系我们
电话:023-81908688
邮箱:icv50@wicv.cn
地址:西部(重庆)科学城
高新区科学谷F2、F3
技术支撑  2025.01.23
返回列表
马斯克“吃螃蟹”,端到端是实现自动驾驶的好机会吗?
原创文章

纵观人类科技史,一个更先进的系统,往往优美而简洁。

 

第五代战斗机用光滑的表面和简单的构型,轻松击败了此前的所有战机。一面屏幕的智能手机,已经取代了按键复杂的功能手机。

 

在自动驾驶领域,传统的模块架构需要进行多个子任务的划分和处理,未来的自动驾驶路线到底应该怎么走?现在,马斯克似乎想把复杂的问题直接用一个深度学习模型来解决。

 

根据他的说法,FSD Beta v12版本将采用“端到端”的架构。对系统输入视觉等传感器信号,系统随之就可以输出转向、刹车、加速等车辆控制信号,与现有版本会拉开巨大的差距。

 

马斯克立志要实现的“端到端”,会是实现自动驾驶的一步好棋吗?

 

端到端:当人工智能遇见自动驾驶


当下,自动驾驶系统没有严谨的分类,行业内有些人将自动驾驶系统区别为“模块化”和“端到端”两种技术路线。

 

这两种路线,有着本质的区别。

 

特斯拉此前的自动驾驶系统,采用的是“模块化”的思维。顾名思义,就是把自动驾驶划分为环境感知层、决策规划层和控制执行层,每一层还可以划分为不同的模块,每个模块还可以划分为不同的子模块。

 

环境感知层就像是人的眼睛和耳朵,看到周围的路况之后,把感知结果送入决策规划层。决策规划层这个“大脑”决策之后,再把命令传输给控制执行层,控制执行层就像人的双手和双脚一样,完成加速或转向。

 

与模块化不同,特斯拉最新的V12版本自动驾驶系统采用了端到端的路线,理论上,可以把车辆传感器采集到的信息,直接送入到统一的深度学习神经网络,神经网络经过处理之后,直接输出自动驾驶汽车的驾驶命令。

 

现在大火的ChatGPT,正是端到端技术的典型代表。

 

两种方式的区别,就像学英语。

 

假设我们要学习英语。传统的模块化就像是按照教材来学习,先学习音标、单词、语法、句型等基础知识,然后再通过阅读、听力、口语、写作等练习来提高英语水平。

 

而端到端就像是直接去一个英语国家生活,我们只需要不断地和当地人交流,从他们的对话中学习英语的发音、词汇、语法、用法等,而不用先学习任何基础知识。这样做需要接触到大量的英语场景和语料,才能逐渐适应和掌握英语的规律。

 

端到端自动驾驶系统虽然现在鲜有车企在用,但对于模块化而言,这是一种革命性的系统。这种技术路线,让自动驾驶更接近人类的真实驾驶。

 

一位业内人士对西部智联表示,传统的多模块化架构需要大量的中间步骤和组件,比如特征提取、分类器训练、地图构建、路径规划等,而端到端只需要一个大模型,省略了大量的繁琐的中间步骤,简化了流程,基于组件的系统工作更少。

 

“特斯拉如果真的推广开了端到端,那就从根本上改变了游戏规则。”

 

他说,传统的多模块化架构往往是基于规则驱动的,会根据图像数据的情况做出反应,一般是道路上某个数据变量达到一定的阈值后,触发系统的动作,属于一种“被动”式的反应。

 

这样的规则设定标准,通常是工程师根据人类驾驶习惯观察取得值。“比如面对会车的情况,本车是选择让旁边车道的车先走,还是抢在其之前走,不同车企的判断逻辑也不一样。”

 

端到端人工智能是基于数据驱动的,根据不断收集到的人类驾驶真实数据进行判断,属于一种“主动”式的反应。这样的数据驱动可以让系统更加接近人类驾驶的方式和水平,也可以让系统更好地适应不同的道路环境和交通情况。

 

当特斯拉选择了端到端,意味着这种路线已经被头部自动驾驶公司纳入到了可行方案中。那么,为什么是特斯拉选择了端到端?

 

手握海量数据,马斯克押注端到端


人工智能有三大根基——算力,算法,数据。端到端是自动驾驶迈向更高等级的“良药”,而数据,就是可靠的“药引子”。

 

端到端人工智能需要大量的数据,因为它要从数据中学习出复杂的映射关系,而不是依赖于人为设计的特征或规则。数据越多,越能覆盖各种可能的情况,越能提高模型的可靠性。

 

只有用数据把人工智能“喂饱”,才能解决掉更多问题。而特斯拉,恰恰是掌握自动驾驶相关数据最丰富的车企。

 

在每台特斯拉车辆上,影子模式“如影随形”,随时为数据采集做着准备。考虑到特斯拉庞大的销售数据,这些车辆等于成为了免费的数据收集器,这给特斯拉带来了指数级的数据增长和极丰富数据多样性。

 

根据MIT教授Lex Fridman的估计,特斯拉已经收集了超过30亿英里的数据,作为比较,Waymo收集的驾驶里程约为2亿英里。丰富的数据量,虽然不是特斯拉选择端到端的理由,但却是特斯拉能够选择端到端的前提。

 

特斯拉选择端到端模式,和马斯克对人工智能的迷恋有很大关系。

 

马斯克与人工智能的渊源可以追溯到他的童年。他曾经在12岁的时候,用BASIC语言编写了一个名为Blastar的太空射击游戏,并卖给了一家电脑杂志。他也是一个狂热的科幻迷,喜欢阅读阿西莫夫、海因莱因等作家的作品,对人工智能和机器人有着浓厚的好奇心。

 

马斯克在成年后,创办了多个成功的公司,都与人工智能技术有着密切的关联。他曾经说过,他的目标是“推动人类文明向前发展”,而人工智能是实现这一目标的重要手段之一。

 

马斯克对人工智能技术的态度是复杂而矛盾的。他曾经多次警告,人工智能可能会超越人类智能,成为一种“不可控制”的力量,甚至可能引发第三次世界大战。他也曾经呼吁,需要建立一个全球性的人工智能监管机构,以防止人工智能被滥用或误用。

 

但是,马斯克对人工智能技术的担忧,并没有阻止他在自动驾驶方面进行大胆的尝试和创新。

 

他认为,自动驾驶是人工智能技术最有价值和最有意义的应用之一,可以提高交通安全、效率和便利性,也可以为人类带来更多的自由和乐趣。他曾经说过,“我认为自动驾驶是最重要的社会问题之一,也是最有趣的问题之一。”

 

马斯克选择端到端模式,也体现了他对人工智能技术的信心和期待。他相信,端到端模式可以让自动驾驶系统更加灵活、强大和智能,可以减少中间层的设计和维护成本,也可以利用海量的数据进行持续的学习和优化。

 

马斯克曾经说过,“只要没打破物理定律,一切皆有可能。”那么,端到端就是马斯克的下一个可能。

 

三大掣肘,端到端实际应用仍任重道远


特斯拉选择了端到端作为其FSD的技术路线,无疑是一种大胆而前卫的尝试。如果这条路线能如愿走通,将对特斯拉自身乃至整个自动驾驶行业产生深远而广泛的影响。

 

对于特斯拉而言,端到端是一柄撕开市场的“利刃”。对于行业来说,马斯克这一举动更是具有示范效应。

 

就像苹果每一次都带动数码行业的审美与技术革新,特斯拉作为自动驾驶行业的领导者和引领者,自动驾驶行业一直不乏追随特斯拉的人。其技术路线的每一次选择和变化,都会对整个行业产生重要的影响和启示。

 

特斯拉选择端到端,表明了这种方案的可行性,也展示了端到端的巨大应用前景。这会在业内带来示范效应,让更多自动驾驶企业投入资源,来加入端到端的推广应用,从而带动整个行业的技术进步。

 

作为一种新兴的技术方法,端到端人工智能在自动驾驶领域有着明显的优势,但也存在着一些局限——端到端人工智能缺乏可解释性和可控性,以及数据收集和算力层面的挑战。

 

这是摆在端到端应用面前的大山。

 

腾讯集团副总裁、腾讯安全总裁丁珂表示,大模型落地应用所面临的第一道坎,就在于它的可解释性。当模型大到一定程度的时候,首先模型的可解释性难度就非常大,一旦出现问题,将很难溯源或者调整。

 

在5月举行的一场峰会上,一位负责AI技术测试工作的美军上校表示,美国空军曾经进行了一次模拟演练,由一架AI无人机执行摧毁敌方防空系统任务。

 

由于摧毁防空系统被设定为优先级,但攻击行动被人类操作员否决。AI觉得人类妨碍了自己执行任务,因此AI决定把人类干掉以排除“阻碍”。但它接受的训练是不能攻击人类,所以AI决定攻击通讯塔,这样就可以切断人类和无人机之间的数据通讯。

 

在此前,或许没人设想到AI将以这种方式完成任务。可解释性和可控性是端到端人工智能的重要属性和需求,也是其最大的难点和风险。

 

端到端人工智能由于采用了复杂的深度神经网络模型,其内部的工作原理和逻辑往往是不清楚甚至是不可知的,这就导致了系统的黑箱化。我们不知道系统为什么会做出某种决策或行为,也不知道如何改进或纠正系统的错误或缺陷。

 

这种黑箱化不仅影响了系统的开发和调试,也影响了系统的监管和审查,更影响了用户对系统的信任和接受度。如果系统出现了严重的失误或事故,我们很难找到原因和责任,也很难进行预防和纠正。

 

如果是日常使用的ChatGPT,无非就是回答错了一个答案而已。但在容错率很低的自动驾驶场景,一旦出现了错误就会导致严重后果。


在另一方面,将人工智能用于自动驾驶,还需要获取大量数据,但这会带来极高的成本。中国工程院院士、西部智联首席科学家李克强近期撰写的《AI大模型在自动驾驶中的应用》论文中披露过一组数据——

“ChatGPT的样本存储比约为3亿/GB(每GB存储的样本数目),而自动驾驶该比值约为370个/GB(以端到端自动驾驶为例);按照特斯拉的数据采集效率(3.9GB/车/天),若要达到万亿级别的训练样本,大概需要单一车辆连续驾驶190万年。”

 

此外,车载算力也是发展端到端的一道门槛。与云端服务器相比,车载算力不足以支撑端到端的产业应用。《AI大模型在自动驾驶中的应用》论文中提到,若将ChatGPT级别的网络用于车载控制器,大致需要1018 FLOPS算力,这相当于车端部署10万张英伟达A100的GPU。

 

解决这些问题,需要构建可解释和可控的端到端人工智能系统,让人类能够监督、干预输出结果。更需要将“车路云”相结合,搭建云数据平台与云计算平台,让云端算力赋予车辆能力。

 

近期,国务院提出了“车能路云”融合发展的路线。这一路线的将自动驾驶系统与车辆、道路、云计算等多个要素进行有效的整合和协同,形成一个智能化、网络化、协同化的交通生态系统,用云控平台即时纠偏,给端到端的应用添上了一道“保险”,更是为端到端插上一双“翅膀”。

 

马斯克下注端到端,更像是对人们的提醒——行业变革,即将到了“涌现”时刻。

 

同样作为人工智能的杰出应用,ChatGPT可以与用户进行自然、流畅的交流。据说它在短短几个月内就吸引了数百万的注册用户,成为了一个现象级的应用。

 

人们用ChatGPT,最多的评价是:它不像一个机器,它像一个人。

 

如果人工智能要像一个人,那么它需要具备什么样的特征和能力呢?是模仿人类的思维和行为,还是理解人类的情感和价值观,或者是创造出人类无法想象的东西?这些问题可能没有一个确定的答案,但是它们可以激发我们对人工智能和人类本质的思考和探索。

 

这让人想到韩非子的千年矛盾寓言——端到端是一柄实现自动驾驶的“长矛”,而它最终商用,恰恰也取决于我们如何打造防范“长矛”缺点的“盾”。

 

矛盾相生,车云协同。单车智能的最终目的地,将会是“中国方案”的坐标。

评论
登录后发表评论
最新评论