特斯拉AI日都讲了些什么?

贝壳号 | 发布于2021-08-22

编辑按:本文转载至微信公众号 “未来投研派”,作者“领航员刘轰轰”贝壳投研经授发布 。

大家好,我是未来投研派的刘轰轰。

昨天有一个让新能源、自动驾驶行业人共同关注的事情,那就是特斯拉AI日的发布会。

特斯拉AI日都讲了些什么?

这场发布会持续了3个小时,中间也涉及了大量的专业知识和术语,所以到现在为止网上大多数都是阐述性的新闻报道,而关于这次AI日将会为我们带来什么,目前提到的媒体还不多。

大部分人的目光,都被一个真正处于ppt阶段的机器人给吸引了:

特斯拉AI日都讲了些什么?

然而这个机器人,其实根本就不是本次AI日的重点......

AI日的重点,是自动驾驶。

虽然当下激光雷达上车已经成为了行业的共识,例如蔚来ET7、小鹏P5(高配车型)、智己L7(预留硬件升级空间)、极狐阿尔法S(HBT版),都会搭载激光雷达,但特斯拉在AI日上,依旧强调了它们不会使用激光雷达。

——即使华为已经立下了让激光雷达成本下降到300美元以内的目标。

在激光雷达成本已经不再是问题的时候,为什么马斯克依然要坚持视觉路线?

要弄明白这一点,得先明白当下的自动辅助驾驶解决方案是一个什么样的情况:目前普通人能买到的量产车上,都是用了超声波雷达+毫米波雷达+摄像头的感知方案。

特斯拉AI日都讲了些什么?

这一套方案中:

超声波雷达是通过超声波发射装置向外发出超声波,再利用接收器接收反射回来的超声波时间差来测算距离。其探测距离在0.1-3米之间时精度较高,超声波雷达现在主要应用在倒车雷达、自动泊车等功能上。

毫米波雷达,是工作在毫米波波段探测的雷达,一般的探测距离在0-200米之间,毫米波导引头穿透雾、烟、灰尘的能力强,具有全天候(大雨天除外)全天时的特点,毫米波导引头的抗干扰、反隐身能力也优于其他微波导引头 ,一般用在辅助驾驶时识别周围车辆。

摄像头则是通过进行图像的识别、处理,和毫米波雷达一起为自动驾驶系统系统道路的数据。

特斯拉AI日都讲了些什么?

这套方案最大的不足在于,毫米波雷达只合适探测运动的物体(为了防止误触发太多,车上的毫米波雷达是会滤除静止物体的特征的,即将多普勒速度为零的信号去除,这样的话基本上所有零速、微动目标都会被抑制掉。)而摄像头的图像识别程度还没那么高——这就是无法识别极端场景的原因。

而激光雷达正可以解决这个问题。

这个问题特斯拉也遇到过,最典型的事故之一就是发生在台湾嘉义的事故:一辆中型厢式货车发生侧翻,过往车辆都会及时避让,一台特斯拉Model 3没有采取任何减速或转向避让的动作,笔直地撞向了前方已经发生侧翻的货车。媒体报道称,事故并未造成人员伤亡,当时特斯拉车主开启了自动驾驶辅助系统,车速约110公里/小时。

特斯拉AI日都讲了些什么?

最近的一次就是大家熟悉的蔚来车祸了,当时撞上的就是静止状态下的工程车。

特斯拉AI日都讲了些什么?

坚持不用激光雷达的特斯拉,马斯克对此的解决方法,应该是再次用到了“第一原理”。

——既然人类开车凭借眼观六路耳听八方就能完成,那么对于自动驾驶系统来说,一定也可以按照同样的方式去做到。而且一旦做到了,毫无疑问成本会比激光雷达更低。

所以特斯拉纯视觉方案,基本构建原则是把自动驾驶系统看作一个生物,有眼睛、有神经、有大脑。

——负责人Andrej说:“我们希望能够打造一个类似动物视觉皮层的神经网络连接,模拟大脑信息输入和输出的过程。就像光线进入到视网膜当中,我们希望通过摄像头来模拟这个过程。”

特斯拉AI日都讲了些什么?

眼睛——摄像头,神经——图像处理,大脑——AI。

这套方案和之前的视觉处理有什么不同?

在之前的视觉处理中,由于图片这种二维的图像中,所展现的物体很难直接判断出它们真实的尺寸、以及行动状态,这一点我觉得道路上偶尔能看见的立体画最能说明问题。

网上发现了一个很棒的图:

特斯拉AI日都讲了些什么?

这样的情况可能夸张极端了一些,但其实汽车之家上列举的真实案例也能说明问题:

特斯拉AI日都讲了些什么?

如上图的2D图片中,如果不做专门的训练,那么机器很难识别出到底那个柱子是真的,那个只是个投影。而这种情况可能会遇到很多,这是为什么将摄像头采集的照片以单张图片作为单元进行分析时,因为

2D图像所展现的物体信息较为局限,很难通过图片去感知图像中物体的真实形状以及运动速度等信息。

而特斯拉之所以在FSD9.0Beta版中能够采用纯视觉的处理方式,是因为它

通过视频图像对场景进行感知有几个好处,首先,统一了信息输入方式,避免了因为雷达、摄像头等不同感知元件所提供的相对分立的数据,而增加算法的复杂度;其次,特斯拉可以通过视频的方式掌握交通参与者当前的运动方向以及速度,而不需要借助雷达;第三点,也是很重要的一点就是特斯拉能够通过视频来构建车辆周围的3D场景,有了道路环境的立体信息,将能够让车辆更准确的识别环境中的危险元素。

特斯拉AI日都讲了些什么?

据特斯拉自己说,在进化到通过连续的视频图像对场景进行感知的过程中,他们发现了几个问题:这些参数和空间追踪是很难通过C++这个基础架构实现拼接的;有一些空间数据的输出质量不高;不同摄像头获取的物体信息不同,拼合时很难进行整体把握。

说白了就是现有的代码不太好解决问题。

为解决这些问题,特斯拉开发了名为“矢量空间”(Vector Space)的技术,这个技术同时兼具了非凸优化算法(Non-convex)、高维度两大优势。

通俗点讲,这个技术可以通过特斯拉车上现有的8个摄像头输入的数据为基础绘制3D鸟瞰视图,形成4D的空间和时间标签的“路网”以呈现道路等信息,帮助车辆把握驾驶环境,更精准的寻找最优驾驶路径。

之前马斯克说重写了FSD代码的原因,现在我们终于知道了。

特斯拉AI日都讲了些什么?

这里面还有一个非常关键的隐藏信息,很多媒体都没有提及。

那就是特斯拉凭借这个技术,可以有自己的3D鸟瞰视图4D的空间和时间标签的“路网”以呈现道路等信息,这也让我们明白了为什么特斯拉不但不用激光雷达,即便是高精地图都不用的原因。

——它自己就能绘制。

从AI日发布的视频中可以清楚的看到,特斯拉会通过自身传感器和摄像头,绘制出当前车辆周边的路况信息,并且会上传到特斯拉自己的地图信息数据库中。

这相当于道路上行驶的特斯拉车辆,都是特斯拉的道路“测绘车”,采集到周边路况信息后,上传到特斯拉“高精地图”信息数据库中,为全球特斯拉车辆提供实时采集的路况“高精地图”信息。

——虽然我们之前就知道很多部门禁止特斯拉入内的原因是这台车会记录数据,但我真的没想到可以记录的这么详细。

所以特斯拉目前的纯视觉路线,是有可能会成功的。

但这并不意味着对于激光雷达是个严重的打击,因为对于其他厂家来说,由于特斯拉这个级别的数据量和积累很难追上,所以激光雷达是他们能迅速追赶特斯拉的一大“外挂”。

——要想在自动驾驶上能和特斯拉抗衡,就必须上激光雷达+高精地图。

除了算法之外,特斯拉还展示了之前一直在说的超级计算机——Dojo。

组成Dojo超级计算机的关键单元,是特斯拉自主研发的神经网络训练芯片——D1芯片。D1芯片采用分布式结构和7纳米工艺,搭载500亿个晶体管、354个训练节点,仅内部的电路就长达17.7公里,实现了超强算力和超高带宽。

特斯拉AI日都讲了些什么?

Dojo变态的地方在于,它可以做到和同规格的芯片无缝融合,变成超大规模计算阵列。

而特斯拉之前预热海报上的那个之前一度被猜测为采用了TSMC(台积电)的InFO-SoW(集成扇出系统)设计(所有的芯片都来自于同一个晶圆,不但不进行切割,反而是直接讲整个晶圆做成一个超大芯片,实现system on wafer的设计。)的图片,实际上是一个集合了25块D1芯片的训练模块。

特斯拉AI日都讲了些什么?

由于每个D1芯片之间都是无缝连接在一起,相邻芯片之间的延迟极低,训练模块最大程度上实现了带宽的保留,配合特斯拉自创的高带宽、低延迟的连接器,算力高达9PFLOPs(9千万亿次)。

得益于训练模块的独立运行能力和无限链接能力,由其组成的Dojo超级计算机的性能拓展在理论上无上限,是个不折不扣的“性能野兽”。实际应用中,特斯拉将以120个训练模块组装成ExaPOD,它是世界上首屈一指的人工智能训练计算机。与业内其他产品相比,同成本下它的性能提升4倍,同能耗下性能提高1.3倍,占用空间节省5倍。

——说白了就是,特斯拉继续怼芯片。

其实国内的芯片依然存在供应不足的局面,之前就有人发现博世(中国)投资有限公司执行副总裁徐大全发了个芯片断供的朋友圈:

特斯拉AI日都讲了些什么?

后续是经过努力克服了芯片的困难:

特斯拉AI日都讲了些什么?

可以看到,目前对于国内芯片企业来说,是个绝佳的机会,后续我们也会挖掘其中有潜力的公司。

国内目前能独立自研芯片的汽车相关的企业并不多,目前只有零跑在大华股份的帮助下交出了个凌芯01,以及地平线公司推出的征程系列,得到了实际的投入应用。(凌芯01用到C11上,征程3用到理想ONE上)

这部分在国内也是一个潜力极大的市场,目前比较确定的信息是韦尔股份有参与到地平线的融资中,大家可以关注、研究一下。

话说回特斯拉——凭借Dojo来进行模拟训练,特斯拉之后的自动辅助驾驶水平预计会得到飞速的提升。因为Dojo的核心作用,就是去模拟一些很少见但会发生的场景,给特斯拉的自动驾驶系统做训练:

上面图中,第一个是有人在高速上奔跑,第二个是密集的人群难以快速打标签,这些都是一些处理起来很困难的场景,在现实中去训练模拟成本就太高了,然而有了Dojo后,特斯拉就可以像围棋上的Alpha Go一样,在短短的时间内就进行成千上万次训练。

凭借Dojo,特斯拉的视觉路线很有可能会颠覆我们的想象。

而结尾被太多人关注的“特斯拉机器人”,则是马斯克的一个招聘,他希望能够招聘到相关的机器人研发人才。

马斯克原话是这么说的:“未来劳动力不会短缺,但体力劳动只是一种选择。Tesla Bot可以执行一些危险性、重复性、枯燥的任务。”Tesla Bot或将在明年推出首个原型机。

——对的,或将+明年,所以被关注最多的其实是最不需要关注的。

飞鲸投研从多维度分析,整理了一份《成长50》的名单,可以关注同名公众号:"飞鲸投研":feijingtouyan,进行领取(点击复制)

该文观点仅代表作者本人,飞鲸投研系信息发布平台

/阅读下一篇/

不止是跳水“零水花”,百度AI面向的是星辰大海

热门推荐