国产弯道超车还是特斯拉强无敌？聊聊自动驾驶那点事_E动中国(yeedong) 中国豪华电动汽车第一门户

摘要：纯视觉方案的忠实拥趸。

目前的国内新能源市场，绝对算得上是卷中之卷，几乎天天有新车上市，炒续航的、拼三电的、甚至连智能座舱都卷出了新高度，但几乎所有车企都少不了吹一波自家的“自动驾驶技术”。

从前几年的L2、L2+，再到如今的NGP、NOA，各种概念层出不穷，高大上的演示画面就差把“自动驾驶”贴用户脸上了。

不过有意思的是，不同于国内车企普遍选择的堆料自动驾驶硬件的多传感器融合方案，特斯拉却一直是纯视觉方案的忠实拥趸。

为啥特斯拉一直坚持死磕纯视觉方案？多传感器融合和纯视觉到底孰优孰劣？想解决这些问题，我们可能要从特斯拉的FSD是如何实现自动驾驶的开始聊起。

纯视觉和多传感器融合，都是为了实现环境感知

特斯拉的自动驾驶的逻辑其实非常简单，就是尽可能地去模仿人类的驾驶习惯。

想实现自动驾驶，首先得做到的就是对周遭环境的感知，而如何实现对周围环境的感知，却成了特斯拉和国内一众车企在自动驾驶技术路线上最大的分歧。

特斯拉用的是完全靠摄像头感知环境的纯视觉方案，通过摄像头获取到的图像信息，用AI技术对周围环境进行判断。比如用个体分割来区分哪里是天、哪里是地，哪里是路；用物体识别来识别图像中的人、车、红绿灯等；并对物体的运动轨迹进行预测，以上这些共同使用一个主要的计算过程，节省计算资源的同时降低延迟，加快自动驾驶的反应速度。

同时特斯拉还有一套自监督训练视觉估算距离的神经网络，并通过开发工程车上搭载的激光雷达等对视觉算法的估算结果进行核对和验证。

不过这一整套依赖神经网络实现的视觉感知系统的问题在于很难解决长尾问题，也就是在同一问题中出现的罕见例子，神经网络对这类没见过的例子处理能力很差。

针对这个问题，特斯拉给出的解决方案是尽可能高效、自动化地收集罕见例子，对算法进行训练，这需要海量的数据。而特斯拉的数据来源，正是大量的在路上跑着的特斯拉车辆。

相比特斯拉的纯视觉方案，国内车企们普遍选择的多传感器融合方案，除了摄像头，还多了激光雷达、毫米波雷达等传感器来帮助实现对周围环境的感知，这种方案的优势也很好理解，有点像星爷电影中多种武器融为一体的“要你命3000”，用摄像头判断和描述物体、毫米波雷达确认物体存在、激光雷达判断距离，各司其职。

不过这套方案的问题同样不少，多传感器不仅会大幅提高硬件成本，还会造成数据和代码的进一步膨胀，不过最难解决的还是多传感器带来的信号融合问题，不仅难解决，解决过程也会进一步消耗算力。

所以特斯拉选择纯视觉方案，不仅成本低，稳定性高，还无需消耗算力去解决信号融合的问题。只要算力提升，同时有足够的数据不断训练优化算法，纯视觉方案的感知能力就会越来越强，追上甚至超越人类，从而实现自动驾驶，毕竟人类也不是靠着头顶发射激光才实现驾驶的。

特斯拉的自动驾驶是怎么完成驾驶决策的？

上面我们聊完了特斯拉和其他车企都是怎么实现对周围环境的感知，不过想实现自动驾驶除了感知还需要决策，也就是获取了路况信息后，还得告诉车辆怎么开。

目前的驾驶决策系统，大多使用的是人为设定的驾驶规则，也就是说通过人来提前设定，路上遇到各种情况时车辆要做什么样的处理，比如最基础的红灯停、绿灯行这类规则。

这样的人为设定驾驶规则优势在于，设定难度不高，也容易解释，实现起来也简单。

可问题在于，这样人为设定规则要想实现让自动驾驶车辆接近人类的驾驶习惯需要海量的规则。这就需要大量人力，去制定、监督、维护这些规则，成本就会提高，想实现更高级别的自动驾驶也更依赖地图厂商提供的高精地图。

这也是为什么现阶段的辅助驾驶都会优先上线高速这类路况相对简单、规则相对明确的场景。

不过高精地图也很难说是个完美的方案，过于依赖高精地图会让自动驾驶变成“轨道车”。高精地图的鲜度问题短时间内也很难解决，无法及时更新的高精地图将极大增加自动驾驶的不稳定风险。

同时高精地图受政策影响的风险也很大，不少敏感地区都可能无法完成高精地图的测绘，这些地区或许就会成为自动驾驶的“盲区”。

特斯拉选择的是不依赖高精地图，通过训练神经网络对不同情况下行车轨迹做出计算和预测，通过模拟学习来学习人类驾驶行为。

特斯拉可以通过路上行驶的特斯拉车辆，收集人类的驾驶行为数据，并进行即时标注。

特斯拉的影子模式，主要作用就是监督人类驾驶者的驾驶决策和习惯，并把这些驾驶行为和自动驾驶系统做出的决策做比对，一旦出现不同，影子模式可以立即对数据进行标注并上传特斯拉服务器作为学习素材。

影子模式带来的海量数据需要有强大算力和数据吞吐能力的超算进行处理，这可能也是特斯拉建立“道场”也就是Dojo超级计算机集群的原因之一。

不过目前神经网络实现的自动驾驶相比人类仍然缺少基于经验的预测能力，以及举一反三的泛化能力，这可能也是特斯拉之后要重点解决的问题。

聊到这，相信大伙对当前自动驾驶的各种方案都有了一定的了解，相比国内车企选择的多传感器融合和高精地图方案，特斯拉的纯视觉方案显然更激进一些，依靠的更多是算力和数据量。

正如时下大火的Web3.0强调的数据即价值，“走量”的特斯拉靠着路上行驶的自家汽车不断的获取数据，再借此优化自动驾驶。

海量的数据才是特斯拉相比其他车企真正的护城河，或许也是短时间内国内车企难以弯道超车的真正原因。

E动中国(yeedong) 中国豪华电动汽车第一门户

国产弯道超车还是特斯拉强无敌？聊聊自动驾驶那点事

评论

相关阅读