(完整word版)自动驾驶核心技术之三：环境感知

合集下载

无人驾驶实现自动驾驶的核心技术

无人驾驶实现自动驾驶的核心技术无人驾驶技术是近年来备受关注的热门话题，它的出现既是科技进步的体现，也是人类对未来出行方式的一种探索。

无人驾驶实现自动驾驶的关键在于以下几项核心技术。

一、感知与环境感知技术感知技术是无人驾驶中最为基础也最为重要的一个环节。

通过搭载在车辆上的各种传感器，如激光雷达、摄像头、毫米波雷达等，车辆可以实时获取周围环境的信息。

这些传感器能够对车辆周围的物体、行人、道路状况等进行感知和识别，并将数据传输给车辆的控制系统。

通过对环境的准确感知，车辆能够进行智能的决策和规划。

二、路径规划与决策技术路径规划与决策技术是无人驾驶实现自动驾驶的关键环节之一。

基于感知技术获取的环境信息，车辆需要根据目标地点和交通状况进行路径规划，选择最优的行驶路线。

同时，车辆还需要实时判断周围环境中的障碍物情况，做出相应的决策，如超车、变道、避让等。

这一系列的决策过程需要结合交通规则、道路标志和信号等因素，确保安全、高效的行驶。

三、定位与控制技术定位与控制技术是实现车辆精准行驶的关键。

通过全球定位系统（GPS）、惯性导航系统（INS）、地图等技术手段，车辆能够精确地确定自身的位置和姿态信息。

根据定位结果，车辆可以进行车道保持、转弯、换道等操作。

同时，通过控制系统对车辆的加速、制动和转向等执行器进行控制，实现车辆的准确操作。

定位与控制技术的精度和稳定性对于无人驾驶的安全及行驶质量至关重要。

四、人机交互与系统监控技术人机交互与系统监控技术是无人驾驶系统的重要组成部分。

通过人机交互界面，用户可以选择目的地、启动系统等操作。

同时，车辆还需要通过语音识别、手势识别等技术与乘客进行交流，确保乘客的使用体验。

系统监控技术则负责对车辆的各个组件和系统进行实时监测和故障诊断，一旦发现异常情况，及时做出响应，并通过报警提醒或自动调整等方式确保行驶的安全性。

无人驾驶实现自动驾驶的核心技术正不断突破，带来了交通出行方式的重大变革。

无人驾驶车辆的环境感知技术介绍

无人驾驶车辆的环境感知技术介绍随着科技的不断进步和人们对出行方式的需求不断变化，无人驾驶车辆成为了当今社会研究和发展的热点之一。

无人驾驶车辆的实现离不开先进的环境感知技术，它能够帮助车辆准确地感知周围环境，做出正确的决策，从而保证行驶的安全和稳定。

环境感知技术是无人驾驶车辆的核心之一，它通过使用各种传感器和设备来感知和识别周围环境的信息。

其中最常用的传感器包括激光雷达、摄像头、超声波传感器和雷达等。

这些传感器能够实时获取车辆周围的数据，如道路状况、障碍物位置、行人行为等。

激光雷达是无人驾驶车辆中最重要的感知设备之一。

它通过发射激光束并接收反射回来的光来测量周围环境的距离和形状。

激光雷达能够快速扫描周围环境，生成高精度的地图，提供给车辆进行路径规划和避障。

激光雷达的优点是精度高、反应速度快，但也存在一些缺点，比如价格昂贵、对天气条件敏感等。

摄像头也是无人驾驶车辆中常用的感知设备之一。

它通过拍摄周围环境的图像来获取信息。

摄像头可以识别道路标志、交通信号灯、行人和其他车辆等。

通过对图像进行处理和分析，车辆可以判断出当前的交通状况，从而做出相应的决策。

摄像头的优点是成本低、信息量大，但也存在一些挑战，如光线条件不好时的影响和图像处理算法的复杂性。

超声波传感器主要用于测量车辆周围的距离。

它通过发射超声波脉冲并测量其反射时间来计算物体与车辆之间的距离。

超声波传感器可以用于避障和停车等场景。

它的优点是价格低、反应速度快，但也存在一些限制，如测量距离有限、对目标形状敏感等。

雷达是一种常用的感知设备，它通过发射无线电波并接收其反射信号来测量物体的位置和速度。

雷达可以用于检测周围车辆的位置和速度，从而进行车辆间的协同和避障。

雷达的优点是适用于各种天气条件、反应速度快，但也存在一些缺点，如分辨率较低、对目标细节感知能力有限等。

除了传感器外，环境感知技术还包括数据融合和处理算法。

数据融合是将来自不同传感器的数据进行整合和处理，以提高感知的准确性和鲁棒性。

(完整word版)无人驾驶关键技术分析

无人驾驶关键技术分析无人驾驶技术是传感器、计算机、人工智能、通信、导航定位、模式识别、机器视觉、智能控制等多门前沿学科的综合体。

按照无人驾驶汽车的职能模块，无人驾驶汽车的关键技术包括环境感知、导航定位、路径规划、决策控制等。

（1）环境感知技术环境感知模块相当于无人驾驶汽车的眼和耳,无人驾驶汽车通过环境感知模块来辨别自身周围的环境信息。

为其行为决策提供信息支持.环境感知包括无人驾驶汽车自身位姿感知和周围环境感知两部分。

单一传感器只能对被测对象的某个方面或者某个特征进行测量，无法满足测量的需要。

因而，必需采用多个传感器同时对某一个被测对象的一个或者几个特征量进行测量，将所测得的数据经过数据融合处理后。

提取出可信度较高的有用信号.按照环境感知系统测量对象的不同，我们采用两种方法进行检测：无人驾驶汽车自身位姿信息主要包括车辆自身的速度、加速度、倾角、位置等信息。

这类信息测量方便，主要用驱动电机、电子罗盘、倾角传感器、陀螺仪等传感器进行测量。

无人驾驶汽车周围环境感知以雷达等主动型测距传感器为主,被动型测距传感器为辅,采用信息融合的方法实现。

因为激光、雷达、超声波等主动型测距传感器相结合更能满足复杂、恶劣条件下，执行任务的需要，最重要的是处理数据量小,实时性好。

同时进行路径规划时可以直接利用激光返回的数据进行计算，无需知道障碍物的具体信息。

而视觉作为环境感知的一个重要手段，虽然目前在恶劣环境感知中存在一定问题。

但是在目标识别、道路跟踪、地图创建等方面具有其他传感器所无法取代的重要性，而在野外环境中的植物分类、水域和泥泞检测等方面,视觉也是必不可少的手段。

（2）导航定位技术无人驾驶汽车的导航模块用于确定无人驾驶汽车其自身的地理位置，是无人驾驶汽车的路径规划和任务规划的之支撑.导航可分为自主导航和网络导航两种。

自主导航技术是指除了定位辅助之外，不需要外界其他的协助，即可独立完成导航任务。

自主导航技术在本地存储地理空间数据，所有的计算在终端完成，在任何情况下均可实现定位，但是自主导航设备的计算资源有限，导致计算能力差，有时不能提供准确、实时的导航服务。

无人驾驶汽车导航中的环境感知

无人驾驶汽车导航中的环境感知在当今科技飞速发展的时代，无人驾驶汽车逐渐从科幻走向现实。

而在无人驾驶技术中，环境感知是至关重要的一环，它就像是汽车的“眼睛”，让车辆能够了解周围的世界，从而做出安全、准确的驾驶决策。

那么，什么是无人驾驶汽车导航中的环境感知呢？简单来说，它是指车辆通过各种传感器和技术手段，收集、分析和理解周围环境的信息，包括道路状况、交通信号、其他车辆和行人的位置与动态等。

这些信息对于无人驾驶汽车的安全行驶和高效导航起着决定性的作用。

为了实现环境感知，无人驾驶汽车配备了多种类型的传感器。

其中，最常见的包括摄像头、激光雷达、毫米波雷达和超声波传感器等。

摄像头就像是人的眼睛，可以获取丰富的图像信息，帮助识别道路标志、交通信号灯和行人的外貌特征。

然而，摄像头在恶劣天气条件下，如雨雪、大雾等，其性能可能会受到一定的影响。

激光雷达则通过发射激光束并测量反射回来的时间，来构建周围环境的三维模型。

它能够精确地测量物体的距离和形状，对于检测障碍物和道路边界非常有效。

但激光雷达的成本相对较高，而且在一些特殊环境下，如面对反射率较低的物体，可能会出现测量误差。

毫米波雷达则擅长检测远距离的物体和快速移动的目标，对于车辆的高速行驶和远距离预警具有重要意义。

它不受天气条件的影响，但在分辨率和精度方面相对激光雷达有所不足。

超声波传感器通常用于近距离的障碍物检测，比如停车时感知车辆周围的低矮物体。

这些传感器各自有着独特的优势和局限性，因此在实际应用中，通常会将它们组合使用，以实现更全面、更准确的环境感知。

当传感器收集到大量的环境数据后，接下来就需要对这些数据进行处理和分析。

这是一个极其复杂的过程，需要强大的计算能力和先进的算法支持。

首先，数据需要进行预处理，去除噪声和无效信息，然后通过特征提取和模式识别等技术，将数据转化为有意义的信息，例如识别出道路上的车辆、行人、自行车等。

在环境感知中，不仅要准确地检测到物体，还需要对物体的运动状态和意图进行预测。

自动驾驶技术的环境感知方法

自动驾驶技术的环境感知方法随着科技的不断发展，自动驾驶技术逐渐成为汽车行业的热门话题。

自动驾驶技术的核心在于车辆对周围环境的感知能力，只有准确地理解和识别道路和交通情况，才能实现安全可靠的自动驾驶。

自动驾驶技术的环境感知方法主要包括传感器、计算机视觉和深度学习三个方面。

首先，传感器是自动驾驶系统的重要组成部分，用于收集和检测车辆周围的环境数据。

常见的传感器包括摄像头、雷达、激光雷达和超声波传感器等。

摄像头主要用于获取图像信息，通过分析图像中的道路标记、车辆和行人等特征来判断道路状况。

激光雷达则能够高精度地测量周围的物体距离和位置，从而实现对车辆的精确感知。

雷达和激光雷达的组合可以提供更全面的环境感知能力。

其次，计算机视觉是自动驾驶技术中的关键技术之一。

通过使用图像处理和计算机视觉算法，可以从传感器采集的图像数据中提取出有用的信息。

例如，利用图像处理技术可以检测出道路标记、交通信号灯和行人等，进而实现对道路情况的快速判断。

计算机视觉技术还能够利用深度学习算法对环境中的物体进行分类和识别，识别出道路上的车辆、行人和障碍物，以及预测它们的行为和动态轨迹。

最后，深度学习是近年来自动驾驶领域的研究热点。

深度学习是一种基于神经网络的机器学习方法，它能够通过大量的训练数据和神经网络模型来实现对复杂环境的感知和理解。

通过深度学习算法，可以让自动驾驶系统掌握道路交通规则和行为模式，并根据实时的环境信息做出准确的决策和预测。

深度学习还可以通过对不同车辆和行人行为的学习，提高自动驾驶系统对复杂交通场景的理解能力和适应能力。

除了传感器、计算机视觉和深度学习之外，环境地图的建立和更新也是自动驾驶技术中必不可少的一环。

通过将传感器采集到的数据与事先建立的地图数据进行匹配和融合，可以实现地图的更新和路径规划的优化。

地图的建立和更新可以利用GPS定位、惯性导航系统和传感器融合等多种技术手段，进一步提高自动驾驶系统的感知能力和路线规划精度。

自动驾驶汽车环境感知技术

自动驾驶汽车环境感知技术自动驾驶汽车环境感知技术是指通过各种传感器、相机和雷达等设备，实现对汽车周围环境的感知和识别，从而使得汽车能够自主地感知和理解道路状况，并做出相应的决策和行动，实现自动驾驶功能。

这项技术的发展对于提高行车安全性、减少交通事故、解决交通拥堵等问题具有重要的意义。

一、传感器技术为了实现对汽车周围环境的感知，自动驾驶汽车需要配备各种先进的传感器技术。

目前常用的传感器包括激光雷达、毫米波雷达、摄像头等。

其中，激光雷达可以通过向周围发射激光束，并利用反射回来的光波数据来生成环境的三维点云图，从而实现对周围物体的感知和识别。

毫米波雷达则可以通过发射毫米波信号，并接收其反射回来的信号，实现对周围物体的距离、速度等信息的感知。

而摄像头则可以通过图像识别和计算机视觉技术，对周围物体进行识别和分析。

二、数据处理与算法传感器获取的大量数据需要通过数据处理与算法来实现对环境的理解和判断。

数据处理的关键是通过滤波算法对传感器数据进行降噪处理，消除因传感器噪声或其他因素引起的干扰。

而算法的关键是实现对环境中的各种物体和障碍物的识别和判断。

常见的算法包括目标检测和跟踪算法、道路识别和车道线检测算法等。

这些算法的研发和优化可以提高自动驾驶汽车对周围环境的感知和理解能力。

三、环境地图构建自动驾驶汽车需要构建一个准确且实时的环境地图，以实现对周围环境的感知和导航。

环境地图是指将传感器获取的数据和识别结果进行融合，并对其进行处理和分析，生成对周围环境的描述和表示。

环境地图可以包括道路信息、交通标志、车辆位置等。

通过与事先构建好的地图进行比对，自动驾驶汽车可以实现对自身位置和周围环境的准确判断。

四、挑战与发展尽管自动驾驶汽车环境感知技术已经取得了长足的进展，但仍然面临一些挑战与困难。

首先，自动驾驶汽车需要处理复杂多变的交通环境和道路情况，例如各种天气条件、道路施工等。

其次，自动驾驶汽车需要处理大量的数据，并进行实时的感知和决策，对计算能力和算法的要求较高。

自动驾驶系统的环境感知与识别优化技巧

自动驾驶系统的环境感知与识别优化技巧自动驾驶技术的快速发展为交通运输领域带来了巨大的变革。

然而，要实现真正的自动驾驶，系统需要准确地感知和识别周围环境，以便正确地作出决策和控制车辆。

本文将介绍一些优化技巧，帮助自动驾驶系统更好地感知和识别环境。

一、多传感器数据融合为了提高环境感知的准确性和稳定性，自动驾驶系统通常会使用多个传感器，如激光雷达、摄像头和毫米波雷达。

然而，各种传感器都存在自身的限制和盲区。

通过将不同传感器的数据进行融合，可以更全面地理解周围环境。

常用的融合方法包括卡尔曼滤波、粒子滤波和图优化。

二、深度学习算法的应用深度学习在计算机视觉领域取得了巨大的成功，对于自动驾驶系统的环境感知和识别也有着重要的应用。

通过深度学习算法，系统可以从传感器数据中学习到更高层次的特征表示，提高识别准确率。

常用的深度学习模型包括卷积神经网络（CNN）和循环神经网络（RNN）。

三、实时语义分割语义分割是一种将图像中的每个像素分配给不同类别的任务，对于自动驾驶系统的环境感知非常关键。

传统的语义分割方法通常较为耗时，难以满足实时性的需求。

近年来，一些基于深度学习的实时语义分割算法被提出，通过网络架构的改进和高效的推理方法，实现了准确且实时的语义分割。

四、实时目标检测与跟踪为了实现自动驾驶，系统需要及时地识别和跟踪道路上的各种目标，如车辆、行人和障碍物。

传统的目标检测与跟踪算法通常难以满足实时性和准确性的需求。

近年来，一些基于深度学习的实时目标检测和跟踪算法被提出，如YOLO和Faster R-CNN，能够在保持较高准确率的同时，实现实时性的目标检测与跟踪。

五、环境模型的更新与维护由于道路环境的不断变化，自动驾驶系统需要及时更新和维护其环境模型，以保持准确性和可靠性。

传感器数据的时序处理和地图信息的融合是实现环境模型更新的关键技术。

同时，为了减少对传感器数据的依赖，还可以借助车载摄像头等主动感知设备，实时监测并更新道路环境。

自动驾驶四大核心技术的环境感知的详细概述

自动驾驶四大核心技术的环境感知的详细概述人类驾驶员会根据行人的移动轨迹大概评估其下一步的位置，然后根据车速，计算出安全空间（路径规划），公交司机最擅长此道。

无人驾驶汽车同样要能做到。

要注意这是多个移动物体的轨迹的追踪与预测，难度比单一物体要高得多。

这就是环境感知，也是无人驾驶汽车最具难度的技术。

今天介绍一下环境感知的内容。

环境感知也被称为MODAT(Moving Object Detection andTracking)。

自动驾驶四大核心技术，分别是环境感知、精确定位、路径规划、线控执行。

环境感知是其中被研究最多的部分，不过基于视觉的环境感知是无法满足无人汽车自动驾驶要求的。

实际的无人驾驶汽车面对的路况远比实验室仿真或者试车场的情况要复杂很多，这就需要建立大量的数学方程。

而良好的规划必须建立对周边环境，尤其是动态环境的深刻理解。

环境感知主要包括三个方面，路面、静态物体和动态物体。

对于动态物体，不仅要检测还要对其轨迹进行追踪，并根据追踪结果，预测该物体下一步的轨迹（位置）。

这在市区，尤其中国市区必不可少，最典型场景就是北京五道口：如果你见到行人就停，那你就永远无法通过五道口，行人几乎是从不停歇地从车前走过。

人类驾驶员会根据行人的移动轨迹大概评估其下一步的位置，然后根据车速，计算出安全空间（路径规划），公交司机最擅长此道。

无人驾驶汽车同样要能做到。

要注意这是多个移动物体的轨迹的追踪与预测，难度比单一物体要高得多。

这就是 MODAT(Moving Object Detectionand Tracking)。

也是无人驾驶汽车最具难度的技术。

下图是一个典型的无人驾驶汽车环境感知框架：这是基于激光雷达的环境感知模型，目前来说，搞视觉环境感知模型研究的人远多于激光雷达。

不过很遗憾地讲，在无人驾驶汽车这件事上，视觉肯定是不够的，长远来说，激光雷达配合毫米波雷达，再加上视觉环境感知的综合方案才能真正做到无人驾驶。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

自动驾驶核心技术之三：环境感知自动驾驶四大核心技术，分别是环境感知、精确定位、路径规划、线控执行。

环境感知是其中被研究最多的部分，不过基于视觉的环境感知是无法满足无人驾驶要求的。

环境感知主要包括三个方面，路面、静态物体和动态物体。

对于动态物体，不仅要检测还要对其轨迹进行追踪，并根据追踪结果，预测该物体下一步的轨迹（位置）。

人类驾驶员会根据行人的移动轨迹大概评估其下一步的位置，然后根据车速，计算出安全空间（路径规划），公交司机最擅长此道。

无人车同样要能做到。

要注意这是多个移动物体的轨迹的追踪与预测，难度比单一物体要高得多。

这就是MODAT(Moving Object Detection and Tracking)。

也是无人车最具难度的技术。

图：无人车环境感知框架这是基于激光雷达的环境感知模型，搞视觉环境感知模型研究的人远多于激光雷达。

不过很遗憾地讲，在无人车这件事上，视觉不够靠谱。

让我们来看计算机视觉的发展历程，神经网络的历史可追述到上世纪四十年代，曾经在八九十年代流行。

神经网络试图通过模拟大脑认知的机理，解决各种机器学习的问题。

1986 年Rumelhart，Hinton 和Williams 在《自然》发表了著名的反向传播算法用于训练神经网络，直到今天仍被广泛应用。

不过深度学习自80年代后沉寂了许久。

神经网络有大量的参数，经常发生过拟合问题，即往往在训练集上准确率很高，而在测试集上效果差。

这部分归因于当时的训练数据集规模都较小，而且计算资源有限，即便是训练一个较小的网络也需要很长的时间。

神经网络与其它模型相比并未在识别的准确率上体现出明显的优势，而且难于训练。

因此更多的学者开始采用诸如支持向量机（SVM）、Boosting、最近邻等分类器。

这些分类器可以用具有一个或两个隐含层的神经网络模拟，因此被称作浅层机器学习模型。

它们不再模拟大脑的认知机理；相反，针对不同的任务设计不同的系统，并采用不同的手工设计的特征。

例如语音识别采用高斯混合模型和隐马尔可夫模型，物体识别采用SIFT 特征，人脸识别采用LBP 特征，行人检测采用HOG 特征。

2006年以后，得益于电脑游戏爱好者对性能的追求，GPU性能飞速增长。

同时，互联网很容易获得海量训练数据。

两者结合，深度学习或者说神经网络焕发了第二春。

2012 年，Hinton 的研究小组采用深度学习赢得了ImageNet 图像分类的比赛。

从此深度学习开始席卷全球，到今天，你不说深度学习都不好出街了。

深度学习与传统模式识别方法的最大不同在于它是从大数据中自动学习特征，而非采用手工设计的特征。

好的特征可以极大提高模式识别系统的性能。

在过去几十年模式识别的各种应用中，手工设计的特征处于统治地位。

它主要依靠设计者的先验知识，很难利用大数据的优势。

由于依赖手工调参数，特征的设计中只允许出现少量的参数。

深度学习可以从大数据中自动学习特征的表示，其中可以包含成千上万的参数。

手工设计出有效的特征是一个相当漫长的过程。

回顾计算机视觉发展的历史，往往需要五到十年才能出现一个受到广泛认可的好的特征。

而深度学习可以针对新的应用从训练数据中很快学习得到新的有效的特征表示。

一个模式识别系统包括特征和分类器两个主要的组成部分，二者关系密切，而在传统的方法中它们的优化是分开的。

在神经网络的框架下，特征表示和分类器是联合优化的。

两者密不可分。

深度学习的检测和识别是一体的，很难割裂，从一开始训练数据即是如此，语义级标注是训练数据的最明显特征。

绝对的非监督深度学习是不存在的，即便弱监督深度学习都是很少的。

因此视觉识别和检测障碍物很难做到实时。

而激光雷达云点则擅长探测检测障碍物3D轮廓，算法相对深度学习要简单的多，很容易做到实时。

激光雷达拥有强度扫描成像，换句话说激光雷达可以知道障碍物的密度，因此可以轻易分辨出草地，树木，建筑物，树叶，树干，路灯，混凝土，车辆。

这种语义识别非常简单，只需要根据强度频谱图即可。

而视觉来说要准确的识别，非常耗时且可靠性不高。

视觉深度学习最致命的缺点是对视频分析能力极弱，而无人车面对的视频，不是静态图像。

而视频分析正是激光雷达的特长。

视觉深度学习在视频分析上处于最初的起步阶段，描述视频的静态图像特征，可以采用从ImageNet 上学习得到的深度模型；难点是如何描述动态特征。

以往的视觉方法中，对动态特征的描述往往依赖于光流估计，对关键点的跟踪，和动态纹理。

如何将这些信息体现在深度模型中是个难点。

最直接的做法是将视频视为三维图像，直接应用卷积网络，在每一层学习三维滤波器。

但是这一思路显然没有考虑到时间维和空间维的差异性。

另外一种简单但更加有效的思路是通过预处理计算光流场，作为卷积网络的一个输入通道。

也有研究工作利用深度编码器(deep autoencoder)以非线性的方式提取动态纹理，而传统的方法大多采用线性动态系统建模。

光流只计算相邻两帧的运动情况，时间信息也表述不充分。

two-stream只能算是个过渡方法。

目前CNN搞空域，RNN搞时域已经成共识，尤其是LSTM 和GRU结构的引入。

RNN在动作识别上效果不彰，某些单帧就可识别动作。

除了大的结构之外，一些辅助的模型，比如visual hard/soft attention model，以及ICLR2016上的压缩神经网络都会对未来的深度学习视频处理产生影响。

目前深度学习对视频分析还不如手工特征，而手工特征的缺点，前面已经说过，准确率很低，误报率很高。

未来恐怕也难以提升。

太多的坑要填。

MODAT首先要对视频分析，实时计算出地平面，这对点云为主的激光雷达来说易如反掌，对视觉来说难比登天。

用分段平面拟合和RANSAC算法计算出真实地平面。

实际单靠激光雷达的强度扫描成像，一样可以得出准确的地平面，这也是激光雷达用于遥感的主要原因，可以排除植被的干扰，获得准确的地形图，大地基准面。

用VOXEL GRID滤波器将动静物体分开，黑棕蓝绿是激光雷达发射到行人身上的每个时间段的假设，与动态物体比，静态物体捕获的点云数自然要多。

左边是深度学习领域人尽皆知的权威Kitti数据集的采集车，右边是数据集的数据格式和内容。

Kitti对其Ground Truth有一段描述，To generate 3D object ground-truth we hired a set of annotators, and asked them to assign tracklets in the form of 3D bounding boxes to objects such as cars, vans, trucks,trams, pedestrians and cyclists. Unlike most existing benchmarks, we do not rely on online crowd-sourcing to perform the labeling. Towards this goal, we create a special purpose labeling tool, which displays 3D laser points as well as the camera images to increase the quality of the annotations.这里Kitti说的很明确，其训练数据的标签加注不是人工众包，而是打造了一个自动标签软件，这个软件把3D激光云点像光学图像一样显示出来，以此来提高标注的质量。

很简单，激光雷达是3D Object Detection的标准，即使视觉深度学习再强大，与激光雷达始终有差距。

再来说一下Stixel（sticks above the ground in the image），中文一般叫棒状像素，这是2008年由奔驰和法兰克福大学Hern′an Badino教授推出的一种快速实时检测障碍物的方法，尤其适合检测行人，每秒可做到150甚至200帧，这也是奔驰和宝马双目的由来。

Hern′an Badino后来被卡梅隆大学的机器人实验室挖走了，Uber的无人车主要就是基于卡梅隆大学机器人实验室开发的。

Stixel的核心是计算棒状物的上下边缘和双目视差，构建一个Stixel，可以准确快速地检测障碍物，特别是行人。

这是奔驰宝马大规模使用双目的主要原因，相对单目的行人识别，双目Stixel拥有碾压性优势。

激光雷达的3D距离信息更容易获得，也更准确，因此建立Steixel更加快捷准确。

现在该说Tracking了，现在不少人把跟踪(tracking)和计算机视觉中的目标跟踪搞混了。

前者更偏向数学，是对状态空间在时间上的变化进行建模，并对下一时刻的状态进行预测的算法。

例如卡尔曼滤波，粒子滤波等。

后者则偏向应用，给定视频中第一帧的某个物体的框，由算法给出后续帧中该物体的位置。

最初是为了解决检测算法速度较慢的问题，后来慢慢自成一系。

因为变成了应用问题，所以算法更加复杂，通常由好几个模块组成，其中也包括数学上的tracking算法，还有提取特征，在线分类器等步骤。

在自成一系之后，目标跟踪实际上就变成了利用之前几帧的物体状态(旋转角度，尺度)，对下一帧的物体检测进行约束(剪枝)的问题了。

它又变回物体检测算法了，但却人为地把首帧得到目标框的那步剥离出来。

在各界都在努力建立end-to-end系统的时候，目标跟踪却只去研究一个子问题，选择性无视'第一帧的框是怎么来的'的问题。

激光雷达的Tracking则很容易做到，以IBEO为例，IBEO每一款激光雷达都会附送一个叫IBEO Object Tracking的软件，这是一个基于开曼滤波器的技术，最多可实时跟踪65个目标，是实时哟，这可是视觉类根本不敢想的事。

Quanergy也有类似的软件，叫3D Perception。

感知、决策（路径规划）、定位都是基于传感器或软件系统的，这也是科技类厂家的强项，不过线控执行系统则是传统汽车产业（不一定是整车厂）的绝对强项，这也是科技类厂家注定无法独立造车的主要原因，无论是谷歌还是百度，都必须要与传统汽车产业联合，才能进军无人车领域。

下一节，我们就说说线控执行。

近期活动：2016汽车传感器与汽车人工智能论坛（AUTOSAI）时间：2016年11月24日-25日地点：北京圣龙翔会议中心一、部分特邀演讲嘉宾二、论坛研讨主题三、报名方式：。