视觉与激光 SLAM 融合技术在复杂环境下的性能优化研究

2025-05-12 22:51
10

   

本论文探讨了视觉SLAM和激光SLAM两种技术的定义、应用、优缺点以及它们在SLAM领域的发展趋势。特别强调了将这两种技术融合的优势,包括提高精确性、适应性、轻便性以及动态物体检测。论文还介绍了如何将它们融合,以及融合后的效果以及适用情况。


关键词

SLAM, 视觉SLAM, 激光SLAM, 传感器融合, 融合技术, 动态物体检测


引言

SLAM技术是机器人领域的关键技术之一,它允许机器人在未知环境中实时地定位自身并构建地图。在SLAM领域,视觉SLAM和激光SLAM是两种常用的方法,各自具有一定的优势和局限性。本文将分别讨论这两种方法的定义、应用、优缺点,以及它们如何融合以取长补短,提高SLAM系统的性能。

一、SLAM的定义

SLAMSimultaneous Localization and Mapping)是指在未知环境中,通过一台移动机器人或传感器设备,同时实时地确定机器人自身的位置(Localization)和构建环境地图(Mapping)的过程。SLAM技术是机器人领域中的核心技术之一,也被广泛应用于自动驾驶车辆、无人机、室内导航系统等领域。

SLAM中,机器人或传感器设备通过携带各种传感器(如激光雷达、相机、惯性测量单元等)来感知周围环境,获取环境的相关信息。SLAM系统利用传感器数据,通过一系列的算法和技术,实时地估计机器人的运动轨迹和周围环境的结构,从而同时实现机器人的定位和地图构建。

定位(Localization):确定机器人在已知地图中的位置。即使在未知环境中,SLAM算法也能够估计机器人相对于地图的位置,通常以坐标或者姿态(位置和方向)的形式表示。

建图(Mapping):在机器人运动过程中,利用传感器数据构建环境地图。这个地图可以是二维或三维的,表示环境中的障碍物、路标或者其他地标。

总的来说,SLAM是一种复杂的计算问题,其目标是实现在未知环境中的实时定位和地图构建,为移动机器人和自主系统在未知或部分未知环境中的导航和决策提供关键支持。


图片1.png

1


一)视觉SLAM

视觉SLAM是一种使用相机图像数据来同时定位机器人和构建地图的技术。它基于计算机视觉算法,通过分析相机捕捉的图像来提取特征点、匹配地图中的特征点,并根据这些信息来估计机器人的位置和地图。

优点在于视觉SLAM使用的相机是轻便且成本相对较低的传感器它的适应性广,可在各种环境下工作提供丰富的视觉信息。缺点在于对光照和纹理变化敏感以及无法直接检测距离,需要通过三角测距进行估计无法检测透明或反射表面。

视觉SLAM通常应用于无人机导航自动驾驶车辆室内导航工业自动化增强现实技术等等,

无人机导航:视觉SLAM可用于自主飞行的无人机,帮助其在室内或未知环境中进行定位和导航。

移动机器人:可以使用视觉SLAM进行自主导航,用于任务如巡逻、物品递送等。

增强现实(AR):视觉SLAM用于追踪设备或用户位置,以便在现实世界中叠加虚拟信息。

自动驾驶:自动驾驶汽车使用视觉SLAM来感知周围环境,定位自己在道路上,并建立地图。

二)激光SLAM

激光SLAM使用激光雷达传感器来测量物体的距离和形状,从而定位机器人和构建地图。激光束发射器旋转,测量回波时间以计算物体的位置。

它的优点包括它可以进行高度精确的距离测量不受光照和纹理的影响可以检测透明或反射表面。缺点包括它使用的激光传感器成本较高体积较大且消耗电能较多它还拥有有限的垂直视场。

其多应用室内导航和建图,建筑测绘,矿山勘探,3D环境建模以及农业自动化

室内导航:室内机器人和自动导航车辆可使用激光SLAM来避障、定位和导航。

建筑测绘:激光SLAM可用于建筑内部或外部的精确地图构建和测绘。

矿山勘探:在地下矿山中,激光SLAM可用于勘探、安全监测和导航。

农业自主机器人:用于农业机器人的自主导航和作物监测。


二、SLAM的发展趋势


图片2.png

图2


图片3.png

图3


SLAM技术在过去几年取得了显著的进展视觉SLAM和激光SLAM各自有其独特的优势和局限性,因此它们的融合可以综合利用它们的优点,使其应用于更多场景。以下是一些发展趋势:

更多的传感器融合,包括相机、激光、惯性传感器、超声波传感器等,以提高鲁棒性和精确性。

机器学习和深度学习在SLAM中的应用,用于特征提取、场景理解和运动估计。

实时性和效率的提高,以适应自动驾驶、无人机等实时应用。

更好的动态物体检测和处理方法,以应对动态环境。


图片4.png

4


图片5.png

5


一)融合这两种技术的方法

使用多模态传感器套件,同时包含相机和激光传感器,以获得更多的数据。

数据融合算法,如Extended Kalman Filter (EKF)GraphSLAM,用于将来自不同传感器的数据融合在一起。

运用机器学习技术,例如深度神经网络,来融合不同传感器的数据和提高对环境信息的理解。

(二)两者融合的优势

更轻便的硬件可以根据需求选择轻便的传感器套件,提高机器人的机动性。

更强的环境感知:视觉SLAM适用于检测颜色、纹理和光照等特征,而激光SLAM在低光照、无纹理表面等情况下表现更好。通过融合两者,机器人或系统可以在更广泛的环境条件下实现更强大的感知能力。

更高的鲁棒性:视觉SLAM和激光SLAM的错误和不确定性来源不同。视觉SLAM可能受到光照变化和遮挡的影响,而激光SLAM则可能受到多路径效应和透明物体的影响。通过融合两种传感器,可以减小错误和提高鲁棒性。

精确的地图生成:激光雷达可以实现高精度的测距,其精度为毫米级。但是激光雷达本身存在有效探测范围,且传感器成本较高;相机成像无探测距离限制,且传感器成本较低。但是相机对光线的依赖程度较高。激光SLAM能够提供高精度的地图,而视觉SLAM可以提供更详细的地图信息。融合两者可以获得高精度和丰富信息的地图,适用于不同类型的应用,如自动驾驶和室内导航。

充分利用传感器的优势:传感器类型方面,激光SLAM采用激光雷达SLAM采集环境信息,按照飞行时间测距原理确定传感器发射器与目标物体之间的传播距离,从而得到环境中物体的位置和形状等信息;视觉SLAM中使用的相机不需要向外发射能量,而是通过捕获外界物体的光能量,将三维物体映射到二维图像上,得到环境中物体的颜色和纹理信息。视觉SLAM和激光SLAM各自有其优势,如视觉SLAM在远距离感知上具有困难,而激光SLAM在高精度距离测量方面优势明显。融合两者可以更好地利用它们的长处,提高整体性能。


图片6.png

6


避免单一故障点:单一传感器可能会出现故障,而融合多种传感器可以减小系统单一故障点的影响。如果一种传感器出现问题,系统仍然可以依赖其他传感器来继续执行任务。

多用途性:融合视觉SLAM和激光SLAM的系统可以用于多种应用,包括自动驾驶、机器人导航、室内外定位等,因为它们具有更广泛的适用性。

更好地进行物体目标检测:融合视觉信息处理、点云融合和Cartographer算法优化三个部分。视觉信息处理主要是指利用双目摄像头检测出小物体的种类以及位置;点云融合是利用标定工具,得出激光雷达和双目摄像头的转移矩阵,利用转移矩阵将双目摄像头生成的伪激光雷达点和原生激光雷达点进行融合,得到融合点云;Cartographer算法的优化主要是针对不同视域,改良栅格的概率更新方式。


图片7.png

7


然而,融合视觉SLAM和激光SLAM也面临挑战,如传感器同步、数据融合算法设计、计算资源需求等。这需要精心设计和优化,以确保系统的高性能和稳定性。综合来看,融合视觉SLAM和激光SLAM可以提供更全面的环境感知和导航解决方案,适用于各种复杂的应用场景。


三、全文总结

   本文描述了视觉SLAM和激光SLAM两者在应用时的优点与缺点,通过将两者优劣势结合,描述了两者融合的趋势,方法,特别强调了将这两种技术融合的优势,包括提高精确性、适应性、轻便性以及动态物体检测,理论上能使得SLAM能够在更加复杂,更加具有挑战性的环境下进行工作。


参考文献

[1]李枭凯,李广云,索世恒等.激光SLAM技术进展[J].导航定位学报,2023,11(04):8-17.DOI:10.16547/j.cnki.10-1096.20230402.

[2]马争光,赵永国,刘成业等.激光和视觉融合SLAM方法研究综述[J].计算机测量与控制,2019,27(03):1-6.DOI:10.16526/j.cnki.11-4762/tp.2019.03.001.

[3]王煜坤. 基于激光与视觉融合的SLAM技术[D].电子科技大学,2023.