首页- 公司动态- 行业知识

2024-01-04 来源:INDEMIND

视觉SLAM是什么?一文彻底搞懂视觉SLAM技术

视觉SLAM(Simultaneous Localization and Mapping)指的是用摄像头来完成环境的感知工作。当一个自主移动的机器人处在一个未知的环境,它要通过摄像头获取的一张张图像帧以估计相机的运动和周围环境的结构,以实现自身定位及地图构建。

一、视觉SLAM框架介绍

1.传感器信息读取。通过相机获取图像信息,并进行去畸变、降噪等预处理。

2.视觉里程计。视觉里程计,也称前端,它的任务是根据相邻图像间的特征匹配,估算相机的运动及局部地图。

3.后端优化。对视觉SLAM系统中的相机位姿和地图点进行全局优化,以消除累积误差,得到全局一致的轨迹和地图。由于接在 前端之后, 又称为后端。

4.回环检测。简单来说,回环检测就是判断机器人是否来到走过的原路,即先前来过的位置。如果检测到回环,它会把信息提供给后端进行优化,以纠正累积误差和闭合地图。

5.建图(Mapping)。它根据优化的轨迹和地图点,构建对应地图。

二、视觉SLAM分类

视觉SLAM研究主要分为三大类:单目、双目(或多目)、RGBD。

单目仅用一支摄像头就能完成SLAM。最大的优点是传感器简单且成本低廉,但同时也有个大问题,就是不能确切的得到深度,存在尺寸不确定的现象,比如丢失深度信息的相片中,我们能见到“手捏太阳”“借位拍照”这样的现象。

一方面是由于绝对深度未知,单目SLAM不能得到机器人运动轨迹及地图的真实大小,如果把轨迹和房间同时放大两倍,单目看到的像是一样的,因此,单目SLAM只能估计一个相对深度。另一方面,单目相机无法依靠一张图像获得图像中物体离自己的相对距离。为了估计这个相对深度,单目SLAM要靠运动中的三角测量,来求解相机运动并估计像素的空间位置。即是说,它的轨迹和地图,只有在相机运动之后才能收敛,如果相机不进行运动时,就无法得知像素的位置。同时,相机运动还不能是纯粹的旋转,这就给单目SLAM的应用带来了一些麻烦。

双目(多目)顾名思义是由两个或多个摄像头来完成SLAM,其普遍为双目视觉方案。双目视觉既可以在运动时估计深度,亦可在静止时估计,双目视觉融合两个摄像头获得的图像并观察它们之间的差别,获得明显的深度感,建立特征间的对应关系,将同一空间物理点在不同图像中的映像点对应起来。并且可以精准感知周围的物体和自身移动的轨迹,从而对周围环境形成三维立体的认识,解决了上面提到的问题。不过通过双目图像计算像素距离,计算量大,而且在特征少的白墙或暗光环境易丢失目标。

目前双目的应用程度明显较高,针对双目方案拓展应用场景上,大多融和了IMU或者IR等传感器,如INDEMIND推出的双目视觉惯性模组,采用了“双目摄像头+IMU”多传感器融合架构与微秒级时间同步机制,可提供精准稳定数据源。

RGBD相机是2010年左右开始兴起的一种相机,它最大的特点是可以通过红外结构光或Time-of-Flight原理,直接测出图像中各像素离相机的距离。因此,它比传统相机能够提供更丰富的信息,也不必像单目或双目那样费时费力地计算深度。

目前常用的RGBD相机有Kinect/Kinect V2等等。不过,现在多数RGBD相机还存在测量范围窄、噪声大、视野小、受阳光,墙面反光等诸多问题。出于量程的限制,主要用于室内SLAM。

从技术效果来看,单目需要靠运动估计深度导致避障效率不高,RGBD存在量程的限制,主要用于室内SLAM。因此,目前在视觉SLAM中,双目的应用程度和落地前景都是最高的。目前,视觉SLAM的应用场景非常广泛,以下是一些具体的应用场景:

1. 机器人自主导航:在机器人领域,视觉SLAM技术可以帮助机器人在未知环境中实现自主导航。在室内及室外环境下,机器人均能通过摄像头获取环境信息,利用视觉SLAM技术实现自身定位和地图构建,从而规划出合适的路径并躲避障碍物。

2. 增强现实(AR):视觉SLAM技术也可以应用于增强现实领域。通过摄像头获取真实场景的信息,利用视觉SLAM技术可以改善虚拟物体在真实场景中的识别和跟踪,将虚拟物体自然逼真的叠加到现实场景中,实现交互强、沉浸感强的增强现实体验。

3. 虚拟现实(VR):在虚拟现实领域,视觉SLAM技术可以实现用户的头部和手部跟踪,从而提供更加真实的沉浸式体验。

4. 无人机航拍与定位:无人机可以利用视觉SLAM技术进行航拍和定位。通过摄像头获取地面图像信息,利用视觉SLAM技术实现无人机的精确定位和地图构建,从而进行精准的航拍和飞行控制。

5. 自动驾驶:在自动驾驶领域,视觉SLAM技术可以与其他传感器(如激光雷达、惯性测量单元等)进行融合,实现车辆的高精度定位和地图构建,为自动驾驶提供更加准确的环境感知能力。

总的来说,视觉SLAM技术在机器人、增强现实、虚拟现实、无人机、自动驾驶等领域都有广泛的应用前景。

INDEMIND是一家拥有自研机器人全栈AI技术的机器人AI技术供应商,立足于机器人产业链最上游,为整个机器人行业提供通用的、可靠的、低成本的机器人AI技术。如有:视觉导航扫地机器人导航、商用机器人底盘和双目视觉等AI技术需要,请拨打010-5289 4598

部分内容来源网络

上一篇:服务机器人有哪些?发展趋势是什么? 返回列表 下一篇:什么是ROS?有哪些优缺点?

相关新闻