视觉里程计原理(二)特征匹配与追踪(LK光流法)

合集下载

光流法的作用

光流法的作用1. 什么是光流法光流法（Optical Flow）是计算机视觉领域中一种重要的运动估计方法，用于分析图像序列中的物体运动。

它通过分析相邻帧之间的像素强度变化来估计每个像素点在图像上的运动方向和速度。

在实际应用中，光流法可以用于目标跟踪、视觉里程计、三维重建和视频压缩等领域。

它对于理解和分析视频序列中的运动行为具有重要意义。

2. 光流法原理光流法基于一个假设：相邻帧之间相同物体上的像素点在时间上保持连续。

根据这个假设，我们可以通过比较两帧之间的像素强度差异来计算每个像素点在图像上的位移。

具体而言，光流法通过以下步骤实现：步骤一：特征提取首先需要从图像序列中提取出关键特征点，例如角点或边缘等。

这些特征点通常具有良好的区分性和稳定性，能够在不同帧之间进行匹配。

步骤二：特征匹配对于每个特征点，光流法通过在相邻帧之间进行搜索来找到其对应点。

一般采用的方法是在当前帧的局部区域内寻找与上一帧中特征点最相似的像素。

步骤三：光流计算通过比较特征点在两帧之间的位置变化，可以计算出光流向量，即每个像素点在图像上的运动方向和速度。

常用的光流计算方法有基于亮度约束和基于相关性约束等。

步骤四：光流可视化为了更直观地展示运动信息，可以将计算得到的光流向量以箭头或颜色等形式叠加在图像上，从而形成光流可视化结果。

3. 光流法的作用3.1 目标跟踪光流法可以用于目标跟踪，即在视频序列中实时追踪目标物体的位置和运动轨迹。

通过不断更新目标物体的位置信息，可以实现对其准确跟踪，并应用于视频分析、智能监控等领域。

3.2 视觉里程计视觉里程计是指通过分析相机连续拍摄的图像序列来估计相机在三维空间中的运动轨迹。

光流法可以用于计算相邻帧之间的相对位移，从而实现对相机运动的估计。

视觉里程计在自动驾驶、增强现实等领域具有重要应用价值。

3.3 三维重建光流法可以用于三维重建，即通过分析多个视角下的图像序列来恢复场景的三维结构。

通过计算不同视角之间的光流向量，可以估计出物体在空间中的位置和形状信息，从而实现对场景的三维重建。

klt跟踪算法公式

klt跟踪算法公式KLT跟踪算法公式1. 算法介绍KLT（Kanade-Lucas-Tomasi）跟踪算法是一种常用的光流估计算法，用于在视频序列中追踪目标的运动。

该算法的核心思想是通过对目标特征点的追踪，根据特征点在连续帧之间的位置变化来估计目标的运动。

2. 公式1：灰度图像金字塔KLT跟踪算法首先将原始图像转换为灰度图像，然后构建金字塔来实现多尺度分析。

灰度图像金字塔的公式如下：G_i = F * G_(i-1)其中，G_i表示第i层金字塔图像，G_(i-1)表示第i-1层金字塔图像，F表示图像的缩放因子。

3. 公式2：特征点的坐标更新KLT跟踪算法通过追踪特征点的位置来估计目标的运动。

对于每个特征点，根据特征点在前一帧和当前帧中的位置，可以计算出特征点的坐标更新量。

坐标更新的公式如下：delta_x = sum((dI/dx)^T * dI/dx)^-1 * sum((dI/dx)^T * dt)delta_y = sum((dI/dy)^T * dI/dy)^-1 * sum((dI/dy)^T * dt)其中，delta_x和delta_y分别表示特征点在x和y方向上的坐标更新量，dI/dx和dI/dy分别表示图像在x和y方向上的梯度，dt 表示两帧之间的时间差。

4. 公式3：特征点的速度根据特征点的坐标更新量，可以计算出特征点在图像上的速度。

特征点的速度公式如下：v = sqrt(delta_x^2 + delta_y^2)其中，v表示特征点的速度。

5. 举例解释假设有一段视频序列，我们选取其中一个目标的特征点进行KLT跟踪。

1.首先，将视频序列的帧转换为灰度图像，并构建金字塔来实现多尺度分析。

2.在连续帧之间，选取目标特征点在前一帧和当前帧中的位置，计算出特征点的坐标更新量。

3.根据坐标更新量，计算出特征点在图像上的速度。

通过KLT跟踪算法，我们可以得到目标特征点在视频序列中的运动轨迹，并估计出目标的运动速度。

LK光流算法

nad光流法）[27]。在这三种光流跟踪方法中，跟踪性能最优的是Lucas Kanade跟踪少量的特征点、迭代法收敛速度也很快而且算法的计算量不大，
已被广泛的应用于运动车辆跟踪和人脸特征点跟踪[47,48]；下面介绍文献[27]，并对其
进行相关实验。
§4.3.1问题提出
提下，推导出灰度图像光流场计算的基本等式，这是经典光流方法[18,24]。
光流的算法多种多样，其用于目标跟踪常用的算法有：检测和跟踪特征点[25]、跟
好的特征点[26]、金字塔图像的Lucas Kanade特征点跟踪算法（因为其跟踪过程是迭
的光流法计算过程，因此，为了更好的体现光流的作用，本文将其简称为：Lucas
(4-3-13)
B(x,y)～=JL(x+gL
x
,y+gL
y
)
?(x,y)∈[px?ωx,px+ωx]×[py?ωy,py+ωy]
(4-3-14)
注意到A(x,y)和B(x,y)的定义域稍微有些差异。实际上，A(x,y)是在窗口大小为
(2ωx+3)×(2ωy+3)的范围内定义，而不是(2ωx+1)×(2ωy+1)。在后面运用中心差分算子
px+ωx
x=px?ωx
py+ωy
y=py?ωy
(A(x,y)?B(x,y)?[?
B
?x
?B
?y
]υ)?[
?B
?x
?B
?y]
(4-3-18)
注意到A(x,y)?B(x,y)可以看作是在点[x,y]T的一个导数，所以：
δI(x,y)～=A(x,y)?B(x,y)
?(x,y)∈[px?ωx,px+ωx]×[py?ωy,py+ωy]

视觉里程计

视觉里程计来源 | ADAS视觉里程计（Visual Odometry）在机器人学与计算机视觉领域，视觉里程计是一个通过分析相关图像序列，来确定机器人位置和朝向的过程。

在导航系统中，里程计（odometry）是一种利用致动器的移动数据来估算机器人位置随时间改变量的方法。

例如，测量轮子转动的旋转编码器设备。

里程计总是会遇到精度问题，例如轮子的打滑就会导致产生机器人移动的距离与轮子的旋转圈数不一致的问题。

当机器人在不光滑的表面运动时，误差是由多种因素混合产生的。

由于误差随时间的累积，导致了里程计的读数随着时间的增加，而变得越来越不可靠。

视觉里程计是一种利用连续的图像序列来估计机器人移动距离的方法。

视觉里程计增强了机器人在任何表面以任何方式移动时的导航精度。

视觉里程计算法：大多数现有的视觉里程计算法都是基于以下几个步骤：1、图像获取：单目照相机、双目照相机或者全向照相机；2、图像校正：使用一些图像处理技术来去除透镜畸变；3、特征检测：确定感兴趣的描述符，在帧与帧之间匹配特征并构建光流场；（1）、使用相关性来度量两幅图像间的一致性，并不进行长时间的特征跟踪；（2）、特征提取、匹配（Lucas–Kanade method）；（3）、构建光流场；4、检查光流场向量是否存在潜在的跟踪误差，移除外点；5、由光流场估计照相机的运动；（1）、可选方法1：使用卡尔曼滤波进行状态估计；（2）、可选方法2：查找特征的几何与3D属性，以最小化基于相邻两帧之间的重投影误差的罚函数值。

这可以通过数学上的最小化方法或随机采样方法来完成；6、周期性的重定位跟踪点；我选择的视觉里程计算法是：“ sift特征匹配点——基本矩阵——R和T”。

第一步：由特征点计算基本矩阵F。

一般而言，sift点是存在误匹配的情况，因此，采用ransac鲁棒方法计算基本矩阵F。

这个过程已经实现，但是还有一个小问题：同样的一组sift点，进行两次基本矩阵计算，得到的基本矩阵差异很大，因此，我在ransac方法的基础上，根据得到的inliers点，采用常规的8点基本矩阵计算方法，这样得到的基本矩阵能保持不变第二步：由基本矩阵计算R和T方法1：奇异值分解E = KK'*F*KK; %%这是真实的本质矩阵E[U,S,V] = svd(E); %奇异值分解。

光流法原理和跟踪流程 -回复

光流法原理和跟踪流程-回复光流法（Optical Flow）是计算机视觉中常用的一种运动估计方法。

它通过分析图像中像素点随时间的变化，来推测出像素点的运动方向和速度。

光流法在目标追踪、医学影像分析、自动驾驶等领域发挥着重要作用。

在本文中，我将详细介绍光流法的原理和跟踪流程，帮助读者更好地理解和应用该方法。

光流法的原理基于一个基本假设：相邻时刻的像素点的灰度值之差（即图像亮度的变化）主要由相机的运动引起，而不是物体的运动。

基于这个假设，光流法试图通过计算相邻帧之间像素点之间的运动矢量来估计相机的运动。

那么，光流法的具体跟踪流程是怎样的呢？以下是一个典型的流程：1. 图像预处理在进行光流计算之前，首先需要对图像进行预处理。

这包括图像去噪、灰度化、图像金字塔构建等步骤。

图像金字塔的构建是为了对不同尺度的运动进行估计，以应对不同场景下的运动速度变化。

2. 特征提取在光流法中，通常选择一些具有较好区分度和稳定性的特征点进行运动估计。

常用的特征点包括角点、边缘等。

特征提取方法可以是角点检测算法（如Harris角点检测）或其他滤波器。

提取到的特征点可以用来计算光流向量。

3. 光流计算光流计算是光流法的核心环节。

常用的光流计算方法有基于亮度差异的光流计算方法和基于约束条件的光流计算方法。

基于亮度差异的光流计算方法基于光流法的基本假设，通过计算相邻帧之间像素点的灰度值之差来估计运动矢量。

这种方法简单直观，但对于大灰度变化和光照变化较大的情况不够稳定。

基于约束条件的光流计算方法则利用了光流场的光滑性和连续性约束。

其中一种常见的方法是使用光流方程，将其转化为一个光流方程约束优化问题，并用迭代方法求解。

这种方法对光照变化和大灰度变化具有一定的鲁棒性。

4. 光流可视化和结果分析经过光流计算之后，得到的光流场可以用来可视化和分析。

常见的可视化方法有箭头可视化和色彩编码可视化。

箭头可视化将每个特征点的光流矢量表示为箭头的方向和长度，色彩编码可视化则利用不同颜色来表示光流的方向和大小。

融合光流跟踪和特征点匹配的单目视觉里程计研究

融合光流跟踪和特征点匹配的单目视觉里程计研究融合光流跟踪和特征点匹配的单目视觉里程计研究摘要：单目视觉里程计（Visual Odometry，VO）是指在没有GPS等定位设备的情况下，通过单目摄像头的输入获取并处理图像信息，实现相机的运动轨迹估计。

VO技术在自动驾驶、机器人导航、无人机等领域有重要应用价值。

但由于单目摄像头只能获得二维图像信息，所以实现稳定和精度较高的VO并不容易。

本文结合光流跟踪和特征点匹配两类方法，提出了一种新的单目VO方法，并进行了实验验证。

实验结果表明，该方法具有较好的准确性和鲁棒性。

关键词：单目视觉里程计；光流跟踪；特征点匹配；估计误差；鲁棒性1. 引言在自动驾驶、机器人导航、无人机等领域，利用单目摄像头获取图像信息来估计相机的运动轨迹是一种十分重要的技术。

单目视觉里程计技术（Visual Odometry，VO）可用于实现相应的目标。

VO在没有GPS等定位设备的情况下，通过处理输入图像信息，估计相机的运动轨迹。

其原理是利用图像中相邻两帧之间的运动信息，结合运动学模型，计算相机相对于前一时刻的运动量。

VO技术的主要应用领域包括自动驾驶、机器人导航、无人机等领域。

虽然技术的应用前景广阔，但是由于单目摄像头只能获得二维图像信息，实现稳定和精度较高的VO 并不容易。

2. 光流跟踪光流跟踪是一种基于像素级别的方法，它通过输入图像中像素点的运动，计算相邻两帧之间的相机运动量。

光流法是通过对图像内像素的偏移量进行计算，实现像素的运动跟踪。

在VO 中，光流法的主要作用在于对图像局部区域内像素的运动进行估计，并通过局部运动结果对整个图像区域内的相对运动进行分析。

然后，基于这些分析结果可以对相对运动量进行计算。

3. 特征点匹配在单目VO中，特征点匹配也是一种常用的方法，它通过提取图像中独特的点，即特征点，并匹配图像中相邻两帧之间的特征点来计算相机的运动轨迹。

特征点通常是图像中一些特定的区域，其特征包括灰度、边缘信息等。

LK光流算法总结

运动目标检测之Lucas-Kanade光流算法读书笔记视觉是人类感知自身周围复杂环境最直接有效的手段之一，而在现实生活中大量有意义的视觉信息都包含在运动中，人眼对运动的物体和目标也更敏感，能够快速的发现运动目标。

随着计算机技术、通信技术、图像处理技术的不断发展，计算机视觉己成为目前的热点研究问题之一。

而运动目标检测是计算机视觉研究的核心课题之一，融合了图像处理、模式识别、人工智能、自动控制、计算机等众多领域的先进技术，在军事制导、视觉导航、视频监控、智能交通、医疗诊断、工业产品检测等方面有着重要的实用价值和广阔的发展前景。

一目标检测运动目标检测运动目标检测是指从序列图像中将运动的前景目标从背景图像中提取出来。

目前,已有的运动目标检测方法按照算法的基本原理可以分为三类:背景差分法，帧间差分法和光流法。

1背景差分法背景差分法又称背景减除法，背景差分法的原理是将当前帧与背景图像进行差分来得到运动目标区域，但是需要构建一幅背景图像，这幅背景图像必须不含运动目标，并且应该能不断的更新来适应当前背景的变化，构建背景图像的方法有很多，比较常用的有基于单个高斯模型的背景构建，基于混合高斯模型的背景构建，基于中值滤波器的背景构造，基于卡尔曼滤波器的背景构造，基于核函数密度估计的背景模型构造。

缺点：因为要求背景是静止的，所以背景的变化，场景中有很多干扰，比如场景中有树枝和叶子在风中晃动、水面的波动等等，还有照明的变化和天气的变化等都可能影响检测的结果2帧间差分法帧间差分法是一种通过对视频图像序列中相邻两帧作差分运算来获得运动目标轮廓的方法，它可以很好地适用于存在多个运动目标和摄像机移动的情况。

当监控场景中出现异常物体运动时，帧与帧之间会出现较为明显的差别，两帧相减，得到两帧图像亮度差的绝对值，判断它是否大于阈值来分析视频或图像序列的运动特性，确定图像序列中有无物体运动。

图像序列逐帧的差分，相当于对图像序列进行了时域下的高通滤波。

基于LK光流法的单目视觉里程计

基于L K光流法的单目视觉里程计陈伟杰，孙作雷(上海海事大学机器辨识与交互研究组，上海2〇13〇6)摘要：在移动机器人快速发展的今天，视觉里程计是通过视觉传感器进行导航定位的主要方式之一。

文章介绍了基于单个摄像头的单目视觉里程计的一种实现方法，使用S U R F算法提取特征点，用L K光流法进行特征追踪，相比于传统特征匹配在运算效率上有极大的提高，再对特征点计算位移与旋转量，以里程计的方式达到定位目的。

详细介绍了视觉里程计的数学原理以及 S U R F算法和L K算法的原理及其数学推导、单目视觉里程计的尺度不确定原理。

最后通过对比确定L K算法的优势以及最优参数的选择。

关键词！视觉里程计；L K光流法；图像处理；特征跟踪；多视图几何中图分类号：T P242.6+2文献标识码：A D O I：10. 19358/j. iss n. 1674-7720. 2017. 21.014引用格式：陈伟杰，孙作雷.基于L K光流法的单目视觉里程计[J].微型机与应用，2017,36(21):45H7,50.Monocular visual odometry based on LK optical flowChen W eijie，Sun Zu o l ei(Machine Perception and Interaction Group ( M P IG)，Shanghai Maritime University，Shanghai 201306，China)A b s tr a c t: Nowadays，with the rapid development 〇: mobile robots，visual odometer is one 〇:the main ways 〇: navigating through visual sensors. In this paper，we introduce a metliod of monocular visual odometer based on single camera. W e use SURF to extract feature points and then use LK optical flow to track features. The operational efficiency of LK is higher than usual matching. F in a iy，we use matching points to get translation and rotation to achieve the purpose of positioning. W e introduce how S U R F a n d LK work and what ’ s projective ambiguity. At la st，we show the result that LK is really faster than usual m atching，and the optimal parameters are determined by comparing the selection.K ey w ord s ：visual odometry；LK optical flow ；image processing；feature tracking; multi-view geometry〇引言智能机器人在近年来越来越多地进人公众视野。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Machine Perception and Interaction Group (MPIG)

Pyramid Implementation
Initial guess
Machine Perception and Interaction Group (MPIG)

Feature Extraction
Feature matching
Compute E or F for [R|t]
Drawing path
Machine Perception and Interaction Group (MPIG)

second
Feature matching
Machine Perception and Interaction Group (MPIG)

rich feature descriptors
example
code FlannBasedMatcher matcher; std::vector< DMatch > matches; matcher.match(descriptors1,descriptors2,matches); Mat img_matches; drawMatches( img1, keypoints1, img2, keypoints2, matches, img_matches ); //-- Draw matches imshow("Matches", img_matches ); //-- Show detected matches
FLANN
Machine Perception and Interaction Group (MPIG)

rich feature descriptors
example
FLANN
Machine Perception and Interaction Group (MPIG)
rich feature descriptors
brute-force Comparing each feature in the first set to each feature in the second set
FLANN (Fast Library for Approximate Nearest Neighbors) K-means tree K-dimension tree
We write as follow for convenience
Machine Perception and Interaction Group (MPIG)

Standard KLT algorithm
Machine Perception and Interaction Group (MPIG)
KLT algorithm
u v
gray value u is I(x,y)
The goal is to find v on J, where I(u) and J(v) are similar The way is to compute d
Machine Perception and Interaction Group (MPIG)

Standard KLT algorithm
Machine Perception and Interaction Group (MPIG)

Standard KLT algorithm
Machine Perception and Interaction Group (MPIG)

Code of LK based openCV
Address: /sunzuolei/vo_basis
calcOpticalFlowPyrLK ()
vector<float> err; vector<uchar> status; Size winSize=Size(21,21); //设定金字塔层搜索窗口尺寸

optical flow
Lucas-Kanade (LK or KLT) [1]
three assumptions
• Brightness constancy • Temporal persistence or small movements
• Spatial coherence
[1] B. D. Lucas, T. Kanade, An Iterative Image Registration Technique with an Application to Stereo Vision .
Machine Perception and Interaction Group (MPIG)

Eliminate errors
code double max_dist = 0; double min_dist = 100; for( int i=0; i<descriptors1.rows; i++ ) { double dist = matches[i].distance; if( dist < min_dist ) min_dist = dist; if( dist > max_dist ) max_dist = dist; } //-- Draw only "good" matches (i.e. whose distance is less than 2*min_dist ) std::vector< DMatch > good_matches; for( int i = 0; i < descriptors1.rows; i++ ) { if( matches[i].distance < 2*min_dist ) { good_matches.push_back( matches[i]); } }
Machine Perception and Interaction Group (MPIG)
example
Machine Perception and Interaction Group (MPIG)

thanks
Machine Perception and Interaction Group (MPIG)
TermCriteria termcrit=TermCriteria(TermCriteria::COUNT+TermCriteria::EPS, 30, 0.01);//指定光流法搜索算法收敛迭代的类型 calcOpticalFlowPyrLK(img1, img2, points1, points2, status, err, winSize, 3, termcrit, 0, 0.001);
Assumptions
Brightness Constancy Assumption translational model:
Machine Perception and Interaction Group (MPIG)

Assumptions
Taylor
2nd assumption
Machine Perception and Interaction Group (MPIG)
//-- Draw only "good" matches Mat img_matches; drawMatches( img1, keypoints1, img2, keypoints2, good_matches, img_matches, Scalar::all(- 1), Scalar::all(-1),vector<char>(), DrawMatchesFlags::NOT_DRAW_SINGLE_POINTS ); //-- Show detected matches imshow( "Good Matches", img_matches );
Point matching using
rich feature descriptors
brute-force
FLANN
optical flow
Horn-Schunck
Lucas-Kanade
Machine Perception and Interaction Group (Meption and Interaction Group (MPIG)

Assumptions
3rd assumption
Machine Perception and Interaction Group (MPIG)

Machine Perception and Interaction Group (MPIG)

Eliminate errors
Getting rid of points for which the KLT tracking failed or those who have gone outside the frame int indexCorrection = 0;//初始化参数 for( int i=0; i<status.size(); i++) { Point2f pt = points2.at(i- indexCorrection); if ((status.at(i) == 0)||(pt.x<0)||(pt.y<0)) { if((pt.x<0)||(pt.y<0)) { status.at(i) = 0;//将对应的这组光流置零,等同于未发现该光流 } points1.erase (points1.begin() + (i - indexCorrection));//删除该点 points2.erase (points2.begin() + (i - indexCorrection)); indexCorrection++; } }