第6章二维运动估计
计算机视觉ppt课件

2
第七章 基于运动视觉的场景复原
3
三维运动估计
三维运动估计是指从二维图象序列来估计物体三维 运动参数以及三维结构。
SFM (Shape From Motion)
4
Singular value decomposition (S1 zk 1
F
rxx xk rzx xk
rxy yk rzy yk
rxz zk rzz zk
tx tz
y规k 1范化F 焦zykk1距1 FF=1rr,yzxx分xxkk 子 rr分yzyy yy母kk 同rrzyzz除zzkk 以 ttZzy k
x F x z
y F y z
xk 1
rxx xk rzx xk
rxy yk rzy yk
rxz rzz
tx tz
/ zk / zk
yk 1
ryx xk rzx xk
ryy yk rzy yk
ryz rzz
ty / zk tz / zk
10
小角度旋转
1
Rk
1
1
小角度旋转矩阵
11
1. 基于正交投影的三维运动估计
xk 1 xk 1 rxxxk rxy yk (rxz zk tx ) yk 1 yk 1 ryxxk ryy yk (ryz zk t y )
1
Shape(Structure) From X
解决的是从2D图像到2.5D表面形状(场景深度) 的问题
利用几何代数进行线段模型匹配和运动估计_黄良明

后来物理学家们又发现了许多新问题 ,由此而产生
了 旋量 ( spinor )代数 ,张量代数等 . Clif fo rd代数是
一个结合的非交换代数 ,即 n= 1时为复数 ; n= 2时
是四元数 ;当 n≥ 3时则是非可除代数 .从 19世纪后
期开始 , Clif f ord代数被 多次引用到各个领域并得 到 发 展 和 完 善 [3 ] . 本 文 所 用 的 方 法 是 由 David
a b cosθ; a∧ b 称 为 a 与 b 的 外 积 , 具 有 模
a b sinθ,它是 a 与 b所在平面上的一个有向面
积 ,也就是将向量 a沿向量 b平移所扫过的面积 ,称
为二向量 ( biv ecto r) . 即两个向量的几何积为一个纯
量和一个二向量之和 ,这种形式的量称为多向量 .
使得
ei ei = Wij
( 5)
1. 3 对多向量的微分
设 X 为一混合阶数的多向量 , 且 X = ∑ Xr , r
其中 Xr 为 X 的第 r 阶齐次分量 , F ( X )为 X 的多向
量值函数 ,则 F ( X )对 A`方向’ 的微 分 ( A 与 X 同
阶 ) ,记作 A* X F ( X ) (这里 ,* 表示两个多向量之
2( 1+ n2 n1 )
由式 ( 4)可以看出 , R是只含有纯量和二向量的多向
量 . 由所有的只含偶数阶向量的多向量组成的一个
子代数 ,称为偶子代数 .
若给 定一 组线 性无 关 向量 集 {ei } (不一 定 正
交 ) ,即可建其互反框架 ( reciprocal f rame) {ei } [5 ] ,并
( 12)
三维运动估计-Read

211第十五章 三维运动估计三维运动估计是指从二维图象序列来估计物体三维运动参数以及三维结构。
具体地说,假定三维物体上一点M 相对于摄象机坐标系从时刻k t 的位置),,(k k k z y x 运动到时刻1+k t 的位置),,(111+++k k k z y x ,它在二维图象平面上的投影从),(k ky x ''运动到),(11++''k k y x ,然后,通过分析二维运动来恢复物体的三维运动及物体上感兴趣点的深度值。
这一点类似于立体视觉的深度恢复,不过立体视觉是从立体图象对来恢复深度值,而三维运动分析是从图象序列中恢复参数。
三维运动估计有着广泛的应用,如机器人视觉,自主导航,目标跟踪,图象监控,智能车辆高速公路系统,基于物体的图象压缩等。
三维运动估计仍然是一个不适定问题,必须增加适当的约束才能得到有效解。
三维运动估计和分析也可以是基于场景的深度图像序列,其方法与基于二维图像序列完全不同。
基于深度图像序列的三维运动估计是一个适定问题,求解方法要比基于二维图像序列要简单一些,主要问题是数据量十分巨大,因此许多研究人员一开始就以实现大规模集成电路(VLSI )作为三维场景估计的基础。
我们将不讨论深度图像序列运动估计问题,感兴趣的读者可以查阅有关文献[Wheeler 1996,Jiar 1996].15.1 基于成象模型的对应点估计首先回顾一下第十二章引入的三维刚体运动方程。
假定三维场景中有一个刚性物体,其上一点M 从时刻k t 的位置),,(k k k z y x 经过旋转和平移,运动到时刻1+k t 的位置),,(111+++k k k z y x 。
设旋转矩阵和平移向量分别是k R 和k T ,则三维刚体运动模型重新表示为k k k k k z y x k k k zz zyzxyz yy yx xz xy xx k k k z y x t t t z y x r r r r r r r r r z y x T R +⎪⎪⎪⎭⎫⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛+⎪⎪⎪⎭⎫ ⎝⎛⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎪⎪⎪⎭⎫ ⎝⎛+++111 (15.1)用欧拉角的形式表示上述旋转矩阵(见式(12.2),(12.3)),并假定旋转角较小,则旋转矩阵可以表示为⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡---=111θψθφψφk R (15.2)其中θ,ψ,φ分别表示绕z y x ,, 轴逆时针旋转小角位移。
5 第五章 二维运动

要求 f(x,y)=0 连续变化,因为我们是在描述运动,而速度是有限值。再进一步
我们需要描述质点位置随时间的变化,为了达到这个目的我们需要参数方程,时 间就是参数:
x x(t) y y(t)
联立方程把参数 t 消去,就得到曲线方程 f(x,y)=0. 那么速度又是如何从轨迹中体现出来的呢?质点在某一点的速度方向就是轨迹
vx v0 vy gt
符号表示速度的方向。从运动方程到速度方程,
ax
dvx dt
d2x dt 2
再带加速度方程,分别是对运动的参数方程求一阶导数,二阶导数,因此:
Fx
m
d2x dt 2
Fy
m
d2y dt 2
方程的左边是受力分析,方程的右边是运动分析,受力分析和运动分析就是动力
学的核心。曲线运动从研究角度来说是解决二维运动,从学习角度来说是熟练牛
在这点的切线方向。其大小由速度矢量三角形决定,下面我们证明为什么速度方
向就是曲线的切线方法,如下图所示:
y v vy
vx
o
x
根据瞬时速度的定义:
vx
lim
t 0
x t
vy
lim
t 0
y t
这里我们所采用的方法就是投影法,就是矢量分解,分别计算 x 方向的瞬时速度 和 y 方向的瞬时速度。根据导数的定义:
v0 y mg
o
x
对质点做受力分析,质点只受重力作用,水平方向不受力,因此牛顿方程:
Fx 0 Fy mg
所以竖直方向做自由落体运动,水平方向做匀速直线运动,参数方程:
x v0t y h 1 gt 2
2
消掉参数 t 得到轨迹方程:
y
g 2v02
运动估计与运动补偿

运动估计与运动补偿运动补偿是通过先前的局部图像来预测、补偿当前的局部图像,它是减少帧序列冗余信息的有效方法。
运动估计是从视频序列中抽取运动信息的一整套技术。
运动估计与运动补偿技术MPEG-4采用I-VOP、P-VOP、B-VOP三种帧格式来表征不同的运动补偿类型。
它采用了H.263中的半像素搜索(half pixel searching)技术和重叠运动补偿(overlapped motion compensation)技术,同时又引入重复填充(repetitive padding)技术和修改的块(多边形)匹配(modified block(polygon)matching)技术以支持任意形状的VOP区域。
此外,为提高运动估计算法精度,MPEG-4采用了MVFAST(Motion Vector Field Adaptive Search Technique)和改进的PMVFAST(Predictive MVFAST)方法用于运动估计。
对于全局运动估计,则采用了基于特征的快速顽健的FFRGMET(Feature-based Fast and Robust Global Motion Estimation Technique)方法。
编解码器用来减少视频序列中的空域冗余。
它也可以用来进行去交织(deinterlacing)的操作。
定义运动补偿是通过先前的局部图像来预测、补偿当前的局部图像,它是减少帧序列冗余信息的有效方法。
分类包括全局运动补偿和分块运动补偿两类。
运动补偿是一种描述相邻帧(相邻在这里表示在编码关系上相邻,在播放顺序上两帧未必相邻)差别的方法,具体来说是描述前面一帧(相邻在这里表示在编码关系上的前面,在播放顺序上未必在当前帧前面)的每个小块怎样移动到当前帧中的某个位置去。
这种方法经常被视频压缩/视频编解码器用来减少视频序列中的空域冗余。
它也可以用来进行去交织(deinterlacing)的操作。
第6章医学图像配准(6.3-6.6)

H ( A) p A (a) log p A (a)
a
两个系统的联合熵为:
H ( A, B) p AB (a, b) log p AB (a, b)
倒角匹配算法的关键部分是距离变换(Distance Transformation)。距 离变换的类型决定了使用该变换后代价函数描述两幅图像特征间距离的准 确程度。 距离变换是将二值图转换为灰度图像的一种变换。每个象素的灰度值 是该象素与最近背景象素间的距离。常用的方法为倒角(Chamfer)算法。 倒角算法通过对图像两次扫描,实现距离变换。 1. 一维距离变换 对图像的一列像素做距离变换。设二值图像像素0:背景, 1:物体。
6.3.3 基于极值点的刚体配准
对同一个病人用相同成像模式但不同位臵的两幅图像进行配准, 可以从这两幅图像上分别提取极值线及极值点, 再设法寻找这两组极值 点间的对应关系。最后,计算能使这些匹配线段重叠的最佳刚体变换。 一种典型的技术是采用几何散列(Hashing)表与H与代价函数的优化
采用何种分割方法取决于实际应用。倒角匹配算法只要求将图像F分 割成二值图像作为距离变换的输入。还要从分割得到的图像G产生一组轮 廓点。轮廓点可用简单的轮廓跟踪法或对二值图像扫描搜索非零元素(线 条图中点的顺序无关紧要)。倒角匹配算法对所用的分割算法并无特殊的 约束。从效率因素考虑总是希望线条中的点数目相对少些为好。 倒角匹配算法对分割质量具高度强健性,这意味可以使用“低质量”自动 分割技术。即算法可以是全自动的,即使图像质量差些也无妨。
一种基于二维运动重构的旋转对称目标拟规则进动参数估计方法

一种基于二维运动重构的旋转对称目标拟规则进动参数估计方法洪灵;戴奉周;刘宏伟【摘要】在初始扰动和扭矩的作用下,自旋稳定空间飞行器的运动形式是章动和进动合成的拟规则进动。
拟规则进动目标运动参数的估计对于确定目标姿态和预测目标落点具有重要意义。
针对拟规则进动的旋转对称目标,该文提出一种基于宽带雷达观测的运动参数估计方法。
首先推导了拟规则进动的运动学模型,而后将基于多散射中心1维径向距离历程的目标运动3维重构方法扩展到旋转对称目标的2维运动重构,然后基于2维运动的欧式重构采用序列二次规划和非线性最小二乘循环迭代的方法估计目标的章动和进动参数。
最后,利用电磁仿真数据验证了算法的有效性。
%Under the effects of the initial perturbation and torque, the motion of the spin-stability spacecraft is the compound of nutation and precession, named quasi-regularized precession. The motion parameters estimation of the quasi-regularized precession object is important to the determination of the attitude and the reentry point of the object. This paper presents a novel method to estimate the motion parameters of the rotation symmetric object based on the measurements from wideband radar. Firstly, the kinematic model of the quasi-regularized precession is derived;and then the algorithm of 3D motion reconstruction from 1D radial range histories of multiple scatterers is extended to the 2D motion reconstruction of the rotation symmetric object; and thirdly based on the 2D Euclidian motion reconstruction result, the method of nutation and precession parameters estimation is proposed by using the cyclic iterativeof sequential quadratic programming and nonlinear least square algorithm. The electromagnetic simulated data show that the proposed method is validated for its effectiveness.【期刊名称】《电子与信息学报》【年(卷),期】2014(000)007【总页数】7页(P1538-1544)【关键词】宽带雷达;旋转对称目标;章动参数估计;2维运动重构【作者】洪灵;戴奉周;刘宏伟【作者单位】西安电子科技大学雷达信号处理国家重点实验室西安 710071;西安电子科技大学雷达信号处理国家重点实验室西安 710071;西安电子科技大学雷达信号处理国家重点实验室西安 710071【正文语种】中文【中图分类】TN957.51航天器的姿态估计对于卫星稳定性和毁伤分析以及再入式飞行器的落点预测具有重要意义。
第3章 三维运动估计

x x ' x Ax (a) Ax (e) (ai ei )
3.6.4 跟
踪用来监视和预测三维场景中物体的运 动和结构变化。
Cs
~ Xi
Co
X i (k )
Y
Ts
X o (k )
世界坐标系
X
Z
图3.3 三维运动跟踪
• 假设有N帧图像序列的M个特征点对应, 表示为
Yi (k ) y i (k ) n y (k ) Z i (k ) X i (k ) xi ( k ) n x (k ) Z i (k )
3.3 基于光流的运动估计
• 3.3.1 概述
• 基于光流的运动估计包括以下两个步骤:
估计二维图像的光流场;
根据光流和光流参数模型估计三维运动参数 和结构参数。
• Ω和V是基于光流的估计方法中需要估
计的三维运动参数。矢量形式为
Ω X V X
基于光流的运动估计方法
正交投影下的运动估计
3.2 基于特征对应的运动估计
• 3.2.1 概述
• 物体的特征描述为能够反映物体物理特 性的点、线、面等。为了保证运动估计 的准确度,选用的特征通常被限制在图 像空间梯度较大的区域内。
• 假设 t 时刻的一个物体点
时刻运动到点
X [ X , Y , Z ]T
在 t/
X' [ X ' , Y ' , Z ' ]T
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6.2.2 运动估计准则1: (Q2) 基于位移帧差准则
最常用的运动估计准则是锚定帧1与目标帧2
之间每个对应点对之间亮度值之差的和。 回忆1中的x移动到2 中的w(x; a) ,则目标函 数写为:
EDFD (a) | 2 (w(x; a)) 1 (x) | p min
–基于梯度搜索法
6.4 基于块的运动估计(块匹配算法)
假设把图像域分割成互不重叠的小区域(块),
每个块内像素运动一致。每个块的运动参数可 独立搜索。 块匹配算法 (BMA): 假设块进行平移运动,每 个块规定一个向量 – 穷尽块匹配算法 (EBMA) – 快速算法 可变形块匹配算法(DBMA): 允许更多复杂的运 动(仿射,双线性)
x
p 是一个正数,当 p = 1, 上面的误差称为平均
绝对差 (MAD), 当p = 2,称为均方差(MSE)
误差图像e(x; a) = 2(w(x, a) ) - 1(x) 一般称为
位移帧差(DFD) 图像
使 EDFD (a) 最小的必要条件是它的梯度=0
6.2.2 运动估计准则2: 基于光流方程准则
6.4 基于块的运动估计
基本思路: – 假设块内各个像素都进行平移运动,用一个 MV表 示 – 用最小化块的位移帧差DFD来独立估计每个块的运 动向量 最小化函数
EDFD (dm )
xBm
| 2 (x dm ) 1 (x) | p min
最优化方法: –穷尽搜索法 (适用于一次搜索一个运动矢量的情况, p=1的MAD准则) –快速算法 –整数 vs.分数精度搜索
又运用泰勒展开式,当dx,dy,dt很小时,
( x d x , y d y , t dt ) ( x, y, t )
dx dy dt x y t
比较上面两个式子,得到光流方程:
dx dy dt 0 vx vy 0 T v 0 x y t x y t t
进行迭代求解,以满足基于位移帧差(DFD) 准则。 MAP准则等价于具有适当平滑约束的基于 DFD的估计器。
6.2.3 优化方法(对误差函数进行最小化) Q3
穷尽搜索
– 通常用在DFD准则中当p=1(MAD)的情况
– 保证全局最优 – 计算量太大
– 快速算法可以得到次优解。
基于梯度搜索
光流方程 如果 dt 很小,令
dx dy dt 0 x y t
dt 2 ( x) 1 ( x) t
1 d x 1 d y 2 1 0, x y
or 1 d 2 1 0
T
这个光流方程的离散形式更经常用在数字视频的运动
2-D 运动: 3-D 运动的投影, 取决于3D 物体运动和投影
操作。 光流: 观测的或表现的二维运动矢量的速度。
– 不仅可以由物体运动引起,还可以由摄像机运动或照明条件 变化引起。注:不等同于真实的二维运动。
左边是一个具有均匀平坦表面
的球在恒定的环境光下转动。 每一个点都反射相同的彩色, 人们感觉不到球的任何变化, 认为球是静止的。
(l 1)
x
(l )
J [H(x )] x x (l )
(l ) 1
Hessian矩阵
2 J x1x1 2 2 J J [H(x )] 2 x x x 2 1 ... 2 J x x k 1
2 J x1x2 2 J x2x2 ... 2 J xk x2
估计中,求解符合方程的x问题可以转化成用以下目标函 数(EOF)表示的最小化问题:
EOF (a) | (1(x))T d(x; a) 2 (x) 1(x) | p min
xA
6.2.2 运动估计准则3 平滑约束正则化
运动估计是一个不适定(病态)问题
– 恒定亮度假定不总是成立 – 在平面纹理区域,不同运动估计可以满足恒定亮度 假设或光流方程。 在严格数学意义上,我们不可能对不适定问题进行求 解并得到答案,只能通过先验知识找到近似解。 正则化过程:即用一组与原不适定问题相近的适定问 题去逼近原问题的解。 在基于像素和基于块运动估计中很重要。
第6章 二维运动估计
纲要
2-D 运动和光流
光流方程解决运动估计的一般方法
– 运动表示 – 运动场参数化 – 最优化准则的公式化 – 寻找最优化参数 运动估计算法
– 基于像素的运动估计 – 基于块的运动估计(EBMA)
3-D运动 -> 2-D运动
3-D MV
2-D MV
2-D 运动 vs. 光流
化与像素邻域点的DFD。 假设每个像素邻域具有相同的运动矢量。 最小化函数:
EDFD (dn )
xB ( x n ) 2 w ( x ) | ( x d ) ( x ) | min 2 n 1
最优化方法: –穷尽搜索法 (适用于一次搜索一个运动矢量的情况)
•要选取适当的搜索范围和搜索步长。
6.2.1 运动表示法(Q1)
整体: 整体运动 由若干整 体参数表 示。
基于像素: 每个象素都 指定运动矢 量
基于块: 把图像域 固定分成 许多小的 方块,每 个块用一 个简单的 模型表征。
基于区域: 将图像帧分 为多个区域, 每个区域用 一个参数化 模型表征。
Other representation: mesh-based (control grid) (to be discussed later)
最优化方法1:多邻域方法
– 假设像素xn 周围的小范围内各个像素的运动向量(MV)一致。 – 最小化邻域上的预测误差。
最优化方法2:像素递归方法
– 当前像素的MV是在已经编码的邻近像素的MV上更新的。根 据同样的更新规则,MV不用编码。 – 应用在较早几代的视频编码器中。
多邻域方法
独立估计每个像素点的运动矢量,计算并最小
dMAP arg maxd {P | 2 | D d ; 1}P( D d ; 1 )
第一个概率表示给出运动场的图像帧与锚定帧
的似然性。第二个概率等价于平滑函数(先验)。
不同准则之间的关系
基于光流方程准则OF – 只有当运动比较小的时候效果较好。 – 当p=2时最小值函数是MV的二次函数。如果运动参 数关于MV线性,则函数具有唯一的最小值,容易 求解。 当运动比较大,可以对基于光流方程准则OF
T
x
(l 1)
x
(l )
J [H(x )] x x (l )
(l ) 1
6.3 基于像素的运动估计
准则——平滑约束正则化:Horn-Schunck 方
法
–光流方程准则 + 运动平滑准则 2 2 2 E (v(x)) ( vx vy ) ws ( vx v y ) y t x A x
T 其中 [ , ] x y
空间梯度矢量
运动估计的中的不确定问题
一个方程有两未知数——
要施加附加条件:最通常 的约束是流矢量在空间平 滑变化。使我们可以利用 x周围一个小的邻域亮度 变化去估计x处的运动。 孔径问题:光流方程只确 定了法向的投影vn,在切 线的投影是不确定的,任 何vt 的值都满足光流方程。 v vne n vt et 运动估计仅在有亮度变化 vn || || 0 t 区域可靠。
... ... ... ...
2J x1xk 2J x2xk ... 2J xk xk
– 比一阶的收敛法快,迭代次数少。 – 每次迭代运算量大 – 易受噪声干扰 (梯度计算受限于噪声,二阶比一阶严 重。) – 当步长 1可能不收敛。必须适当选取 以达到确保 收敛和收敛速度之间的折衷
6.2.2 运动估计准则4 贝叶斯准则:根据经验数据估计难以观察的分布
Bayesian (最大后验MAP) 准则:使后验概率
最大化。 1 2(x)已知,运动向量取d的概率最 大 P( D d | 2 ; 1 ) max 运动场D的后验概率分布:
P( 2 | D d ; 1 ) P( D d ; 1 ) P( D d | 2 ; 1 ) P( 2 ; 1 ) D的最大后验(MAP)估计:
牛顿-拉夫森算法
牛顿-拉夫森算法 – 用一阶梯度来近似二阶梯度 – 令目标函数是误差的平方和(MSE)的一半 – 只需要计算一阶梯度,而收敛速度近似于牛顿法 – 广泛采用
1 2 J (x) ek ( x) 2 k
T
J ek ek (x ) x x
2 J ek ek 2ek ek ek [H ] 2 2 ek (x) x x x x x x
右边是一个静止的球,被一个
绕着球转动的点光源照明。光 源的运动引起球上反射光点的 运动,人眼认为球在运动。
光流方程
如果照明条件未知,那么所能得到的最精确估
计就是光流。 恒定亮度假设 光流方程
( x d x , y d y , t dt ) ( x, y, t )
符号定义
后向运动估计 Time t - t x x Time t +t
Time t
d(x, t + t)
d(x, t - t)
x 目标帧 锚定帧 前向运动估计
目标帧
锚定帧/参考帧: 1(x, t1) 目标帧/ 跟踪帧: 2(x, t2) 运动参数矢量: a 锚定帧的运动矢量: d(x) 运动场: d(x, a), x 映射函数: w(x, a) = x + d(x, a) , x 前向运动估计 /后向运动估计: t2 > t1 / t2 < t1