粒子滤波详解

粒子滤波详解
粒子滤波详解

2.4粒子滤波

例子滤波是以贝叶斯滤波和重要性采样为基本框架的。因此,想要掌握例子滤波,对于上述两个基本内容必须有一个初步的了解。重要性采样呢,其实就是根据对粒子的信任程度添加不同的权重,添加权重的规则就是:对于我们信任度高的粒子,给它们添加的权重就相对大一些;否则,就加的权重小一些。根据权重的分布形式,实际上就是它与目标的相似程度。

粒子滤波的结构实际上就是加一层重要性采样思想在里面的蒙特卡罗方法(Monte Carlo method,即以某时间出现的频率来指代该事件的概率)。该方法的基本思想是用一组样本(或称粒子)来近似表示系统的后验概率分布,然后使用这一近似的表示来估计非线性系统的状态。采用此思想,在滤波过程中粒子滤波可以处理任意形式的概率,而不像Kalman滤波只能处理线性高斯分布的概率问题。粒子滤波的一大优势也在于此,因此近年来该算法在许多领域得到成功应用。

2.4.1贝叶斯滤波理论

贝叶斯滤波泛指一类以贝叶斯定理为基础的滤波技术,其根据所获得的观测,对状态后验概率分布、状态先验概率分布、状态估计值以及状态预测值等感兴趣量进行递归计算。

假设有一个系统,我们知道它的状态方程,和测量方程如下:

=(,(状态方程)(2.4.1)

=(,(测量方程)(2.4.2)

其中x为系统状态,y为测量到的数据,f,h是状态转移函数和测量函数,v,n 为过程噪声和测量噪声,噪声都是独立同分布的。

由贝叶斯理论可知,状态估计问题(目标跟踪、信号滤波)就是根据之前一系列的已有数据(测量数据)递推的计算出当前状态的可信度,这个可信度就是概率公式p(),它需要通过预测和更新两个步奏来递推的计算。

预测过程是利用系统模型(状态方程2.4.2)预测状态的先验概率密度,也就是通过已有的先验知识对未来的状态进行猜测,即p( )。更新过程则利用最新的测量值对先验概率密度进行修正,得到后验概率密度,也就是对之前的猜测进行修正。

处理这些问题之前,假设系统的状态转移服从一阶马尔科夫模型,即当前时刻的状态x(k)只与上一个时刻的状态x(k-1)有关, k时刻测量到的数据y(k)只与当前的状态x(k)有关。

预测阶段:为了进行递推,不放假设已知k-1时刻的概率密度函数p(),先不知k时刻的测量数据,预测状态x(k)出现的概率为:p()=。(2.4.3)

更新阶段:当获取k时刻的观测值后,利用观测值修正先验概率密度p(),得到后验概率密度p(这就是滤波了。

p(

=(2.4.4)

其中归一化常数:

p()=(2.4.5)

2.4.6)

可得:p()=

由测量方程(2-16)可知y(k)只与x(k)有关,p()也称之为似然函数,只和测量噪声n(k)的概率分布有关:

p()=(2.4.7)

2.4.2蒙特卡洛采样

蒙特卡洛方法(Monte Carlo Method)也称统计模拟方法,是20世纪40年代中期由于科学技术的发展和电子计算机的发明而被提出的一种以概率统计理论为指导的一类非常重要的数值计算方法。

蒙特卡洛方法的基本原理是,事件的概率可以用大量试验中发生的频率来估计,当样本容量足够大时,可以认为该事件发生的频率即为其概率。因此,可以先对影响其可靠度的随机变量进行大量的随机抽样,然后把这些抽样值一组一组地代入功能函数式,确定结构是否失效,最后从中求得结构的失效概率。蒙特卡洛方法在金融工程学、宏观经济学、计算物理学(如粒子运输计算、量子热力学计算、空气动力学计算)等领域应用广泛。

假设我们能得到一些服从一个目标概率分布p(x)的样本(,)(每个样本看成一个粒子)。那么这些粒子作为一部分自变量的某些函数的期望值:E[f(x)]==(2.4.8)

蒙特卡洛采样的思想就是用部分样本的平均值代替积分,求期望:E[f(x)]≈(2.4.9)

在上一节中,贝叶斯后验概率的计算里要用到积分(2.4.5),但这个积分很难直接算出。为了解决这个积分难的问题,可以用蒙特卡洛采样来代替计算后验概率。

假设能从后验概率中采样到N个样本,那么后验概率的计算可近似表示为:

()=≈p()(2.4.10)

当前状态的期望值:

E[f()] ≈()d=(2.4.11)

通过这些采样的粒子(样本)的状态值直接平均就得到了期望值,也就是滤波后的值,这里的f(x) 就是每个粒子的状态函数。这就是粒子滤波了,只要从后验概率中采样很多粒子,用它们的状态求平均就得到了滤波结果。

2.4.3贝叶斯重要性采样

在蒙特卡洛采样中,我们从后验概率中采集到了N个样本(粒子),但事实上后验概率不知道啊,怎么从后验概率分布中采样!所以直接应用是行不通的。

无法直接从后验概率分布p()中采样,就从一个已知的可以采样的分布q()里去采样:

那么上节里当前状态的期望值:

E[f()] ≈()d

=q()d

=q()d

=q()d(2.4.12)

其中权值

=(2.4.13)

由因为测量数据的概率

p()=(2.4.14)

(2.4.12)可以进一步写成

E[f()]=(2.4.15)

所以,通过采样N个样本{}~用样本的平均来求它们的期望,(2.4.15)可近似为

E[f()]=(2.4.16)

其中

=(2.4.17)

贝叶斯重要性采样提出了重要性概率密度的概念,从一个已知分布中进行采样得到独立同分布的采样点,取代从后验概率密度中进行采样,从理论上提供了解决采样难的方法。

2.4.4序列重要性采样(SIS)

贝叶斯重要性采样解决了在不知后验概率的前提下,无法从后验概率采样的问题。但估计后验滤波概率需要利用所有的观测数据,每次新的观测数据到来都得重新计算,每个粒子的权重()也需重新计算,这样会造成计算量过大。

为了解决这一问题,人们提出了序列重要性采样(Sequential Importance Sampling, SIS)。

假设重要性概率密度可以分解为

=(2.4.18)设系统的状态是一个马尔科夫过程,且给定系统状态下各次观测独立,则有=(2.4.19)

=(2.4.20)

此时,通过参考分布q()得到样本集{}以及从q(,)得到样本点,这样就可得到新的样本集{} 粒子权值的递归形式如下

=(2.4.21)

通常,还需要对粒子权值进行归一化处理,即

=(2.4.22)

K时刻,系统状态的估计值可表示为

=(2.4.23)

序列重要性采样算法(SIS)以递推的方式实现了贝叶斯重要性采样,以递归更新的方式实现了对粒子权值的重新计算。

2.4.5SIR算法及粒子退化

在应用SIS 滤波的过程中,存在一个粒子退化的问题。就是经过几次迭代以后,很多粒子的权重都变得很小,可以忽略了,只有少数粒子的权重比较大。

并且粒子权值的方差随着时间增大,状态空间中的有效粒子数较少。随着无效采样粒子数目的增加,使得大量的计算浪费在对估计后验滤波概率分布几乎不起作用的粒子上,使得估计性能下降。

克服序列重要性采样算法权值退化现象最直接的方法是增加粒子数,而这会造成计算量的相应增加,影响计算的实时性。因此,一般采用以下两种途径:(1)选择合适的重要性概率密度函数;(2)在序列重要性采样之后,采用重采样方法。

对于第一种方法:选取重要性概率密度函数的一个标准就是使得粒子权值的方差最小。Doucet等给出的最优重要性概率密度函数为:

q()= p()

=(2.4.24)

此时,粒子权值为

=(2.4.25)

以作为重要性概率密度函数需要对其直接采样在实际情况中,构造最优重要性概率密度函数的困难程度与直接从后验概率分布中抽取样本的困难程度等同。因此我们更习惯采用重采样方法。

重采样的思路是:既然那些权重小的不起作用了,那就不要了。要保持粒子数目不变,得用一些新的粒子来取代它们。找新粒子最简单的方法就是将权重大的粒子多复制几个出来,并且权重越大的粒子复制的次数越多。有了重采样,就有了基本的粒子滤波算法。

1993年,Gordon等人最先提出了一种名为Bootstrap的粒子滤波算法。该算法在每步迭代过程中,根据粒子权值对离散粒子进行重采样,在一定程度上克服了粒子退化的问题。在运算思想上,该算法与采样-重要性再采样(Sampleing- Importance Resampling, SIR)及其相似,两者仅在采样算法上有细微的差别。

SIR滤波器和SIS滤波器都属于基本粒子滤波器,都是用重要性采样算法,但两者又有区别。对于SIR滤波器,重采样总是会被执行,在算法中通常两次重要性采样之间需要一次重采样,而SIS滤波器只是在需要时才进行重采样。

一种改进的粒子滤波重采样算法研究_金玉柱

2011年4月第4期 电子测试 ELECTRONIC TEST Apr.2011 No.4一种改进的粒子滤波重采样算法研究 金玉柱,李善姬 (延边大学工学院,吉林 延吉 133002) 摘要:粒子滤波是基于递推的蒙特卡罗模拟方法的总称,可用于任意非线性,非高斯随机系统的状态估计。为了减轻退化现象,引入重采样过程,但重采样过程算法复杂,计算量大,不利于硬件实现,并且会削弱粒子的多样性,从而导致滤波性能下降。提出了一种将局部重采样和优化组合算法结合的重采样算法。将粒子按权值大小分类,小权值的粒子抛弃,大权值的粒子进行复制,将复制的粒子和抛弃的粒子线性组合产生新的粒子,增加了粒子多样性并且只对大权值粒子进行运算,故降低了计算量利于实时系统的硬件实现。仿真结果证明了该算法的有效性。 关键字:粒子滤波; 局部重采样; 优化组合 中图分类号: TP391 文献标识码:A Research of improved particle filter resampling algorithm Jin Yuzhu, Li Shanji (College of Engineering, Yanbian University, Yanji 133002, China) Abstract: Particle filtering is a sequential Monte Carlo simulation algorithm. It can be used to estimate the state of any nonlinear, non-Gaussian system. In order to reduce the degeneracy, the resampling algorithm is adopted. But the resampling process has complex algorithm architecture, which have restricted its implementation in real-time system. Resampling process also leads to the loss of diversity of particles, and the loss makes filter’s performance worse. A new algorithm-partial resampling combined with optimizing combination resampling method is proposed. Assort the particles by their weights, the particles which have low weights are abandoned and the particles which have high weights are reproduced, and generate new particles by combining the reproduced particles and abandoned particles. This new method partly overcomes the loss of diversity and because it simply operates to the high weights particle so its calculation is simplified. And it is propitious to implement by hardware. The simulation results prove the effectiveness of the proposed method. Keywords : particle filtering; partial resampling; optimizing combination 0 引言 粒子滤波器,又称序贯蒙特卡罗方法。可以有效地处理非线性、非高斯滤波问题,广泛地应用在机动目标跟踪、信号传输与压缩、金融领域数据分析、图像处理、故障诊断等领域。所谓粒子滤波就是贝叶斯估计基于抽样理论的一种近似算法,通过非参数化的蒙特卡罗模拟方法来实现递推贝叶斯滤波,即通过一组动态状态空间上按贝叶斯准则进行更新的随机加权的样本或粒子,对未知状态的后验概率密度进行估计,其中这些粒子通过对后验密度序贯重

粒子滤波原理和仿真

粒子滤波算法原理和仿真 1 引言 粒子滤波(Particle Filter, PF)是一种基于蒙特卡洛(Monte Carlo, MC)方法的递推贝叶斯滤波算法。其核心思想是通过从状态空间寻找的一系列随机样本来近似系统变量的概率密度函数,以样本均值代替积分运算,从而获得状态的最小方差估计。其中从状态空间中抽取的样本称为“粒子”。一般地,随着粒子数目的增加,粒子的概率密度函数就逐渐逼近状态的概率密度函数,从而达到最优贝叶斯估计的效果。 2 粒子滤波原理 2.1 系统的动态空间 对于被观测对象的状态,可以通过以下非线性离散系统来描述: 11(,)t t t x f x w --= (1) (,)t t t z h x v = (2) 以上为系统的状态方程和观测方程。其中,f ( )为状态函数,h ( )为观测函数,x t 是系统在时间t 的状态变量,w t 为对应的过程噪声,z t 是系统在时间t 的观测值,v t 为对应的观测噪声。 从贝叶斯估计角度来看,状态估计问题就是根据观测信息z 0:t 构造状态的概率密度函数p (x 0:t |z 0:t ),从而估计在系统在任何状态下的滤波值。设系统状态序列函数为g t ,则有: []0:0:0:0:0:()()()t t t t t t x E g x g x p x z dx =? (3) 根据蒙特卡洛方法,后验概率分布可以用有限的离散样本来近似,由大数定律,当系统粒子数N →∞时,期望E [g t (x 0:t )]可近似为: []() 0:0:1 1()()N i t t t t i E g x g x N ==∑ (4) 式中{() 0:i t x : i =1,2,...N }为状态空间中按p (x 0:t |z 0:t )得到的采样点。 2.2 重要性采样 在粒子采集过程中,p (x 0:t |z 0:t )往往是未知且多变的,因此可先从一个已知且容易采样的参考分布q (x 0:t |z 0:t )中抽样,再通过对抽样粒子集进行加权求和来估计系统的状态值,即:

卡尔曼滤波和粒子滤波最直白的解释

卡尔曼滤波本来是控制系统课上学的,当时就没学明白,也蒙混过关了,以为以后也不用再见到它了,可惜没这么容易,后来学计算机视觉和图像处理,发现用它的地方更多了,没办法的时候只好耐心学习和理解了。一直很想把学习的过程记录一下,让大家少走弯路,可惜总也没时间和机会,直到今天。。。 我一直有一个愿望,就是把抽象的理论具体化,用最直白的方式告诉大家--不提一个生涩的词,不写一个数学公式,像讲故事一样先把道理说明白,需要知道细节的同学可以自己去查所有需要知道的一切。因为学习的过程告诉我,最难的其实是最初和这个理论和应用背景亲和的过程--这些理论它究竟是做什么的,又是怎么做到的。可惜我们能看到的关于这些理论的资料大多数都是公式的堆砌并且假定我们明白许多“基本的道理”,其实这些“基本的道理”往往是我们最难想象和超越的。以卡尔曼滤波为例,让我们尝试一种不同的学习方法。 相信所有学习卡尔曼滤波的同学首先接触的都是状态方程和观测方程,学过控制系统的同学可能不陌生,否则,先被那两个看起来好深奥的公式给吓跑了,关键是还不知道他们究竟是干什么的,什么是状态,什么是观测。。。。。。如果再看到后面的一大串递归推导增益,实在很晕很晕,更糟糕的是还没整明白的时候就已经知道卡尔曼滤波其实已经不够使了,需要extended kalmanfilter和particle filter了。。。 其实我们完全不用理会这些公式。先来看看究竟卡尔曼滤波是做什么的,理解了卡尔曼滤波,下面的就顺其自然了。 用一句最简单的话来说,卡尔曼滤波是来帮助我们做测量的,大家一定不明白测量干嘛搞那么复杂?测量长度拿个尺子比一下,测量温度拿温度表测一下不就完了嘛。的确如此,如果你要测量的东西很容易测准确,没有什么随机干扰,那真的不需要劳驾卡尔曼先生。但在有的时候,我们的测量因为随机干扰,无法准确得到,卡尔曼先生就给我们想了个办法,让我们在干扰为高斯分布的情况下,得到的测量均方误差最小,也就是测量值扰动最小,看起来最平滑。 还是举例子最容易明白。我最近养了只小兔子,忍不住拿小兔子做个例子嘻嘻。 每天给兔子拔草,看她香甜地吃啊吃地,就忍不住关心一下她的体重增长情况。那么我们就以小兔子的体重作为研究对象吧。假定我每周做一次观察,我有两个办法可以知道兔子的体重,一个是拿体重计来称:或许你有办法一下子就称准兔子的体重(兽医通常都有这办法),但现在为了体现卡尔曼先生理论的魅力,我们假定你的称实在很糟糕,误差很大,或者兔子太调皮,不能老实呆着,弹簧秤因为小兔子的晃动会产生很大误差。尽管有误差,那也是一个不可失去的渠道来得到兔子的体重。还有一个途径是根据书本上的资料,和兔子的年龄,我可以估计一下我的小兔子应该会多重,我们把用称称出来的叫观察量,用资料估计出来的叫估计值,无论是观察值还是估计值显然都是有误差的,假定误差是高斯分布。现在问题就来了,按照书本上说我的兔子该3公斤重,称出来却只有2.5公斤,我究竟该信哪个呢?如果称足够准,兔子足够乖,卡尔曼先生就没有用武之地了呵呵,再强调一下是我们的现状是兔兔不够乖,称还很烂呵呵。在这样恶劣的情景下,卡尔曼先生告诉我们一个办法,仍然可以估计出八九不离十的兔兔体重,这个办法其实也很直白,就是加权平均,把称称出来的结果也就是观测值和按照书本经验估算出来的结果也就是估计值分别加一个权值,再做平均。当然这两个权值加起来是等于一的。也就是说如果你有0.7分相信称出来的体重,那么就只有0.3分相信书上的估计。说到这里大家一定更着急了,究竟该有几分相信书上的,有几分相信我自己称的呢?都怪我的称不争气,没法让我百分一百信赖它,还要根据书上的数据来做调整。好在卡尔曼先生也体会到了我们的苦恼,告诉我们一个办法来决定这个权值,这个办法其实也很直白,就是根据以往的表现来做决定,这其实听起来挺公平的,你以前表现好,我就相信你多一点,权值也就给的高一点,以前表现不好,我就相信你少一点,权值自然给的低一点。那么什么是表现好表现不好呢,表现好意思就是测量结果稳定,方差很小,

粒子滤波开题报告

毕 业 设 计 (论文) 开 题 报 告 姓名: 学号: 学院: 专业: 课题:基于粒子滤波的移动目标跟踪导师: 时间:

1.本课题研究的目的及意义: 粒子滤波(Particle Filter, PF)是一种基于蒙特卡罗(Monte Carlo)仿真的方法,它利用状态空间的一组带权值的随机样本(粒子)逼近状态变量的概率密度函数,每个样本代表系统的一个可能状态,可以得到状态的最小方差估计。粒子滤波算法摆脱了解决非线性滤波问题时随机量必须满足高斯分布的制约条件,因此,近几年来它在计算机视觉、目标跟踪、机器学习等领域受到了广泛的关注。另外,粒子滤波器的多模态处理能力,也是它应用广泛的原因之一。 本课题主要关注粒子滤波算法在目标跟踪领域的应用,随着计算机技术的发展,人们开始利用计算机来处理数字图像,包括图像增强,图像恢复,图像检索等等,而视频中运动目标的跟踪一直是计算机视觉、图像处理和模式识别等领域非常重要的研究课题。但是传统的目标跟踪方法存在着很多的局限性与不足之处,比如对非刚性目标跟踪时如何准确提取合适的目标特征进行跟踪,以及如何应对跟踪过程中的遮挡问题和复杂背景等等,也就难以保证跟踪的实时性和有效性。然而诸如此类的问题现在可以借助基于粒子仿真的方法来解决,在动态系统的模型选择,故障检测、诊断方面,出现了基于粒子的假设检验、粒子多模型、粒子似然度比检测等方法。同时,粒子滤波较之卡尔曼滤波(Kalman Filter)等在非线性非高斯系统领域中存在的优势,也决定了它的应用范围更加宽泛。 本课题旨在通过研究深入理解粒子滤波的原理及其算法,并利用MATLAB软件的图像处理功能,成功将粒子滤波算法应用于目标跟踪领域,最终实现对视频中运动目标的准确跟踪与检测。 2. 本课题国内外同类研究现状: 基于粒子滤波极强的实用性,国内外学者对此已经进行了大量研究,提出了许多用于跟踪的有效算法。这些方法主要可以分为两类:(1) 基于运动的方法:依据某种强健的算法,把一段时间内的具有运动一致性的点归为一类,如光流法和特征点法,但是计算量较大。(2) 基于模型的方法:主要依据高层的语义表示和知识描述来完成目标的跟踪。利用目标中信息部分的不同,可分为基于目标边界、基于目标区域的方法。但由于目标本身的信息较多,如不加简化,将不可避免地带来信息匹配时的大量运算。因此,对于实时性要求很高的运动目标的跟踪技术而言,如何选取目标的特征信息,并在可靠的前提下简化运算是目标跟踪的关键。本研究将在借鉴前人研究成果的基础

粒子滤波详解

2.4粒子滤波 例子滤波是以贝叶斯滤波和重要性采样为基本框架的。因此,想要掌握例子滤波,对于上述两个基本内容必须有一个初步的了解。重要性采样呢,其实就是根据对粒子的信任程度添加不同的权重,添加权重的规则就是:对于我们信任度高的粒子,给它们添加的权重就相对大一些;否则,就加的权重小一些。根据权重的分布形式,实际上就是它与目标的相似程度。 粒子滤波的结构实际上就是加一层重要性采样思想在里面的蒙特卡罗方法(Monte Carlo method,即以某时间出现的频率来指代该事件的概率)。该方法的基本思想是用一组样本(或称粒子)来近似表示系统的后验概率分布,然后使用这一近似的表示来估计非线性系统的状态。采用此思想,在滤波过程中粒子滤波可以处理任意形式的概率,而不像Kalman滤波只能处理线性高斯分布的概率问题。粒子滤波的一大优势也在于此,因此近年来该算法在许多领域得到成功应用。 2.4.1贝叶斯滤波理论 贝叶斯滤波泛指一类以贝叶斯定理为基础的滤波技术,其根据所获得的观测,对状态后验概率分布、状态先验概率分布、状态估计值以及状态预测值等感兴趣量进行递归计算。 假设有一个系统,我们知道它的状态方程,和测量方程如下: =(,(状态方程)(2.4.1) =(,(测量方程)(2.4.2) 其中x为系统状态,y为测量到的数据,f,h是状态转移函数和测量函数,v,n 为过程噪声和测量噪声,噪声都是独立同分布的。 由贝叶斯理论可知,状态估计问题(目标跟踪、信号滤波)就是根据之前一系列的已有数据(测量数据)递推的计算出当前状态的可信度,这个可信度就是概率公式p(),它需要通过预测和更新两个步奏来递推的计算。 预测过程是利用系统模型(状态方程2.4.2)预测状态的先验概率密度,也就是通过已有的先验知识对未来的状态进行猜测,即p( )。更新过程则利用最新的测量值对先验概率密度进行修正,得到后验概率密度,也就是对之前的猜测进行修正。 处理这些问题之前,假设系统的状态转移服从一阶马尔科夫模型,即当前时刻的状态x(k)只与上一个时刻的状态x(k-1)有关, k时刻测量到的数据y(k)只与当前的状态x(k)有关。

视频目标跟踪算法综述_蔡荣太

1引言 目标跟踪可分为主动跟踪和被动跟踪。视频目标跟踪属于被动跟踪。与无线电跟踪测量相比,视频目标跟踪测量具有精度高、隐蔽性好和直观性强的优点。这些优点使得视频目标跟踪测量在靶场光电测量、天文观测设备、武器控制系统、激光通信系统、交通监控、场景分析、人群分析、行人计数、步态识别、动作识别等领域得到了广泛的应用[1-2]。 根据被跟踪目标信息使用情况的不同,可将视觉跟踪算法分为基于对比度分析的目标跟踪、基于匹配的目标跟踪和基于运动检测的目标跟踪。基于对比度分析的跟踪算法主要利用目标和背景的对比度差异,实现目标的检测和跟踪。基于匹配的跟踪主要通过前后帧之间的特征匹配实现目标的定位。基于运动检测的跟踪主要根据目标运动和背景运动之间的差异实现目标的检测和跟踪。前两类方法都是对单帧图像进行处理,基于匹配的跟踪方法需要在帧与帧之间传递目标信息,对比度跟踪不需要在帧与帧之间传递目标信息。基于运动检测的跟踪需要对多帧图像进行处理。除此之外,还有一些算法不易归类到以上3类,如工程中的弹转机跟踪算法、多目标跟踪算法或其他一些综合算法。2基于对比度分析的目标跟踪算法基于对比度分析的目标跟踪算法利用目标与背景在对比度上的差异来提取、识别和跟踪目标。这类算法按照跟踪参考点的不同可以分为边缘跟踪、形心跟踪和质心跟踪等。这类算法不适合复杂背景中的目标跟踪,但在空中背景下的目标跟踪中非常有效。边缘跟踪的优点是脱靶量计算简单、响应快,在某些场合(如要求跟踪目标的左上角或右下角等)有其独到之处。缺点是跟踪点易受干扰,跟踪随机误差大。重心跟踪算法计算简便,精度较高,但容易受到目标的剧烈运动或目标被遮挡的影响。重心的计算不需要清楚的轮廓,在均匀背景下可以对整个跟踪窗口进行计算,不影响测量精度。重心跟踪特别适合背景均匀、对比度小的弱小目标跟踪等一些特殊场合。图像二值化之后,按重心公式计算出的是目标图像的形心。一般来说形心与重心略有差别[1-2]。 3基于匹配的目标跟踪算法 3.1特征匹配 特征是目标可区别与其他事物的属性,具有可区分性、可靠性、独立性和稀疏性。基于匹配的目标跟踪算法需要提取目标的特征,并在每一帧中寻找该特征。寻找的 文章编号:1002-8692(2010)12-0135-04 视频目标跟踪算法综述* 蔡荣太1,吴元昊2,王明佳2,吴庆祥1 (1.福建师范大学物理与光电信息科技学院,福建福州350108; 2.中国科学院长春光学精密机械与物理研究所,吉林长春130033) 【摘要】介绍了视频目标跟踪算法及其研究进展,包括基于对比度分析的目标跟踪算法、基于匹配的目标跟踪算法和基于运动检测的目标跟踪算法。重点分析了目标跟踪中特征匹配、贝叶斯滤波、概率图模型和核方法的主要内容及最新进展。此外,还介绍了多特征跟踪、利用上下文信息的目标跟踪和多目标跟踪算法及其进展。 【关键词】目标跟踪;特征匹配;贝叶斯滤波;概率图模型;均值漂移;粒子滤波 【中图分类号】TP391.41;TN911.73【文献标识码】A Survey of Visual Object Tracking Algorithms CAI Rong-tai1,WU Yuan-hao2,WANG Ming-jia2,WU Qing-xiang1 (1.School of Physics,Optics,Electronic Science and Technology,Fujian Normal University,Fuzhou350108,China; 2.Changchun Institute of Optics,Fine Mechanics and Physics,Chinese Academy of Science,Changchun130033,China)【Abstract】The field of visual object tracking algorithms are introduced,including visual tracking based on contrast analysis,visual tracking based on feature matching and visual tracking based on moving detection.Feature matching,Bayesian filtering,probabilistic graphical models,kernel tracking and their recent developments are analyzed.The development of multiple cues based tracking,contexts based tracking and multi-target tracking are also discussed. 【Key words】visual tracking;feature matching;Bayesian filtering;probabilistic graphical models;mean shift;particle filter ·论文·*国家“863”计划项目(2006AA703405F);福建省自然科学基金项目(2009J05141);福建省教育厅科技计划项目(JA09040)

关于粒子滤波算法的形象比喻

本文来自https://www.360docs.net/doc/3f5807656.html,/yangyangcv/archive/2010/05/23/1742263.html 一直都觉得粒子滤波是个挺牛的东西,每次试图看文献都被复杂的数学符号搞得看不下去。一个偶然的机会发现了Rob Hess(https://www.360docs.net/doc/3f5807656.html,/~hess/)实现的这个粒子滤波。从代码入手,一下子就明白了粒子滤波的原理。根据维基百科上对粒子滤波的介绍 (https://www.360docs.net/doc/3f5807656.html,/wiki/Particle_filter),粒子滤波其实有很多变种,Rob Hess实现的这种应该是最基本的一种,Sampling Importance Resampling (SIR),根据重要性重采样。下面是我对粒子滤波实现物体跟踪的算法原理的粗浅理解: 1)初始化阶段-提取跟踪目标特征 该阶段要人工指定跟踪目标,程序计算跟踪目标的特征,比如可以采用目标的颜色特征。具体到Rob Hess的代码,开始时需要人工用鼠标拖动出一个跟踪区域,然后程序自动计算该区域色调(Hue)空间的直方图,即为目标的特征。直方图可以用一个向量来表示,所以目标特征就是一个N*1的向量V。2)搜索阶段-放狗 好,我们已经掌握了目标的特征,下面放出很多条狗,去搜索目标对象,这里的狗就是粒子particle。狗有很多种放法。比如,a)均匀的放:即在整个图像平面均匀的撒粒子(uniform distribution);b)在上一帧得到的目标附近按照高斯分布来放,可以理解成,靠近目标的地方多放,远离目标的地方少放。Rob Hess的代码用的是后一种方法。狗放出去后,每条狗怎么搜索目标呢?就是按照初始化阶段得到的目标特征(色调直方图,向量V)。每条狗计算它所处的位置处图像的颜色特征,得到一个色调直方图,向量Vi,计算该直方图与目标直方图的相似性。相似性有多种度量,最简单的一种是计算 sum(abs(Vi-V)).每条狗算出相似度后再做一次归一化,使得所有的狗得到的相似度加起来等于1. 3)决策阶段 我们放出去的一条条聪明的狗向我们发回报告,“一号狗处图像与目标的相似度是0.3”,“二号狗处图像与目标的相似度是0.02”,“三号狗处图像与目标的相似度是0.0003”,“N号狗处图像与目标的相似度是0.013”...那么目标究竟最可能在哪里呢?我们做次加权平均吧。设N号狗的图像像素坐标是(Xn,Yn),它报告的相似度是Wn,于是目标最可能的像素坐标X = sum(Xn*Wn),Y = sum(Yn*Wn). 4)重采样阶段Resampling 既然我们是在做目标跟踪,一般说来,目标是跑来跑去乱动的。在新的一帧图像里,目标可能在哪里呢?还是让我们放狗搜索吧。但现在应该怎样放狗呢?让我们重温下狗狗们的报告吧。“一号狗处图像与目标的相似度是0.3”,“二号狗处图像与目标的相似度是0.02”,“三号狗处图像与目标的相似度是 0.0003”,“N号狗处图像与目标的相似度是0.013”...综合所有狗的报告,一号狗处的相似度最高,三号狗处的相似度最低,于是我们要重新分布警力,正所谓好钢用在刀刃上,我们在相似度最高的狗那里

扩展卡尔曼滤波和粒子滤波算法比较

扩展卡尔曼滤波和粒子滤波算法比较上海大学2013 , 2014学年秋季学期 研究生课程小论文 课程名称: 随机信号导论课程编号: 07SB17002 论文题目: 扩展卡尔曼滤波和粒子滤波算法比较 研究生姓名: 班孝坤 (33%) 学号: 13720843 研究生姓名: 倪晴燕 (34%) 学号: 13720842 研究生姓名: 许成 (33%) 学号: 13720840 论文评语: 成绩: 任课教师: 刘凯 评阅日期: 扩展卡尔曼滤波和粒子滤波算法比较 第一章绪论 在各种非线性滤波技术中, 扩展卡尔曼滤波是一种最简单的算法, 它将卡尔曼滤波局部线性化,适用于弱非线性、高斯环境下。卡尔曼滤波用一系列确定样本来逼近状态的后验概率密度, 适用于高斯环境下的任何非线性系统。粒子滤波用随机样本来近似状态的后验概率密度, 适用于任何非线性非高斯环境, 但有时选择的重要性分布函数与真实后验有较大差异, 从而导致滤波结果存在较大误差, 而粒子滤

波正好克服了这一不足, 它先通过UKF产生重要性分布, 再运用PF 算法。通过仿真实验, 对其的性能进行比较。 严格说来,所有的系统都是非线性的,其中许多还是强非线性的。因此,非线性系统估计问题广泛存在于飞行器导航、目标跟踪及工业控制等领域中,具有重要的理论意义和广阔的应用前景。 系统的非线性往往成为困扰得到最优估计的重要因素,为此,人们提出了大量次优的近似估计方法。包括EKF,基于UT变换的卡尔曼滤波(UKF),粒子滤波,等等。 第二章扩展卡尔曼滤波介绍 2.1 扩展卡尔曼滤波的理论(EKF) 设非线性状态空间模型为: xfxv,(,)(1)ttt,,11 yhxn,(,)(2)ttt 式中和分别表示在t时刻系统的状态和观测,和 xR,yR,vR,nR,tttt分别表示过程噪声和观测噪声,f和h表示非线性函数。 扩展卡尔曼滤波(Extended kalman filter,以下简称EKF)是传统非线性估计的代表,其基本思想是围绕状态估值对非线性模型进行一阶Taylor展开,然后应用线性系统Kalman滤波公式。 EKF是用泰勒展开式中的一次项来对式(1)和 ( 2 ) 中的非线性函数f和h 进行线性化处理, 即先计算f和h 的雅克比矩阵, 然后再在标准卡尔曼滤波框架下进行递归滤波。和均为零均值的高斯白噪声。 vntt 2.2 扩展卡尔曼滤波的算法 EKF的算法同KF 一样, 也可分为两步预测和更新。如图2.1所示

粒子滤波技术的发展现状综述

1 收稿日期: 2009-06-10 基金项目:国家自然科学基金项目10872125、上海市自然科学基金 项目06ZR14042、高等学校学科创新引智计划资助项目B06012、教育部留学回国人员科研启动基金项目 作者简介:张瑞华(1985-),女,硕士,目前从事非线性动力学、信 号处理与识别研究。E m ai:l zhangrh @s j tu https://www.360docs.net/doc/3f5807656.html, 文章编号:1006 1355(2010)02 0001 04 粒子滤波技术的发展现状综述 张瑞华,雷 敏 (上海交通大学机械系统与振动国家重点实验室,上海 200240) 摘 要:对粒子滤技术的近几年研究发展进行回顾,介绍四大类粒子滤波改进算法,总结目前目标跟踪、导航与定位中存在的问题,展望粒子滤波技术的方法研究及实际应用前景。 关键词:振动与波;粒子滤波;非线性系统;信号处理;目标识别中图分类号:TP27;TN 713;V 2 文献标识码:A DO I 编码:10.3969/.j issn .1006-1355.2010.02.001 Review of State of The A rt of Particle Filtering Technique ZHANG Rui hua,LEI M in (S tate Key Laboratory ofM echanical Syste m and V ibration ,Shangha i Jiao tong Un i v ersity ,Shangha i 200240,China) Abstract :Th is paper rev ie w s the state of the art of particle filtering techn i q ue .The novelm ethods for particle filtering ca lculati o n o f four k i n ds of particles are i n troduced .The prob l e m s i n tar get track i n g ,nav i g ation and orientation are summ ar ized.A t las,t t h e further study and practica l app li c ations of particle filtering techn ique are prospected . Key w ords :v i b ra ti o n and wave ;particle filtering ;nonlinear syste m s ;si g na l pr ocess ;target recog niti o n 粒子滤波(Partic le Filter ,PF )技术是一种用于非线性、非高斯系统的滤波方法。在其发展过程中有很多表述方法,如Bootstrap filter ,C ondensati o n M onte Carlo filter ,Particle filter 等,目前使用最多的是英文 Particle filter 中文 粒子滤波 。粒子滤波思想最早可以追溯到上一世纪50年代末H e mm ers ley 等人[1] 提出的基于贝叶斯采样估计的顺序重要采样(SI S)滤波思想。60年代以后粒子滤波技术得到了一定的发展,但研究中一直存在粒子退化、重采样可能减少正确的粒子数和计算量制约等致命问题,从而没有引起人们足够的重视。直到上个世 纪90年代初,Go r dan 等人[2] 提出在递推过程中重 新抽样的思想,奠定了粒子滤波实用性的基础,随后许多改进算法相继被提出,使得粒子滤波技术得到迅速发展。目前该技术已被广泛地应用到诸多领域里,如目标跟踪及导航与制导、状态监视和故障诊断、参数估计与系统辨识、人手臂运动识别、计算机视觉、金融领域等 [3-9] 。 1 粒子滤波技术发展现状 根据SC I 数据库的检索报告,从1990年至今共有482篇SC I 的 粒子滤波(Parti c le F ilteri n g) 标题文章,而近5年的标题文章就有336篇,占全部标题文章的69.7%,并且 粒子滤波(Partic le F iltering) 的主题文章近5年就有将近1500篇之多,可以说粒子滤波技术已受到学者和科研人员的高度关注,成为当今一个非常活跃的研究领域。 粒子滤波是针对所有可能的观测值,通过状态空间随机生成一些粒子,每个粒子利用贝叶斯准则进行加权修正,然后递归构造状态变量的条件概率密度,以近似估计实际的系统状态。Gordan 等人 [2] 粒子滤波技术的发展现状综述

粒子滤波理论备课讲稿

2粒子滤波理论 粒子滤波通过非参数化的蒙特卡洛(Monte Carlo)模拟方法来实现递推贝叶斯滤波,适用于任何能用状态空间模型描述的非线性系统,精度可以逼近最优估计。粒子滤波器具有简单、 易于实现等特点,它为分析非线性动态系统提供了一种有效的解决方法,从而引起目标跟踪、 信号处理以及自动控制等领域的广泛关注。本章首先概述用于求解目标状态后验概率的贝叶 斯滤波理论,随后介绍具有普遍适用性的粒子滤波器,最后针对当前粒子滤波器存在的粒子 多样性丧失问题,提出了一种量子进化粒子滤波算法。 2.1贝叶斯滤波 动态系统的目标跟踪问题可以通过图 2.1所示的状态空间模型来描述。本节在贝叶斯滤 波框架下讨论目标跟踪问题。 在目标跟踪问题中,动态系统的状态空间模型可描述为 X k f(X k 1) U k 1 (2.1) y k h(X k) V k 其中f(), h()分别为状态转移方程与观测方程,x k为系统状态,y k为观测值,u k为过程 噪声,V k为观测噪声。为了描述方便,用X k x°:k {X0,X1,L ,X k}与Y k y1k{%丄,丫讣分别表示0到k 时刻所有的状态与观测值。在处理目标跟踪问题时,通常假设目标的状态转 移过程服从一阶马尔可夫模型,即当前时刻的状态x k只与上一时刻的状态x k-1有关。另外 一个假设为观测值相互独立,即观测值y k只与k时刻的状态x k有关。 贝叶斯滤波为非线性系统的状态估计问题提供了一种基于概率分布形式的解决方案。贝叶斯滤波将状态估计视为一个概率推理过程,即将目标状态的估计问题转换为利用贝叶斯公 式求解后验概率密度p(X k |Y k)或滤波概率密度p(X k |Y k),进而获得目标状态的最优估计。贝叶斯滤波包含预测和更新两个阶段,预测过程利用系统模型预测状态的先验概率密度,更

粒子滤波的基本原理笔记

粒子滤波的基本原理 粒子滤波算法广泛应用在视觉跟踪领域、通信与信号处理领域、机器人、图像处理、金融经济、以及目标定位、导航、跟踪领域,其本质是利用当前和过去的观测量来估计未知量的当前值。在粒子滤波算法中使用了大量随机样本,采用蒙特卡洛仿真来完成递推贝叶斯滤波过程,其核心是使用一组具有相应权值的随机样本(粒子)来表示状态的后验分布。该方法的基本思路是选取一个重要性概率密度函数并从中进行随机抽样,得到一些带有相应权值的随机样本后,在状态观测的基础上调节权值的大小和粒子的位置,再使用这些样本来逼近状态后验分布,最后通过这组样本的加权求和作为状态的估计值。粒子滤波不受系统模型的线性和高斯假设约束,采用样本形式而不是函数形式对状态概率密度进行描述,使其不需要对状态变量的概率分布作过多的约束,适用于任意非线性非高斯动态系统,是目前最适合于非线 性、非高斯系统状态的滤波方法【Arulampalam M S, Maskell S, Gordon N, et al. A tutorial on particle filters for online nonlinear/non-Gaussian Bayesian tracking[J]. IEEE Transactions on Signal Processing, 2002, 50(2):174-188.】 1 动态系统的状态空间模型 状态空间模型包括系统状态方程和观测方程,其通用的表示方法分别为【梁军. 粒子滤波算法及其应用研究[D]. 哈尔滨工业大学, 2009.】【黄小平, 王岩, 廖鹏程. 粒子滤波原理及应用——MATLAB 仿真[M].电子工业出版社. 2017】 ()1,k k k f -=X X W (1) (),k k k h =Z X V (2) 其中()f ?和()h ?为已知函数, k W 和k V 是概率密度已知的随机变量,k X 代表k 时刻的状态量,k Z 代表k 时刻的观测量,k W 和k V 是相互独立的。 关于系统的状态方程和观测方程,通常也可用()1k k p -X X 表示状态转移模型;()k k p Z X 表示观测似然模型;()0p X 表示初始状态的先验分布;()0:1:k k p X Z 表示系统的后验密度; ()1:k k p X Z 表示边沿后验密度,或称为后验滤波密度。卡尔曼滤波以及粒子滤波算法的本质即是利用观测序列1:k Z 对当前状态进行优化,从而得到k 时刻的后验滤波密度,进而得到k 时刻的状态值。【Merwe R V D, Doucet A, Freitas N D, et al. The unscented particle filter[C]// International Conference on Neural Information Processing Systems. MIT Press, 2000:563-569.】

基于粒子滤波器的移动机器人定位和地图创建研究进展

文章编号:1002 0446(2007)03 0281 09 基于粒子滤波器的移动机器人定位和地图创建研究进展* 余洪山,王耀南 (湖南大学电气与信息工程学院,湖南长沙 410082) 摘 要:首先,对粒子滤波器的原理和研究进展进行了综述.然后,介绍了基于粒子滤波器的移动机器人定位研究进展.其次,给出了粒子滤波器在移动机器人地图创建领域的最新成果.最后,对粒子滤波器在移动机器人研究领域的未来发展方向进行了展望. 关键词:粒子滤波器;蒙特卡洛定位;移动机器人地图创建;移动机器人定位;移动机器人同步地图创建和定位 中图分类号: TP24 文献标识码: A A R eview on M obile R obot L ocalizati on and M ap buildi ng A l gorith m s Based on Particle Filters YU H ong shan,WANG Y ao nan (Colle g e o f E lectri ca l and Infor ma tion Eng i neering,H unan Universit y,Chang sha410082,Ch i na) Abstract:F i rstl y,the research progress and princ i p l e o f particle filters a re overv ie w ed.Secondly,t he progress o fm ob ile robot locali zati on based on parti c le filte rs i s descri bed.T hird l y,the recent w orks o f pa rtic l e filters in m ap bu ildi ng f o r mo b ile robots are presented.F i nall y,the future d i recti ons o f pa rti c l e filters in m ob ile robot are su mm ar i zed. K eyword s:parti c le filte r;M onte Carlo l o ca li za ti on;mob ile robot m ap bu il d i ng;mob ile robot localizati on;SLAM 1 引言(Introduction) 粒子滤波器(partic le filter)是一种基本统计工具,其核心是基于贝叶斯采样估计的顺序重要采样(Sequenti a l I m portance Sa m pli n g,S I S)滤波思想,通常也称之为Bootstrap滤波器、蒙特卡洛滤波器、Conden sation算法和Surv i v a l o f the Fittest算法,开始成功应用于目标跟踪、语音识别、移动机器人定位、地图创建、故障诊断、统计分析等领域[1~8]. 粒子滤波器具有可逼近任意概率分布的特性,并且计算简单方便,与传统卡尔曼滤波器方法、马尔可夫算法相比,具有其特定的优越性.De llaert等[9]和Fox等[10]分别独立提出将粒子滤波器应用于移动机器人定位研究中,即蒙特卡洛定位算法(M onte Carlo Localization,MCL).此后算法被研究人员广泛采用和扩展,迅速成为继EKF模型、马尔可夫模型后移动机器人定位领域的一个新的研究热点[11].在此基础上,研究人员将粒子滤波器引入地图创建研究,提出了一系列移动机器人同步地图创建和定位方案,如FastSL AM算法[12,13]、粒子滤波器和其他智能计算方法的复合地图创建方法等,得到了移动机器人地图创建研究人员的广泛认可.本文拟对粒子滤波器在移动机器人定位、地图创建等应用领域的最新研究进行综述,分析和总结该类算法的优缺点和可能研究方向. 2 粒子滤波器原理和研究进展(The re search progress and principle of particle filters) 粒子滤波器的研究源于H a mm ersley等[2]提出的基本SI S方法.1993年Gor don等[4]提出了一种新的基于SIS的Bootstrap非线性滤波方法,奠定了粒子滤 第29卷第3期 2007年5月机器人 ROBOT V o.l29,N o.3 M ay,2007 *基金项目:国家自然科学基金资助项目(60375008);教育部博士点基金资助项目(20030532004);湖南大学优秀博士论文创新基金资助项目(521218006). 收稿日期:2006-07-03

基于粒子滤波的目标跟踪算法浅析

基于粒子滤波的目标跟踪算法浅析 高 翔 (甘肃联合大学 电子信息工程学院 甘肃 兰州 730010) 摘 要: 所做的工作是利用粒子滤波理论解决目标跟踪所面临的技术问题。首先介绍粒子滤波中的两种重要算法:贝叶斯理论和蒙特卡罗方法,接着在此基础上详细阐述基于粒子滤波的目标跟踪算法。 关键词: 目标跟踪;粒子滤波;序列重要性采样 中图分类号:TN.2 文献标识码:A 文章编号:1671-7597(2011)0510193-02 1 绪论 时就可以根据上式计算出p 的概率分布。可以表示为: 粒子滤波技术在非线性、非高斯系统表现出来的优越性,决定了它的应用范围非常广泛。另外,粒子滤波器的多模态处理能力,也是它应用广泛有原因之一。本文首先介绍了粒子滤波理论的基础,接下来在此基础上研究了基于粒子滤波的目标跟踪算法。 2 粒子滤波的计算理论方法 其中,为模拟随机试验的次数,即是p 的子样本的个数。p i ,表示试2.1 贝叶斯理论 验所得到的相应的子样本。 贝叶斯估计理论较经典的统计估计理论具有更大的优势,逐渐成为科蒙特卡罗方法是以概率模型为基础的,它解题的三个主要步骤是:学界推理的一个重要工具。贝叶斯推论提供了一种与传统方法不同的概率分布形式的估计,它利用所有的已知信息来构造系统状态变量的后验概率密度,即用系统模型预测状态的先验概率密度,再利用最新的量测值进行修正,得到后验概率密度。这样它就包括了量测值和先验知识在内的所有可以利用的信息,得到的估计误差自然就小一些。 我们将会描述一个以状态x 为参数的一般模型的框架,其中t 表示离散时t 间。对于跟踪所关心的分布是后验概率 也叫滤波分布,其中 波分布可以用两步递归迭代来计算: 其中预测阶段是一个边缘分布,而新的滤波分布则是由贝叶斯法则直 接得到的。递归过程的完成需要有状态演进 的动态模型和一个当前测量值 的状态似然模型,迭代过程用一些初始状态的分布来初始化。上述跟踪迭代只是在极少的情况下具有严格的表述形式。其中最著名的是用于线性和高斯动态系统与似然模型的卡尔曼滤波器(KF ),而对于一般的非线性和非高斯模型跟踪迭代变得束手无策,这时就需要逼近技术。而序列蒙特卡罗方法也叫粒子滤波器由于它们具有有效、简单、适应性强、易实现等优点,作为一个计算复杂模型的跟踪迭代近似方案近年来受到广泛的欢迎。 2.2 蒙特卡罗方法 蒙特卡罗方法的基本原理是:在物理、数学、建筑工程以及工业生产等领域,如果要求解的问题是某种事件出现的概率,或者是某个随机变量的数学期望时,首先按照一定的方法建立一个数学模型,使该模型的参数等于要求的问题的解,然后以此数学模型为基础通过抽样试验来计算出参数的统计特性,最后给出所求问题的近似估计值。在实际的应用中,解的精确度可以用估计值的标准误差来表示。 假如有以下的函数关系式:P 二f (x ) 其中,变量x 服从某一概率分布,是一个随机变量。f (x )是一个包含多重积分的表达式,直接用解析的方法很难求出函数 p 的概率分布。 按照蒙特卡罗方法的基本思想,要想用“试验”的方法求出函数p 的概率分布概率分布,就要在函数表达式满足的定义域内,随机的抽取每一个随机变量二,并把它带入表达式f (x )中,进而求出函数p 的值。由于变量:的值是在一定的定义域内随机抽取的,所以经过多独立的模拟试验后,可以得到相应的抽样数据Pi 。当对变量:进行模拟抽取的次数足够大 第一步:构造或者描述概率过程。在实际的应用中,有些问题不具有随机性质,比如计算多重积分问题,偏微分方程的边值求解问题等。使用传统的计算方法求解这些问题比较困难,为了能利用蒙特卡罗方法求解,就需要人为的设计一个概率过程,并且该概率过程要能很好的描述该事件的发生,同时把要求问题的解设置为该概率过程的某些参数。对于本身就具有随机性质的问题,其主要任务是如何准确的描述和模拟这个概率过程。把不具有随机性质的问题,通过特定的模型转化为具有随机性质的问题,是蒙特卡罗方法应用和研究的主要问题之一。 第二步:实现从已知概率分布中抽样。由概率论的知识可知,各种各样的概率分布都可以按照一定的方式构造出相应的概率模型。当概率 模型构造完成以后,如何准确的产生己知概率分布的随机变量,就成为实现蒙特卡罗方法的关键步骤。从另一个方面来讲,如何产生合适的随机变量也是蒙特卡罗方法随机抽样原理的重要体现。通常情况下,一个最典型的概率分布是(0,l )区间上的均匀分布。同时,这种分布也是最简单的概率分布,在这种分布上产生的随机变量就是我们常说的随机数。具有相同分布的随机数构成的一个序列就是随机数序列,随机数序列中的各个子样都是相互独立的。因此,随机数的产生问题,就演化为从己知的概率分布中抽样的问题。随机数的独立性就保证了抽取的样本是若干次独立的试验,这样就保证了样本的多样性。具有这些特性的样本总体就能准确的表达相应的概率分布,这就是蒙特卡罗方法的重要特征。 第三步:建立各种估计量。通常情况下,要实现蒙特卡罗模拟试验,首先要构造概率模型,然后从已经的概率分布中抽样,最后还要设置一个合适的随机变量。使该随机变量恰好是所求问题的解,我们称之为无偏估计。在前两步的基础上,建立各种估计量,相当于对模拟实验的结果进行考察和登记,进而得到所求问题的解。 3 粒子滤波的基本原理 3.1 序列重要性采样 序列重要性采样算法,是一种通过蒙特卡罗模拟实现递推的贝叶斯滤波的技术。它的主要思想可以描述为:利用一系列随即样本的加权和来表示所需状态的后验概率密度,进而得到状态的估计值。当样本点增至无穷大时,蒙特卡罗特性与后验概率密度的函数表示等价,515滤波器逼近最优的贝叶斯估计。重要采样技术是一个关键的步骤,因为粒子的权值就是根据重要采样技术来选择的,所以提议分布的设计是一项重要的工作。如果粒子是根据重要密度q (x0:k|z0:k )选择的,那么粒子的权值可以表 示为: 预测阶段:

相关文档
最新文档