系统辨识第三章(随机逼近法)讲义(NJUST)

合集下载

系统辨识 第三章 状态估计—Kalman滤波方法

系统辨识 第三章 状态估计—Kalman滤波方法

定理 若 z 的协方差阵 Rzz 有逆 则 z 对 x 的线性无偏最小方差估计唯一地表示为 −1 ˆ = E ( x | z ) = m x + Rxz Rzz ( z − mz ) x (3.1.16) 且误差协方差阵为 −1 ~~ T ˆ ˆ T R~ x = cov{x x } = cov{( x − x )( x − x ) } = R xx − R xz R zz R zx (3.1.17)E[T * (Y ) − x] ≤ E[T (Y ) − x] 2 则称 T (Y ) 为最小方差估计 定理 设 x 和 Y 是两个联合分布的随机向量 期望值 ˆ = E[ x | y ] = ∫ x p( x | y )dx x
−∞ ∞
ˆ 就是 x 的条件 则 x 的最小方差估计 x (3.1.8)
估计值能够落在真值的任一
定义 如果对于任意实数 ε > 0 式 3.1.1 ˆ (N ) − x > ε} = 0 lim P{ x
N →∞
得到的估计量依概率收敛于真值
即 (3.1.4)
则称该估计为一致估计 充分估计 ˆ 包含了样本 { y (1), y (2),L , y ( N )} 关于 x 的全部信息 则称 x ˆ (N ) 为 x 的 如果 x 充分估计
−1
−1
−1
结合式
(3.1.18)
定理得证
5 定理 如果 z = { y (1),L , y ( N )} 是 Y 的一组子样 且 y (i ), i = 1, L , N 对 x 的线性无偏最小方差估计为 ˆ = E{x | z} = ∑ E ( x | y (i )) − ( N − 1)m x x
证明 假定 f ( y ) 为 x 的一个估计 其中 y 为随机向量 Y 的某一实现 则估计误差为 ~ x = x − f ( y) 且 E[ ~ x~ x T ] = E{[ x − f ( y )][ x − f ( y )]T = E{[ x − E ( x | y ) + E ( x | y ) − f ( y )] • [ x − E ( x | y ) + E ( x | y ) − f ( y )]T } = E{[ x − E ( x | y )][ x − [ x − E ( x | y )]T } + E{[ E ( x | y ) − f ( y )][ E ( x | y ) − f ( y )]T } + E{[ x − E ( x | y )][ E ( x | y ) − f ( y )]T } + E{[ E ( x | y ) − f ( y )][ x − E ( x | y )]T } 下面说明上式的最后两项为零 E{[ x − E ( x | y )][ E ( x | y ) − f ( y )]T }

《系统辨识》课件

《系统辨识》课件

模型结构确定后,其中未知部分就要通过观测数据进
行估计。通常未知部分是以未知参数出现,故辨识工
作就成了参数估计。
参数估计的要求就是要辨识出来的模型与实际过程在
某种意义下最“接近”。
所以必须有个准则衡量。
4、模型验证
一个模型辨出来后,是否可靠必须进行多次验证。
通常一个模型用一套数据进行辨识,然后用另一套数
建立数学模型来预报。
4
第一章 概 述
2. 用于分析实际系统 工程上在分析一个新系统时,通常先进行数学仿真, 仿真的前提必须有数学模型。
3. 为了设计控制系统 目前,对被控系统的控制器的设计方法的选取,以及如 何进行具体的控制结构和参数的设计都广泛依赖于对 被控系统的理解及所建立的被控系统数学模型。
t2 t1
28
t1
y(t1)1e T
y1
y(t2)1et2T y2
第二章 过渡响应法和频率响应法
y(t)
t2 t1 y ( )
t
两边同取对数得:
t1 T
t2 T
n[1 n[1
y (t1)] y (t 2 )]
T t2n[nn1[[11 yyy(t((1ttt)112]))]] tn1t[1n1[n1[1y yy(t(2t)(2t])2])]
17
常用的模型类: 参数的 或 非参数的 线性的 或 非线性的 连续的 或 离散的 确定的 或 随机的 I/O的 或 状态的 时变的 或 定常(时不变)的
集中参数的 或 分布参数的 频率域的 或 时间域的 等等。
第一章 概 述
18
第一章 概 述
根据系统的空间、时间的离散化情况,模型可分为 三类:

t
y(t) 1e T

201110第三讲系统辨识建模法课件

201110第三讲系统辨识建模法课件
如果所确定的系统模型合适,则辨识结束。否则,改变系统的验 前模型结构,重新执行辨识过程,即执行第(4)步至第(8)步,直 到获得一个满意的模型为止。
19
系统辨识的基本方法和步骤
系统辨识中常用的误差准则
辨识有3个要素---数据、模型类和准则。辨识就是按 照一个准则在一组模型类中选择一个与数据拟合得最好的模 型。
持续激励:输入信号必须充分激励系统的所有模态;
输入信号的选择应能使给定问题的辨识模型精度最高。
在具体工程应用中,选择输入信号还应考虑以下因素: (1)输入信号的功率或幅值不宜过大,以免使系统工作 在非线性区,但也不应过小,以致信噪比太小,直接影响 辨识精度; (2)输入信号对系统的“净扰动”要小,即应使正负向 扰动机会几乎均等; (3)工程上要便于实现,成本25 低。
理想阶跃信号
理想阶跃信号:实际上阶跃信号具有上升空间成为带斜坡的阶跃 信号,数学上定义的阶跃信号上升空间为零,称为理想阶跃信号。
ut
0,t 1,t
0 0
理想阶跃信号的频谱:
Ujj1
幅频: 如图所示
U(j) 1( / ),, 00
2 带斜坡的阶跃信号
t/, t
x1(t)
1,
t
带斜坡的阶跃信号
9
(3)系统设计和控制 在工程设计中,必须掌握系统中所包括的所有部件的特性或者子
系统的特性,一项完善的设计,必须使系统各部件的特性与系统的总 体设计要求(如产量指标、误差、稳定性、安全性和可靠性等)相适 应。为此,需要建立数学模型,在设计中分析、考察系统各部分的特 性以及各部分之间的相互作用和它们对总体系统特性的影响。
辨识问题可以归结为用一个模型来表示客观系统(或将要 构造的系统)本质特征的一种演算,并用这个模型把对客观系统 的理解表示成有用的形式。

《系统辨识第三章》PPT课件

《系统辨识第三章》PPT课件
ˆLS
h
10
三、最小二乘估计 的求法
⒈ ˆLS 解法
ˆLS
由最小二乘辨识定义,求 的:
ˆLS
必要条件:
J ()
0
ˆLS
充分条件:
2 J ()
0 及
2
ˆ LS
J ()
0
ˆLS
Y
J()T ( Y )T(Y ) Y T Y T T Y Y T T T
h
11
由 于是得:
由充分条件:
2J() 2
2T0
与参数向量 无关。 θ
h
12
⒉ 解ˆL的S 唯一性
因 阵行数大于列数,T为 2n2方n阵。若 存 (T)1
在,则 T必ˆLS正定;反之,若 T 正定,则逆 必 (T)1
存在。因此, 必有解,且满足充分条件
2 J ( ) 2
0
与 无关,所以ˆLS解唯一。
h
13
⒊最小二乘法所需信息量与持续激励条件
☆ 3-6 适应最小二乘法
h
3
第三章 最小二乘辨识
用来进行系统参数辨识的最小二乘法,是一种经典的数据处理方法,最早的应用可追 溯到18世纪,高斯为了提高天体运动观测的准确性,曾应用了最小二乘法。
本章将介绍一般最小二乘法、加权最小二乘法、递推最小二乘法以及广义最小二乘法 等内容。
由于最小二乘法比较简单实用,而且又可与其他辨识方法相组合,因此最小二乘辨识 是一种基本的、重要的辨识方法。
表示为:
Y(N) Y Ub a(N,)
bn0
(N)(N, )
h
8
Y(N) Y Ub a(N,)
(N)(N,)
其中: Y(N)( 测R 量(向N量n) ,1)1

模式识别第3章 近邻法

模式识别第3章 近邻法
如果样本足够多,就可以重复地执行剪辑程序, 以进一步提高分类性能,称为重复剪辑最近邻法 (MultiEdit算法)。
26
27
近邻法
重复剪辑近邻法
原始样本集(不同均矢和协方差阵的两类正态分布随机样本)28
近邻法
重复剪辑近邻法
第一次剪辑后留下的样本
29
近邻法
重复剪辑近邻法
第三次剪辑后留下的样本

36
近邻法
压缩近邻法
基本方法:
• 将样本集XN分为XS 和XG ,开始时XS 中只有一个样本, XG中为其余样本
• 考查XG 中每个样本,若用XS 可正确分类则保留,否则 移入XS
• 最后用XS作最近邻法的比较样本集。
37
近邻法
压缩近邻法
算法步骤(Condensing算法):
1. 设置两个存储器,分别为STORE和GRABBAG,将第一个样本放 入STORE中,把其他样本放入GRABBAG中;
i1
如果
则 x m
5
近邻法
最近邻决策规则—k-NN
k的取值选择很重要! 6
近邻法
最近邻决策规则—k-NN
特点: 思想简单,计算方便 需要存储所有样本,每次决策都要计算待识
别样本与全部训练样本之间的距离并进行比 较,存储量和计算量都很大
7
近邻法 例子:
最近邻决策规则—k-NN
8
近邻法
最近邻决策规则—k-NN
主要内容
第一章 第二章 第三章 第四章 第五章 第六章 第七章
绪论 非监督学习方法 近邻法 线性判别函数 人工神经网络 贝叶斯决策理论 模式识别应用
1
第三章 近邻法
• 最近邻决策规则 • 推广—K近邻决策规则 • 改进算法

系统辨识第3讲

系统辨识第3讲

《系统辨识》第3讲要点第2章 随机信号的描述与分析2.5 白噪声及其产生方法(Why and How ?)2.5.1 白噪声的概念(Why )● 白噪声过程(一系列不相关的随机变量组成的理想化随机过程)相关函数:)()(2τδστ=W R 谱密度:+∞<<∞-=ωσω2)(W S● 近似白噪声过程谱密度:⎩⎨⎧>≤=002,0,)(ωωωωσωW S (0ω为给定的远大于过程的截止频率)相关函数:τωτωπωστ0002sin )(⋅=W R ● 讨论白噪声时,还要涉及到白噪声的概率分布,服从正态分布的白噪声称为高斯白噪声。

n 维白噪声:一个n 维随机过程)(t W 满足:⎩⎨⎧=+=+=)()}()({)}(),({0)}({τδττQ t W t W E t W t W Cov t W E 其中Q 为正定常数矩阵,则称)(t W 为n 维白噪声过程。

● 白噪声序列白噪声序列是白噪声过程的离散形式。

如果序列)}({k W 满足: 相关函数: ,2,1,0,)(2±±==l l R l W δσ 则称为白噪声序列。

谱密度:2)()(σωω==∑∞-∞=-l l j WW e l RS2.5.2 表示定理与成形滤波器● 表示定理(某些特定的有色噪声可以由白噪声输入线性系统而生成) 设平稳噪声序列)}({k e 的谱密度)(ωe S 是ω的实函数,或是ωcos 的有理函数,那么必定存在一个渐近稳定的线性环节,使得如果环节的输入是白噪声序列,则环节的输出是谱密度为)(ωe S 的平稳噪声序列)}({k e 。

● 成形滤波器表示定理中所涉及到的线性环节称为成型滤波器。

白噪声)(k w)(k e可以证明:如果)}({k e 的谱密度)(ωe S 是ωcos 的有理函数,那么一定存在一个成型滤波器,它的脉冲传递函数为:d d c c n n n n z d z d z c z c z C z D z H -------++++++== 111111111)()()( 且)(),(11--z D z C 的根都在z 平面的单位圆内。

《系统辨识第三章》PPT课件

《系统辨识第三章》PPT课件

(N+1)时刻的估计输出值
之差。
第五十五页,共161页。
55
递推公式基本形成,但其中涉及矩阵求逆运算,即 为了避免求逆运算,由矩阵反演公式: 令
第五十六页,共161页。
56
最后,加权最小二乘递推算法归纳如下:
在上列式中,令
,得最小二乘递推算法。
第五十七页,共161页。
57
二、初值的确定
进行递推估计,必须设定初值
由于最小二乘法比较简单实用,而且又可与其他辨识
方法相组合,因此最小二乘辨识是一种基本的、重要的辨 识方法。
第四页,共161页。
4
§3-1 最小二乘法
一、最小二乘辨识方程
用最小二乘辨识技术辨识系统的数字模型的原理方 块图如下:
被辨识系统
测量装置
D/A
A/D
计算机
(最小二乘辨识 算法)
数学模型
第五页,共161页。
但由于简单实用,仍不失为一种好的参数估计方法,
为了克服最小二乘法的不足,在最小二乘法的基础
上,发展了辅助变量法和广义最小二乘法,但计算
量较大。
第三十一页,共161页。
31
例3-2 设有下列二阶系统
输入序列 为振幅等于1的伪随机二位式序列, 噪声 为零均值且方差为 可调正态 分布随机数序列。试说明最小二乘估计精度。
5
被辨识系统
测量装置
D/A
A/D
计算机
(最小二乘辨识算法)
数学模型
设被辨识系统的脉冲传递函数为
第六页,共161页。
6
则当存在观测误差 及建模误差时,相应的差分方程:
式中, 称为方程误差, 为模型参数向量;若令 代 表真实参数向量,显然有

系统辨识 第3章 系统辨识输入信号

系统辨识  第3章 系统辨识输入信号
第3章 系统辨识常用输入信号
3.1 准备知识——随机过程
3.2 白噪声及其产生方法 3.3 M序列的产生及其性质
3.4 逆重复M序列的产生及其性质
3.5 辨识输入信号的要求
噪声 u(k)
对象
y(k)
测量噪声
测量
输入测量值
测量
输出测量值
测量噪声
系统辨识
辨识三要素: 数据、模型和准则
3.1 准备知识—随机过程
2
X - E{ X }
2

-
x - x
2
p( x , t )dx
( X (t ))
方差的性质
2
——标准差函数
2
( X ) E X
EX
2
a为常数时
2 (aX ) a 2 2 ( X )
2 ( X a) 2 ( X )

x

p ( , t ) d
pk P{X (t ) xk }
F ( x, t ) pk
xk x
1.2 随机变量及其分布
(2)二维随机变量的联合分布函数:
二维随机过程{X(t),Y(t)}在任意时刻t均可看作二维随机变量 连续随机变量 联合概率密度函数
p( x, y, t ) P X (t ) x, Y (t ) y
1.2 随机变量及其分布
随机事件的概率 ==> 随机变量的取值规律
(1)一维随机变量的分布函数: 随机过程{X(t)}在任意时刻t均可看作随机变量 连续随机变量 概率密度函数
p(, t ) P{X (t ) }
概率分布函数 F ( x, t ) P X (t ) x 离散随机变量 概率分布律 概率分布函数
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

{ } J
(θ)
=
1 2
E
⎡⎣e2
(k
)⎤⎦
=
1 2
E
⎡⎣ y(k) − ψT (k)θ ⎤⎦2
则有q(θ, Ωk ) = ψ(k) ⎡⎣ y(k) − ψT (k)θ ⎤⎦
{ } J (θ) = 1 E 2
⎡⎣z(k + n) − ψT (k + n)θ ⎤⎦2
利用随机逼近原理,可得参数估计的随机逼近
算法为
θˆ(k + n) = θˆ(k −1) + ρ(l)ψ(k + n)[z(k + n) − ψT (k + n)θˆ(k −1)]
k = 1, n + 2,2n + 3,"
2
3.2 随机逼近参数估计方法
2)随机逼近法参数估计 根据随机逼近原理,有
( ) θˆ(k) = θˆ(k −1) + ρ(k)q θˆ(k −1), Ωk
式中收敛因子ρ(k) ,必须满足收敛条件。
如果准则函数 J (θ)取为
{ } J
(θ)
=
1 2
E
⎡⎣e2
(k ) ⎤⎦
=
1 2
E
⎡⎣ y(k) − ψT (k)θ ⎤⎦2
Wolfowitz 给出了求回归函数ϕ(x)极值的迭代算法。
x(k +1) = x(k) − ρ(k) dy dx x(k )
如果式中收敛因子 ρ(k) 满足 Robbins-Monro 算法的条件(*),则 Keifer-Wolfowitz 算法是收敛 的,即 x(k)的收敛值将使ϕ(x(k))达到极值。
15
两两不相关。
3.2 随机逼近参数估计方法
4)差分方程的参数辨识
z(k) = ψT (k)θ + e(k)
式中
⎧ ψT (k)
⎪ ⎨
θ
=
[a1
⎪⎩e(k) =
= [−z(k −1)" − z(k − na )
" ana b1 " bnb ]T A(q−1)v(k) − B(q−1)s(k) +
ε
x(k (k )
例 已知系统差分方程为
y(k) = −0.18 y(k −1) + 0.784 y(k − 2) − 0.656 y(k − 3) + ε (k) z(k) = y(k) + v(k)
式中,ε (k)和v(k) 分别是均值为 0、方差为 1 和 0.25 的不相关随机噪声。采用随机逼近法和修正的随机 逼近法估计参数。(见教材 P144)
⎡σ ⎢
2 v
I
na
⎢⎣ 0
σ
0 I2
s nb
⎤ ⎥ θˆ(k ⎥⎦
−1)⎫⎪⎬, ⎪⎭
k = 1,n + 2,2n + 3,"
并证明了该算法在均方意义下是一致收敛的,即
{ } lim E
k →∞
⎡⎣θ0 − θˆ(k + n)⎤⎦T ⎡⎣θ0 − θˆ(k + n)⎤⎦
=0
19
3.2 随机逼近参数估计方法 4)差分方程的参数辨识
7
3.1 随机逼近原理
1) Robbins-Monro算法
Wolfowitz 还进一步证明,若ϕ(x)满足下列条件:
(1)

∫−∞
[
y

ϕ
(
x)
]2
dp(
y
|
x)
<


(2) ϕ(x) < c + d x , − ∞ < x < ∞ ;
(3)当 x < x0 时,ϕ(x) < a, 当 x > x0 时,ϕ(x) > a ; (4)对满足关系式0 < δ1 < δ2 < ∞的任意δ1和δ2 ,存 在 inf ϕ(x) − a > 0
Keifer-Wolfowitz 算法可直接推广到多维的
情况。
10
3.1 随机逼近原理
2)Keifer-Wolfowitz算法 考虑标量函数 J (θ)的极值问题。
如果θ 在θˆ 上使 J (θˆ) 为极值,则求θˆ 的迭代算法 为:
θˆ(k + 1) = θˆ(k) − ρ(k) ∂J (θ) ∂θ θˆ (k )
=0
可求出使 J (θ) = min 的θˆ 。
但是,在 e(k) 统计特性未知情况下,上式无法 求解。
3
3.1 随机逼近原理
如果用平均值来近似数学期望
{ } ∑ 则有 1 N N k=1
ψ(k) ⎣⎡ y(k) − ψT (k )θˆ⎦⎤
=0
∑ ∑ 可得θˆ
=
⎡ ⎢⎣
N k =1
ψ
(k

T
(k
⎤ −1 )⎥⎦

则参数估计的迭代方程可写为
θˆ(k) = θˆ(k −1) + ρ(k)ψ(k) ⎡⎣ y(k) − ψT (k)θˆ(k −1)⎤⎦
——随机逼近法参数估计的基本公式。 13
3.2 随机逼近参数估计方法
3)收敛因子的选取
θˆ(k) = θˆ(k −1) + ρ(k)ψ(k) ⎡⎣ y(k) − ψT (k)θˆ(k −1)⎤⎦ 一般情况下, ρ(k)随着k 的增加,需要有足够的
系统辨识
第三章 随机逼近法
主讲教师:郭毓 联系方式:025-84315872-306(o)
南京理工大学自动化学院
随机逼近法 ——一种应用广泛的参数估计方法
3.1 随机逼近原理 考虑模型参数辨识问题
y(k) = ψT (k)θ + e(k) 其中,e(k) 是均值为0的噪声。
{ } 选取准则函数
J (θ)
而 Keifer 和 Wolfowitz 用ϕ(x) = E{y | x} = α 来确 定回归函数ϕ ( x) 的极值。
如果回归函数ϕ(x) 存在极值,则ϕ(x) 取极值处 的 x 使的 dϕ(x) = 0 。
dx
9
3.1 随机逼近原理
2)Keifer-Wolfowitz算法 根 据 Robbins-Monro 算 法 , Keifer 和
∂J (θ) ∂θ θˆ(k −1)
其中, R(k) 是 Hessian 矩阵在θˆ(k −1)点上的近似形
式,在特定的准则函数下,它可以再用随机逼近法
来确定。
23
3.3 随机牛顿法
2)随机牛顿法(RNA)
利用随机牛顿法进行方程 y(k) = ψT (k)θ + e(k) 参 数的辨识。
假设取准则函数为
B(q−1) = b1q−1 + " + bnbq−nb ,
ε
(k
)
是均值为零,方差为σ
2 ε
的不相关噪声;
输入和输出数据对应的测量值为
⎧x(k) = u(k) + s(k)
⎨ ⎩
z(k)
=
y(k)
+
v(k)
式中 s(k )
和v(k)
分别是均值为
0、方差为σ
2 s
和σ
2 v
的不
相关随机噪声,且ε (k) 、s(k) 、v(k) 和u(k) 在统计上
17
3.2 随机逼近参数估计方法
4)差分方程的参数辨识 为了避免误差累计,算法中采用的数据必须是
互不相关的,或数据中所含的噪声e(k) 统计独立。 由e(k) 所具有的噪声特性知,如果每隔(n +1) 时
刻递推计算一次,则可满足e(k) 统计独立的要求。
收敛因子 ρ(l)必须满足收敛性条件,自变量l 可 取l = k −1或l = (k −1) / (n +1) 。
=
1 2
E
⎡⎣e2 (k)⎤⎦
=
1 2
E
⎡⎣ y(k) − ψT (k )θ ⎤⎦2
求 θˆ ,使 J (θ) = min 。
2
3.1 随机逼近原理
在{e(k )} 为零均值的独立随机序列的情况下,只 需求 J (θ)的一阶负梯度并令其为 0
{ } 即:⎡⎢⎣−
∂J (θ) ∂θ
⎤T ⎥⎦
=
E
ψ(k ) ⎡⎣ y(k ) − ψT (k)θ⎤⎦
1)问题的提出 为了加快收敛速度,可采用牛顿算法:
θˆ(k J (θ)
⎢ ⎣
∂θ 2
⎤ −1 ⎥ ⎦
∂J (θ) ∂θ
θˆ (k −1)
随机牛顿逼近法实质上是 沿着准则函数的二阶负梯 度方向搜索极小值点
式中 ∂2J (θ) ——Hessian 矩阵,它是对称阵,在递推
∂θ 2
记为ϕ(x) E{y | x},它是 x 的函数——回归函数。
假设:对于给定的α ,方程ϕ(x) = E{y | x} = α 有唯一解。
当ϕ ( x) 的函数形式和条件概率密度均未知时,
方程求解困难 ,可用随机逼近法求解。☺
5
3.1 随机逼近原理
随机逼近法就是利用变量 x1, x2,",及对应的随 机变量 y(x1), y(x2),",通过迭代计算,逐步逼近方程 式的解。
一般地, ρ(l) 随着 k 的增加要有足够的下降速 度,但 ρ(l) 又不能下降得太快,否则被处理的数据
18
总量太少。
3
4.2 随机逼近参数估计方法
4)差分方程的参数辨识 注意:利用随机逼近方法获得的参数估计是有偏的
(证明略) 相良节夫将偏差引入算法,给出了一种修正的随
机逼近算法
{ θˆ(k + n) = θˆ(k −1) + ρ (l) ψ(k + n)[z(k + n) − ψT (k + n)θˆ(k −1)] +
相关文档
最新文档