第5章(5.5.2)均方误差准则(MSE)和LMS算法

5.5.2均方误差准则（MSE ）和LMS 算法

引言：均方误差准则同时考虑ISI 及噪声的影响，使其最小化。

本节讨论问题： 1. 均方误差准则；

2. 无限长LMS 均衡器（C (z )，J min ）；

3. 有限长LMS 均衡器（C opt ，J min ）；

4. LMS 算法；

5. 均衡器的操作；

6. 递推LMS 算法收敛特性的分析。

一. 均方误差准则

信息符号的估计值：?k j k j

j I c ∞

-=-∞

∑v （无限长均衡器情况）

其中，接收数据样本为：k n k n k n f I η-=+∑v ，k η为白噪声。估计误差：?ISI k k k k

I I εε=-，包括及噪声定义：估计值2?[]k k

I J E ε=的均方误差为均衡器的性能指数。 }{k ηε

均方误差准则：使均方误差性能指数J 最小（min J ），此准则同时考虑使ISI 及噪声影响最小。

获得min J 的途径：调整{}j c ，当min J J =时，opt C C =(最佳抽头系数)

寻找opt C 的方法：1)根据正交性原理（线性均方估计）：*

[]0k k l E l ε-=，所有v 。（注：与ZF 准则不同的是，这里的输入是经过两个输入滤波器的数据样本k v ，这就包含了噪声）。即*?[]0kkl E l ε-=，所有I 。

2)求函数极值方法：令

?0=→=??opt k

C C 2013年5月3日星期五上午讲于此处，已经是第十次矣。

这两种方法是等价的，证明如下。

证明：求导置零方法与正交性原理等价。

?l i m K

j j k

K j j K

I c c

∞

--→∞

=-∞

=-==∑

∑v v

lim T k K →∞

=V c

假如均衡器为有限长，则

?T k k

I =V c 其中

11T

k k K k K k

k K k K v v v v v ++--+-??=??V ，以及 1

K K K c c c c c --+-??=??c 。

()2

??[][()()]k k k k k

J E E I I I I ε**==--c *

[()]T k k k E I ε=-V c

故

{}k k J E ε*

?=-?V c

另一种方法：

()2

*??[][()()] {()()}

[][][][]

k k k k k k i k i k j k j i

k i k k i j k k j i j k i k j i

J E E I I I I E I c I c E I c E I c E I c c E ε*****

--****----==--=--=--+∑∑∑∑∑∑c v v v v v v

*[][][][]k i k k i j k k j i j k i k j i

E I c E I c E I c c E ****----=--+∑∑∑∑v v v v

可见，()J c 是{}j c 的平方函数（二次型）。求导置零可得：

*0k k l j k l k j j

l J E I c E c **

---?????=-+=?????∑v v v 即， ***0, k j k j k l j l J E I c l c --???????=--=-∞<<∞???????????

∑v v

()()**

00k k i k k i E E εε--∴==，或v v ，i -∞<<∞

{}k k J E ε*

?=-?V c

k k K

k K k

k K k K v v v v v ++--+-??=??V

结论：求导方法与正交性原理是等价的，满足正交条件，就可以获得最小MSE 。

二、无限长LMS 均衡器（()min J z C ，性能）

1. 求()z C ：从正交原理出发，

()*

0k k l E ε-=v

(10-2-27)

即

[()]0k j k j

k l j E I c ∞

--=-∞

=∑v

即

()()

k -j

k -l k k l j c E E I ∞

-=-∞

=∑*v

v v （*）正交条件

注: k l -v 是收数据样本，其中的噪声已经白化。

在（*）式左边可以得到：

{}********

0 k j k l n k j n k j m k l m k l n m n m k j n k l m k j k l n m n m k j n k l m lj

E E f I f I E f f I I f f E I I N ηηηηδ*------------------????????=++????????

????????=+??

=+∑∑∑∑∑∑v v

式中利用了[]0k n k n k k n

f I E ηη-=+=∑，v 。

注：j k jk j k kj j k ,)(δδδδδ==-==-都是Kroenecker 冲激或离散冲激的不同写法。因此我们有：

***

,00[]k j k l n m n m l j lj m m l j lj n

E f f N f f N δδδ--+-+-=+=+∑∑∑v v

n n l j

lj n f f

N δ+-==+∑0 0,

l j lj x N l j L

else δ-?+-≤?=??? (A)

注：()()(1/)X z F z F z **=，()1F z **-代表了()F z 序列的共轭颠倒序列。或者说

()1F z **-代表了()F z 的MF(零时延)。

()()(1/)X z F z F z **=

()101L L f f z f z --=++

1110()L L L L L z f f z f z f z **-*-+*--??++++?

000

L i

i j i

L j

L j i j i j z

f z -*

-*----======∑∑∑∑

i j i

L j i j z

f z *---===∑∑

L L

n i i n i n f f z *-===∑∑

L L

l n l n l L n f

f z

*-+=-==

∑∑（注：令l i n =-）故

l n n l n x f f +==∑，其支撑为：L l L -≤≤

或者说，可以得到

L k

k n n

k l l l k n n k

n n k l

n n x f f

f f f f f f

f f ----+++===*====∑∑∑∑

也可以写为

j l j l L n j

l n n L

n j

l n n x f

f f

---=-+=-+==

∑∑)

（*）式右边：

,*******

, 1

(){[]}{}{}k k l n k k l k n k l n k l n k k l n k k l n

c c E I E I f I f E I I E I δηη---------==+=+∑∑v

式中，,,10k k l n l n n l n l

δδ---=-?==?≠-?，当，当

由此可得

{}** , 0

l k k l

f L l E I --?-≤≤=??v (B)

将（A ）、（B ）两式代入（*）式：

*0[]j

l j

lj l j c x

N f δ∞

--=-∞

+=∑

上式就是: *

0l l l l c x N c f -?+=

取Z 变换： ()()110[()]()C z F z F z N F z **-**-+= (10-2-31)

则MMSE 均衡器 ()11

0()

()()F z C z F z F z N **-**-=+ (10-2-32) 等效MMSE 均衡器： ()()100

()()C z F z F z N X z N **-'=

=++

(10-2-33)

I ^

()

z C '

2. 求min J （最小均方误差）（1）时域

2*****?[][()][][]k k k k k k k j k j

J E E I I E I E c εεεε-==-=-∑v 利用正交原理第二项为零，所以

2**min ?[()][][()]k k k k k j k j

J E I I I E I E I c -=-=-∑v *

[]j k j k j j j

c c E I c c f --=-=-∑∑v （利用(B)式）

令信息符号的平均功率为1，则

[]1k c E I ==

min 0

11j

j l l

l j J c

f c f ∞

-==-∞

=-?∑

（2）频域

通过z 变换及令，T j e z ω=将min J 式的{}关系变换成n f J ~min

()

()关系ωωH e X J T j ?~min

全传输系统响应：{}()()()0

N z X z X z B b n +=? (10-2-35)

以z 反变换（留数法）求：

()112n-n c

b B z z dz j

π=

()()()1001122c

X z b B z z dz dz j

z X z N ππ-∴=

+????

(10-2-36)

j T z e T

ωπ

ω=≤

令，且，

()

()()()

()00

2 2j T T

j T j T j T T j T

T j T

X e b e e jT d j X e N X e

d X e

ωπ

ωωπωωπ

ωω

πω

---

??+=

+?? (10-2-37)

代入 min 01J b =-，得

()0

m i n 0

2T j T

N T

J d X e

ωωπ

将()j T X e ω以信道折叠谱表示。因为

()()()

k t kT

x x kT h t h t *===?-

()()h t h t *?-的傅里叶变换为2

()H ω，故

12()FT

k k n n x t kT H T T πδω∞

∞=-∞

=-∞??-←?→+ ???∑∑

又

22()()()j ft j fkT k k k k k k k FT x t kT x t kT e dt x e DTFT x ππδδ∞

∞∞∞

--=-∞=-∞

=-∞-∞??-=-==????∑∑∑?

所以

()2

12 j T

n n X e H T T T ωππωω∞=-∞??=+≤ ?

??∑， (10-2-18) 所以

min

for ISI 0

212T T

n T T

N J d n H N T T π

ωπ

πω-

∞

=-∞===?

?++ ???

?∑ (10-2-38)

所以，当ISI=0时， 0

min min 0

011N J J N =

<<+， (10-2-39) 因k k k I I ?-=ε，故?k k k I I ε=+,22?[||]||k k k E I E I ε=-，利用正交原理*?[]0k k l

E ε-=I ，易证：

222?||||||k k k E I E I E ε=+，即2min ?[]1k E I J =-。输出SNR: 2min

min

?[]1[]

k k E I J J E γε∞-=

(10-2-40)

三、有限长LMS 均衡器 (opt C ,

min J )

均方误差：()2

?[]K k k k j k j

j K J k E I I E I c -=-??

??=-=-????∑v {}k k J E ε*

?=-?V C

101T

K K K K c c c c c --+-??=??C 1

k k K

k K k

k K k K v v v v v ++--+-??=??V

I =

1、求opt C ：无限长均衡器

*0[]j

l j

lj l j c x

N f δ∞

--=-∞

+=∑

仿上面无限长均衡器的推导：根据正交条件：

[]

*0l K

j lj j

l j

f N x

c --=-=+∑δ

令0lj l j lj x N δ-??Γ=+??

则0 0,l j lj lj x N l j L δ-?+-≤?Γ=???，

其他

（注: l x 的支撑为l L ≤。）

令 *

00 l l f L l ξ-?-≤≤?=???，

，

其他

得

∑-==Γ

j l lj

c ξ （10-2-43）

矩阵形式：ΓC =ξ （10-2-46）

所以， 1opt -=C Γξ （10-2-47）

说明：opt C , ξ为有)12(+K 个元素的列向量

Γ为(2K+1)×(2K+1)的Hermitian 矩阵。

因为自相关函数*k k x x -=且*lj jl δδ=，所以ij ??=Γ??

Γ中元素满足*

ij ji Γ=Γ。Γ是共轭转置阵（Hermite ）阵。

2、求均衡器的性能即求最小能达到的均方差min J ：前已经证明min 1j

j j J c

f ∞

-=-∞

∑

将opt C 代入()K J min 式：

1min ()111j j opt j K

J K c f **--=-''=-

=-=-∑

ξC ξΓξ (10-2-48)

注：j f 的支撑为0j L ≤≤。

工程实用方法：采用简单的迭代过程——最速下降法。

四. LMS 算法：

内容: a)算法：k k k G C C ?-=+1 (理论算法)

b)梯度： ()k k k k

dJ E d ε*

=-G V C c) 工程实用算法：1??k k k k ε*++?C =C V d) 均衡器结构：图11-1-2

1、算法：LMS 算法是一种最陡下降法，其实质是一个迭代过程，而迭代过程是通过递推运算来进行的。设{}j c 有（2K +1）个抽头

递推运算： ()()()K K j k c k c k c j j j ，，，，

0 1-=+=+δ 每次迭代变化量： ()()k G k c j j ?-∝δ 令 ()()k G k c j j ?-=δ 则 ()()()k G k c k c j j j ?-=+1 或矩阵形式： k k k G C C ?-=+1，

式中?为调节阶距（步长）注：可以看到

()()

()K K j k G k c k c j j j ，，，，0 1

1-=?-=-+，

即强制要求抽头系数向着误差下降的方向变化。则 ()()()k G k c k c j j j ?-=+1 或矩阵形式： k k k G C C ?-=+1，

式中?为调节阶距（步长step ），其中第k 符号时间的抽头系数列矢量（即

均衡器）为：

101()()

()

()()T

k K K K K c k c k c k c k c k --+-?

?=??C

,j opt j j ()()()

曲线的梯度次迭代时，为第j j j c J k k dc k dJ k G ~=

2、梯度：

{}k k k k

dJ E d ε*

=-G V C

{}k k k k

dJ E d ε*

=-G V C 11T

k k K

k K k

k K k K v v v v v ++--+-??=??V

讨论：1)理想情况下，经过若干次迭代（时0k k =），

0min

{}0()opt k k k

E J k J ε*

=??

=-=??

=??C C G V

2)实际情况中，计算k G 困难

*[]k k k E ε=-G V 统计平均, 不实时

为克服这一困难，用估计值k

G ?取代梯度真值k G *

[]k k k E ε=-G V

对k G 的无偏估计有：?{}k k E =G G 则

k k V G *?ε-= k G 为梯度真值，k

G ?为真值k G 的无偏估计量。

3. 工程实用LMS 算法：

k k k G C C ???1?-=+ (11-1-9) 即 *1??k

k k k V C C ε?+=+ (11-1-11) 或 k

k k k V C C *1??ε?+=+

在商用的自适应均衡器中，为简化乘法运算次数，仅取k v 和（或）k ε的正负号进行运算，而不管大小。其优点是简单，易实现，运算次数少；缺点是收敛慢。如：

()()()()

1csgn csgn j j k k j c k c k v ε-+=+? (11-1-14)

定义复符号函数：()()()()

()()()()()()()()()1 Re 0Im 01 Re 0Im 0csgn 1 Re 0Im 01 Re 0Im 0j x x j x x x j x x j x x ?+>>?

->??

--<

，

(11-1-15)

4. 均衡器结构

图11-1-2 基于MSE 准则的线性自适应均衡器

五. 均衡器的操作过程 1. 方框图

2. 两种工作模式（状态）

（1）训练模式（training mode ）: k

k k I I ?-=ε （2

）工作模式（run mode ）: k k k I I ?~-=ε, 2

10-

，即使有错判，由于?很小，由此引起的误调整影响很小。

3. 步长?选择与收敛特性

训练时：1? 1?大—加速初始调整，接近m i n J 工作时：2? 2?小—稳态误差小，m i n J J ≈ 步长?选择考虑：●稳定且收敛快

● 稳态MSE 小

六. 递推LMS 算法收敛特性的分析

1、引言

说明三个问题：要解决什么问题；分析从何入手；分析的方法。（1）算法表示理论上LMS 算法： k k k G C C ?-=+1，（A ）

实用的递推算法：

*1??k

k k k V C C ε?+=+ （B ）

梯度向量有噪无偏估计值：*?k

k k V G ε-= （2）问题

● 收敛特性与?的关系？ ● 如何选择?，以确保收敛？

因为{}

k k E G G ?=，即k

G ?为真值k G 的无偏估计，所以，?对收敛特性的影响，对（A ）（B ）两式是相同的。为数学分析方便，我们只研究（A ）式的收敛特性。

（3）收敛特性的分析方法

采用反馈系统稳定性的分析方法：

● 建立以1+k C 输出的闭环系统模型，定性分析?的影响； ● 建立系统的差分方程，定量分析?的影响。

2、闭环系统模型——定性分析收敛特性

算法： 1k k k +=-?C C G （A ）

式中， ()k k k =--G =ΓC -ξξΓC （B ）

Γ－接收信号自相关矩阵，由[]k j k l E v v *--确定。

ξ－互相关矩阵，由[]k k l E I v *-确定。

分析：由（A ）式可看出

（1）k C 的迭代过程可以看作：每次迭代增量(k k δ=-?C G )的累积过程

—由保持器实现；

（2）第k 时刻计算的增量(k -?G )应在第(k+1)时刻反映出来

—由延迟(Z -1)来实现。

结论：对闭环输出1k +C 收敛特性影响因素：, ?Γ

3、系统的差分方程——定量分析收敛特性

由(A)式 1=()k k k k k +=-?-?C C G C ΓC -ξ

得

1()k k +=-?+?C I ΓC ξ （A '） (11-1-20)

为一阶差分方程组，即

1(21)k k C I C K ξ+????????

????????=-?Γ

+?+?????????????????????

??????

因为Γ不是对角矩阵，故，（2K+1）个一阶差分方程是相互耦合的，必须联解。所以，用解联立方程组来定量分析收敛特性是困难的。解决方法：利用线性变换（酉变换）来解耦。

①Γ为Hermite （厄米特）矩阵，可用U (酉矩阵)表示为

*'=ΓU ΛU (U -1) (11-1-21)

N λλλ?????

?=?????

Λ 式中，U (酉矩阵)由Γ的特征向量确定。

Λ(对角矩阵)的对角元素为Γ的特征值，特征值{}i λ为特征方程

0λ-=ΓI 的根。

②再利用U 矩阵的性质： *'=U U I (U -2)

③将(U -1)式代入(A ')式，两边再乘*'U ，然后利用(U -2)式，可得 1()k k +=-?+?ξΛC I C (11-1-22)

式中， 11

k k k k *++**'?=?

'=??'=?

C U C C U C ξU ξ

1 ()

()

() k k k k +=-?+

?ΛC I C ξ

信道特性反映迭代生不迭代而化的化量与与有产随变变无关关

说明：(1)因为Λ为对角矩阵，所以一阶差分方程组是线性不相关的（即解耦）。

(2) 收敛特性取决于其齐次方程组：

1()k k +=-?C I ΛC (11-1-23)

即表示成（2K+1）个一阶差分方程组：

,(1),()0,(1)0,()0

,(1),()111K k K k K

k k K k K k K C C C C C C λλλ-+--++????

-??????

??????

?????????=-????

??????

????

???

??-??

?????

可见，（2K+1）个{}i λ与（2K+1）个{}i C 对应。对第j 个抽头系数C j 的差分方程为

,(1)

,()(1)j k j j k C C λ+=-?

,,0,

,0,1,2,

j K K k =-=

其相应的闭环系统模型为：系统函数为：

1(1)j z λ---?

令11(1)0j z λ---?=，得极点：1j z λ=-? 要使迭代过程收敛，应使极点在单位圆内，即

11j λ-?< (11-1-24)

即，

111j λ-<-?<

,()

j k C ,(1)

j k C +

又因为{}j λ为Γ的(2K+1)个特征值；而Γ为自相关矩阵、Hermite 型、正定

的，因此，0 ( )j all j λ>，则 2

又因为各抽头用统一的步长?，为保证稳定收敛，以max λ确定?。

因此，若步长?满足：max

0λ

，

则递推算法是稳定的，收敛的。式中，max λ是Γ的最大特征值，其上界为 max ,00trace (21)(21)()K

j j j K

K K x N λλ

=-<

==+Γ=++∑Γ

,0,000(21)(), all j j K x N j Γ=Γ=++

4、收敛特性的分析

（1）收敛特性～?

在满足稳定递推运算条件下（即max

0λ

），

??↑?↑?

?↑??

收速度差敛稳态误矛盾解决方法：分12 ??，

(一般21 /10 ??＝)。 LMS 算法的优点：简单，各抽头用同一个?。

LMS 算法每次迭代时，一个抽头做两次计算（一次乘法，一次加法），

则N 个抽头（这里N=2K+1），每次迭代计算量为2N+1≈2N 。

LMS 算法的缺点：收敛慢。

因为按max λ确定?，牺牲了大多数抽头乃至整个系统的收敛速度。

（2）收敛特性～λ（max λ，min λ）

收敛速度～max

min λ

λ??

???

比值有关。

若max

min 1λλ??

→ ???

，选择适当的Δ，可快速收敛。

若max

min

1λλ??

>> ???

，收敛慢。 (3) 收敛特性～信道频率响应()C f 的关系 ~~~~()j n x f C f λΓ

对有深度衰减的信道，max

min 1λ

λ??

>> ???

，收敛慢。