一种新型认知无线电信道状态的预测算法 (1)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第31卷第5期2010年9月华侨大学学报(自然科学版)
JournalofHuaqiaoUniversity(Natural
Science)
VoI.31
No.5
Sep.2010
文章编号:1000—5013(2010)05-0521—05
一种新型认知无线电信道状态的预测算法
黄川1”,郑宝玉1
(1.南京邮电大学信号处理与传输研究院。江苏南京210003;
2.福建师范大学数学与计算机科学学院,福建福州350007)
摘要:基于部分可测马尔科夫决策过程(POMDP)模型,结合认知无线电频谱侦测技术,提出一种新的多无
线电多信道环境下认知无线电检测信道算法.该算法通过对信道状态历史信息的分析,推导出信道信念状态
的初始分布和转移概率;然后,以此选择出具有最佳回报的信道以供接入,使得次用户能获得最佳带宽回报,
从而达到提高信道利用率的目的.仿真结果表明,算法获得相对于传统认知无线电频谱接入方式更高的信道
带宽,并接近无漏检和虚警现象的理想情况,有效地提高了信道利用率.
关键词:认知无线电;多无线电;多信道;马尔科夫模型;频谱侦测
中图分类号:TN014;TN914.4文献标识码:A
新兴的认知无线技术为解决非授权用户有效利用闲置频谱,提高频谱利用率提供了可能[1].然而,
由于网络的未知性,使得次用户很难获得不同信道的精确状态,而必须依据当前的不完全状态信息做出
决策.因此,对网络的未知性采用部分可测马尔科夫模型(POMDP)建立信道状态信息模型,并以此做
出选择最佳信道的决策具有合理性[2。39.文[z-1提出了一种基于POMDP模型的认知MAC(Media
Ae-
cess
Contr01)协议,解决了异构网络中信道选择决策问题.文[3-1在文[2]的基础上,提出更为具体的以
POMDP模型为基础的频谱检测策略、信道选择决策,以及接人策略的联合优化方案.上述研究仍存在
着两个问题:其一是信道状态间的转移概率是事先给定的,无法根据实际情况变化;另一个是只有一个
无线电收发器,使得用户不得不经常中断数据传输过程转而检测授权用户(或称为主用户)是否出现,从
而浪费信道带宽.针对上述问题,本文通过建立以POMDP模型为基础的多无线电系统[41模型,提出一
种与认知无线电频谱侦测技术相结合的在异构网络环境下的新型信道状态预测算法.
1
异构网络环境及多无线电系统模型
假设网络中每个次用户配备两个独立的,具有认知无线电功能的无线电收发设备.当次用户从网
络A向不同的网络B移动时,其中一个无线电保持与网络A的连接,称为工作无线电;而另一个无线电
处于认知侦测状态,则称为观测无线电.由观测无线电侦测结果组成的信道状态历史信息,由离散观测
时间序列DT内的一系列行为a、回报r、观测状态z和应答状态是的序列h组成.即
h={(口1,rl,z1,k1),…,(口f,rt,Zt,kf)),t∈DT.
(1)
假设在网络B中存在N(O<N<oo)个独立授权信道,每个信道在某~个时隙t内处于空闲(1)或
忙(o)状态,则网络在某个时隙t内的信道状态为
S(£)一Isl(£),…,SM(£)].
其中:M=2N,且si(£)一s1(£)…5N(£),sj(f)∈{0,1),每个信道的带宽表示为W蹦,J—l,…,N.由于环
境的未知性,设次用户可侦测到的信道数目,z≤N.
收稿日期:
通信作者:
基金项目:2009—・11—・29郑宝玉(1945一),男,教授,博士生导师,主要从事无线通信与网络信号处理的研究.E-mail:zby@njupt.educfL国家自然科学基金资助项目(60972039)
万方数据
华侨大学学报(自然科学版)
2010拉
2典型的POMDP模型
一个典型POMDP模型可用六元组表示为(S,A,丁,R,Z,0)[51.其中:S为系统中有限信道状态集
合;A为次用户采取的有限行为(观测,接人)的集合,用A={口。,口。)表示;丁表示当前信道状态s在行
为a的作用下变为5’的转移函数,记为T(s,12,s7);R为瞬时回报函数,记为R(s,口);Z为用户对系统状
态的有限观测状态集合;0为观测函数,记为O(s7,口,z).此外,ki(£)∈{0,1)表示次用户在执行行为口
后得到的应答.此处,设应答是无错的.
由于S是未知的,采用信念状态空间B来表示信道状态的概率分布,有
B一{b2∑6(s)一1.0,Vs∈S,6(s)≥o).
sffS
其中:6(s)表示信道处于状态s的概率.根据Bayes法则,可得在£+1时隙信念状态更新的表达式为
≥:T(s,口f,s’)0(s7,口l,2件1)6I(£)
6件1。,)““m衙p。,)一袁怎五万厨瓦了而‘
Q’
j∈Sj∈S
对于任何时隙£,信念状态是一个充分统计量[6],从而表明不会有任何历史信息可以增加次用户的
回报.同时,定义次用户得到的瞬时回报为空闲信道的带宽为
RB(6,口)=∑b(s)R(s,口)=∑∑b(s=1)MB小
(3)
策略1l"表示次用户在当前信念状态b的情况下,使用策略丌从而选择行为a.解决一个POMDP问
题的目标是找寻一个最佳策略丌7,以使用户获得的总折扣回报达到最大值.即次用户所能获得的最大
信道带宽,用值函数表示为
V’(6)=maxlRB(6,口)+f芝:P(名Ib,n)V。(r(6,口,2))1.
(4)
aEA。
z∈Z
。
式(4)中:}为折扣因子,o<K1;P为条件转移的概率函数.
3信道预测算法及收敛性证明
以POMDP模型为基础的多无线电多信道,其信道状态预测算法(CSPA)可分为如下两个阶段.
(1)观测阶段.通过一段时间的观测,将获得的系统环境信息记录到^中,期间的执行接人行为仅为向
相应频段发送探测包,并未真正执行信道接入操作.(2)预测阶段.通过h,对信道的初始状态分布、状
态转移概率和观测概率进行估计,并利用启发式算法找出具有最大折扣回报的策略玎7,在接人时隙冻
用户按其接入.在预测阶段,对次用户来说,信道状态个数M是N的指数,要计算出最大折扣回报是很
困难的.然而,实际网络中的信道一般是独立的,有如下定理.
定理l假设n个独立信道,有A一卧l,.”,L],其中丸为信道i在某个时隙t开始时刻所处的状
态,则L是信道状态Si(£)的充分统计量.
证明参见文[63.
根据定理1,POMDP模型中信念状态空间B={b(Si(£)),i一1,…,以)可简化为B一{b(sk(£)),愚=
1,…,竹},从而信念空间维度由2”降为,z.对于每个信道i来说,其最大折扣回报表达式为
w(抚)=啦芋lRB(bi,ai)+菩∑P(麓Ibl,ai)W(r(6朋i,zi))I.
(5)
4ic“
zlEZ
式(5)中:RB(bi,12‘)一6(&=1)WB.i.对于次用户,则有
V。(6)=maxW(抚).(6)
f=1.…。n
对于在时隙t内的每一个信道,可设最为在时隙t内信道i状态为空闲的概率,即b(si(£)=1)=
鼠;而状态为忙的概率为b(si(£)一o)=1一B.在T个时隙中,信道i状态为空闲出现次数为yi,服从二项
式分布b(托;T,良).根据Bayes法则,晚对h的条件概率密度为
,T、
口(统)f‘矽}(1一侥)1、
厂(最I
I}1)=i——老}————~.
(7)
l口(房)1)舒(1一房)T_砖d谚
万方数据
第5期黄川,等:一种新型认知无线电信道状态的预测算法
523
式(7)中:q(阮)为夙的先验分布.对于次用户来说,信道i处于空闲或忙状态是等可能的,故先验分布q
(鼠)为[O,1]上的均匀分布,有
衙肛丽舅,(高1-Or丽-r,)・
(8)
用只对h的条件期望E{8I^)估计信道状态为空闲的概率,有
bi(si=1)=E{晚lh)=(嚣+1)/(T+2).
(9)
信道状态转移概率T(s,口,57)也是未知的.设砖/为信道i执行行为a后,状态从5转移到57的转移概
率.其中:s,57∈{0,1),向量Pi=(以/.,aEA,k=l,..・,I
S1).在T个时隙中信道i的状态从s到s7的转
移次数向量咖i=(鲑^,aEA,k=l,…,JSJ).在执行行为a条件下,只服从Dirichlet分布,(焦‘,…,
盟
髭/。)渐进等于Dir(娥/。,…,娥/。),其期望E(pi)2带.^/∑砖/。.
当信道状态转移后,向量∥i=啦+劈.j,.其中:l霹,/l=I
s
I,且撰,/[s7一力=1,其余为0.用期望值
估计转移概率,有
・L(5,口,5’)=识,/∑≯4’/.
(10)
在频谱侦测中,由于存在漏检和虚警现象,因此对于次用户来说,所观测到的信道状态并不一定与
信道真实状态相符.假设信道为AWGN,Pd为检测概率,Pt为虚警概率,且采用能量检测器的频谱侦测
方法[2],则有
A=P{Y>r
加=P{Y>r
(11)(12)由于信道真实状态的未知性,次用户可根据执行行为a后得到的应答信息k,来验证观测状态的正确与否,有fP,d,k,引-0,o∥,州):P(zs,,口):P(zI跏):{上_A’;2;21’.(13)pf'庀21’z2u’【1一加,忌=o,z=1,从而可求出次用户可获得的最大折扣回报.即y。(6)一Ⅲaxmax[b(si=1)WB.f+红.pdpg%b(si=o)+加pt:06(是=1)+Pf纯xb(sl=o)+A户aI‘,1i6(&一1)]V?(r(bi,口l,o))+匹(1一加)户敏ob(si—o)+(1一Pd)P奢06(乳=1)+(1一A)Pgjtb(si=o)+(1~pf)纠j16(si=1)]V,(r(6i,ai,1))].(14)(1)当k=z=0时,信念状态更新为rc6,n,z,=j石tj磊:li_:三—石j一=干={≥ij:;:j!ij号弓j芊?;考《:;ijij;!ij百歹-=Fi丽.(2)当足=z=1时,信念状态更新为r(6,口,z)=i了—:二j;:i目i焉:ji_:三—石j_;=-三{;;:!;!;jb!}=j;i?;i!写矛ji主:|j%ij—三:i5i一=;=.ji厕.(3)当惫=1,名一。时,信念状态更新为r(6,n,z)=j石tj磊:l;i}:三—6了一=;!i5曩:i:{!jij÷}{=i:;者三粪:i;i!;己了一=干i;丽.(4)当k=0,z一1时,信念状态更新为r(6,口,2)=i一=:j云了tj磊:苫i;:三1i};声亏姜笺丢E}鼍:尝;手f;=j;;=!三号考专{参主i:};毛三1iy:Fj看厕.))三糯.娅斫L一2L一2ⅣⅣ一
一
11
l
=
II
O
I
巩
巩
万方数据