CUDA架构下外辐射源雷达杂波抑制并行算法

CUDA架构下外辐射源雷达杂波抑制并行算法
CUDA架构下外辐射源雷达杂波抑制并行算法

收稿日期:2013-10-17 网络出版时间:2014-05-14

基金项目:国家自然科学基金资助项目(61372136)

作者简介:武 勇(1987-),男,西安电子科技大学博士研究生,E -mail :wu y on g xidian@https://www.360docs.net/doc/0916614720.html,.网络出版地址:htt p ://https://www.360docs.net/doc/0916614720.html, /kcms /doi /10.3969/j .issn.1001-2400.2015.01.017.html doi:10.3969/j .

issn.1001-2400.2015.01.017CUDA 架构下外辐射源雷达杂波抑制并行算法

武 勇,王 俊,张培川,曹运合

(西安电子科技大学雷达信号处理国家重点实验室,陕西西安 710071)

摘要:为了解决用于杂波抑制的直接矩阵求逆算法在外辐射源雷达工程应用中实时处理困难的问题,提

出了分段并行的直接矩阵求逆算法.充分考虑了直接矩阵求逆算法的特点,将整个运算块分解为多个规模

相同的子运算块,在计算统一设备架构下对这些子运算块进行并行处理,达到了提高算法处理效率的目

的.实验结果表明,在采样率为200kHz ,杂波对消阶数为128的条件下,与传统的串行处理算法相比,该算

法的运行效率提高了25倍,并成功用于某外辐射源雷达实时信号处理中.关键词:外辐射源雷达;杂波抑制;直接矩阵求逆算法;计算统一设备架构;并行

中图分类号:TN958 文献标识码:A 文章编号:1001-2400(2015)01-0104-08Parallel clutter su pp ression al g orithm for p assive radar in CUDA

WU Yon g ,WANG J un,Z HANG P eichuan,CAO Yunhe

(National Ke y Lab.of Radar Si g nal Processin g ,Xidian Univ.,Xi an 710071,China )

Abstract: In order to solve the p roblem that the direct matrix inverse (DMI )al g orithm for clutter

su pp ression can not be real -time p rocessin g in the p assive radar en g ineerin g a pp lication,a se g mented p arallel DMI al g orithm (called P -DMI )is p ro p osed.B y considerin g the feature of the DMI al g orithm,the entire o p eration block is broken u p into several identical sub -blocks,and in the Com p ute Unified Device Architecture,these sub -blocks are p rocessed in p arallel to achieve the p ur p ose of im p rovin g the p rocessin g efficienc y .Ex p erimental results indicate that this al g orithm s com p utation efficienc y is raised more than 25times com p ared with the traditional serial al g orithm when the sam p lin g rate is 200kHz and the clutter

cancelation order is e q ual to 128.Also,the method has been used in real -

time si g nal p rocessin g for p assive radar successfull y .Ke y Words: p assive radar;clutter su pp ression;direct matrix inverse;com p ute unified device architecture;

p arallel

外辐射源雷达属于双基地雷达的一种,其自身不发射电磁波,而是通过接收目标反射第三方照射源的电磁波来实现对运动目标的检测二定位和跟踪.外辐射源雷达的接收天线由主天线和参考天线两部分组成,主天线接收的信号包括目标回波二直达波二多径和噪声,参考天线接收的信号包括直达波二多径和噪声.在这种体制的雷达中,由于发射信号功率低以及收/发非协作的问题,使得接收到的目标回波强度远远低于直达波二

多径的强度,如果不设法消去这些强杂波,那么目标回波就会被淹没而无法被检测到[1].

因此,在对目标进行检测之前,必须首先对接收到的回波信号进行杂波抑制,以去除强杂波对目标检测的影响.最小均方法

(LMS )二递归最小二乘法(RLS )二直接矩阵求逆算法(DMI )以及它们的改进[2]是外辐射源雷达信号处理中常用的杂波抑制算法.其中,直接矩阵求逆算法的杂波抑制能力最强,但其所涉及的运算最复杂,这也是限制直接矩阵求逆算法在工程中应用的主要瓶颈之一,尤其是在对实时性要求较高的外辐射源雷达领域,这一问题

2015年2月

第42卷 第1期 西安电子科技大学学报(自然科学版)JOURNAL OF XIDIAN UNIVERSITY Feb.2015Vol.42 No.1

显得尤为突出.如何提高直接矩阵求逆算法的实时处理性能,是外辐射源雷达信号处理中亟待解决的关键问题之一.

自英伟达公司发布计算统一设备架构(CUDA )以来,基于图形处理器(GPU )的并行处理技术在信号处理领域得到了迅速的发展.文献[3]利用计算统一设备架构提出了高效的红外图像背景预测方法.文献[4]在计算统一设备架构之下,实现了格型最小均方算法的并行处理,并将其用于外辐射源雷达的杂波抑制中.文献[5]基于计算统一设备架构提出了一种用于合成孔径雷达(SAR )成像的高效处理算法,缩短了合成孔径雷达成像的响应时间.除此之外,在科学计算领域,基于计算统一设备架构的并行处理也获得了很好的应用[6-9].针对外辐射源雷达应用背景中,直接矩阵求逆算法存在的计算效率低二实时性差的问题,在计算统一设备架构下,结合图形处理器的硬件特点,充分挖掘了直接矩阵求逆算法的并行性,笔者提出了一种高效并行的直接矩阵求逆算法(简称P -DMI ).该算法将整个数据集划分为若干个子集,分别调度到图形处理器上进行并行处理,在保证杂波抑制性能的前提下,达到了实时杂波对消的目的.

1 并行直接矩阵求逆算法原理

并行直接矩阵求逆算法的主要思想为:首先将主天线和参考天线接收的信号分别划分为长度相同的若干个子段;然后将每个子段的回波信号投影到由对应的直达波信号及其延时构成的正交子空间中.由于真实目标回波和杂波(直达波和多径)之间存在多普勒频移,所以目标回波信号与杂波可以看做是相互正交的[10],即目标回波信号在其正交子空间的投影系数为零,而杂波在此子空间中存在一组不全为零的投影系

数,通过求解这组投影系数就可以将混杂在目标回波中的杂波对消掉.最后将杂波对消后的子段回波信号拼接成完整的剩余回波信号.首先根据式(1)对主天线和参考天线接收的信号进行分段:Bb =N ,(1)式中,N 为总的数据长度,b 为所分的数据段数,B 为每段数据长度.在数据分段后,所要对消的第i 段回波信号表示为

S sur i [=s sur [(i -1)B +1],s sur [(i -1)B +2], ,s sur [iB ]] ,

i =1,2, ,b .(2) 对应的第i 段参考信号为S ref i [=s ref [(i -1)B +1],s ref [(i -1)B +2], ,s ref [iB ]] .

(3) 由第i 段参考信号及其延时构成的正交子空间参考矩阵为V i =s ref [(i -1)B +1]0 0s ref [(i -1)B +2]s ref [(i -1)B +1] 0???s ref [iB ]s ref [iB -1] s ref [iB -K +1é?

êêêêêêù?úúúúúú] ,(4)

式中,K 表示杂波对消阶数.杂波在正交子空间的投影系数通过求解如下优化问题得到:w i =ar g m in w i S sur i -V i w i 22

,(5)式中,四

2表示2范数.式(5)既是一个最小二乘问题,也是一个二次凸优化问题,因此,式(5)所述问题可以转化为求解S sur i -V i w i 22的梯度等于零的问题,即

?S sur i -V i w i 22

?w i =2V H i (S sur i -V i w i )=0 .(6) 对上式进行简单的移项化解后,易得第i 段回波信号的投影系数为w i =(V H i V i )-1V H i S sur i .(7)

经过与原始回波信号对消后,第i 段信号的剩余信号可表示为C i =S sur i -V i w i ()

501第1期 武 勇等:CUDA 架构下外辐射源雷达杂波抑制并行算法

最后将各个子段的对消结果按顺序拼接起来,

即可得到完整的剩余信号,即C =[C 1,C 2, ,C b ] .(9)

2 并行直接矩阵求逆算法实现

2.1 并行直接矩阵求逆算法总体实现

在计算统一设备架构下,中央处理器(CPU )

和内存统称为主机端,图形处理器和显存统称为设备端.主机端主要负责任务分配二资源调度以及一些逻辑运算,而设备端主要对数据密集型的任务进行处理.在设备

端运行的函数称为核函数[11].计算统一设备架构的一般处理流程包括:任务划分二资源分配二资源调度二任务执行二资源释放.由第1节的公式推导可知,将完整的接收信号分为若干个数据段后,对各段数据分别进行杂波对消.各个数据段之间的对消处理是相互独立的,而且每段数据的处理过程都是相同的,这就为实现并行二提高算法效率提供了可能.在并行直接矩阵求逆算法中,在主机端上进行数据划分,并给每个划分好的数据段预先分配一个任务流,即将数据段与任务流进行关联;在设备端上各个任务流负责执行该段杂波对消处理涉及到的所有运算,并将处理的结果在主机端上进行综合,得到完整的杂波对消结果.并行直接矩阵求逆算法的基本流程如图1所示

.

图1 并行直接矩阵求逆算法流程图

2.2 模块实现

2.2.1 大规模矩阵相乘并行化每个任务流在进行处理的过程中,运算量主要来自于大规模矩阵相乘,这部分的运算直接影响着算法的

6

01 西安电子科技大学学报(自然科学版) 第42卷

执行效率.为了提高求解大规模矩阵相乘的运算速度,根据计算统一设备架构的特点,首先对大规模的矩阵进行分块,然后采用分块相乘的方式来提高大规模矩阵相乘的并行度,进而提高算法的处理效率.下面以方阵相乘为例对分块矩阵相乘进行说明.设A 二B 二C 均为M 阶方阵,

现欲求解如下矩阵相乘问题:AB =C .(10)基于方便推导的原则,令M =kL .为了高效求解如上问题,对矩阵A 二B 分别进行子阵划分,

子阵的阶数为L ,划分结果为

A =Λ11Λ12 Λ1k Λ21Λ22 Λ2k ??

?Λk 1Λk 2 Λé?êêêêêêù?úúúúúúkk , B =B 11B 12 B 1k B 21B 22 B 2k ???B k 1B k 2 B é?êêêêêêù?úúúúúúkk .(11)进行子阵划分后,矩阵A 二B 相乘的结果为

C =ek i =1Λ1i B i 1ek i =1Λ1i B i 2 ek i =1Λ1i B ik ek i =1

Λ2i B i 1ek i =1Λ2i B i 2

ek i =1Λ2i B ik ???ek i =1Λki B i 1ek i =1Λki B i 2 ek i =1Λki B é?êêêêêêêêêêù?úúúúúúúúúúik =C 11C 12 C 1k C 21C 22 C 2k ???C k 1C k 2 C é?êêêêêêù?úúúúúúkk .(12)式(12)就是分块矩阵相乘的最终形式.相比于传统的逐点相乘,按块相乘可以最大程度地利用硬件的计算资源,降低相乘运算的时间开销.在并行直接矩阵求逆算法的实现中,当涉及到大规模的矩阵相乘时,首先对两个矩阵进行子阵划分;然后由一个线程块负责其中两个子阵的相乘,不同线程块是并行进行处理的,线程块

中的每个线程负责对应位置的元素计算.在存储优化方面,在相乘过程中,由于两个子阵中的元素要多次用

到,因此将这两个子阵的元素存储于共享内存,而共享内存的访问速度几乎和访问寄存器一样快[12],这样可以有效地提高矩阵相乘的并行效率.另外,为了防止出现对共享内存的访问冲突,使用计算统一设备架构模

型中的s y ncthreads ()进行数据同步.2.2.2 矩阵求逆并行化

随着杂波对消阶数的加大,复数矩阵求逆的运算量会迅速增长.在这种情况下,矩阵求逆就会成为算法的计算瓶颈(矩阵求逆常用的方法有高斯消元法二QR 分解法二LU 分解法等).为了克服这一瓶颈,笔者在计算统一设备架构上对高斯消元法进行了并行加速.高斯消元法借助单位矩阵,通过迭代的方式完成矩阵求逆,每次迭代均包括归一化二消元操作.前后两次迭代过程具有耦合性,因此无法进行并行处理.然而,在每次迭代中,对各个元素的操作是相互独立的,根据这种独立性,对每次迭代进行并行处理,以加速矩阵的求逆过程.对于n 阶矩阵A 和单位矩阵I ,第i 次迭代过程为:第1步,获取矩阵A 第i 行的归一化主元a ii ;第2步,对矩阵A 和I 的第i 行元素进行归一化操作,这

一步可通过开辟一维的线程格二线程块,使第i 行的所有元素并行完成归一化操作,

其中,每个元素与一个线程对应;第3步,获取矩阵A 第i 列的所有元素;第4步,通过二维线程格二线程块的并行,对矩阵A 和I 除第

i 行以外的所有元素进行消元操作.重复以上步骤n 次就可以得到矩阵A 的逆矩阵.矩阵求逆的计算统一设备架构实现分为线程块和线程两级并行.线程块并行属于不同数据块之间的并行,每个线程块负责一个数据块中所有元素的更新,这种并行是粗粒度的,而线程级并行则属于同一数据块中不同元素的细粒度并行.在归一化和消元操作中,同一线程块中的不同线程需要频繁地调用归一化主元和

消元因子,因此将这些元素放在共享内存中,以提高存储带宽;在开辟线程格和线程块时,将线程块的大小设701第1期 武 勇等:CUDA 架构下外辐射源雷达杂波抑制并行算法

为256,可以使硬件的设备利用率达到最优.

3 性能分析

3.1 计算复杂度

在这一节中,

笔者对并行直接矩阵求逆算法的计算复杂度进行了分析,并与直接矩阵求逆算法进行了对比.由于每段处理的计算复杂度均相同,因此仅针对一段进行分析.并行直接矩阵求逆算法的运算量包含5个部分:自相关矩阵计算二自相关矩阵求逆二互相关矩阵计算二权值计算以及剩余信号的求解.其中自相关矩

阵计算的运算量为K 2B ,矩阵求逆的运算量为K 2lo g K [13],互相关计算的运算量为KB ,权值计算的运算量为K 2,剩余信号求解的运算量为KB ,则每段所需的总运算量为K 2B +2KB +K 2+K 2lo g K .因此并行直接矩阵求逆算法的计算复杂度可表示为

C P -DMI =b (K 2B +2KB +K 2+K 2lo g K ) .(13) 以上计算过程仅统计了复乘运算,

忽略了复数加减运算.按上述计算方法易得直接矩阵求逆算法的计算复杂度为

C DMI =(K 2+2K )N +K 2+K 2lo g K . 为了获得C P -DMI 与C DMI

之间的关系,联立式(1)与式(13),整理化解后,式(13)可化为如下形式:C P -DMI =K 2

N +2KN +N B K 2(1+lo g K )=K 2+2K +K 2(1+log K )é?êêù?úúB N .(14)比较C P -DMI 与C DMI 可知,并行直接矩阵求逆算法的计算复杂度与直接矩阵求逆算法同阶.3.2 空间复杂度

空间复杂度是对算法在执行过程中所占存储单元多少的度量.在本节中,笔者统计了并行直接矩阵求逆算法的空间复杂度,并与直接矩阵求逆算法进行了对比.统计过程与3.1节的描述类似,以并行直接矩阵求逆算法中一段数据的处理为例.回波信号需要的存储单元个数为B ,子空间参考矩阵需要的存储单元个数为

KB ,自相关矩阵计算和求逆共需要2K 2个存储单元,互相关矩阵计算需要K 个存储单元,权值计算和剩余信号求解共需K +B 个存储单元,则处理每段数据所需的存储单元总量为2B +KB +2K 2+2K .因此,并行直接矩阵求逆算法的空间复杂度可表示为S P -DMI =(2B +KB +2K 2+2K )b =(2+K )N +2K (K +1)b .(15)按上述方法可得直接矩阵求逆算法的空间复杂度S DMI =(2+K )N +2K (K +1).比较S P -DMI 与S DMI ,可得它们之间的关系为S P -DMI =S DMI +2K (K +1)(b -1) .(16)由上式可知,并行直接矩阵求逆算法需要的存储单元总量略大于直接矩阵求逆算法.然而,在外辐射源雷达

的应用中,Kb ?N .以N =200000,K =48,b =2为例,并行直接矩阵求逆算法共需要9.5457MB 个存储单

元,直接矩阵求逆算法共需要9.5412MB 个存储单元,它们之间仅相差0.0045MB 个存储单元,

相比于两种算法各自所需的存储总量,这种差别是可以忽略不计的.因此,在外辐射源雷达的应用背景下,两种算法的空

间复杂度近似相等.3.3 性能改善限制因素和算法应用性分析

本节对限制并行直接矩阵求逆算法性能改善的主要因素和算法应用性进行了分析.并行直接矩阵求逆算法的性能由杂波抑制能力和计算效率两部分组成.杂波改善因子是评价算法杂波抑制能力强弱的主要标

准,其定义如下:R (γ)=10l g (P 1P 2) ,P 1=es 2 , P 2=ef 2 {,(17)

式中,四为求模运算,γ为杂波改善因子,s 和f 分别表示杂波抑制前后的回波信号,P 1及P 2为对应的信号功率.杂波改善因子越大,算法的杂波抑制能力越强.在以下的应用中,接收到的回波信号主要由杂波二噪声和真实目标构成,因此,原始回波信号的总功率可表示为这种信号的功率之和,即8

01 西安电子科技大学学报(自然科学版) 第42卷

P 1=P c +P n +P s .(18) 经过杂波抑制后,

回波信号中仍然存在少量的残余杂波,因此,杂波抑制后的回波信号总功率可表示为P 2=P cr +P n +P s ,(19)式中,P cr

表示残余杂波的功率.将式(18)和式(19)代入式(17),可得R =10l g P 1P ?è???÷2=10l g P s +P n +P c P s +P n +P ?è???÷cr <10l g P s +P n +P c P s +P ?è???

÷n .(20) 在外辐射源雷达中,

杂波信号的强度一般比目标信号高60dB 以上,噪声信号的强度比目标信号高20dB 以上[10].与噪声相比,目标信号的功率可忽略不计;与杂波相比,噪声和目标信号的功率均可忽略不计.因此,上式可进一步化解为

R <10l g P s +P n +P c P s +P ?è???÷n ?10l g P c P ?è???

÷n .(21)由上式可知,杂波改善因子的上限不会超过回波信号中的杂噪比,即并行直接矩阵求逆算法的杂波抑制能力受制于回波信号中杂噪比的大小.计算效率是算法性能的另一种表征.根据图形处理器众核运算的特点,笔者设计了并行直接矩阵求逆算法,与传统串行执行的直接矩阵求逆算法相比,其计算效率的提升主要取决于图形处理器的工作频率二计算统一设备架构运算核心的数量以及所开辟线程块的尺寸.图形处理器工作频率和计算统一设备架构运算核心数量的乘积越大,并行直接矩阵求逆算法的计算效率就越高.线程块的大小需要根据具体的任务进行设置,256是理论上的最优尺寸.在并行直接矩阵求逆算法中需要构建一个参考矩阵,其所需的存储量很容易成为并行直接矩阵求逆算法在实际中应用的限制因素,这也是并行直接矩阵求逆算法存在的主要局限.由3.2节的分析可知,构建参考矩阵需要的存储量与信号采样率(代表数据长度)和杂波对消阶数的乘积成正比.假设每个存储单元占4个字节,在外辐射源雷达应用中,笔者选用调频广播电台作为照射源,信号采样率为200kHz ,杂波对消阶数为48,构建参考矩阵需要的存储量约为37MB ,而目前图形处理器显存的主流配置为2GB ,完全能满足该存储量的需求.当采用数字电视作为照射源时,信号采样率高达8MHz ,杂波对消阶数通常也在1000阶以上,设对消阶数为1024,则构建参考矩阵需要的存储量约为30GB ,显然,受图形处理器硬件资源的限制,并行直接矩阵求逆算法将不再适用.在此情况下,只能通过降低数据量的方式来缓解并行直接矩阵求逆算法的这种局限性,如将处理的数据长度由1s 变为0.1s ,但这又会为后续的目标检测带来性能损失.因此,在具体的应用中,对参考矩阵的存储量应予以特别关注.

4 性能验证

为了说明并行直接矩阵求逆算法的高效性,使用仿真数据和实测数据对该算法进行了验证.实验1 采用的硬件环境为HP Z820工作站,其中央处理器为Intel?Xeon E5-2620@2.00GHz ,内存为64GB ,图形处理器型号为Tesla C2075;操作系统为Windows7,并安装了Matlab R2008a 二Microsoft Visual Studio 2008和计算统一设备架构Toolkit 4.0.在该实验中,通过Matlab 产生所需的主天线和参考天线信号,然后分别使用并行直接矩阵求逆算法和直接矩阵求逆算法对仿真信号进行杂波对消.实验中使用

的参数为:观测时间T 为1s ,采样率f s 为200kHz ,对消阶数K 为48,输入杂噪比为40dB ,数据段数为2,重复实验次数为50.为了考查并行直接矩阵求逆算法的性能,将其与直接矩阵求逆算法进行了对比,性能评价所采用的指标

为杂波改善因子和算法加速比.其中,算法加速比指的是50次重复实验下直接矩阵求逆算法与并行直接矩阵求逆算法的平均处理时间之比.在主天线输入杂噪比一定的条件下,杂波改善因子越大,越有利于目标的检测,说明算法的杂波抑制性能越好.另外,在处理的数据长度一定的条件下,算法的处理时间越短,说明算法的效率越高.仿真实验的结果如表所示9

01第1期 武 勇等:CUDA 架构下外辐射源雷达杂波抑制并行算法

表1 实验结果对比

对消阶数K

直接矩阵求逆算法改善因子/dB 直接矩阵求逆算法平均耗时/ms 并行直接矩阵求逆算法算法改善因子/dB 并行直接矩阵求逆算法平均耗时/ms 4839.0978239.09476439.09128539.0957

12839.10329639.10124

由表1可以看出,

直接矩阵求逆算法与并行直接矩阵求逆算法具有相同的杂波抑制能力.当对消阶数为48时,

相比于直接矩阵求逆算法,并行直接矩阵求逆算法处理的加速比为17;当对消阶数为64时,并行直接矩阵求逆算法的加速比为22;当对消阶数为128时,该加速比达到了26.说明了并行直接矩阵求逆算法的处理更加高效,即并行直接矩阵求逆算法能以较低的时间代价获得相同的性能

.图2 对消阶数对处理时间的影响在实际应用中,算法本身的实时性以及数据扩展性对工程实现

具有重要的意义.下面分析了在对消阶数按步长5从30逐渐变化

到150阶的情况下,并行直接矩阵求逆算法和直接矩阵求逆算法处

理时间的变化情况,实验结果如图2所示.由图2可以看出,随着对消阶数的增大,并行直接矩阵求逆算法处理的时间变化缓慢,基本都维持在200ms 以下,显示出较强的

实时性.增大对消阶数就意味着处理数据量的加大,在数据量加大的情况下,对消处理的时间开销却没有显著增加,这也说明并行直

接矩阵求逆算法具有较强的数据扩展性.相比于并行直接矩阵求逆

算法,直接矩阵求逆算法的处理时间却显著增加,在对消阶数为60阶时就已经不满足实时性的要求.另外,在对消阶数从30变化到150的过程中,直接矩阵求逆算法处理时间的跨度达3s 之多,而并行直接矩阵求逆算法的时间跨度仅为0.14s.实验2 该实验的软硬件配置与实验1相同,所用数据来自外场试验的实测数据.参数如下:观测时间为1s ,采样率为200kHz ,对消阶数为48,目标个数为3.除了处理的数据不同之外,实际系统与实验1的其他实验条件(硬件平台,信号采样率等)完全相同.显然,在参数设置一定的条件下,算法的处理时间与其所处理的数据并不存在关联性,因此笔者提出的算法对实测数据的处理效率与实验1给出的结果相当.本实验着重对并行直接矩阵求逆算法的有效性进行了研究.首先将并行直接矩阵求逆算法和直接矩阵求逆算法对实测数据进行处理后的结果进行了对比,两者之间的相对误差如图3所示.由图3可以看出,两者之间的相对误差维持在0.3%以下,

因此可以认为并行直接矩阵求逆算法和直接矩阵求逆算法在处理精度上近似相同

.

图3 并行直接矩阵求逆算法和直接矩阵求逆算法的结果对比图4 实测数据距离维侧视图

为了进一步验证并行直接矩阵求逆算法和直接矩阵求逆算法之间的这种差异对目标检测是否会产生影响,最后将上述并行直接矩阵求逆算法对实测数据的处理结果继续进行距离-多普勒二维匹配,观察能否获得该实测数据中的目标信息,实验结果如图4所示.由图4易知,在对实测数据进行杂波对消二匹配滤波处理后,在距离维平面上检测到了个目标,再一次说明了并行直接矩阵求逆算法的有效性,而且使用并行直接0

11 西安电子科技大学学报(自然科学版) 第42卷

矩阵求逆算法缩短了杂波对消处理的时间,为后续的实时信号处理留出了较大的空间.

5 结束语

在工程背景中,直接矩阵求逆杂波抑制算法存在着计算复杂二时间开销大的问题.根据直接矩阵求逆算法的特点,笔者提出了基于计算统一设备架构的并行直接矩阵求逆算法,将整个运算块分解为若干个小的子运算块,各个子块之间相互独立,在计算统一设备架构下,将这些子运算块调度到图形处理器上进行并行处理,从而降低了整个处理的时间开销.与直接矩阵求逆算法相比,在确保杂波抑制性能的前提下,并行直接矩阵求逆算法的处理效率实现了最高26倍的加速,达到了实时杂波对消的目的,并缓解了后续外辐射源雷达实时信号处理在时间上的压力.另外,该算法的处理时间随数据量的加大变化缓慢,表现出较强的数据扩展性,进一步拓宽了该算法的应用范围.

参考文献:

[1]王俊,水鹏朗,保铮,等.基于分数迟延估计的外辐射源雷达杂波相消算法[J ].西安电子科技大学学报,2005,32(3):378-382.Wan g Jun,Shui Pen g lan g ,Bao Zhen g ,et al.External Illuminator Based on Continuous Wave Radar Clutter Cancelin g Al g orithm Usin g Arrival Time Estimation b y Fractional Inter p olation [J ].Journal of Xidian Universit y ,2005,32(3):

378-382.

[2]Colone F,Cardinali R,Lombardo P.Cancellation of Clutter and Multi p ath in Passive Radar Usin g a Se q uential A pp roach

[C ]//IEEE International Radar Conference.Piscatawa y :IEEE,2006:393-399.[3]吴鑫,张建奇,刘德生,等.CUDA 架构下高效红外图像背景预测方法[

J ].西安电子科技大学学报,2011,38(6):44-51.Wu Xin,Zhan g Jian q i,Liu Deshen g ,et al.Efficient Infrared Ima g e Back g round Prediction in CUDA [J ].Journal of Xidian Universit y ,2011,38(6):44-51.[

4]Bernaschi M,Di Lallo A,Fulcol íR,et https://www.360docs.net/doc/0916614720.html,bined Use of Gra p hics Processin g Unit (GPU )and Central Processin g Unit (CPU )for Passive Radar Si g nal and Data Elaboration [C ]

//Proceedin g s of the 12th International Radar S y m p osium.Piscatawa y :IEEE,2011:315-320.[5]孟大地,胡玉新,丁赤飚,等.一种基于GPU 的SAR 高效成像处理算法[

J ].雷达学报,2013,2(2):210-217.Men g Dadi,Hu Yuxin,Din g Chibiao,et al.Efficient Al g orithm for Processin g SAR Data Based on GPU [J ].Journal of

Radars,2013,2(2):210-217.[6]Richter C,Sch ?p s S,Clemens M.GPU Acceleration of Finite Difference Schemes Used in Cou p led Electroma g netic

/Thermal Field Simulations [J ].IEEE Transactions on Ma g netics,2013,49(5):1649-1652.[7]秦华,周沫,察豪,等.软件雷达信号处理的多GPU 并行技术[

J ].西安电子科技大学学报,2013,40(3):146-151.Qin Hua,Zhou Mo,Cha Hao,et al.Research on Multi -

GPU Parallel Technolo gy in Software Radar Si g nal Processin g [J ].Journal of Xidian Universit y ,2013,40(3):146-151.[8]Chitchian M,Simonetto A,Keviczk y T,et al.Distributed Com p utation Particle Filters on GPU Architectures for Real -

time Control A pp lications [J ].IEEE Transactions on Control S y stems Technolo gy ,2013,21(6):2224-2238.[9]K y u y eon H,Won y on g S.Load Balanced Resam p lin g for Real -

time Particle Filterin g on Gra p hics Processin g Units [J ].IEEE Transactions on Si g nal Processin g ,2013,61(2):411-419.[10]王海涛.外辐射源雷达信号处理若干问题研究[D ].西安:西安电子科技大学,2013.

[11]Jason S,Edward K.CUDA B y Exam p le:an Introduction to General -

p ur p ose GPU Pro g rammin g [M ].Boston:Pearson Education,2010.[12]张舒,褚艳利.GPU 高性能运算之CUDA [M ].北京:中国水利水电出版社,2009.[13]Colone F,O ha g an D W,Lombardo P,et al.A Multista g e Processin g Al g orithm for Disturbance Removal and Tar g et Detection in Passive Bistatic Radar [J ].IEEE Transactions on Aeros p ace and Electronic S y stems,2009,45(2):698-722.(编辑:郭 华)

111第1期 武 勇等:CUDA 架构下外辐射源雷达杂波抑制并行算法

CUDA架构下外辐射源雷达杂波抑制并行算法

作者:武勇, 王俊, 张培川, 曹运合, WU Yong, WANG Jun, ZHANG Peichuan, CAO Yunhe 作者单位:西安电子科技大学 雷达信号处理国家重点实验室,陕西 西安,710071

刊名:

西安电子科技大学学报(自然科学版)

英文刊名:Journal of Xidian University (Natural Science)

年,卷(期):2015(1)

引用本文格式:武勇.王俊.张培川.曹运合.WU Yong.WANG Jun.ZHANG Peichuan.CAO Yunhe CUDA架构下外辐射源雷达杂波抑制并行算法[期刊论文]-西安电子科技大学学报(自然科学版) 2015(1)

外辐射源雷达概述

1 研究背景与意义 雷达面临的四大挑战: (1)隐身目标的威胁 隐身飞机、隐身导弹和隐身舰艇和无人机的出现使得雷达散射截面积成百上千倍的减小,增加了雷达发现目标的难度。 (2)低空与超低空目标的威胁 战术导弹和战略巡航导弹等低空、超低空目标的入侵也给雷达探测带来了重大挑战。(3)反辐射摧毁的威胁 反辐射导弹利用敌方雷达的电磁辐射进行制导并将其摧毁,是电子对抗中对雷达硬杀伤最有效的武器。为应对日益恶化的外部电磁环境,雷达往往需要发射更大的功率以达到同样的探测性能,从而增加了被发现甚至被摧毁的风险。 (4)强电子干扰 传统雷达一般采用收发共置的布站方式,其发射电磁波一旦被敌方发现和定位,就极容易被干扰,进而丧失整个武器战争系统的重要信息来源。 外辐射源(无源)雷达因能克服上述问题而引起人们的广泛关注。外辐射源雷达分为两大类:第一类是基于目标的红外辐射或自身发射的电磁波来对其探测,目标发射的电磁波主要来源于雷达、应答机、通信电台、导航仪、有源干扰机等通讯电子设备;第二类是利用广播信号、电视信号、手机信号、卫星导航信号等非合作照射源来探测目标。当目标静默(不发射电磁波)时,利用第一类外辐射源雷达通过电磁波来探测目标就无法实现。对于第二类外辐射源雷达,即使目标静默,也能探测到目标,因此对此类外辐射源雷达的研究成为热点。 外辐射源雷达的优势: (1)反隐身特性 隐身目标一般只大幅度减少鼻锥±30°范围之内后向散射的RCS,前向与侧向的散射还是很强。外辐射源雷达是一种双基地雷达,它可以通过接收目标前向与侧向的散射回波信号来探测隐身目标。其次,外辐射源信号多数工作在甚高频、超高频等波段,波长较长,隐身飞机表面的吸波材料对该波段电磁波的作用极差;再者,外辐射源雷达在形式上属双(多)基地雷达,可探测到隐身飞机前向和侧向的散射信号,具有空域上反隐身的特点。因此,外辐射源雷达具有探测隐身目标的能力。 (2)探测低空与超低空目标 外辐射源雷达利用各种民用或商用信号作为照射源,频率一般较低,波长较长,因此照射源能够通过衍射穿过低空障碍物探测到目标。并且广播信号、卫星导航信号等外辐射源信号多采用高塔架设,向下发射波束,能够很好地覆盖低空范围,从而具有一定的超低空探测能力。 (3)抗反辐射导弹 外辐射源雷达不发射电磁波,因此不容易被敌方的侦察系统发现。此外,第三方辐射源具有数量大、地域分布广的特点,受反辐射导弹的攻击概率低,具有很强的生存能力和抗打 (4)抗干扰 外辐射源雷达没有配备专用的发射机,而是借助于其它通信广播基站作为发射站,无法被电子侦察设备所发现,也使其免受其它电子干扰源的影响。并且没有其它主动发射雷达容易受广播、通信信号干扰问题的困扰。

RFS的多目标跟踪算法及其在外辐射源雷达中的应用

RFS的多目标跟踪算法及其在外辐射源雷达中的应用准确跟踪多个运动目标的轨迹是一项在多个领域中都不可或缺的关键技术。目标的非协作性导致目标数目及运动信息难以获取,传感器本身的系统噪声及监控区域内观测野值带来了观测信息的不确定性,这两大难点使得多目标跟踪成为一项十分艰难的任务。解决多目标跟踪问题的传统方法是通过采用硬关联或软关联判断观测量的来源,完成对多目标问题的拆分,进而实现对单个目标的独立跟踪。该类方法没有对多目标建立统一的理论体系,在面对目标数目未知时变的复杂场景时往往束手无策。 基于RFS的多目标跟踪算法避免了目标-量测关联,利用集合建模实现了对多目标的整体滤波处理,开辟了一种应对复杂跟踪场景的新途径。外辐射源雷达的重要职能之一就是同时实现对多个运动目标的有效跟踪,该系统的联合定位体制及输入到跟踪系统中的数据的高度不确定性,必然会大大增加多目标跟踪的难度。本文对基于RFS的多目标跟踪方法及其在外辐射源雷达背景下的应用进行了研究,主要取得了以下成果:1.在SP-PHD滤波中,根据目标状态转移密度函数分布预测粒子,导致滤波性能严重依赖目标运动模型,在运动模型不准的情况下,大量粒子偏离真实目标状态,粒子退化严重。为提高SP-PHD滤波中的粒子有效利用率,提出一种改进的P-PHD算法,该算法基于球面-径向容积数值积分准则,利用CKF产生建议密度函数,并对其进行采样得到当前时刻的粒子状态,从而使粒子 分布更接近于真实多目标后验PDF,有效地缓解了SP-PHD滤波算法中的粒子退化现象,大大减少了SP-PHD滤波中所需粒子数。 同时,CP-PHD滤波算法性能不受目标状态维数的影响,在目标状态维数较高时,其性能优于UP-PHD滤波。2.提出了基于SCKF的P-CBMe MBer滤波算法。该算法采用SCKF产生建议密度函数,从而使预测粒子分布更接近于高似然区域,达到改善粒子分布和提高跟踪精度的目的。SCKF是对CKF的一种改进算法,具有计算量小、算法性能不受目标状态维数影响等与CKF相同的优点,其滤波性能与CKF 相似,但SCKF不需要对矩阵做开方处理,从而避免了由此导致的滤波精度下降、算法发散或终止等现象的出现,仿真表明所提算法跟踪精度优于UP-CBMe MBer 滤波,与CP-CBMe MBer算法性能相当,这说明SCP-CBMe MBer滤波在提高算法稳定性的同时保证了算法的跟踪精度。

一种基于数字电视地面广播照射源的外辐射源雷达快速杂波相消算法

第35卷第1期电子与信息学报 Vol.35 No.1 2013年1月 Journal of Electronics & Information Technology Jan. 2013一种基于数字电视地面广播照射源的外辐射源雷达快速杂波相消算法 张各各*王俊刘玉春 (西安电子科技大学雷达信号处理国家重点实验室西安 710071) 摘要:为了减小外辐射源雷达系统中常规杂波相消算法的运算量,该文利用数字电视地面广播(DTTB)照射源中的PN序列,提出了一种快速杂波相消算法。该算法基于PN序列良好的自相关特性,并考虑到DTTB信号对载频频偏(CFO)很敏感,提出2-D信道和CFO估计来提高估计精度;然后,利用估计的信道和CFO进行直达波重构和杂波相消,剩余目标回波和噪声。相比于传统的杂波相消算法,该方法运算量比较小,并且所有处理都基于预警天线,不需要参考天线,简化了系统模型。最后仿真实验验证了算法的有效性。 关键词:外辐射源雷达;杂波相消算法;数字电视地面广播信号;PN序列;相关方法 中图分类号:TN958 文献标识码:A 文章编号:1009-5896(2013)01-0036-05 DOI: 10.3724/SP.J.1146.2012.00669 A Fast Cancellation Algorithm for DTTB-based Passive Radar System Zhang Ge-ge Wang Jun Liu Yu-chun (National Laboratory of Radar Signal Processing, Xidian University, Xi’an 710071, China) Abstract: To reduce the computational complexity of conventional cancellation algorithm in passive radar system, a fast cancellation by the Pseudo-Noise (PN) sequence in the Digital Television Terrestrial Broadcasting (DTTB) illuminator is proposed. Based on the good correlation property of PN sequence, and the fact that DTTB illuminator is very sensitive to the Carrier Frequency Offset (CFO), the 2-D time delay and CFO estimation is proposed to improve the estimation accuracy. Once obtaining the time delay and CFO, the direct path signal reconstruction and cancellation can be made, remaining the target echoed signal and noise. Compared with the conventional cancellation method, the method has the smaller computational cost, and all the processing is on surveillance antenna, simplifying the passive radar system model by removing the reference antenna. Finally, the simulation experiments demonstrate the effectiveness of the method. Key words: Passive radar; Clutter cancellation; Digital Television Terrestrial Broadcasting (DTTB) signal; Pseudo -Noise (PN) sequence; Correlation method 1引言 外辐射源雷达利用非合作信号,比如FM信号,GPS信号,模拟电视信号,作为其照射源,在抗干扰、抗反辐射导弹、抗低空突防和反隐身能力等方面有着主动雷达不可比拟的优势[1,2]。随着中国自主知识产权的数字电视地面广播(Digital Television Terrestrial Broadcasting, DTTB)信号的出现,为外辐射源雷达提供了新的照射源。DTTB信号的伪随机特性,使它更易形成近似“图钉型”的模糊函数,获得比其它照射源更高的距离和多普勒分辨率 。 但是外辐射源雷达信号处理中的一个难点是目标回波非常微弱,极易被强直达波、多径及地物杂波所淹没,因此在匹配滤波之前首先需要杂波相消。但是常规杂波相消通过额外配置参考天线以获得参考信号,极易受到多径的影响,而参考信号的精度 2012-05-28收到,2012-10-09改回 教育部创新团队计划(IRT0954)资助课题 *通信作者:张各各 ggzhang@https://www.360docs.net/doc/0916614720.html, 直接决定杂波相消的精度和匹配滤波的效果,因此有时需要直达波提纯;并且在目标比较微弱的情况下,一般通过增加数据长度来换取高信噪比改善,杂波相消运算量一般比较大 。常规杂波相消算法运算量之所以比较大是因为没有考虑照射源的信号特性。实际上OFDM(Orthogonal Frequency- Division Multiplexing)信号通常设置一定长度的保护间隔(Guard Interval, GI)来对抗多径衰落[9]。比如DVB-T(Digital Video Broadcasting-Terrestrial)信号用循环前缀(Cyclic Prefix, CP)作为保护间隔,把频域选择性衰落变成平坦衰落,一阶频域均衡可以快速地恢复直达波。DTTB信号利用PN(Pseudo- Noise)序列良好的自相关特性,用PN序列代替DVB-T中的CP,形成TDS-OFDM (Time-Domain Synchronous-OFDM)调制,不需要额外的导频(pilots)信号,能获得比基于DVB-T信号更快的帧同步、信道估计、频偏估计和均衡性能 ,已有文献提出利用DTTB信号来进行多站定位,测距误差达到分米级[13]。

雷达系统中杂波信号的建模与仿真

1.雷达系统中杂波信号的建模与仿真目的 雷达的基本工作原理是利用目标对雷达波的散射特性探测和识别目标。然而目标存在于周围的自然环境中,环境对雷达电磁波也会产生散射,从而对目标信号的检测产生干扰,这些干扰就称为雷达杂波。对雷达杂波的研究并通过相应的信号处理技术可以最大限度的压制杂波干扰,发挥雷达的工作性能。 雷达研制阶段的外场测试不仅耗费大量的人力、物力和财力,而且容易受大气状况影响,延长了研制周期。随着现代数字电子技术和仿真技术的发展,计算机仿真技术被广泛应用于包括雷达系统设计在内的科研生产的各个领域,在一定程度上可以替代外场测试,降低雷达研制的成本和周期。 长期以来,由于对杂波建模与仿真的应用己发展了多种杂波类型和多种建模与仿真方法。然而却缺少一个集合了各种典型杂波产生的成熟的软件包,雷达系统的研究人员在需要用到某一种杂波时,不得不亲自动手,从建立模型到计算机仿真,重复劳动,造成了大量的时间和人力的浪费。因此,建立一个雷达杂波库,就可以使得科研人员在用到杂波时无需重新编制程序,而直接从库中调用杂波生成模块,用来产生杂波数据或是用来构成雷达系统仿真模型,在节省时间和提高仿真效率上的效益是十分可观的。 从七十年代至今已经公布了很多杂波模型,其中有几类是公认的比较合适的模型。而且,杂波建模与仿真技术的发展己有三十多年的历史,己经有了一些比较成熟的理论和行之有效的方法,这就使得建立雷达杂波库具有可行性。 为了能够反映雷达信号处理机的真实性能,同时为改进信号处理方案提供理论依据,雷达杂波仿真模块输出的杂波模拟信号应该能够逼真的反映对象环境的散射环境。模拟杂波的一些重要散射特性影响着雷达对目标的检测和踉踪性能,比如模拟杂波的功率谱特性与雷达的动目标显示滤波器性能有关;模拟杂波的幅度起伏特性与雷达的恒虚警率检测处理性能有关。因此,杂波模拟方案的设计是雷达仿真设计中极其重要的内容,杂波模型的精确性、通用性和灵活性是衡量杂波产生模块的重要指标。 2.Simulink简介 Simulink是MATLAB最重要的组件之一,它提供一个动态系统建模、仿真和

载波频偏对正交频分复用波形外辐射源雷达性能影响的研究

第35卷第4期电子与信息学报 Vol.35No.4 2013年4月 Journal of Electronics & Information Technology Apr. 2013 载波频偏对正交频分复用波形外辐射源雷达性能影响的研究 赵志欣万显荣* (武汉大学电子信息学院武汉 430072) 谢锐柯亨玉 摘要:利用正交频分复用(OFDM)波形外辐射源雷达进行目标跟踪和定位是国内外研究的热点之一。该文首先介绍了OFDM波形外辐射源雷达信号模型及其信号处理的关键技术。在此基础上重点从不同角度仿真研究了载波频偏估计误差对OFDM波形外辐射源雷达探测性能的影响,包括其对匹配滤波后目标参数估计精度的影响,对时域杂波抑制性能影响的定量分析,以及对参考信号重构误码率等方面的影响。仿真结果表明,不同时域杂波抑制算法对载波频偏估计误差要求不同;参考信号重构误码率对时域杂波抑制性能影响较大,对匹配滤波的影响较小。最后基于实测数据验证了分析结果的正确性。 关键词:外辐射源雷达;正交频分复用;载波频偏;匹配滤波;杂波抑制;参考信号重构 中图分类号:TN958.97 文献标识码:A 文章编号:1009-5896(2013)04-0871-06 DOI: 10.3724/SP.J.1146.2012.01011 Impact of Carrier Frequency Offset on Passive Bistatic Radar with Orthogonal Frequency Division Multiplexing Waveform Zhao Zhi-xin Wan Xian-rong Xie Rui Ke Heng-yu (School of Electronic Information, Wuhan University, Wuhan 430072, China) Abstract: Using passive radar with Orthogonal Frequency Division Multiplexing (OFDM) waveform for target track and location is recently a research spot at home and abroad. This paper first introduces the signal model for passive radar with OFDM waveform and key techniques during the signal processing. On that basis, how the estimation error of carrier frequency offset influences the detection performance of this radar is mainly investigated through simulation from different aspects, including the influences on target parameter estimation after match filtering, clutter rejection performance and bit error rate during reference signal reconstruction. The simulation results show that different temporal clutter rejection methods require different estimation accuracy of carrier frequency offset. The reconstruction bit error rate has a great impact on the temporal clutter rejection performance while having a little effect on match filtering. Finally, the analysis results are verified based on the measurement data. Key words: Passive radar; OFDM; Carrier Frequency Offset (CFO); Match filtering; Clutter rejection; Reference signal reconstruction 1引言 外辐射源雷达,即无源雷达,它是利用第三方发射的电磁信号探测跟踪目标的双/多基地雷达系统,该体制雷达本身并不发射能量,而是被动地接收目标反射的非协同式辐射源的电磁信号,从而实现对目标的跟踪和定位。外辐射源雷达的主要优点有:(1)无需频率分配、无辐射、抗摧毁能力强;(2)反隐身、低空探测能力强;(3)研制和维护成本低、设备体积小、机动性强、易于部署等。数字广播取代模拟广播是时代发展的趋势,其覆盖面广,发射 2012-08-06收到,2012-12-17改回 国家自然科学基金(60971101, 41074116, 41106156)资助课题 *通信作者:万显荣 xrwan@https://www.360docs.net/doc/0916614720.html, 功率大,为外辐射源雷达提供了极便利的非合作照射源。数字广播通常采用正交频分复用(OFDM)调制技术,一方面增强了广播接收机抗频率选择性衰落的能力,同时也为基于该波形的外辐射源雷达探测提供了有力支撑,如使雷达系统具有探测性能稳定、分辨性能与节目内容无关[1],易于纯净参考信号重构[2,3] [411] 等优点。目前已被研究用来作为外辐射源雷达非合作照射源的OFDM波形数字广播信号包括:DAB(数字音频广播),DVB-T(数字视频广播),DTMB(数字地面电视),CMMB(中国数字移动多媒体视频广播),DRM(全球性数字调幅广播)等。 OFDM波形外辐射源雷达通常设有两个通道:参考通道和监测通道,分别用来接收参考信号和监

相关文档
最新文档