基于CEEMDAN样本熵的心音信号特征提取及 识别研究
心音信号的分析及其特征提取方法的研究

心音信号的分析及其特征提取方法的研究
周静;杨永明;何为
【期刊名称】《中国生物医学工程学报》
【年(卷),期】2005(024)006
【摘要】心音的改变和心脏杂音的出现,往往是器质性心脏病的最早体征.本研究讨论了一种全面的、综合性的心音信号分析方法,从多个角度对方法进行了探讨,提取心音的特征值,区分不同的心音.分析和仿真结果证明该方法能有效地区分不同的心音,有助于器质性心脏病的辅助诊断.
【总页数】5页(P685-689)
【作者】周静;杨永明;何为
【作者单位】重庆大学高电压与电工新技术教育部重点实验室,重庆,400044;重庆大学高电压与电工新技术教育部重点实验室,重庆,400044;重庆大学高电压与电工新技术教育部重点实验室,重庆,400044
【正文语种】中文
【中图分类】R318.04
【相关文献】
1.心音信号包络提取识别别方法的比较分析研究 [J], 吴玉春
2.心音信号时频分析方法研究 [J], 李战明;韩阳;韦哲
3.心音信号分析方法及应用性研究 [J], 陈天华;韩力群;唐海滔;郑若金
4.心音信号特征分析与识别方法研究 [J], 周克良;王亚光;叶岑
5.两种时频分析方法在心音信号处理上的比较研究 [J], 陈新华;成谢锋
因版权原因,仅展示原文概要,查看原文内容请购买。
《基于脑电信号样本熵的情感识别》范文

《基于脑电信号样本熵的情感识别》篇一一、引言情感识别是人工智能领域的一个重要研究课题,尤其在人机交互、心理健康评估、医学诊断等领域有着广泛的应用前景。
近年来,随着神经科学技术的发展,基于脑电信号(EEG)的情感识别方法越来越受到关注。
脑电信号是反映大脑活动的关键指标,能够有效地捕捉到人们在特定情绪状态下的脑电信号变化。
样本熵作为一种复杂的生物信号特征提取工具,其在情感识别领域的应用,已成为一个新的研究方向。
二、脑电信号与情感识别脑电信号是一种非线性的、复杂的生物信号,其中包含了丰富的关于人的情绪、认知等神经活动的信息。
基于脑电信号的情感识别主要通过对大脑皮层不同区域的信号进行采集和分析,从而实现对情感的识别和分类。
然而,由于脑电信号的复杂性和非线性,如何有效地提取和解析其中的情感信息成为了该领域的一大挑战。
三、样本熵的概念与特性样本熵(Sample Entropy)是一种基于时间序列的复杂度度量方法,它被广泛应用于生物信号的复杂度分析中。
样本熵通过计算时间序列的序列复杂性来评估其复杂性程度,其优点在于对噪声和微小变化的敏感性较低,可以有效地反映时间序列的内在特征。
在情感识别中,样本熵可以用于提取脑电信号的复杂度特征,从而实现对情感的准确识别。
四、基于样本熵的脑电信号情感识别方法基于样本熵的脑电信号情感识别方法主要包括以下几个步骤:首先,通过脑电波帽等设备采集不同情感状态下的脑电信号;其次,对采集到的脑电信号进行预处理,包括滤波、去噪等操作;然后,利用样本熵算法对预处理后的脑电信号进行复杂度特征提取;最后,通过机器学习算法对提取出的特征进行分类和识别。
在具体的实施过程中,我们需要选择合适的脑电信号采集设备和数据处理方法,以获取高质量的脑电信号数据。
在特征提取阶段,我们可以通过调整样本熵算法的参数来优化特征提取的效果。
在分类和识别阶段,我们可以选择适合的机器学习算法和模型来进行训练和测试。
五、实验结果与分析我们通过实验验证了基于样本熵的脑电信号情感识别的有效性。
心音信号的分析及其特征提取方法的研究

A Ne w Algorithm of Heart Sound Feature Extraction
ZHOU Jing Y ANG Y ong2Ming HE Wei
( High Voltage and Electronic Laboratory of Ministry of Education , Chongqing University , 400044)
212 归一化平均香农能量分布
式中 , x norm 是采样值与所分析频段中采样信号 的最大绝对值之比 ; N 为 20ms 内的采样数 , 因采样 频率为 2205Hz ,则 N = 44 。 那么 ,整个心音信号的归一化平均香农能量为 : Es ( t) - M ( Es ( t) ) ( 2) P ( t) = S ( E ( s ( t) ) 以分段作为时间变量 ,则由式 ( 1) 中的 Es 得到 式 ( 2) 中的 Es ( t) 序列 , M ( Es ( t) ) 是 Es ( t) 的平均值 , S
‘杂音’ 的频率成分 、 强度 、 出现的时间等特征都是本 研究所关心的重点 。国内外不少的研究人员都曾尝 试 用 不 同 的 方 法 来 分 析 心 音 信 号 。Abdelghani Djebbari 等用短时傅立叶变换分析心音信号 ,发现第 一心音的频率成份主要集中在 50Hz ~ 150Hz 范围 内 , 而 第 二 心 音 的 频 率 成 份 主 要 集 中 在 50Hz ~ 200Hz 范围内 ,250Hz ~ 300Hz 范围内出现第二个小 [3 ] 峰值 。B. El2Asir 等用时频分析的方法分析心音 信号 ,发现不同的心脏疾病在心音中体现为不同时 [4 ] 刻出现的不同频率的心脏杂音 。为了能同时了解 心音在各方面的特性 ,本研究利用了小波分析 、 归一 化平均香农能量分布 , 功率谱估计等多种分析方法 的特点 ,形成一个综合性的 、 全面的分析方法 , 从时 频特性 、 时域特征 、 能量分布等多个角度提取心音的 特征值 ,有效的区分不同的心音 ,最终实现对心脏疾 病的辅助诊断 。
基于样本熵快速算法的心音信号动力学分析

() = [ i , i ) … , i i () ( +1 , ( +m 一1 ] ( ) ) 1
式 中 , =1 i ~N—m+1 ;
( )定 义 X() X() 的距 离 d X( )X() 为 2 i与 j 间 [ i, j ] 两 者对应 元 素 中差值 最 大的一 个 , : 即 d X( ) X() [ i , j ]=ma [ i )一x j+ ] ( ) x ( + ( ) 2
3 0 ms~ 7 0 m s7 0 0 1
,
这 无 疑 会 影 响 该 类 方 法 的检 测 效
( ) 给定 阈 值 r 对 每 一 个 i 统 计 d[ i , 3 , 值 X( ) X () 小 于 r ] 的数 目以及 此数 目与 矢 量 总个 数 Ⅳ 一 的 m 比值 , 为 B ( ) 记 r,
果 。A a 计 算 了舒 张 期 心 音 的 近 似 熵 , 明冠 状 动 ky 证 脉 狭窄病 人 和健康 人 近 似熵 值 存在 显 著差 异 。虽然 近 似 熵计算 所需数据量少 , 具有很好 的抗 噪能力 , 且 但是 其 计算 过程 中存在 自身数 据段 的比较 , 致结果存在偏 差 。 导 本 文基于样 本 熵理 论 , 出 了样本 熵 快 速算 法 , 利 J提 并 用 样本熵快速算法 分析舒 张期 心音 , 现冠 状动 脉狭 窄 实
的无损检测 。由于样本 熵在保 留近似熵 优点 的同时提高
( ÷ dxi,( ]< 的 } 3 r ) {E( ) ) r 数目 ()
组 织振 动从 而产生 声音 。因此 分 析舒 张 期 心音 为 无 损 检测 冠 状 动 脉 疾 病 提 供 了 可 能 。G uhe 采 用 快 atir
速傅里 叶变 换 对 舒 张期 心音 进 行 分 析 , 出 了 冠 心 病 得
基于改进CEEMDAN-DCNN的声发射源识别分类方法

基于改进CEEMDAN-DCNN的声发射源识别分类方法谢学斌;刘涛;张欢
【期刊名称】《黄金科学技术》
【年(卷),期】2022(30)2
【摘要】声发射源的准确分类识别是声发射地压监测预报预警研究的重要基础。
针对矿山井下围岩体声发射事件信号和采掘作业噪声信号分类识别问题,提出了一种基于改进完备总体经验模态分解和深度卷积神经网络(DCNN)的智能识别分类方法。
首先,对信号进行改进CEEMDAN降噪处理,即利用相关性系数阈值和排列熵(PE)阈值剔除伪分量和噪声分量;然后,利用DCNN对降噪后的信号自动提取高维特征;最后,将特征用于softmax分类器分类识别,实现智能化井下信号源多分类。
研究表明:改进CEEMDAN能够有效剔除伪分量及噪声分量;相比其他机器学习方法,改进CEEMDAN-DCNN方法具有准确率高和稳定性较好等优点。
信号源识别分类方法研究为地压监测预警预报提供了重要的基础数据,准确的灾害预警预报可为矿山井下作业人员和设备提供安全保障。
【总页数】13页(P209-221)
【作者】谢学斌;刘涛;张欢
【作者单位】中南大学资源与安全工程学院
【正文语种】中文
【中图分类】TD76
【相关文献】
1.基于贝叶斯网络分类器的雷达辐射源识别方法
2.一种基于多分类器融合的雷达辐射源识别方法
3.基于贝叶斯理论的辐射源分类识别方法研究
4.基于Softmax回归的通信辐射源特征分类识别方法
5.声发射源识别中的三比值特征提取方法研究
因版权原因,仅展示原文概要,查看原文内容请购买。
一种新的心率变异性度量方法

一种新的心率变异性度量方法邵士亮; 王挺; 宋纯贺; 崔婀娜; 赵海; 姚辰【期刊名称】《《物理学报》》【年(卷),期】2019(068)017【总页数】13页(P295-307)【关键词】心率变异性; 改进的自适应噪声完备集合经验模态分解; (ICEEMDAN); bubble; 熵; 复杂网络【作者】邵士亮; 王挺; 宋纯贺; 崔婀娜; 赵海; 姚辰【作者单位】东北大学计算机科学与工程学院沈阳 110819; 中国科学院沈阳自动化研究所机器人学国家重点实验室沈阳 110016; 中国科学院机器人与智能制造创新研究院沈阳 110169【正文语种】中文1 引言心率变异性(heart rate variability,HRV)是指逐次心跳间期的波动,常用来评估自主神经系统(autonomic nervous system,ANS)对心脏活动的调节作用,是评价自主神经活动的重要无创指标,HRV的分析能够了解ANS在心脏发病过程中的作用[1-3].传统的HRV分析方法集中于时域和频域分析[4-6].时域分析法主要是利用相邻正常心跳间隔的标准差(standard deviation of normal to normal,SDNN)、相邻正常心跳间隔差值的均方根(root mean square of the successivenormal,RMSSD)、相邻正常心跳间隔差值超过50 ms的比例(count divided by the total number of all NN intervals,pNN50)、相邻正常心跳间隔的总个数除以相邻正常心跳间隔直方图的高度(HRV triangular index,HRVTi)等指标对HRV 进行评价.频域分析法是把HRV分解为不同的频率成分,并将其相对强度定量为功率,提供了各种频率成分的功率谱测定,分为甚低频段(very low frequency,VLF)、低频段(low frequency,LF)、高频段(high frequency,HF)、总功率谱(total power,TP)等指标.然而,时域指标不能表达出HRV信号的时变特性,所以对自主神经系统的反映十分有限,而频域分析只能给出全局的频率信息,缺少局部和不同频率间的耦合信息.时域和频域的分析方法都是对HRV信号做线性分析,很难透过HRV 信号的非线性本质[7,8].因此,通过非线性分析方法对HRV进行分析得到了广泛的研究,包括Poincaré散点图[9]、去趋势波动分析[10]和近似熵[11]、样本熵[12]、排列熵[13]、bubble熵[14]等熵分析法.熵分析法是HRV分析中比较有代表性的一类方法,因HRV的无序波动中,包含了心脏活动中有序的内在动力学特性,而熵测度能够度量心脏活动的这种有序程度,所以在HRV信号的研究中,熵分析法得到了广泛的应用.但对HRV信号直接进行熵测度分析忽略了信号内部的波动细节.为了增强对HRV信号内部细节的观察,文献[15]把经验模态分解(empirical mode decomposition,EMD)方法与熵分析方法相结合,但该方法忽略了残差信号,同时没有考虑不同本征模态函数(intrinsic mode function,IMF)之间的耦合关系,造成了信息量的丢失,而且EMD分解算法存在模态混叠和端点效应等不足.目前,对HRV信号的分析研究中,并没有对不同时频尺度下的HRV信号之间的耦合关系进行分析.本文根据非线性和非平稳的HRV信号在不同时刻具有不同频率成分的特点,提出了一种基于改进的自适应噪声完备集合经验模态分解(improved complete ensemble EMD with adaptive noise,ICEEMDAN)和bubble熵(bubble entropy)的复杂网络(complex network,CN)映射的HRV度量方法-ICBN方法,该方法主要研究不同时频尺度空间下的HRV信号之间的耦合关系.本研究先通过ICEEMDAN对HRV信号进行时频尺度化,然后将得到的不同时频段间的IMF分别计算bubble熵值,构建熵值向量,根据有限穿越水平可视图法(limited penetrable horizontal visibility graph,LPHVG)[16,17]将熵值向量映射成复杂网络,通过网络参数特征对不同时频尺度空间化下的IMF间的耦合关系进行度量,从而实现对HRV信号的度量.2 研究对象与方法本文的实验方法结构如图1所示.首先,对带有人工校准的心跳标注和时间戳的文件进行HRV提取,并进行片段分割; 然后,通过时域分析、频域分析、ICBN方法对HRV信号进行分析,提取时域、频域指标和耦合特征指标; 最后,通过统计分析和交叉校验对各特征的分类性能进行对比分析.图1 HRV分析框架图Fig.1.Framework of the HRV analysis.2.1 研究对象实验数据取自PhysioNet提供的数据集[18].在这里共使用了4个数据集.第一个数据集是chf2,包含29个患有充血性心力衰竭(congestive heart failure,CHF)病人的长时心电信号(electrocardiogram,ECG),患者年龄从34到79岁.第二个数据集是nsr2,包含54个正常窦性心律(normal sinus rhythm,NSR)对象的长时ECG信号,其中男性30名,年龄从28.5到76岁,女性24名,年龄从58到73岁.第三个数据集是nsr,包含18个正常窦性心律的长时ECG信号,包括男性5名,年龄从26到45岁,女性13名,年龄从20到50岁.第四个数据集是ltaf,包含84个房颤心律失常(atrial fibrillation,AF)患者的长时ECG信号.原始ECG信号的采样频率是128 Hz,每个信号都带有人工校准的心跳标注,从而可以获得用于数据分析的RR间期序列,即HRV信号(图2).为了排除昼夜节律对信号分析的影响,文献[19]采用上午清醒时间段的信号进行分析,本文采用同样的方法进行实验.2.2 时域、频域分析方法时域分析的统计特征如表1所示,包括SDNN,RMSSD,pNN50,HRVTi这4个时域特征指标.本文采用Lomb-Scamble周期图法计算功率谱密度,相对基于FFT的方法具有更高的估计精度[20].本文计算的频域特征包括TP (≤ 0.4 Hz),VLF (0.003-0.040 Hz),LF (0.04-0.15 Hz)和HF(0.15-0.40 Hz)范围的功率谱,LF和HF的比值LF/HF,5个频域特征指标.具体的描述与定义如表2所示.图2 HRV信号获得示意图Fig.2.Schematic of obtaining HRV signal.2.3 ICBN分析方法本文提出的ICBN分析方法的实现过程如图3所示.首先,读取带有人工校准标注的数据文件并提取HRV信号,根据标注文件剔除异常点; 然后,通过ICEEMDAN对提取的HRV信号在不同时频尺度下进行分解,得到不同时频尺度空间下的IMF; 再通过计算每个IMF的bubble熵值,构建bubble熵向量,对熵向量进行网络的映射; 最后,通过对网络的特征进行计算,完成对HRV信号在不同时频尺度下的耦合特征分析.2.3.1 RRs提取获取带有人工标注的ECG信号文件和人工标注的注释文件,提取每个对象上午清醒时间段1 h长的HRV信号,定义为x(i),1≤i≤N,i∈Z ,其中 N 表示信号长度.2.3.2 ICEEMDAN分解ICEEMDAN基于EMD方法提出,是针对非线性和非稳态数据的自适应分析方法,它改善了EMD方法的模态混叠效应,减少了IMF中的噪声成分,同时丰富了IMF的物理意义[21].对于输入HRV信号 x ,ICEEMDAN对其分解的具体实现过程如下. 1)对于j=1,2,···,J ,通过EMD分解得到第一个残差:2)在第一阶段 k=1 ,计算第一个模态分量:表1 时域分析统计特征Table 1.Statistical features in time domain.指标单位描述与定义images/BZ_303_1414_2137_2048_2262.png■SDNNimages/BZ_303_693_2155_735_2176.png 相邻正常心跳间隔的标准差RMSSDmsimages/BZ_303_1537_2301_2192_2426.png■相邻正常心跳间隔差值的平方和均值的均方根相邻正常心跳间隔差值超过50毫秒的比例HRVTi-相邻正常心跳间隔的总个数除以相邻正常心跳间隔直方图的高度pNN50%images/BZ_303_1523_2439_2139_2514.png表2 频域分析统计特征Table 2.Statistical features in frequency domain.指标单位描述与定义频率范围Total power所有频率范围的功率谱总和≤ 0.4 Hz VLFimages/BZ_303_713_2826_767_2859.png高频范围内的功率谱0.15-0.40 Hz LF/HF%images/BZ_303_713_2888_767_2921.png低频范围内的功率谱0.04-0.15 Hz HF甚低频范围内的功率谱0.003-0.040 HzLFimages/BZ_303_713_2950_767_2984.pngimages/BZ_303_713_3013_767_ 3046.pngLFimages/BZ_303_1090_3076_1170_3118.png 与HFimages/BZ_303_1266_3076_1346_3118.png 的比值-[][]图3 ICBN分析方法实现过程框图Fig.3.Implementation process of ICBN analysis method.3)对于j=1,2,···,J ,通过EMD分解得到第二个模态分量为4)对于k=3,···,K ,计算第 k 个残差:5)计算第 k 个模态分量:6)对下一个 k 回到步骤4).重复4)到6),直到获取的残差不能继续被EMD分解,则输入信号被分解为以上公式中Ek(·) 为产生第 k 个模态分量的算子;M(·)是局部均值算子; w(i) 为零均值单位方差白噪声; 系数βk=εkstd(rk) 允许在每一次迭代中选择信噪比,其中std(·) 为标准偏差算子.研究表明[21],噪声幅值ε0=0.2 时,ICEEMDAN具有最好的分解效果,分解次数 J 在取值50和200时具有相似的分解结果,所以本文设置ε0=0.2 ,J=50.2.3.3 计算IMFs的bubble熵Bubble熵是一种更加稳定和精确的度量方法,不需要设置容限值且度量结果不依赖于嵌入维数,是基于条件排列熵和Renyi排列熵而提出的.相对于样本熵和近似熵,bubble熵具有更好的区分能力[14].对于输入的HRV信号 x:{x(i):1≤i≤N} ,通过ICEEMDAN在不同时频尺度上分解出不同的模态分量 IMFs ,定义为IMFs=[IMF1,IMF2,···,IMFK],其中每个模态分量定义为IMFk:{imfk(i):1≤i≤N,1≤k≤K},对 IMFk 进行计算bubble熵的过程如下.将 IMFk 嵌入一个 m 维空间,对于每一个imfk(i),进行相空间重构,得到其中 L 和 m 分别为延迟因子和嵌入维数.将IMFk(i)的 m 个重构分量[imfk(i),imfk(i+L),···,imfk(i+(m-1)L)]使用冒泡排序法,按照升序进行重新排列,统计每一个重构分量的必要交换次数nj(j=1,2,···,m),在bubble熵的计算中,L=1 ,所以m 维矢量的个数为 N-m+1 ,计算其对应次数出现的概率嵌入维数m根据文献[14]设置为15.Renyi排列熵可根据如下公式计算:条件排列熵可根据如下公式计算:其中,PE(m) 代表m维空间排列熵,PE(m+1) 代表m+1维空间排列熵.条件Renyi排列熵为根据公式(8),(9)和(10)得bubble熵的计算公式为其中 1/log(m+1/m-1) 是归一化因子.对于模态分量IMFs=[IMF1,IMF2,···,IMFK],得到bubble熵值向量BE=[be1,be2,···,beK].2.3.4 Bubble熵网络的映射LPHVG具有相对更强的连接性,进而在较小的时间尺度上可以更多地反应信号的内在信息和特征,同时不影响对序列长程波动趋势的影响[16,17],因此本文选择LPHVG方法构建bubble熵网络.对于时间序列 x(i),1≤i≤N,i∈Z ,通过ICEEMDAN在不同时频尺度上分解出IMFs,IMFs=[imf1,imf2,···,imfK],对每一个IMF进行非线性分析计算出bubble熵值,得到向量BE=[be1,be2,···,beK],根据LPHVG,将 BE 向量映射成网络G=(V,ξ).通过对网络G=(V,ξ) 的特征参数进行计算,完成对IMFs之间的耦合关系分析,其中节点集合为V={v1,v2,···,vK} ,ξ⊆{(vδ,vϑ):vδ,vϑ∈V,vδ=vϑ}是边所构成的集合,且(vδ,vϑ)∈ξ⇔(vϑ,vδ)∈ξ ,|V| 表示图 G 的阶.定义W=[wδϑ]为图 G 的加权邻接矩阵,其中wδϑ=0⇔(vδ,vϑ)∈ξ,2个节点vδ 和 vϑ的权值分别为beδ 和 beϑ ,定义节点vδ 和 vϑ之间边的权值为节点vδ 的邻居集合定义为Tδ={vϑ∈V:wδϑ=0}={vϑ∈V:(vδ,vϑ)∈ξ},节点vδ 的度定义为dδ ,则dδ=|Tδ| ,图 G 的度矩阵定义为DG=[d1,d2,···,dK]=[|T1|,|T2|,···,|TK|],根据节点之间的边权值,节点vδ 的点权值Sδ 定义为与它关联的边权值之和,即图G的点权矩阵定义为SG=[s1,s2,···,sK].2.3.5 计算网络特征指标在将bubble熵值向量映射为加权网络后,对5个复杂网络参数进行考察,分别为平均集聚系数MC,特征路径长度 CL ,网络拓扑熵 TE ,网络层级加权值 WB ,平均点权值 PW.平均集聚系数 MC : 平均集聚系数是指在网络中与同一个节点连接的2个节点之间相互连接的平均概率,该系数用来刻画网络的局域结构性质[22].其中,与节点vδ 直接相连接的节点数为 |Tδ| ,κδ 为所有与节点vδ 相连接的节点之间直接相连接的边数.特征路径长度 CL : 特征路径长度表示所有节点之间距离的平均值,它描述了网络中节点间的平均分离程度,即网络有多小[22].网络标准拓扑熵TE: 网络拓扑熵可以更简洁的度量网络的序状态,对网络拓扑熵进行归一化得到网络标准拓扑熵,其定义为[23]其中为节点重要程度,显然0≤TE≤1.针对IMFs的bubble熵网络的实际物理意义,本文在构建的bubble熵网络的基础上提出2个网络特征,分别是网络层级加权值 WB 和平均点权值PW.网络层级加权值WB: 网络层级加权值以不同权值,对不同层级地位的网络节点的权值总量进行计算,图 G 中节点vδ 的δ 表示IMF的层级位置,每个节点vδ 的权值为beδ ,则网络层级加权值为平均点权值PW: 用来刻画网络中点权值的平均分布情况,定义为图 G 的点权向量SG=[s1,s2,···,sK]除以度向量DG=[d1,d2,···,dK].3 实验分析采用上述的时域、频域分析方法和本文提出的ICBN分析方法,分别对不同人群的HRV信号进行分析,然后通过T检验对各类特征分别进行差异分析,并取 p<0.001 的特征作为最终的极显著差异特征进行分类,最后通过Fisher判别模型对实验对象进行识别.为了得到更加可靠、稳定的结果,采用留一法交叉检验实验的平均值作为最后的识别结果.3.1 应用于健康人和CHF患者的HRV首先对如下两组HRV信号进行分析,即CHF组和NSR1组,其中CHF组采用chf2数据集的29例CHF患者; NSR1组采用nsr2数据集的前29例健康人.3.1.1 NSR1和CHF的HRV信号差异性分析HRV信号时域、频域特征和ICBN分析方法计算的IMF间耦合特征的均值和标准差如表3所示.从NSR1和CHF这2类人群的对比中可以看出,WB,PW,CL,HRVTi,LF/HF具有极显著统计学差异(p<0.001); TE,MC指标具有显著统计学差异(p<0.01).其中,耦合特征中WB,PW和CL具有极显著的统计学差异(p<0.001); 时频域指标中HRVTi和LF/HF具有极显著的统计学差异(p<0.001).图4是具有极显著差异的特征的均值和标准差.从图4中可以看出,在NSR1组中,PW,CL,HRVTi,LF/HF的均值比CHF组的均值高,PW的均值比CHF组的均值低.ICBN方法中的指标WB,PW和CL,在CHF对象中表现出了更高的标准差,而时域指标HRVTi和频域指标LF/HF,在NSR1对象中表现出了更高的标准差.3.1.2 CHF病人的识别通过Fisher判别模型对NSR1和CHF这2组HRV信号进行分类,实现对不同指标分类性能的验证.分类结果通过正确率(accuracy,Acc)、灵敏度(sensitivity,Sen)、特异度(specificity,Spe)、ROC曲线下的面积(area under curve,AUC)来进行评价.实验结果如表4所列,通过单独的每个特征进行分类时,WB,PW,CL,HRVTi和LF/HF 这5个特征之中,WB表现出了更高的Acc,Sen和AUC,分别是79.3%,90.48%和81.72%,LF/HF表现出了更高的Spe,为80.95%.表3 NSR1和CHF患者不同分析方法下的结果Table 3.Statistical analysis results of HRV index under different analysis methods.注: *,**,***分别代表 p <0.05 p<0.01 ,p<0.001.指标NSR1(meanimages/BZ_306_866_2121_896_2151.png SD)CHF(meanSD)标准误差差值的95%置信区间 images/BZ_306_1250_2121_1279_2151.png下限上限images/BZ_306_2109_2133_2130_2158.pngWB27.835images/BZ_306_1201_ 2215_1235_2245.png 7.7413.0508.9140***PW 21.8531.479images/BZ_306_816_2215_845_2244.png0.5630.051images/BZ_306_807_2277_836_2306.pngimages/BZ_306_1197_2277_1 227_2306.pngICBN 0.455 0.103-0.151-0.0660***TE0.954images/BZ_306_1192_2402_1227_2432.png 0.194-0.268-0.0940***MC 0.937images/BZ_306_1192_2340_1227_2370.png 0.037-0.034-0.0050.009**CL 0.956 0.019images/BZ_306_807_2340_836_2369.png1.135 0.133images/BZ_306_807_2402_836_2431.png0.6840.035images/BZ_306_807_2465_836_2494.png0.705 0.026-0.038-0.0060.009**images/BZ_306_1197_2465_1227_2494.png10.772images/BZ_ 306_1192_2589_1227_2619.png 14.110-8.2776.8700.853 RMSSD81.507images/BZ_306_802_2527_836_2557.png 38.56659.535 44.76-43.9510.0070.05 pNN50SDNNimages/BZ_306_1206_2527_1235_2556.png11.47614.676images/BZ_306_807_2589_836_2619.png时域60.307images/BZ_306_1192_2652_1227_2682.png 58.497-20.70738.9760.542 HRVTi 51.17254.895images/BZ_306_807_2652_836_2681.png6.8862.452images/BZ_306_807_2715_836_2744.png4.093 1.494-3.861-1.7250***images/BZ_306_1197_2715_1227_2744.png1.443images/BZ_306_ 1192_2777_1227_2807.png 4.052-2.7342.0010.758 VLF TP1.8094.909images/BZ_306_807_2777_836_2806.png1.322images/BZ_306_1192_2 964_1227_2994.png 3.745-2.4831.9340.804 LF/HF 0.00030.448images/BZ_306_816_2839_845_2869.pngimages/BZ_306_1197_2839_1 227_2869.png频域0.119images/BZ_306_1192_2902_1227_2932.png 0.316-0.2630.0780.281 HF 1.387 6.214-1.2653.3700.367 LF0.2120.333images/BZ_306_807_2902_836_2931.png1.5974.608images/BZ_306_807_2964_836_2994.pngimages/BZ_306_807_3026_83 6_3056.png0.288 0.1840.108images/BZ_306_1197_3026_1227_3056.png 0.083-0.255-0.1050***图4 NSR1和CHF这2组对象具有极显著差异的指标的均值与标准差Fig.4.Mean and variance of the indicators with very significant differencesbetween the two groups of NSR1 and CHF.表4 不同特征的CHF识别性能对比Table 4.Performance comparisons of different indices for CHF recognition.注: TP,被判定为CHF病人的数量; TN,被判定为NSR1对象的数量; FP,NSR1对象被判定为CHF病人的数量; FN,CHF病人被判定为NSR1对象的数量; 正确率灵敏度特异度指标TPTNFPFNAccSenSpeAUC WB192710279.3190.4872.9781.72PW192410574.1479.1770.5975.53 CL20239674.1476.9271.8874.40 HRVTi231961072.4169.7076.0072.85 LF/HF251741272.4175.6880.9578.32 本文通过穷举法,将具有极显著差异的5个指标WB,PW,CL,HRVTi和LF/HF中的所有2,3,4,5个指标的组合作为特征,通过Fisher判别模型对NSR1和CHF病人进行分类,将分类正确率最高的5种组合列出(具体见表5).其中,WB&CL&LF/HF表现出了最高的Acc和Spe,分别是89.66%和92.59%,WB&PW表现出了最高的Sen 和AUC,分别是100%和90.28%.表5 不同特征组合的CHF识别性能对比Table 5.Performance comparisons of different indices for CHF recognition.指标TPTNFPFNAccSenSpeAUCWB&CL&LF/HF25274289.6692.5987.189.85WB&PW&CL&HRVTi&LF/HF24275287.9392.3184.3888.35WB&PW&CL&LF/HF24275287.9392.3184.3888.35WB&PW22297087.9310080.5690.28WB&CL&HRVTi&LF/HF25254486.2086.2186.2186.21WB&PW&HRVTi&LF/HF24265386.2088.8983.8786.38WB&CL&HRVTi25254486.2086.2186.2186.21WB&PW&HRVTi24265386.2088.8983.8786.383.2 应用于健康人和AF患者的HRV对如下2组HRV信号进行分析: AF组采用ltaf数据集的前43例患者,为了和AF 组形成公平对比,并和上一组实验进行区分,NSR2组采用nsr数据集的18例健康人和nsr2数据集的后25例健康人,共43个实验对象.3.2.1 NSR2和AF的HRV信号差异性分析NSR2组和AF组的HRV信号时域、频域和ICBN指标如表6所列.从NSR2和AF这2类人群的对比可知,WB,PW,SDNN,pNN50,RMSSD和LF/HF具有极显著统计学差异(p<0.001);CL,HRVTi,TP,LF和HF指标具有显著统计学差异(p<0.01); TE和 MC指标具有统计学差异(p<0.05).其中,耦合特征中WB和PW具有极显著的统计学差异(p<0.001); 时频域指标中SDNN,pNN50,RMSSD和LF/HF具有极显著的统计学差异(p<0.001).图5是具有极显著差异特征的均值和标准差.从图5中可以看出,具有极显著差异的指标中,在NSR2组中PW和LF/HF的均值比AF组的均值高,WB,SDNN,pNN50和RMSSD的均值比AF组的均值低.ICBN方法中的指标WB和PW,时域指标SDNN,pNN50和RMSSD在AF对象中表现出了更高的标准差,频域指标LF/HF在NSR2对象中表现出了更高的标准差.表6 NSR2和AF患者在不同分析方法下的结果Table 6.Statistical analysis results of HRV index under different analysis methods.注: *,**,***分别代表 p <0.05 ,p<0.01 ,p<0.001.指标NSR2(meanimages/BZ_308_876_2121_905_2151.png SD)AF(meanSD)标准误差差值的95%置信区间images/BZ_308_1238_2121_1267_2151.png下限上限images/BZ_308_2106_2133_2127_2158.png24.243images/BZ_308_1201_22 15_1235_2245.png 3.1051.7313.7890***PW WB21.4831.367images/BZ_308_825_2215_854_2244.png0.5670.074images/BZ_308_817_2277_846_2306.pngimages/BZ_308_1197_2277_1227_2306.pngICBN 0.454 0.090-0.148-0.0770***TE0.999images/BZ_308_1192_2402_1227_2432.png 0.170-0.183-0.0470.001**MC 0.960images/BZ_308_1192_2340_1227_2370.png0.0100.0040.0350.013*CL 0.9410.050images/BZ_308_817_2340_846_2369.png1.1130.146images/BZ_308_817_2402_846_2431.png0.6870.043images/BZ_308_817_2464_846_2493.png0.664 0.032-0.024-0.0080.04*images/BZ_308_1197_2464_1227_2493.png45.495images/BZ_30 8_1192_2590_1227_2620.png 30.6874.90425.6200***RMSSD 74.69826.193139.016 62.48010.33143.7730***pNN50SDNNimages/BZ_308_817_2527_846_2556.pngimages/BZ_308_1206_2527_ 1235_2556.png10.123 9.610images/BZ_308_825_2590_854_2619.png时域170.926images/BZ_308_1201_2652_1235_2682.png97.98015.220104.2560***HRVTi 36.40219.003images/BZ_308_817_2652_846_2681.png7.7353.210images/BZ_308_817_2715_846_2744.png6.049 2.488-2.918-0.4550.008**images/BZ_308_1197_2715_1227_2744.png13.493images/BZ_ 308_1192_2778_1227_2808.png 19.3697.00018.7540.001**VLF TP0.615 0.612images/BZ_308_817_2778_846_2807.png12.272images/BZ_308_1192_ 2965_1227_2995.png 17.9086.38117.2470.001**LF/HF 0.00020.0003images/BZ_308_817_2839_846_2869.pngimages/BZ_308_1197_2839_ 1227_2869.png频域1.204images/BZ_308_1192_2902_1227_2932.png1.6200.5531.5400.002**HF 0.017 0.063-2.25636.1470.083 LF0.1570.154images/BZ_308_817_2902_846_2931.png0.4580.515images/BZ_308_817_2965_846_2994.pngimages/BZ_308_817_3026_84 6_3056.png0.515 0.4190.126images/BZ_308_1197_3026_1227_3056.png 0.059-0.519-0.2590***图5 NSR2和AF这2组对象具有极显著差异的指标的均值与标准差Fig.5.Mean and variance of the indicators with very significant differences between the two groups of NSR2 and AF.3.2.2 AF患者的识别通过Fisher判别模型对NSR2和AF这2组HRV信号进行分类,实现对不同指标分类性能的验证.实验结果如表7所示,通过单独的每个特征进行分类时,WB,PW,SDNN,pNN50,RMSSD和LF/HF这6个特征之中,PW表现出了最高的Acc,Sen和AUC,分别是83.72%,96.77%和86.57%,LF/HF表现出了最高的Spe,是96.00%.表7 不同特征的AF识别性能对比Table 7.Performance comparisons of different indices for AF recognition.指标TPTNFPFNAccSenSpeAUCWB303713677.9183.3374.0078.67 PW304213183.7296.7776.3686.57 SDNN313412975.5877.5073.9175.71 pNN50283915477.9187.5072.2279.86 RMSSD2933141072.0974.3670.2172.29 LFHF422411976.7468.8596.0082.43 表8 不同特征的AF识别性能对比Table 8.Performance comparisons of different indices for AF recognition.指标TPTNFPFNAccSenSpeAUCWB&PW&pNN50&RMSSD&LFHF38415291.8695.0089.1392.07WB&PW&SDNN&LFHF38405390.7092.6888.8990.79WB&PW&RMSSD&LFHF38405390.7092.6888.8990.79WB&PW&SDNN&RMSSD37416290.7094.8787.2391.05WB&PW&SDNN&pNN50&RMSSD36427190.7097.3085.7191.51本文通过穷举法,将具有极显著差异的6个指标的所有2,3,4,5,6个指标的57种组合作为特征,通过Fisher判别模型对NSR2和AF病人进行分类,将分类正确率最高的5种组合列出(表8).其中,WB&PW&pNN50&RMSSD&LFHF表现出了最高的Acc,Spe和AUC,分别是91.86%,89.13%和92.07%,WB&PW&SDNN&pNN50&RMSSD表现出了最高的Sen,为97.3%.4 讨论本文首先研究比较了NSR1组对象和CHF患者HRV信号时域、频域指标和ICBN 指标之间的差异,然后又对另一NSR2组对象和AF患者进行了同样的分析.从表3可知,对于CHF和NSR1这2组实验对象,所有的时域和频域指标中,HRVTi 和LF/HF表现出了极显著的统计学差异(p<0.001).CHF与NSR1相比,时域指标HRVTi显著减小,表明充血性心力衰竭病人心脏活动发生变化,交感神经活动增强,副交感神经活动下降,频域指标LF/HF的下降反应了交感神经和副交感神经系统活动的均衡状态发生变化,这与文献[4,6]的研究结论相一致,因此本文选择HRVTi和LF/HF作为时域和频域的识别指标.从图4可知,ICBN分析方法中,CHF与NSR1相比,WB指标均值增大,PW指标和CL指标均值减小.WB指标反映的是不同层级模态分量的波动特性的加权值,CHF 患者的HRV信号波动特性相对NSR1组的健康人更强,信号频率成分更复杂,所以CHF患者的WB均值更大.PW指标反映的是模态分量的波动特性在整个网络中的分布情况,而NSR1组对象的HRV信号频率成分更简单,根据LPHVG构建的网络节点的度值较小,CHF患者的HRV信号频率成分复杂,构建的网络边数更多,节点的度值更大,所以CHF患者具有更小的PW值.而CL值反映的是构建的网络的所有节点之间最短路径长度的平均值,是网络的全局特征,因为CHF患者的网络具有更多的边,所有节点之间有更多的路径和更短的路径,所以CHF组具有更小的CL值.ICBN 方法是对HRV在不同时频尺度空间下的非线性特征之间的关系进行分析,反映了充血性心力衰竭病人交感神经和副交感神经之间复杂的耦合关系.ICBN方法中CHF 对象的WB指标、PW指标和CL指标标准差均大于NSR1组,因标准差是对数据离散程度的度量,而ICBN方法是通过度量每个IMF的复杂性来实现对HRV信号的度量,WB指标、PW指标和CL指标标准差越大表示CHF组病人的HRV信号之间差异大,自主神经系统的调控越活跃,而NSR1组实验对象之间的差异则较小,实验对象的自主神经系统活动更有规律.本文的研究初步表明,ICBN方法能够对CHF病人和健康人的HRV信号进行度量并进行区分,但其背后的生理学机制有待深入研究. 从表4和表5可知,在ICBN方法中,WB,PW和CL相对于时域指标HRVTi和频域指标LF/HF具有更高的识别正确率,WB,CL和LF/HF这3个指标组合的情况下具有最高的分类正确率.实验结果表明,ICBN方法提高了分类的正确率,WB,PW和CL 指标,对于CHF病人的筛选具有相对于时域HRVTi指标和频域LF/HF指标更好的分类效果,通过表5还可以看出不是指标越多分类效果越好.因为指标之间并不相互独立,过多的指标会导致分类器出现过拟合现象,使模型不稳定,分类性能下降.分类正确率最高的组合中均包含本文提出的ICBN方法中的指标,表明了本文提出的ICBN 方法对HRV信号的度量具有一定的应用价值.从表6可知,对于AF和NSR2这2组实验对象,所有的时域和频域指标中,SDNN,pNN50,RMSSD和LF/HF表现出了极显著的统计学差异(p<0.001),这与文献[24]的研究结论相一致,所以本文选择SDNN,pNN50,RMSSD和LF/HF作为时域和频域指标.从图5可知,ICBN方法中,AF与NSR2相比,WB指标均值增大,PW指标均值减小,与CHF患者和NSR1的情况相同.WB指标反映的是不同层级模态分量的波动特性的加权值,因疾病原因,AF患者的HRV信号波动特性更强,信号频率成分更复杂,所以AF患者的WB均值更大.PW指标是网络单位度值下的点权值,而NSR2组的HRV信号频率成分相对AF组简单,根据LPHVG构建的网络节点的度值小,AF患者的HRV信号频率成分复杂,构建的网络边数更多,网络中度值更大,所以AF患者具有更小的PW值.AF组的WB和PW指标的标准差均大于NSR2组,因标准差是对数据离散程度的度量,而ICBN方法是通过度量每个IMF的复杂性来实现对HRV 信号的度量的,WB和PW指标标准差越大表示AF组病人的HRV信号之间差异越大,而NSR2组实验对象之间的差异则较小,HRV信号更有规律.从表7和表8可知,在ICBN方法中,WB和PW指标相对于时域指标SDNN,pNN50和RMSSD,频域指标LF/HF具有更高的识别正确率.对于AF病人的筛选,在组合所有极显著差异指标后,WB,PW,pNN50,RMSSD和LFHF组合表现出了最高的分类正确率,且分类正确率最高的组合中均包含本文提出的ICBN方法中的指标.实验结果表明,ICBN方法提高了AF病人分类的正确率,对HRV信号的度量具有一定的应用价值.还可以看出,因为指标之间并非完全独立,过多的指标组合会导致分类器出现过拟合现象,反而会降低分类正确率.ICBN分析方法首先通过ICEEMDAN方法对HRV信号进行分解,因为健康人和病人(CHF与AF患者)的HRV信号在频率成分上存在一定的差异,ICEEMDAN将分解出不同数量和波动特性的IMFs,因HRV信号内在的生理信息不能单纯地通过信号分解进行分离,因此在不同IMFs之间存在着耦合的生理信息,所以通过bubble 熵对IMFs的无序特性进行度量,然后将得到的bubble熵值通过LPHVG方法构建成网络,通过对网络特征的分析实现不同IMF之间耦合生理信息的分析.因为健康人和病人将构建出具有不同网络特征的网络,通过网络特征WB,PW,TP,CL和MC对网络进行度量,实现对HRV信号的度量.ICBN方法中包含了5个指标,即WB,PW,CL,MC和TE.WB指标反映的是不同层级IMF的波动特性的加权值,CHF 和AF患者的HRV信号频率成分相对于健康人更复杂,因此AF和CHF患者的WB 值更大.PW指标反映的是网络的单位度值下的点权值,健康人的HRV信号规律性强,频率成分简单,得到的IMF数量少,因此LPHVG构建的网络、节点和边的数量少,节点的度值小.相反,CHF和AF患者的HRV信号频率成分复杂,构建的网络具有更大的度值,因此具有更小的PW值.CL值反映的是构建的网络的所有节点之间路径长度的平均值,是网络的全局特征,如果构建的网络的节点之间有更多的路径和更短的路径,则具有更小的CL值.MC指标反应的是网络的平均聚集程度,在节点数相差不大的情况下,如果构建的网络具有更多的边,则聚集程度更高.TE反映的是网络的序特征,网络的结构越规则,TE值越小.WB和PW这2个网络特征度量指标的计算过程是对HRV信号不同时频尺度下IMFs的bubble熵值直接进行应用,而CL,MC 和TE更多的是对网络结构特征的度量,对模态分量的bubble熵值是一种间接的应用,所以WB和PW相对于CL,MC和TE具有更好的分类效果.5 结论本文首先将提出的ICBN方法和传统的时域、频域分析方法分别应用于NSR1组和CHF组实验对象,结果表明,ICBN方法相对于时域和频域指标具有更高的识别正确率,并且本文提出的WB和CL指标与频域指标LF/HF作为特征向量,通过Fisher 判别方法对CHF病人识别正确率达89.66%.然后将ICBN方法、时域和频域分析方法应用于NSR2组和AF组实验对象,结果表明ICBN方法中的指标相对于时域和频域指标具有更高的识别正确率.将时域指标pNN50,RMSSD,频域指标LF/HF,WB和PW指标作为特征向量,Fisher判别方法对AF患者的识别正确率达到91.86%.综合以上实验结果可知,本文提出的ICBN方法具有一定的心率变异性度量能力.ICBN分析方法在不同时频尺度空间下对非线性和非平稳的HRV的复杂波动特性进行分析,是评价交感神经和副交感神经系统调节的潜在指标.ICBN分析方法的提出,为心脏自主调节的复杂波动分析和HRV信号的度量分析提供了新的思路.参考文献。
基于emd近似熵特征提取和支持向量机的故障诊断方法

基于emd近似熵特征提取和支持向量机的故障诊断方法近年来,随着工业自动化程度的不断提高,各种机械设备的使用越来越广泛,但是机械故障的发生也越来越频繁。
因此,对机械设备进行及时有效的故障诊断就显得尤为重要。
故障诊断方法的研究一直是机械工程领域的热点问题之一。
本文将介绍一种基于emd近似熵特征提取和支持向量机的故障诊断方法。
一、emd近似熵特征提取emd近似熵是一种新型的信号分析方法,它可以有效地提取信号的非线性特征。
emd近似熵的基本思想是将原始信号分解成若干个本征模函数(IMF),然后对每个IMF进行emd近似熵计算,最终得到整个信号的emd近似熵。
在本文中,我们采用emd近似熵特征提取方法对机械故障信号进行处理。
具体步骤如下:1. 将原始信号分解成若干个IMF。
2. 对每个IMF进行emd近似熵计算,得到emd近似熵谱。
3. 将emd近似熵谱作为特征向量,用于故障诊断。
二、支持向量机支持向量机(SVM)是一种常用的分类器,它可以有效地处理高维数据和非线性问题。
SVM的基本思想是将数据映射到高维空间中,然后在该空间中找到最优的超平面,将不同类别的数据分开。
在本文中,我们采用SVM对机械故障信号进行分类。
具体步骤如下:1. 将emd近似熵谱作为特征向量,构建训练集和测试集。
2. 选择合适的SVM核函数和参数,训练SVM模型。
3. 对测试集进行预测,得到故障诊断结果。
三、实验结果为了验证本文提出的故障诊断方法的有效性,我们在一个实验平台上进行了实验。
该平台由一个带有故障的轴承和一个加速度传感器组成,采集了轴承在不同故障状态下的振动信号。
我们将采集到的信号分别进行emd近似熵特征提取和SVM分类,得到了如下结果:1. 在滚珠故障状态下,本文方法的准确率为96.7%。
2. 在内圈故障状态下,本文方法的准确率为93.3%。
3. 在外圈故障状态下,本文方法的准确率为90.0%。
以上结果表明,本文提出的故障诊断方法具有较高的准确率和可靠性,可以有效地应用于机械故障诊断领域。
基于样本熵的运动想象脑电信号特征提取与分类方法

基于样本熵的运动想象脑电信号特征提取与分类方法作者:马满振来源:《山东工业技术》2017年第07期摘要:脑-机接口是一种允许人脑与外部接口直接交流的系统,它通过识别不同思维下的脑电信号,并将其转换为控制信号,来实现意念控制。
传统的基于EEG信号频域特性进行特征提取的方法无法达到高分类正确率的要求[1]。
本文提出基于小波变换与样本熵的运动想象脑电信号特征提取方法。
分析了左右手运动想象EEG信号样本熵的动态变化规律及其神经电生理意义。
最后利用Fisher线性判别式进行了左右手运动想象脑电的分类,得到了较好的分类结果,平均最大分类正确率达到了90.3%,证明了该方案具有很大的可行性和实用价值。
关键词:脑机接口;运动想象;小波变换;样本熵DOI:10.16640/ki.37-1222/t.2017.07.2621 引言脑-机接口(Brain-Computer Interface,BCI)是一种允许人脑与外部接口直接交流的一种系统[2]。
BCI通过实时测量与使用者意图相关的大脑活动,并将这个活动转化为相应的控制信号,从而达到对设备实时控制的目的[3]。
BCI最终的目标是形成更加自然顺畅的人-机交流方式,这对某些特殊环境中的外部设备操控人员(如坦克操控人员、潜水员、宇航员等)来说,可以增加人员对专用设备的特殊控制技能,同时还可以达到减少人员工作量,提高工作效率和控制精度等效果。
基于左右手运动想象脑电的BCI,其实现最为关键的环节是脑电信号的特征提取。
目前的特征提取方法主要有自回归(AR)模型[4]、功率谱估计[5]、小波变换[6]等。
AR模型和功率谱估计属于频域分析法,无法很好的表征EEG信号的时域信息;小波变换属于时频分析法,虽然可以同时分析信号的时域和频域信息,但不能同时在时域和频域有高的分辨率。
因此,寻找更加有效的左右手运动想象脑电特征对于改善BCI性能是非常有意义的。
本研究提出了将小波与样本熵结合进行EEG信号特征提取,首先利用小波对EEG原始信号进行去噪,然后采用非线性动力学参数“样本熵”作为脑电特征进行分类。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
肖苗 等
X = m (i )
1) 按照序号组成的一组 维数为 m 的向量序列, X m (1) , X m ( 2 ) , , X m ( i ) , , X m ( N − m + 1) ,其中 2) 定义向量 X m ( i ) 和 X m ( j ) 之间的距离 D X m ( i ) , X m ( j ) 为两者对应元素中最大差值的绝对值。即:
1 2
School of Information, Yunnan University, Kunming Yunnan Yunnan Fuwai Cardiovascular Disease Hospital, Kunming Yunnan
th th th
Received: Dec. 15 , 2018; accepted: Dec. 28 , 2018; published: Jan. 4 , 2019
基于CEEMDAN样本熵的心音信号特征提取及 识别研究
肖
1 2
苗1,常
俊1,潘家华2,杨宏波2,王威廉1
云南大学信息学院,云南 昆明 云南省阜外心血管病医院,云南 昆明
文章引用: 肖苗, 常俊, 潘家华, 杨宏波, 王威廉. 基于 CEEMDAN 样本熵的心音信号特征提取及识别研究[J]. 生物医 学, 2019, 9(1): 1-9. DOI: 10.12677/hjbm.2019.91001
Keywords
CEEMDAN (Complete Ensemble Empirical Mode Decomposition with Adaptive Noise), Sample Entropy, Heart Sound, CHD (Congenital Heart Disease), Factorization Machines (FM)
Open Access
1. 引言
心脏听诊是临床诊断的重要手段,尤其在先心病初诊和筛查中更为重要。对心音信号进行分类识别 研究有重要的科学和临床意义。对信号进行分类识别,包括特征提取和分类识别两个过程。由于心音信 号采集的不稳定和信号的非平稳特性,且微弱的心音信号经常被背景噪声所淹没,直接进行特征提取和 分类识别有困难。经验模式分解(Empirical Mode Decomposition, EMD) [1]是由 N E Huang 等人在 1998 年 提出的一种处理非线性、非平稳信号的时频分析方法,在心音分析领域内得到广泛应用。为了解决 EMD 的模态混叠现象,Huang [2]提出的完备经验模态分解(Ensemble Empirical Mode Decomposition, EEMD), EEMD 是在 EMD 算法的基础上加入高斯白噪声,利用其均匀尺度的性质,改善心音信号的极值点特性 和模态混叠现象,但 EEMD 的分解完备性较差,如果参数选择不当,分解会产生较多的虚假分量。Torres [3]等提出了一种自适应噪声完备经验模态分解(Complete EEMD with Adaptive Noise, CEEMDAN),不仅 提高了分解效果,也改善了分解的完备性。 样本熵[4]是在近似熵的基础上发展而来的一种新的时间序列复杂性的度量方法,与近似商相比,其 抗干扰能力更强,有更好的统计稳定性。 因子分解机[5] (Factorization Machines, FM)算法是由 Steffen Rendle 等提出的一种基于矩阵分解模型 的机器学习算法,它将支持向量机的优势融入到了因子分解模型中。在对特征进行建模的过程中,因子 分解机模型不仅考虑了单个特征对模型的影响,而且也考虑了特征与特征之间的相互关系。因子分解机 算法的出现,为特征稀疏的问题提供了一种有效的途径。 本文根据心音信号分析中存在的问题,提出了一种基于 CEEMDAN [6]分解与样本熵[7] [8]相结合的 心音特征提取方法,用 CEEMDAN 方法将心音信号分解为若干个 IMF 分量,求其样本熵,并构造成特 征向量, 实现心音特征向量化。 在分类识别算法上, 本文构造了二分类因子分解机(Factorization Machines, FM)模型与 SVM 分类器对利用上述方法提取的特征进行了智能分类比较, 通过对 600 例先心病病例心音
j =1
J
(7)
2.2. 样本熵
样本熵(SampEn) [11]是基于近似熵(ApEn) [12]的一种用于度量时间序列复杂性的改进方法,都是通 过度量信号中产生新模式的概率大小来衡量时间序列复杂性,新模式产生的概率越大,序列的复杂性就 越大。与近似熵相比, 样本熵具有两个优势: 样本熵的计算不依赖数据长度; 样本熵具有更好的一致性, 即参数 m 和 r 的变化对样本熵的影响程度是相同的。样本熵的定义过程如下:
关键词
自适应噪声的完备经验模态分解,样本熵,心音,先心病,因子分解机
Copyright © 2019 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). /licenses/by/4.0/
(2)
3) 进行 i 次试验,每次对 r1 ( t ) + ε1 E1 ( ni ( t ) ) 进行分解,直至得到第 1 个模态分量,定义第 2 个模态 分量
1 I Z 2 ( t ) = ∑ E1 r1 ( t ) + ε1 E1 ( ni ( t ) ) I i=1
(
)
(3)
4) 对于 j = 2,3
肖苗 等
收稿日期:2018年12月15日;录用日期:2018年12月28日;发布日期:2019年1月4日
摘
要
针对心音信号的非平稳特性和易被噪声干扰的特点,本文提出一种基于自适应噪声的完备经验模态分解 (CEEMDAN)与IMF样本熵结合的特征提取方法。 将信号进行CEEMDAN自适应分解为若干个IMF分量, 并 计算各阶 IMF 分量的样本熵作为特征向量。在此基础上提出一种基于因子分解机 (Factorization Machines, FM)的推荐模型,能更好的处理稀疏大数据的缺点,较好的解决了样本熵的稀疏性。为了验证该 模型的优劣,进行了AUC曲线分析。通过对600例先心病病例心音和600例正常心音实验数据分析,证明 该方法能够改善信号特征提取的效果,对先心病心音类型上的判断表现出较高的识别率。
Hans Journal of Biomedicine 生物医学, 2019, 9(1), 1-9 Published Online January 2019 in Hans. /journal/hjbm https:///10.12677/hjbm.2019.91001
Abstract
Due to the nonstationary characteristics of heart sound signal which was often disturbed by noise, a feature extraction method based on complete ensemble empirical mode decomposition with adaptive noise (CEEMDAN) with IMF sample entropy was proposed in this work. The heart sound signals were adaptively decomposed into several IMF components by using CEEDDAN, and the sample entropy of each order IMF component was calculated as the feature vector. A recommendation model based on Factorization Machines (FM) was proposed, which can deal with the disadvantages of sparse big data and solve the sparsity of sample entropy better. In order to verify the pros and cons of the model, AUC curve analysis was performed. 600 heart sounds of congenital heart disease and 600 normal heart sounds were analyzed. It is proved that the method can improve the signal feature extraction and show a higher recognition rate for the heart sound of congenital heart disease.
, I ,对
适应高斯白噪声来计算唯一的残余信号,设 S ( t ) 为原始信号,令 Z i ( t ) 为 EMD 分解得到的第 j 个模态分
Z1 ( t ) =
2) j = 1 时,计算第 1 个残余量
1 I i ∑ d1 ( t ) I i=1
(1)
r1= ( t ) S ( t ) − Z1 ( t )
DOI: 10.12677/hjbm.2019.91001 2 生物医学
肖苗 等
和 600 例正常心音实验数据分析, 实验结果表明 CEEMDAN 与样本熵相结合的方法在心音类型分类识别 中的准确性高。
2. 基本原理
2.1. CEEMDAN 算法
EMD 将信号分解为一组 IMF 和余项之和。EEMD [7]在 EMD 基础上附加频率均匀分布的高斯白噪 声,使信号在不同尺度上具有连续性,以减少模态混叠的程度。CEEMDAN [9] [10]通过每个阶段附加自 量, ni ( t ) 为第 i 次添加的零均值,方差为 1 的白噪声序列, ε 为信噪比控制系数。则 CEEMDAN 模态分 解步骤如下: 每个 Si ( t ) 进行 EMD 分解,直到分解出第 1 个 IMF 分量 Z1 ( t ) ,定义 CEEMDAN 的第 1 个 IMF 分量为: 1) 向待处理信号 S ( t ) 中分别加入多次白噪声序列 ni ( t ) ,构造出 Si ( t ) = ε ni ( t ) , i = S (t ) + 1, 2,