基于基音周期预测的低速率语音隐写

合集下载

基于ARM的低速率语音编码的研究与设计

基于ARM的低速率语音编码的研究与设计
s m s g o p fsn od o s n h sz h p e h i n l n h r q e ce f t e e sn s is r utpe f u a r u o ius is t y t e ie t e s e c sg a, d t e fe u n is o h s i u od a e m l ls o a i
2 低速 率语 音编码 的算法
用谐 波编码方 法合 成语音 能够很 好地模拟 语音 的时域 或者是频 域特征 。而 且谐波编 码方法 能够直 接调节 合成语 音 的频 域特征 参数而 不用 像C L 、M L 编 码算 法那 样需要 EP EP 控 制带通 滤波器 的系数 。最初 的一些 谐波编 码算法 虽然能 够准 确地 控制谐 波 的幅度 、相 位 以及 频率参 数 ,但 是编码 端 必须传 送的一 些附加 参数会 增加编码 的 比特 数 。为 了减 少编 码端所要传送 的参数个数 ,一 种基于C W 音编译码算 S语 法 被提 出。该算 法通过 叠加一 组正弦 波来合 成语音 ,这组 正 弦波 的频率是基 音频 率的整 数倍数 ,它们 的幅度 、相位 和频 率都是时变 的。合成语音信 号S t 可 以用公 式 ( . ) () 2 1
fn a na e u n yA dtip o es s efr db en l M 9 0 I ui S C2 l f a u g . u d me tlrq e c .n s r c s wa rome yk r eAR f h p 2 T( s t mp 3 4 0o ms n ) S S Ke r slw i r t e c o i g C W d n l o i m; S O; e se A M ywo d : bt aes e h c d n ; S c i gag r h M V e o p o t mb d s t m; R y

低速率语音编解码声码器的实现

低速率语音编解码声码器的实现

随着 我 国通 信 市 场 发展 步 伐 的加 快 , 音 传 语 输这 一通 信传 输 服 务 得 到 了迅 速 的 发展 . 速 率 低
理 去 除工频 干扰并 进行 预加 重 . 后进 行线性 预 然
的语音传 输 能够 降低 价格 、 维持 高品质 , 同时能够 提 供保 密功 能 . 由于使 用 者 的 增加 和有 限 带 宽 的
限制 , 音 编码 速率 已 由 8 b s c L ) 4 8 b s 语 K p( E P 和 .K p
( S c L ) 至 2 4 b s以 下 . c —A E P 降 .K p 由于 编 码 速 率
的降低 , 音 的品 质 就 只 能通 过 复 杂 的算 法 来 提 语
升 “.
第3 3卷
第 3期
2O 0 6年
低 速 率语 音 编解 码 声码 器 的 实现
石广 源 , 王福 君
( 宁大 学 物 理 系 , 宁 沈 阳 103 ) 辽 辽 10 6
摘 要 : 于 编 码 速 率 60 p 的 S L 音 算 法 , 出一 种 新 的 语 音 编 解 码 芯 片 . 基 0 bs E P语 提 电路 设 计 时 满 足 算 法 复 杂 度 高 、 算 量 大 的 需 求 , 而 使 声 码 器 在 极 低 的速 率 下 更 高 效 地 工 作 , 得 更 好 的语 音 重 建 质 量 . 运 从 获 同时 , 声
图 2 解 码 器 功 能 框 图
示 . 入 8k z 样 率 的语 音信 号 首 先 经 过 预 处 输 H 采
测分 析 , 每帧语 音提取 预测 系数 、 对 基音周 期和余
- 作 者 简 介 : 广 源 (9 1)男 . 宁 沈 阳人 . 宁 大 学 副 教 授 , 事 微 电 子学 与 微 电子 技 术 研究 石 15. . 辽 辽 从 基 金 项 目 : 阳 市 科 委 科 研项 目(O 22— 2 6 沈 1309 —o )

一种基于基音预测的信息隐藏算法

一种基于基音预测的信息隐藏算法
P 协议 ; 基音周期 ;长时预测
An I n f o r ma t i o n Hi d i n g Al g o r i t h m Ba s e d o n Pi t c h Pr e d i c t i 0 n
s e c r e t i n f o r ma t i o n i s u p t o 3 7 4 . 6 3 6 b i f s , he t d e t e i r o r a t i o n o f P e r c e p t u a l E v a ! u a t i o n o f S p e e c h Qu a l i t y ( P E S Q 1 i s l e s s ha t n 1 0 . 4 %a nd
第3 9卷 第 2期
、 厂 0 1 . 3 9






2 0 1 3年 2月
F e b r u a r y 2 01 3
No . 2
Co mp u t e r E n g i n e e r i n g
安全技术 ・

文章 埔号 l 1 o o 0 _ - _ 3 4 2 8 ( 2 o 1 3 ) o 2 — 0 1 3 7 — o 4 文 献 标 识 码 t A
中 圈 分 类 号 l T N 9 1 1 . 7
种 基 于基音预 测 的信 息隐藏算 法
刘程浩 l a , l b 9柏 森 l a , l b t黄永蜂 ,阳 溢 l a , l b I t 李松斌
2 .清华大学 电子工程 系,北京 1 0 0 0 8 4 )
( 1 . 重庆通信学院 a . 应急通信重庆市重点实验室 ; b . 图像通信实验室,重庆 4 0 0 0 3 5 ;

低速语音编码

低速语音编码

低速率语音编码的实现与仿真摘要:近年来,随着通信与计算机网络的飞速发展,低速率语音编码以其低速率且良好的编码质量等特点,在数字通信中越来越受到重视。

低速率语音编码方案主要是基于LPC-10,混合激励线性预测(MELP),多带激励编码(MBE),正弦变换编码(SCI)等。

它们大都能够工作在2.4kbps速率下。

本文对LPC-10进行了研究,以LPC模型为原型,通过联合帧、矢量量化及参数内插等技术,实现了一种低速率语音编码算法。

归一化互相关函数基音检测算法(NCCFPDA)的引入,提高了清浊音判决的准确率;线谱对(LSP)参数的量化特性,降低了误差率,提高了算法的稳健性;固定矢量量化码本(LSPVQ码本)提高了量化精度并降低了传输码率;联合帧的应用,较好的平衡了低码率与语音质量严重恶化的矛盾,而与参数内插技术的结合更加降低了传输码率。

通过该算法获得了比较满意的合成语音,并在MATLAB中得到实现,验证了算法的可行性。

关键词:语音编码,基音检测,LSP,MATLAB目录第一章绪论 (4)1.1引言 (4)1.2低速率语音编码研究现状 (4)1.3常用低速率语音编码算法 (5)1.3本文主要研究内容及章节安排 (6)第二章 LPC-10编码算法 (7)2.1LPC-10编码算法的理论依据 (7)2.1.1 语音信号的产生模型 (7)2.1.2语音信号的线性预测分析[8] (7)2.2LPC-10编解码算法的分析[9] (8)2.2.1 LPC-10编码算法分析 (8)2.2.2 计算声道滤波参数RC (9)2.2.3 计算增益RMS (10)2.2.4 提取基音周期和检测清/浊音 (10)2.2.5 参数编码与解码 (10)2.2.6 LPC-10解码算法分析 (10)2.3LPC-10声码器存在的问题[9] (11)第三章 900BIT/S极低速率编码算法 (12)3.1算法概述 (12)3.2编码原理 (13)3.2.1预处理 (13)3.2.2线性预测分析 (14)3.2.3 NCCFPDA算法[12] (16)3.2.4 矢量量化[9] (19)3.2.5参数编码 (20)3.3解码原理 (20)3.3.1参数解码 (21)3.3.2合成语音 (21)3.4本章小节 (22)第四章低速率语音编解码算法的仿真实现 (23)4.1仿真实验平台 (23)4.2编解码器的工作流程 (23)4.2语音编码仿真结果 (24)第五章结论与展望 (25)5.1结论 (25)5.2展望 (25)参考文献 (26)第一章绪论1.1引言语音通信是一种非常重要且普遍的通信方式。

基于统计模型及SVM的低速率语音编码QIM隐写检测

基于统计模型及SVM的低速率语音编码QIM隐写检测

) H a i k o u L a b o r a t o r o A c o u s t i c s, I n s t i t u t e o A c o u s t i c s, C h i n e s e A c a d e m o S c i e n c e s,H a i k o u 5 7 0 1 0 5 y f f y f
I M D e t e c t i o n o f S t e a n o r a h i n L o w B i t a t e S e e c h C o d e c B a s e d o n -R Q g g p y p M o d e l s a n d S VM S t a t i s t i c a l
1 L I S o n B i n - g
1) (
) , 3)
1 2 Y o n F e n U J i C a n HUANG - - g g L g


2) ( 3) (
) D e a r t m e n t o E l e c t r o n i c E n i n e e r i n T s i n h u a U n i v e r s i t B e i i n 0 0 0 8 4 p f g g, g y, j g 1 ) Z h e n z h o u I n o r m a t i o n S c i e n c e a n d T e c h n o l o I n s t i t u t e, Z h e n z h o u 4 5 0 0 0 2 g f g y g
6期
李松斌等 :基于统计模型及 S VM 的低速率语音编码 Q I M 隐写检测
1 1 6 9
但些研究主要针对图像作为载体 时 的 Q 研究 , I M

基于统计模型及SVM的低速率语音编码QIM隐写检测

基于统计模型及SVM的低速率语音编码QIM隐写检测

基于统计模型及SVM的低速率语音编码QIM隐写检测李松斌;黄永峰;卢记仓【期刊名称】《计算机学报》【年(卷),期】2013(036)006【摘要】QIM(Quantization Index Modulation,量化索引调制)隐写在标量或矢量量化时嵌入机密信息,可在语音压缩编码过程中进行高隐蔽性的信息隐藏,文中试图对该种隐写进行检测.文中发现该种隐写将导致压缩语音流中的音素分布特性发生改变,提出了音素向量空间模型和音素状态转移模型对音素分布特性进行了量化表示.基于所得量化特征并结合SVM(Support Vector Machine,支持向量机)构建了隐写检测器.针对典型的低速率语音编码标准G.729以及G.723.1的实验表明,文中方法性能远优于现有检测方法,实现了对QIM隐写的快速准确检测.%Quantization Index Modulation (QIM) steganography,which embeds the secret information during the Vector Quantization,can hide information in low bit-rate speech codec with high imperceptibility.This paper tries to detect this type of steganography.For this purpose,starting from the speech generation and compress coding theory,this paper firstly analyzes the possible significant feature degradation through the QIM steganography in compressed audio stream deeply.And it finds that the QIM steganography will disturb the phoneme sequence in the stream,and inevitably make the imbalance and correlation characteristics of phoneme distribution in the sequence change.According to this discovery,this paper adopts the phoneme distribution characteristics as the key for thedetection of the QIM steganography.In order to get the quantitative features of phoneme distribution characteristics,this paper designs the Phoneme Vector Space Model and the Phoneme State Transition Model to quantify the imbalance and correlation characteristics respectively.By combining the quantitative vector features with supervised learning classifier,this paper builds a high performance detector towards the QIM steganography in low bit-rate speech codec.The experiments show that,for the two typical low bit-rate speech codec:G.729 and G.723.1,the proposed method has an excellent performance compared to existing method.【总页数】9页(P1168-1176)【作者】李松斌;黄永峰;卢记仓【作者单位】清华大学电子工程系北京100084;中国科学院声学研究所南海研究站海口 570105;清华大学电子工程系北京100084;解放军信息工程大学网络工程系郑州 450002【正文语种】中文【中图分类】TP309【相关文献】1.基于提升小波分解的低速率波形内插语音编码算法 [J], 李如玮;鲍长春2.基于DSP的甚低速率语音编码算法及其实现 [J], 赵继勇;曹芳;梁妙元;刘亚峰3.基于基音周期预测的低速率语音隐写 [J], 严书凡;汤光明;孙怡峰4.基于小波变换和压缩感知的低速率语音编码方案 [J], 叶蕾;杨震;郭海燕5.基于压缩感知的低速率语音编码新方案 [J], 叶蕾;杨震;孙林慧因版权原因,仅展示原文概要,查看原文内容请购买。

基于统计模型及SVM的低速率语音编码QIM隐写检测.

基于统计模型及SVM的低速率语音编码QIM隐写检测.

6期李松斌等:基于统计模型及SVM的低速率语音编码QIM隐写检测1173融合特征向量中的子向量在隐写前后的取值发生了改变;对于G所有文件的V.729,VR均值为0.86,对于G因此可以认为本文所提.723.1该值为0.68.——隐写将导致该特取的特征对隐写是非常敏感的—征发生显著性变化.这对隐写检测非常有利.用支持向量机作为分类器.SVM分类器是一种监督学习分类器,它是通过使用某些已标注类别的样本,进行训练获得的.对于特征向量t分类器f的训练和预测步骤如下:()获取尽可能多的c1over类别低速率压缩编并使用Q分组码本使用码语音片段,IM嵌入方法(]文献[算法进行优化划分)进行隐写以获得c8over类别中每个样本对应的s并做好标注;teo样本,g()抽取上一步骤所获得的两类样本的特征向2,标记每个向量的类别;量t()训练分类器:使用上一步骤获得已标记类3别的特征向量集合训练分类器,获得分类器f;()使用分类器f对未知类别样本进行隐写检4,测:对于未知类别样本首先抽取特征向量t将t作分类器输出即为隐写检测结为分类器f的输入,果.本文基于LIBSVM是一个优秀的SVM工具,LIBSVM进行分类器的训练和预测.3基于机器学习的隐写检测假设有一个未知是否存在QIM隐写的压缩语,音片段S隐写检测的目标即判定S是否存在QIM隐写.假设通过对S进行处理所抽取的可用于隐写检,)测的特征向量为t则隐写检测过程可用式(表示:9),}()t+1,-19y=f(y∈{其中函数f为隐写检测器其输出结果即为检测结若y=+1,表示S不存在隐写,否则存在隐写.果,显然函数f是一个二值分类器,隐写检测过程实质上是分类过程:假设y=+1时S属于未隐写类(称,为c称为sover类)teogy=-1时S属于隐写类(,类)则隐写检测就是将未知类别的样本S分为对于分类问题,基于机器学习cover类或steo类.g的分类方法是当前主流,本文也采用这种方法.对于未知类别的压缩语音片段,本文基于机器学习的隐写检测过程如图4所示.显然,隐写检测的关键是确定特征向量t和分类器f.4实验及讨论本文选择G.729和G.723.1作为实验测试所]用的低速率语音编码器,并采用文献[给出的方法8本文针对两种编码器分别进行了本作为隐写算法.文隐写检测方法的性能测试,并与文献[给出的13]隐写检测方法进行了比较.为了阐明算法具有较好的普适性,本文选择不同发音人的多个语音片段组成语音样本库.所用语音片段样本包含4个种类,分别是中文男声图4压缩语音片段隐写检测过程(,,包含5中文女ChineseManCM)00个语音片段;,,包含5英声(ChineseWomanCW)32个语音片段;,,文男声(包含8EnlishManEM)18个语音片段;g,,英文女声(包含8EnlishWomanEW)24个语音g片段.语音片段总计2每个语音片段的时长674个.,,为1采样率为8对每个采样点用10s000Hz6bit进行量化,用PCM格式存储.我们称没有进行信息隐藏的压缩语音片段为未,隐写类(否则称其为隐写类(不同类别C类)S类).发音人的语音片段编码所得的C类及其对应的S类压缩语音流片段构成进行分类器进行训练和预由于本文已将隐写检测问题转化为测时的数据集.)分类问题,因此本文采用式(定义的分类准确率10]在文献[中,特征向量的提取必须首先对压13缩语音片段进行解码,其后基于解码获得的语音数据计算基于MF这种特征提取CC的统计特征向量,方法需要进行解码操作,甚为耗时.上一节中我们介绍了本文的特征提取方法,该方法不需要对压缩语音进行解码,直接在压缩域抽取特征向量,计算速度较快.为此,本文将上节给出的音素分布特性量化向量H作为特征向量t.关于分类器的设计,现有研究中,不同的对象分这些方法大致可分类识别系统有不同的训练方法,为两大类:判别法(和生成discriminativearoach)pp)法(判别法可以灵活地选择用enerativearoach.gpp来识别的特征,检测速度也较快,为此本文采用基于判别法的分类器.在判别型分类器中,由于支持向量,机(较适合小样本SuortVectorMachineSVM)pp训练的情况,本文考虑到训练时间和训练样本量,使Precision对检测算法的性能的进行评估:^+^λ θ Precision=λ+θ ()10^其中λ 和θ 是数据集中的C类和S类样本的个数,λ ^和θ 则是被分类器准确判定类别的C类和S类样本1174计算机学报2013年的个数.4.1低速率语音编码器QIM隐写检测结果对语音样本库中CM中的每个PCM格式存储的语音片段使用G获得.729编码器进行压缩编码,没有进行信息隐藏的500个G.729压缩语音流片,段,由于G因此每个片段包含.729的帧长为10ms这些压缩语音片段组成未隐写类1000个G.729帧,别(样本.使用文献[介绍的CC类)8]NV算法方法对G.729进行矢量量化时的3个分裂矢量码本进获得进行Q再次行优化划分,IM嵌入的分组码本.对每个PCM格式的语音样本进行基于G.729标准的编码压缩,并且,在对每个帧的LPC系数进行矢量量化时使用Q获得包含隐IM机制嵌入机密信息,,藏信息的5个压缩语音流片段这些压缩语00G.729样本.音片段组成隐写类别(S类)C类及其对应的S类压缩语音流片段构成进行分类器训练和预测时的同理可得CW、这CM数据集.EM和EW数据集.数据集.4个数据集的所有样本构成混合(Hbrid)y因此,本文在5个不同的数据集上评估了算法性能.用类似的方法获得使用G.723.1作为低速率进行检测算法性能评估的数据集.语音编码器时,,G.由于每个语音片段的长度为10s723.1的帧,长为3因此每个G0ms.723.1压缩语音片段包含333个帧.对上述的每个数据集,选择75%的C类样本及其对应的S类样本,组成该种类分类器的训练样本剩余的2库,5%样本组成测试样本库用于评估训练表1给出了测试结果,所得分类器的分类准确性.表1中列PDFV是使用本文方法获得的隐写检测结果,列MF的方法获得的隐写CC是使用文献[13]检测结果.从测试结果看本文方法在5个测试数据的方法,在语音片段时长为集上均优于文献[13]对于两种低速率语音编码标准,本文方法检10s时,测准确率均超过9而文献[的方法对于8%,13]对5个数据集检测G.723.1基本上无法有效检测:准确率均低于60%.表1语音片段时长为10s时的测试结果数据集名CMCWEMEWHbridy使用G.729的结果/%PDFV100.00100.00100.00100.0099.98MFCC94.0088.7280.0077.4386.70使用G.723.1的结果/%PDFV98.4096.8098.2297.8798.62MFCC49.6052.2654.6356.5552.76上面获得的测试结果所用的语音片段的时长为本文面向的是V10s.oIP中低速率编码的压缩语音流的隐写检测;进行隐VoIP中的语音流是实时流,为了达到较快检测以写检测前必须进行流的存储.及减少存储的数据量,显然达到可以接受的隐写检测准确率时,我们希望所需要存储的语音流时长越为此,我们在下文对语音片段时长与隐写检短越好.测的性能进行了评估.4.2压缩语音流时长对隐写检测结果的影响为了评估语音片段时长对隐写检测结果的影响,首先根据不同的低速率编码器的帧长,对数据集中的1对于0s长度的语音片段进行截短处理.,由于其帧长为1G.729,0ms10s长度的语音片段总共包含了1截取前N(个帧000帧,0<N1000)编码所需的采样值,构成时长为0.01×Ns的新的对这些新的CM、CW、EM、EW和Hbrid数据集.y数据集进行分类器的训练并测试分类准确性.表2给出了不同语音片段时长时(的检测N取不同值)结果.表2压缩语音流时长变化时的G.729QIM隐写检测结果时长/s0.100.150.200.400.801.603.204.806.408.00CM的检测结果/%PDFV69.1678.1485.4294.6199.4099.90100.00100.00100.00100.00MFCC53.6059.6058.8066.4067.6077.6087.2089.6089.6094.00CW的检测结果/%PDFV65.2280.3587.5994.7398.21100.00100.00100.00100.00100.00MFCC52.2657.8957.5260.5365.4167.6773.6881.9586.8488.35EM的检测结果/%PDFV67.8478.4285.5794.2599.0299.87100.00100.00100.00100.00MFCC57.0763.4163.6667.0777.0775.1277.3275.5976.8377.07EW的检测结果/%PDFV66.2074.7581.6793.5698.6699.7599.93100.00100.00100.00MFCC52.9156.8058.5060.4462.8667.2374.7675.2480.3481.30Hbrid的检测结果/%yPDFV74.3383.3889.6095.9299.1499.85100.00100.00100.00100.00MFCC58.3761.2161.7366.2969.5175.1178.9281.5484.4586.92为了更直观地比较两种方法的性能,图5给出了5个数据集的平均检测准确率与语音片段时长的从该图可以看出,随着语音片段时长的增关系图.加,隐写检测准确率也随之提升;本文方法在任一时长下其检测准确率均优于文献[的方法;在语音13]片段时长为0.40s时本文方法已能够达到有效检测(,检测准确率已经超过9而此时文献[的方0%)13]法仍不超过7因此,对于G.在语音片段时0%.729,6期李松斌等:基于统计模型及SVM的低速率语音编码QIM隐写检测1175];长较小时本文方法性能远优于文献[在语音片段13),时长较大时(超过4本文达到1.8s00%的隐写检]测准确率,这一点是文献[无法达到的.13个帧编码所需的采样值,构成时长为0.03×Ns的新的CM、对这些CW、EM、EW和Hbrid数据集.y新的数据集进行分类器的训练并测试分类准确性.表3给出了不同语音片段时长时(的N取不同值)为了更好地比较两种方法的性能,图6给检测结果.出了5个数据集的平均检测准确率与语音片段时长从该图可以看出,随着语音片段时长的增的关系图.加,本文方法的隐写检测准确率也随之提升,但是文]的方法其检测准确率一直低于6可以认献[130%(为无法对隐写作出检测)其原因可能是G..723.1[]每3的采样值采用文献的隐写方法仅0ms8QIM嵌入3嵌入率太低导致解码后的语音bit秘密信息,这使基采样值序列并不因隐写而产生较大的改变,于采样值序列统计的特征对隐写不够敏感,从而导但是本文方法是压缩域方法,不考察解致检测率低.码后的语音数据,因此仍能获得较好的隐写检测准在语音片段时长较大超过6本文方法检确率:s时,测准确率超过90%.图55个数据集的G.729QIM隐写检测平均准确率,由于G.723.1的帧长为30ms10s长度的语)音片段总共包含了3仍截取前N(33帧,0<N333表3压缩语音流时长变化时的G.723.1QIM隐写检测结果时长/s0.300.601.202.403.604.506.007.509.00CM的检测结果/%PDFV52.7955.4857.4871.8587.6289.4292.6196.1097.90MFCC56.8052.4056.8054.4051.2050.0057.2050.0051.20CW的检测结果/%PDFV45.9546.5251.1264.5680.4585.9090.9794.7395.86MFCC54.1451.8847.7451.5051.1356.3953.3857.8953.38EM的检测结果/%PDFV44.7449.7556.4780.0185.8190.9593.8295.9097.31MFCC50.2450.9852.4452.4453.9153.1751.9552.6849.02EW的检测结果/%PDFV45.6950.6060.7474.2787.1089.4494.2397.0297.63MFCC47.8250.7355.1052.1853.6453.8853.4052.4355.10Hbrid的检测结果/%yPDFV49.7153.9668.3780.1888.7891.7095.1297.2398.09MFCC48.8050.4548.7352.4752.0251.7953.4452.3253.145总结本文对在低速率语音编码过程中的QIM隐写给出了高效的检测方法.本文发现一段语音中的音素其分布存在不均衡性和相关性,据此本文提出了一种基于压缩域的隐写检测特征抽取方法,并结合支持向量机构建了隐写检测分类器.与基于时域的,特征抽取方法相比本文方法不仅具有较高的检测而且节省了压缩语音的解码时间,实现了对准确率,压缩语音流的快速隐写检测.本文方法借鉴了文档正是利用这些的向量空间表示方法及其分类模型,方法所蕴含的深刻思想建立了本文的隐写检测算图65个数据集的G.723.1QIM隐写检测平均准确率法.本文方法为隐写检测提供了一种新的思路.参考文献根据上述实验,本文方法对于两种典型的低速率语音编码器中的Q检测性IM隐写均能有效检测,能远优于时域特征抽取方法.[]M//1azurczkW,LubaczJ.SteanorahofVoIPstreamsyggpy1176计算机学报2013年Proceedinsofthe3rdInternationalSmosiumonInforma-gyp,M,tionSecurit.Monterreexico2008:10011018-yy[]H2uanY,XiaoB,XiaoH.Imlementationofcovertcom-gp//municationbasedonsteanorahProceedinsofthe4thggpygConferenceonIntellientInformationHidinInternationalgg,C,2andMultimediaSinalProcessin.Harbinhina008:gg15121515-[]L3iX,YuHH.Transarentandrobustaudiodatahidininpg//domainProceedinsoftheIEEEInternationalcestrumgpConferenceonMultimediaandExo.NewYork,USA,p2000:397400-[]W4anCT,ChenTS,ChaoWH.Anewaudiowatermark-g/inbasedonmodifieddiscretecosinetransformofMPEGg//AudioLaerIIIProceedinsoftheIEEEInternationalCon-yg,,,ferenceonNetworkinSensinandControl.TaieiChinaggp2004:265277-[]Wu,H5S,HuanJuanD,etal.Effcientlselfsnchro--ggyynizedaudiowatermarkinforassuredaudiodatatransmis-g,2:sion.IEEETransactionsonBroadcastin005,51(1)g6976-[]C:A6henB,WornellGW.Quantizationindexmodulationclassofmethodsfordiitalwatermarkinandrovabloodggpyginformationembeddin.IEEETransactionsonInformationg,():Theor2001,47414231443-y[],,7HuanYTanSYuanJ.SteanorahininactiveframesggggpyofVoIPstreamsencodedbsourcecodec.IEEETransactionsy,():onInformationForensicsandSecurit2011,62296306-y[],,8XiaoBoHuanYonfenanShanu.AnaroachtogggTgypp//informationhidininlowbitrateseechstreamProceedins-gpg,oftheIEEEGlobalCommunicationsConference.NewOrleansUSA,2008:19401944-[]M9alikH.StatisticalmodelinoffootrintsofQIMsteano-gpgg//rahProceedinsofthe2010IEEEInternationalConfer-pyg,enceonMultimediaandExo(ICME2010).Sinaorepgp2010:14871492-[]M10alikH,SubbalakshmiKP,ChandramouliR.NonarametricpsteanalsisofQIMdatahidinusinaroximateentro.gyggpppy,TransactionsonInformationForensicsandSecuritIEEEy():2012,72418431-[]M11alikH.SteanalsisofQIMsteanorahusinirreu-gyggpygg//laritmeasureProceedinsofthe10thACMWorkshoonygp,UK,MultimediaandSecurit.Oxford2008:149158-y[]Wu,,12QinxiaLiWeiinYuXiaoYi.Revisitsteanalsisonpggy//QIM-baseddatahidinProceedinsofthe5thInternationalggConferenceonIntellientInformationHidinandMultimediagg,SinalProcessin.KotoJaan,2009:929932-ggyp[]L,,13iuQinzhonSunAndrewHQiaoMenu.Temoralggggypderivativebasedsectrumandmelcestrumaudiosteanalsis.--ppgy,IEEETransactionsonInformationForensicsandSecurity():2009,43359368-[]:14QuatieriFThomas.Discrete-TimeSeechSinalProcessinpgg,UPrincilesandPractice.NJSA:PrenticeHallPTR,2002p,,LISoninbornin1981,Ph.D.-Bgassociateresearcher.Hisresearchinter-estsncludeultimedianformationimiandinformationhidin.rocessingpg,,rofessor.HUANGYonFenbornin1967,Ph.D.-pggHisresearchinterestsincludemultimedianetworksecurityandnextInternet.enerationg,bLUJianornin1985,Ph.D.candidate.His-Cgresearchinterestsincludesteanorahandsteanalsis.ggpygyBackroundgQuantizationIndexModulation(QIM)steanorahggpyroosedwasbChenBetal.fromMassachusettsInstituteppyofTechnoloin2001.TheQIMsteanorahhidesthegyggpysecretuantizationinformationdurinthescalarorvectorqgrocesswhichisthenecessarsteinmostdiitalaudioandpypgvideo(imae)comressionstandards.Bconnectinwithgpyg,therocesscodincloseltheadditionaldistortioncausedbpgyyQIMsteanorahissolittlethatercetionofthetheggpypp,steanorahisverhard.ThereforedetectionoftheQIMggpyysteanorahisaverchalleninwork.ggpyygg,UndoubtedlttackoftheQIMsteanorahhasyaggpy,m'iattractedriormanresearchersnterest.HoweverostpyworksmainlfocusondetectionoftheQIMsteanorahyggpy,durintheimaecomressioncodinndtheresearchggpgaachievementscannotbedirectlaliedtoaudiowhichisypp,sinificantldifferentfromimae.ThereforethisaergygppstudiesthedetectionmethodoftheQIMsteanorahinggpybitrateaudiocomressioncodin.low-pgThisaerroosesanovelmethodforQIMsteano-ppppggrahdetection.Basedontheseechenerationandcom-pypg,ressaerivescodintheorhisfirstldeeanalsisofpppggytypytheossiblesinificantfeaturederadationcausedbthepggy,QIMsteanorahinaudiocomressedstream.Andthenggpypresentsitthestatisticalmodelstoextractthesinificantlpgyfeaturesinthecomresseddomain.Bcombininchanedpygg,theextractedfeatureswithsuervisedlearninclassifierthispgaerbuildsahiherformancedetectortowardstheQIMppgpsteanorahinlowbitratecomressedaudiostream.-ggpypTheartiallresearchworkinthisarticlehasbeensu-pyportedbtheNationalNaturalScienceFoundationofChinapyunderGrantNos.60970148,61271392.Underthesesu-p,wortseaimstobuildthewholetheorsstemofstream-pyyinediabasedinformationhidinandwehaveublished-m-ggpdozensofaersatmanhihimactournalsinthisarea.ppygpj。

基于CELP的语音编码解读

基于CELP的语音编码解读

码激励线性预测语音编码(CELP)算法
事实上,几乎全部的CELP语音编码器都是基于这种两级 码书结构模型而实现的。
四、语编码的发展方向
语音编码的发展方向
随着通信领域发展的多样化,语音编码的发 展也应是多元化、多分支的。目前,语音编码主 要有以下几个发展方向:宽带语音编码、语音/音 频联合编码、多讲话者的语音编码、甚低速率的 语音编码、嵌入式语音编码等。 目前的多数语音编码标准都能适应一般通信 时的信道状况。然而,当信道状况恶化,只允许 极少的比特通过信道时,比如矿井救援时,就需 要甚低比特语音编码了。
三、码激励线性预测语音编码(CELP) 算法
码激励线性预测语音编码(CELP)算法

码激励线性预测CELP(Code Exited linear prediction)编码技术是一种有效的中低速率语 音压缩编码技术,它以码本作为激励源,具有速 率低、合成语音质量高、抗噪性强及多次音频转 接性能良好等优点。在4.8~16Kb/s速率上得到广 泛的应用。 • 采用CELP算法的低速率语音压缩编码很多, 如北美的IS-95、IS-96,日本的JDC半速率标准, ITU的G.723、G.728和G.729采用的都是CELP算 法。
码激励线性预测语音编码(CELP)算法
调整后在搜索前仅对输入语音信号进行加权一次,并有短 时合成滤波器与加权滤波器相组合的全极点感知加权合成 滤波器。
码激励线性预测语音编码(CELP)算法
2、激励参数的码书结构
根据刚才的模型分析得,可以将合成激励看作两个激励的 叠加,一个来自于u (n),用固定码书表示。结合图1和图3可 知,这里的u (n)在理论上具有白噪声的特性。另一个激励信 号 来自于过去的合成激励d (n-M)(M为基音延迟)。这里,d (n-M)由自适应码书表示。自适应码书利用移位寄存器来存储 码矢量,码矢量具有叠接性,若基音延迟M的最大值为 Mmax,则自适应码书的大小为Mmax。自适应码书记录着语 音信号的周期信息,并且每子帧更新一次。两级码书结构的 CELP语音编码模型的原理可用图4来表示。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于基音周期预测的低速率语音隐写
严书凡;汤光明;孙怡峰
【期刊名称】《计算机应用研究》
【年(卷),期】2015(32)6
【摘要】为了在保证语音通信实时性和一定隐藏容量的同时降低隐写失真以达到较好的不可感知性,提出了一种以低速率语音为载体的双层隐写算法.通过限制语音子帧基音周期值的搜索集合,实现了第一层隐写;利用搜索集合内基音周期取值的任意性,实现了第二层隐写.双层嵌入过程中,以最小化修改幅度为原则决定基音周期的取值,降低了隐写失真.实验结果表明,算法在实时性方面性能优越,并可较好地抵抗隐写分析算法的检测,在嵌入率达到100 bps时仍保持了良好的语音听觉质量.
【总页数】4页(P1774-1777)
【作者】严书凡;汤光明;孙怡峰
【作者单位】解放军信息工程大学,郑州450001;解放军信息工程大学,郑州450001;解放军信息工程大学,郑州450001
【正文语种】中文
【中图分类】TP309.2
【相关文献】
1.一种基于线性预测与自相关函数法的语音基音周期检测新算法 [J], 柏静;韦岗
2.一种适用于低速率语音编码系统的基音周期量化算法 [J], 朱文育;郭莉;王炳锡
3.基于统计模型及SVM的低速率语音编码QIM隐写检测 [J], 李松斌;黄永峰;卢
记仓
4.一种低速率压缩语音通用隐写分析方法 [J], 李松斌; 刘鹏; 杨洁; 晏黔东
5.一种低速率压缩语音通用隐写分析方法 [J], 李松斌; 刘鹏; 杨洁; 晏黔东
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档