同步音频水印算法的实现
基于能量自适应的同步小波音频水印算法

攻击 , 如剪切 , 回声 , 间 缩 放 等 , 以 要 求 音频 水 时 所
印应该 保 持 同 步 , 以便 抵 抗 剪 切 、 击 。 同 时 变换 攻
域水 印算 法具有较 强 的抗 攻 击 能力 , 在小 波 域 中 而
嵌入 水印可 以很 大程度上 提高鲁棒 性 。 目前关于数字音频水 印的相关研究 中 , 大部分 的 方法都是在时域 或转换域嵌人数字水 印 , 有些数字水 印系统可达 到不需原 始信 号即可检 测或提 取数 字水 印, 但在 系统设 计 的 难度 及鲁 棒 性 的要求 也 相 应提 高。不同的系统对 于各种攻击也各有 优缺点 。因此 , 现将 能量 自适应 自同步小波 域引入 到音频 水 印系统
() 1
( ) 中 , ( ) 语 音 信 号 分 帧所 采 用 的 窗 函数 , 1式 n 是
l,
(n):
20 0 8年 8月 1 1日收 到
甘 肃 省 自然科 学 基 金 ( 83 JA 2 ) 助 00 RZ 0 4 资
0≤ n≤ N 一1
第一作者 简介 : 康
隐藏 与 音 频 水 印 。
1 语音信号预处理
根 据 能 量 自适 应 L B算 法 的基 本 思 想 … : S 在 L B算法 的基础 上加入对语 音 信 号短品 , 得 作者 的利益 受 到 使 极大 的威胁 , 以 , 够 有 效 地 实 行 版 权 保 护 的数 所 能
⑥
20 Si eh E gg 08 c .T c. nn.
基于 能量 自适 应 的 同步小 波音频 水 印算法
康 旭 张秋余 袁 占亭
( 兰州理工大学计算机与通信学 院, 兰州 70 5 3 00)
摘
一种自适应的同步音频水印算法

作者简介 : 施化吉 (94 ) 男 , 16 一 , 博士生 , 江苏大学 教授 , 主要从 事信息安全 、 多媒体信号处理与数字音频水 印 、 分布计算与分
布数据处理研究. — i jh@useu e Ema :h i j.d .n l s
6 0
检测 到水 印 的位 置 , 而无 法 有效 地 提取 水 印. 从 为 此 , 中提 出抵制 同步攻击 的分段 同步算 法 , 先基 文 首
收稿 日期 : 07 0 —2 20 —80
G ri算法 首先对 水印信 号进行 冗余 编码 和 置 aca 乱 等预处 理 , 后 根 据 HA 然 S模 型进 行 掩 蔽 阈 值 判
1 G ri 法 aca算
听 觉掩 蔽效 应 是心 理声 学 中一 个 重要 的性 质 , 表 明人耳 听觉系 统对 频 率 和 时间 分辨 力 的局 限性 . 人在 听到 两个声音 时 , 因 一个 声音 的存 在 而难 以 会 觉察 另一 个声 音 , 种 现 象称 为 “ 蔽效 应 ” 通 过 这 掩 . 听觉掩 蔽效应 , 可以更好地 保证水 印 的不 可感知性 , G ri ac 研究 了听觉掩蔽效应在音频水印中的应用. a
( trl c neE io ) Na a S i c dt n u e i
文章编号 :10 — 5 (0 8 0 —0 9 0 0 05 X 2 0 )90 5 —5 6
一
种 自适应 的同步音频水印算法 术
施化吉 唐 慧 郑洪源。 李星毅 丁秋林
(. 1 南京航空航天大学 计算机应用研究所 , 江苏 南京 20 1 ; . 10 6 2 江苏大学 计算机科学与通信工程学 院,江苏 镇江 22 1 ) 10 3
AE中的音频同步技巧

AE中的音频同步技巧音频同步是After Effects(AE)中非常重要的一项技术,它可以让我们将音频与视频画面完美地结合起来,达到更加出色的视听体验。
本文将介绍一些在AE中实现音频同步的技巧。
1. 导入音频文件在开始之前,首先需要将音频文件导入到AE项目中。
可以通过点击“文件”菜单下的“导入”选项,选择所需的音频文件并导入。
导入完成后,可以将音频文件拖拽到AE的时间轴中。
2. 视频剪辑接下来,我们需要编辑视频素材,以便与音频同步。
可以通过在AE的时间轴上创建视频层,然后将视频剪辑拖拽到时间轴上来实现。
3. 音频预览在进行后续的音频同步操作之前,可以先进行音频的预览,以便更好地理解音频节奏和节拍。
在AE中,可以按住小键盘上的小空格键进行音频预览。
通过反复预览音频,可以了解音频中的强弱节奏和变化。
4. 同步视频与音频在了解了音频节奏后,我们可以开始同步视频与音频。
一种常见的方法是使用“关键帧”功能来实现同步效果。
首先,选择视频层上的属性,比如位置、大小或透明度等,然后将时间轴移动到合适的位置。
接下来,点击属性面板中的“添加关键帧”按钮,在时间轴上生成一个关键帧。
然后,将时间轴移动到下一个合适的位置,再次点击“添加关键帧”按钮,生成第二个关键帧。
通过在时间轴上调整关键帧的位置,可以使视频素材与音频的强弱节奏完美同步。
5. 音频效果除了同步视频与音频外,AE还提供了丰富的音频效果,可以进一步提升音频的效果。
在AE的“效果”面板中,可以找到各种音频效果,比如均衡器、混响、合唱等。
这些效果可以让音频更加丰富和立体,为视频创作增添独特的视听体验。
6. 节拍同步在一些创意的视频创作中,节拍同步是一个非常重要的技巧。
可以通过使用AE中的“时间扭曲”功能来实现节拍同步。
选择视频层上的属性,点击“时间扭曲”按钮,在时间线上生成一个时间扭曲关键帧。
然后,根据音频的节拍进行调整,使视频创作与音频的节奏完美同步。
7. 动画同步除了同步视频的属性之外,AE还可以通过动画来实现与音频的同步效果。
双声道音频水印的同步及盲检测算法

(.哈尔滨 工 业大 学 计算 机科 学 与技术 学 院,黑龙 江 哈 尔滨黑龙 江 哈尔 滨 10 8) 50 6
摘
要 :基 于双声道特 性提 出了水印同步及盲检测方法 。通过计算左右声 道 Me 频率倒谱 系数特征并利用左 右声 l
c c lt gM e e u n y se tu c e ce t n sn o lt n b t e eta drg tc a n l te s n ho ie l a uai lf q e c p crm o f in d u ig c .ea o ewe n lf h h e, h y c r nz d n r i a i n i n
道 相关性 实现水 印同步段,并将水 印嵌入在 这个 同步 段内。同时分析了水印嵌入及攻击对 同步性能 的影 响。利用 左 右声道 同时嵌入 正相 关或 负相关 的水 印,在水 印检测时可对左右 声道 进行 相关检测来确定水 印嵌入信息 ,实现 了相关检测在水 印盲检测 中的应用 。水 印检测时 ,既不需要原始载体 ,也不需要原始 的水 印信息 。实验结果表明 : 提 出的同步及水 印嵌入 算法对加 噪、MP 3压缩 、重采样 重量化等攻击具有较强 的健壮性 。 关键词 :音频水 印:双声道音频 :同步段;盲检 测 中图分 类号 : P 1.1 T 39 4 文献标识码 : A 文章编号 : 0 04 6 (0 61.0 20 10 .3 X 2 0 )00 6 .7
2Sh o f te t s c n eH i nj n iesyHab 10 8 , hn) .co l hma c i c, e ogi g vri , ri 5 06 C ia o Ma i Se l a Un t n
Ab t a t sr c :A y c r n z t n a d a b i d d tc l o i m a e n c a a t ro u lc a n la d o wa r s ne y s n h o i ai n l e e ta g r h b s d o h r ce fd a — h n e u i s p e e t d b o n t
一种抗D_A和A_D变换的音频水印算法

第29卷 第2期2006年2月计 算 机 学 报C HIN ESE J OU RNAL OF COM PU TERSVol.29No.2Feb.2006收稿日期:2004212210;修改稿收到日期:2005211206.本课题得到国家杰出青年科学基金(60325208)、国家自然科学基金重点项目(60133020)和广东省自然科学基金团队项目基金(04205407)资助.项世军,男,1974年生,博士研究生,现主要从事多媒体信号处理和数字音频水印方面的研究工作.E 2mail :xiangshijun @.黄继武,男,1962年生,博士,教授,博士生导师.目前主要研究领域为多媒体信息安全.王永雄,男,硕士,主要从事音频水印方面的研究工作.一种抗D/A 和A/D 变换的音频水印算法项世军 黄继武 王永雄1)(中山大学信息科学与技术学院 广州 510275)2)(广东省信息安全技术重点实验室 广州 510275)摘 要 音频水印的许多应用要求水印能在模拟环境中保留下来,这涉及到水印的D/A 和A/D (以下简称DA/AD )变换.然而,音频水印抗DA/AD 变换尚未引起人们的充分重视.已有的音频水印算法能抵抗DA/AD 的很少.文中通过大量的实验,分析并得出了在DA/AD 过程中影响音频水印的主要因素:波形失真和时间轴线性伸缩,并针对这些因素提出了一个基于DWT 的抗DA/AD 变换的盲音频水印算法.针对音频水印DA/AD 变换过程中时间轴上的线性伸缩和因幅值变化与噪声影响产生的波形失真,作者在算法中分别采取了相应的对策:(1)在检测过程中结合同步码重定位和线性伸缩恢复来消除时间轴上线性伸缩带来的影响;(2)针对幅值改变,在DW T 域采用了基于三段低频小波系数之间能量关系的嵌入对策;(3)自适应调整嵌入强度来满足抗噪声攻击的要求.实验表明,所提出的音频水印算法具有很强的抗DA/AD 攻击性能和抗其它各种通用的音频处理和攻击的能力.关键词 音频水印;DA/AD 变换;波形失真;线性伸缩;重同步中图法分类号TP391An Audio W atermarking Algorithm Against the D/A and A/D ConversionsXIAN G Shi 2J un HUAN G Ji 2Wu WAN G Y ong 2Xiong1)(School of I nf ormation S cience and Technolog y ,S un Yat 2S en Universit y ,Guangz hou 510275)2)(Guang dong Key L aboratory of I nf ormation Securit y ,Guangz hou 510275)Abstract In many applications of audio watermarking ,t he watermark is required to survive well in analog environment s ,which involve t he D/A and A/D conversions (denoted as DA/AD in t his paper ).However ,t he robust ness of audio watermarking against t he DA/AD processing has not drawn sufficient attention yet.According to our best knowledge ,t here has no report for t he audi 2o watermark to effectively resist t he DA/AD conversions.Based on extensive experiment s ,t his paper analyze and conclude t he main degradations on t he audio watermark caused by t he DA/AD conversions ,waveform distortion and temporal linear scaling.Accordingly ,t he aut hors propo se a DW T 2based blind audio watermarking algorit hm against t he DA/AD conversions.To resist wave 2form distortion of t he watermarked audio ,t hey adopt t he embedding st rategy using t he relative energy relations among group s of t he wavelet coefficient s in low 2f requency sub 2band and adaptive 2ly cont rol t he embedding strengt h.The resynchronization is designed to resist temporal linear scaling.The experimental result s show t hat t his algorit hm is robust to t he DA/AD conversions ,and ot her mo st common audio p rocessing manip ulations and attacks.K eyw ords audio watermarking ;DA/AD conversions ;waveform distortion ;temporal linear scaling ;resynchronization1 引 言随着数字音频的广泛普及,音频水印正逐渐成为数字水印中的一个重要研究方向[1,2].由于人类听觉系统(HAS )极为灵敏,使得音频水印的研究具有极大的挑战性.根据IFPI (International Federa 2tion of t he Phonograp hic Indust ry )关于音频水印鲁棒性的定义[3],音频水印除了要具备不可觉察性(水印不能影响音频的质量、嵌入水印后的音频可以提供20dB 或更高的信噪比)、一定嵌入容量(嵌入水印的数据信道带宽至少要有20bp s )外,还需要抵抗各种攻击,包括加性或乘性噪声、M P3压缩、两个连续的D/A 和A/D 转换、时间拉伸(10%)、重采样、重量化、滤波等.先前的音频水印技术基本上可以被归纳为两类:时域算法和频域算法.时域算法的主要代表有L SB 方法[4]、回声隐藏(echo coding )[5]等.频域算法通过改变音频信号的频域系数(如DF T [6],DC T [7],DW T [8]系数)来隐藏水印,通常具有较好的鲁棒性.考虑到音频信号是时间轴上的函数,易受到各种攻击(如对音频的裁剪、无线传输中的信号丢失、IP 网络中的丢包等),文献[7,8]在音频水印系统中引入了同步信号,缺点是所用的算法对音频能量幅度的变化非常敏感.在引入同步信号的基础上,文献[9]提出了基于音频能量幅度关系的嵌入算法,很好地解决了音频幅度变化带来的影响,由于选择在时域上嵌入信息,鲁棒性较差.以往算法基本上不考虑音频水印在模拟环境中的问题.音频水印技术潜在的大量应用需要水印在模拟的环境中能够保留下来,如通过模拟信道传输、利用模拟设备转录、通过扬声器的录音等,使得音频水印的抗DA/AD 变换成为一个亟待解决的问题.目前众多的有关音频水印技术的文献中,都没有很好地解决这一问题.我们从文献中选取了几个算法[8~11]进行抗DA/AD 测试,都无法得到预期的实验结果.造成这方面研究欠缺的原因主要是:(1)音频的DA/AD 变换过程是一个复杂的过程,这个过程对于水印的影响尚未能模型化;(2)尽管大多数的音频攻击在StirMark Benchmark for Audio (SMBA )[12]软件中可以仿真,但对抗DA/AD 攻击却缺乏相应的标准测试软件.目前只有文献[13]简单讨论了DA/AD 变换过程中音频可能受到哪些硬件特性的影响,但没有详细分析这些影响对音频和水印的失真模型.本文通过分析数字音频的DA/AD 变换过程,将音频水印在DA/AD 过程中受到的攻击模型化为:(1)时轴上的线性伸缩;(2)波形失真(幅值变化和噪声的影响).在水印失真模型的基础上,在算法中分别采取了相应的对策:(1)采用线性伸缩恢复和重定位搜索同步信号,消除在时间轴上可能的线性伸缩;(2)针对幅值改变,在DW T 域采用了基于三段低频小波系数之间的能量关系的嵌入对策;(3)根据DA/AD 过程中噪声引起的失真较大的特点,使用自适应调整嵌入强度因子和嵌入强度的上下限来满足抗噪声攻击的要求.实验结果表明,该算法对抗DA/AD 攻击具有良好的性能,在抵抗其它常见的音频处理和攻击(如高斯噪声、M P3压缩等)方面也具有很好的性能.本文第2节分析了DA/AD 变换对音频水印的影响;第3节描述算法的基本原理和框架;第4节介绍水印的检测;第5节是实验结果,证实了算法抗DA/AD 和各种攻击及处理的性能;第6节是结论.2 DA/AD 变换对音频水印的影响211 实验环境为了更好地说明音频信号在DA/AD 变换过程中受影响的情况,我们采用图1所示的实验环境.这里采用电缆作为模拟信道,因而信道噪声可以忽略.图1 音频DA/AD 过程的实验模型 图1中声卡采用的是(1)Creative 公司的SoundBlaster Live511(采用EMU10K1音频处理芯片,具有32bit 的数字处理能力,高达192dB 的动态范围);(2)德国坦克火网版1723(TERRA TEC AU 2REON Xfire 1723);(3)Audio 2000CM8738Audio PCI ;(4)ZOL TRIX 公司的Nightingale Pro 6(信噪9032期项世军等:一种抗D/A 和A/D 变换的音频水印算法比>85dB ).表1是测试用的4段音频数据(均是16bit 、PCM 编码、WAV E 格式的单声道音频).表1 测试DA/AD 过程的音频文件文件名采样率(k Hz )长度(s )特点march44.wav 441156进行曲,高低频成分平均drum44.wav 441156鼓声乐,低频成分为主flute44.wav 441156笛声乐,高频成分为主dialog44.wav441156一般对话212 DA/AD 变换对音频信号的影响数字音频信号在DA/AD 变换过程中将会受到许多的影响[13],归纳起来主要有以下几个方面:(1)D/A 处理过程中的噪声;(2)音频能量幅度的改变以及放大器引入的噪声;(3)模拟信道噪声与能量的变化;(4)A/D 处理过程中的噪声和量化失真.大量的实验发现,受到DA/AD 过程的影响,数字音频信号在一个连续DA/AD 变换后表现如下.(1)音频伸缩现象选择表1中的4段音频数据分别用上述的四种声卡测试DA/AD 变换过程中的音频样本变化情况,结果如表2所示.由表2可以看出数字音频在DA/AD 变换的过程中,有如下现象:(i )在一个连续的DA/AD 变换后,不同的声卡可能会对音频文件在时间轴上产生微小的线性拉伸或者收缩(Sound Blaster Live511声卡,每10s 的音频样本减少6个左右;AU REON Xfire 1723和Au 2dio 2000PCI ,样本数保持不变;Nightingale Pro 6声卡,每10s 的音频样本增加14个).实验证明,这种伸缩过程在整个DA/AD 变换过程中是一直存在的.(ii )样本的变化只与声卡即DA/AD 变换过程中的硬件性能相关,而与使用的电脑和音频样本的类型无关(实验中,在使用相同声卡和音频长度相同的情况下,我们采用不同类型的音频文件及不同性能的电脑(CPU 、主板和内存都不同)来进行测试,发现音频样本的减少或增加的情况是完全一样的).表2 DA/AD 变换过程中的音频样本的变化情况长度(s )音频样本的变化Sound Blaster Live511AU REON Xfire 1723Audio 2000PCINightingale Pro 610减少6 增加0增加:0增加1420减少12增加0增加0增加2830减少18增加0增加0增加4240减少24增加0增加0增加5650减少30增加0增加0增加70(2)波形失真数字音频信号在经过DA/AD 过程后,会出现一定的波形失真,主要表现为信号能量的变化和噪声引起的失真.实验中,我们发现音频文件在经过一个连续的DA/AD 过程后,音频幅值会发生整体变化的情况,且变化的大小与声卡的性能、播放时音量的选择和模拟信道的抗衰减性能有关.图2和图3分别为用So und Blaster Live511声卡播放和录制回来后的音频文件的波形图.可以看出,录制回来的音频波形的整体幅值变小了.对于其它声卡,同样都有幅值变化的情况,但变化幅度有所不同.图2 播放音频图3 录制音频 为了研究这种幅值的整体变化的特性,我们对录制音频进行归一化,如果有线性伸缩则进行线性伸缩恢复,然后计算其与播放音频的S N R 值.实验结果显示这时的S N R 值并不高(如图5所示),表013计 算 机 学 报2006年明了这种幅值的整体变化是非线性的,并不是一个简单的线性放大与缩小的关系.除了在时间轴上的伸缩和音频幅值整体变化的情况外,在一个连续的DA/AD 过程中,由于量化噪声、电噪声的影响和器件本身的因素,录制回来的音频具有一定的失真.这可以通过下面的实验来说明.我们选择S N R 来评估波形失真:S N R =-10lg F -F ″2F2(1)F ″=F ′∑min (N ,N ′)-1i =0f ′i∑min (N ,N ′)-1i =0f i (2)其中,F ={f 0,f 1,…,f N -1},f ′={f ′0,f ′1,…,f ′N ′-1},F ″={f ″0,f ″1,…,f ″N ′-1},f i ,f ′i 和f ″i 分别为播放音频、录制音频和录制后经归一化的音频的第i 个样本的幅值.由于音频在DA/AD 变换后会发生幅度的改变,所以在计算S N R 之前先要对F ′进行归一化处理.波形失真可以在如下的实验中得到证实.实验中,F 1,F 2,F 3和F 4分别为播放的音频文件、录制回来的音频文件和录制后经归一化的音频文件和录制后经归一化及线性伸缩恢复的音频文件.当N ≠N′时需要进行伸缩恢复(参考413节).以Sound Blast 2er Live511声卡为例,音频信号F 1和F 3(经过归一化但未进行线性伸缩恢复)的S N R 值及F 1和F 4(经过归一化和线性伸缩恢复)的S N R 值如图4,图5所示.图4 归一化但未进行线性伸缩恢复的F1和F 3的S N R由图4可知,音频在DA/AD 变换过程中在时间轴上的误差造成了波形的错位,由于这种错位随时间的增加而不断扩大,从而造成了S N R 值的逐渐减小.图5是线性伸缩恢复处理后的S N R 值.可以看出,伸缩恢复消除了这种时间轴上的波形错位,S N R 值不再逐渐减小,而是维持在20~30db 左右,图5 经过归一化和线性伸缩恢复的F 1和F 4的S N RS N R 值不高反映了DA/AD 过程中音频信号存在一定的失真.213 DA/AD 变换对音频水印的影响分析由前面的分析可知,经过DA/AD 变换的音频信号会出现一定的波形失真(表现为幅值的变化和噪声的影响)和时间轴上的线性伸缩.以信号处理的观点,水印是在强背景(数字音频)上嵌入的弱信号,载体的变化对于水印的变化将会产生直接的影响.因此,音频水印在DA/AD 变换过程中也会受到相应的攻击,主要有3个方面(表现为水印失真模型如图6所示):(1)时间轴上的线性伸缩,即嵌入音频的水印在经过DA/AD 处理后将会在时间轴上出现一定的线性拉伸或者收缩;(2)幅度的变化.在DA/AD 处理过程中,水印也会受到幅度变化的攻击而产生失真.(3)各种噪声的影响.噪声对音频影响的同时也会使音频水印产生一定的失真.图6 数字音频水印DA/AD 变换失真模型3 算法的基本原理和框架针对音频水印DA/AD 变换过程中因幅值变化与噪声影响产生的波形失真和时间轴上的线性伸1132期项世军等:一种抗D/A 和A/D 变换的音频水印算法缩,我们在嵌入和检测算法中分别采取了相应的对策:(1)针对幅值改变,在DW T 域采用了基于三段低频小波系数之间的能量关系的嵌入对策;(2)使用自适应调整嵌入强度因子和嵌入强度的上下限来满足抗噪声攻击的要求;(3)在检测算法中结合同步码重定位和线性伸缩恢复来消除时间轴线性伸缩带来的影响.311 算法框架和水印结构水印的嵌入过程如图7所示.首先将一段长的音频分段,每段音频中隐藏一个同步信号和部分(或全部)水印数据.具体做法是先对每段音频作小波分解,并将同步信号和水印转换为{-1,1}序列,然后将{-1,1}的序列嵌入到DW T 域的低频系数中.水印嵌入时,在满足音频质量的前提下调节嵌入强度到最大.水印嵌入后在DW T 域[8]计算音频的S N R 值,如果S N R 值满足要求,则进行小波重构得到嵌有水印的音频;否则根据一定的规则(表3)来调整嵌入强度,直到嵌入后的S N R 值达到预先规定的要求,再进行小波重构得到嵌有水印的音频.图7 水印嵌入方案 该嵌入方案的最大好处是解决了以往算法中嵌入强度根据经验取值所带来的不便问题,为不同类型的音频寻找符合要求的嵌入强度提供了一种行之有效的方法.由于S N R 值在DW T 域计算,计算开销不大.312 嵌入方法将m 序列(同步码)和水印都转换为“1”和“-1”的序列.并构造序列{s y n (i )}和{w m k (i )}.每帧嵌入信息{w (i )}w (i )|w (i )∈{-1,1}的长度为m 序列{s y n (i )}与水印信息{w m k (i )}的长度之和.m 序列放到{w (i )}的前部,水印信息放到{w (i )}的后部.隐藏数据的结构如图8所示.…同步信号水印信息同步信号水印信息…图8 隐藏数据的结构 在图9中,根据同步信号和水印信息的长度,我们将一段长的音频信号进行分段:…分段长度N 1分段长度N 2分段长度N 1分段长度N 2…图9 音频的分段结构将音频数据分段后,对数据段N 1和N 2作k 层的小波分解,将分别得到N 1/2k和N 2/2k个低频小波系数,然后在N 1/2k 个低频系数中嵌入同步信号,在N 2/2k个低频系数中嵌入水印信息,从而完成一帧信息{w (i )}的嵌入.音频信号在DA/AD 过程中会发生能量幅度的改变,严重影响了基于音频幅度绝对量的嵌入方法的检测率.所以,本文嵌入方法是在文献[9]基于时域分段样本能量之间关系的基础上,采用基于三段相邻低频小波系数之间的能量关系来嵌入水印,从而避免了能量幅度改变带来的问题.由于嵌入是在DW T 的低频子带进行,同文献[9]相比具有更强的鲁棒性.图9中,分段的长度N 1和N 2分别由同步信号和水印信息的长度以及小波分解层数和嵌入强度决定,即N 1=3L ×2k ×(同步码长度)(3)N 2=3L ×2k ×(水印信息长度)(4)其中,k 是小波分解层数,L 为一段低频小波系数的长度,它的选择与嵌入带宽、S N R 和抗攻击要求有关.嵌入过程如下:假设有3L 个相邻的低频小波系数{f (i )|i =0,1,…,3L -1},将其平均分为3段,每段长L ,如图10所示.图10 三段相邻低频小波系数分段示意图三段低频小波系数的能量E 1,E 2和E 3定义为E 1=∑L -1i =0f (i ),E 2=∑2L -1i =Lf (i ),E 3=∑3L -1i =2Lf (i ).213计 算 机 学 报2006年令A =E max -E midB =E mid -Emin(5)其中,E max =maximum {E 1,E 2,E 3},E mid =medium {E 1,E 2,E 3},E min =minimum {E 1,E 2,E 3}.定义S=P L ,d ・∑3L -1i =0f (i )3<P L P U ,d ・∑3L -1i =0f (i )3>P Ud ・∑3L -1i =0f (i )3,其它(6)(1)如果要嵌入的信息w (i )为“1”,则令A 和B满足A -B ΕS(7)如不满足公式(7)的关系,则同时调整E max ,E mid 和E min 三者的大小.(2)如果要嵌入的信息w (i )为“-1”,则令A 和B 满足B -A ΕS(8)同理,如果公式(8)的关系不成立,则同时调整E max ,E mid 和E min 三者的大小.E m ax ,E mid 和E min 的调整算法.嵌入信息为“1”时:1.E max 增大.2.if (E mid >E min ) E mid 减小,E min 增大.else if (E mid <=E min &&E min >0) E mid 减小,E min 减小.嵌入信息为“-1”时:1.if (E min >0)E min 减小.2.if (E max >E mid ) E max 减小,E mid 增大.else if (E max <=E mid ) E max 增大,E mid 增大.313 嵌入强度公式(6)中的d 为嵌入强度调整因子,它决定了A 和B 之间差的大小,由于在DA/AD 变换过程中有一定的波形失真,因此可以根据抗攻击能力的要求调整d ,以满足实际的需要.同时,d 也是影响嵌入水印后音频质量的重要因素,应在保证水印音频不可觉察性(一定S N R 值)的前提下尽量取大值.P U 和P L 分别为嵌入强度的上下限,决定了水印抗攻击能力的大小.DA/AD 变换过程中的噪声影响十分大,采用下限P L 确保水印的抗攻击能力.P U 为嵌入强度上限,限制因嵌入强度S 过大时对水印音频的影响,可以提高水印音频的S N R 值.P U 和P L 的选择与音频的强度、小波分解层数和分段长度L 有关.音频强度越大、小波分解层数越多、分段长度L 越大,上下限的取值也越大.此外,因为每多做一层小波分解,低频小波系数的值大约增大2倍.因此,嵌入强度的下限P L 和上限P U 的定义可以表述如下:P L =L ×2K ×S L (9)P U =L ×2K×S U(10)公式(9)和(10)中的S L 和S U 与音频的类型和强度有关.在进行水印嵌入时,一般先根据经验对嵌入强度因子d 、下限因子S L 和上限因子S U 取一个初始值,再根据嵌入后的音频性能(一般用S N R 的值来衡量)是否满足预定要求来自适应调整它们的值,直到嵌入水印后的音频满足要求.嵌入强度因子d 、下限因子S L 和上限因子S U 对音频S N R 值的影响如表3所示.表3 嵌入强度因子对SNR 的影响嵌入强度因子音频嵌入水印后的S N Rd 增大、S L 和S U 保持不变S N R 值减小.S L 增大、d 和S U 保持不变S N R 值减小,S L 增大到一定程度时,S N R 不再改变.S U 增大、d 和S L 保持不变S N R 值减小,S U 增大到一定程度时,S N R 不再改变.4 水印提取4.1 检测方案根据音频水印在DA/AD 的过程中可能受到在时间轴上的伸缩影响,我们在使用同步码的同时提出了基于线性伸缩恢复的水印提取方法.水印的检测框架如图11所示.提取水印时首先对待检测的音频信号进行线性伸缩恢复,再分段作相应的小波分解,从低频系数中搜索同步信号,找到嵌入水印信息的起始位置,然后从随后样本的DW T 低频系数中提取水印.线性伸缩恢复需要知道原音频的长度,以便决定伸缩恢复因子.我们的做法是通过搜寻两个同步码,根据它们之间的音频长度和水印嵌入时的两个3132期项世军等:一种抗D/A 和A/D 变换的音频水印算法图11 水印提取方案同步码间已知的原始音频长度来计算伸缩因子,进而进行线性伸缩恢复.因此这一方案在水印检测的过程中不需要原始的音频信息,是一种盲音频水印算法.通过线性伸缩恢复,消除了音频在时间轴上伸缩所带来的影响.而同步信号的引入和重定位搜索可以定位每一帧嵌入信息的开始点,进而提取水印.4.2 同步码重定位同步码重定位检测示意图如图12所示.在图12中,N 1为用于嵌入一个同步信号的音频样本的长度,N 2为用于嵌入一帧水印的音频样本的长度.2Δ为同步信号重定位检测的检测区间,根据实际的硬件情况取值.2Δ1为水印可能产生的错位区间.图12 重定位检测示意图4.3 线性伸缩恢复假设F ′={f ′(0),f ′(1),…,f ′(L ′-1)}为经过DA/AD 处理后的水印音频,通过搜索同步信号计算两个同步信号间的音频长度为N ′2,N 2为水印音频F 在变换前两个同步信号间的已知音频长度,当N ′2≠N 2时采用公式(11)来进行线性伸缩恢复,相当于一个插值的过程.f ″(i )=f ′(0), i =0(1-β)・f ′(α・i )+β・f ′(α・i +1),0<i <L -1f ′(L ′-1),i =L -1(11)其中F ″={f ″(0),f ″(1),…,f ″(L -1)}为线性伸缩恢复后的水印音频,f ″(i )和f ′(j )分别为F ″和F ′的第i 个和第j 个样本,0Φi ΦL -1,0Φj ΦL ′-1,β=α・i -α・i ∈[0,1],・为取整函数,α=(N ′2/N 2)=(L ′-1)/(L -1)为线性伸缩因子,L ′和L 分别为音频F ′和F ″的长度.414 检测算法假设在重同步后我们已经确定了待检测音频的开始点,则按照嵌入水印时的分段规则将音频数据分段,并做相应层数的小波分解,得到低频小波系数f ′(i ),按照同样的长度3L 计算出相应E ′1,E ′2和E ′3,类似水印嵌入的过程,进一步得到E ′m ax ,E ′m id 和E ′m in ,然后计算得A ′=E ′m ax -E ′m idB ′=E ′m id -E ′m in (12)则有w ′(i )=1,A ′-B ′Ε0-1,A ′-B ′<0(13)5 实验结果实验中同步信号取一周期为31的m 序列,阈值T 取为23,水印是一个32bit 的二进制随机序列.选db2小波基,小波的分解层数为7,L 的长度取8.根据公式(3)可以计算出水印的带宽为14136bp s ,即每嵌入一帧信息(m 序列和水印)大约需要414s 的音频数据,共嵌入12帧756bit 信息.本文算法的同步信号和水印对抗DA/AD 的鲁棒性能实验结果如表4所示.表4中,当未引入同步码时只能检测出部分水印,且误码率很高;在引入同步码定位后,水印的误码率已经明显减小;本文算法结合了线性伸缩恢复和同步码定位,进一步降低了误码率.413计 算 机 学 报2006年表4 抗DA/AD攻击音频数据未有同步误码B ER(%)未有校正误码B ER(%)本文算法误码B ER(%)march44137181120 0 0 0 drum44174231014 0152910 0 flute44191251267 0192592 012645 dialog443441502 0126450 0 平均134171723125014299015010661此外,我们用文献[8]中的算法分别做了抗高斯噪声、MP3解/压缩和DA/AD攻击实验,结果如表5所示.表5中还列举了本算法与文献[9~11]中的算法在水印带宽、抗高斯噪声、抗M P3解/压缩和抗DA/AD攻击的详细比较.表5 算法性能比较算法带宽(bps)抗高斯噪声误码率(%)抗MP3解/压缩误码率(%)抗DA/AD变换误码率(%)文献[8]约3440(约8dB)0(32Kbps)不能检测文献[9]约49没提及约2192(80Kbps)提及但无实验结果文献[10]约81532173(36dB)约2199(64Kbps)约113文献[11]没提及没提及约1142(64Kbps)约3157本文算法141360(约8dB)0(32Kbps)010661从表5的比较结果看来,本算法在保持文献[8]中算法的优越性能的同时有效地提高了抗DA/AD 攻击的性能.而且对比其它几个算法,我们的算法在抗高斯噪声、M P3解/压缩和DA/AD攻击性能方面都有比较大的提高.6 结 论在大量实验分析的基础上,本文提出了一种新的基于DW T的音频水印抗DA/AD解决方案.主要贡献如下:(1)通过大量的实验,分析了音频信号在DA/AD 变换过程中可能受到的影响.实验分析表明数字音频在DA/AD变换过程中存在一定的波形失真(信号幅度改变和各种噪声的影响)和微小的线性伸缩.这种伸缩的大小或者有无取决于用于DA/AD变换的声卡性能;(2)根据数字音频在DA/AD变换过程中受到的影响,给出了数字音频在DA/AD过程中可能受到的攻击,并在此基础上提出了音频水印的DA/AD 失真模型;(3)基于音频水印的DA/AD失真模型,提出了用同步码重定位和线性伸缩恢复相结合的盲音频水印算法,实验结果表明该算法有很好的抗DA/AD 攻击性能和其它攻击的性能;(4)引入了基于SN R值的自适应水印嵌入方案,通过自适应调整嵌入强度来满足对性能的要求.本文算法主要针对DA/AD变换,尚未考虑模拟信道.这是下一阶段的工作.参考文献1Arnold M..Audio watermarking:Features,applications and algorit hms.In:Proceedings of IEEE International Conference on Multimedia&Expo,New Y ork,USA,2000,2:1013~10162Swanson M.D.,Zhu Bin,Tewfik A.H..Current state of t he art,challenges and future directions for audio watermarking.In:Proceedings of IEEE International Conference on Multime2 dia Computing and Systems,Florence,Italy,1999,19~243Katzenbeisser S.,Fabien A.,Petitcolas P.eds..Wu Qiu2Xin et rmation Hiding Techniques for Steg2 anography and Digital Watermarking.Beijing:Post s&Telecom Press,1999(in Chinese)(Katzenbeisser S.,Fabien A.,Petitcolas P.编.吴秋新,钮心忻,杨义先,罗守山,杨晓兵译.信息隐藏技术———隐写术与数字水印.北京:人民邮电出版社,2001)4Cvejic N.,Seppanen T..Increasing robustness of L SB audio steganography using a novel embedding met hod.In:Proceed2 ings of IEEE International Conference on Information Technol2 ogy:Coding and Computing,2004,2:533~5375Craver Scott,Liu Bede,Wolf Wayne.Detectors for echo hid2 ing systems.In:Proceedings of t he5t h Information Hiding Workshop.Lecture Notes in Computer Science2578,Berlin: Germany Springer2Verlag,2002,247~2576Bender W.,Gruhl D.,Morimoto N..Techniques for data hid2 ing.IBM Systems Journal,1996,35(3~4):313~3367Huang Ji2Wu,Wang Y ong,Shi Y.Q..A blind audio water2 marking algorit hm wit h self2synchronization.In:Proceedings of IEEE International Symposium on Circuit s and Systems,Ar2 izona,USA,2002,3:627~6308Wu Shao2Quan,Huang Ji2Wu,Huang Da2Ren,Shi Yun Q..Efficiently self2synchronized audio watermarking for assured audio data transmission.IEEE Transactions on Broadcasting, 2005,51(1):69~769Lie Wen2Nung,Chang Li2Chun.Robust and high2quality time2 domain audio watermarking subject to psychoacoustic masking.In:Proceedings of IEEE International Symposium on Circuit s and Systems,Arizona,USA,2002,2:45~4810Seok Jongwon,Hong Jinwoo,K im Jinwoong.A novel audio watermarking algorit hm for copyright protection of digital audio.ETRI Journal,2002,24(3):181~18911Shin Seungwon,K im Oanjin,K im Jongweon,Choil Jonguk.A robust audio watermarking algorit hm using pitch scaling.In: Proceedings of IEEE Workshop on Digital Signal Processing, 2002,701~70412Steinebach M.,Petitcolas F.A.P.,Raynal F.,Ditt mann J., Fontaine C.,Seibel S.,Fates N.,Ferri L.C..StirMark5132期项世军等:一种抗D/A和A/D变换的音频水印算法。
数字音频水印技术的探索与应用

本文就数字音频水印技术的发展、特点、算法等方面进行了阐述,对数字音频水印技术(以及音频指纹识别技术)作为媒体融合的中间介质在广播电视领域的最新应用进行了简要的说明与概括。
数字音频水印 掩蔽效应 鲁棒性 音频指纹识别 北京电视台官 健 王 麒 康许剑 程 宏一 数字音频水印技术概述1. 数字音频水印的概念数字音频水印技术是将数字水印通过一些特定的水印嵌入算法嵌入到原始音频文件中,同时对原始音频文件的音质不会产生太大的影响,或者人耳感觉不到音质的变化。
数字音频水印技术还要能够有效地抵抗违法侵权行为的各种攻击,在需要时能够完整地提取出所嵌入的水印内容,以便作为证据来保护版权所有者的合法权益。
2. 理论依据在音频文件中嵌入水印的一般都要利用人类听觉系统的某些特征来实现,充分利用这些特征可以提高水印算法的不可感知性。
(1)掩蔽效应当人们同时听两个声音时,其中一个声音的感受会因为另一个声音的出现而发生改变。
人们愿意接受的声音成为“信号”,信号以外的各种杂乱声音统称为“噪声”。
噪声的干扰,使人们对信号的听阈提高,这种现象称为掩蔽效应。
假定声音A 的阈值为50dB ,若同时又发出声音B ,这时要听清楚声音A ,声音A 的阈值提高到64dB ,即比原来的阈值要提高14dB 才能被听到。
一个声音的阈值因另一个声音的出现而提高听阈的现象称为听觉掩蔽。
在上述例子中,B 称为掩蔽声,A 称为被掩蔽声,14dB 称为掩蔽量。
掩蔽现象是神经系统判断的率高的纯音掩蔽作用大,即低频声能有效地掩蔽高频声,但高频声对低频声的掩蔽作用不大。
掩蔽量随掩蔽声声压级的增加而提高,并且掩蔽的频率范围变宽。
(2)人耳对声音信号相位的敏感度人耳对声音信号的绝对相位不敏感,而只对其相对相位敏感。
(3)人耳对频率的敏感度人耳对不同频段声音的敏感程度不同,通常人耳可听见20Hz~18kHz 的信号,但对300Hz~3400Hz 范围内的信号最敏感,幅度很低的信号也能被听见,而在低频区和高频区,能被人耳听见的信号幅度要高得多。
几种水印算法详解-入门必备

水印算法近年来,数字水印技术研究取得了很大的进步,下面对一些典型的算法进行了分析,除特别指明外,这些算法主要针对图像数据(某些算法也适合视频和音频数据)。
空域算法该类算法中典型的水印算法是将信息嵌入到随机选择的图像点中最不重要的像素位(LSB:least significant bits)上,这可保证嵌入的水印是不可见的。
但是由于使用了图像不重要的像素位,算法的鲁棒性差,水印信息很容易为滤波、图像量化、几何变形的操作破坏。
另外一个常用方法是利用像素的统计特征将信息嵌入像素的亮度值中。
Patchwork算法方法是随机选择N对像素点(ai,bi) ,然后将每个ai点的亮度值加 1 ,每个bi点的亮度值减1,这样整个图像的平均亮度保持不变。
适当地调整参数,Patchwork方法对JPEG压缩、FIR滤波以及图像裁剪有一定的抵抗力,但该方法嵌入的信息量有限。
为了嵌入更多的水印信息,可以将图像分块,然后对每一个图像块进行嵌入操作。
变换域算法该类算法中,大部分水印算法采用了扩展频谱通信(spread spectrum communication)技术。
算法实现过程为:先计算图像的离散余弦变换(DCT),然后将水印叠加到DCT域中幅值最大的前k系数上(不包括直流分量),通常为图像的低频分量。
若DCT系数的前k个最大分量表示为D=,i=1 ,… ,k,水印是服从高斯分布的随机实数序列W =,i=1 ,… ,k,那么水印的嵌入算法为di = di(1 + awi),其中常数a为尺度因子,控制水印添加的强度。
然后用新的系数做反变换得到水印图像I。
解码函数则分别计算原始图像I和水印图像I*的离散余弦变换,并提取嵌入的水印W*,再做相关检验以确定水印的存在与否。
该方法即使当水印图像经过一些通用的几何变形和信号处理操作而产生比较明显的变形后仍然能够提取出一个可信赖的水印拷贝。
一个简单改进是不将水印嵌入到DCT域的低频分量上,而是嵌入到中频分量上以调节水印的顽健性与不可见性之间的矛盾。
广播电视系统中DCT域同步音频水印技术研究

2 数字 音 频水 印 的分 类 和特 点
2 0年 第 8期 ( 第 2 8期 ) 0 1 总 4
有 线 电视 技 术
上影 响感 知透 明性 和信息 容量 。 () 3 自恢复 性 : 数 字 水 印 系统 能 够从 被 操 作 变 指 换 后遭 到破坏 的片段 数据 中 ,恢 复隐 藏 的水 印 信息 , 被嵌 入音 频数 字水 印 的音 频数 字信 号 , 与其 性能 好坏
謦
●
究
中 , 时 引入 了嵌 入 同步 信 号 的思 想 , 用 同 步信 号 定 位 水 印 的 嵌 入 位 置 。 采 用 量化 调 制策 略 将 水 印 信 息嵌 入 到频 域 同 利 并
系数 中。 实验 结 果 表 明, 系统 达 到 实用 要求 。 该 关 键词 : 广播 电视 系 统 数 字 音 频水 印 D T域 同步 C
1 引 言
随 着 电视技 术 的 飞速 发 展 , 通过 卫 星 、 波 方式 微 传输 到各 级 电视 台的节 目多达几 十乃 至上 百套 , 电 对 视节 目进 行实时 监测 , 障电视 节 目播 出过 程 防止 非 保 法 插播 和 干扰 是广 播 电视 工 作安 全播 出 的一项 非 常 重要 的任务 。 以人工 为主对 电视信 号进行 监测 的过 在 程 中 , 班 人员 要 时刻 监视 播 出信 号状 态 , 值 并及 时 对 干扰 或 中断 做 出处 理 ,工作 强 度很 大 且 难 免会 有 失
误。
目前常 用 的音 频水 印技 术口 按 水 印嵌入 方 式 可 I , 以分为两类 : 时域 法 和变换域 法 。 时域算 法简单 , 运行 速 度快 , 抗干扰 能力差 ; 换域 法有 D- 但 变 } T算法 、 C DT 算 法 、 WT算 法 等 , 类算 法 复 杂 度 较 高 为 目前水 印 的主流技 术 。 但是 这些算 法 , 由
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第28卷 第4期 吉首大学学报(自然科学版)Vol.28 No.4 2007年7月J ournal of J ishou University(Natural Science Edi ti on)Jul.2007文章编号:1007-2985(2007)04-0074-04同步音频水印算法的实现张国武,曾巧明(中南大学信息科学与工程学院,湖南长沙 410008)摘 要:目前的音频水印算法缺乏有效的同步技术,笔者应用通信网同步方法,提出了一种快速重同步音频有意义音频水印算法.该算法利用时域水印技术嵌入同步信息,从而对抗音频在时间轴上可能受到的攻击,借助变换域基于小波变换增强音频的鲁棒性,水印为一幅二值图像.仿真实验表明该算法产生的水印在对抗加性Gaussian噪声、MP3压缩和裁剪等方面具有良好的稳健性,可用于数字音频产品的版权保护.关键词:同步;小波变换;稳健性中图分类号:TP301.6 文献标识码:A数字水印技术是把数据(水印)嵌入到多媒体文件中去,以保护所有者对多媒体所拥有的版权.当所有者权益被侵犯时,可通过对水印的检测来得到证明.由于人的听觉系统(HAS)要比视觉系统(HVS)敏感,相对于静止图像和视频信号,在音频信号中嵌入数字水印更为困难[1].通常,音频数字水印应具有以下3个特性.(1)不可觉察性.加入水印后的语音信号比起原语音信号对人耳来讲应该是听起来无差别的;(2)鲁棒性.未被授权的个人或团体企图通过一些处理方法,去除或修改嵌入的水印信息时,会引起原语音信号音质的明显下降;而对于常见的信号处理操作,如传输、过滤、重采样、有损压缩等,嵌入的信息应损坏很小,并在一定正确概率的基础上可以被检测到;(3)可靠性.水印嵌入和检测方法对未被授权的第3方而言,应是保密且不能被轻易破解的,而那些合法的所有者或使用者,通过水印的检测过程,来证实自己的合法行为,以达到版权保护的目的.目前常用的音频水印技术[2],按水印嵌入方式来分可以分为2类:时域法和变换域法.时(空)域算法的算法简单、运行速度快,但抗干扰能力差.变换域法有离散傅里叶变换(DFT)算法、离散余弦变换(DCT)算法、离散小波变换(DWT)算法等,该类算法复杂度较高,但鲁棒性好.由于小波变换具有良好的时频局部特性,因此成为目前频域法水印的主流技术.目前,一些主要的算法,由于缺乏一种有效的同步机制,无法抵抗音频裁剪等攻击,水印的稳健性不强.笔者研究了一种结合时域和变换域的音频水印算法,这种算法借鉴无线语音传输系统的同步技术,在时域上嵌入了同步信号,实现了语音信号受裁剪等攻击后的快速重同步.为了在满足不可感知性的前提下获得良好的抗噪声、MP3和裁剪等攻击的稳健性能,嵌入的水印信号将水印作为一幅二值图像来处理与隐藏,利用小波变换将水印嵌入到音频信息中.在水印提取时,使用了同步码检测技术,能够知道水印嵌入的起始点.1 算法原理由于语音信号是时间轴上的函数,剪裁等攻击会引起严重的同步错误.为了在检测时保持水印的同步,笔者提出了在隐藏有意义水印的同时,在语音信号中嵌入同步信息.一般来说,同步信息的数据量远小于水印数据量.所提出算法结合了变换域和时域水印技术.由于变换域上的水印能量能较均匀地扩散到时域上,对水印的不可感知性和稳健性比较有利,占隐藏数据量大部分的水印采用变换域方法嵌入于原始语音信号中.而为了实现快速重同步,同步信号的隐藏则采用时域水印技术.考虑到语音信息量一般比较庞大,如果进行全局DWT变换,计算量太大.因此笔者设计的算法对原始语音信号f(t)进行分段处理.在每个分段点处嵌入同步码.水印数据则嵌入到每段语音信号.隐藏了水印的语音信号受到各种攻击(MP3、噪声、低通滤波、剪裁等)后,从中检测的水印将不可避免地发生错误.为了降低检测水印的差错率,从而提高水印的稳健性,收稿日期:2007-05-21作者简介:张国武(1978-),男,湖南常德人,中南大学信息科学与工程学院硕士生,主要从事ERP的研究与应用.图1 算法原理图笔者设计的算法对每段语音信号做IDWT 变换以获取加入水印的语音信号.提取水印时,首先在待测语音信号中沿时间轴搜索同步信号,并利用数字通信的帧同步原理实现快速重同步.然后根据同步信号对语音数据分段.提取出一个估计的隐藏水印.图1是所提出算法的原理框图.2 同步码和水印的嵌入2.1同步码嵌入考虑数据隐藏中不可感知性和稳健性的基本要求,同步码需要满足如下条件:具有尖锐特性的自相关函数;具有较短的码长.笔者选用12b 的巴克码(Bark Code)作为同步码,巴克码是一种常用的群同步码,它是一种非周期序列,一个n 位的巴克码为{x 1,x 2,x 3, ,x n },x 1的取值为 1,其自相关函数为R (j )=n -j i =1x i x i +j =n j =0,0, 1 0<j <n ,0 j n .(1)当j 为负值时的自相关函数值,与正值对称,自相关函数在j =0时出现尖锐单峰.假设同步码为A 比特,每段语音信号有B 个抽样点,则共有M 段语音信号,记第i 段语音信号为R i (j ),同步码为B (j ),且同步码嵌入于每段信号的第1至第A 个抽样点中.嵌入算法如下:R i (j )=R i (j )-R i (j )mod S +3S /4 B (j )=1,R i (j )-R i (j )mod S +S /4 B (j )=0.(2)其中:1 i B ;1 j A ;S 为在满足不可察觉性的前提下,尽可能选择的大值;mod 为取模运算.R i (j )-R i (j )mod S 相当于R i (j )的低log 2S 位清零.同步码嵌入于每段信号R i (j )的第1至第A 的抽样点中,每段余下的B -A 个抽样点将用来隐藏水印数据.2.2水印的嵌入2.2.1音频信号的分解对R i (j )中上述的B -A 个抽样点,利用参考文献[3]提出的方法对每一段进行L 级的小波变换,保留前L -1级小波的细节分量及第L 级小波的近似分量不变,在第L 级小波的细节分量d 1中嵌入水印,假设d 1的长度为Ld 1.2.2.2水印信号的获取 由一幅二值数字图像,得到一个二值序列S ={s i ,0 i <N },其中s i 代表图像的点,1或-1表示该点为黑或白,且s i {-1,1}.利用一长度为N 的伪随机序列P 对S 进行调制,得到序列P ={p i ,0 i <N } p i {-1,1},(3)W ={w i ,0 i <N } w i {-1,1}.(4)其中:w i =s i p i ;0 i <N .将W 作为要嵌入的水印,其中(3)式中的伪随机序列P 对算法的安全性起着重要作用,由于P的伪随机性,W 也具有伪随机的特性,在攻击者不了解P 的情况下,很难检测到水印并将其破坏掉.2.2.3水印信号的嵌入 为保证嵌入水印后的信号质量和算法的稳健性,将水印W 分成等长的M 段,每段的水印长度为K ,且K =N M ,K Ld 1时将第m (0<m <M )段的K 个值依次嵌入到相应第m 段音频信号小波变换的序列d 1中,且d i (i )=d 1(i )[1+ w m (i -s 0)] s 0 i s 0+k ,0 s 0<L dl -K ,d 1(i ) 其他.(5)其中: 为伸缩因子(通过调整 的取值,可以使嵌入的水印在具有听觉不可见性的同时保证水印的强度足够大);s 0是序列d 1中嵌入水印的起始点.利用d 1和第L 级近似分量及前L -1级细节分量进行小波逆变换,得到嵌入水印后的第m 段信号.重复以上步骤,将得到的M 段信号依次合成为嵌入水印后的完整信号.水印嵌入过程中的所有参数都应由版权所有者或仲裁机构妥善保存,以便在水印检测时使用.3 同步码和水印的检测及提取同步码的检测方法是基于数字通信中的帧同步技术.笔者采用如下的综合抗衰落帧同步方案:在任何状态下,都同时进行监视和搜索输入的语音信号.如果在规定时间连续出现若干次 丢失原来的随后发现新的帧定位信号 或者 发现新的75第4期 张国武,等:同步音频水印算法的实现图2 同步码检测随后丢失原来的帧定位信号 ,就与之建立新的帧同步.如图2所示.其中: Found 指搜索到同步符; Lost 指失去同步符;N 1,N 2, 为整数;L 为嵌入同步码时相邻2个同步码的距离.按照上述检测原则,a ,b 和e 点被认为是同步码.搜索同步码和建立重同步的具体步骤:(1)对整段语音信号进行监测,提取与同步码的相关函数大于一定阈值的码;(2)在上述提取的码中相邻两码的距离满足分段要求的被认为是同步信息.同步信号的提取过程是嵌入过程的逆过程.使用最大似然译码来提取同步码的每个比特B (j ),1 j N .则它与同步码B 的相关函数定义为(B ,B )=N j =1B (j ) B (j ).(6)如果 (B ,B ) T ,则认为同步信号已搜索到.对待测信号同步信号后面的A -B 个抽样点,利用水印的嵌入的第1步,得到序列d 1,对未嵌入水印的原始音频信号,用同样的方法得到序列d 1.利用s 0,由(7)式得到第m 段的水印信号w m ,w m i =+1 1-d 1(i +s 0)d 1(i +s 0) 0 0 i <K ,-1 其他.(7)对所有M 段信号重复上述步骤,得到长度为N 的水印信号w m ,用序列P 对w m 进行调制,得到序列s i =p (i )w i 0 i <N .(8)s 即可得到水印图像.观察者可以直接观察比较水印和原始水印的相似度.为克服主观的影响,可采用一种客观的评价方法,用下式计算水印的相似程度[4]Sim =N N .(9)其中:N 表示提取出的水印图像和原始水印图像相同的像素数;N 是原始图像的总像素数.4 实验结果笔者采用N =7的同步码,语音信号为长度为2s,其抽样频率为44.1kHz,量化值为16b,内容为一段音乐的音频信号进行实验.选取N =7的巴克码1110010作为同步码.在计算相关函数时,它转化为B =[+1,+1,+1,-1,-1,+1,-1].在实验中权衡了稳健性和不可察觉性后,该算法采用S =8192,该参数对参与实验的语音信号能获得比较好的性能,即当要嵌入 1 时,低8位置为11000000,要嵌入0 时,低8位置为01000000.在实验中同步码相关函数阈值T 取2.4.每段信号长度取为1000个样点,对每段信号进行3层小波变换,水印是N =64的二值图像,嵌入水印时 =0.15,水印检测同步,对含有水印的信号不作任何处理.对处理后的信号进行水印检测并计算得到Sim 的值如图3所示.a 原始水印b 直接提取c 低通滤波d 加入白噪音e 采用上采样率f 采用上采样率g 重新量化 (Si m=0.9835)(Si m=0.7825)(Si m=0.7956)(Si m=0.9813)(Si m=0.9785) (Sim=0.7417)图3 处理后的信号进行水印检测的结果图实验结果如下:(1)低通滤波.采用长度为6阶,截止频率为22.05kHz 的巴特沃兹低通滤波器.水印检测结果如图2.(2)重新采样.上采样是将信号采样频率提升为48k Hz,再还原为原采样频率.下采样是将信号采样频率下降为22.08kHz,再还原为原采样频率.2次的检测结果见图3-e,f.(3)重新量化.将信号由16bit 量化为8bit,再量化为16bit,检测结果为图3-g.(4)噪声干扰.对信号在时域中加入高斯白噪音.信噪比取为10dB.水印结果检测表明仍能正确识别且没有误判.(5)音频压缩编码.对信号采用MP3编码标准,在不同的比特率下进行编码,比特率越低,信号压缩率越高.解码后水76吉首大学学报(自然科学版)第28卷印检测结果见表1所示.表1 不同比特率下信号的压缩比和解码后提取水印的Si m 值比特率 kbps压缩比Sim 值1604.4 10.94231285.5 10.94021126.3 10.9312967.4 10.9289808.8 10.91525 结语从实验结果可以分析,该算法结合时域 变换域水印技术,根据同步信号和水印不同的要求,采用在时域中嵌入同步码,在DWT 域中嵌入水印的方案,同时满足了水印稳健性和同步码检测计算量小的要求,对采样率的改变及MP3压缩有较强的稳健性,提取出来的水印比较清晰,该算法具有较强的稳健性和安全性.参考文献:[1] FRANK HARTUNG,MARTIN KUTTER.Multimedia Watermarking Techniques [J].Proceeding of IEEE,1999,87(7):1079-1107.[2] 李跃强,孙星明.一种健壮的数字音频水印时域算法[J].计算机工程与应用,2005,41(8):89-91.[3] 钮心忻,杨义先.基于小波变换的数字水印隐藏与检测算法[J].计算机学报,2000,23(1):21-27.[4] WON -GYUM KIM ,JONG C HAN LEE,WON DON LEE.An Audio Watermarki ng Scheme with Hidden Signatures [D].Beijing:Pro -ceedings of 2000on Information Securi ty,2000.The Implementation of a Synchronous Audio Watermarking AlgorithmZ HANG Guo -wu,ZE NG Qiao -ming(Central South Univ.of Information Science and En g ineering,Changsha 410008,China)Abstract :The current audio watermarking algorisms lack effective techniques for synchronization.In this paper,the synchronization scheme in communication network is adopted and a fast resynchronized meaning -ful audio watermarking algorithm is proposed.These are some characteristic:with the technology of spatial watermarking,synchronization signal is e mbedded into the audio signal in order to resist some possible attack along the time a xis;the algorithm which is based on the use of wavelet transform domain can enhance the robustness,and the watermark is a binary image here.The e xperiment results of the emula tion show that the algorithm has good robustness in the watermark confrontation ad -ditive Gaussian noise,MP3compression and cutting,and other aspec ts,and it can be used for digital audio products copyright protection.Key words :synchronization;wavelet transform;robustness(责任编辑 陈炳权)77第4期 张国武,等:同步音频水印算法的实现。