音频水印的评价标准

合集下载

1.6第六讲 数字音频的主要性能参数(无水印)(无水印)

1.6第六讲   数字音频的主要性能参数(无水印)(无水印)

三、声道数
声道数是指所使用的声音通道的个数,它表明声 音记录只产生一个波形还是两个波形,也就是单声道
或是双声道。
双声道也称立体声,它比单声道听起来更为丰满,
但它占用的存储空间也是单声道的两倍。
四、数据速率
数据速率既与计算机中实时传输信息有关,又 与计算机的存储容量有关。
数据速率可用以下公式计算。 数据速率=采样频率×量化位数×声道数(bit/s)
数字音频的主要性能参数
一、采样频率
采样频率是将模拟声音波形转换成数字音频时,
每秒钟对声音波形进行采样的次数。
目前通用的标准采样频率有5kHz、11.025kHz、
22.05kHz、44.lkHz和48kHz。
二、量化位数
量化位数即量化精度,量化位数越多,量化精 度越高,它决定了模拟信号数字化以后的动态范围。
四、数据速率
根据声音的频带,通常把声音的质量分成5 个等级,由低到高分别是电话、调幅(AM)广 播、调频(FM)、光盘(CD)和数字录音带 (DAT)的声音。在这5个等级中,使用的采样 频率、样本精度、通道数和数据率如下表所示。
四、数据速率
课堂小结
一.采样频率 二.量化位数
三.声道数
四.数据速率
样本大小是用每个声音样本的位数(bit/s) 表示的,它反映度量声音波形幅度的精度。
二、量化位数
采样精度的另一种表示方法是信号噪声比,简称 为信噪比(SNR)
SNR =10 lg[(Vsignal)2/(Vnoise)2]=20 lg(Vsignal/Vnoise)
假设Vnoise=l,采样精度为lbit表示Vsignal=21,它的信噪 比SNR=6dB。 假设Vnoise=l,采样精度为16bit表示Vsignal=216,它的 信噪比SNR=96dB。

音源定义指标

音源定义指标

音源定义指标
音源定义指标是用来描述和评估音频信号的特征和属性的一组指标。

这些指标通常可以分为以下几个方面:
1. 频率特性:包括频率范围、频率响应、频谱分布等。

频率特性可以反映音频信号在不同频率下的能量分布情况,如低频、中频、高频的分布比例。

2. 动态范围:指音频信号能够覆盖的最大动态范围,即最大可辨识的音量差异。

较大的动态范围表示音频信号能够表现更多的细节和音量变化。

3. 噪音水平:描述音频信号中存在的噪音或杂音的强度。

噪音水平越低,音频信号越清晰。

4. 失真程度:指音频信号在传输或处理过程中产生的失真程度。

失真会导致音频信号的质量下降,失真程度越低,音频信号越接近原始信号。

5. 空间特性:描述音频信号在立体声或环绕声系统中的定位和分布效果。

包括声场宽度、深度、声像定位等参数。

6. 动态特性:包括音频信号的攻击性、衰减速度等参数,能够反映音频信号的动态变化特性。

这些指标可以帮助我们评估音源的质量,选择合适的音频设备或进行音频处理。

不同的音源定义指标适用于不同的应用场景和需求。

基于恒定统计特征的数字音频水印技术

基于恒定统计特征的数字音频水印技术

WA G Q , I i h n , N i L — eg WA G Bn—i C E i Bc N igx, H N Q
(ntueo nomainE gn eig nomainE gn eigU ies y hn zo 5 0 2,C ia Istt fIfr t n ier ,Ifr t n ie r nv ri ,Z egh u4 0 0 i o n o n t hn )
⑥ 在 大多数 情 形 下 , 印检 测 不 应 该 需 要 原 始音 水
Ke r s dgtla dow tr rig iei om t n;sai ia p rmee ;bid et cin y wo d : i a u i aemakn ;sd n r ai i f o tt t l aa tr l xr t sc n a o
对于数 字水 印 的本 质 , o 人认 为数 字水 印 C x等 是边 信息 通 信机 制 的 一 种 特殊 形 式 …—— 从 水 印 嵌入 器 向水 印接 收 器 传输 信 息 。基 本 分 为 3个 模 型 , 最 先提 出的模 型 中 , 在 载体 作 品被 当作 纯噪 声 ; 在第 2个 模 型 中 , 载体 作 品仍 被 视 为 噪声 , 该 噪 但 声为信 道 编码器 提供边 带 信息 ; 最后一 个模 型不 把 载体 作品 当作 噪声 , 而是 当作 另 一类 信 息 , 必 须 它 和水 印信息 一起 用 复用 的 方式 传 输 。有 意 义 的 数 字音频 水 印技术 是 将 具有 特 定 意 义 的信 息 嵌 入 到 原 始音 频 中而不 显 著 地 影 响其 质 量 。水 印 隐 藏 在 宿主音 频数 据 中通常不 为 人所感 知 , 此外还 必须 能 够 抵抗 常规 音频 信号处 理 以及某 些恶 意的攻 击 。

数字音频水印技术的研究与应用

数字音频水印技术的研究与应用

数字音频水印技术的研究与应用数字音频水印技术是一种将水印信息嵌入到数字音频中的技术。

它通过改变音频的部分特征,如频谱、相位或时间域,来嵌入隐藏信息,从而实现对音频内容的认证、版权保护和溯源等功能。

随着数字音频的广泛应用,数字音频水印技术也越来越受到人们的关注。

数字音频水印技术的研究一直以来都是一个热门的研究领域。

研究人员通过对数字音频信号的特征进行分析,选择合适的嵌入位置和嵌入强度,来确保水印嵌入后对音频质量的影响最小化。

近年来,随着深度学习等技术的发展,研究者们也开始尝试使用机器学习算法来进行音频水印的嵌入和解析,以提高水印的鲁棒性和抗干扰能力。

数字音频水印技术在版权保护方面具有重要的应用价值。

随着数字音频的盗版问题日益严重,传统的版权保护手段已经无法满足实际需求。

数字音频水印技术能够将版权信息嵌入到音频文件中,使得音频的版权信息难以被篡改或删除。

这对于音频作者和唱片公司来说是非常有价值的,可以更好地保护他们的知识产权。

同时,数字音频水印技术也能够通过解析水印信息来进行音频的溯源,对于侵权行为的追踪和取证非常有帮助。

另外,数字音频水印技术在音频内容认证方面也有广泛的应用。

在音频传输过程中,数字音频水印技术可以用来验证音频的完整性和真实性,防止音频在传输过程中被篡改或替换。

这对于一些对音频内容的可靠性要求极高的场景,如司法鉴定、新闻报道和证据保全等,都起到了至关重要的作用。

此外,数字音频水印技术还可以为音频文件的标记和分类提供帮助。

通过嵌入不同的数字音频水印,可以对音频文件进行标记和索引,并方便地进行分类和检索。

这对于音频搜索引擎的优化和音频数据库的管理非常重要,有助于提高用户的搜索体验和音频管理的效率。

总的来说,数字音频水印技术具有广泛的研究和应用前景。

它在版权保护、音频认证和溯源、音频标记和分类等方面都具有重要的作用。

随着音频技术的不断发展和应用需求的增加,数字音频水印技术必将迎来更加广阔的发展空间。

音频处理中的主观音质评价方法研究

音频处理中的主观音质评价方法研究

音频处理中的主观音质评价方法研究音频处理是指对音频数据进行加工、修复、增强等技术处理,以改善音频的质量和听觉体验。

在音频处理的过程中,主观音质评价方法起着至关重要的作用。

主观音质评价方法通过人的听觉感知来评估音频质量,直观反映了音频在听众耳中的表现,对于音频处理的效果评估具有重要的参考价值。

本文将探讨音频处理中的主观音质评价方法研究。

1. 主观音质评价的重要性音频处理的目的是提升音频的质量,让听众有更好的听觉体验。

而主观音质评价是评估音频处理效果的一种重要方法,它能够直接体现人们对听觉感知的主观感受。

通过主观音质评价,可以了解不同音频处理算法或参数对音频质量的影响,从而优化音频处理的效果。

因此,主观音质评价方法的研究对于音频处理技术的发展和应用具有重要的指导价值。

2. 主观音质评价的方法主观音质评价的方法有许多种,其中最常用的方法是主观主观比较法和主观单评分法。

主观主观比较法是通过让受试者同时听取两个音频样本,并比较它们的音质差异。

在实验中,受试者需要根据听觉感知来选择两个样本中哪个更好或更接近主观理想音频。

该方法的优点是能够直接比较不同音频样本的音质差异,但需要耗费大量的时间和人力。

主观单评分法是让受试者逐一评价音频样本的音质,通常使用5分量表、9分量表或100分量表等作为评价标准。

受试者需要根据听觉感知将音频样本评分,评分越高表示音质越好。

该方法相对于主观主观比较法来说,能够更快速地获取音频样本的质量评价结果。

除了上述常用的主观音质评价方法,还有一些衍生的方法,如排序方法、类别评价方法、模拟听觉环境评价方法等。

这些方法在不同的实验条件下有着各自的优势和适用性。

3. 主观音质评价的实验设计在进行主观音质评价实验时,需要考虑实验设计的重要原则,以保证评价结果的可靠性和有效性。

首先,需要选择合适的受试者群体。

受试者的听力和听觉感知水平是评价结果的关键因素,应尽量选择听力正常、具有一定听觉经验的受试者。

音频数字水印技术在版权保护中的应用

音频数字水印技术在版权保护中的应用

音频数字水印技术在版权保护中的应用音频数字水印技术是一种在音频文件中嵌入不可见的标识信息的技术,可以用于版权保护和音频身份识别。

随着数字化技术的快速发展,音频数字水印技术在版权保护中的应用也变得越来越重要。

本文将探讨音频数字水印技术的原理、应用场景以及其在版权保护中的作用。

音频数字水印技术的原理是将一段具有唯一标识的数字码嵌入到音频信号中,这段数字码在听众听到音频时是不可感知的。

数字码可以包含版权信息、音频所有者的信息或其他与版权保护相关的信息。

嵌入数字码的过程可以通过离散余弦变换等技术来实现,确保嵌入后的音频质量不受影响。

音频数字水印技术可以广泛应用于版权保护领域。

首先,对于音乐行业来说,数字水印可以用于保护音乐作品的版权。

音乐制作人可以将数字水印嵌入到原始音频中,当有人未经许可使用这些音频时,通过解码数字水印可以追踪到音频的来源。

此外,数字水印还可以用于音乐版权的监测和授权管理,帮助音乐公司追踪音频的使用情况并进行结算。

除了音乐行业,音频数字水印技术还可以在广播电台、电视台等媒体领域得到广泛应用。

例如,广播电台可以在节目中嵌入数字水印以确保节目的版权。

当有人未经许可转载节目时,版权方可以通过分析数字水印来追踪到侵权者,并采取必要的法律措施。

此外,数字水印技术还可以用于广告追踪和效果评估,帮助广告主监测广告的播放情况和效果。

音频数字水印技术还可以应用于语音识别和声纹识别领域。

通过在音频中嵌入数字水印,可以对音频进行身份验证和属性识别。

例如,数字水印可以嵌入到语音识别系统中,用于区分正式用户和非法用户,保护语音识别系统的安全性。

此外,数字水印还可以用于医学声纹识别、司法声纹识别等领域,为声纹识别技术提供额外的安全保障。

虽然音频数字水印技术在版权保护中发挥着重要作用,但也面临一些挑战和限制。

首先,数字水印可能会受到音频压缩算法等处理的影响,导致数字水印的可靠性下降。

其次,数字水印技术可能受到攻击者的攻击,例如修改或删除数字水印,从而破坏版权保护的效果。

数字音频水印技术的探索与应用

本文就数字音频水印技术的发展、特点、算法等方面进行了阐述,对数字音频水印技术(以及音频指纹识别技术)作为媒体融合的中间介质在广播电视领域的最新应用进行了简要的说明与概括。

数字音频水印 掩蔽效应 鲁棒性 音频指纹识别 北京电视台官 健 王 麒 康许剑 程 宏一 数字音频水印技术概述1. 数字音频水印的概念数字音频水印技术是将数字水印通过一些特定的水印嵌入算法嵌入到原始音频文件中,同时对原始音频文件的音质不会产生太大的影响,或者人耳感觉不到音质的变化。

数字音频水印技术还要能够有效地抵抗违法侵权行为的各种攻击,在需要时能够完整地提取出所嵌入的水印内容,以便作为证据来保护版权所有者的合法权益。

2. 理论依据在音频文件中嵌入水印的一般都要利用人类听觉系统的某些特征来实现,充分利用这些特征可以提高水印算法的不可感知性。

(1)掩蔽效应当人们同时听两个声音时,其中一个声音的感受会因为另一个声音的出现而发生改变。

人们愿意接受的声音成为“信号”,信号以外的各种杂乱声音统称为“噪声”。

噪声的干扰,使人们对信号的听阈提高,这种现象称为掩蔽效应。

假定声音A 的阈值为50dB ,若同时又发出声音B ,这时要听清楚声音A ,声音A 的阈值提高到64dB ,即比原来的阈值要提高14dB 才能被听到。

一个声音的阈值因另一个声音的出现而提高听阈的现象称为听觉掩蔽。

在上述例子中,B 称为掩蔽声,A 称为被掩蔽声,14dB 称为掩蔽量。

掩蔽现象是神经系统判断的率高的纯音掩蔽作用大,即低频声能有效地掩蔽高频声,但高频声对低频声的掩蔽作用不大。

掩蔽量随掩蔽声声压级的增加而提高,并且掩蔽的频率范围变宽。

(2)人耳对声音信号相位的敏感度人耳对声音信号的绝对相位不敏感,而只对其相对相位敏感。

(3)人耳对频率的敏感度人耳对不同频段声音的敏感程度不同,通常人耳可听见20Hz~18kHz 的信号,但对300Hz~3400Hz 范围内的信号最敏感,幅度很低的信号也能被听见,而在低频区和高频区,能被人耳听见的信号幅度要高得多。

基于内容分析的音频水印算法


An u i a e m a ki g Al o ih s d o A do W tr r n g rt m Ba e n Aud o Co e a y i g i ntntAn l zn
S UN n d 。LU n Xi - e Li g。J NG - i I Li a x
缩等对 水 印 的破 坏攻 击.
LlJ 12


个 具有 实用 价值 的音频 水 印算法 一 般应
具有感知透明性、 鲁棒性 、 安全性、 计算复杂性低和
错 误率低 的 特点 .感 知 透 明 性 在 高 品质 的音 乐 制 品不
可避免地要经受各种信号处理操作 , 显然水印不能 因为常规的信号处理操作而消失或发生误检测 , 所 以鲁棒 性也是 很必 要 的 .如何 在 不 影 响 音 质 的情 况下提高水印的鲁棒性是算法研究必须解决 的问 题 之一 .另一 方 面 , 包括 随机 裁 剪 、 间 标度 修 改 时
音频 数字水 印技 术 可 以用 在 与 音 频 相关 的数
字 作品 的版权保 护 、 内容认 证 、 音频 检索 、 隐蔽 通信 等领域 , 目前 仍 然 是 国 内 外 关 注 的 研 究 热 点 之

速爬 升为依 据选 者特 征点 , 并把水 印数 据嵌人 到特 征点 附近 , 提高 了水 印性 能 J但 是嵌 人 水 印 信息 , 量较少 , 且抗 随机裁 剪 的能力不 很强 .本文 提 出 并 利用短 时 帧能量 确定 高能 区 、 把水 印嵌 人到 听觉敏 感 区域 的方 法 , 有效抵 抗 了随机裁 剪 、 噪声 、 有损压
(Z egh uIstt o A rnui d syM ngmetZ egh u40 1 ,hn ) h nzo tue f eoat a I ut aae n ,h nzo 50 5 C i ni c n r l a

一种自适应复倒谱音频水印算法

一种自适应复倒谱音频水印算法黄雄华;蒋伟贞【摘要】倒谱域统计均值的稳定性已被一些文献用来嵌入水印,但其水印的嵌入强度等参数是根据实验获得的,这些参数需要通过反复实验来调整,因难以找到水印鲁棒性和透明性达到最佳折中的参数,故提出一种根据信噪比来调整水印鲁棒性和透明性关系的自适应复倒谱音频水印算法.该算法实现了水印盲检溯,水印的提取不需原始音频和原始水印.实验结果表明,该算法在满足透明性的要泉下具有较好的鲁棒性.【期刊名称】《成都大学学报(自然科学版)》【年(卷),期】2010(029)003【总页数】4页(P253-256)【关键词】音频水印;自适应;信噪比;复倒谱【作者】黄雄华;蒋伟贞【作者单位】桂林电子科技大学教学实践部,广西,桂林,541004;暨南大学,信息科学技术学院,广东,广州,510084【正文语种】中文【中图分类】TP3090 引言计算机技术和通信技术的发展使得数字作品能被方便的复制、篡改和传输,数字水印技术作为一种新的保护版权、鉴定作品完整性的有效手段,受到人们的广泛的关注和研究[1].同时,在需要重播的应用中,数字水印技术是替代密码学的潜在解决方法之一[2,3].复倒谱分析是语音信号处理中的一种强有力的分析手段.倒谱分析是同态系统的理论基础,其在语音识别、地震检测、声纳分析等方面有广泛的应用.已有学者在倒谱域中研究倒音频水印并取得了一些成果,如文献[4,5]提出的倒谱域统计均值修改算法,文献[6]提出的倒谱域BCH纠错码的鲁棒音频水印算法,以及文献[7,8]提出的根据人类听觉感知特性和心理声学模型定性控制水印嵌入的倒谱域音频水印算法.这些算法的一个共同问题在于缺乏定量的自适应机制,因为水印的嵌入强度等参数需要反复实验来获得,且难以得到最合适的值.基于此,本文提出一种根据SNR来自适应确定水印嵌入强度的音频水印算法,该算法可根据听觉要求的SNR自适应确定最大嵌入强度,且水印具有较好的鲁棒性.1 离散傅立叶变换及其性质离散傅立叶变换(DFT)是倒谱分析的核心,本文的自适应算法应用其相关性质.用→x={xi|0≤i<N}表示时域音频信号,用→X={Xi|0≤i<N}表示傅立叶变换后的对应信号.记N-1),由ai×j和bi×j组成的矩阵分别为A,B.音频信号的傅立叶变换及其逆变换可表示为,并且有下述性质:(5)式中,I表示单位阵.其中,~a 表示a的共轭. i×ji×j2 音频信号的复倒谱变换过程音频信号的复倒谱变换过程如图1所示.图1 复倒谱变换的过程图1中,x→={xi|0≤i<N},表示输入的音频信号,X→={Xi|0≤i<N},表示经DFT变换后的信号,lnX→={lnXi|0≤i≤N-1},表示取对数后的信号,C→={Ci|0≤i≤N-1},表示倒谱系数.复倒谱域的变换是可逆变换,其逆变换过程如图2所示.图2 复倒谱的逆变换过程图2中是倒谱系数经过DFT后的值,→Ye={Yei|Yei= eYi, 0≤i≤N-1},是对 DFT变换后对应的指数值,→x=IDFT(→Ye)={xi|0≤i<N},表示经过 IDFT后时域的值.通常,复倒谱的能量主要集中在零点附近.一般而言,时域一定的扰动对复倒谱统计均值(CCSM)影响很小[4,5].3 自适应复倒谱统计均值修改算法3.1 复倒谱统计均值修改算法原理复倒谱统计均值修改(CCSMM)算法[1,3,5]的基本原理为:首先,将音频数据分帧,对每帧求复倒谱系数;其次,计算每帧的倒谱系数的均值,并将每个倒谱系数减去均值;最后,根据水印比特“1”或“0”,调整统计均值分别为M1或M2,并作逆变换.水印的提取以(M1+M2)/2为门限,倒谱系数均值大于门限提取“1”,否则提取“0”.显然,上述算法中M1和M2的确定选择需要反复实验以满足水印的鲁棒性和透明性的要求,最佳取值通常难以获得,M1和M2的取值与音频信号有关.基于此,本文通过SNR来确定M1和M2的值,提出了一种自适应复倒谱统计均值(ACCSMM)音频水印算法.3.2 ACCSMM算法相关原理3.2.1 倒谱域与时域的对应变化关系.以下沿用前述的符号及其意义,并在相应的符号上加“′”号表示倒谱域变化后对应的值(即添加水印后的相应值).若倒谱域每个系数变化量为Δ,倒谱系数可表示为,那么,倒谱系数经过DFT变换后的表达式为,其中,T表示转置(以下同).由式(3)、(4),式(8)可简化为,式(9)经过指数化过程,可表示为,式(11)经过 IDFT变换后,可表示为,3.2.2 音频质量评价准则.目前,音频水印对嵌入了水印的音频失真评价标准借鉴了信号处理的方法,即通过峰值信噪比PSNR(Peak Signal to Noise Ratio)和信噪比SNR来衡量嵌入水印后音频信号的听觉失真度.设x→是含有 N个样点的原始数字音频信号, x→={xi|0≤i<N},xi是幅值序列.x→′是嵌入水印后的数字音频信号,x→′={x′i|0≤i<N},x′是幅值序列.音频信号,x→′的SNR定义为:由式(10)、(12),式(13)可表示为,其中,Ci是xi的函数.式(13)表明,对确定的帧长N,由初始信号和要求的音频失真度量SNR可以自适应地确定倒谱变化量.4 水印的嵌入算法根据上述的原理,我们采用视觉可见的二值图像作为水印,二值图像表示为:P={P|pm×n,0≤m<M,0≤n<N},pm×n表示图像像素,M,N分别为图像的宽和高;音频表示为,X={X|xi,0≤i≤L},xi表示音频幅度,L是音频长度.算法的具体步骤如下: 首先,将图像水印经过降维处理,其次,从音频起始处开始做分帧处理,每帧长度l=?L/M·N」,?·」表示取整.然后,对每帧按下述方法嵌入一比特的水印.记,x(j,k),1≤k≤l,1≤j≤M×N,表示第j帧的第 k个数据,并对所有的帧求复倒谱变换,式中,C(j,k)表示第j帧第k个倒谱系数,再依次求第j帧倒谱的和及均值,对每个倒谱系数做如下变换以嵌入水印,式中如果满足:δ(j)>0,设定添加水印后的统计均值门限为“0”,统计均值大于“0”提取比特“1”,统计均值小于“0”提取比特“0”,可以实现水印的盲检测.同时,为使水印鲁棒性较好,δ(j)可选取,式中可据式(14)计算而得,目的是为了获得较高的水印嵌入强度.最后,将嵌入水印后的倒谱系数做逆倒谱变换,从而得到含水印的音频.5 水印的提取根据前面的分析,我们可以实现水印的盲提取:首先,将带水印的音频分帧,帧长与嵌入水印时相同;其次,对每帧作倒谱变换,计算其统计均值,并与与门限“0”比较,如果大于“0”,提取比特“1”;否则,提取比特“0”;最后,将水印比特按序排列并升维还原图像水印.6 实验结果在实验中,我们选用了图3所示的64×64的二值水印图像,并截取了名为flybird.wav的音频左声道前50 s的音频数据作为载体音频,采样频率为44.1 KHz,16比特量化.预设含水印各帧局部信噪比为60 dB,在未受攻击的情况下,提取的水印如图4所示.比较图3、4可见两者几乎无视觉上的差异.图3 原始水印图像图4 未受攻击提取的水印为了测试算法的鲁棒性,本文对水印音频进行了多种攻击模拟:包括MP3压缩,压缩率为128 kbps;高斯白噪声,方差为0.01;低通滤波,截止频率为6 KHz;重采样,采样频率为11 025 Hz.攻击后提取的水印如图5所示.图5 攻击模式测试按式(18)所表示的归一化相关值如表1所示.表1 不同攻击模式下水印的归一化相关值表比较攻击方法相似系数噪声攻击0.9435低通滤波 0.9276重采样 0.9349 MPEG压缩 0.9371未攻击 0.9975式中,P,Ps分别表示原始水印图像和提取的水印图像;p(m,n),ps(m,n)分别表示其像素(m,n)值.实验结果表明,本文提出的水印算法在较高的SNR条件下仍具有较好的鲁棒性.7 结论本文利用复倒谱域系数的统计均值趋于零的特性,以“0”为水印提取门限,实现了水印的盲提取.同时,为了提高水印的鲁棒性,在嵌入水印过程中应用了音频信号失真评价准则——信噪比来控制水印的不可听性.在信噪比确定的情况下,按式(14)计算取得最大水印嵌入强度,相应的也就取得了最大水印鲁棒性,实验的结果也表明了水印在不可听的情况下的鲁棒性.参考文献:[1]Cox IJ,Miler ML.The First50Years of Electronic Watermarking[J].AppliedSignal Process,2002,56(2):225-230.[2]Arnold M.Audio Watermarking:Features,Applications,and Algorithms[C]//IEEE Multimedia and Expo.NewY ork:IEEE Press,2000:1013-1016.[3]Swanson M D,Zhu B,Tewfik A H.Robust Audio Watermarking Using Perceptual Masking[J].Signal Process,1998,66(3):337 -355.[4]Xin L,Heather Y H.Transparent and Robust Audio Data Hiding in Cepstrum Domain[C]//Proceedings of IEEE International Conference on Multimedia and Expro.New Y ork:IEEE Press, 2000:397-400.[5]K wang L S,Sung H Y.Digital Audio Watermark-ing in the Cepstrum Domain[J].IEEE Trans On Consumer Electronics,2000, 46(3):744-750. [6]Liu S C,Lin S F.BCH Code-Based Robust Audio Watermarking in the Cepstrum Domain[J].Journal of Information Science and Engineering,2006,22(1):535-543.[7]G opalan K.Audio Stegnography by Cepstrum Modification[C]// Conference on Acoustice,Speech and Signal Processing.Philadelphia:IEEE Press,2005:481-484.[8]年桂君,王树勋,唐笑年.倒谱域自适应音频水印算法[J].吉林大学学报,2008,26(1):55-61.。

用于版权和内容认证的音频水印

用于版权和内容认证的音频水印林晓丹【摘要】提出了一种多功能水印算法,能同时对数字音频版权和内容完整性进行认证.首先将代表版权信息的二值图像以零水印方式嵌入音频美尔倒谱系数(MFCC),再将该系数转换成二进制串,作为最终的水印信息以量化方式嵌入音频离散余弦变换(DCT)域.检测时可实现两种水印信息的盲提取.实验结果表明,该方法不但对音频内容的恶意篡改非常敏感,而且能够定位出被篡改音频的位置;此外,还能有效抵抗诸如滤波、MP3压缩等常规信号处理操作,正确恢复版权信息.【期刊名称】《计算机应用》【年(卷),期】2010(030)008【总页数】3页(P2269-2271)【关键词】音频水印;内容认证;版权保护;美尔倒谱系数【作者】林晓丹【作者单位】华侨大学,信息科学与工程学院,福建,泉州,362021【正文语种】中文【中图分类】TP309;TP30 引言随着多媒体技术的迅速发展和因特网的盛行,人们可以任意地对数字音频作品进行复制、修改并在网络上传播。

数字音频作品的版权问题和内容完整性面临前所未有的挑战。

现有的认证方法大多是嵌入单一水印,例如用于版权保护的稳健水印,或是用于内容完整性认证的脆弱水印。

基于扩频技术的水印[1]具有非常好的稳健性,能够有效地实现作品的版权保护。

但这种方法在需要对音频内容的真实性进行认证的场合就显得无能为力了,例如法庭证据、电视电话会议。

音频内容可能已经遭到篡改但却很难被察觉,因此一个能够验证音频真伪性的方法就显得异常重要。

典型的脆弱水印算法例如LSB(Least Significant Bits)算法[2],对内容篡改非常敏感,但对一些常规的信号处理也同样敏感,无法对版权进行保护,因此在应用方面有一定的局限。

若能在一个系统中同时实现版权和内容完整性认证,将使数字水印技术具有更广阔的应用前景。

与较为成熟的单水印技术相比,多功能音频水印的研究工作目前还处于起步阶段。

现有的一些方法例如鸡尾酒算法[3],将两个互补的水印同时嵌入音频,分别按正负调制规则对音频离散余弦变换(DiscreteCosineTransform,DFT)系数进行调制。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

音频水印的评价标准
水印算法的质量是音频水印最为重要的一个因素,而具体评判一个水印算法的质量的好坏,现在也没有统一的标准。

因此,本文从水印的一些基本特征出发对于水印算法的质量的好坏进行度量,也就是从水印算法的不可感知性,以及水印算法的鲁棒性二个方面来考虑水印算法的质量的好坏(刘应,2014)。

1、水印算法的不可感知性
水印算法的不可感知性也即是在一个音频信号加入了水印之后,对于加入水印之后的音频信号的感知程度,加入水印之后的音频信号的感知程度越低,说明水印算法的不可感知性越好,加入水印之后的音频信号越接近于原信号,水印算法就越好。

而具体的水印算法的不可感知性得评判标准一般又分为二种,也就是主观不可感知性的评判标准以及客观不可感知性的评判标准。

主观不可感知性的评判标准:
顾名思义,也就是选取听众将没有加入水印的音频信号,与加入了水印的音频信号同时听一遍,从个人主观的程度上给出相应水印算法的不可感知性的评价。

主观不可感知性得评判标准(SDG)具体的评判标准如下表2.1所示:
表2.1 主观不可感知性得评判标准(SDG)
从表2.1 主观不可感知性得评判标准(SDG)可以看出来,个人主观的程度上给出相应水印算法的不可感知性的评价,评价越接近于0,主观不可感知性越好,水印算法越好。

客观不可感知性的评判标准:
而对于具体的客观不可感知性的评判标准其实方法有很多,本文选取信噪比(SNR)来进行评判。

具体的信噪比(SNR)评价方式如下:
2
12
1
10lg
(1)
n
k n k x
SNR x x ===-∑∑ (2-1)
其中,x 表示没有加入水印之前的音频,x1表示加入水印之后的音频,n 为
采样点数。

2、水印算法的鲁棒性
在对于水印算法具体的嵌入过程的时候,甚至是水印相关的信号在进行存储,与在进行传输的时候都会受到一定的干扰,导致水印本身所含有的信息可能发生一定的改变,所以对于水印算法的评判,水印算法的鲁棒性也是一个不能够忽略的点,具体本文对于水印算法的鲁棒性的度量选用的是归一化相关系数(NC )进行相关的评判的。

归一化相关系数定义如下式子2-2所示:
()()
,*1,m n
w i j w i j NC =
∑∑ (2-2)
其中,
具体表示的是原始水印信,
具体表示的是提取的相关
的水印信息。

M*N 是信息的维度。

()
,w i j ()
1,w i j。

相关文档
最新文档