辽宁师范大学计算机与信息技术学院

合集下载

基于二元Weibull分布的非下采样Shearlet域图像水印算法

基于二元Weibull分布的非下采样Shearlet域图像水印算法

基于二元Weibull分布的非下采样Shearlet域图像水印算法牛盼盼;王向阳;杨思宇;文涛涛;杨红颖【摘要】不可感知性、鲁棒性、水印容量是衡量数字图像水印算法优劣的最重要指标,且三者存在固有的相互矛盾关系,可保持不可感知性、鲁棒性、水印容量之间良好平衡的图像水印方法研究是一项富有挑战性的工作.以非下采样Shearlet变换(nonsubsampled Shearlet transform,NSST)与二元Weibull分布理论为基础,提出了一种基于二元Weibull统计建模的非下采样Shearlet域数字图像水印算法.1)构造出基于非线性单调函数的自适应高阶水印嵌入强度函数;2)根据NSST域尺度间相关性,利用二元Weibull边缘分布对NSST域高熵块奇异值进行统计建模,并估计出二元Weibull统计模型参数;3)结合NSST域二元Weibull边缘分布模型与最大似然决策理论,构造出二元数字水印检测器并盲提取水印信息.仿真实验结果表明:该算法可以较好地获得不可感知性、鲁棒性、水印容量之间的良好平衡.【期刊名称】《计算机研究与发展》【年(卷),期】2019(056)007【总页数】16页(P1454-1469)【关键词】图像水印;二元Weibull分布;非下采样Shearlet变换;最大似然决策;相关性【作者】牛盼盼;王向阳;杨思宇;文涛涛;杨红颖【作者单位】辽宁师范大学计算机与信息技术学院辽宁大连 116029;大连理工大学电子信息与电气工程学部辽宁大连 116023;辽宁师范大学计算机与信息技术学院辽宁大连 116029;辽宁师范大学计算机与信息技术学院辽宁大连 116029;辽宁师范大学计算机与信息技术学院辽宁大连 116029;辽宁师范大学计算机与信息技术学院辽宁大连 116029【正文语种】中文【中图分类】TP309.2作为图像作品版权保护的有效手段,数字水印技术已成为国际学术界研究的热点之一.不可感知性、鲁棒性、水印容量是衡量一个图像水印算法优劣的最重要指标[1],而这3方面却又存在着固有的相互矛盾关系,三者之间的最佳平衡也成为图像水印算法所共同追求的目标.可有效保持不可感知性、鲁棒性、水印容量之间良好平衡的高性能数字图像水印算法研究是一项富有挑战性的工作[2].数字图像水印技术发展到今天,已有大量不同的图像水印算法.而依据水印嵌入方式,人们习惯将数字图像水印算法划分为3类,即加性水印、乘性水印、量化水印[3-6].相比之下,乘性嵌入方式在保证含水印图像质量在可接受水平内,能够接受更大的水印嵌入强度和水印容量,即:乘性嵌入方法在保证不可感知性的同时,能够使得水印的嵌入强度随着载体信号强度成一定比例变化,让人更不容易察觉,获得更高的鲁棒性和更大的水印容量,从而最接近于三者之间的良好平衡.一般说来,为全面提高图像水印的不可感知性、鲁棒性和水印容量,应该充分结合人眼视觉掩蔽特性与图像自身统计特性而进行数字水印信息的嵌入与检测.基于统计模型的变换域乘性水印较好地体现了上述思想,为有效解决不可感知性、鲁棒性、水印容量之间良好平衡问题提供了可能的解决方向[7].基于统计模型的变换域乘性水印工作原理为[7]:在水印嵌入环节,利用简单的乘性策略调制原始载体图像信号,以保证水印嵌入强度与载体图像信号强度成一定比例变化,让人更不容易察觉,从而最大程度地平衡鲁棒性和不可感知性;在水印检测环节,结合能够充分体现图像自身特性的多尺度变换特性(多分辨率性、能量聚集性等),有效利用变换系数的统计特性而构造数字水印检测器,以检测和提取数字水印信息.其中,基于统计模型的水印检测器构造是整个变换域乘性图像水印方案的核心.截止到目前,人们主要采用2类统计模型设计变换域乘性图像水印方案,分别为多尺度联合统计模型[8](multiscale joint statistical model)和多尺度边缘分布模型[9](multiscale marginal distribution model).多尺度联合统计模型也称多尺度统计相关模型,其着重考察多尺度变换系数之间的相互关系,利用基于多尺度变换的各种数据结构,如隐Markov模型(hidden Markov models, HMM)描述并确定多尺度变换系数的隐含状态(隐含未知参数),进而通过隐含状态联系建立多尺度变换系数关联,并进一步利用隐含未知参数来分析处理图像(如图像水印检测器构造).Wang等人[10]提出了基于小波域先验HMM 模型参数的数字图像水印算法.该算法首先对原始载体图像进行3级小波分解并利用高频子带构造系数向量树,然后结合小波Watson视觉失真测度与先验HMM模型参数自适应确定水印嵌入强度,进而将水印信息嵌入到小波系数向量树中.在水印检测阶段,该算法结合泰勒级数近似局部最优检验理论,利用先验HMM模型参数构造了数字水印检测器.Amini等人[11]结合小波域向量HMM联合统计建模理论,提出了一种局部最优盲图像水印检测算法.该算法选取具有最大系数方差的高频子带作为水印嵌入区,并采用线性乘性方法嵌入水印信息.在水印提取阶段,算法首先利用向量HMM对小波系数进行了多尺度联合统计建模,然后结合对数似然比检验理论构造了数字图像水印检测器.总体说来,现有多尺度联合统计模型普遍采用高斯混合模型(Gaussian mixture model, GMM)描述变换系数的边缘分布,并利用隐Markov树捕捉变换系数间的相关特性.然而仿真实验表明,对具有明显高尖峰重拖尾分布的变换系数而言,高斯混合模型难以精确描述其非高斯分布特性.也就是说,现有基于GMM的多尺度联合统计模型尚无法高效捕获变换系数的边缘分布与变换系数间的相关特性,而这必然严重影响图像水印的检测性能. 多尺度边缘分布模型也称多尺度随机过程模型,其是将各多尺度变换系数看作是一个随机变量,进而考察各单个多尺度变换系数的边缘分布特点,即利用各种概率密度函数(probability density function, PDF)反映单个多尺度变换系数分布,描述多尺度变换系数统计特性,并进一步利用概率密度函数参数分析处理图像(如图像水印检测器构造).Akhaee等人[12]选择将水印信息嵌入到Contourlet域高频子带内,同时利用广义高斯分布(generalized Gaussian distribution, GGD)对Contourlet域高频系数进行统计建模,并进一步结合极大似然方法估计GGD参数并构造数字水印检测器.然而,该算法估计GGD模型参数时需要原始载体信号,故不利于实际应用.Bian等人[13]利用贝塞尔K(Bessel K form, BKF)概率密度函数对图像小波系数进行边缘分布建模,并根据极大似然理论构造了局部最优水印检测器.同时,结合“渐进相对效率”和“最大渐进相对效率”等客观评价指标证明了该检测器的有效性.然而,该局部最优水印检测器的抗攻击能力较弱.Etemad等人[14]首先依据Kolmogorov-Smirnov检验理论,证明t location-scale概率密度函数可高效描述Contourlet系数的边缘分布特点,进而结合似然比检验与t location-scale分布理论,构造了最优乘性数字水印检测器.Sadreazami等人[15]利用正态逆高斯(normal inverse Gaussian, NIG)分布刻画图像Contourlet域系数统计特性,并使用局部窗口自适应估计每个子带的NIG模型参数,同时结合Bayesian最大后验概率准则构造了水印检测器.但NIG分布无封闭形式解,且参数估计较复杂.Wang等人[16]结合非下采样剪切波变换与BKF统计建模理论,首先通过乘性方法将水印信息嵌入到非下采样剪切波变换重要系数中;然后,利用BKF边缘分布对非下采样剪切波变换域系数进行建模,并结合子带内系数相关性估计出BKF模型参数;最后,结合BKF统计模型与局部最大势能检验理论构造出局部最优检测器并进行水印提取.张悦等人[17]提出了一种基于共轭对称列率复数哈达码变换(conju-gate symmetric sequency-ordered complex Hadamard transform, CS-SCHT)的数字图像水印算法.该算法首先选择CS-SCHT系数幅值作为载体并进行乘性水印嵌入,然后结合实验对CS-SCHT系数幅值分布进行分析并确定出其近似分布——韦伯(Weibull)分布,最后设计出基于Weibull分布的乘性水印局部最优检测器.Dong等人[18]提出了一种基于Weibull边缘分布的DCT域图像水印算法.该算法利用Weibull分布对DCT直流系数和交流系数进行了统计建模,并结合极大似然方法构造出了数字水印检测器.由于上述多尺度边缘分布模型图像水印仅仅结合各种概率密度函数,考察了各单个多尺度变换系数的边缘分布特点,而忽略了多尺度变换系数间的重要相关特性(如尺度间相关性),故数字水印检测性能并不理想.尽管Sadreazami等人[19-20]尝试引入了二元α-稳定分布、二元Cauchy分布等多元Cauchy统计建模理论,通过初步考虑变换系数尺度间相关性,一定程度上提升了多尺度边缘分布模型的建模能力,但数字水印的检测性能并未得到明显改善.本文以非下采样Shearlet变换(nonsubsampled Shearlet transform, NSST)与二元Weibull分布理论为基础,提出了一种基于二元Weibull统计建模的非下采样Shearlet域数字图像水印算法.由于非下采样Shearlet变换拥有鲁棒而接近最优的图像几何结构特征捕获能力,同时二元Weibull分布可精确描述NSST域图像信号的边缘分布与相关特性,故利用二元Weibull边缘分布对NSST域高熵块奇异值进行统计建模并估计出其模型参数,同时利用最大似然决策构造出二元数字水印检测器并盲提取水印信息,可获得较好的水印检测性能.1 多元Weibull分布的NSST域统计建模1.1 NSST系数统计特性分析2008年Easley等人[21]提出了接近最优(即“最稀疏”)图像表示方法——剪切波(Shearlet)变换理论,其不仅可以鲁棒捕获图像几何结构特征,更具有方向敏感、重构准确、结构简单、表示稀疏等诸多优良特性.NSST是Shearlet变换的拓展表示形式[22],其消除了采样步骤,将非下采样拉普拉斯金字塔(nonsubsampled Laplacian pyramid, NSLP)变换与一系列剪切滤波器进行结合,通过迭代操作实现.NSST继承了Shearlet变换优点,不仅有效解决了Shearlet变换所存在的“混沌”现象,使同一方向信息不会在不同方向子带中重复出现,而且为二维图像提供了最优的渐近表示,对图像重要特征具有极强的捕获能力.图1给出了标准灰度图像Barbara的2级NSST示意图.这里,尺度2和尺度1均采用了4个分解方向. Fig. 1 The NSST on Barbara image图1 标准灰度图像Barbara的非下采样Shearlet变换结构示意图Fig. 2 Histogram of NSST subbands (Barbara)图2 标准图像Barbara的部分NSST域高频子带系数分布直方图为全面客观了解NSST系数统计特性,图2给出了标准灰度图像Barbara的部分NSST域高频子带系数分布直方图.从图2中可以看出,绝大多数NSST高频子带系数接近于0,只有少量NSST高频子带系数幅值较大,即体现了明显的高尖峰重拖尾分布特点.同时,4个NSST域高频子带的系数峰度值分别为23.754 4,22.901 7,22.931 0,12.126 7,远大于标准高斯分布的峰度值3,其表明NSST 域高频子带系数分布呈现出了明显的非高斯性.近年来,研究者普遍关注并利用了变换域系数的高尖峰重拖尾非高斯性,但不同程度忽略了变换系数之间的强依赖性(多种相关性).事实上,同一子带内的系数相关性、不同方向间的系数相关性及不同尺度间的系数相关性是NSST域高频子带客观存在的3种重要相关性.这里,我们采用chi-plot工具[23]分析了NSST域高频子带的系数相关特性(包括子带内、方向间、尺度间相关性).chi-plot是Scatterplot的扩展,它能更好地并且以可视化方式评估二维变量之间的相关程度.在chi-plot中,n对点(Xi,Yi)被变换成n对(λn i,χn i)(i=1,2,…,n).χn i表示在采样点(Xi,Yi)处二维分布函数能被分解为2个边缘分布的失败情况.λn i表示(Xi,Yi)到二维中值的距离,如果X和Y相关,则λn i的值往往比较集中.chi-plot图在二维坐标中的范围是[-1,1]×[-1,1].(λn i,χn i)偏离水平线χ=0的程度反映了X和Y变量的相关程度.图3给出了NSST域高频子带的子带内、方向间、尺度间chi-plot图.Fig. 3 chi-plots to illustrate the different degrees of dependence between intraband, interorientation and interscale, NSST coefficient pairs图3 NSST 域高频子带系数的子带内、方向间、尺度间chi-plot图Fig. 4 The empirical joint child-parent histogram and the PDF of different bivariate distributions图4 父子系数联合分布直方图及不同二元分布的联合概率分布拟合图从图3可以看出,3幅chi-plot图中的大多数点比较集中且较大地偏离水平线χ=0,其说明同一子带内、不同方向间、不同尺度间的NSST域高频子带系数均存在明显的相关特性.需要指出的是,计算χn i值时会因为采样的不稳定性而产生偏差,在chi-plot图中用灰色部分予以表示.1.2 基于二元Weibull分布的NSST域统计建模为充分利用NSST域的尺度间相关性,本文利用二元Weibull分布对NSST域尺度间父子系数进行建模,二元Weibull分布的PDF具体表示参见附录A.图4(b)给出了二元Weibull的父子联合概率分布P(X1,X2)拟合图.为了能够说明二元Weibull统计模型的精确性,这里又利用二元Cauchy分布、二元BKF分布、二元标准正态分布对NSST域尺度间父子系数进行了建模,如图4(c)(d)(e)所示.图4(a)给出了NSST域尺度间父子系数联合分布直方图.不难看出,相比其他二元分布,利用二元Weibull分布进行统计建模,可以更加精确地拟合出NSST域尺度间父子系数的分布.为进一步比较4种二元统计模型的拟合精度,本文选择KL距离(Kullback-Leibler divergence)来评判各种分布模型对NSST系数建模的拟合效果,KL距离计算:(1)其中,Pi表示联合分布直方图的bin值,Qi表示在每个bin中由二元分布PDF求出的概率值.在计算中,要先将Pi和Qi进行归一化处理.以标准灰度图像Lena,Barbara,Mandrill为例,首先获得NSST域第1尺度4个方向和第2尺度4个方向的高频子带父子系数,然后利用不同二元分布对每组父子系数进行建模,并计算出每种模型的平均KL距离,表1给出了测试结果.Table 1 The KL Performance Comparisons of four Different Bivariate Distributions表1 4种二元分布模型的KL测试结果对比Test ImageDirectionBivariate GeneralGaussian DistributionBivariate CauchyDistributionBivariate BKFDistributionBivariate WeibullDistributionLena16.41894.54565.86893.766423.14312.31642.84342. 200833.98182.69573.51472.125744.05053.36423.97462.4326Barbara16.091 74.24505.61703.641323.68512.71572.99542.293934.97392.88793.97222.00 7144.10333.17753.87622.2859Mandrill16.10283.75055.05313.353024.9017 3.39053.65782.782335.65142.70384.28362.361144.39213.45654.81122.810 9Note: The black bold font provides a better performance than other commonly used distributions.从表1可以看出,相比其他3种二元分布,二元Weibull分布可以更好地对图像NSST域尺度间父子系数相关性进行建模,因此本文利用二元Weibull统计模型构造水印检测器.2 数字水印嵌入本文结合人眼视觉感知特性选取非线性嵌入强度函数,采用乘性策略将水印信息嵌入到鲁棒的NSST域高频系数块奇异值内.假设I={f(x,y),0≤x<P,0≤y<Q)}表示原始载体图像,W={w(i)∈{0,1},0≤i≤N}表示随机生成的二值水印序列.则整个图像水印的嵌入过程可描述如下:1) 原始载体的非下采样Shearlet变换首先对原始载体图像进行2级非下采样Shearlet变换,以获得1个低频子带及第1尺度4个方向、第2尺度4个方向的高频子带.选取第1尺度和第2尺度中具有最高能量的方向子带(以下简称“重要子带”)用于水印嵌入,子带能量的计算方法:(2)其中,Dk,j表示位于第k尺度、第j个方向的子带.2) 重要Shearlet系数块选取及其奇异值分解首先,将所选取出的“重要子带”划分成不重叠的Shearlet系数块(每块大小为L×L),并计算出每个Shearlet系数块的熵值.然后,根据熵值,对第1与第2尺度“重要子带”的Shearlet系数块进行各自排序处理,进而分别选取前N个高熵Shearlet系数块(以下简称“重要Shearlet系数块”)用于嵌入水印.由于高熵系数块集中了大量信息,人眼对其不敏感,故将水印信息嵌入到高熵Shearlet系数块中,可以增强水印不可感知性.最后,对所选取的N个重要Shearlet系数块分别进行奇异值分解(singular value decomposition, SVD),并选取每个重要Shearlet 系数块的第2个奇异值作为水印嵌入位置.由于奇异值的稳定性较好,故通过对奇异值的微小改变来嵌入水印信息,可以提高数字水印的不可感知性及鲁棒性.3) 数字水印嵌入现有统计模型图像水印方案普遍采用线性单调函数刻画水印嵌入强度,并用于自适应调节载体信号[11,13-15,18-19].然而,水印嵌入强度增量与载体信号改变量间并非具有简单的线性单调关系,而是呈现出明显的非线性单调关系.为此,本文以刻画能力更强的非线性单调函数为基础,构造了自适应高阶水印嵌入强度(函数),并进一步给出了自适应图像内容的高性能乘性水印嵌入方法.设Bi(i=0,1,…,N-1)表示原始重要Shearlet系数块,表示含水印重要Shearlet系数块,式(3)给出了自适应图像内容的数字水印嵌入方法.(3)其中,xi∈Bi和分别表示原始重要Shearlet系数块奇异值和含水印重要Shearlet 系数块奇异值.f1(xi)和f0(xi)分别表示待嵌入水印位为“1”时的嵌入强度函数和待嵌入水印位为“0”时的嵌入强度函数.(4)这里,a1=100,b1=1.2,a2=150,b2=1.5.图5给出了水印位为“1”和“0”时的嵌入强度函数.Fig. 5 Two watermark strength functions for embeddingdigital watermark of “1” or “0”图5 数字水印位为“1”和“0”时的嵌入强度函数与现有统计模型水印方案普遍采用线性水印嵌入强度不同,本文采用刻画能力更强的非线性单调函数——反三角函数,构造了自适应水印嵌入强度函数.从图5可以看出,本文所选取的非线性单调函数具有使嵌入强度增量与载体信号改变量保持非线性关系的性质,即:当嵌入强度增加时,使得值大的重要Shearlet系数块奇异值发生大的改变,而值小的重要Shearlet系数块奇异值发生小的改变,反之亦然. 重复步骤3),直到所有重要Shearlet系数块处理完毕为止.最后,对每个含水印奇异值进行逆奇异值分解即可得到含水印重要Shearlet系数块,进一步对含水印Shearlet域重要子带与其他子带一起进行逆非下采样Shearlet变换,即可得到含水印图像.3 数字水印检测3.1 二元水印检测器构造假设水印检测器端接收到的含水印重要Shearlet系数块奇异值yi受到零均值的高斯白噪声(5)其中,f表示2种水印嵌入强度函数.由于重要Shearlet系数块奇异值与噪声项是相互独立的,因此可获得含噪声重要Shearlet系数块奇异值的概率密度函数公式:(6)为简化式(6),本文利用three-sigma准则估计高斯分布的概率密度函数fn(τ):(7)由式(7)可见,存在2个非0的闭合区间:[-3σn,0]和[0,3σn],因此式(6)可表示成式(7)的形式:(8)根据Simpson’s rule,将式(7)带入式(8)中,化简后可以得到:(9)其中,fBWD表示二元Weibull分布概率密度函数[24].本文中,假设二值水印序列与重要Shearlet系数块奇异值均为服从独立同分布的随机变量,于是有重要Shearlet系数块奇异值所组成的y11,y12,…,y1N(来自第1尺度重要子带)和y21,y22,…,y2N(来自第2尺度重要子带),在嵌入水印位为“1”和嵌入水印位为“0”两种假设下的检测概率.(10)(11)其中,yi=[y1i,y2i],i=1,2,…,N,fBWD(yi|1)和fBWD(yi|0)分别是在使用嵌入强度函数的情况下被计算出来的:(12)(13)其中,g1(·)和g0(·)分别代表嵌入强度函数f1(xi)和f0(xi)的反函数,ρ表示y1i和y2i之间的相关系数(i=1,2,…,N),C1和k1表示y1i的形状参数和尺度参数;C2和k2表示y2i的形状参数和尺度参数.这里我们采用最大似然方法对4个参数C1,k1,C2,k2进行估计,并进一步可通过最大似然决策规则获得最优水印检测器.(14)代入式(10)和式(11),经过代数操作后,Zi(y)可以表示为(15)于是,可以从第i个重要Shearlet系数块中提取出水印信息位(16)其中,和fBWD(yi|0)由式(12)(13)求得.3.2 数字水印提取首先对含水印图像进行2级非下采样Shearlet变换,并按照第2节步骤1)和步骤2)方法确定出“重要Shearlet系数块”,同时对其进行奇异值分解.然后,利用3.1节所构造的数字水印检测器,从每个重要Shearlet系数块奇异值所组成的系数对yi=[y1i,y2i]中提取出水印信息位.3.3 误码概率分析误码概率(bit error probability, BEP)用于分析提出的水印检测器的工作性能.在无攻击检测条件下BEP的计算:P(Zi(y) < T|H1)].(17)在无噪检测条件下,含水印重要Shearlet系数块奇异值都嵌入“0”的H0假设下的检测概率Zi(y):Zi(y|H0)=(18)其中,由于Zi(y|H0)是大量的独立随机变量之和,因此,Zi(y|H0)近似地服从正态分布,且在2种假设下,具有有限的数学期望和方差:(μ0,σ0)和(μ1,σ1).具体地,在H0假设下,其期望μ0的计算:(19)其中,(20)在H0假设下,其期望的计算:(21)由于Zi(y|H0)=-Zi(y|H1),可以得到μ1=-μ0和故可求得检测1位水印信息位的误码概率(22)其中,因此,如果嵌入到原始载体图像的二进制序列“0”或“1”具有相同的概率,总的BEP计算:(23)应用式(23),即可对所提出的数字水印检测器进行性能评估.4 实验结果为验证本文图像水印算法的高效性,分别给出了本文算法的数字水印检测性能、不可感知性和鲁棒性的测试结果,并与文献[12,15-16,19]算法进行了对比.文献[12,15-16,19]均为基于统计模型的变换域乘性水印算法,且与本文算法密切相关.其中,文献[15,19]采用了线性单调函数刻画水印嵌入强度,文献[12,16]采用了非线性单调函数(指数函数)刻画水印嵌入强度;此外,文献[12,15-16]利用了单元概率密度函数建立多尺度边缘分布模型,文献[19]则是利用了多元概率密度函数建立多尺度边缘分布模型.实验中,原始载体图像选用了512×512×8 b的标准灰度图像Lena,Mandrill,Barbara,Peppers,数字水印则采用了128 b,256 b,512 b,1 024 b的伪随机序列.此外,我们利用峰值信噪比(peak signal to noise ratio, PSNR)和失真率(bit error ratio, BER)评价了图像水印算法的不可感知性和鲁棒性.同时,非下采样Shearlet变换的分解级数K=2,第1尺度和第2尺度均采用了4个分解方向,Shearlet系数块大小为8×8.4.1 水印检测器的性能测试本文结合非下采样Shearlet域二元Weibull边缘分布模型与最大似然决策理论,构造了二元数字水印检测器并盲提取了数字水印信息.本部分以标准灰度图像Barbara为例,对所构造的数字水印检测器的工作性能予以测试.图6分别给出了在嵌入水印位为“1”和“0”2种情况下数字水印检测器的检测响应.其中,横坐标为接收端含水印图像信号序列,纵坐标表示水印检测器的响应值,虚线表示检测器关于含水印图像信号的检测响应值,实线表示关于含水印图像信号的检测阈值. 通过图6可以看出,本文所提出的二元数字图像水印检测器能够准确地提取出数字水印信息(包括各种攻击下),即当嵌入水印位为“1”时,有SML>ST;当嵌入水印位为“0”时,有ST>SML.这里,S表示曲线(直线)与x轴和y轴围成的面积.根据数字水印检测原理,当嵌入水印位为“1”时,检测器(ML detector, ML)的曲线面积SML越大于检测阈值(threshold, T)的曲线面积ST,则说明检测响应效果越好,即检测器工作能力越强.同理,当嵌入水印位为“0”时,检测器的曲线面积越小于检测阈值的曲线面积,则说明检测响应效果越好,即检测器工作能力越强.表2给出了不同水印容量(包括128 b,256 b,512 b,1 024 b)情况下,整个图像水印系统的PSNR、BER、水印嵌入时间以及水印提取时间等工作性能.Fig. 6 The test results of ML watermark detector under various attacks图6 数字水印检测器的检测响应Table 2 The Average Watermarking Performance Under Different Watermarking Capacity表2 不同水印容量下的图像水印系统工作性能ImagesWatermark Length∕bPSNR∕dBBEREmbedding Time∕sExtracting Time∕sLena12851.169902.36841.741325651.146302.37281.841751250.8985 02.38311.8478102440.80280.00882.46651.8495Barbara12845.457202.8152 2.203725645.462902.85932.215451245.037602.93252.3137102444.61200.0 0392.95602.3883Mandrill12842.589302.47151.761225642.669402.49361.78 8251241.535502.53621.8146102440.49800.00492.57861.9394 Continued (Table 2)ImagesWatermark Length∕bPSNR∕dBBEREmbedding Time∕sExtractingTime∕sPeppers12851.134702.64142.058725651.246202.67142.085051246.0 33102.69832.1476102440.98620.00482.78062.28944.2 不可感知性测试理论分析与实验结果均表明:水印嵌入强度对算法工作性能有一定影响,为了取得不可感知性和鲁棒性的良好平衡,水印嵌入强度应自适应于载体信号内容,即水印嵌入强度应该随着载体信号强度(值)的增大而增大.现有算法普遍采用线性单调函数刻画水印嵌入强度,并用于自适应调节载体信号(即嵌入水印信息)[15,19].然而,水印嵌入强度增量与载体信号改变量间并非具有简单的线性单调关系,而是呈现出明显的非线性单调关系,为此本文算法采用刻画能力更强的非线性单调函数——反三角函数,构造了自适应水印嵌入强度函数.与指数函数相比[12,16],反三角函。

Chap 3_CTFT_DTFT

Chap 3_CTFT_DTFT
例: x n n n 当 1 时绝对可和,存在DTFT;当 序列的DTFT不存在
1 时,
绝对可和序列与有限能量序列
2
2
xn
xn
n
n
绝对可和序列必定是能量有限的
能量有限序列不一定是绝对可和的
例: x n
1/n n 1 ,
2
1
1
,
0 n 1 n1 n
6 n 1n
辽宁师范大学计算机与信息技术学院 宋传鸣
1 2
X
* a
j
xa t e j tdt d
1 2
X
* a
j
Xa j
d
1 2
2
Xa j d
xa t 2 dt
1 2
Xa j 2d
帕斯瓦尔关系 (Parseval’s Relation)
辽宁师范大学计算机与信息技术学院 宋传鸣
Page 5
《数字图像处理的信号基础》
连续时间傅里叶变换(CTFT)
能量密度谱
辽宁师范大学计算机与信息技术学院 宋传鸣
Page 20
《数字图像处理的信号基础》
离散时间系统的频域表示
特征函数
例:理想延迟系统 y n x n nd 的频率响应
由于该系统的单位脉冲响应为 h n n nd ,则频率响
应为 H e j
hke jk
k
k
n nd e j k e j nd
离散时间线性时不变系统的频率响应总是频率的周期函数,
Page 25
《数字图像处理的信号基础》
滤波的概念
例:一个简单数字滤波器的设计
输入信号为角频率分别为0.1弧度/样本和0.4弧度/样本的两 个正弦序列的和.要求设计一个高通滤波器拦截低频分量

运用交互式电子白板提高学生课堂参与度

运用交互式电子白板提高学生课堂参与度
尤其重要。 但在 目前的课 堂教学 中, 更 加重视教 师的直 接指导 , 注重学习者 知
抑 制, 阻碍 了学生 的能 动性 与参与性 ,
不利于自 主学习能力的培养。
( 3 ) 资源无法获 取
自 信心是影响学生学习 效果的一个
重 要因素。 由于自 停 不足以及缺乏基本
在 传 统教 学 方 式下, 教学 媒 体只
在实际教 学过程中, 大多数的学 生
质疑、 调查、 探究, 在实践中学习, 促进 学生在教师指导下主动地、 富有个 l 生 地
学习。 高学生课堂参与度对于培养
看上去在认真听讲, 但他们对教学 内 容 很少提 出质疑 , 只是 一味地 盲 从, 不 愿
传统课 堂的教 学方式 主要是以教
提 出了 相应 的对 策。
关键词: 课 堂参与度 ; 交互式电子白板; 对策
学 生课 堂参 与度 存在 的问题
与原因
不太积极, 注意力集中程度不高, 主体 陛
境 性 活 动, 没 有一 种 活动 不是 情境 性 的” [ 3 】 。 传 统教 学 缺乏 多媒体 创设 的教 学 情境 , 不利于学 生的理解 , 无法 激发 学 生的学习动机 , 不 能使 学生积极主动
兴趣 。 兴趣是学生课堂参与的内驱 力且
效的呈现 、 传递、 处理信 息的教学模 式, 符合 人的思维规律和思维习惯, 能够提
高 学生 的课 堂参 与度 , 最 终提 高教 学
不 是天生的, 它是 在后天的活动中得到
息, 以帮助学 生完成系统的知识建构。
t o u g a o l @ c h i n a i  ̄ d u . c n 技 术与应用
运用交互式电子白板

“一体化+三协同+四融合”教学模式构建与实践_1

“一体化+三协同+四融合”教学模式构建与实践_1

合,提升学生的学习兴趣和参赛积极性。当前, 大学生对各类大赛是“爱恨交织”,“爱”源于竞 赛的成就感、趣味性、体验感;“恨”源于对竞赛 内容不熟悉产生的排斥心理。教师要立足学生实 际,尊重学生需求,力争教到学生心中去。“磨 学”磨的是学情,是教师不断贴近学生需求、了 解学生的过程 [4]。每节课必是师生完美合作的作 品,教学精彩永远是学生 [5]。教学赛一体化驱动 下的磨学过程如图 2 所示。
学生科学精神与人文精神相融合,不仅要培养学 中不仅关注学生成长、教学策略,更关注教与学
生的科学思维方式,更要锤炼学生高尚的品德情 的效益、评价的量化及教学反思。
方法引领
内容引领


以学为本

以学生为中心 以自主为要求 以自立为目标
通用能力与专业能力协同
以能力为本
个性发展与全面发展协同
素质与能力协同
图 3 新时代背景下提出的“三协同”教学模式
1.3 “四融合”教学模式构建 教学不是简单的“合而为一”,其真正意义
第9期
教育与教学研究
163
在于激发新知,“以我观物,悟其精髓,得己之 见”,智慧的火花碰撞出“1+1>2”的效果 [7]。现
摘 要:针对传统教学模式无法满足企业高能力创新型人才需求的问题,提出“一体化 + 三协同 + 四 融合”的创新型教学模式,以计算机网络中的“子网划分”为例,从课程理念、教学手段、教学过程、 课程设计、课程评价 5 个方面介绍实践应用,最后说明教学效果与意义。 关键词:一体化;三协同;四融合;教学模式

1 新型教学模式构建

1.1 “一体化”教学模式构建

“ 一 体 化 ”是 指“ 教 学 赛 一 体 化 ”, 教

研究生国家奖学金评选细则

研究生国家奖学金评选细则

研究生国家奖学金评选细则根据《辽宁师范大学研究生国家奖学金管理暂行办法》精神,结合我院实际情况,特制定计算机与信息技术学院研究生国家奖学金评选细则如下。

一、申请基本条件申报研究生国家奖学金,必须同时具备以下基本条件:(1)热爱社会主义祖国,拥护中国共产党的领导;(2)遵守宪法和法律,遵守学校规章制度;(3)诚实守信,道德品质优良,心理素质健康;(4)学风端正,学习刻苦,学位课成绩优秀;(5)科研成果显著,发展潜力突出;(6)辅导员和导师对其操行评定为优秀;(7)学位课平均成绩80分以上,且单科不低于60分;(8)外语水平已达到我校上一年学位授予时对外国语成绩的要求(有B类以上论文者免此条件);(9)曾获得研究生奖学金(包括国家奖学金、学业奖学金),再次申报,除学习成绩外,已使用过的科研材料,不得重复使用。

二、评选依据(评分细则)根据学校分配的名额,按照如下“综合成绩”进行等额初选,并通过“票决”结果上报(即如果按照综合成绩确定的等额初选者未通过表决,则名额作废)。

学术型研究生:综合成绩="科研成绩"(45%)+"学习成绩"(35%)"+"政治思想表现成绩"(20%) 专业型研究生:综合成绩="科研成绩"(5%)+"学习成绩"(50%)+"专业实践成绩"(25%)+"政治思想表现成绩"(20%) 其中1、科研成绩科研成绩由论文、项目、著作、专利、科研奖励五部分成绩组成,五项之总和即为科研成绩。

说明:(1)成果分值标准见附表;(2)个人贡献:以上成果中第一作者按100%计分,第二作者按50%计分,第三作者按25%计分,第四作者按10%计分,第五及以后作者不计积分;(3)学术论文已公开发表(含网上发表)且辽宁师范大学为第一署名单位;(4)如导师是第一作者的,该成果第二作者可以视同第一作者计分;(5)EI收录论文等同于C类论文;(6)C类以上中文论文应为CSSCI期刊或核心期刊或SCD期刊论文。

学者风采 李玉斌

学者风采 李玉斌

主要研究方向为智慧教育、在线学习、面向信息化的教师专业发展等。

在教学方面,为技术学专业本科生讲授“信息技术教育应用”“计算机网络基础”等课程,为研究生讲授“信息技术与教育”等课程。

曾获得全国教育硕士专业学位教学成果一等奖、辽宁省教学改革成果二等奖、霍英东教育基金会优秀青年教师奖以及全国第三届教育硕士专业学位优秀教师、辽宁省优秀青年骨干教师、辽宁省普通高等学校本科大学生计算机设计竞赛优秀指导教师、辽宁师范大学优秀教师等奖励或荣誉。

近年来,聚焦深度学习、在线学习行为、网络学习空间的研究。

主持或完成包括国家社会科学基金教育学一般课题“网络学习空间的内涵及其应用模式研究”、全国教育科学规划教育部重点课题“大学生网络学习行为的分析模型与调控机制研究”、全国教育科学“十五”国家级重点课题分课题“高师院校‘现代教育技术’公共课双向信息化教学模式实践研究”、教育部人文社会科学研究一般项目“大学生网络学习行为调查研究”、教育部-中国移动科研基金(2015)研发项目子课题“网络学习空间改变学生学习方式的应用模式与实证研究”等课题9项,发表包括《面向混合学习环境的大学生深度学习量表编制》《整合网络学习空间和学习支架的翻转课堂研究——面向深度学习的设计与实践》《网络学习空间升级与学习方式转变》《教师网络学习空间评价体系构建研究》《网络学习行为调控的机制及其建议》《网络学习行为模型的建构与实证》等学术论文90多篇,在高等教育出版社、科学出版社等出版著作3部,获得辽宁省自然科学学术成果一等奖、辽宁省政府哲学社会科学三等奖等10余项学术性奖项。

担任或曾任中国教育技术协会信息技术教育专业委员会常务理事、辽宁省教育学类本科专业教学指导委员会委员、辽宁省高校教师培训专家库专家、辽宁省信息技术教师教研联盟专家、辽宁省教育教学信息化大赛评审专家、大连市人工智能与计算机辅助教育学会副理事长等职务。

(孙震华供稿)。

chapter_1


辽 师
机与 学计 机与
术学
传鸣
《计 机图 学》 机图
图形用户接口 内容提要
图形学科地位 图形学的应用 辅助设计 可视化 GIS系统 GIS系统 教学培训 计算机艺术 用户接口 虚拟现实 图形学的发展
以WIMP(Window、Icon、Menu、Pointing De 、 、 、 vice)为特征的图形用户界面 为特征的图形用户界面 图形用户接口的主要部分是一个允许用户显示 多个窗口区域的窗口管理程序。 多个窗口区域的窗口管理程序。每一窗口可以 获得包括图形和非图形显示在内的不同处理, 获得包括图形和非图形显示在内的不同处理, 如视窗操作系统及各种可视化图形界面的系统
图形学科地位 图形学的应用 辅助设计 可视化 GIS系统 GIS系统 教学培训 计算机艺术 计算机动画 多媒体系统 用户接口 虚拟现实 图形学的发展
地理信息系统(Geographic information systemGeog 地理信息系统 raphic system)是用于地理相关信息的搜集、存储、 是用于地理相关信息的搜集、 是用于地理相关信息的搜集 存储、 管理和分析,如地理图、地形图、森林分布图、 管理和分析,如地理图、地形图、森林分布图、人 口分布图、矿藏分布图、气象图、水资源分布图。 口分布图、矿藏分布图、气象图、水资源分布图。
辽 师
机与 学计 机与
术学
传鸣
《计 机图 学》 机图
科学计算可视化 内容提要
图形学科地位 图形学的应用 辅助设计 可视化 GIS系统 GIS系统 教学培训 计算机艺术 计算机动画 多媒体系统 用户接口 虚拟现实 图形学的发展
数学函数的图形 分形图形、 分形图形、拓扑结构 CT数据的可视化 数据的可视化 气象卫星数据的天气变化趋势图 彩色编码、等值线、 彩色编码、等值线、图表 曲面绘制、 曲面绘制、体视化

辽宁师范大学计算机学院2014年硕士研究生招生简章

计算机与信息技术学院2014年硕士研究生招生简章
学院、专业代码、专业名称
人数ห้องสมุดไป่ตู้
考试科目
备注
151计算机与信息技术学院
Tel:8599200585992415
040102课程与教学论(计算机)
2
①101思想政治理论
②201英语一
③311教育学专业基础综合
078401教育技术学
8
①101思想政治理论
②201英语一
②201英语一
③302数学(二)
④836C语言程序设计
授工学硕士学位
一级硕士点
说明:科目④为学校自行命题
045114现代教育技术
10
①101思想政治理论
②204英语二或202俄语或203日语
③333教育综合
④836C语言程序设计
教育硕士专业学位
两年制
说明:科目④为学校自行命题
085211计算机技术
5
一级硕士点
说明:科目③、④均为学校自行命题
《高等数学》仅考核微积分部分
③601高等数学或727教学设计
④836C语言程序设计
说明:科目③、④均为学校自行命题
《高等数学》仅考核微积分部分
081200计算机科学与技术
11
①101思想政治理论
②201英语一
③301数学(一)
④866C语言与数据结构
授工学硕士学位
一级硕士点
说明:科目④为学校自行命题
083500软件工程
5
①101思想政治理论
①101思想政治理论
②204英语二
③302数学二
④836 C语言程序设计
工程硕士专业学位
两年制

综合性实验报告

辽宁师范大学计算机与信息技术学院综合性实验报告课程名称:汇编语言实验题目: debug的用法学生姓名:左丰亮专业:计算机科学与技术学号:20101118050111实验日期: 2012.3.14实验成绩:一、实验目的练习常用的DOS命令,熟练掌握DEGUG的主要命令的用法,为下一步编程打下基础。

通过实验观察和分析在不同的寻址方式下存储单元逻辑地址的表示以及指令的执行结果。

熟练掌握DEGUG的R命令、A命令、T命令和D 命令的用法。

二、实验内容1.DOS命令用法1)用两种方法在Windows中进入DOS环境。

2)用DIR命令查看根目录下的文件。

3)用CD命令进入Program Files子目录,并查看子目录中的文件。

2.DEBUG命令用法1)进入DEBUG,用D命令查看数据段中0100H—0200H单元的内容。

2)用U命令查看代码段中0100H开始的程序。

3)用R命令查看并修改IP寄存器的值为0.4)用E命令修改数据段5号,6号单元的内容为12、34。

3.两个操作数相减运算,结果放在数据段的16号单元1)AX,BX寄存器分别赋值为0008H和0010H。

2)AX,BX的内容相减(SUB指令),结果在AX中。

3)用直接寻址方式将相间的结果保存到16号单元。

三、实验过程(含结果抓图)用CD命令进入Program Files子目录,并查看子目录中的文件。

进入DEBUG,用D命令查看数据段中0100H—0200H单元的内容。

用U命令查看代码段中0100H开始的程序。

用R命令查看并修改IP寄存器的值为0.用E命令修改数据段5号,6号单元的内容为12、34。

两个操作数相减运算,结果放在数据段的16号单元四、实验结果分析(运行过程中出现的问题、如何解决的;实验过程中的经验及教训)1.记不住关键的程序命令,每次再想执行的之后得看书之后输入。

2.各种的寻址的方式记不住,太多,很容易记错,用错。

3.在进行减法运算时,保存的位置出错过。

屏幕内容编码方法研究进展

屏幕内容编码方法研究进展刘丹;陈规胜;宋传鸣;何兴;王相海【摘要】随着云计算、虚拟桌面等的普遍推广,屏幕内容图像已成为新一代云——移动计算模型——不可或缺的一部分.研究压缩效率高、实时性好、复杂性适中的屏幕内容编码方法是目前视频编码领域的热点问题之一.从空间域、频率域、时间域和颜色空间4方面分析了屏幕内容图像的数据统计特性,进而重点阐述不连续色调图像的典型编码方法,将现有方法分为基于调色板-索引图的编码算法、基于模板匹配的编码算法、基于块匹配的编码算法、基于字典的编码算法、基于形状表示的编码算法以及时间域编码方法、色度编码方法,并进一步总结基于混合框架的屏幕内容编码方法,对各类算法的优势和存在的不足进行比较、分析和讨论.在此基础上,介绍了HEVC-SCC编码国际标准制定工作的进展,并对屏幕内容编码的未来发展趋势进行了展望.%With the widespread promotion of the applications such as cloud computing, virtual desktop, and so on, screen content image has become an integral part of the new generation of cloud-mobile computing model.It is one of the hot issues of video coding field to investigate the screen content coding methods with high compression efficiency, good real-time performance, and moderate computational complexity.On introducing the statistical characteristics of screen content image presented in the spatial domain, the frequency domain, the temporal domain, as well as the color space respectively, this study focuses on typical coding methods of the discontinuous tone images.The state-of-art methods are classified into seven categories, namely the palette-index map based methods, the template matching based methods, the blockmatching based methods, the dictionary-based methods, the shape representation based methods, the temporal-domain coding methods, as well as the chroma component coding methods.Then the screen content coding methods using a hybrid framework is furthersummarized.Meanwhile, the advantages vs.disadvantages of various methods are also compared, analyzed and discussed.Based on the above, the progress of drafting the international HEVC-SCC coding standard is introduced, and the development trend of the screen content coding is forecast in the near future.【期刊名称】《计算机研究与发展》【年(卷),期】2017(054)009【总页数】18页(P2059-2076)【关键词】视频编码;图像编码;屏幕内容;屏幕图像;复合图像;综述【作者】刘丹;陈规胜;宋传鸣;何兴;王相海【作者单位】辽宁师范大学计算机与信息技术学院辽宁大连 116029;大连理工大学电子信息与电气工程学部辽宁大连 116024;辽宁师范大学计算机与信息技术学院辽宁大连 116029;吉林大学计算机科学与技术学院长春 130012;辽宁师范大学计算机与信息技术学院辽宁大连 116029;大连理工大学电子信息与电气工程学部辽宁大连 116024;辽宁师范大学计算机与信息技术学院辽宁大连 116029;辽宁师范大学计算机与信息技术学院辽宁大连 116029【正文语种】中文【中图分类】TN911.73;TP37(******************.cn)随着计算机和网络技术的发展,数字化的文本、图像、图形和视频等替代了传统的模拟媒体,这使得媒体的编辑和传播变得愈加便捷,又促使媒体由单一形式向复合形式演变,如网页、PDF(portable document format)文档、扫描的电子文档、幻灯片和海报等图像中均包含了多种形式的媒体,研究者们将此类图像称为“复合图像”(compound image)[1].而近5年,视频会议、在线教学、远程医疗和远程桌面等逐年普及,尤其是云计算取得了迅猛发展,又出现了虚拟桌面、桌面云、WiFi显示、无线HDMI(high definition multimedia interface)等应用[2],这些应用均要求把本地计算机屏幕显示的内容传输到远程终端上并显示,以实现屏幕共享.由于屏幕内容一般由各种应用软件生成,如办公软件、3D游戏、电影动画、地理信息系统、网络浏览器等,图像往往由文本、图形和自然图像等若干不同类型的区域混合而成.这类复合图像又被称为“屏幕内容图像”,它已成为新一代云——移动计算模型——中不可或缺的一部分.一方面,屏幕视频的数据量庞大(1 s的1 920×1 080分辨率@50 Hz的屏幕视频数据量高达297 MB),且屏幕共享的交互性对编码、传输的实时性提出了较高要求,许多应用中甚至在10 Gbs的网络带宽下都不能满足高清屏幕视频的传输需求[3].另一方面,典型的JPEG(joint picture experts group),JPEG 2000,JPEG-LS对屏幕内容中的自然图像部分有很高的压缩效率,却对诸如线条、文字、图形边界等非连续色调内容显得无能为力;而一些对非连续色调内容编码效率较高的算法,如DjVu,MRC(mixed raster content),又对自然图像内容的压缩能力有限,且计算复杂度高.在这样的情况下,研究压缩效率高、实时性好、复杂性适中的面向复合图像,尤其是屏幕图像的编码方法则显得尤其重要,也为实际应用所亟需.最初,研究人员通过改变参数的方式来利用JPEG,JPEG 2000等标准算法压缩复合图像.例如,文献[4-5]通过自适应调整量化步长提出了JPEG的一种扩展框架.为了保持清晰的文本图形边界,该方法采用较小的步长量化文本图形区域.文献[6]在JPEG的基础上,根据图像内容自适应地调整编码器的率失真,从而为文本图形区域分配更多的位.文献[7]则采用了H.264AVC的帧内编码模式,并通过改变不同宏块的量化参数来分别满足文本块和图像块的压缩要求.尽管上述算法的参数可根据内容的不同进行自适应地调整或者交互设定,其编码效率往往不能令人满意[8].于是,研究人员一方面逐步总结出复合图像,特别是屏幕内容图像,相对于自然图像的特殊性;另一方面,他们也发现屏幕图像和其他类型的复合图像相比,同样存在一定不同之处,例如:由于尘埃污染和扫描仪本身的缘故,扫描复合图像存在大量固有的噪声,而屏幕内容图像则不受噪声影响;多幅连续的屏幕内容图像之间存在沿着时间维的强相关性,可以像视频序列那样采用帧间预测编码;而且,屏幕内容图像编码和扫描复合图像编码在应用上也有不同,前者需保证屏幕共享的交互性和实时性,编码算法需兼顾压缩效率和计算复杂度,而后者则主要应用于替代纸质文件实现文档数字化,其压缩效率需要率先考虑,算法复杂度则相对次要.为此,为了应对诸多应用愈加迫切的屏幕内容图像视频的编码需求,国际视频编码联合协作组(Joint Collaborative Team on Video Coding, JCT-VC)近2年来成立了专门工作组负责制定高效率视频编码(high efficiency video coding, HEVC)的扩展标准——屏幕内容编码(HEVC-screen content coding extension, HEVC-SCC),并在世界范围内征集方案[9-10],成为视频图像编码领域的研究热点之一,并形成了一系列适合于屏幕内容编码的技术标准.本文也将注意力集中于此.本文从屏幕内容图像的数据统计特性出发,重点阐述屏幕内容图像视频的编码进展.将现有方法分为7类,即基于调色板-索引图的编码算法、基于模板匹配的编码算法、基于块匹配的编码算法、基于字典的编码算法、基于形状表示的编码算法、时间域编码方法,以及色度分量编码方法,并总结了屏幕内容编码的混合框架,对各类算法的优势和不足进行比较和分析.最后,对屏幕内容编码方法的未来发展进行了展望.对于JPEG,JPEG 2000和H.264AVC,HEVC等面向自然图像、视频的预测+变换结构的编码器,其有效性建立在自然图像和视频数据的2个统计特性上:1)空间、时间局部相关性;2)能量集中特性,即经过适当的数学变换(如离散余弦变换、小波变换等)之后,图像的绝大部分能量集中在低频分量,保存少数低频系数就可以非常近似地重构原始图像,从而取得很高的压缩率和主客观质量.可见,对待编码数据统计特性的充分认识和利用对于编码算法的设计及其性能提升具有重要意义.在本节重点讨论屏幕内容的统计特性.1.1 空间域的统计特性屏幕内容往往由不连续色调的文本、图表、图形、图标等图像和连续色调的自然图像、视频片段等不同类型的区域混合而成,而其中的文本、图表、图形等元素一般由显示适配器生成,包含的纹理信息较多,但复杂纹理少,重复图案多,对比度高,线条细腻,边缘锐利,颜色种类少[11-12];而自然图像则相反,颜色种类多,复杂纹理也多,边缘一般较为平滑,二者的对比情况如图1所示.为了更好地验证这一点,文献[8]采用空间频率测度(spatial frequency measure, SFM)[13]统计了3 150个文本图形块和4 552个自然图像块的相邻像素值的变化程度:其中,xi,j表示图像块中i行j列的像素值,M和N分别表示图像块的高度和宽度(实验中均设置为16).如图2所示,文本图形内容块中相邻像素值的变化量广泛分布于10~160之间,而自然图像块的变化量则几乎全部集中在0~20之间,可见,文本图形内容块的像素值变化量明显高于自然图像,其像素值的局部相关性不同于自然图像.1.2 频率域的统计特性屏幕内容图像与自然图像在像素值分布方面的差异,导致了二者在频率域统计特性上的不同.图3给出了图1的2个图像块经过离散余弦变换(discrete cosine transform, DCT)后的交流系数绝对值分布.可见,自然图像块的能量集中于3个大幅值变换系数,而屏幕内容图像的能量分布则更加均匀,并未呈现明显的能量集中现象.文献[8]进一步在更大的数据集上采用频谱活动测度(spectral activity measure, SAM)度量了3 150个文本图形图像块和4 552个自然图像块的图像变换系数幅值分布:,其中,表示i行j列的DCT系数.SAM的值越小,变换系数的幅值分布就越均匀;否则,该分布就越不均匀,能量越集中.由图4,在较大数据集上的SAM统计结果与图3的情况一致,这说明采用传统JPEG或MPEG(moving picture experts group)的“变换+量化”策略会损失图像的大部分能量,产生明显的信息失真和主客观降质.1.3 时间域的统计特性屏幕内容由应用软件和显示适配器捕获生成,且主要记录软件界面和用户操作序列,所以物体的运动特点与摄像机拍摄的自然视频也存在不同.首先,由于自然视频反映了物体在客观世界的运动,它的运动向量在理论上应是连续的;而屏幕内容的运动在本质上是离散的[14],其最小运动幅度取决于显示设备的定位精度,即运动向量为整数像素精度.其次,屏幕内容包含了窗口移动放大缩小、页面滚动、翻页、淡入淡出等运动,其运动幅度较之自然视频更大,模式也更复杂[15].文献[15]通过比较自然视频序列“Johnny”和屏幕视频“SlideShow”的相邻帧的均方差(MSE)发现,前者的帧差变化非常平缓,而后者的帧差则表现出剧烈变化,既存在长时间的零值,又有短时间的突变,如图5所示.屏幕视频的这个特点加大了帧间预测的难度,导致编码器会产生波动较大的输出码率.1.4 颜色空间采样的差异典型自然图像和视频的标准格式普遍采用4∶2∶0颜色空间采样,如YUV4∶2∶0.然而,由于屏幕内容包含大量细线条,有些甚至是1个像素宽的单色线条,如果仍旧采用4∶2∶0的颜色采样方式,就会产生人眼可见的明显失真[16].为了实现画面质量的高保真,目前屏幕内容图像和视频格式一般采用4∶4∶4的颜色采样方式,如RGB 4∶4∶4,这使得屏幕内容图像的色度冗余高于自然图像,前者的色度分量在编码过程中会消耗比后者更多的位.1.5 小结由1.1~1.4节比较可知,屏幕内容有着复杂的空间和频谱特征,变换编码已不适用于其不连续色调部分的高效率编码,这同时也解释了文献[4-7]等力图通过传统“帧内帧间预测+变换结构”的单一编码器压缩屏幕内容等复合图像的效率不够理想的根本原因.于是,研究人员开始针对屏幕内容图像,尤其是不连续色调的文本、图表、图形等图像的数据分布特性,展开了以下4方面研究:1) 根据不连续图像的纹理信息多、边缘锐利、颜色种类少等特点,研究适用于文本、图表、图形等屏幕图像视频的空间域编码方法.2) 根据不连续图像序列的运动幅度大、运动模式复杂、离散运动等特点,研究有效的、向量精度自适应的时间域编码(即帧间预测)方法.3) 根据不连续图像的色度采样特点,研究减少屏幕内容图像视频的色度信息冗余的方法.4) 根据屏幕内容是连续色调图像和不连续色调图像混合体的特点,研究适用于屏幕内容编码的总体框架.本文将分别详细阐述这4个方面的典型研究工作.对于第1个方面,为了保证文本、图表、图形等不连续色调图像的主观保真度,目前通常采用无损或近无损编码算法对其进行压缩.早期,文献[17]采用JPEG-LS算法编码文本图形图像块,但JPEG-LS是针对自然图像统计特性设计的,不完全适用;文献[18]采用PNG(portable network graphic)算法编码不连续色调部分,但计算复杂度高,压缩比有限.除了应用标准的编码算法以外,研究人员针对不连续色调图像的像素分布特性提出了5类更加有效的方法,即基于调色板-索引图的编码算法、基于模板匹配的编码算法、基于块匹配的编码算法、基于字典的编码算法和基于形状表示的编码算法.2.1 基于调色板索引图的编码算法考虑到不连续色调图像包含颜色种类少的统计特性,文献[11]提出将图像中出现次数较多的几种灰度值作为基本颜色(base color),分别为每种基本颜色指定一个索引值构成调色板,再将原图像的每个灰度值用对应的索引值替代便形成一张索引图(index map);只要将经过熵编码后的调色板和索引图传输至解码端,即可利用调色板和索引图重构出复合图像,如图6所示.由于该算法发掘了文本、图表、图形等图像的数据特点,成为不连续色调图像的重要空间域编码方法之一.该类算法包括3个主要步骤:调色板和索引图的生成环节、调色板编码环节和索引图编码环节,后续的研究工作便从这3方面分别展开.2.1.1 调色板和索引图的生成方法为了获得不连续色调图像的调色板和索引图,文献[11]提出首先采用K-均值算法将像素值聚合成若干类,并用每个聚类中心的值替代相应类中的所有像素值;然后利用树结构向量量化(tree structure vector quantization, TSVQ)方法将像素值量化成1~8种基本颜色.文献[19-22]进一步将这种调色板-索引图方法作为一种帧内编码模式增加到HEVC-SCC标准中,并且文献[12,22]提出一种新的调色板生成方法,其主要步骤是先将图像直方图进行排序,再从出现频率最高的像素值开始扫描,若当前像素值不能被调色板中的颜色以低于量化因子的误差来表示,则将当前像素值作为新的基本颜色增加到调色板.同时,文献[23]利用HEVC帧差编码将量化误差也传输至解码端,实现了屏幕内容的无损压缩.不过,由于基本颜色的数量num因图像内容而异,编码端就需要为每个图像块向解码端传送一个边信息来标识num,在一定程度上影响了编码效率.于是,文献[24]提出为每个图像选取固定数量b的基本颜色,从而减少传输num的边信息量,其主要思路是选取图像中出现次数最多的b种像素值作为基本颜色,将其余像素值映射成离其最近且距离不超过阈值Δ1的基本颜色,而将那些与最近的基本颜色距离超过Δ1的像素值映射成逃逸色(escape color).经过大量的实验统计,文献[24]认为4种基本颜色为最佳数目.该方法选取基本颜色的计算过程简单快速,但是无法避免由于基本颜色过于集中、逃逸色导致图像失真偏大的情况.因此,文献[25]提出了一种构造最优调色板和索引图的率失真模型,有效控制了屏幕内容图像的整体失真,其BD-Rate指标较文献[20]降低了4.7%,不足之处是计算复杂度有所提高.文献[8,26]也讨论了类似的率失真模型,并且给出一种率失真模型的动态规划解法,其计算量低于文献[20].此外,文献[27]提出了一种索引图的优化方法,其中心思想是:若2个索引值相邻的次数较多,则尽可能重新为它们分配2个连续的索引值.该思路较为新颖,将索引图的压缩效率提高了43%,但涉及较多的统计运算.2.1.2 调色板编码方法在建立了图像块(或编码单元)的调色板后,文献[11]采用上下文自适应的算术编码生成调色板信息的压缩码流;文献[8]通过量化将基本颜色的值域从0~255调整成{0,8,16,24,32,…,248,255},再利用多符号算术编码进行压缩;文献[24]则采用差分脉冲编码调制(differential pulse code modulator, DPCM)和霍夫曼编码对调色板进行压缩.这3种方法均利用了调色板内部的数据冗余,而考虑到不连续色调图像颜色种类少的特点,相邻的或者位于相似纹理区域的不同图像块(或编码单元)的调色板之间必然也存在一定相关性,显然上述3种方法并未发掘这种相关性.鉴于此种情况,就有研究者提出了局部调色板和全局调色板的解决思路.所谓的“局部调色板”是指,利用调色板数据的局部相关性而设计的编码方法.文献[21,28]采用左侧相邻编码单元的调色板来预测当前编码单元的调色板.文献[29]提出一种调色板合并算法,其主要思路是将当前编码单元上方和左侧相邻编码单元的调色板合并,若当前编码单元的某个基本颜色在该合并调色板C中,则把它在C中的索引值传输至解码端;否则,将该基本颜色直接传输至解码端.除了调色板合并方法以外,文献[12]建立了一个参考调色板,若当前调色板的某个基本颜色位于参考调色板中,则将该颜色在2个调色板中的索引之差传输至解码端;否则,就利用当前调色板中的前一种基本颜色预测待编码的基本颜色,只将预测误差传输至解码端.该方法利用了图像中不同块的基本颜色间的相关性和同一图像块调色板内部的颜色相关性,取得了不错的编码效率.与此类似,文献[26,30]也给出了调色板的2种编码模式:隐式模式和显示模式.前者是用已编码图像块(编码单元)的调色板作为当前图像块(编码单元)的调色板;后者则是从已编码图像块(编码单元)的调色板中提取出常用的基本颜色加入到一定容量的参考调色板,再为每种参考颜色设置一个重用标识用于表示其在当前调色板中是否重用.对于那些不在参考调色板、而出现在当前调色板中的颜色,就直接将其编码进压缩码流.同时,为了保持参考调色板有较高的预测准确率,文献[26,30]又定义了参考调色板的更新操作,实时地将当前调色板中出现的新基本颜色放入参考调色板,而将其中不常用的基本颜色删除.需要指出,该编码方案已被HEVC-SCC测试模型接纳.有研究表明[31],图像中广泛存在着非局部相关性,即一个图像块往往与同一图像中位置不相邻的某块具有相似的边缘、纹理或轮廓等,这样调色板数据也应具有非局部相关性.而所谓的“全局调色板”就是利用调色板的这种非局部相关性所设计的编码方法.文献[25]首先利用率失真方法建立整幅图像的调色板,再采用凸优化方法从中选择出预测误差最小的若干种基本颜色建立全局调色板,进而实现对每个图像块调色板的最优预测.理论上,该方法可达到优于上述所有调色板编码方法的效率,但是它需要进行2轮调色板扫描和求解优化问题的多次迭代,故此其计算量明显高于其他方法,实用性受到了一定限制.2.1.3 索引图编码方法索引图是基于调色板-索引图的编码算法中体量最大的一部分数据,其编码效率直接影响调色板编码算法的整体压缩性能,所以索引图编码是调色板编码最主要的组成部分.早期,文献[11]采用上下文自适应的算术编码压缩索引图,文献[8]采用上下文重映射和熵编码压缩索引图,二者均利用了索引图的统计冗余.但由1.1节可知,索引图中还会出现重复的图案,即所谓的局部和非局部数据相关性.于是,文献[12]采用1D串匹配的方法编码索引图,如图7(a)的索引图片段可编码成一系列二元、三元组序列(0,14)(1,1,3)(0,17)(1,1,3)…(0,1)(0,2)(0,3)(0,4)(1,4,4)[12].然而,索引图中的重复图案几乎全部是2D图案,如采用前面的1D串匹配还存在较大冗余.如图7(b),1D串匹配产生了多次重复的三元组(1,8,7),故此文献[12,32]提出了索引图的2D串匹配编码方法,将1个重复的2D图案表示成四元组“(匹配成功标志,距离,宽度,高度)”,例如图7(b)的阴影部分可表示成(0,0)(1,1,7,8).可见,充分发掘索引图的数据相关性可带来明显的编码增益.文献[19]提出了一种2重预测编码方法,即方向预测和模板预测.其中,方向预测如图8所示,首先计算与待编码索引相邻的前一位置的索引值与其水平方向、对角线方向、垂直方向和反对角线方向上各索引值的欧氏距离;再选取欧氏距离最小的索引值所在的方向作为当前位置的预测方向,把待编码索引沿着预测方向上的索引值作为其预测.对于预测失败的元素,则进一步采用模板预测,其基本思想是利用统计相关性查找待编码索引的最佳预测,如图9所示,在模板“0020”作为上文,下文“1”出现3次,而“2”出现1次,所以“1”被作为待编码索引的预测.最后,采用CABAC和2叉树编码对2个阶段预测生成的匹配表进行压缩.由于方向预测和模板预测分别利用了索引图的局部相关和非局部相关,索引值被准确预测的概率达到了92%.为此,文献[24]提出了2级层次预测编码模式来发掘索引图的全局相关性:第1级将每个与左侧相邻索引值相等的索引标识为符号“L”,将每个与上方相邻索引值相等的索引标识为符号“U”,然后将剩余索引标识为“O”,得到如图10(b)所示的预测符号图;第2级对每一行预测符号进行分组,每组包含m(m=4)个相邻的预测符号.对于每个分组,若其中的预测符号均为“L”,则将该分组标识为“X”;若其中的预测符号均为“U”,则将该分组标识为“Y”;否则将该分组标识为“Z”,结果如图10(c)所示.最后,对各标识符号进行熵编码.虽然文献[19,24]是发掘索引图局部与非局部相关的代表性方法,可是这2种方法涉及多轮扫描,计算量偏高.为此,文献[29]对文献[19]进行了简化,在水平和竖直方向中选取索引值变化量较小者作为预测方向,再采用预测方向上与待编码索引直接相邻的索引作为预测值.该方法的计算量仅相当于文献[19]的20%,但预测方向较少、未兼顾索引图的非局部相关性,预测效率有所降低,适合于实时要求较高的应用. 与上述方法不同,文献[33]发掘了索引图的行、列相关性,提出水平预测模式、垂直预测模式和逐像素预测模式3种编码模式.具体地讲,若一个图像块的某一行(列)与其相邻的前一行(列)有相同索引值或者仅有1个索引值不同,则用垂直(水平)预测模式编码该行(列)像素的索引值.如果不满足以上2种模式,则采用逐像素预测模式,即利用左侧相邻像素的索引值预测当前像素的索引值,再将预测误差写入码流.与文献[8,11,19,29]的每次只能预测1个索引值的方法相比,该方法每次可预测多个索引值,其预测效率更高,所需同步信息更少,因此这一思路经过改进后被HEVC-SCC接纳.HEVC-SCC为每个索引值定义2种预测模式:“COPY_ABOVE_MODE”和“COPY_INDEX_MODE”[31,34].前者类似文献[33]的水平预测模式,后者相当于垂直预测模式,不同的是,这2种模式采用拷贝行。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

辽宁师范大学计算机与信息技术学院 宋传鸣
Page
4
《数字图像处理的信号基础》
连续时间傅里叶变换(CTFT)
能量密度谱

一个有限能量的连续时间复信号的总能量等于
将其中的
e = xt t = )d ( x a 蝌
?
+ ?
2
? ?
* xtxtd t ) ) ( ( a a
x (t)
* a
用逆CTFT代换,则有
a
之外为0,即
b

理想带限信号是不可能产生的 . 实际中只能保证带限信号在其频率范 围之外的能量足够小 根据绝大部分能量集中的频率段分类:
低通:
ì ï 1 , ï X j W =í ) a( ï , ï î00bFra biblioteka
,
称为信号的带宽
高通:
带通:
0 0 0
p L
p
W
p
H
辽宁师范大学计算机与信息技术学院 宋传鸣
绝对可和序列必定是能量有限的
能量有限序列不一定是绝对可和的 例:
2 + ? ? ì ï 1 / n( n ³1 ) 骣 1 p 1 ï ÷ ç x n ,邋 , [ ]í ÷ ç ÷ 6 ç ï 桫 0 n < 1 n n ) ( n = 1 n = 1 ï î
Page 12
辽宁师范大学计算机与信息技术学院 宋传鸣
,求其CTFT. -a t ì ï e t³ 0 ) ( ï x t =í ,a>0 a() ï 0 ( t<0 ) ï î 由于 ,它的傅里叶变换为 + ? ? 1 -a t x td t = e d t = < ? ) ( a 蝌 -? 0 a

例1:令
X j W =蝌 e e d t= ) ( a
举例:求
骣 1 W 1 1 ÷ ç = g a r c t a n = g p = ÷ ç ÷ ç 桫 2 p a a 2 p a 2 a -?
辽宁师范大学计算机与信息技术学院 宋传鸣
Page 6
+ ?
《数字图像处理的信号基础》
连续时间傅里叶变换(CTFT)
带限连续时间信号

理想带限信号在有限频率范围
0
+ ?
-a t -j W t
? -a j ) t ( +W 0
e
d t
- ja r c t a n W / a ( ) 2 2 = 1 a +j W = e a + W ) (
辽宁师范大学计算机与信息技术学院 宋传鸣
Page
3
《数字图像处理的信号基础》
连续时间傅里叶变换(CTFT)
连续时间信号的傅里叶变换定义
辽宁师范大学计算机与信息技术学院 宋传鸣
Page
8
《数字图像处理的信号基础》
离散时间傅里叶变换(DTFT)
正变换

序列x[n]的DTFT
: X (的定义如下 e jw )
X( e

jw
)= å
n
+?
n xne [ ] - jw
例:计算指数序列
j w
n =- ?
xn =am n( a< 1 [] [] )
示例
辽宁师范大学计算机与信息技术学院 宋传鸣
Page 10
《数字图像处理的信号基础》
离散时间傅里叶变换(DTFT)
收敛条件

DTFT 是一个无限求和的级数,可能收敛也可能不收敛 只要
n= - ?
å
+?
x[n] < + ?
j w
,则有
+ ? -j w n ?

n = -? n-? x[n]的DTFT收敛的充分条件是序列绝对可和
X e) =邋 x n e [ ] (
?
x n ? [ ]+
一致收敛


k ? ?
,则级数一致收敛
j w j w l i m Xe = X e ( ) ( ) ,其DTFT的无穷级数对所有 k 对于一个绝对可和的序列
都是一致收敛的
w
辽宁师范大学计算机与信息技术学院 宋传鸣
Page
11
《数字图像处理的信号基础》

根据傅里叶变换的定义,有

-? 自相关函数与能量密度谱构成一个傅里叶变换对
-j W l S W = r l e d W ) ( () x x x ò x
+ ?

时,
互能量密度谱 l= 0
1 +? r 0= ò S W d W ) x x() x x( ? 2 p
+ ?
1? jl W rl = ftft l d t = F j W F j W e d W ) ) ) ( ( ( ()() x y 1 2 1 2 蝌 ? ? 2 p
辽宁师范大学计算机与信息技术学院 宋传鸣
Page 13
《数字图像处理的信号基础》
离散时间傅里叶变换(DTFT)
收敛条件

2 p w w c 1 1 j w c 由于 å hn = H e d w = d w = [ ] ( ) L P L P 蝌 p w c 2 p 2 p p n = ? 是能量有限的,但不是绝对可和的 h L P [n ] 2 + ?
()
()
( )
例 :设
jw
,求其逆DTFT
ì ï 0# w w c) ï1 ( e )=í n≠H 0时 ,( L P ï w ?p ) ï c< w ï î0 ( c 1 p 1 w jw jw n jw n h n = H e e d w = e d w [ ] ( ) L P L P 蝌 p w 2 p 2 p c jw n - jw n c c 骣 s i n w n ) ( 1 e e c ÷ n=0时, ÷ = ç = ç ÷ ç 2 pç j n j n ÷ p n 桫 c 1p 1w w j w h 0 = H e d w = d w = [ ] 蝌 ( ) L P L P p w c 2 p 2 p p
轾 1 ? * 在绝对可积的情况 -j W t 犏 e = xt Xj W e d W d t ) ( () x 蝌 a a ? ? 下,交换积分次序 犏 2 p 臌 ? ? 1 + 轾 * -j W t = 蝌 Xj W xte d t d W ) ) ( ( 犏 a a ? 犏 2 p-? 臌 ? 2 1+ 1 ? * =蝌 X j WW X j d W = X j W d W () () () a a a ? 2 p 2 p?
积分范围也可以是[0,2π]
基本性质

极坐标形式:
直角坐标形式:
X ( e jw )
j qw () Xe = Xe e ( ) ( ) 称为幅度谱, 称为相位谱 j w j w
,其中
qw =a r g Xe () ( jw)
{
}
q (w )
j w j w j w X e = Xe + j Xe ( ) ( ) ( ) r e i m
Page
15
《数字图像处理的信号基础》
离散时间傅里叶变换(DTFT)
JPEG中的吉布斯现象
辽宁师范大学计算机与信息技术学院 宋传鸣
Page
16
《数字图像处理的信号基础》
离散时间傅里叶变换(DTFT)
基于小波的视频编码中的吉布斯现象
辽宁师范大学计算机与信息技术学院 宋传鸣

例2:计算理想冲激函数
的 d (CTFT. t)
+ ? -?

例3:计算移位冲激函数
-j W t (抽样性质) D j W = d te d t= 1 ) ( () ò
x t =d t- t0) ( a()
+ ?
的CTFT.
-j W t -j W t 0 Xj W = d t t e d t = e ) ) ( ( a 0 ò ?
X a ( j W)
qa (W)
辽宁师范大学计算机与信息技术学院 宋传鸣
Page
2
《数字图像处理的信号基础》
连续时间傅里叶变换(CTFT)
连续时间信号的傅里叶变换定义

CTFT存在的条件(狄利克雷Dirichlet条件)
在任何一个有限的区间内 ,信号具有有限个不连续点,且极值数目有

信号绝对可积
Page
7
《数字图像处理的信号基础》
连续时间傅里叶变换(CTFT)
能量密度谱与自相关序列

1 令 r () l = f t f t l d t = ) () ( x x 蝌
+ ? -? ? 1 + j W l = ò S W e d W ) ( x x -? 2 p
? ?
2 p
j w l F w F w e d w ) ) ( (
CTFT通常也称为傅里叶谱.
xa(t)可由其CTFT通过逆变换得到,即
? 1 + j W t x t = X j W e d W ) () ( a a ò 其中, 表示连续时间的角频率变量 , 量纲为弧度 . 2 p -? W? R 由于
j q W ( ) a X j W = X j W e q W = a r g X j W ) () () ( () { } ( ) a a, a a 称为幅度谱 称为相位谱


h L P [n ]
的DTFT只在均方收敛意义下达到
j w k
s i n w n )- jw ( c n H e = e ( ) å n L P , k p = - k 的邻域存在波纹 在 n ,并与求和项无关
相关文档
最新文档