虹膜图像预处理

虹膜图像预处理
虹膜图像预处理

虹膜图像预处理

在实际获取的图像中,虹膜只占一部分区域。图像中还包括瞳孔、眼睑、睫毛及眼睛和人脸的其它部分。所以,在对虹膜纹理特征进行提取之前,要把虹膜区域从图像中分割出来。其分割准确与否直接影响到后面的特征提取及匹配精度,即如果分割不准确,则虹膜识别效果就差,很可能造成误判,使识别算法失效。针对Canny[2]算法优良的边缘检测性能及虹膜边界的特点,本文采用了该算法,与Hough变换相结合,用于定位虹膜内外边界、分割上下眼睑,采用阀值法剔除睫毛。

2.1 虹膜内外边界的定位

虹膜的内边界即内边缘与瞳孔相交接的部分,外边界即外边缘与巩膜相交接的部分,均近似为圆形,因此定位虹膜内外边界就是要确定这两个拟合圆的圆心和半径。

2.1.1 Canny算子和Hough变换的基本原理

(1)Canny边缘检测算子

边缘是图像的基本特征,保留了原始图像中相当重要的信息,而又使得总的数据减小了很多。准确提取边缘既能减少图像处理的信息量,又可重点描述物体的形态特征。传统的边缘检测算子如Roberts、Sobel、Prewitt、Kirsch和Laplacian 等算子都是局域窗口梯度算子,由于它们对噪声敏感,所以在处理实际图像中效果并不理想。1986年,Canny提出边缘检测算子应满足以下3个判断准则:信噪比准则;定位精度准则;单边缘响应准则,并由此推导出了最佳边缘检测算子--Canny算子。该算子具有定位精度高、单一边缘和检测效果好等优点。它主要分以下四步:

○1平滑图像

Canny边缘检测算子是高斯函数的一阶导数,是对信噪比与定位精度之乘积的最优化逼近算子。选择合适的高斯低通滤波器来平滑原始的虹膜图像,既可以取得更加柔和的平滑效果,又不至于破坏图像中的边沿,同时还可以消除原始图像的高频噪声。Canny算法首先用二维高斯函数的一阶导数,对图像进行平滑,设二维高斯函数为:

22

22

1

(,)exp()22x y G x y πσσ+=-

(2.1)

其梯度矢量为:

G x VG G y ??

??=?????

(2.2)

把G 的2个滤波卷积模板分解为2个一维的行列滤波器:

22

1222exp()exp()()()22G x y kx h x h y x σσ?=--=? (2.3)

22

1222exp()exp()()()22G y x ky h y h x y σσ

?=--=? (2.4)

其中,k 为常数,σ为高斯滤波器参数,它控制着平滑程度。σ小的滤波器,

虽然定位精度高,但信噪比低;σ大的情况则相反,因此要根据需要适当地选取高斯滤波器参数σ。 ○

2计算梯度的幅值和方向

传统Canny 算法采用22?邻域一阶偏导的有限差分来计算平滑后数据阵列

的梯度幅值和梯度方向。其中,x 和y 方向偏导数的2个阵列[],x P i j 和[],y P i j 分别为: [][][][][],(,1,1,11,)2x P i j I i j I i j I i j I i j =+-+++-+ (2.5) [][][][][],(,1,,11,1)2y P i j I i j I i j I i j I i j =-+++-++

(2.6)

像素的梯度幅值和梯度方向用直角坐标到极坐标的坐标转化公式来计算,用

二阶范数来计算梯度幅值和方向,分别为:

[],M i j =

(2.7) [][][](),arctan ,,y x i j P i j P i j θ=

(2.8)

3 对梯度幅值进行非极大值抑制

为了精确定位边缘,必须细化梯度幅值图像[],M i j 中的屋脊带,只保留幅值

局部变化最大的点,这一过程就是非极大值抑制。如图2-1。

在非极大值抑制过程中,Canny 算法使用33?大小、包含8个方向的邻域对

梯度幅值阵列[],M i j 的所有像素沿梯度方向进行梯度幅值的插值。在每一个点上,邻域的中心像素[],m i j 与沿梯度方向的2个梯度幅值的插值结果进行比较,

[],F i j 是像素邻域中心处沿着梯度方向的扇形区域,非极大值抑制在此区域进行。如果邻域中心点的幅值[],m i j 不比梯度方向上的2个插值结果大,则将[],m i j 对应的边缘标志位赋值为0,这一过程把[],M i j 宽屋脊带细化为一个像素宽,并且保留了屋脊的梯度幅值。非极大值抑制(Non -Maxima Suppression,NMS)过程的数学表示为:

[][][],(,,,)N i j NMS M i j i j ζ=

(2.9)

100

1

2

2

3

3

7

81234

5

6

图2-1 Canny 算子非极大值抑制

4 检测和连接边缘

双阈值算法是对经过非极大值抑制的图像[],N i j 分别使用高、低2个阈值h

S 和l S 分割得到2个阈值边缘图像[],h T i j 和[],l T i j 。由于图像[],h T i j 是由高阈值得到的,因此它应该不含有假边缘,但[],l T i j 可能在轮廓上有间断。因此双阈值算法要在[],h T i j 中把边缘连接成轮廓,当达到轮廓端点时,该算法就在由低阈值得到的边缘图像[],l T i j 的8邻域位置寻找可以连接到轮廓上的边缘,这样,利用递归跟踪的方法不断地在[],l T i j 中搜集边缘,直到将[],h T i j 中所有的间隙都连接起来为止。

(2)Hough 圆检测

Hough 变换是一种用于区域形状描述的方法,经典的Hough 变换常常被用于

直线段、圆和椭圆的检测,广义的Hough 变换可以推广至任意形状。两种变换的基本思想是将图像的空间域变换到参数空间,用大多数边界点满足的某种参数形式来描述图像中的曲线区域边界。

Hough 变换可以用于检测图像解析曲线,其中x 为解析曲线上的点,

a 为参数空间上的点。对于圆,设其半径为r 、圆心为,则圆方程:

222()()i i x a y b r -+-=

(2.10)

图像空间的圆对应着参数空间(,,)a b r 中的一个点,一个给定点(,)i i x y 约束了

通过该点的一簇圆参数(,,)a b r 。传统的Hough 圆检测是将空间域的每个轮廓点带入参数方程,其计算结果对参数空间(,,)a b r 中的量化点进行投票,若投票超过某一门限,则认为有足够多的图像点位于该参数点所决定的圆上。由于其需要逐点投票、记录,故花费的时间较长,占用的计算机存储量也较大。 2.1.2 本文采用的Canny 算子

如图2-2(a)所示的虹膜图像,很多边缘对于检测虹膜内外边界来说都是干扰

边缘,如果在计算梯度时,对x 、y 两个方向均进行计算,则会产生过多过细的边缘,而这些边缘又是不需要的,而且会对提取有用的边缘起干扰作用。此时,如果有选择性的重点检测某一或某些方向的边缘,则既能节省时间又有利于排除干扰。针对虹膜图像,由于上下部分常常会被眼睑遮挡,如果将眼睑边界也过清晰地检测出来了,则对下一步的Hough 圆变换检测外边界产生很大的干扰,特别是眼睑基本成弧形,与圆形接近。为削弱非虹膜边界的影响,可以在进行边缘检测时重点检测有用的边缘,在保留足够的虹膜边界信息的同时尽量削弱其它边界的影响。注意到上下眼睑边界仅限于水平方向,在计算梯度幅值时对水平方向偏导值赋以较大的权重,而对竖直方向偏导值赋以较小的权重,从而削弱水平方向上的边界。

(1)本文在定位虹膜外边界时,按照这一思想对Canny 算子进行了改进,在

计算梯度时只计算水平方向上的梯度,以避免过多地检测出眼睑边缘。即:

X 方向偏导数:

(,)0f x a =(,)a b

[][][][][],(,1,1,11,)2x P i j I i j I i j I i j I i j =+-+++-+

(2.11)

Y 方向偏导数:

[],0y P i j =

(2.12)

(a)原始图像缩放0.4

(b)竖直权重为0

(c)两方向均匀权重

(d)水平权重为0

图2-2虹膜图像以及Canny 边缘检测的图像

其中滤波时对边缘处,为简化,未处理,造成有虚假边缘,定位时除去,并

不影响Hough 定位圆。

(2)在非极大值抑制时,选择比较邻域为半径1.5像素范围之内,这样的到

的边缘图像相对较好,边缘大于等于一个像素,小于等于两个像素,考虑到Hough 参数的量化,比选择半径为1的邻域范围造成的误差小,而与选择半径2的邻域边缘图相比,边缘得到了较好的细化。如图2-3。

(a)1.5邻域半径抑制

(b)2邻域半径抑制

(c)1邻域半径抑制

(d)1.5邻域半径抑制 (e)2邻域半径抑制 (f)1邻域半径抑制

图2-3不同邻域半径边缘检测图

(3)此外实际处理过程进行了少许改变:

1为了减小处理的数据量,在定位虹膜内外边界时,首先对虹膜图像进行了缩放,而且缩放定位后再折换成原始图像的圆,原始图像大小为320280?。

2对于Canny 检测处理后的边缘图像,直接一次将内外两圆定位出,在定位外圆时比较准确,但是定位内圆时由于受其外围边缘的影响,很容易造成定位失败,因此首先定位出外圆,然后在外圆的范围中定位内圆,大大减小了干扰。

○3由于内圆相对较小,定位外圆时缩放比例0.4,定位内圆时缩放比例为0.6。

2.1.3 本文采用的Hough 变换圆检测算法

直接使用Hough 变换是将图像上的每个边缘点都代入方程,且半径搜索范围

从O 到图像平面所能容纳的上限,因此计算量非常大。本文对其进行了修改,并根据先验知识及所采集的虹膜图像的特点尽可能地减少搜索范围及参与Hough 变换的点数以高效率。过程如下: (1)对图像进行边缘检测得到边缘图像;

(2)根据先验知识,分别确定内外边界圆半径的范围,从而减小搜索半径; (3)圆的参数方程可改写为:

cos ,sin a x r b y r θθ=-=-

(2.13)

将图像空间中的边缘点而不是原图像中的每个点逐一代入上式,求出参数

(,)a b 值。从图中可以看出,虹膜外边界左右两侧的部分所受干扰较少,边界质量

较高,因此可以限制θ的取值范围,相当于只统计左右两侧部分的边界点。由于虹膜边界圆的圆心不可能太靠近图片边缘(否则就没有将整个虹膜区域采集进来,虹膜信息可能太少而无法用于识别),即圆心应位于图像中间区域的某个范围内,因此如果(,)a b 位于这一范围内,则将相应的累加阵(,)H a b 中的元素加1,否则加0;

(4)找出(,)H a b 中元素的最大值,即是对应半径为r ,圆心为(,)a b ,且圆周

上边点最多的圆,即为边界圆。

2.1.4 虹膜内外边界的定位

本文先定位虹膜外边界,然后再在外边界范围以内定位内边界,从而能更快更准地定位内边界。

虹膜外边界上下部分常常被眼睑部分地遮挡,且往往还有睫毛的干扰,所以对外边界的定位先采用本文所述的改进的Canny算子进行边缘检测,从而在保留足够多的边缘信息的情况下尽量少地检测出干扰边缘,再利用改进的Hough变换进行圆检测,确定外边界圆的圆心和半径。

由于瞳孔位于虹膜区域以内,所以定位内边界时,将搜索范围限制在外边界范围以内,以减少搜索范围。

定位结果如图2-4

图2-4虹膜定位结果

2.2 眼睑的分割

在虹膜识别过程中,虹膜区域往往会受到干扰,由于尽量考虑实用性,不能对被采集者提出苛刻要求进行配合,这样在被采集者不配合的情况下,获得的虹膜有效区域是很有限的,往往会是部分虹膜区域,其余部分被眼皮、睫毛等遮挡。从采集的图像数据库中也可以看出,多数图像中虹膜区域都是不完全的,因此虹膜区域不完全是普遍存在的。眼睑包括上眼睑和下眼睑,上下眼睑开度不同,裸

露出的虹膜区域面积也不同。如果这部分眼睑也作为有效虹膜区域带入虹膜特征提取和编码模块,那么得到的虹膜编码可信度将大大降低。 检测眼睑比较常用的方法有抛物线检测眼睑和直线检测法。

在许多文献中,都采用了抛物线检测眼睑。Mathieu ADAM 等在文献中首先

在保留虹膜边界的同时,平滑了虹膜纹理,然后进行抛物线检测;Tae -Hong Min 等提出在归一化后的虹膜图像中采用抛物线检测,这样不需要考虑θ的影响;Young Kyoon Jang 等提出检测眼睑候选区的曲线累积值,如果大于某一阈值则进行抛物线检测,否则进行直线检测。 2.2.1 抛物线检测眼睑

检测眼睑时,可以根据眼睑的形状采用抛物线拟合的方法,在多维参数空间

求最优解。抛物线曲线的定位可通过广义Hough 变换来确定抛物线的各个参数。抛物线曲线可表示为:

2(()sin ()cos )(()cos ()sin )x h y k x h y k θθαθθ--+-=-+- (2.14)

其中α是用来控制抛物线的曲率,(,)h k 是抛物线的顶点,θ是抛物线相对于

x 轴的旋转角。该方法的缺点是运算时间长。另外较常用的是将眼睑简化为直线

的方法。这样可以大大的降低运算量。 2.2.2 Radon 变换法分割眼睑

对眼睑边界进行细分,可以近似认为其由一系列的线段连接而成。因此可以

采用Radon 变换直线检测法定位眼睑。

Radon 变换可在任意维空间定义,下面给出在2维空间的定义式:

(,)(,)(cos sin )D

R f x y x y dxdy ρθδρθθ=--??

(2.15)

式中,D 为整个图像平面,(,)f x y 为图像在点(,)x y 的灰度,ρ为坐标原点

到直线的距离,θ为距离与x 轴的夹角,δ为冲激函数,定义为:

(1)()0x δ∞?=?

?

离散时为 0

0x x =≠

(2.16)

它使(,)f x y 沿直线cos sin x y ρθθ=+进行积分。如图2-5。

Radon 变换可以理解为图像在ρθ-空间的投影,ρθ-空间中的每一点对应

着图像空间中的一条直线,而Radon 变换是图像像素点在每条直线上的积分,也可理解为图像逆时针旋转θ角度后在水平轴上的投影。因此图像中每条直线会在ρθ-空间形成一个“亮点”,直线的检测转化为在ρθ-变换域对“亮点”的检测。

图2-5

Radon 变换法检测眼睑的步骤如下:

(1)分别确定可能存在上、下眼睑的虹膜区域,以减少搜索范围;

(2)对可能存在眼睑的虹膜区域采用改进的Canny 算子进行边缘提取。由于

眼睑边缘呈水平方向,因此在计算梯度时只取竖直方向的梯度,以避免虹膜边界的干扰,即: X 方向偏导数:

[],0x P i j =

(2.17)

Y 方向偏导数:

[][][][][],(,1,,11,1)2y P i j I i j I i j I i j I i j =-+++-++

(2.18)

(3)对提取到的边缘图像进行Radon 变换直线检测,变换后会得到若干个“亮

点”,如果“亮点”的最大值大于某个阈值T ,则视其对应的直线为眼睑边界直线L ,否则认为没有上(或下)眼睑遮挡;

(4)如果检测到了眼睑边界直线L ,则作一条水平直线,此直线过虹膜外边

界与L 的交点,为简化处理,将此直线所在的虹膜区域标为干扰点。

(5)对检测到眼睑像素用灰度0代替。 眼睑检测结果如图2-6。

可以发现采用这种方法能比较有效地将上下眼睑分割出去但检测方法过于

粗略,易将部分有用虹膜当作眼睑分割出去,因此损失了一定量的有用虹膜信息。

2.3 剔除睫毛

睫毛是用来保护眼睛的,可以有效阻挡异物进入眼睛,但是在虹膜识别时,

落入虹膜图像区域的睫毛影响了虹膜特征的提取,如果不加以消除,会造成特征表示精度下降,难以反映实际的虹膜信息。由于虹膜编码识别算法本身具有一定的抗干扰能力,当睫毛稀疏且很短时,对虹膜识别的影响还不是很大。但是如果睫毛的数量较多、比较长,在进行虹膜特征编码时很容易被误认为是虹膜的纹理特征,得到错误的虹膜编码。

文献中有一些睫毛剔除的方法。John Dangman 基于虹膜灰度直方图[4],提出

睫毛检测的统计模型;Zhao feng He 等人也提出了一种基于统计模型的睫毛剔除法;D Zhang 等首先用Sobel 算子处理睫毛所在区域,然后判决是否为睫毛遮挡,若是,则沿边沿方向进行1D 中值滤波[15];Byung Jun Kang 等将睫毛区域分成两种类型--多条睫毛重叠区域和睫毛可分区域,然后分别处理。

本论文中采用了简单的阈值法剔除睫毛。

2.3.1 阈值法剔除睫毛

睫毛通常具有灰度值较低的特点,和虹膜区域其它部分的灰度相比,睫毛部

分灰度值更低,因此从灰度上基本可以将睫毛与虹膜区分开,本文采用了灰度阈值法分离睫毛。而且睫毛具有多而分散、形状有弯有曲和存在交叉现象的特点,因此采用阈值法检测是比较合适的。

设用于分离睫毛的阈值为T ,在可能存在睫毛的虹膜区域内,如果像素的灰

度值于T ,则认为是睫毛,标记为干扰点,记作1:

(,)1,(,)0,N x y if N x y if =??

=?

(,)(,)I x y T

I x y T >≤

(2.19)

图2-6是部分虹膜内外圆定位、眼睑分割及睫毛剔除的最终结果。

图2-6部分虹膜内外圆定位、眼睑分割及睫毛剔除结果

2.4 小结

本章完成虹膜图像的预处理,采用Canny边缘检测和Hough变换对虹膜内外边界进行了定位,采用Radon变换进行直线检测,检测上下眼睑,采用阈值法除去睫毛干扰,并给出了处理结果。

水样的常见预处理办法

精心整理 水样的常见预处理方法 样品前处理是目前分析测试工作的瓶颈,也是国内外研究的薄弱环节,同时又非常重要。因为样品被沾污或者因吸附、挥发等造成的损失,往往使监测结果失去准确性,甚至得出错误的结论,所以样品前处理过程是保证监测结果准确度的一个重要环节,样品前处理技术方法及需要注意的问题是保证监测结果真实可靠的保障。 常用的水样前处理方法有多种。无机物测定的前处理方法常用的有过滤、絮凝沉淀、蒸馏、酸化吹气法等;CuPbZnCd等重金属的前处理一般选用消解的方法;从环境水样中富集分离有机物的方法也有许多,半挥发性有机物的方法主要有液-液萃取,液-固萃取及固相微萃取等;对挥发性有机物主要有吹脱捕集法-顶空法和液-液萃取。 样特点等来确定, 准确性。 1、环境水样过滤絮凝沉淀前处理方法 测定天然水样溶解态元素时,用0.45μm 物和颗粒物如可溶性正磷酸盐Fe、Cd、Cu、Pb滤膜过滤,弃去初始50~100ml 滤和不过滤对测定结果影响很大, 否过滤,否则,严重影响测定结果的准确性。 测定沉淀物中硫化物。测定氯化物硝酸盐氮、 过滤后测定滤液中 其中 进一步除去可溶性物质, 2 调节水样的PH值非常重要氟化物在含高氯 PH值4,氰 蒸馏含酚水样时,由于流出液体积和原蒸馏液相当,蒸馏后的残液也须呈酸性,如不呈酸性,则应重新取样,增加磷酸加入量,进行蒸馏,否则苯酚未全部蒸馏,使测定结果偏低。注意检查蒸馏和吸收装置的连接部位,使其严密,氰化物、氨氮蒸馏装置的导管下端插入吸收液面下,这些细节都必须注意,否则蒸馏液损失,使测定结果偏低。蒸馏温度应适当,更应避免发生暴沸,否则可造成流出液温度升高,氰化氢、氨吸收不完全。 3、环境水样消解前处理方法 金属及其化合物的测定,常选择消解水样的方法消解样品,使水样无机结合态的和有机结合态的金属以及悬浮颗粒物中的金属化合物转变为游离态的离子,以便于进行原子吸收等的测定用原子吸收法测定金属时,消解用的酸的选择非常重要,作为基体应不影响后面的原子吸收测定。对于火焰原子吸收法,一般以稀HNO3介质为佳,HCIO3次之,因有分子吸收,不用H2SO4,H3PO4存在化学干扰,也不宜选用。对于石墨炉原子吸收法一般以HNO3介质为佳,应避免使用HCl介质,因一些金属的氯化物在灰化阶段易挥发损失,如CdCl2、ZnCl2、PbCl2等,同时NaCl、CaCl2、MgCl2常常产生基体干扰,也要避免使用H2SO4和HCIO3介质,即使使用了对以后测定有干扰

影像预处理

遥感影像预处理 预处理是遥感应用的第一步,也是非常重要的一步。目前的技术也非常成熟,大多数的商业化软件都具备这方面的功能。预处理的大致流程在各个行业中有点差异,而且注重点也各有不同。 本小节包括以下内容: ? ? ●数据预处理一般流程介绍 ? ? ●预处理常见名词解释 ? ? ●ENVI中的数据预处理 1、数据预处理一般流程 数据预处理的过程包括几何精校正、配准、图像镶嵌与裁剪、去云及阴影处理和光谱归一化几个环节,具体流程图如图所示。 图1数据预处理一般流程

各个行业应用会有所不同,比如在精细农业方面,在大气校正方面要求会高点,因为它需要反演;在测绘方面,对几何校正的精度要求会很高。 2、数据预处理的各个流程介绍 (一)几何精校正与影像配准 引起影像几何变形一般分为两大类:系统性和非系统性。系统性一般有传感器本身引起的,有规律可循和可预测性,可以用传感器模型来校正;非系统性几何变形是不规律的,它可以是传感器平台本身的高度、姿态等不稳定,也可以是地球曲率及空气折射的变化以及地形的变化等。 在做几何校正前,先要知道几个概念: 地理编码:把图像矫正到一种统一标准的坐标系。 地理参照:借助一组控制点,对一幅图像进行地理坐标的校正。 图像配准:同一区域里一幅图像(基准图像)对另一幅图像校准影像几何精校正,一般步骤如下, (1)GCP(地面控制点)的选取 这是几何校正中最重要的一步。可以从地形图(DRG)为参考进行控制选点,也可以野外GPS测量获得,或者从校正好的影像中获取。选取得控制点有以下特征:

1、GCP在图像上有明显的、清晰的点位标志,如道路交叉点、河流交叉点等; 2、地面控制点上的地物不随时间而变化。 GCP均匀分布在整幅影像内,且要有一定的数量保证,不同纠正模型对控制点个数的需求不相同。卫星提供的辅助数据可建立严密的物理模型,该模型只需9个控制点即可;对于有理多项式模型,一般每景要求不少于30个控制点,困难地区适当增加点位;几何多项式模型将根据地形情况确定,它要求控制点个数多于上述几种模型,通常每景要求在30-50个左右,尤其对于山区应适当增加控制点。 (2)建立几何校正模型 地面点确定之后,要在图像与图像或地图上分别读出各个控制点在图像上的像元坐标(x,y)及其参考图像或地图上的坐标(X,Y),这叫需要选择一个合理的坐标变换函数式(即数据校正模型),然后用公式计算每个地面控制点的均方根误差(RMS) 根据公式计算出每个控制点几何校正的精度,计算出累积的总体均方差误差,也叫残余误差,一般控制在一个像元之内,即RMS<1。 (3)图像重采样

数字图像处理技术试题答案

数字图像处理技术试题库 一、单项选择题:(本大题 小题, 2分/每小题,共 分) 1.自然界中的所有颜色都可以由()组成 A.红蓝绿 B.红黄绿 C.红黄蓝绿 D.红黄蓝紫白 2. 有一个长宽各为200个象素,颜色数为16色的彩色图,每一个象素都用R(红)、G(绿)、B(蓝)三个分量表示,则需要()字节来表示 A.100 B.200 C.300 D. 400 3.颜色数为16种的彩色图,R(红)、G(绿)、B(蓝)三个分量分别由1个字节表示,则调色板需要()字节来表示 A.48 B.60 C.30 D. 40 4.下面哪一个不属于bmp 文件的组成部分 A .位图文件信息头 B. 位图文件头 C.调色板 D. 数据库标示 5.位图中,最小分辨单元是 A.像素 B.图元 C.文件头 D.厘米 6.真彩色的颜色数为 A.888?? B. 161616?? C.128128128?? D.256256256?? 7.如果图像中出现了与相邻像素点值区别很大的一个点,即噪声,则可以通过以下方式去除 A.平滑 B.锐化 C. 坐标旋转 D. 坐标平移 8.下面哪一个选项不属于图像的几何变换() A.平移 B.旋转 C. 镜像 D. 锐化 9.设平移量为x x t t (,),则平移矩阵为() A .1 0 00 1 0 1x y t t ?????????? B. 1 0 00 -1 0 1x y t t ??-???????? C.1 0 00 1 0 - 1x y t t ????????-?? D.1 0 00 1 0 - -1x y t t ?????????? 10.设旋转角度为a ,则旋转变换矩阵为() A .cos() sin() 0sin() cos() 00 0 1a a a a -?????????? B .cos() sin() 0sin() cos() 00 0 1a a a a ?????????? C .sin() cos() 0 sin() cos() 0 0 0 1a a a a -?????????? D .cos() sin() 0sin() cos() 00 0 1a a a a -????-?????? 11.下面哪一个选项是锐化模板 A .-1 -1 -1-1 9 -1-1 -1 -1??????????g B .-1 -1 -1-1 -9 -1-1 -1 -1??????????g C .-1 -1 -1-1 8 -1-1 -1 -1??????????g D .-1 -1 -1-1 6 -1-1 -1 -1?????????? g 12.真彩色所能表示的颜色数目是 A .128128? B .256256256 ?? C .256 D .6059

虹膜识别技术

前言随着社会的发展,身份识别的重要性正日益显现,而传统的身份识别方式由于其固有的局限性已远远不能满足要求,钥匙、卡片和身份证等容易丢失和仿造,密码则容易遗忘,更为严重的是这些传统识别方式无法区分真正的拥有者和取得身份标识物的冒充者,一旦他人获得了这些身份标识物,就可以拥有相同的权力。在需求的驱动下,基于人脸、指纹、虹膜、手形、笔迹等生物特征的识别技术应运而生。 虹膜识别技术是近几年兴起的生物认证技术。虹膜的形成由遗传基因决定,人体基因表达决定了虹膜的形态、生理特性、颜色和总的外观,是最可靠的人体生物终身身份标识。虹膜识别就是通过这种人体生物特征来识别人的身份。在包括指纹在内的所有生物特征识别技术中,虹膜识别是当前应用最为精确的一种。虹膜识别技术以其高精确度、非接触式采集、易于使用等优点得到了迅速发展,被广泛认为是二十一世纪最具有发展前途的生物认证技术,未来的安防、国防、电子商务等多种领域的应用,也必然的会以虹膜识别技术为重点。这种趋势,现在已经在全球各地的各种应用中逐渐开始显现出来,市场应用前景非常广阔。 1.什么是虹膜 人眼的外观由巩膜、虹膜、瞳孔三部分构成,巩膜即眼球外围的白色部分,眼睛中心为瞳孔部分,虹膜位于巩膜和瞳孔之间,包含了最丰富的纹理信息。外观上看,虹膜由许多腺窝、皱褶、色素斑等构成,是人体中最独特的结构之一。 虹膜作为身份标识具有许多先天优势: 1) 唯一性,由于虹膜图像存在着许多随机分布的细节特征,造就了虹膜模式的唯一性。英国剑桥大学John Daugman教授提出的虹膜相位特征证实了虹膜图像有244个独立的自由度,即平均每平方毫米的信息量是3.2比特。实际上用模式识别方法提取图像特征是有损压缩过程,可以预测虹膜纹理的信息容量远大于此。并且虹膜细节特征主要是由胚胎发育环境的随机因素决定的,即使克隆人、双胞胎、同一人左右眼的虹膜图像之间也具有显著差异。虹膜的唯一性为高精度的身份识别奠定了基础。英国国家物理实验室的测试结果表明:虹膜识别是各种生物特征识别方法中错误率最低的。 2) 稳定性,虹膜从婴儿胚胎期的第3个月起开始发育,到第8个月虹膜的主要纹理结构已经成形。除非经历危及眼睛的外科手术,此后几乎终生不变。由于角膜的保护作用,发育完全的虹膜不易受到外界的伤害。 3) 非接触,虹膜是一个外部可见的内部器官,不必紧贴采集装置就能获取合格的虹膜图像,识别方式相对于指纹、手形等需要接触感知的生物特征更加干净卫生,不会污损成像装置,影响其他人的识别。 4) 便于信号处理,在眼睛图像中和虹膜邻近的区域是瞳孔和巩膜,它们和虹膜区域存在着明显的灰度阶变,并且区域边界都接近圆形,所以虹膜区域易于拟合分割和归一化。虹膜结构有利于实现一种具有平移、缩放和旋转不变性的模式表达方式。 5) 防伪性好,虹膜的半径小,在可见光下中国人的虹膜图像呈现深褐色,看不到纹理信息,具有清晰虹膜纹理的图像获取需要专用的虹膜图像采集装置和用户的配合,所以在一般情况下很难盗取他人的虹膜图像。此外眼睛具有很多光学和生理特性可用于活体虹膜检测。 2. 虹膜识别过程 虹膜识别通过对比虹膜图像特征之间的相似性来确定人们的身份,其核心是使用模式识别、图像处理等方法对人眼睛的虹膜特征进行描述和匹配,从而实现自动的个人身份认证。 虹膜识别技术的过程一般来说分为:虹膜图像获取、图像预处理、特征提取和特征匹配四个步骤。

图像预处理代码

function img = My_read(path) M=0;var=0; I=double(imread(path)); [m,n,p]=size(I); for x=1:m for y=1:n M=M+I(x,y); end end M1=M/(m*n); for x=1:m for y=1:n var=var+(I(x,y)-M1).^2; end end var1=var/(m*n); for x=1:m for y=1:n if I(x,y)>=M1 I(x,y)=150+sqrt(2000*(I(x,y)-M1)/var1); else I(x,y)=150-sqrt(2000*(M1-I(x,y))/var1); end end end figure, imshow(I(:,:,3)./max(max(I(:,:,3)))); title(‘归一化’) M =3; %3*3 H = m/M; L= n/M; aveg1=zeros(H,L); var1=zeros(H,L); for x=1:H; for y=1:L; aveg=0;var=0; for i=1:M; for j=1:M; aveg=I(i+(x-1)*M,j+(y-1)*M)+aveg; end end aveg1(x,y)=aveg/(M*M); for i=1:M; for j=1:M; var=(I(i+(x-1)*M,j+(y-1)*M)-aveg1(x,y)).^2+var;

end end var1(x,y)=var/(M*M); end end Gmean=0; Vmean=0; for x=1:H for y=1:L Gmean=Gmean+aveg1(x,y); Vmean=Vmean+var1(x,y); end end Gmean1=Gmean/(H*L); %所有块的平均值Vmean1=Vmean/(H*L); %所有块的方差gtemp=0; gtotle=0; vtotle=0; vtemp=0; for x=1:H for y=1:L if Gmean1>aveg1(x,y) gtemp=gtemp+1; gtotle=gtotle+aveg1(x,y); end if Vmean1

对于车牌识别图像预处理技术的研究

对车牌识别图像预处理技术的探究 摘要:随着当今汽车数量日益增加,城市交通状况也相应的受到人们的重视,如何进行有效的交通管理更是成为了人们关注的焦点。针对此问题,人们运用新的科学技术,相继研制开发出了各种交通道路监视、管理系统。这些系统通过车辆检测装置对过往的车辆实施检测,提取有关交通数据,达到监控、管理和指挥交通的目的。MATLAB是一种高效的工程计算语言,它是一个比较完整的数据库系统,在数据处理、图像处理、神经网络、小波分析等方面都有广泛的应用。本文详细阐述了运用MATLAB对车牌进行图像增强、边缘检测、二值图像化、形态学滤波等处理过程,为后面研究其定位、分割、识别做好充分的准备。 关键词:车牌图像增强中值滤波二值化形态学滤波 MATLAB 引言:通常情况下,由于外界光线、气候或其他自然、设备本身、人为因素等干扰而导致所拍摄的车牌图片成像不完美,使得对比度太小、曝光量太大、不清晰、倾斜等情况产生,这些情况都会极大的影响后期车牌号码字符的分割、识别操作,甚至导致无法进行字符分割和识别操作。因而,在做字符分割和识别操作之前,对图像做一系列的预处理很有必要。这些预处理操作包括图像增强处理(中值滤波、均值滤波、直方图均衡化)、边缘检测、二值化、形态学滤波处理。 1图像的增强处理 1.1中值滤波 中值滤波是一种非线性滤波,由于它在实际运算过程中并不需要图像的统计特性,所以比较方便。中值滤波首先是被应用在一维信号处理技术中,后来被二维图像信号处理技术所应用。在一定的条件下,可以克服线性滤波器所带来的图像细节模糊,而且对滤除脉冲干扰及图像扫描噪声最为有效。但是对一些细节多,特别是点、线、尖顶细节多的图像不宜采用中值滤波的方法。 中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替。

基于图像预处理的二维码识别技术的研究概要

基于图像预处理的二维码识别技术的研究 摘要:随着计算机科学技术的发展,自动识别技术得到了广泛的应用。在众多自动识别的技术中,条码技术已经成为当今主要的计算机自动识别技术之一。为解决条码信息容量有限的问题,九十年代以来出现一种新的条码——二维码。 二维码是指在平面二维方向上,使用某种特定的几何图形按一定规律分布的黑白相间的,用以记录信息的符号。在代码编制上巧妙地利用构成计算机内部逻辑基础的“0”、“1”比特流的概念,使用若干个与二进制相对应的几何形体来表示文字数值信息,通过图象输入设备或光电扫描设备自动识读以实现信息自动处理:它具有条码技术的一些共性:每种码制有其特定的字符集;每个字符占有一定的宽度;具有一定的校验功能等。同时还具有对不同行的信息自动识别功能、及处理图形旋转变化等特点。 二维码主要分为两大类:一是堆叠式是二维码,其主要代表是pdf417;二是矩阵式二维码,主要包括QR码和Data Matrix码。在现代商业活动中,二维码以其低成本、快速识读、含有大量信息而广泛应用于各个行业,如:产品防伪/溯源、广告推送、网站链接、数据下载、商品交易、定位/导航、电子凭证、车辆管理、信息传递、名片交流、wifi共享等,人们通过手机二维码的扫描软件就可以轻松获得二维码中所储藏的信息。 对QR码进行识别需要使用采集设备采集的图像,但图像的采集过程中由于受到各种因素(如光照不均匀、拍摄角度、二维码有褶皱等)的影响,可能导致二维码图像背景有各种噪声,收到的图像可能存在几何畸变或者图像有阴影,从而导致识读设备很难识读,给解码带来相当大的困难。因此,如何对收集到的图像进行适当的去噪和校正已成为二维码识别的关键问题[1]。 本文主要针对异常QR码以及Data Matrix码的识别进行描述,先表明二维码识别要解决的问题、任务和框架,并对现有方法进行阐述,最后讨论二维码识别技术仍需解决的问题,并展望看其未来研究方向。 1.二维码识别的概念框架 随着二维码的广泛使用,二维码被广泛认知,当人们遇到二维码扫描失败的时候,对其产生的影响也是巨大的,人们会怀疑是不是产品是假的,或者是有诈骗信息,但其主要问题可能是: 1)二维码的扫描不够精确; 2)不是真的二维码图形;

虹膜图像预处理

虹膜图像预处理 在实际获取的图像中,虹膜只占一部分区域。图像中还包括瞳孔、眼睑、睫毛及眼睛和人脸的其它部分。所以,在对虹膜纹理特征进行提取之前,要把虹膜区域从图像中分割出来。其分割准确与否直接影响到后面的特征提取及匹配精度,即如果分割不准确,则虹膜识别效果就差,很可能造成误判,使识别算法失效。针对Canny[2]算法优良的边缘检测性能及虹膜边界的特点,本文采用了该算法,与Hough变换相结合,用于定位虹膜内外边界、分割上下眼睑,采用阀值法剔除睫毛。 2.1 虹膜内外边界的定位 虹膜的内边界即内边缘与瞳孔相交接的部分,外边界即外边缘与巩膜相交接的部分,均近似为圆形,因此定位虹膜内外边界就是要确定这两个拟合圆的圆心和半径。 2.1.1 Canny算子和Hough变换的基本原理 (1)Canny边缘检测算子 边缘是图像的基本特征,保留了原始图像中相当重要的信息,而又使得总的数据减小了很多。准确提取边缘既能减少图像处理的信息量,又可重点描述物体的形态特征。传统的边缘检测算子如Roberts、Sobel、Prewitt、Kirsch和Laplacian 等算子都是局域窗口梯度算子,由于它们对噪声敏感,所以在处理实际图像中效果并不理想。1986年,Canny提出边缘检测算子应满足以下3个判断准则:信噪比准则;定位精度准则;单边缘响应准则,并由此推导出了最佳边缘检测算子--Canny算子。该算子具有定位精度高、单一边缘和检测效果好等优点。它主要分以下四步: ○1平滑图像 Canny边缘检测算子是高斯函数的一阶导数,是对信噪比与定位精度之乘积的最优化逼近算子。选择合适的高斯低通滤波器来平滑原始的虹膜图像,既可以取得更加柔和的平滑效果,又不至于破坏图像中的边沿,同时还可以消除原始图像的高频噪声。Canny算法首先用二维高斯函数的一阶导数,对图像进行平滑,设二维高斯函数为:

图像处理基本方法

图像处理的基本步骤 针对不同的目的,图像处理的方法不经相同。大体包括图像预处理和图像识别两大模块。 一、图像预处理: 结合识别复杂环境下的成熟黄瓜进行阐述,具体步骤如下: · 图像预处理阶段的流程图 对以上的图像流程进行详细的补充说明: 图像预处理的概念: 将每一个文字图像分检出来交给识别模块识别,这一过程称为图像预处理。 图像装换和图像分割以及区域形态学处理都是属于图像处理的基本内容之一。 图像转换:方法:对原图像进行灰度化处理生成灰度矩阵——降低运算速度(有具体的公式和方程),中值滤波去噪声——去除色彩和光照的影响等等。 图像分割:传统方法:基于阈值分割、基于梯度分割、基于边缘检测分割和基于区域图像割等方法。脉冲耦合神经网络 (PCNN)是针对复杂环境下 图像采集 图像采集中注意采集的方法、工具进行介绍。目的是怎样获取有代表性的样本。(包括天气、相机的位置等) 对采集的图像进行特征分析 目标的颜色和周围环境的颜色是否存在干涉的问题、平整度影响相机的拍摄效果、形状 图像转换 图像分割 区域形态学处理

的有效分割方法,分割的时候如果将一个数字图像输入PCNN,则能基于空间邻近性和亮度相似性将图像像素分组,在基于窗口的图像处理应用中具有很好的性能。 区域形态学处理:对PCNN分割结果后还存在噪声的情况下,对剩余的噪声进行分析,归类属于哪一种噪声。是孤立噪声还是黏连噪声。采用区域面积统计法可以消除孤立噪声。对于黏连噪声,可以采用先腐蚀切断黏连部分,再膨胀复原目标对象,在进行面积阙值去噪,通过前景空洞填充目标,最后通过形态学运算,二值图像形成众多独立的区域,进行各连通区域标识,利于区域几何特征的提取。 二、图像识别: 针对预处理图像提取 目标特征 建立LS SVM分类器 得到结果 图像识别流程图 提取目标特征:目标特征就是的研究对象的典型特点,可以包括几何特征和纹理特征。 对于几何特征采用的方法:采用LS-SVM支持向量机对几何特征参数进行处理,通过分析各个参数的分布区间来将目标和周围背景区分开,找出其中具有能区分功能的决定性的几何特征参数。 纹理特征方法:纹理特征中的几个参数可以作为最小二乘支持向量机的辅助特征参数,提高模型的精准度。 最小二乘支持向量机介绍:首先选择非线性映射将样本从原空间映射到特征空间,以解决原空间中线性不可分问题,在此高维空间中把最优决策问题转化为等式约束条件,构造最优决策函数,并引入拉格朗日乘子求解最优化问题,对各个变量求偏微分。 LS SVM分类器:对于p种特征选择q个图像连通区域,作为训练样本。依

图像预处理方法

预处理就是在图像分析中,对输入图像进行特征抽取等前所进行的处理。输入图像由于图像采集环境的不同,如光照明暗程度以及设备性能的优劣等,往往存在有噪声,对比度不够等缺点。另外,距离远近,焦距大小等又使得人脸在整幅图像中间的大小和位置不确定。为了保证人脸图像中人脸大小,位置以及人脸图像质量的一致性,必须对图像进行预处理。图像预处理的主要目的是消除图像中无关的信息,滤除干扰、噪声,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取的可靠性. 人脸图像的预处理主要包括人脸扶正,人脸图像的增强,以及归一化等工作。人脸扶正是为了得到人脸位置端正的人脸图像;图像增强是为了改善人脸图像的质量,不仅在视觉上更加清晰图像,而且使图像更利于计算机的处理与识别。归一化工作的目标是取得尺寸一致,灰度取值范围相同的标准化人脸图像[4]。 几何规范化 由于图像在提取过程中易受到光照、表情、姿态等扰动的影响,因此在识别之前需要对图像做归一化的预处理[4],通常以眼睛坐标为基准点,通过平移、旋转、缩放等几何仿射变换对人脸图像进行归一化。因为人脸虽然是柔性的三维曲面,同一人脸因表情变化会有差异,但相对而言人的两眼之间的距离变化不会很大,因此双眼的位置及眼距,就成为人脸图像归一化的依据。 定位眼睛到预定坐标,将图像缩放至固定大小。通过平移、旋转、缩放等几何仿射变换,可以对人脸图像做几何规范化处理,仿射变换的表达式为: ]100][1,,[]1,,[3231 22 211211 a a a a a a v u y x = (2-1) 其中(u,v)表示输入图像中像素的坐标(x,y)表示输出图像中像素的坐标。将上式展开可得 322212312111u a x a v a u a y a v a ++=++= (2-2)

进行识别前图像预处理

进行识别前图像预处理 //BP神经网络字符识别函数定义 #include "dibapi.h" #include <iostream> #include <deque> #include <math.h> using namespace std; typedef deque<CRect> CRectLink; typedef deque<HDIB> HDIBLink; //声明一些必要的全局变量 int w_sample=8; int h_sample=16; bool fileloaded; bool gyhinfoinput; bool gyhfinished; int digicount; int m_lianXuShu; CRectLink m_charRectCopy; CRectLink m_charRect; HDIBLink m_dibRect; HDIBLink m_dibRectCopy;

HDIB m_hDIB; CString strPathName; CString strPathNameSave; /********************************function declaration*************************************/ //清楚屏幕 void ClearAll(CDC* pDC); //在屏幕上显示位图 void DisplayDIB(CDC* pDC,HDIB hDIB); //对分割后的位图进行尺寸标准归一化 void StdDIBbyRect(HDIB hDIB, int tarWidth, int tarHeight); //整体斜率调整 void SlopeAdjust(HDIB hDIB); //去除离散噪声点 void RemoveScatterNoise(HDIB hDIB); //梯度锐化 void GradientSharp(HDIB hDIB); //画框 void DrawFrame(CDC* pDC,HDIB hDIB, CRectLink charRect,unsigned int linewidth,COLORREF color); //将灰度图二值化 void ConvertGrayToWhiteBlack(HDIB hDIB);

基于matlab的图像预处理技术研究文献综述

毕业设计文献综述 题目:基于matlab的图像预处理技术研究 专业:电子信息工程 1前言部分 众所周知,MATLAB在数值计算、数据处理、自动控制、图像、信号处理、神经网络、优化计算、模糊逻辑、小波分析等众多领域有着广泛的用途,特别是MATLAB的图像处理和分析工具箱支持索引图像、RGB 图像、灰度图像、二进制图像,并能操作*.bmp、*.jpg、*.tif等多种图像格式文件如。果能灵活地运用MATLAB提供的图像处理分析函数及工具箱,会大大简化具体的编程工作,充分体现在图像处理和分析中的优越性。 图像就是用各种观测系统观测客观世界获得的且可以直接或间接作用与人眼而产生视觉的实体。视觉是人类从大自然中获取信息的最主要的手段。拒统计,在人类获取的信息中,视觉信息约占60%,听觉信息约占20%,其他方式加起来才约占20%。由此可见,视觉信息对人类非常重要。同时,图像又是人类获取视觉信息的主要途径,是人类能体验的最重要、最丰富、信息量最大的信息源。通常,客观事物在空间上都是三维的(3D)的,但是从客观景物获得的图像却是属于二维(2D)平面的。 图像存在方式多种多样,可以是可视的或者非可视的,抽象的或者实际的,适于计算机处理的和不适于计算机处理的。 图像处理它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在 1964 年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动

图像预处理流程

图像预处理流程: 图2.2图像预处理流程图 2.2系统功能的实现方法 系统功能的实现主要依靠图像处理技术,按照上面的流程一一实现,每一部分的具体步骤如下: 1原始图像:由数码相机或其它扫描装置拍摄到的图像; 2预处理:对采集到的图像进行灰度化、图像增强,滤波、二值化等处理以克服图像干扰; 3字轮定位:用图像剪切的方法获取仪表字轮; 4字符分割:利用字符轮廓凹凸检测定位分割方法得到单个的字符; 5字符识别:利用模板匹配的方法与数据库中的字符进行匹配从而确认出字符,得到最后的仪表示数。

2.3.1 MATLA B简介 MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。 MATLAB是矩阵实验室(Matrix Laboratory)的简称,和Mathematica、Maple并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。 MATLAB的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完相同的事情简捷得多,并且mathwork也吸收了像Maple等软件的优点,使MATLAB成为一个强大的数学软件。在新的版本中也加入了对C,FORTRAN,C++ ,JAVA的支持。可以直接调用,用户也可以将自己编写的实用程序导入到MATLAB函数库中方便自己以后调用,此外许多的MATLAB 爱好者都编写了一些经典的程序,用户可以直接进行下载就可以用。 2.3.2 MATLAB的优势和特点 1、MATLAB的优势 (1)友好的工作平台和编程环境 MATLAB由一系列工具组成。这些工具方便用户使用MATLAB的函数和文件,其中许多工具采用的是图形用户界面。包括MATLAB桌面和命令窗口、历史命令窗口、编辑器和调试器、路径搜索和用于用户浏览帮助、工作空间、文件的浏览器。随着MATLAB的商业化以及软件本身的不断升级,MATLAB的用户界面也越来越精致,更加接近Windows的标准界面,人机交互性更强,操作更简单。而且新版本的MATLAB提供了完整的联机查询、帮助系统,极大的方便了用户的使用。简单的编程环境提供了比较完备的调试系统,程序不必经过编译就可以直接运行,而且能够及时地报告出现的错误及进行出错原因分析。

基于opencv对图像的预处理

基于opencv 对图像的预处理 1.问题描述 本次设计是基于opencv 结合c++语言实现的对图像的预处理,opencv 是用于开发实时的图像处理、计算机视觉及模式识别程序;其中图像的预处理也就是利用opencv 对图像进行简单的编辑操作;例如对图像的对比度、亮度、饱和度进行调节,同时还可以对图像进行缩放和旋转,这些都是图像预处理简单的处理方法;首先通过opencv 加载一幅原型图像,显示出来;设置五个滑动控制按钮,当拖动按钮时,对比度、亮度、饱和度的大小也会随之改变,也可以通过同样的方式调节缩放的比例和旋转的角度,来控制图像,对图像进行处理,显示出符合调节要求的图像,进行对比观察他们的之间的变化。 2.模块划分 此次设计的模块分为五个模块,滑动控制模块、对比度和亮度调节模块、饱和度调节模块、缩放调节模块、旋转调节模块,他们之间的关系如下所示: 图一、各个模块关系图 调用 调用 调用 调用 滑动控制模块 对比度和亮度调节模块 饱和度调节模块 缩放调节模块 旋转调节模块

滑动控制模块处于主函数之中,是整个设计的核心部分,通过createTrackbar创建五个滑动控制按钮并且调用每个模块实现对图像相应的调节。 3.算法设计 (1)滑动控制: 滑动控制是整个设计的核心部分,通过创建滑动控制按钮调节大小来改变相应的数据,进行调用函数实现对图像的编辑,滑动控制是利用createTrackbar(),函数中包括了滑动控制的名称,滑动控制显示在什么窗口上,滑动变量的地址和它调节的最大围,以及每个控制按钮应该调用什么函数实现什么功能; (2)对比度和亮度的调节: 对比度和亮度的调节的原理是依照线性理论,它的公式如下所示:g(x)=a* f(x) +b,其中f(x)表示源图像的像素,g(x)表示输出图像的像素,参数a(需要满足a>0)被称为增益(gain),常常被用来控制图像的对比度,参数b通常被称为偏置(bias),常常被用来控制图像的亮度; (3)饱和度的调节: 饱和度调节利用cvCvtColor( src_image, dst_image, CV_BGR2HSV )将RGB 颜色空间转换为HSV颜色空间,其中“H=Hue”表示色调,“S=Saturation”表示饱和度,“V=Value ”表示纯度;所以饱和度的调节只需要调节S的大小,H 和V的值不需要做任何的改变; (4)旋转的调节: 旋转是以某参考点为圆心,将图像的个点(x,y)围绕圆心转动一个逆时针角度θ,变为新的坐标(x1,y1),x1=rcos(α+θ),y1=rsin(α+θ),其中r是图像的极径,α是图像与水平的坐标的角度的大小; (5)缩放的调节: 首先得到源图像的宽度x和高度y,变换后新的图像的宽度和高度分别为x1和y1,x1=x*f,y1=y*f,其中f是缩放因子; 4.函数功能描述 (1)主函数main()用来设置滑动控制按钮,当鼠标拖动按钮可以得到相应的数据大小,实现手动控制的功能,当鼠标拖动对比度和亮度调节是,主函数调用

图像复原处理技术

实验五图像复原处理技术 实验目的 1 了解图像降质退化的原因,并建立降质模型。 2 理解反向滤波图像复原的原理 3 理解维纳滤波图像复原的原理实验原理图像复原处理一定是建立在图像退化的数学模型基础上的,这个退化数学模型应该能够 反映图像退化的原因。图像降质过程的模型如图5-1所示,其表达式为 g(x,y)=h (x,y)*f (x,y) +n (xy) (5.1) 图5-1图像降质模型 1、 滤波图像复原 逆滤波法是最简单的图像恢复方法。对5.1式两边作二维傅立叶变换,得到 G (u , v ) =H (u ,v) F (u ,v) + N (u ,v) H (u ,v) 为成像系统的转移函数。估算得到的恢复图像的傅立叶变换F ? (u ,v) 为 ()()()()()() ,,?,,,,G u v N u v F u v F u v H u v H u v ==+ (5.2) 若知道转移函数H (),u v ,5.2式经反变换即可得到恢复图像,其退化和恢复的全过程用图5-2表示。 图5-2频域图像降质及恢复过程

逆滤波恢复法会出现病态性,若H (),u v ,而噪声N(u,v) ≠0,则()(),,N u v H u v 比F (x,y)大很多,使恢复出来()?,f x y 与(),f x y 相差很大,甚至面目全非。一种改进的方法是在H (u , v ) =0 的频谱点及其附近,人为仔细设置()1,H u v -的值,使得在这些频 谱点附近,()(),,N u v H u v 不会对()?,F u v 产生太大影响。二种方法是考虑到降质系统的转移函数(),H u v 的带宽比噪声要窄的多,其频率特性也具有低通性质,因此可令逆滤波的转移函数()1,H u v 为 ()()()()1 222 11 2220 1,,0H u v u v D H u v u v D ?+≤?=??+>? (2)维纳滤波复原 逆滤波简单,但可能带来噪声的放大,而维纳滤波对逆滤波的噪声放大有抑制作用。 维纳滤波是寻找一个滤波器,使得复原后图像()?,f x y 与原始图像(),f x y 的方差最小,即 ()(){ }2 ?min ,,E f x y f x y ??=-?? 如果图像(),f x y 和噪声(),n x y 不相关,且(),h x y 有零均值,则可导出维纳滤波器的传递函数为 ()() () () () 2 2 ,1 ,,,,,w n f H u v H u v P u v H u v H u v P u v = ? + 式中(),n P u v 和(),f P u v 分别为噪声和原始图像的功率谱。实际上(),n P u v 和(),f P u v n 往往是未知的,这时常用常数K 来近似 () () ,,n f P u v P u v 。 【实验】产生一模糊图像,采用维纳滤波图像复原的方法对图像进行处理。 clear; %清除变量 d=15 %设定长度

图像预处理流程

图像预处理流程: 系统功能的实现方法 系统功能的实现主要依靠图像处理技术,按照上面的流程一一实现,每一部分的具体步骤如下: 1原始图像:由数码相机或其它扫描装置拍摄到的图像; 2预处理:对采集到的图像进行灰度化、图像增强,滤波、二值化等处理以克服图像干扰; 3字轮定位:用图像剪切的方法获取仪表字轮; 4字符分割:利用字符轮廓凹凸检测定位分割方法得到单个的字符; 5字符识别:利用模板匹配的方法与数据库中的字符进行匹配从而确认出字符,得到最后的仪表示数。 2.3.1 MATLA B简介 MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB 和Simulink两大部分。 MATLAB是矩阵实验室(Matrix Laboratory)的简称,和Mathematica、Maple 并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。 MATLAB的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完相同的事情简捷得多,并且mathwork也吸收了像Maple等软件的优点,使MATLAB成为一个强大的数学软件。在新的版本中也加入了对C,FORTRAN,C++ ,JAVA的支持。可以

直接调用,用户也可以将自己编写的实用程序导入到MATLAB函数库中方便自己以后调用,此外许多的MATLAB爱好者都编写了一些经典的程序,用户可以直接进行下载就可以用。 2.3.2 MATLAB的优势和特点 1、MATLAB的优势 (1)友好的工作平台和编程环境 MATLAB由一系列工具组成。这些工具方便用户使用MATLAB的函数和文件,其中许多工具采用的是图形用户界面。包括MATLAB桌面和命令窗口、历史命令窗口、编辑器和调试器、路径搜索和用于用户浏览帮助、工作空间、文件的浏览器。随着MATLAB的商业化以及软件本身的不断升级,MATLAB的用户界面也越来越精致,更加接近Windows的标准界面,人机交互性更强,操作更简单。而且新版本的MATLAB提供了完整的联机查询、帮助系统,极大的方便了用户的使用。简单的编程环境提供了比较完备的调试系统,程序不必经过编译就可以直接运行,而且能够及时地报告出现的错误及进行出错原因分析。 (2)简单易用的程序语言 MATLAB是一种高级的矩阵/阵列语言,它包含控制语句、函数、数据结构、输入和输出和面向对象编程特点。用户可以在命令窗口中将输入语句与执行命令同步,也可以先编写好一个较大的复杂的应用程序(M文件)后再一起运行。新版本的MATLAB语言是基于最为流行的C++语言基础上的,因此语法特征与C++语言极为相似,而且更加简单,更加符合科技人员对数学表达式的书写格式。使之更利于非计算机专业的科技人员使用。而且这种语言可移植性好、可拓展性极强,这也是MATLAB能够深入到科学研究及工程计算各个领域的重要原因。 (3)强大的科学计算机数据处理能力 MATLAB是一个包含大量计算算法的集合。其拥有600多个工程中要用到的数学运算函数,可以方便的实现用户所需的各种计算功能。函数中所使用的算法都是科研和工程计算中的最新研究成果,而前经过了各种优化和容错处理。在通常情况下,可以用它来代替底层编程语言,如C和C++ 。在计算要求相同的情况下,使用MATLAB的编程工作量会大大减少。MATLAB的这些函数集包括从最简单最基本的函数到诸如矩阵,特征向量、快速傅立叶变换的复杂函数。函数所能解决的问题其大致包括矩阵运算和线性方程组的求解、微分方程及偏微分方程的组的求解、符号运算、

虹膜识别算法研究及实现

摘要 在当今信息化时代,如何精确鉴定个人的真实身份、保护信息安全,已成为一个急待解决的关键性问题。传统的身份认证极易伪造和丢失,难以满足急速发展的社会需求,目前最为便捷、安全的解决方案就是生物体识别技术。它不仅简洁快速,而且安全、可靠、准确。同时更易于配合网络和安全、监控、管理系统整合,实现自动便捷管理。虹膜识别是一种基于人体生理特征的生物体特征识别技术,与人体纹理、掌纹、脸相、音频、步频、血液等特征识别相比,具有唯一、高稳定、识别率高、检测方便等优点,因此虹膜识别技术己成为当前身份鉴别研究的热门领域。 本论文详细阐述了虹膜识别技术的研究背景和现状、虹膜生理结构和虹膜识别系统的构成。较深入的研究了虹膜识别算法,实现了三个步骤,即虹膜数字图像预处理、特征码提取和模式匹配。本论文的研究工作主要集中在对虹膜数字图像预处理的归一化和模式匹配两方面的研究。 在虹膜数字图像预处理的归一化过程中,采用一种基于Dangman橡皮片的辐射线段的归一化方式,将环型区域改变成为矩形区域。这种方式采用若千条线段表示两个非同心圆周之间的区域,只要设定这些线段上的点数就可以起到很好的归一化成果,并且仅出一种分析模型。更加定位搜索的效率,节约时间,简化定位的过程。采取Hough变换算子对虹膜进行精定位。 在特征提取及编码匹配过程中,本论文首先将归一化后的2D虹膜数字图像转换为1D灰度信号,从而减小了运算量;然后运用1D Gabor小波对构造的1D 灰度信号进行分析,选取一定尺度上的小波变换结果进行量化,生成二进制的特征向量,从而提高了虹膜识别技术的效率;最后通过改进的Hamming距离移位匹配,实现了识别中的旋转不可逆性。 本论文通过使用中科院自动化研究所的虹膜数据库(CASIA-IRISV1)的虹膜数字图像进行实验。经过一定工作量的科学实验对这一算法进行了验证。实验结果:本论文选取的CASIA-a中心波长为20像素效果最好。最好的模板大小为

相关文档
最新文档