图像局部熵用于小目标检测

图像局部熵用于小目标检测
图像局部熵用于小目标检测

图像局部熵用于小目标检测

摘要

分析了局部熵用于小目标检测时造成目标范围扩散等问题的原因,并提出了熵增长方法。该方法用于点目标检测可避免发生目标范围扩散现象。由于边缘纹理和点目标在熵增长处理过程中表现出截然相反的属性,故可避免边缘纹理对于小目标检测产生的严重干扰。该方法也可用于不受噪声干扰的边缘检测。针对相同信噪比目标在不同背景亮度中具有不同熵值和增长量的问题,提出用方差增长替代熵增长,使相同信噪比目标在不同背景亮度中表现出相同的增长量值,降低了后续目标分割的难度。试验表明,熵增长方法和方差增长方法能够有效检测1或2像素大小的点目标,并不受背景中边缘纹理的干扰。对算法的复杂度进行了分析,并提出采用双通道并行流水线方式实现工程化的设计思路。

关键词:小目标检测;背景抑制;局部熵;熵增长

0 引言

自信息熵的概念引入图像处理以来,在图像恢复边缘检测、目标检测和图像匹配等领域已得到广泛应用。利用小目标的存在将引起图像局部熵产生较大变化这一特性,局部熵方法也被用于红外图像中的小目标检测。但该算法在实际应用还存在目标范围扩散背景边缘纹理干扰严重、熵值大小受背景亮度制约等诸多问题。本文对这些问题进行了逐一分析,并提出相应的解决方法。

1 图像熵值计算方法演变

信息论中,Shannon 用事件发生概率的倒数来表示该事件的信息。如系统某一状态i(i=0,1,k,n)发生的概率为p i,则该状态具备的信息可描述为

?I(p i) =log(p i?1)=-log(p i) (1)

n

=1 0≤p i≤1 (2)

p i

i=0

n

log p i (3)

H=E?I=?p

i

i=0

在此,Shannon熵关于信息量的定义不是对于所有状态都存在,由式(1)知

?I P i=1=0

P i→0,?I P i→∞

(4)

P i=0,?I P i无定义

为此,PAL N R 和PAL S K 重新定义了指数形式的信息熵 ,用式(5) 所示的指数关系式计算某一状态的信息量

?I p i=exp?(1?p i)(5)

n

H=E?I=p i

log p i (6)

i=0

式中,ΔI ( pi ) 在区间[ 0 ,1 ]所有的点都存在且连续;ΔI ( pi = 0) = K1 , K1 ≥0 为有限值;ΔI ( pi = 1) = K2 ,0 ≤K2 < K1 ;随着pi 的增大,ΔI ( pi ) 按指数规律减小。SHIOZA KI 提出以SHANNON 熵的定义来计

算图像的熵。设图像中像素( i , j) 的灰度值为f 0 ,它的某种邻域内的像素的灰度值分别为: f 1 , f 2 , ?,f i , ?, f n . 这n + 1 个像素构成一局部图像窗口, 其熵按式(3) 计算,但其中的pi 被定义为窗口中某一像素灰度与窗口中各像素灰度之和的比值

p i=f i/f j (7)

n

j=0

文献[ 6 ]利用局部熵进行红外图象中的小目标检测时将熵值计算简化为

H≈1?p i2

n

i=0 (8)

为简化计算并方便说明问题,引入

H g=1?H=p i2

n

i=0 (9)

H g 具有如下性质:在图像灰度相对均匀的位置,有较小值;在图像灰度离散性较大的地方有较大值;其值的大小虽反映了图像灰度的离散程度,但和“熵”的原始性质刚好相反,为表述方便仍称其为“局部熵".

2 局部熵增长抑制点目标扩散

按SHIOZA KI 图像局部熵计算方法以及文献[6 ]的小目标检测算法,在进行背景抑制和小目标检测时会产生目标范围的扩散1 为简化问题,设在一均匀背景中有一孤立点目标如图1 (a) ,按照文献[6 ]的算法取3 ×3 小邻域计算后的熵值图如图1(b)。显然,熵值图中目标范围发生了扩散,除目标点的真正位置外,与其相邻的位置都表现出相同的熵值;为此,要确定目标的真正位置,需在后续阶段进行熵值图的细化等形态学处理,使处理过程复杂化且与目标检测的实时性需求相悖。

2. 1 局部熵增长算法

局部熵算法进行小目标检测之所以出现目标范围的扩散,原因在于在3 ×3

小邻域范围内计算局部熵时,并没有考虑真正引起局部熵值变化的点的位置。如图2 ,假设目标处于位置0 ,而背景为均匀背景,此时因为目标点不但处于

以自己为中心的3 ×3区域,同时也处于位置1 ?8 的3 ×3 小邻域范围内,

按照文献[ 6 ]的处理方法,自然在位置0 ?8 处有相同的局部熵值。

现在,将图像中某3 ×3 小邻域范围内(9 像素点) 的局部熵值计为H9 ;

而如果去掉中心点,以该中心点的邻域点(图2 中位置1 ?8) 组成一个新的

局部图(8 像素点) ,可计算出一个新的局部熵值并计为H8 ,定义

H z=H9?H8 (10)

为该中心点引起该局域范围熵值的增长幅度,简称为该中心点的“熵增长”. 相类似,如需要也可以定义5 ×5 邻域范围的"熵增长"。

设在均匀背景下,3 ×3 范围的局部熵值为H b ,如果没有目标存在,则显然H9 ≈H8 , 则有Hz ≈0 ;如计算域中心为目标点,则3 ×3 范围内由于目标点的出现离散度增加,而如果去掉该中心点,则其8 邻域的灰度值相近离散度降低. 由上面H g 的性质可知H9 > H8 ,则局部熵增长Hz > 0 ;如计算域中心为背景点,而目标点只是出现在该中心点的8 邻域范围内(图2 中位置1 ?8) ,此时虽9 点局部图像和8点局部图像局部熵值都较没有目标点存在时的熵值大,但是由于此时H9 ≈H8 , 则同样有Hz ≈0。可见,采用局部熵增长计算方法只有当局部计算范围的中心为目标点时,才有较大熵增长量值;而当计算区域为背景区,或是有点目标存在但目标点不是计算区域的中心点时,局部熵增长基本为0。故可有效杜绝目标范围发生扩散,直接得到目标点准确位置,也就不再需要进行后续形态学处理等运算过程。

2. 2 归一化局部熵

局部熵增长计算过程中,用到了9 点局部熵和8 点局部熵进行比较,组成局部元素的数目对于局

部熵值会产生影响。

假设一种极限情况:组成局部图像各元素的量值均相同1 此时, H 具有最大值,而H g 具有最小值。分别由式(3) 和式(9) 有,在pi 相等的情况下

H=log n+1, H g=

1

n+1

(11)

显然,无论按照那种方式计算,熵的大小,均与组成局部图像元素的数目有关,故需对其进行归一化处

理。

对于式(3) 可以证明

0≤H≤log n+1 (12)

而对于式(9) 可以证明

(n+1)?1≤H g≤1 (13)

可分别通过式(14) 、(15) 对H 和H g 进行归一化处理。归一化处理后的熵值,不再与组成样本元素的

数目相关, 进而可用作式( 10) 中进行熵增长的计算。

H g=H g?

1

n+1

×

n+1

n

=

n+1H g?1

n

(15)

2. 3 局部熵增长抑制目标范围扩散效果

利用计算局部熵增长方法进行点目标检测的过程可归纳为:

1) 选定局域范围大小,一般为3 ×3 (或5 ×5) 大小; 2) 按照式(3)

或式(9) 计算全局域的熵值H9 ;并按照式(14) 或式(15) 对其进行归一化;3) 按照式(3)或式(9) 计算局域中去掉中心点后的局部熵值H8 ;并按照式(14)

或式(15) 对其进行归一化;4) 按照式(10) 计算中心点作用于该局域范围时

的熵增长;5)进行后续阈值分割和航迹确认处理。

对图1 (a) 进行熵增长处理的结果如图3 ,相比较图1 (b) 明显发现其熵

增长的峰值点就是目标点的位置,没有出现目标范围扩散的现象。

3 区分小目标与边缘纹理

小目标检测过程中,背景物边缘纹理的影响一直是一个突出的问题1 因为边

缘纹理在空间上表现出与小目标相类似的高频特性,已报道的各种背景抑制

方法均不能将此二者区分开来,只能在背景抑制处理之后,再按照边缘纹理和

小目标在空间形态上的差异进行形态学处理和区分,进一步将边缘纹理滤除掉。局部熵处理方法具有背景抑制作用,但同样不能区分边缘纹理和小目标。

假设场景中有一边缘纹理和点目标如图4 (a) , 图4 (b) 为普通高通滤

波处理结果,图4 (c) 为局部熵

处理结果。

可以看到普通高通滤波和局部熵处理后,边缘纹理和目标均凸现出来,必须进行后续处理才能将目标点从强边缘纹理的干扰中分离出来。但如果采用局部熵增长方法对其进行处理,结果如图4 (d)。

可以发现:边缘纹理和小目标经局部熵增长处理后,表现出截然相

反的特性1点目标的局部熵增长量为正值,而边缘纹理的局部熵增长

量为负值。分析产生此现象的原因:边缘点可以看作是从背景向景

物的过渡点,其量值必将处于背景和景物像素量值之间. 此时,如果

进行局部熵增长计算的局域范围的中心点是边缘点,则在局域范围

去掉该中心点后(8 点局域图像) ,由于少了一个中间过渡量值的平

滑作用,其它元素(包括背景像素和景物像素) 量值的离散度将增加. 同样,当计算该局域全部元素(9 点局域图像) 的局部熵时,由于该

边缘元素的过渡平滑作用,局域整体的离散度相对前者将减小。故

进行局部熵增长处理后,边缘像素处将出现负值。对于如图4 (a)

所示的锐变边缘,其边缘像素量值与背景或景物像素量值相等,上述

规律仍然成立。

相反,对于孤立的点目标,其局部熵增长处理的结果一定表现为

正值。故采用局部熵增长处理,可在检测出点目标的同时,能够有效

分离出边缘纹理,在提高检测效率的同时,相应提高了检测的准确性。

反过来看,此结果亦可应用于进行景物的边缘检测。文献[2 ]在

将局部熵方法用于边缘检测时,为了抑制噪声的干扰而采用了繁琐

的处理方法,且检测效果还需在人工干预的情况下完成1 如采用本

文提出的局部熵增长处理方法,由于噪声和边缘纹理会表现出截然

相反的属性,则可有效排除噪声对于边缘纹理检测的影响。

同时,在3 ×3 小邻域范围内,如果目标大小≥3个像素,则熵增

长量将表现出类似于边缘点的属性,故局部熵增长方法仅对1 或2

个像素大小的点目标有较好的检测效果。

4 背景亮度无关的点目标检测

用局部熵增长计算方法进行点目标检测时发现,在进行局部熵增长的计算过程当中,即便对于同一离散度区域,图像局部熵量值的大小会随着背景平均亮度的变化而变化,有时甚至会出现数量级的变化。

图5 (a) 为两个具有相同信噪比的目标处于不同亮度的背景当中;图5 ( b) 为对应的熵值图;图5(c) 为其熵增长图1 可以看到,相同信噪比的目标在不同背景中的熵增长量值不同,而图5 (b) 可以证明这种差异是由于局部熵在不同亮度背景表现出不同的大小所造成的。

对于具有相同信噪比的目标,最好能用相同的分割阈值将其从背景中分割出来。而局部熵在不同背景亮度下表现出来的这种性质,将对其后进行分割时阈值的选取造成困难1 也就是说如果视场范围内场景的背景亮度一致,则经局部熵增长处理后,可选取统一的阈值进行分割;而如果场景中存在不同亮度的背景,则单一阈值要么使高亮度背景中的目标被漏分割造成漏警,或使低亮度背景中的噪声被误分割造成虚警。

考虑小目标的检测是利用了局部图像离散度的不同,同时希望能够做到与背景亮度(平均值) 大小无关;而式(3) 或式(9) 定义的局部熵虽能够反映局部图像量值的离散度,但其计算结果的大小受背景亮度影响较大。为此,须寻找或定义一种既具备熵值的特性、又与背景量值大小无关的量来进行类似熵增长的计算,则既能够具备熵增长计算的优越性,又能够保证相同信噪比的目标经处理后具备相同的幅值,保证后续分割的准确性。

在随机过程的数字特征描述中,方差是描述样本偏离其平均值程度的量,也可以理解为描述了该样本的离散程度,但其量值的大小却与样本平均值的大小无关。方差的这种特性使其正好可以被用来作为熵增长计算过程中熵的替代量。则进行目标检测的过程转化为:

1) 选定局域范围大小,一般为3 ×3 (或5 ×5) 大小;2) 按照式(16) 计算全局域的方差δ9 ;3) 按照式(16) 计算局域中去掉中心点后的方差δ8 ;

4) 按照式(17) 计算中心点作用于该局域范围时方差的增长量;5) 进行后续阈值分割和航迹确认处理。

n

M=1/(n+1)f i (16 a)

i=0

n

δ=1/(n+1) (f i?M)2 (16 b)

i=0

δz=δ9?δ817

图6 为用方差增长量对图5 (a) 进行处理后的结果。比较图5 (c) 可以看到:方差增长的计算结果除保留了对于点目标的突现、边缘表现出与点目标相反的性质等特性外,对于相同信噪比的目标,其处理后也具有相同的量值,表现出与背景亮度无关的优良特性。

(完整版)信息熵在图像处理特别是图像分割和图像配准中的应用——信息与计算科学毕业设计

摘要 信息论是人们在长期通信实践活动中,由通信技术与概率论、随机过程、数理统计等学科相结合而逐步发展起来的一门新兴交叉学科。而熵是信息论中事件出现概率的不确定性的量度,能有效反映事件包含的信息。随着科学技术,特别是信息技术的迅猛发展,信息理论在通信领域中发挥了越来越重要的作用,由于信息理论解决问题的思路和方法独特、新颖和有效,信息论已渗透到其他科学领域。随着计算机技术和数学理论的不断发展,人工智能、神经网络、遗传算法、模糊理论的不断完善,信息理论的应用越来越广泛。在图像处理研究中,信息熵也越来越受到关注。为了寻找快速有效的图像处理方法,信息理论越来越多地渗透到图像处理技术中。本文通过进一步探讨概论率中熵的概念,分析其在图像处理中的应用,通过概念的分析理解,详细讨论其在图像处理的各个方面:如图像分割、图像配准、人脸识别,特征检测等的应用。 本文介绍了信息熵在图像处理中的应用,总结了一些基于熵的基本概念,互信息的定义。并给出了信息熵在图像处理特别是图像分割和图像配准中的应用,最后实现了信息熵在图像配准中的方法。 关键词:信息熵,互信息,图像分割,图像配准

Abstract Information theory is a new interdisciplinary subject developed in people long-term communication practice, combining with communication technology, theory of probability, stochastic processes, and mathematical statistics. Entropy is a measure of the uncertainty the probability of the occurrence of the event in the information theory, it can effectively reflect the information event contains. With the development of science and technology, especially the rapid development of information technology, information theory has played a more and more important role in the communication field, because the ideas and methods to solve the problem of information theory is unique, novel and effective, information theory has penetrated into other areas of science. With the development of computer technology and mathematical theory, continuous improvement of artificial intelligence, neural network, genetic algorithm, fuzzy theory, there are more and more extensive applications of information theory. In the research of image processing, the information entropy has attracted more and more attention. In

图像定位及跟踪技术大解析

图像定位及跟踪技术大解析 在科学技术日新月异的今天,人们对机器设备的智能性、自主性要求也越来越高,希望其完全替代人的角色,把人们从繁重、危险的工作任务中解脱出来,而能否像人一样具有感知周围环境的能力已成为设备实现智能化自主化的关键。 广义的“图像跟踪”技术,是指通过某种方式(如图像识别、红外、超声波等)将摄像头中拍摄到的物体进行定位,并指挥摄像头对该物体进行跟踪,让该物体一直被保持在摄像头视野范围内。狭义的“图像跟踪”技术就是我们日常所常谈到的,通过“图像识别”的方式来进行跟踪和拍摄。 因为红外、超声波等方式,都受环境的影响,而且要专门的识别辅助设备,在实际应用中已经逐步被“图像识别”技术所替代。“图像识别”是直接利用了摄像头拍摄到的图像,进行NCAST图像差分及聚类运算,识别到目标物体的位置,并指挥摄像头对该物体进行跟踪。 图像跟踪系统采用特有的NCAST目标外形特征检测方法,被跟踪者无需任何辅助设备,只要进入跟踪区域,系统便可对目标进行锁定跟踪,使摄像机画面以锁定的目标为中心,并控制摄像机进行相应策略的缩放。系统支持多种自定义策略,支持多级特写模式,适应性强,不受强光、声音、电磁等环境影响。 目标物体的边缘检测 物体的形状特征在大多数情况下变化不多,基于目标形状轮廓的跟踪方法与基于区域的匹配方法相比,可以更精确的分割目标。 边缘是运动目标的最基本特征,表现在图像中就是指目标周围图像灰度有阶跃变化或屋顶变化的那些像素集合,它是图像中局部亮度变化最显著的部分。 边缘检测就是采用某种算法来定位灰度不连续变化的位置,从而图像中目标与背景的交界线。图像的灰度变化可以用灰度梯度来表示。

关于三维图像目标识别文献综述

关于三维目标识别的文献综述 前言: 随着计算机技术和现代信息处理技术的快速发展,目标识别已经迅速发展成为一种重要的工具与手段,目标识别是指一个特殊目标(或一种类型的目标)从其它目标(或其它类型的目标)中被区分出来的过程。它既包括两个非常相似目标的识别,也包括一种类型的目标同其他类型目标的识别。目标识别的基本原理是利用雷达回波中的幅度、相位、频谱和极化等目标特征信息,通过数学上的各种多维空间变换来估算目标的大小、形状、重量和表面层的物理特性参数,最后根据大量训练样本所确定的鉴别函数,在分类器中进行识别判决。它属于模式识别的范畴,也可以狭义的理解为图像识别。三维目标识别是以物体表面朝向的三维信息来识别完整的三维物体模型目标识别需要综合运用计算机科学、模式识别、机器视觉以及图像理解等学科知识。目标识别技术已广泛应用于国民经济、空间技术和国防等领域。 正文: 图像识别总的来说主要包括目标图像特征提取和分类两个方面。但是一般情况下,图像受各种因素影响,与真实物体有较大的差别,这样,就需要经过预处理、图像分割、特征提取、分析、匹配识别等一系列过程才能完成整个识别过程。 目前,最主流的三种三维物体识别研究思路是: 1)基于模型或几何的方法;

2)基于外观或视图的方法; 3)基于局部特征匹配的方法; 一、基于模型或几何的方法: 这种方法所识别的目标是已知的,原理就是利用传感器获得真实目标的三维信息并对信息进行分析处理,得到一种表面、边界及连接关系的描述,这里,三维物体识别中有两类最经常使用的传感器:灰度传感器和深度传感器,前者获取图像的每个像素点对应于一个亮度测量,而后者对应于从传感器到可视物体表面的距离;另一方面,利用CAD建立目标的几何模型,对模型的表面、边界及连接关系进行完整的描述。然后把这两种描述加以匹配就可以来识别三维物体。其流程如下图所示: 传感器数据获取过程,就是从现实生活中的真实物体中产生待识别的模型。分析/建模过程,是对传感器数据进行处理,从中提取与目标有关的独立应用特征。模型库的建立一般式在识别过程之前,即首先根据物体的某些特定特征建立一些关系以及将这些信息汇总成一个库。在模型匹配过程,系统通过从图像中抽取出的物体关系属性图,把物体描述与模型描述通过某种匹配算法进行比较、分析,最终得到与物体最相似的一种描述,从而确定物体的类型和空间位置。 基于模型的三维物体识别,需要着重解决以下4个问题:

实验一 灰度图像信息熵的相关计算与分析

实验一 灰度图像信息熵的相关计算与分析

一、实验目的 1、复习信息熵,条件熵,联合熵,互信息,相对熵的基本定义, 掌握其计算方法,学习互信息与相对熵的区别之处并比较两者的有效性,加深对所学理论理论知识的理解。 2、掌握图像的的基本处理方法,了解图像的编码原理。 3、学习使用matlab ,掌握matlab 的编程。 4、通过对比分析,。在解决问题的过程中,锻炼自身对问题的研究能力。 二、实验内容与要求 1、计算灰度图像的信息熵,条件熵,联合熵,互信息,相对熵,并比较互信息和相对熵在判别两幅图像的联系与区别。 2、利用matlab 编程计算,并书写完整实验报告。 三、实验原理 1、信息熵 离散随机变量X 的熵H(X)为: ()()log () x H X p x p x χ ∈=-∑ 图像熵是一种特征的统计形式,它反映了图像中平均信息量的多少。图像的一 维熵表示图像中灰度分布的聚集特征所包含的信息量,将图像的灰度值进行数学统计,便可得到每个灰度值出现的次数及概率,则定义灰度图像的一元灰度熵为: 255 log i i i H p p ==-∑ 利用信息熵的计算公式便可计算图像的信息熵,求出任意一个离散信源的熵(平均自信息量)。自信息是一个随机变量,它是指某一信源发出某一消息所含有的信息量。所发出的消息不同,它们所含有的信息量也就不同。任何一个消息的自信息量都代表不了信源所包含的平均自信息量。 信息熵的意义:信源的信息熵H 是从整个信源的统计特性来考虑的。它是从平均意义上来表征信源的总体特性的。对于某特定的信源,其信息熵只有一个。不同的信源因统计特性不同,其熵也不同。 图像的一维熵可以表示图像灰度分布的聚集特征,却不能反映图像灰度分布的空间特征,为了表征这种空间特征,可以在一维熵的基础上引入能够反映灰度分布空间特征的特征量来组成图像的二维熵。选择图像的邻域灰度均值作为灰度分布的空间特征量,与图像的像素灰度组成特征二元组,记为( i, j ),其中i 表示像素的灰度值(0255)i ≤≤,j 表示邻域灰度(0255)j ≤≤, 2 (,)/ij P f i j N =

实验一-信息熵与图像熵计算-正确

实验一信息熵与图像熵计算(2 学时) 一、实验目的 1.复习MATLAB的基本命令,熟悉MATLAB下的基本函数; 2.复习信息熵基本定义,能够自学图像熵定义和基本概念。 二、实验内容 1.能够写出MATLAB源代码,求信源的信息熵; 2.根据图像熵基本知识,综合设计出MATLAB程序,求出给定图像的图像熵。 三、实验仪器、设备 1.计算机-系统最低配置256M内存、P4 CPU; 2.MATLAB编程软件。 四实验流程图 五实验数据及结果分析

四、实验原理 1.MATLAB中数据类型、矩阵运算、图像文件输入与输出知识复习。 2.利用信息论中信息熵概念,求出任意一个离散信源的熵(平均自信息量)。自信息是一个随机变量,它是指某一信源发出某一消息所含有的信息量。所发出的消息不同,它们所含有的信息量也就不同。任何一个消息的自信息量都代表不了信源所包含的平均自信息量。不能作为整个信源的信息测度,因此定义自信息量的数学期望为信源的平均自信息量: 1( ) 1 ( ) [log ] ( ) log ( ) i n i i p a i H E p a p a X 信息熵的意义:信源的信息熵H是从整个信源的统计特性来考虑的。它是从平均意

义上来表征信源的总体特性的。对于某特定的信源,其信息熵只有一个。不同的信源因统计特性不同,其熵也不同。 3.学习图像熵基本概念,能够求出图像一维熵和二维熵。 图像熵是一种特征的统计形式,它反映了图像中平均信息量的多少。图像的一维熵表示图像中灰度分布的聚集特征所包含的信息量,令Pi表示图像中灰度值为i的像素所占的比例,则定义灰度图像的一元灰度熵为: 2550 log i i i p p H 图像的一维熵可以表示图像灰度分布的聚集特征,却不能反映图像灰度分布的空间特征,为了表征这种空间特征,可以在一维熵的基础上引入能够反映灰度分布空间特征的特征量来组成图像的二维熵。选择图像的邻域灰度均值作为灰度2

基于深度学习的图像目标定位识别研究

基于深度学习的图像目标定位识别研究 科学技术的发展是推动人类社会进步的主要原因之一,未来社会进一步地朝着科技化、信息化、智能化的方向前进。在信息大爆炸的今天,充分利用这些信息将有助于社会的现代化建设,这其中图像信息是目前人们生活中最常见的信息。 利用这些图像信息的一种重要方法就是图像目标定位识别技术。不管是视频监控领域还是虚拟现实技术等都对图像的识别有着极大的需求。 一般的图像目标定位识别系统包括图像分割、目标关键特征提取、目标类别分类三个步骤。在研究课题相关背景和意义之后,本文对上述三个步骤涉及到的技术进行了调研。 深度学习理论由Hinton教授提出之后得到学术界的普遍关注。越来越多的学者尝试用深度学习理论去解决图像识别技术中碰到的问题。 深度学习理论包含诸多的模型,不同的模型各自的应用领域也不相同。这其中卷积神经网络(CNN)模型是最常用于图像处理的模型。 相比较传统的人工神经网络模型,卷积神经网络拥有更多的隐藏层,其特有 的卷积和池化操作对图像地处理有着较高的效率。本文在分析了CNN模型对图像特征的表达特性之后,搭建了一个CNN网络模型,该模型在传统的VGG模型的基础上加以改进,统一了图像分割、目标特征提取和目标分类三个过程,改进后的模型称为N-VGG。 本文的创新点之一是研究学习了基于估计目标网络(RPN)的图像分割技术, 提出了改进策略以提升RPN网络的性能,改进后的图像分割模块称之为IRPN。最终将IRPN网络应用到本课题构建的N-VGG模型中。 同时分析了传统的卷积神经网络模型中应用的激活函数,最终在N-VGG网络

模型中引入了新的激活函数:指数线性单元(ELU)。另外在N-VGG网络模型中引入了空间金字塔池化技术(SPP),以提升模型的识别精度。 最后利用第三方开源工具Caffe构建了N-VGG模型,并构建了一个简易的图像目标定位识别系统。最终通过该系统测试本文构建模型的识别效率。 在测试阶段,还单独训练了一个SVM分类器,以对比SVM分类器和softmax 分类器性能。最后本文对在这个课题学习设计的过程中遇到的问题和学习到的经验、方法做了总结,同时对未来在图像目标定位识别领域可以做的改进工作进行了展望。

目标检测综述教学内容

一、传统目标检测方法 如上图所示,传统目标检测的方法一般分为三个阶段:首先在给定的图像上选择一些候选的区域,然后对这些区域提取特征,最后使用训练的分类器进行分类。下面我们对这三个阶段分别进行介绍。 (1) 区域选择这一步是为了对目标的位置进行定位。由于目标可能出现在图像的任何位置,而且目标的大小、长宽比例也不确定,所以最初采用滑动窗口的策略对整幅图像进行遍历,而且需要设置不同的尺度,不同的长宽比。这种穷举的策略虽然包含了目标所有可能出现的位置,但是缺点也是显而易见的:时间复杂度太高,产生冗余窗口太多,这也严重影响后续特征提取和分类的速度和性能。(实际上由于受到时间复杂度的问题,滑动窗口的长宽比一般都是固定的设置几个,所以对于长宽比浮动较大的多类别目标检测,即便是滑动窗口遍历也不能得到很好的区域) (2) 特征提取由于目标的形态多样性,光照变化多样性,背景多样性等因素使得设计一个鲁棒的特征并不是那么容易。然而提取特征的好坏直接影响到分类的准确性。(这个阶段常用的特征有SIFT、HOG等) (3) 分类器主要有SVM, Adaboost等。 总结:传统目标检测存在的两个主要问题: 一是基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余; 二是手工设计的特征对于多样性的变化并没有很好的鲁棒性。 二、基于Region Proposal的深度学习目标检测算法 对于传统目标检测任务存在的两个主要问题,我们该如何解决呢? 对于滑动窗口存在的问题,region proposal提供了很好的解决方案。region

proposal(候选区域)是预先找出图中目标可能出现的位置。但由于region proposal 利用了图像中的纹理、边缘、颜色等信息,可以保证在选取较少窗口(几千个甚至几百个)的情况下保持较高的召回率。这大大降低了后续操作的时间复杂度,并且获取的候选窗口要比滑动窗口的质量更高(滑动窗口固定长宽比)。比较常用的region proposal算法有selective Search和edge Boxes,如果想具体了解region proposal可以看一下PAMI2015的“What makes for effective detection proposals?” 有了候选区域,剩下的工作实际就是对候选区域进行图像分类的工作(特征提取+分类)。对于图像分类,不得不提的是2012年ImageNet大规模视觉识别挑战赛(ILSVRC)上,机器学习泰斗Geoffrey Hinton教授带领学生Krizhevsky使用卷积神经网络将ILSVRC分类任务的Top-5 error降低到了15.3%,而使用传统方法的第二名top-5 error高达26.2%。此后,卷积神经网络占据了图像分类任务的绝对统治地位,微软最新的ResNet和谷歌的Inception V4模型的top-5 error降到了4%以内多,这已经超越人在这个特定任务上的能力。所以目标检测得到候选区域后使用CNN对其进行图像分类是一个不错的选择。 2014年,RBG(Ross B. Girshick)大神使用region proposal+CNN代替传统目标检测使用的滑动窗口+手工设计特征,设计了R-CNN框架,使得目标检测取得巨大突破,并开启了基于深度学习目标检测的热潮。 1. R-CNN (CVPR2014, TPAMI2015) (Region-based Convolution Networks for Accurate Object d etection and Segmentation)

信息熵

信息熵在遥感影像中的应用 所谓信息熵,是一个数学上颇为抽象的概念,我们不妨把信息熵理解成某种特定信息的出现概率。信源各个离散消息的自信息量得数学期望(即概率加权的统计平均值)为信源的平均信息量,一般称为信息源,也叫信源熵或香农熵,有时称为无条件熵或熵函数,简称熵。 一般而言,当一种信息出现概率更高的时候,表明它被传播得更广泛,或者说,被引用的程度更高。我们可以认为,从信息传播的角度来看,信息熵可以表示信息的价值。这样子我们就有一个衡量信息价值高低的标准,可以做出关于知识流通问题的更多推论。 利用信息论中的熵模型,计算信息量是一种经典的方法,广泛应用于土地管理,城市扩张以及其他领域。熵值可以定量的反应信息的分散程度,将其应用于遥感图像的解译中可以定量的描述影像包含的信息量,从而为基于影像的研究提供科学的依据。利用信息熵方法对遥感影像的光谱特征进行离散化,根据信息熵的准则函数,寻找断点,对属性进行区间分割,以提高数据处理效率。 遥感影像熵值计算大致流程为:遥感影像数据经过图像预处理之后,进行一系列图像配准、校正,图像增强,去除噪声、条带后,进行图像的分类,然后根据研究区域进行数据的提取,结合一些辅助数据对图像进行监督分类后生成新的图像,将新的图像与研究区边界图和方格图生成的熵单元图进行进一步的融合便可得到熵分值图。 1.获得研究区遥感影像 以研究区南京市的2009 年6 月的中巴资源二号卫星分辨率20 米得影像为例,影像是有三幅拼接完成。通过ArGIS9.2 中的选择工具从全国的行政区域图中提取边界矢量图,再通过掩膜工具获得研究区的影像。分辨率的为90 米得DEM 图有两副影像拼接而得,操作的步骤与获取影像一致,为开展目视解译工作提供参考。然后依照相关学者的相关研究以及城市建设中的一些法律法规,参照分类标准,开展影像解译工作,对于中巴资源二号影像开展监督分类,以及开展目视解译工作。 2.二值图像的建立 将两种解译所得的图像按照一定的标准转化为城镇用地和非城镇用地两种,进一步计算二值图像的熵值。 3.熵值单元图 根据一些学者对城市边缘带的研究,其划分的熵值单元为 1 km ×1 km,针对样 区的具体情况,采用500 m ×500 m 的熵值单元。在ERDAS 软件和

遥感图像处理及其在军事目标定位中的应用

多媒体技术及其应用 本栏目责任编辑:李桂瑾 1前言 随着科技的不断进步,遥感工具的使用越来越频繁,人们能够从高空以及太空中来观察人类居住的地球,也能够利用获得的遥感图像进行一系列研究和探索。现已应用于农林业、测绘、地质勘探、水利、气象、环境保护以及军事等部门,并取得了很好的效益。 军事目标是一项特殊的研究内容,如何充分利用遥感图像资料来分析和定位军事目标是需要解决的主要问题。遥感图像资料主要来自遥感卫星以及侦察飞机拍摄的影像资料,本文主要研究利用无人侦察飞机拍摄的影像资料对军事目标进行定位的问题。 2遥感图像处理技术概论 遥感图像处理是遥感技术的一个重要环节,它直接影响到遥感信息的增强提取和分析应用效果。 遥感图像处理技术一般可以分为两大类。一是光学处理技术,它可以分为机械光学和光化学处理两种方法,机械光学又称电子光学或物理光学,主要是利用相干光光源作图像处理,譬如密度分割、位相交换、等照度变换等内容;光化学处理是依据摄影光化学原理,利用非相干光光源,即普通暗房摄影处理方法进行图像处理,它可以进行图像镶嵌、图像增强(包括反差调整、彩色 增强、比值处理、边缘增强、黑白发色等)、 图像密度分割、假彩色合成以及信息复合处理等;二是计算机数字图像处理技术,它可以精确地进行几何定位与几何校正,还可以多功能地进行图像镶 嵌、图像增强(包括线性变换、 直方图均衡、彩色增强、比值处理等等)、 图像分类、图像统计分析、多波段图像组合以及信息复合处理等。这些处理结果在地表环境要素不太复杂的情况下,完全可以定量化精确分析,应用效果比较好。这里,我们主要就数字图像处理中的几何校正等方面进行研究与分析。 除此之外,遥感图像处理技术开始进行信息复合的研究应用工作。这种处理技术主要是综合使用现有的遥感资料,挖掘遥感资料所提供的全部信息。其作用是能够进行地物信息的验证、补充与更新,提高了遥感信息的实用价值。因此可以说,信息复合处理技术实际上是建立遥感资料信息库的有效方法之一。 3目标定位方法 传统的对计划外目标定位主要依靠人工现地判定,不仅精度得不到保证,而且作业时间一般来说较长。随着科技的不断发展,越来越多的遥感卫星运用到军事中,使目标定位有了更进一步的发展。但现阶段这些高技术定位装备只能保障战略、战役目标的 定位,对一般战斗中出现的目标还不能达到及时精确的保障。因 此,利用低空无人侦察机的遥感图像信息来对作战中出现的目标进行定位,是很有研究价值的。 3.1图像信息的获取 图像信息获取过程工作原理为接收天线收到“无人机”发出的侦察图像信号后,经高频电路送下变频电路进行信息处理,输出中频信号,经调制跟踪环解调,经7M低通滤波器提纯出视频信号,经视频放大和去加重电路后送往视频分配器分为两路标准视频信号,计算机便可将得到的图像实时记录并显示。 信息接收系统设计主要采用了图像同步跟踪和存储技术。信息接收系统接收到“无人机”发射的视频图像后,利用图像采集软件通过视频信息采集卡截取“无人机”获取的战场视频图像,整个过程将采用多线程操作方式处理视频图像的采集与存储的接收事件。线程之间同步协调则以二进制形式融合将图像文件进行同步存储,以便于利用其对图像信息进行进一步的处理。 3.2“ 三点”匹配定位方法应当指出,遥感图像处理技术一般要以常规资料与人为经验结合起来,即指处理人员最好要具备丰富的专业知识,这样才能得到理想的处理结果;同时也要采用多种处理方法的综合研究,才能满足各种专题信息的研究。因此在实际工作中,对一幅遥感图像应当使用哪种方法和哪些技术手段,必须根据应用目的以及现有技术条件的可能来选择,讲究实效,使遥感图像处理技术真正为遥感应用服务。 由于图像信息是通过“无人机”的航拍而获取的,而在“无人 机”拍摄过程中,又可能会受到天气、 战场环境、拍摄区域地形状况、“ 无人机”飞行姿态等一系列因素的影响,通常会导致获取的遥感图像是发生了畸变的倾斜图像。因此,在遥感图像信息处理过程中,关键要实现对倾斜图像的匹配校正。 3.2.1匹配校正方法 在匹配校正过程(也即倾斜图像几何校正的过程)中,由于目标附近GCP信息因受战场环境的影响,获得其信息非常困难,所以匹配过程应该使用尽量少的GCP。我们通过已知目标附近的三个GCP的坐标,将倾斜图像进行几何校正。由于只使用了三个GCP,每个控制点的选取对校正结果的影响都很大,因此控制点一 般选取地面上容易确定的标志物,如交叉路口、 河流的尽头等。此外,控制点的选取应尽可能地分散,若三个GCP在共线,是不能够建立仿射坐标系的。 收稿日期:2007-08-16 作者简介:王楠(1981-),男,重庆人,解放军炮兵学院硕士研究生,研究方向:炮兵武器装备发展论证及效能分析;邓灵博(1983-),男,内蒙古自治区包头人,解放军炮兵学院硕士研究生,研究方向:炮兵武器装备发展论证及效能分析;何洪峰(1981-),男,安徽桐城人,解放军炮兵学院硕士研究生,研究方向:炮兵武器装备发展论证及效能分析。 遥感图像处理及其在军事目标定位中的应用 王楠,邓灵博,何洪峰 (中国人民解放军炮兵学院,安徽合肥230031) 摘要:对遥感图像进行了初步的介绍;提出了一种军事目标定位方法;利用实验对该目标定位方法进行了验证;对其应用前景进行了展望。 关键词:遥感图像处理;匹配校正;目标定位中图分类号:TP391文献标识码:A文章编号:1009-3044(2007)18-31713-02 TheImageofRemoteSensingImageProcessinganditsApplicationinMilitaryGoalLocation WANGNan,DENGLing-bo,HEHong-feng(CollegeofPLAartillery,Hefei230031,China) Abstract:Forremotesensing,imagehascarriedoutpreliminaryintroduction;Haveputforwardakindofmilitarygoallocationmethod;Verifyusingexperimentforthisgoallocationmethod;Foritsapplication,prospectislookedahead. Keywords:TheimageofremoteSensingImageProcessing;Matchtorectify;Goallocation 1713

目标检测方法简要综述

龙源期刊网 https://www.360docs.net/doc/961244540.html, 目标检测方法简要综述 作者:栗佩康袁芳芳李航涛 来源:《科技风》2020年第18期 摘要:目标检测是计算机视觉领域中的重要问题,是人脸识别、车辆检测、路网提取等领域的理论基础。随着深度学习的快速发展,与基于滑窗以手工提取特征做分类的传统目标检测算法相比,基于深度学习的目标检测算法无论在检测精度上还是在时间复杂度上都大大超过了传统算法,本文将简单介绍目标检测算法的发展历程。 关键词:目标检测;机器学习;深度神经网络 目标检测的目的可分为检测图像中感兴趣目标的位置和对感兴趣目标进行分类。目标检测比低阶的分类任务复杂,同时也是高阶图像分割任的重要基础;目标检测也是人脸识别、车辆检测、路网检测等应用领域的理论基础。 传统的目标检测算法是基于滑窗遍历进行区域选择,然后使用HOG、SIFT等特征对滑窗内的图像块进行特征提取,最后使用SVM、AdaBoost等分类器对已提取特征进行分类。手工构建特征较为复杂,检测精度提升有限,基于滑窗的算法计算复杂度较高,此类方法的发展停滞,本文不再展开。近年来,基于深度学习的目标检测算法成为主流,分为两阶段和单阶段两类:两阶段算法先在图像中选取候选区域,然后对候选区域进行目标分类与位置精修;单阶段算法是基于全局做回归分类,直接产生目标物体的位置及类别。单阶段算法更具实时性,但检测精度有损失,下面介绍这两类目标检测算法。 1 基于候选区域的两阶段目标检测方法 率先将深度学习引入目标检测的是Girshick[1]于2014年提出的区域卷积神经网络目标检测模型(R-CNN)。首先使用区域选择性搜索算法在图像上提取约2000个候选区域,然后使用卷积神经网络对各候选区域进行特征提取,接着使用SVM对候选区域进行分类并利用NMS 回归目标位置。与传统算法相比,R-CNN的检测精度有很大提升,但缺点是:由于全连接层的限制,输入CNN的图像为固定尺寸,且每个图像块输入CNN单独处理,无特征提取共享,重复计算;选择性搜索算法仍有冗余,耗费时间等。 基于R-CNN只能接受固定尺寸图像输入和无卷积特征共享,He[2]于2014年参考金字塔匹配理论在CNN中加入SPP-Net结构。该结构复用第五卷积层的特征响应图,将任意尺寸的候选区域转为固定长度的特征向量,最后一个卷积层后接入的为SPP层。该方法只对原图做一

信息熵与图像熵计算

p (a i ) ∑ n 《信息论与编码》课程实验报告 班级:通信162 姓名:李浩坤 学号:163977 实验一 信息熵与图像熵计算 实验日期:2018.5.31 一、实验目的 1. 复习 MATLAB 的基本命令,熟悉 MATLAB 下的基本函数。 2. 复习信息熵基本定义, 能够自学图像熵定义和基本概念。 二、实验原理及内容 1.能够写出 MATLAB 源代码,求信源的信息熵。 2.根据图像熵基本知识,综合设计出 MATLAB 程序,求出给定图像的图像熵。 1.MATLAB 中数据类型、矩阵运算、图像文件输入与输出知识复习。 2.利用信息论中信息熵概念,求出任意一个离散信源的熵(平均自信息量)。自信息是一个随机变量,它是指某一信源发出某一消息所含有的信息量。所发出 的消息不同,它们所含有的信息量也就不同。任何一个消息的自信息量都代表不了信源所包含的平均自信息量。不能作为整个信源的信息测度,因此定义自信息量的数学期望为信源的平均自信息量: H (X ) = E [ log 1 ] = -∑ p (a i ) log p (a i ) i =1 信息熵的意义:信源的信息熵H 是从整个信源的统计特性来考虑的。它是从平均意义上来表征信源的总体特性的。对于某特定的信源,其信息熵只有一个。不同的信源因统计特性不同,其熵也不同。 1. 学习图像熵基本概念,能够求出图像一维熵和二维熵。 图像熵是一种特征的统计形式,它反映了图像中平均信息量的多少。图像的一维熵表示图像中灰度分布的聚集特征所包含的信息量,令 P i 表示图像中灰度值为 i 的像素所占的比例,则定义灰度图像的一元灰度熵为: 255 H = p i log p i i =0

Cognex VisionPro软件简介及其目标识别定位功能

Cognex VisionPro 软件简介及其目标识别定位功能 1、VisionPro主要功能:图像预处理、图像拼接、图像标定、几何校正、 定位、OCV\ID、图像几何测量、结果分析等,该软件可以直接和国际大多数相机相连,包括模拟、1394、千兆网相机等,且可以直接输出检测结果,提供二次开发接口、支持点net。在其QuickBuild环境中无需任何代码编程,只需拖拉操作就可以完成检查文件的设置,检测结果输出,可进行快速开发。 QuickBuild能与用户自己编写的点net程序无缝连接,实现数据共享,用户可以使用自己的I/O板。 2、VisionPro软件与Halcon对比: 开发方式:VIsionPro可以拖拉式图形编程,非常形象,同时也可以使用API 函数编程,增加灵活性。VisionPro的QuickBuild提供更加高效快速的编程界面,能够迅速融合到用户程序中。QuickBuild提供许多成熟的视觉检测工具和设置界面,使用QuickBuild做评估测试和开发的效率远高于Halcon的Hdevelop。而Halcon只能用函数编程,没有图形编程界面,开发效率低于VisonPro。 视觉工具和函数:VisonPro的PatMax定位工具和颜色识别工具优于Halcon的类似工具。特别是PatMax定位工具可在图像模糊、对比度低、目标形变严重的情况下实现更稳定的定位和目标识别功能,得到了行业内广泛的认可。 支持的相机:两种开发软件都支持大多数相机,都可以编写自定义的驱动。编写自定义驱动,Halcon提供更好的接口。 Cognex VisionPro软件的测试版可在https://www.360docs.net/doc/961244540.html,下载 VisionPro定位工具简介: 安装完VisionPro后,有很多演示例程可以运行,且可以进行图像仿真。 以下是其中的一小部分以及我们客户中使用到的一些。 存在透视形变情况下的定位与高度识别

两个matlab实现最大熵法图像分割程序

%两个程序,亲测可用 clear all a=imread('moon.tif'); figure,imshow(a) count=imhist(a); [m,n]=size(a); N=m*n; L=256; count=count/N;%%每一个像素的分布概率 count for i=1:L if count(i)~=0 st=i-1; break; end end st for i=L:-1:1 if count(i)~=0 nd=i-1; break; end end nd f=count(st+1:nd+1); %f是每个灰度出现的概率 size(f) E=[]; for Th=st:nd-1 %%%设定初始分割阈值为Th av1=0; av2=0; Pth=sum(count(1:Th+1)); %%%第一类的平均相对熵为 for i=0:Th av1=av1-count(i+1)/Pth*log(count(i+1)/Pth+0.00001); end %%%第二类的平均相对熵为 for i=Th+1:L-1 av2=av2-count(i+1)/(1-Pth)*log(count(i+1)/(1-Pth)+0.00001); end E(Th-st+1)=av1+av2; end position=find(E==(max(E))); th=st+position-1

for i=1:m for j=1:n if a(i,j)>th a(i,j)=255; else a(i,j)=0; end end end figure,imshow(a); %%%%%%%%%%%%%%%%%%%%%2-d 最大熵法(递推方法) %%%%%%%%%%% clear all; clc; tic a=imread('trial2_2.tiff'); figure,imshow(a); a0=double(a); [m,n]=size(a); h=1; a1=zeros(m,n); % 计算平均领域灰度的一维灰度直方图 for i=1:m for j=1:n for k=-h:h for w=-h:h; p=i+k; q=j+w; if (p<=0)|( p>m) p=i; end if (q<=0)|(q>n) q=j; end a1(i,j)=a0(p,q)+a1(i,j); end end a2(i,j)=uint8(1/9*a1(i,j)); end

信息熵在图像处理中的应用

信息熵在图像处理中的应用 摘要:为了寻找快速有效的图像处理方法,信息理论越来越多地渗透到图像处理技术中。文章介绍了信息熵在图像处理中的应用,总 结了一些基于熵的图像处理特别是图像分割技术的方法,及其在这一领域内的应用现状和前景 同时介绍了熵在织物疵点检测中的应用。 Application of Information Entropy on Image Analysis Abstract :In order to find fast and efficient methods of image analysis ,information theory is used more and more in image analysis .The paper introduces the application of information entropy on the image analysis ,and summarizes some methods of image analysis based on information entropy ,especially the image segmentation method .At the same time ,the methods and application of fabric defect inspection based on information entropy ale introduced . 信息论是人们在长期通信实践活动中,由通信技术与概率论、随机过程、数理统计等学科相结合而逐步发展起来的一门新兴交叉学科。而熵是信息论中事件出现概率的不确定性的量度,能有效反映事件包含的信息。随着科学技术,特别是信息技术的迅猛发展,信息理论在通信领域中发挥了越来越重要的作用,由于信息理论解决问题的思路和方法独特、新颖和有效,信息论已渗透到其他科学领域。随着计算机技术和数学理论的不断发展,人工智能、神经网络、遗传算法、模糊理论的不断完善,信息理论的应用越来越广泛。在图像处理研究中,信息熵也越来越受到关注。 1 信息熵 1948年,美国科学家香农(C .E .Shannon)发表了一篇著名的论文《通信的数学理论》 。他从研究通信系统传输的实质出发,对信息做了科学的定义,并进行了定性和定量的描述。 他指出,信息是事物运动状态或存在方式的不确定性的描述。其通信系统的模型如下所示: 图1 信息的传播 信息的基本作用就是消除人们对事物的不确定性。信息熵是信息论中用于度量信息量的一个概念。假定X 是随机变量χ的集合,p (x )表示其概率密度,计算此随机变量的信息熵H (x )的公式是 P (x ,y )表示一对随机变量的联合密度函数,他们的联合熵H (x ,y )可以表示为 信息熵描述的是信源的不确定性,是信源中所有目标的平均信息量。信息量是信息论的中心概念,将熵作为一个随机事件的不确定性或信息量的量度,它奠定了现代信息论的科学理论基础,大大地促进了信息论的发展。设信源X 发符号a i ,的概率为Pi ,其中i=1,2,…,r ,P i >O ,要∑=r i Pi 1=1,则信息熵的代数定义形式为:

图像熵计算

图像熵计算 信息熵: 利用信息论中信息熵概念,求出任意一个离散信源的熵(平均自信息量)。自信息是一个随机变量,它是指某一信源发出某一消息所含有的信息量。一条信息的信息量和它的不确定性有着直接的关系。所发出的消息不同,它们所含有的信息量也就不同。任何一个消息的自信息量都代表不了信源所包含的平均自信息量。不能作为整个信源的信息测度,因此定义自信息量的数学期望为信源的平均自信息量: 信息熵的意义 信源的信息熵H 是从整个信源的统计特性来考虑的。它是从平均意义上来表征信源的总体特性的。对于某特定的信源,其信息熵只有一个。不同的信源因统计特性不同,其熵也不同。信息熵一般用符号H 表示,单位是比特。变量的不确定性越大,熵也就越大。 图像熵: 1.一元灰度熵 图像熵是一种特征的统计形式,它反映了图像中平均信息量的多少。图像的一维熵表示图像中灰度分布的聚集特征所包含的信息量,令P i 表示图像中灰度值为i 的像素所占的比例,则定义灰度图像的一元灰度熵为: 255 log =i i i H p p =∑ 其中P i 是某个灰度在该图像中出现的概率,可由灰度直方图获得。 %% 图像灰度直方图 clear; clc;

close all; ImageData=imread('lena.jpg'); if ndims(ImageData) == 3 figure; imshow(ImageData); title('您选择的是RGB图,将转换为灰度图!'); ImageData = rgb2gray(ImageData); %如果是真彩色图,就将其装换为灰度图 end figure imshow(ImageData) title('您所选择的图像'); figure; h=imhist(ImageData); %一个MATLAB图像处理模块中的函数,用以提取图像中的直方图信息 h1=h(1:2:256); h2=1:2:256; stem(h2,h1,'r--'); %绘出柱状图,红色 title('图像灰度直方图-柱状图'); figure; imhist(ImageData); %一个MATLAB图像处理模块中的函数,用以提取图像中的直方图信息 title('灰度直方图');

基于图像超分辨网络的目标检测算法

图形图像 现代计算机(https://www.360docs.net/doc/961244540.html, )2019.09上 文章编号:1007-1423(2019)25-0047-04 DOI :10.3969/j.issn.1007-1423.2019.25.010 基于图像超分辨网络的目标检测算法 畅青,冯晶明,洪伟杰,薛凯 (四川大学计算机学院,成都610065) 摘要: 目标检测一直是计算机视觉研究领域的核心问题。当前,视觉识别任务仍然容易受到各种图像退化的影响,如图像模糊和图像低分辨率。为此,提出一种基于图像超分辨网络的目标检测算法。首先,搭建一个轻量级的图像超分辨网络对输入图片进行像素信息恢复和局部细节增强;然后在重建图片上搭建目标检测网络对各种类型的目标进行检测和定位;最终,将检测结果映射会原始图片。实验证明,经过融合图像超分辨重建网络,该算法实现更好的性能。关键词: 目标检测;图像超分辨率;多尺度检测器基金项目: 四川省科技创新苗子工程(No.2018048) 0引言 目标的检测与跟踪技术在计算机视觉领域有着广 泛的应用,例如在视频监控、无人驾驶、机器人等领域都有着举足轻重的价值。随着深度学习算法与技术的飞速发展,更是带动了该技术在性能、速度等方面取得了质的飞跃。然而随着社会的发展,需求的不断提高,我们在研究算法高效性的同时还要考虑算法所训练出的模型在实际应用上的性能与速度。 在深度学习出现之前,目标检测需要根据一定的先验知识,通过建立某种数学模型来完成目标检测,应用比较广泛的有:帧差法[1]、Hough 变换[2]、光流法[3]、滑动窗口模型[4]、可变形部件模型[5]等。这些传统的目标检测方法通过手工设计的特征来组合并进行分类。然而由于需要依赖于研究人员的经验,因此,传统的方法的泛化能力较差,鲁棒性较低。 受益于深度学习的发展,最近几年,目标检测作为计算机视觉的基础性任务取得了长足的进步。尤其是R-CNN [6] 创造性的将检测任务划分为两个阶段:产生候 选区域和目标识别。随后众多优秀的工作 [7-9] ,都采用 这种两阶段的管道实现了巨大的性能提升。与此同 时,众多单阶段检测算法[10-12]也在不断刷新着COCO 挑战赛的记录。 尽管不断有新的检测框架问世,视觉识别任务仍然容易受到各种图像退化的影响,包括图像模糊和图像低分辨率。COCO 数据集上的检测结果表明:识别不同尺度的目标依然是检测任务一项重大挑战。进一步提高对小目标和模糊目标的检测精度和召回率是优化目标检测框架总体性能的核心方式。 小目标本身在图片中所占区域较小,所涉及的像素数量少。模糊目标本身含有大量的噪声导致像素质量过低。本身像素信息的匮乏加上卷积神经网络池化操作对特征图的浓缩,导致神经网络难以对小目标及模糊目标提取出充足的特征。图像超分辨率可以作为一种输入数据增强消除这些弊病并以此为目标检测提供积极的影响。 1算法实现 针对图像模糊和低分辨率问题以及目标检测高实 时性要求,本文提出了基于图像超分辨率的多尺度检测算法。该算法首先依靠一个轻量级的图像超分辨网

相关文档
最新文档