图像识别技术设计已完成

图像识别技术设计已完成
图像识别技术设计已完成

摘要

数字图像处理(Digital Image Processing)的任务是实现图像增强、复原、编码、压缩等,其主要为改善图像的质量,以人为对象,且以改善人的视觉效果为目的。目前,图像处理系统应用领域广泛医学、军事、科研、商业等领域。因为数字图像处理技术易于实现非线性处理,处理程序和处理参数可变,故是一项通用性强,精度高,处理方法灵活,信息保存、传送可靠的图像处理技术。本设计的数字图像处理与识别技术系统以数字图像处理理论为基础,基于Matlab工具工作环境设计,能很好、快速的应用于识别本专业以后将要经常使用的电子元器件。主要作用为识别相同元器件的个数,相对于传统的机械识别具有安全性高,非接触性,高速度等特点。此种数字图像处理算法可以广泛应用于各个行业的相同或相近的物品识别,从而大大提高生产效率。

关键字:数字图像;图像处理; 图像识别; Matlab; 元器件.

Abstract

Digital Image Processing, the task is to realize the Image enhancement, recovery, coding, compression, its main for improving the quality of images, adhere to the object, and to improve the person for the purpose of visual effect. At present, image processing system is widely medicine, military and scientific research, business, etc. The design of the digital image processing and recognition technology in the digital image processing system based on the theory of the working environment, based on Matlab tool design, can be very good, rapid applied to identify the major often used electronic components. Main function for the same number of components, the identification of the traditional mechanical identification with a high level of security, non-contact, high speed, etc. The digital image processing algorithms can be widely used in various industries of the same or similar goods identification, which greatly improve the production efficiency.

Keywords:Digital image, Image processing, Image recognition, Matlab, Components.

目录

前言 (3)

1.设计要求 (4)

2.功能介绍 (4)

3.总体方案设计 (4)

3.1 功能模块划分 (4)

3.2 MCU传送控制流程 (5)

3.3数码相机拍摄 (6)

3.4软件处理流程 (6)

4.图像处理 (7)

4.1 图像格式转换 (7)

4.2 去噪及特征提取 (7)

4.3灰度调整 (8)

4.4二值化处理 (10)

4.5阈值分割 (11)

5.识别统计 (14)

5.1图像反色 (14)

5.2函数bwlabel统计 (14)

6.完整设计程序 (16)

7.总结体会 (18)

参考文献 (19)

前言

数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。因为数字图像处理技术易于实现非线性处理,处理程序和处理参数可变,故是一项通用性强,精度高,处理方法灵活,信息保存、传送可靠的图像处理技术。

本图像识别统计装置设计数字以数字图像处理理论为基础,基于Matlab工具工作环境设计,能很好、快速的应用于识别本专业以后将要经常使用的电子元器件。主要作用为识别相同元器件的个数,相对于传统的机械识别具有安全性高,非接触性,高速度等特点。此种数字图像处理算法可以广泛应用于各个行业的相同或相近的物品识别,从而大大提高生产效率。

1.设计要求

主要运用图像处理的综合方法实现,把均值滤波增强,腐蚀运算和膨胀运算,开运算,灰度变换等相结合,来实现本次设计:

1)设计一套符合应用场合的图像采集装置测量装置。

2)详细写出图像采集装置和测量装置的组成部件以及参数。

3)详细列出图像采集和测量的使用环境。

4)设计处理的流程。

5)对实验使用的关键原理作以介绍。

2.功能介绍

本设计为小功率的三极管元件图像识别统计装置,通过数码相机获取平铺无重叠堆积的三极管的图像,并通过Matlab工具处理后统计三极管的数目。通过控制控制数码相机的拍摄实现拍摄—统计—拍摄的过程。可以由MCU实现三极管的传送,上位机实现统计显示。本装置的统计方式为软件识别,与传统的机械清点相比具有速度快,损耗低等特点,目前的缺陷就是清点精度相对比较的低。

3.总体方案设计

3.1 功能模块划分

本装置有检测传送控制、图像拍摄、软件处理三部分组成,MCU主要负责三极管的取送,数码相机负责图像的获取;而具体的任务分配及数据处理则由处理能力强大的上位机(PC机)来完成。

总体功能可由下图表示:

图3-1整体功能模块示意图

3.2 MCU传送控制流程

装置MCU控制传送的元件块分块及传送速度。其与数码相机存在控制通讯接口,逻辑关系如下图所示:

图3-2MCU传送控制

3.3数码相机拍摄

数码相机获取的图片是后续程序处理的基础,所以在得到的图片质量上要有好的保证。比如图像的曝光度,解析度,对比度、色调等,所以有必要调整光照,设定好元件放置处的背景色。其中调整光照可以由MCU一并控制。数码相机的启停可由MCU控制,也可由PC控制,但图片所涉及的数据量大,要求失真度低,图像数据传输通讯接口可采用USB接口。

3.4软件处理流程

图3-3 软件处理流程

4.图像处理

4.1 图像格式转换

取的图像格式为RGB彩色图像,需要先将其转换为8位256级的灰度图像。本程序采用Matlab的图像处理工具箱的函数rgb2gray来实现。

rgb2gray()

功能:

转换RGB图像或颜色映像表为灰度图像。

语法:

I = rgb2gray(RGB)

newmap = rgb2gray(map)

4.2 去噪及特征提取

图4-1 灰度图及其直方图

上图4-1为三极管统计的局部图片,图中可见,三极管的主体部分很背景及管脚有着明显的区别,可以通过选取合适的阈值进行二值化,从而提取出每个三极管的特征。

图4-2为此图像的直方图,从图中可见到比较明显的阈值分界点,但是并不是非常的明显,这是因为,图中有很多的三极管因为反光的缘故,导致主体部分有些发白,如图4-3所示。

图4-2 需要进一步处理的地方

4.3灰度调整

对于这些发白部分,我们采用灰度调整及中值滤波进行处理,在matlab中,提供了两个函数进行相应的操作,其中imadjust进行灰度调整,其用法如下

Imadjst(f,[low_in high_in],[low_out high_out],gamma)

Gamma所表示的意义:

>1 -------- 凹曲线

<1 -------- 凸直线

=1 -------- 直线

medfilt2用于进行中值滤波处理,其用法如下

F=medfilt2(f,[m n]);

f为输入图像

[m n]为中值滤波模板

F是中值滤波后输出的图像。

图4-1经过灰度调整及中值滤波后的图像如图4-4所示,可见,经过中值滤波后,三极管的主体部分有了较大的改善。

图4-4 灰度调整中值滤波后的直方图

4灰度调整,中值滤波后的直方图

4.4二值化处理

经过滤波后,即可对图像进行二值化处理,首先,我们采用人工选择阈值的方法进行二值化,由图可见,对于本幅图片,其合适的阈值在50~100之间,通过试验,我们选取的值为80。

对图像二值化处理的程序如下:

[M,N]=size(F);

for x=1:M

for y=1:N

if F(x,y)<80

F(x,y)=0; %低于阈值的值黑

else

F(x,y)=255; %高于阈值的值白

end

end

end

处理后的图像如图4-6所示:

图4-5 二值化后结果

4.5阈值分割

当然仍有许多模糊的三极管管脚残影,但已经将三极管的主体很好的识别了出来,采用人工选择阈值的方法虽然可以成功分离出三极管的主体,但是这个阈值这是针对这张图片有效,对于获取的其它图片,这个阈值并不能正确地对图像进行二值化处理,因此我们决定采用自动阈值分割的方法来对图像进行二值化。

我们所选用的自动阈值分割方法为Otsu法,它是一种使类间方差最大的自动确定阈值的方法,该方法具有简单、处理速度快的特点,是一种常用的阈值选取方法。

在matlab中,提供了一个函数graythresh来实现Otsu法阈值分割,其用法如下:

T=graythresh(f);

其中,f为待进行阈值分割的灰度图像,T为返回的分割灰度比例,将其乘于256即为Otsu法划定的分割阈值。

优化后的程序如下:

T=graythresh(F);

T=T*256;

[M,N]=size(F);

for x=1:M

for y=1:N

if F(x,y)

F(x,y)=0; %%低于阈值的置黑

else

F(x,y)=255; %%低于阈值的置白

end

end

end

采用Otsu法进行阈值二值化后的图像如图4-7所示:

二值化结果

图4-6 Otsu法阈值分割后图像

由上可见,不管是采用人工阈值还是Otsu法自动阈值分割,仍然会残留很多的三极管管脚,它们将会严重干扰到对三极管的统计,对于这些噪声,我们采用图像形态学中的闭运算来进行处理,闭运算的原理是先对图像进行腐蚀后再进行膨胀,matlab提供了函数imclose来实现图像的闭运算。其格式为:

F=imclose(f,B);

其中,B为结构元素,可由以下两种办法生成

(1)B=ones(n);

(2)B=strel(‘type’,[m n]);

Type可以取以下的值

square 生成一个m*n方形矩阵

line 生成一条长度为m,斜率为n°的直线

disk 生成一个m*n大小的蝶形

ball 生成一个m*n大小的球形

滤除三极管管脚后的结果如图4-8所示。

闭运算

图4-7 去噪后的局部图像

由图中可见,噪声被有效的滤除了,但是,去除了噪声的同时,也使部分接触紧密的三极管在闭运算后连成一个整体,如图4-8中的红圈所示,因此在此后的识别统计中需要对其进行特殊的处理。

5.识别统计

5.1图像反色

将以上处理过后的图像反色,如图4-10所示

反色

图4-8 反色后的图像

5.2函数bwlabel统计

三极管数目的统计采用函数bwlabel 来实现.

bwlabel功能:

标注二进制图像中已连接的部分,并将每个连同的部分标上相同的序号。

语法: L = bwlabel(BW,n) ,[L,num] = bwlabel(BW,n)

统计的过程如下:

1)通过bwlabel计算出图像中所以的连通区域的数目,这包括了单个、两个、

及三个以上的三极管。

2)计算每个连通区域的大小,根据大小判断其中包括的三极管数目,分别计算

两个三极管,三个三极管,及三个以上三极管的数目。

3)将上面各项统计结果加起来即为三极管的数目。

具体程序如下:

%对图像贴标签

[L N]=bwlabel(F1,8)

Sum = [];

%统计每个标签的数量

for i=1:N

[r,c] = find(L==i);

rc = [r c];

Num = length(rc);

Sum([i])=Num;

end

%根据每个标签数量,分别统计2个,3个,4个三极管的数量for i=1:length(Sum)

if (Sum([i]))>2000

N=N+3;

elseif(Sum([i])) > 1450

N =N + 2;

elseif (Sum([i])) > 900

N =N + 1;

end

end

图4-9 Matlab统计分析

经过统计,如图4-11所示,该幅图像的三极管数目约为481个。

6.完整设计程序

完整程序如下所示:

clear all;

close all;

f=imread('BJT.jpg');

F=rgb2gray(f);

figure;imshow(F);title('原图');

figure;imhist(F);title('直方图');

F0 = imadjust(F,stretchlim(F),[0 1]);

Ft=medfilt2(F0,[5 5]);

figure;imshow(Ft);title('灰度调整,中值滤波后的图像');

figure;imhist(Ft);title('灰度调整,中值滤波后的直方图');

T=graythresh(Ft);

T=T*256-5;

[M,N]=size(Ft);

for x=1:M

for y=1:N

if Ft(x,y)

Ft(x,y)=0; %低于阈值的值黑

else

Ft(x,y)=255; %高于阈值的值白

end

end

end

figure;imshow(Ft);title('二值化结果');

B=ones(10);

F0=imclose(Ft,B);

figure;imshow(F0);title('闭运算');

F1=imadjust(F0,[0,1],[1,0],1);

figure;imshow(F1);title('反色');

%对图像贴标签

[L N]=bwlabel(F1,8)

Sum = [];

%统计每个标签的数量

for i=1:N

[r,c] = find(L==i);

rc = [r c];

Num = length(rc);

Sum([i])=Num;

end

%根据每个标签数量,分别统计2个,3个,4个三极管的数量

for i=1:length(Sum)

if (Sum([i]))>2000

N=N+3;

elseif(Sum([i])) > 1450

N =N + 2;

elseif (Sum([i])) > 900

N =N + 1;

end

end

7.总结体会

通过本本设计为小功率的三极管元件图像识别统计装置的设计,目前的缺陷就是清点精度相对比较的低。不仅使我们对上位机、MCU等控制系统、通信系统进一步增加了了解,而且在Matlab中关于图像处理方面的函数有了更深入的了解,同时在试验过程中我们也试验了多种的图像处理方法,如平滑滤波,高斯低通滤波等等,进一步掌握了图像处理的一些常用方法,对图像形态学操作也有了深入的学习与掌握,了解了图像形态学操作的重要作用。

在此一并感谢赵老师、罗老师这一学期以来的指导与教诲,两位老师不仅给了我们学习上的指导,对我们的生活也给了无微不至的关心,在思想上更是如此。两位老师平日里工作繁多,但在我做课程设计的每个阶段,从选题到查阅资料,提纲的确定,中期的修改,后期课程设计格式调整等各个环节中都给予了我悉心的指导。

除了敬佩两位老师的专业水平外,您们治学严谨和科学研究的精神也是我永远学习的榜样,并将积极影响我今后的学习和工作。在这样的教诲下,掌握了坚实的专业知识基础,为我以后的学习生活提供了源动力。

参考文献

[1]胡学龙等著数字图像处理电子工业出版社,2006.9.

[2]朱衡君编著 MATLAB语言及实践教程清华大学出版社,2005.

[3]陈怀琛. MATLAB机器在理工科课程中的应用. 西安电子科技大学出版社,2007.

[4]董长虹等. MATLAB信号处理与应用国防工业出版社,2005.

[5]李在铭. 数字图像处理、压缩与识别技术电子科技大学出版社,2000.

人工智能车牌识别

车牌自动识别 近年来,随着物联网、车联网的迅猛发展,以及中国汽车数量的不断增加,这对智能交通系统提出了新的要求。作为智能交通系统一部分的集成信号处理、计算机视觉、模式识别等技术的车牌识别系统因而也有了新的应用和挑战。除传统的用于高速公路超速违章管理、停车场管理、车辆流量管理以及车辆电子收费系统外,车牌识别系统还可以用于移动机器人对停车场车辆的监管以及交通管理部门对违章车辆车牌的自动登记等。 一、车牌自动识别系统的技术说明 车牌自动识别系统采用车牌识别技术来实现技术效果的。车牌识别技术(Vehicle License Plate Recognition,VLPR) 是指能够检测到受监控路面的车辆并自动提取车辆牌照信息(含汉字字符、英文字母、阿拉伯数字及号牌颜色)进行处理的技术。车牌识别是现代智能交通系统中的重要组成部分之一,应用十分广泛。它以数字图像处理、模式识别、计算机视觉等技术为基础,对摄像机所拍摄的车辆图像或者视频序列进行分析,得到每一辆汽车唯一的车牌号码,从而完成识别过程。通过一些后续处理手段可以实现停车场收费管理,交通流量控制指标测量,车辆定位,汽车防盗,高速公路超速自动化监管、闯红灯电子警察、公路收费站等等功能。对于维护交通安全和城市治安,防止交通堵塞,实现交通自动化管理有着现实的意义。 车牌识别技术结合电子不停车收费系统(ETC)识别车辆,过往车辆通过道口时无须停车,即能够实现车辆身份自动识别、自动收费。在车场管理中,为提高出入口车辆通行效率,车牌识别针对无需收停车费的车辆(如月卡车、内部免费通行车辆),建设无人值守的快速通道,免取卡、不停车的出入体验,正改变出入停车场的管理模式。

图像识别技术的研究现状论文

图像识别技术研究现状综述 简介: 图像识别是指图形刺激作用于感觉器官,人们辨认出它是经验过的某一图形的过程,也叫图像再认。在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程,才能实现对图像的再认。图像识别技术是以图像的主要特征为基础的,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。对于熟悉的图形,由于掌握了它的主要特征,就会把它当作一个单元来识别,而不再注意它的细节了。这种由孤立的单元材料组成的整体单位叫做组块,每一个组块是同时被感知的。图像在人类的感知中扮演着非常重要的角色,人类随时随处都要接触图像。随着数字图像技术的发展和实际应用的需要,出现了另一类问题,就是不要求其结果输出是一幅完整的图像,而是将经过图像处理后的图像,再经过分割和描述提取有效的特征,进而加以判决分类,这就是近20年来发展起来的一门新兴技术科学一图像识别。它以研究某些对象或过程的分类与描述为主要内容,以研制能够自动处理某些信息的机器视觉系统,代替传统的人工完成分类和辨识的任务为目的。 图像识别的发展大致经历了三个阶段:文字识别、图像处理和识别及物体识别:文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,并从印刷文字识别到手写文字识别,应用非常广泛,并且已经研制了许多专用设备。图像处理和识别的研究,是从1965年开始的。过去人们主要是对照相技术、光学技术的研究,而现在则是利用计算技术、通过计算机来完成。计算机图像处理不但可以消除图像的失真、噪声,同时还可以进行图像的增强与复原,然后进行图像的判读、解析与识别,如航空照片的解析、遥感图像的处理与识别等,其用途之广,不胜枚举。物体识别也就是对三维世界的认识,它是和机器人研究有着密切关系的一个领域,在图像处理上没有特殊的难点,但必须知道距离信息,并且必须将环境模型化。在自动化技术已从体力劳动向部分智力劳动自动化发展的今天,尽管机器人的研究非常盛行,还只限于视觉能够观察到的场景。进入80年代,随着计算机和信息科学的发展,计算机视觉、人工智能的研究已成为新的动向 图像识别与图像处理的关系: 在研究图像时,首先要对获得的图像信息进行预处理(前处理)以滤去干扰、噪声,作几何、彩色校正等,以提供一个满足要求的图像。图像处理包括图像编码,图像增强、图像压缩、图像复原、图像分割等。对于图像处理来说,输入是图像,输出(即经过处理后的结果)也是图像。图像处理主要用来解决两个问题:一是判断图像中有无需要的信息;二是确定这些信息是什么。图像识别是指对上述处理后的图像进行分类,确定类别名称,它可以在分割的基础上选择需要提取的特征,并对某些参数进行测量,再提取这些特征,然后根据测量结果做出分类。为了更好地识别图像,还要对整个图像做结构上的分析,对图像进行描述,以便对图像的主要信息做一个好的解释,并通过许多对象相互间的结构关系对图像加深理解,以便更好帮助和识别。故图像识别是在上述分割后的每个部分中,找出它的形状及纹理特征,以便对图像进行分类,并对整个图像做结构上的分析。因而对图像识别环节来说,输入是图像(经过上述处理后的图像),输出是类别和图像的结构分析,而结构分析的结果则

浅析人工智能中的图像识别技术

浅析人工智能中的图像识别技术 本文从网络收集而来,上传到平台为了帮到更多的人,如果您需要使用本文档,请点击下载按钮下载本文档(有偿下载),另外祝您生活愉快,工作顺利,万事如意! 图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。随着计算机技术的发展,人类对图像识别技术的认识越来越深刻。图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。文章简单分析了图像识别技术的引入、其技术原理以及模式识别等,之后介绍了神经网络的图像识别技术和非线性降维的图像识别技术及图像识别技术的应用。从中可以总结出图像处理技术的应用广泛,人类的生活将无法离开图像识别技术,研究图像识别技术具有重大意义。 1 图像识别技术的引入 图像识别是人工智能科技的一个重要领域。图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。图像识别,顾名思义,就是对图像做出各种处理、分析,最终识别我们所要研究的

目标。今天所指的图像识别并不仅仅是用人类的肉眼,而是借助计算机技术进行识别。虽然人类的识别能力很强大,但是对于高速发展的社会,人类自身识别能力已经满足不了我们的需求,于是就产生了基于计算机的图像识别技术。这就像人类研究生物细胞,完全靠肉眼观察细胞是不现实的,这样自然就产生了显微镜等用于精确观测的仪器。通常一个领域有固有技术无法解决的需求时,就会产生相应的新技术。图像识别技术也是如此,此技术的产生就是为了让计算机代替人类去处理大量的物理信息,解决人类无法识别或者识别率特别低的信息。 图像识别技术原理 其实,图像识别技术背后的原理并不是很难,只是其要处理的信息比较繁琐。计算机的任何处理技术都不是凭空产生的,它都是学者们从生活实践中得到启发而利用程序将其模拟实现的。计算机的图像识别技术和人类的图像识别在原理上并没有本质的区别,只是机器缺少人类在感觉与视觉差上的影响罢了。人类的图像识别也不单单是凭借整个图像存储在脑海中的记忆来识别的,我们识别图像都是依靠图像所具有

关于人脸识别技术的发展研究

人脸识别技术优势 863计划、国家科技支撑计划、自然科学基金都拨出专款资助人脸识别的相关研究。国家“十一五”科技发展规划中也将人脸识别技术的研究与发展列入其中[4],明确指出:“要在生物特征识别技术领域缩小与世界先进水平的差距,开展生物特征识别应用技术研究,人脸识别具有高安全性、低误报率的出入口控制新产品。”在这种环境下,国内一些科研院所和院校在人脸识别技术方面取得了很大进展。如中科院自动化所,清华大学,中科院计算所自主开发的人脸识别技术已经达到了国际先进的水平。人脸识别作为一种新兴的生物特征识别技术(Biometrics),与虹膜识别、指纹扫描、掌形扫描等技术相比,人脸识别技术在应用方面具有独到的优势: 1.人脸识别使用方便,用户接受度高。人脸识别技术使用通用的摄像机作为识别信息获取装置,以非接触的方式在识别对象未察觉的情况下完成识别过程。 2.直观性突出。人脸识别技术所使用的依据是人的面部图像,而人脸无疑是肉眼能够判别的最直观的信息源,方便人工确认、审计,“以貌取人”符合人的认知规律。 3.识别精确度高,速度快。与其它生物识别技术相比,人脸识别技术的识别精度处于较高的水平,误识率、拒认率较低。 4.不易仿冒。在安全性要求高的应用场合,人脸识别技术要求识别对象必须亲临识别现场,他人难以仿冒。人脸识别技术所独具的活性判别能力保证了他人无法以非活性的照片、木偶、蜡像来欺骗识别系统。这是指纹等生物特征识别技术所很难做到的。举例来说,用合法用户的断指即可仿冒合法用户的身份而使识别系统无从觉察。 5.使用通用性设备。人脸识别技术所使用的设备为一般的PC、摄像机等常规设备,由于目前计算机、闭路电视监控系统等已经得到了广泛的应用,因此对于多数用户而言使用人脸识别技术无需添置大量专用设备,从而既保护了用户的原有投资又扩展了用户已有设备的功能,满足了用户安全防范的需求。 6.基础资料易于获得。人脸识别技术所采用的依据是人脸照片或实时摄取的人脸图像,因而无疑是最容易获得的。 7.成本较低,易于推广使用。由于人脸识别技术所使用的是常规通用设备,价格均在一般用户可接受的范围之内,与其它生物识别技术相比,人脸识别产品具有很高的性能价格比。 概括地说,人脸识别技术是一种高精度、易于使用、稳定性高、难仿冒、性价比高的生物特征识别技术,具有极其广阔的市场应用前景。 我将人脸识别的一些应用列举出来,希望抛转引玉,大家不断完善,开拓更多的应用领域。 1)监控布控

人工智能与模式识别

人工智能与模式识别 摘要:信息技术的飞速发展使得人工智能的应用围变得越来越广,而模式识别作为其中的一个重要方面,一直是人工智能研究的重要方向。在介绍人工智能和模式识别的相关知识的同时,对人工智能在模式识别中的应用进行了一定的论述。模式识别是人类的一项基本智能,着20世纪40年代计算机的出现以及50年代人工智能的兴起,模式识别技术有了长足的发展。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。模式识别的发展潜力巨大。 关键词:模式识别;数字识别;人脸识别中图分类号; Abstract: The rapid development of information technology makes the application of artificial intelligence become more and more widely. Pattern recognition, as one of the important aspects, has always been an important direction of artificial intelligence research. In the introduction of artificial intelligence and pattern recognition related knowledge at the same time, artificial intelligence in pattern recognition applications were discussed.Pattern recognition is a basic human intelligence, the emergence of the 20th century, 40 years of computer and the rise of artificial intelligence in the 1950s, pattern recognition technology has made great progress. Pattern recognition and statistics, psychology,

图像识别技术发展状况及前景

医学图像配准技术 罗述谦综述 首都医科大学生物医学工程系(100054) 吕维雪审 浙江大学生物医学工程研究所(310027) 摘要医学图像配准是医学图像分析的基本课题,具有重要理论研究和临床应用价 值。本文较全面地介绍了医学图像配准的概念、分类、配准原理、主要的配准技术及评 估方法。 关键词医学图像配准多模 1 医学图像配准的概念 在做医学图像分析时,经常要将同一患者的几幅图像放在一起分析,从而得到该患者的多方面的综合信息,提高医学诊断和治疗的水平。对几幅不同的图像作定量分析,首先要解决这几幅图像的严格对齐问题,这就是我们所说的图像的配准。 医学图像配准是指对于一幅医学图像寻求一种(或一系列)空间变换,使它与另一幅医学图像上的对应点达到空间上的一致。这种一致是指人体上的同一解剖点在两张匹配图像上有相的空间位置。配准的结果应使两幅图像上所有的解剖点,或至少是所有具有诊断意义的点及手术感兴趣的点都达到匹配。 医学图像配准技术是90年代才发展起来的医学图像处理的一个重要分支。涉及“配准”的技术名词除registration外,mapping、matching、co-registration、integration、align-ment和fusion 等说法也经常使用。从多数文章的内容看,mapping偏重于空间映射;fu-sion指图像融合,即不仅包括配准,而且包括数据集成后的图像显示。虽然在成像过程之前也可以采取一些措施减小由身体移动等因素引起的空间位置误差,提高配准精度(称作数据获取前的配准preacquisition),但医学图像配准技术主要讨论的是数据获取后的(post-acquisition)配准,也称作回顾式配准(retrospective registration)。当前,国际上关于医学图像配准的研究集中在断层扫描图像( tomographic images,例如CT、MRI、SPECT、PET等)及时序图像(time seriesimages,例如fMRI及4D心动图像)的配准问题。 2 医学图像基本变换 对于在不同时间或/和不同条件下获取的两幅图像I1(x1,y1,z1)和I2(x2,y2,z2)配准,就是寻找一个映射关系P:(x1,y1,z1) (x2,y2,z2),使I1的每一个点在I2上都有唯一的点与之相对应。并且这两点应对应同一解剖位置。映射关系P表现为一组连续的空间变换。常用的空间几何变换有刚体变换(Rigid body transformation)、仿射变换(Affine transformation)、投影变换(Projec-tive transformation)和非线性变换(Nonlin-ear transformation)。 (1)刚体变换: 所谓刚体,是指物体内部任意两点间的距离保持不变。例如,可将人脑看作是一个刚体。 处理人脑图像,对不同方向成像的图像配准常使用刚体变换。刚体变换可以分解为旋转和平移:P(x)=Ax+b(1) x=(x,y,z)是像素的空间位置;A是3×3的旋转矩阵,b是3×1的平移向量。

图像识别与人工智能研究所发展规划报告

图像所学科建设与发展规划 根据学校建设世界知名高水平大学的发展目标,特制定图像所相应的学科建设与发展规划,以推动本学科的跨越式发展。 一、学科建设总体目标 (一)学科基础 图像识别与人工智能研究所(简称图像所)将继续以跻身于我国的国防科技的发展为切入点,从事发展巡航导弹中制导、末制导关键技术,承担相关预先研究和攻关科研任务为学科建设的主攻方向。 (1)目前本学科点共有五个研究方向: “计算机视觉与应用”、 “成像自动目标识别与精确制导技术”、 “多谱成像与遥感图像处理”、 “人工智能与思维科学” “面向模式识别的专用处理机与IC芯片设计”。 (2)本学科点现有科研人员26人,其中教授(含博士生导师)7人,副教授7人。科研教学梯队层次高,年龄、专业结构合理。现有教学科研用房4000 平方米。实验设备固定资产5000余万元,已初步形成先进、配套的教学、科研、开发环境和雄厚的技术储备。 (3)学科特点 模式识别与智能系统是信息科学技术领域中发展最迅速的前沿领域之一。

来自不同成像传感器的不同谱段的图像信号能全面揭示客观世界的各种特性,智能控制是人工智能与自动控制相结合的现代控制理论和技术,图像模式处理、识别与智能控制的结合构成了智能信息系统和智能自动化系统发展的基础,不仅科学意义深远而且有十分广阔的应用前景。本学科点的主要特色是紧密结合航天、航空和信息技术领域的国家目标,进行应用基础和应用技术的研究和开发,重点研究多谱段图像模式信息的获取、表示、处理、分析与智能系统领域的基础理论与关键技术,同时培养和造就本领域高层次、高质量的科技人才。本学科点具有特色和优势的研究方向是: ·计算机视觉与应用 在基于信息融合的信号处理、基于视觉、力觉和超声波接近觉的多传感器机器人系统和飞行器三维航迹规划技术方面具有特色,承担了国家重大型号XY-20末制导航迹规划攻关项目并进入型号研制。 ·成像自动目标识别与精确制导技术 开展面向复杂背景和随机环境下成像自动目标检测、识别、跟踪的新理论、新方法、新算法和新系统的研究,其特色是瞄准有关国家安全的国家目标,紧密结合航天航空高技术发展,在基于图象和图象序列的自动目标识别,景象匹配定位等精确制导领域开展应用基础和高技术的研究,并将一系列高水平成果应用于国防高技术武器系统中。 ·多谱成像与遥感图像处理 研究微波辐射特性及成像技术、激光雷达成像信号处理和遥感图像处理与

图像识别技术的现状和未来

图像识别技术的背景 知了图像识别科技,是一家以图像识别算法为核心的高科技企业,目前已经开发出了,知了点拍,钢管,钢筋智能点数app。识别率高,点数速度快,极大的方便了需要对钢管,钢筋点数人员的工作,提高了效率,知了点拍,是施工和建材经销商的好帮手。 移动互联网、智能手机以及社交网络的发展带来了海量图片信息,根据BI五月份的文章,Instagram每天图片上传量约为6000万;今年2月份WhatsApp每天的图片发送量为5亿;国的微信朋友圈也是以图片分享为驱动。不受地域和语言限制的图片逐渐取代了繁琐而微妙的文字,成为了传词达意的主要媒介。图片成为互联网信息交流主要媒介的原因主要在于两点:第一,从用户读取信息的习惯来看,相比于文字,图片能够为用户提供更加生动、容易理解、有趣及更具艺术感的信息;第二,从图片来源来看,智能手机为我们带来方便的拍摄和截屏手段,帮助我们更快的用图片来采集和记录信息。 但伴随着图片成为互联网中的主要信息载体,难题随之出现。当信息由文字记载时,我们可以通过关键词搜索轻易找到所需容并进行任意编辑,而当信息是由图片记载时,我们却无法对图片中的容进行检索,从而影响了我们从图片中找到关键容的效率。图片给我们带来了快捷的信息记录和分享方式,却降低了我们的信息检索效率。在这个环境下,计算机的图像识别技术就显得尤为重要。 图像识别是计算机对图像进行处理、分析和理解,以识别各种不同模式的目标

和对像的技术。识别过程包括图像预处理、图像分割、特征提取和判断匹配。简单来说,图像识别就是计算机如何像人一样读懂图片的容。借助图像识别技术,我们不仅可以通过图片搜索更快的获取信息,还可以产生一种新的与外部世界交互的方式,甚至会让外部世界更加智能的运行。百度彦宏在2011年提到“全新的读图时代已经来临”,现在随着图形识别技术的不断进步,越来越多的科技公司开始涉及图形识别领域,这标志着读图时代正式到来,并且将引领我们进入更加智能的未来。 图像识别的初级阶段——娱乐化、工具化 在这个阶段,用户主要是借助图像识别技术来满足某些娱乐化需求。例如,百度魔图的“大咖配”功能可以帮助用户找到与其长相最匹配的明星,百度的图片搜索可以找到相似的图片;Facebook研发了根据相片进行人脸匹配的DeepFace;雅虎收购的图像识别公司IQ Engine开发的Glow可以通过图像识别自动生成照片的标签以帮助用户管理手机上的照片;国专注于图像识别的创业公司旷视科技成立了VisionHacker游戏工作室,借助图形识别技术研发移动端的体感游戏。 这个阶段还有一个非常重要的细分领域——OCR(Optical Character Recognition,光学字符识别),是指光学设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,就是计算机对文字的阅读。语言和文字是我们获取信息最基本、最重要的途径。在比特世界,我们可以借助互联网和计算机轻松的获取和处理文字。但一旦文字以图片的形式表现出来,就对我们获取和处理文字平添了很多麻烦。这一方面表现为数字世界中由于特定原因被存储称图片格式的文字;另一方面是我们在现实生活中看到的所有物理形态的文字。所以我们需要借助OCR技术将这些文字和信息提取出来。在这方面,国产品包括百度的涂书笔记和百度翻译等;而谷歌借助经过DistBelief 训练的大型分布式神经网络,对于Google 街景图库的上千万门牌号的识别率超过90%,每天可识别百万门牌号。 在这个阶段,图像识别技术仅作为我们的辅助工具存在,为我们自身的人类视觉提供了强有力的辅助和增强,带给了我们一种全新的与外部世界进行交互的方

人工智能YOLO V2 图像识别实验报告

第一章前言部分 1.1课程项目背景与意义 1.1.1课程项目背景 视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国把对计算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重大挑战。计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图象信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。作为一门学科,计算机视觉开始于60年代初,但在计算机视觉的基本研究中的许多重要进展是在80年代取得的。计算机视觉与人类视觉密切相关,对人类视觉有一个正确的认识将对计算机视觉的研究非常有益。 计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。 科学技术的发展是推动人类社会进步的主要原因之一,未来社会进一步地朝着科技化、信息化、智能化的方向前进。在信息大爆炸的今天,充分利用这些信息将有助于社会的现代化建设,这其中图像信息是目前人们生活中最常见的信息。利用这些图像信息的一种重要方法就是图像目标定位识别技术。不管是视频监控领域还是虚拟现实技术等都对图像的识别有着极大的需求。一般的图像目标定位识别系统包括图像分割、目标关键特征提取、目标类别分类三个步骤。 深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习的概念由Hinton等人于2006年提出。基于深度置信网络提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。 深度学习是机器学习中的一个新的研究领域,通过深度学习的方法构建深度网络来抽取特征是目前目标和行为识别中得到关注的研究方向,引起更多计算机视觉领域研究者对深度学习进行探索和讨论,并推动了目标和行为识别的研究,推动了深度学习及其在目标和行为识别中的新进展。基于这个发展趋势,我们小组选择了基于回归方法的深度学习目标识别算法YOLO的研究。 1.1.2课程项目研究的意义 众所周知,当前是信息时代,信息的获得、加工、处理以及应用都有了飞跃

人脸识别技术的主要研究方法

1、绪论 人脸识别是通过分析脸部器官的唯一形状和位置来进行身份鉴别。人脸识别是一种重要的生物特征识别技术,应用非常广泛。与其它身份识别方法相比,人脸识别具有直接、友好和方便等特点,因而,人脸识别问题的研究不仅有重要的应用价值,而且在模式识别中具有重要的理论意义,目前人脸识别已成为当前模式识别和人工智能领域的研究热点。本章将简单介绍几种人脸识别技术的研究方法。 关键词:人脸识别 2、人脸识别技术的主要研究方法 目前在国内和国外研究人脸识别的方法有很多,常用的方法有:基于几何特征的人脸识别方法、基于代数特征的人脸识别方法、基于连接机制的人脸识别方法以及基于三维数据的人脸识别方法。人脸识别流程图如图2.1所示: 图2.1人脸识别流程图 3、基于几何特征的人脸识别方法 基于特征的方法是一种自下而上的人脸检测方法,由于人眼可以将人脸在不此研究人员认为有一个潜在的假设:人脸或人脸的部件可能具有在各种条件下都不会改变的特征或属性,如形状、肤色、纹理、边缘信息等。基于特征的方法的目标就是寻找上述这些不变特征,并利用这些特征来定位入脸。这类方法在特定的环境下非常有效且检测速度较高,对人脸姿态、表情、旋转都不敏感。但是由于人脸部件的提取通常都借助于边缘算子,因此,这类方法对图像质量要求较高,对光照和背景等有较高的要求,因为光照、噪音、阴影都极有可能破坏人脸部件的边缘,从而影响算法的有效性。 模板匹配算法首先需要人TN作标准模板(固定模板)或将模板先行参数化(可变模板),然后在检测人脸时,计算输入图像与模板之间的相关值,这个相关值通常都是独立计算脸部轮廓、眼睛、鼻子和嘴各自的匹配程度后得出的综合描述,最后再根据相关值和预先设定的阈值来确定图像中是否存在人脸。基于可变模板的人脸检测算法比固定模板算法检测效果要好很多,但是它仍不能有效地处理人脸尺度、姿态和形状等方面的变化。 基于外观形状的方法并不对输入图像进行复杂的预处理,也不需要人工的对人脸特征进行分析或是抽取模板,而是通过使用特定的方法(如主成分分析方法(PCA)、支持向量机(SVM)、神经网络方法(ANN)等)对大量的人脸和非人脸样本组成的训练集(一般为了保证训练得到的检测器精度,非人脸样本集的容量要为人脸样本集的两倍以上)进行学习,再将学习而成的模板或者说分类器用于人脸检测。因此,这也是j 种自下而上的方法。这种方法的优点是利用强大的机器学习算法快速稳定地实现了很好的检测结果,并且

图像识别技术

伴随着通信技术与信息处理技术的迅猛发展,越来越多的纸质文档通过数字采集设备转换成文本图像,从而使文本图像数据能够快捷的在网络、卫星、传真通信信道中传输,因此,文本图像已逐渐成一个重要的信息来源。但是,现有的文本图像处理系统自动化程度低,且通用性不高,无法满足文本图像处理广泛性与实时性的要求。因此,研究如何对文本图像进行分析与处理,以便高效、快捷的获取文本图像的信息,是一项十分有意义的研究课题。本文在总结已有研究成果的基础上对文本图像的识别检索、预处理、版面分析和表格图像识别展开研究。所做的主要工作如下:1.依据图像的灰度分布和结构特征差异,对基于图像信息度量的文本图像识别检索算法进行改进,构造一种基于信息度量与Radon变换的文本图像识别检索算法。该算法综合利用文本图像与连续色调】图像的灰度分布与结构特征差异进行文本图像的识别检索。实验结果表明,所构造算法可有效降低文本图像识别检索的误识率。2.对基于Hough变换的文本图像倾斜检 图像识别,是利用计算机对图像进行处理、分析和理解,以识别各种不同模 式的目标和对像的技术。 图像识别可能是以图像的主要特征为基础的。每个图像都有它的特征,如字 母A有个尖,P有个圈、而Y的中心有个锐角等。对图像识别时眼动的研究表明, 视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向 突然改变的地方,这些地方的信息量最大。由此可见,在图像识别过程中,知觉 机制必须排除输入的多余信息,抽出关键的信息。 图像识别的目的在于用计算机自动处理图像信息,以代替人去完成图像分类 及辨识的任务。数字图像处理与识别技术是模式识别领域一个重要的研究方向, 近几十年来,图像识别技术取得了深入和迅速的发展,并广泛应用于图像遥感、机 器人视觉、生物医学、地质勘探等多个领域。 随着图像识别技术在多领域的发展,由其在计算机视觉和图像处理研究中,已经取得了一定的研究成果。Mallat在小波变换中滤波器的设计、Belhumeur在Fisher变换中的识别模型和Largrange优化方式建立支持向量机。本文在总结上述研究成果的基础上,首先对摄像头采集的数据进行了处理,完成JPEG的编码,详细讨论了JPEG图像解码的过程并实现了其算法。

数字图像处理技术的研究现状与发展方向

数字图像处理技术的研究现状与发展方向 孔大力崔洋 (山东水利职业学院,山东日照276826) 摘要:随着计算机技术的不断发展,数字图像处理技术的应用领域越来越广泛。本文主要对数字图像处理技术的方法、优点、数字图像处理的传统领域及热门领域及其未来的发展等进行相关的讨论。 关键词:数字图像处理;特征提取;分割;检索 引言 图像是指物体的描述信息,数字图像是一个物体的数字表示,图像处理则是对图像信息进行加工以满足人的视觉心理和应用需求的行为。数字图像处理是指利用计算机或其他数字设备对图像信息进行各种加工和处理,它是一门新兴的应用学科,其发展速度异常迅速,应用领域极为广泛。 数字图像处理的早期应用是对宇宙飞船发回的图像所进行的各种处理。到了70年代,图像处理技术的应用迅速从宇航领域扩展到生物医学、信息科学、资源环境科学、天文学、物理学、工业、农业、国防、教育、艺术等各个领域与行业,对经济、军事、文化及人们的日常生活产生重大的影响。 数字图像处理技术发展速度快、应用范围广的主要原因有两个。最初由于数字图像处理的数据量非常庞大,而计算机运行处理速度相对较慢,这就限制了数字图像处理的发展。现在计算机的计算能力迅速提高,运行速度大大提高,价格迅速下降,图像处理设备从中、小型计算机迅速过渡到个人计算机,为图像处理在各个领域的应用准备了条件。第二个原因是由于视觉是人类感知外部世界最重要的手段。据统计,在人类获取的信息中,视觉信息占60%,而图像正是人类获取信息的主要途径,因此,和视觉紧密相关的数字图像处理技术的潜在应用范围自然十分广阔。 1数字图像处理的目的 一般而言,对图像进行加工和分析主要有以下三方面的目的[1]: (1)提高图像的视感质量,以达到赏心悦目的目的。如去除图像中的噪声,改变图像中的亮度和颜色,增强图像中的某些成分与抑制某些成分,对图像进行几何变换等,从而改善图像的质量,以达到或真实的、或清晰的、或色彩丰富的、或意想不到的艺术效果。 (2)提取图像中所包含的某些特征或特殊信息,以便于计算机进行分析,例如,常用做模式识别和计算机视觉的预处理等。这些特征包含很多方面,如频域特性、灰度/颜色特性、边界/区域特性、纹理特性、形状/拓扑特性以及关系结构等。 (3)对图像数据进行变换、编码和压缩,以便于图像的存储和传输。 2数字图像处理的方法 数字图像处理按处理方法分,主要有以下三类,即图像到图像的处理、图像到数据的处理和数据到图像的处理[2]。 (1)图像到图像。图像到图像的处理,其输入和输出均为图像。这种处理技术主要有图像增强、图像复原和图像编码。 首先,各类图像系统中图像的传送和转换中,总要造成图像的某些降质。第一类解决方法不考虑图像降质的原因,只将图像中感兴趣的特征有选择地突出,衰减次要信息,提高图像的可读性,增强图像中某些特征,使处理后的图像更适合人眼观察和机器分析。这类方法就是图像增强。例如,对图像的灰度值进行修正,可以增强图像的对比度;对图像进行平滑,可以抑制混入图像的噪声;利用锐化技

图像识别匹配技术原理

第1章绪论 1.1研究背景及意义 数字图像,又称数码图像或数位图像,是二维图像用有限数字数值像素的表示。通常,像素在计算机中保存为二维整数数组的光栅图像,这些值经常用压缩格式进行传输和储存。数字图像可以由许多不同的输入设备和技术生成,例如数码相机、扫描仪、坐标测量机等,也可以从任意的非图像数据合成得到,例如数学函数或者三维几何模型,三维几何模型是计算机图形学的一个主要分支。数字图像处理领域就是研究它们的变换算法。 数字图像处理(Digital Image Processing)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。数字图像处理的产生和迅速发展主要受三个因素的影响:一是计算机的发展;二是数学的发展(特别是离散数学理论的创立和完善);三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。 图像配准(Image registration)就是将不同时间、不同传感器(成像设备)或不同条件下(天候、照度、摄像位置和角度等)获取的两幅或多幅图像进行匹配、叠加的过程,它已经被广泛地应用于遥感数据分析、计算机视觉、图像处理等领域。 图像配准的方法迄今为止,在国内外的图像处理研究领域,已经报道了相当多的图像配准研究工作,产生了不少图像配准方法。总的来说,各种方法都是面向一定范围的应用领域,也具有各自的特点。比如计算机视觉中的景物匹配和飞行器定位系统中的地图匹配,依据其完成的主要功能而被称为目标检测与定位,根据其所采用的算法称之为图像相关等等。 基于灰度信息的图像配准方法一般不需要对图像进行复杂的预先处理,而是利用图像本身具有灰度的一些统计信息来度量图像的相似程度。主要特点是实现简单,但应用范围较窄,不能直接用于校正图像的非线性形变,在最优变换的搜索过程中往往需要巨大的运算量。经过几十年的发展,人们提出了许多基于灰度信息的图像配准方法,大致可以分为三类:互相关法(也称模板匹配法)、序贯相似度检测匹配法、交互信息法。 目前主要图像配准方法有基于互信息的配准方法,基于相关性的配准方法和基于梯度的配准方法。其中基于梯度的方法基本很少单独使用,而作为一个辅助

模式识别人工智能论文

浅谈人工智能与模式识别的应用 一、引言 随着计算机应用范围不断的拓宽,我们对于计算机具有更加有效的感知“能力”,诸如对声音、文字、图像、温度以及震动等外界信息,这样就可以依靠计算机来对人类的生存环境进行数字化改造。但是从一般的意义上来讲,当前的计算机都无法直接感知这些信息,而只能通过人在键盘、鼠标等外设上的操作才能感知外部信息。虽然摄像仪、图文扫描仪和话筒等相关设备已经部分的解决了非电信号的转换问题,但是仍然存在着识别技术不高,不能确保计算机真正的感知所采录的究竟是什么信息。这直接使得计算机对外部世界的感知能力低下,成为计算机应用发展的瓶颈。这时,能够提高计算机外部感知能力的学科——模式识别应运而生,并得到了快速的发展,同时也成为了未来电子信息产业发展的必然趋势。 人工智能中所提到的模式识别是指采用计算机来代替人类或者是帮助人类来感知外部信息,可以说是一种对人类感知能力的一种仿真模拟。近年来电子产品中也加入了诸多此类的功能:如手机中的指纹识别解锁功能;眼球识别解锁技术;手势拍照功能亦或是机场先进的人耳识别技术等等。这些功能看起来纷繁复杂,但如果需要一个概括的话,可以说这都是模式识别技术给现代生活带来的福分。它探讨的是计算机模式识别系统的建立,通过计算机系统来模拟人类感官对外界信息的识别和感知,从而将非电信号转化为计算机可以识别的电信号。

二、人工智能和模式识别 (一)人工智能。人工智能(Artificial Intelligence),是相对与人的自然智能而言的,它是指采用人工的方法及技术,对人工智能进行模仿、延伸及扩展,进而实现“机器思维”式的人工智能。简而言之,人工智能是一门研究具有智能行为的计算模型,其最终的目的在于建立一个具有感知、推理、学习和联想,甚至是决策能力的计算机系统,快速的解决一些需要专业人才能解决的问题。从本质上来讲,人工智能是一种对人类思维及信息处理过程的模拟和仿真。 (二)模式识别。模式识别,即通过计算机采用数学的知识和方法来研究模式的自动处理及判读,实现人工智能。在这里,我们将周围的环境及客体统统都称之为“模式”,即计算机需要对其周围所有的相关信息进行识别和感知,进而进行信息的处理。在人工智能开发,即智能机器开发过程中的一个关键环节,就是采用计算机来实现模式(包括文字、声音、人物和物体等)的自动识别,其在实现智能的过程中也给人类对自身智能的认识提供了一个途径。在模式识别的过程中,信息处理实际上是机器对周围环境及客体的识别过程,是对人参与智能识别的一个仿真。相对于人而言,光学信息及声学信息是两个重要的信息识别来源和方式,它同时也是人工智能机器在模式识别过程中的两个重要途径。在市场上具有代表性的产品有:光学字符识别系统以及语音识别系统等。 在这里的模式识别,我们可以将之理解成为:根据识别对象具有特征的观察值来将其进行分类的一个过程。采用计算机来进行模式识别,是在上世纪60年代初发展起来的一门新兴学科,但同样也是未来一段实践中发展的必然方向。在生活节奏相当之快的今天人们希望电子产品可以为我们的生活提供更多的便利条件。因此在未来相当一段时间内模式识别技术依然是发展的必然趋势。

人脸检测和识别技术的文献综述

人脸识别技术综述 摘要:在阅读关于人脸检测识别技术方面文献后,本文主要讨论了人脸识别技术的基本介绍、研究历史,人脸检测和人脸识别的主要研究方法,人脸识别技术的应用前景,并且总结了人脸识别技术的优越性和当下研究存在的困难。 关键词:人脸识别;人脸检测;几何特征方法;模板匹配方法;神经网络方法;统计方法;模板匹配;基于外观方法; 随着社会的发展,信息化程度的不断提高,人们对身份鉴别的准确性和实用性提出了更高的要求,传统的身份识别方式已经不能满足这些要求。人脸识别技术(FRT)是当今模式识别和人工智能领域的一个重要研究方向.虽然人脸识别的研究已有很长的历史,各种人脸识别的技术也很多,但由于人脸属于复杂模式而且容易受表情、肤色和衣着的影响,目前还没有一种人脸识别技术是公认快速有效的[1]基于生物特征的身份认证技术是一项新兴的安全技术,也是本世纪最有发展潜力的技术之一[2]。 1. 人脸识别技术基本介绍 人脸识别技术是基于人的脸部特征,一个完整的人脸识别过程一般包括人脸检测和人脸识别两大部分,人脸检测是指计算机在包含有人脸的图像中检测出人脸,并给出人脸所在区域的位置和大小等信息的过程[3],人脸识别就是将待识别的人脸与已知人脸进行比较,得

出相似程度的相关信息。 计算机人脸识别技术也就是利用计算机分析人脸图象, 进而从中出有效的识别信息, 用来“辨认”身份的一门技术.人脸自动识别系统包括三个主要技术环节[4]。首先是图像预处理,由于实际成像系统多少存在不完善的地方以及外界光照条件等因素的影响,在一定程度上增加了图像的噪声,使图像变得模糊、对比度低、区域灰度不平衡等。为了提高图像的质量,保证提取特征的有有效性,进而提高识别系统的识别率,在提取特征之前,有必要对图像进行预处理操作;人脸的检测和定位,即从输入图像中找出人脸及人脸所在的位置,并将人脸从背景中分割出来,对库中所有的人脸图像大小和各器官的位置归一化;最后是对归一化的人脸图像应用人脸识别技术进行特征提取与识别。 2. 人脸识别技术的研究历史 国内关于人脸自动识别的研究始于二十世纪80年代,由于人脸识别系统和视频解码的大量运用,人脸检测的研究才得到了新的发展利用运动、颜色和综合信息等更具有鲁棒性的方法被提出来变形模板,弹性曲线等在特征提取方面的许多进展使得人脸特征的定位变得更为准确。 人脸识别的研究大致可分为四个阶段。第一个阶段以Bertillon,Allen和Parke为代表,主要研究人脸识别所需要的面部特征;第二个阶段是人机交互识别阶段;第三个阶段是真正的机器自动识别阶段;第四个阶段是鲁棒的人脸识别技术的研究阶段。目前,国外多所

关于人工智能中的图像识别技术的研究

191 关于人工智能中的图像识别技术的研究 翁和王 (武夷学院数学与计算机学院,福建武夷山354300) 摘要:图像识别技术作为在信息时代发展起来的一项信息技术,其主要是利用计算机对人工进行替代,实现对众多的物 理信息进行处理。计算机技术快速发展也推动了图像识别技术得以迅猛的发展。文章就图像识别的技术原理、模式识别进行图像识别技术概述,并对其识别过程进行一定的分析,重点对神经网络以及非线性降维两个形式的图像识别技术加以分析。以期对图像识别有关的研究人员与应用人士有所参考。关键词:人工智能;原理与过程;图像识别技术;非线性;神经网络中图分类号:TP18文献标识码:A 文章编号:1673-1131(2016)10-0191-02 0引言 图像识别技术作为人工智能内的重要领域之一,在计算机技术和信息技术快速发展的背景下,其也得到了愈发广泛的使用,其在医疗诊断、指纹识别、面部识别以及卫星云图识别等方面具有着很好的应用。图像识别技术通常是指利用计算机对系统前端捕获的图片根据既定的目标对其进行处理。图像识别在人们日常的生活中也得到普遍的应用,诸如条码识别、车牌捕捉以及手写识别等。随着其不断的发展与完善,其今后的应用领域也会更加的广泛。 1图像识别技术的概述1.1图像识别的技术原理 事实上,图像识别具有的原理并非很深奥,主要是图像识别所需处理的信息非常的复杂。计算机中的所有处理技术均不能随意出现,是众多学者通过实践获得的启示,通过程序使其得到模拟与实现。计算机实现图像识别所需的原理与人类进行图像识别所需的原理基本上是一致的,仅仅是计算机不存在人类视觉和感觉方面的影响。人类在进行图像识别过程中并非仅是利用这一图像存在于脑海内的记忆加以识别,而是通过图像自身拥有的特征对其进行相应的分类,之后利用各个类别拥有的特征使图片被识别出来。当我们看到图片时,大脑便会快速感知出以前见过这张或与之相类似的图片与否。事实上在看到和感知间已经实现了快速的识别,这一识别与搜索存在一定的相似性[1]。在识别过程中,大脑将会按照存储记忆内被分好类的图片展开识别,检查其是否和这一图像存在相同或者是类似特征记忆存储,便识别出以往时候看见过这一图片。计算机进行图像识别的原理也是这样,利用分类和提取出图像的重要特征,并对多余的无用特征加以有效地排除,以此实现对图像的识别。计算机所能提取出来的上述特征有时会较为明显,而有时也会非常的普通,这在极大程度上对计算机识别效率造成一定的影响。总而言之,利用计算机进行视觉识别时,图像中的内容一般是通过图像特征对其加以描述的[2]。 1.2模式识别 模式识别作为信息科学与人工智能中的重要组成,其通 常是对现象和事物处于不同形式中信息实现处理与分析,以便能够达到对现象与事物进行分类、描述以及辨认等目标。而计算机能够实现图像识别便是对人类进行图像识别时的一种模拟,在实现图像识别时,能够展开模式识别是不可或缺的。以往的模式识别仅仅是人类所掌握基本智能之一,伴随人工智能以及计算机技术得到兴起与发展,人类自身具有的识别 模式便无法再满足人类的生活需求,对此人们便需要利用计算机来对人类脑力劳动进行一定程度的替代与扩展。这也就产生了计算机形式的模式识别。简而言之,模式识别便是对数据实现分类,其是一门和数学有着密切联系的科学,其所运 用的大量思想便是数学中的统计和概率[3] 。可以将模式识别分成统计模糊模式、识别模式识别以及句法模式识别三类。 2图像识别技术的识别过程 由于计算机进行图像识别和人类进行图像识别所采用的是一样的原理,因此上述两种识别过程也会存在一定的相似性。可以将图像识别技术划分为如下几步:第一步,信息的获取,其是指利用传感器将声音和光等信息装换为电信号,简而言之便是获取识别对象具有的基本信息,同时将其装换成为计算机可以识别的信息。第二步,预处理,其是指对图像进行去噪、变换以及平滑等处理操作,以此来提升图像所具有的重要特点。第三步,特征抽取与选择,其是在模式识别过程中,要对图像进行特征的抽取与选择,简而言之便是识别的图像是多种多样的,若想通过一定的方式将其分离开,便要对图像中拥有的自身特征进行识别,在特征的获取时便称为特征抽取[4]。在进行特征抽取过程中,获取的特征并非一定对本次识别有所价值,此时便要对所获取的特征进行一定的提取,这便是特征选择。对于图像识别整个过程而言,特征抽取与选择时期中最为关键的步骤之一,因此,这一步使进行图像识别理解时的重点内容。第四步,分类器设计与分类决策,其中分类器设计即利用训练来制定出一个识别规则,借此识别规则便能够获得一个特征种类,从而让图像识别可以达到更高的辨识率。而分类决策则是对特征空间内的被识别对象实现分类的最佳识别方法。 3图像识别技术的研究分析 3.1神经网络形式的图像识别技术 神经网络形式的图像识别是目前较为新型的技术,其是基于以往的图像识别方式,并将神经网络算法进行有效的融合。这里所说的神经网络指的是人工神经网络,换句话说便是该神经网络并非是动物体所拥有的神经网络,而是人类根据动物神经网络进行人工模拟的一种神经网络。对于神经网络形式的图像识别技术而言,遗传算法和BP 神经网络进行有效的结合是目前基于神经网络形式的图像识别技术内最为经典的模型,其在诸多的领域之中均有所应用。对图像识别系统运用神经网络系统,通常先对图像特征进行提取,之后将图像特征向神经网络中加以映射,以此实现对图像的识别与分类。例如,对于智能汽车监控中拍照识别技术而言, 2016 (Sum.No 166) 信息通信 INFORMATION &COMMUNICATIONS 2016年第10期(总第166期)

相关文档
最新文档