基于libsvm的gist和phog特征的图像分类研究

基于libsvm的gist和phog特征的图像分类研究
基于libsvm的gist和phog特征的图像分类研究

研究生技术报告题目:基于libsvm的图像分类研究

编号:20132098

执笔人:刘金环

完成时间:2013-11-23

摘要

随着科学技术的飞速发展,机器学习与人工智能技术的不断创新,人们对特定信息检索的需求逐渐增加,使得如何对资源进行合理有效的分类成为一个关键问题。支持向量机(SVM)是一种建立在统计学习理论基础之上的机器学习方法,由于其基于小样本训练的优越性,被广泛应用于模式识别的各个领域,在图像检索、人脸识别等中充分了体现了其优越性,越来越受到广泛的关注和重视。

本文主要介绍了基于libsvm分类器的分类问题。本文以gist和phog特征为例简单实现了图像的分类问题,并通过查询准确性对这两种分类方法进行对比和分析。由仿真结果可知,gist特征分类要好于phog的特征分类,仿真效果较为理想。

目录

1 课题意义..................................................................................................... 错误!未定义书签。

2 技术要求及性能指标................................................................................. 错误!未定义书签。3方案设计及算法原理.................................................................................. 错误!未定义书签。

3.1基于libsvm的gist特征提取分类.............................................. 错误!未定义书签。

3.1.1算法原理 (1)

3.1.2设计框图 (2)

3.2基于libsvm的phog特征提取分类.............................................. 错误!未定义书签。

3.2.1算法原理.............................................................................. 错误!未定义书签。

3.2.2设计框图.............................................................................. 错误!未定义书签。4代码及相关注释. (4)

4.1基于libsvm的gist特征提取分类仿真结果 (6)

4.1.1代码及注释 (9)

4.1.2测试结果 (9)

4.2基于libsvm的phog特征提取分类仿真结果 (9)

4.2.1代码及注释 (9)

4.2.2测试结果 (12)

4.3基于libsvm的gist特征分类不同训练集测试结果.................. 错误!未定义书签。

4.3.1代码及注释.......................................................................... 错误!未定义书签。

4.3.2测试结果 (14)

5实验结果分析.............................................................................................. 错误!未定义书签。6总结 ............................................................................................................. 错误!未定义书签。

1.课题意义

伴随着网络和多媒体技术的飞速发展,图像作为一种内容丰富、表现直观的媒体信息,越来越多的受到人们的关注。在现实生活中时时刻刻都会有大量的图像产生,如何从这些图像信息中找出符合用户要求的图像,成为了一个关键问题。

图像分类就是模式识别的过程,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。图像的内容丰富多彩,其所包含的内容抽象复杂。由于目前对图像理解和计算机视觉发展水平的限制,人类对图像的理解与计算机对图像的描述存在着较大的差异。并且,不同的人对同一幅图像的理解和描述也存在着差距,甚至大相径庭,这也使得计算机对图像进行分类成为一种必要。

由上可知,对基于libsvm的图像分类研究具有实际的应用价值和重要的研究意义。

2.技术要求及性能指标

要求了解libsvm的安装过程及简单的使用方法,通过MATLAB平台编程实现对gist图像特征和 phog图像特征的提取,并分别用所提取的特征对训练集的图像进行训练,从而完成对测试集图像的分类,得出分类准确度。

本文主要以梅兰竹菊和松竹梅图像为例,分别用以上两种特征对图像进行分类,并对分类准确性进行对比。

3.方案设计及算法原理

3.1 基于libsvm的gist特征提取分类

3.1.1 算法原理

通过creatGabor()函数和gistGabor()函数提取训练图像的gist特征,然后对不同类别的图像进行标签设置,用svmtrain()函数完成对训练集图像的训练过程,同样提取测试集图像的gist特征并对不同类别的图像进行标签设置,用svmpredict()函数完成对测试集图像的测试,从而完成分类过程,得到分类准确率。

3.1.2 框图设计

.

3.2 基于libsvm 的phog 特征提取分类

3.2.1 算法原理

通过phog()函数提取训练图像的phog 特征,然后对不同类别的图像进行

开始

读入训练图像

提取gist 图像特征

设置训练图像标签

对训练集图像进行训练

读入测试图像

提取测试图像的gist 图像特征

设置测试图像的标签

对读入的测试图像进行测试

得到准确率

结束

标签设置,用svmtrain()函数完成对训练集图像的训练过程,同样提取测试集图像的phog特征并对不同类别的图像进行标签设置,用svmpredict函数完成对测试集图像的测试,从而完成分类过程,得到分类准确率。

3.2.2 框图设计

.

开始

读入训练图像

提取phog图像特征

设置训练图像标签

对训练集图像进行训练

读入测试图像

提取测试图像的phog图像特征

设置测试图像的标签

对读入的测试图像进行测试

得到准确率

结束

4.代码及相关注释

本文主要采用梅兰竹菊和松竹梅两组图像,其图像大小均为60*60像素,且每一类的训练集均为10个图片,每一类的测试集均为30个图片。

梅兰竹菊组的训练图像如下:

梅兰竹菊组的测试图像如下:

松竹梅组的训练图像如下:

松竹梅组的测试图像如下:

4.1 基于libsvm的gist特征提取分类仿真结果4.1.1 代码及注释

梅兰竹菊训练样本代码:

clc

clear all

close all

tic;

%读入训练图像;

A=dir('D:\梅兰竹菊gist\train\*.jpg');

C=[];

for k=1:size(A)%k为训练图像的总数;

B=strcat('D:\梅兰竹菊gist\train\',A(k).name);

img=imread(B);

%获取图像的GIST特征向量;

Nblocks = 4;

imageSize = 60;

orientationsPerScale = [8 8 8 8];%每个数值范围的方向数量

numberBlocks = 4;

createGabor(orientationsPerScale, imageSize);

G = createGabor(orientationsPerScale, imageSize);

output = prefilt(double(img), 4);

g = gistGabor(output, numberBlocks, G);

C(k,:)=g;%C为该图像的特征矩阵;

end

%设置训练图像标签;

s=[];

for i=1:4

A=i*ones(10,1);

s=[s;A];

end

%对图像进行训练;

model = svmtrain(s, C);

t1=toc

梅兰竹菊测试样本代码:

Tic;

A=dir('D:\梅兰竹菊gist\test\*.jpg');

D=[];

%读入测试图像;

for k=1:size(A)%k为测试图像的总数;

B=strcat('D:\梅兰竹菊gist\test\',A(k).name);

img=imread(B);

%获取图像的GIST特征向量;

Nblocks = 4;

imageSize = 60;

orientationsPerScale = [8 8 8 8];%每个数值范围的方向数量numberBlocks = 4;

createGabor(orientationsPerScale, imageSize);

G = createGabor(orientationsPerScale, imageSize);

output = prefilt(double(img), 4);

g = gistGabor(output, numberBlocks, G);

D(k,:)=g;%C为该图像的特征矩阵;

end

T=[];

for i=1:4

A=i*ones(30,1);

T=[T;A];

end

%对图像进行测试;

[predict_label, accuracy, dec_values] = svmpredict(T,D, model); T2=toc

松竹梅训练样本代码:

clc

clear all

close all

tic

%读入训练图像;

A=dir('D:\松竹梅gist\train\*.jpg');

C=[];

for k=1:size(A)%k为训练图像的总数;

B=strcat('D:\松竹梅gist\train\',A(k).name);

img=imread(B);

%获取图像的GIST特征向量;

Nblocks = 4;

imageSize = 60;

orientationsPerScale = [8 8 8 8];%每个数值范围的方向数量numberBlocks = 4;

createGabor(orientationsPerScale, imageSize);

G = createGabor(orientationsPerScale, imageSize);

output = prefilt(double(img), 4);

g = gistGabor(output, numberBlocks, G);

C(k,:)=g;%C为该图像的特征矩阵;

end

%设置训练图像标签;

s=[];

for i=1:3

A=i*ones(10,1);

s=[s;A];

end

%对图像进行训练;

model = svmtrain(s, C);

T1=toc

松竹梅测试样本代码:

tic

A=dir('D:\松竹梅gist\test\*.jpg');

D=[];

%读入测试图像;

for k=1:size(A)%k为测试图像的总数;

B=strcat('D:\松竹梅gist\test\',A(k).name);

img=imread(B);

%获取图像的GIST特征向量;

Nblocks = 4;

imageSize = 60;

orientationsPerScale = [8 8 8 8];%每个数值范围的方向数量

numberBlocks = 4;

createGabor(orientationsPerScale, imageSize);

G = createGabor(orientationsPerScale, imageSize);

output = prefilt(double(img), 4);

g = gistGabor(output, numberBlocks, G);

D(k,:)=g;%C为该图像的特征矩阵;

end

T=[];

for i=1:3

A=i*ones(30,1);

T=[T;A];

end

%对图像进行测试;

[predict_label, accuracy, dec_values] = svmpredict(T,D, model);

T2=toc

4.1.2 测试结果

梅兰竹菊gist测试结果:对其进行四分类,其中每一类的训练图像为10幅,测试图像为30幅,测试时间为t=t1+t2=10.5512+20.4377=30.9889S,Accuracy = 87.5% (105/120) 。当改成orientationsPerScale=[8, 8, 4]时,测试结果变为t=t1+t2=7.6699+14.1259=21.7958S,Accuracy = 84.1667% (101/120) 。

松竹梅gist测试结果:对其进行三分类,其中每一类的训练图像为10幅,测试图像为30幅,测试时间为t=t1+t2=5.7285+15.0340=20.7625S,Accuracy = 91.1111% (82/90) 。

4.2 基于libsvm的phog特征提取分类仿真结果

4.2.1 代码及注释

梅兰竹菊训练样本代码:

clc

clear all

tic

%显示训练图像工作路径;

cd('D:\梅兰竹菊phog\train')

files=dir('*.jpg');

m=size(files,1);%m为训练图像的总数;

%获取训练图像的PHOG特征向量;

bin = 8;%直方图的方向个数;

angle = 360;%方向角度;

L=3;%图像分三层;

roi = [1;60;1;60];%提取图像大小;

C=[];

for k=1:m

p = anna_phog(files(k).name,bin,angle,L,roi);

C(k,:)=p;%C为该图像的特征矩阵;

end

%设置训练图像标签

s=[];

for i=1:4

A=i*ones(10,1);

s=[s;A];

end

%对图像进行训练;

model = svmtrain(s, C);

T1=toc

梅兰竹菊测试样本代码:

tic

%显示测试图像工作路径;

cd('D:\梅兰竹菊phog\test')

files=dir('*.jpg');

m=size(files,1);%m为测试图像的总数;

%获取测试图像的PHOG特征向量;

bin = 8;%直方图的方向个数;

angle = 360;%方向角度;

L=3;%图像分三层;

roi = [1;60;1;60];%提取图像大小;

D=[];

for k=1:m

p = anna_phog(files(k).name,bin,angle,L,roi);

D(k,:)=p;%D为该图像的特征矩阵;

end

%设置测试图像标签

for i=1:4

A=i*ones(30,1);

T=[T;A];

end

%对图像进行测试;

[predict_label, accuracy, dec_values] = svmpredict(T,D, model); T2=toc

松竹梅训练样本代码:

clc

clear all

close all

Tic;

%显示训练图像工作路径;

cd('D:\松竹梅phog\train')

files=dir('*.jpg');

m=size(files,1);%m为训练图像的总数;

%获取训练图像的PHOG特征向量;

bin = 8;%直方图的方向个数;

angle = 360;%方向角度;

L=3;%图像分三层;

roi = [1;60;1;60];%提取图像大小;

C=[];

for k=1:m

p = anna_phog(files(k).name,bin,angle,L,roi);

C(k,:)=p;%C为该图像的特征矩阵;

end

%设置训练图像标签

s=[];

for i=1:3

A=i*ones(10,1);

s=[s;A];

end

%对图像进行训练;

model = svmtrain(s, C);

T2=toc

松竹梅测试样本代码:

Tic;

%显示测试图像工作路径;

cd('D:\松竹梅phog\test')

files=dir('*.jpg');

m=size(files,1);%m为测试图像的总数;

%获取测试图像的PHOG特征向量;

bin = 8;%直方图的方向个数;

angle = 360;%方向角度;

L=3;%图像分三层;

roi = [1;60;1;60];%提取图像大小;

D=[];

for k=1:m

p = anna_phog(files(k).name,bin,angle,L,roi);

D(k,:)=p;%D为该图像的特征矩阵;

end

%设置测试图像标签

T=[];

for i=1:3

A=i*ones(30,1);

T=[T;A];

end

%对图像进行测试;

[predict_label, accuracy, dec_values] = svmpredict(T,D, model);

T2=toc;

4.2.2 测试结果

梅兰竹菊phog测试结果:对其进行四分类,其中每一类的训练图像为10幅,测试图像为30幅,测试时间为t=t1+t2=8.6881+10.0942=18.7823S,Accuracy = 53.3333% (64/120) 。改成L=0时,t=t1+t2=1.3464+2.0309=3.3773S,Accuracy = 43.3333% (52/120) ;改成L=2时,t=t1+t2=1.7162+3.2901=5.0063S,Accuracy = 51.6667% (62/120) 。

松竹梅phog测试结果:对其进行三分类,其中每一类的训练图像为10幅,测试图像为30幅,测试时间为t=t1+t2=2.3445+5.1615=7.506S,Accuracy = 70% (63/90) 。改成roi = [15;45;15;45]时,t=t1+t2=2.5186+5.8621=8.3807S,Accuracy = 75.5556% (68/90)。

4.3 基于libsvm的gist特征分类不同训练集测试结果

4.3.1 训练图像

训练图像组(1)为:

训练图像组(2)为:

训练图像组(3)为:

4.3.2 测试结果

训练图像组(1)的测试结果:测试时间为t=t1+t2=2.1293+4.7639=6.8932S,Accuracy = 81.1111% (73/90) 。

训练图像组(2)的测试结果:测试时间为t=t1+t2=2.8401+4.8126=7.6527S,Accuracy = 61.1111% (55/90) 。

训练图像组(3)的测试结果:测试时间为t=t1+t2=2.2477+4.9528=7.2005S,Accuracy = 63.3333% (57/90) 。

5.实验结果分析

综上可知,同一组图片,当用gist和phog提取特征时,其训练结果是不同的,gist图像特征用来分类的结果要相对好一些。由orientationsPerScale()函数和L()函数参数的改变可以看出,在进行特征提取时,所提取的图层数目越多,特征越精确,相应的分类准确率也越高。由roi()参数的改变可以看出,当以中心部分图像做特征提取时,分类准确度更高一些。

6.总结

本文主要介绍了libsvm用于分类器的实现问题,并设计了gist图像特征和phog图像特征的提取、训练及测试系统。成功完成了对图像的分类,并且通过改变部分函数的参数值,验证了其对分类准确率的影响。但是其中还存在一些问题,例如:图像的选择问题、图像的背景影响问题、函数参数设置的合理性问题等等,都或多或少的影响着分类准确率,由此可见,本程序还有待继续改善。总体来说,测试结果比较理想,分类比较成功。

图像识别技术的研究现状论文

图像识别技术研究现状综述 简介: 图像识别是指图形刺激作用于感觉器官,人们辨认出它是经验过的某一图形的过程,也叫图像再认。在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程,才能实现对图像的再认。图像识别技术是以图像的主要特征为基础的,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。对于熟悉的图形,由于掌握了它的主要特征,就会把它当作一个单元来识别,而不再注意它的细节了。这种由孤立的单元材料组成的整体单位叫做组块,每一个组块是同时被感知的。图像在人类的感知中扮演着非常重要的角色,人类随时随处都要接触图像。随着数字图像技术的发展和实际应用的需要,出现了另一类问题,就是不要求其结果输出是一幅完整的图像,而是将经过图像处理后的图像,再经过分割和描述提取有效的特征,进而加以判决分类,这就是近20年来发展起来的一门新兴技术科学一图像识别。它以研究某些对象或过程的分类与描述为主要内容,以研制能够自动处理某些信息的机器视觉系统,代替传统的人工完成分类和辨识的任务为目的。 图像识别的发展大致经历了三个阶段:文字识别、图像处理和识别及物体识别:文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,并从印刷文字识别到手写文字识别,应用非常广泛,并且已经研制了许多专用设备。图像处理和识别的研究,是从1965年开始的。过去人们主要是对照相技术、光学技术的研究,而现在则是利用计算技术、通过计算机来完成。计算机图像处理不但可以消除图像的失真、噪声,同时还可以进行图像的增强与复原,然后进行图像的判读、解析与识别,如航空照片的解析、遥感图像的处理与识别等,其用途之广,不胜枚举。物体识别也就是对三维世界的认识,它是和机器人研究有着密切关系的一个领域,在图像处理上没有特殊的难点,但必须知道距离信息,并且必须将环境模型化。在自动化技术已从体力劳动向部分智力劳动自动化发展的今天,尽管机器人的研究非常盛行,还只限于视觉能够观察到的场景。进入80年代,随着计算机和信息科学的发展,计算机视觉、人工智能的研究已成为新的动向 图像识别与图像处理的关系: 在研究图像时,首先要对获得的图像信息进行预处理(前处理)以滤去干扰、噪声,作几何、彩色校正等,以提供一个满足要求的图像。图像处理包括图像编码,图像增强、图像压缩、图像复原、图像分割等。对于图像处理来说,输入是图像,输出(即经过处理后的结果)也是图像。图像处理主要用来解决两个问题:一是判断图像中有无需要的信息;二是确定这些信息是什么。图像识别是指对上述处理后的图像进行分类,确定类别名称,它可以在分割的基础上选择需要提取的特征,并对某些参数进行测量,再提取这些特征,然后根据测量结果做出分类。为了更好地识别图像,还要对整个图像做结构上的分析,对图像进行描述,以便对图像的主要信息做一个好的解释,并通过许多对象相互间的结构关系对图像加深理解,以便更好帮助和识别。故图像识别是在上述分割后的每个部分中,找出它的形状及纹理特征,以便对图像进行分类,并对整个图像做结构上的分析。因而对图像识别环节来说,输入是图像(经过上述处理后的图像),输出是类别和图像的结构分析,而结构分析的结果则

遥感图像分类方法综述

龙源期刊网 https://www.360docs.net/doc/721957706.html, 遥感图像分类方法综述 作者:胡伟强鹿艳晶 来源:《中小企业管理与科技·下旬刊》2015年第08期 摘要:对传统图像监督分类方法和非监督分类方法在遥感图像分类中的应用进行总结, 对基于人工神经网络、模糊理论、小波分析、支持向量机等理论的新的遥感图像分类方法进行了介绍,并对遥感图像分类方法研究的发展趋势做了展望。 关键词:遥感图像;监督分类;分类精度 1 概述 遥感就是远离地表,借助于电磁波来收集、获取地表的地学、生物学、资源环境等过程和现象的科学技术。遥感技术系统由四部分组成:遥感平台、传感器、遥感数据接收及处理系统、分析系统。遥感数据就是用遥感器探测来自地表的电磁波,通过采样及量化后获得的数字化数据。 2 传统遥感图像分类方法 2.1 非监督分类方法 非监督分类方法也称为聚类分析。进行非监督分类时,不必对遥感图像影像地物获取先验类别知识,仅依靠遥感图像上不同类别地物光谱信息进行特征提取,根据图像本身的统计特征的差别来达到分类的目的。主要的算法有:K-均值聚类(K-means)算法和迭代自组织数据分析法(Iterative Self-organizing Data Analysis Techniques A, ISODATA)等。 2.2 监督分类方法 对于监督分类,训练区的选择要求有代表性,训练样本的选择要考虑到遥感图像的地物光谱特征,而且样本数目应能够满足分类的要求,否则,一旦样本数目超过一定的阈值时,分类器的精度便会下降。主要的算法有:最大似然分类(Maximum Likelihood classification,MLC)、最小距离分类、K-近邻分类等。 3 基于新理论的遥感图像分类方法 3.1 基于人工神经网络的遥感图像分类 在遥感图像的分类处理中,人工神经网络的输入层神经元表征遥感图像的输入模式。每一个输入层神经元对应于一个光谱波段,每一个输出层神经元则对应于一种土地覆盖类型。其

图像局部特征点检测算法综述

图像局部特征点检测算法综述 研究图像特征检测已经有一段时间了,图像特征检测的方法很多,又加上各种算法的变形,所以难以在短时间内全面的了解,只是对主流的特征检测算法的原理进行了学习。总体来说,图像特征可以包括颜色特征、纹理特等、形状特征以及局部特征点等。其中局部特点具有很好的稳定性,不容易受外界环境的干扰,本篇文章也是对这方面知识的一个总结。 本篇文章现在(2015/1/30)只是以初稿的形式,列出了主体的框架,后面还有许多地方需要增加与修改,例如2013年新出现的基于非线性尺度空间的KAZE特征提取方法以及它的改进AKATE等。在应用方面,后面会增一些具有实际代码的例子,尤其是基于特征点的搜索与运动目标跟踪方面。 1. 局部特征点 图像特征提取是图像分析与图像识别的前提,它是将高维的图像数据进行简化表达最有效的方式,从一幅图像的M×N×3的数据矩阵中,我们看不出任何信息,所以我们必须根据这些数据提取出图像中的关键信息,一些基本元件以及它们的关系。 局部特征点是图像特征的局部表达,它只能反正图像上具有的局部特殊性,所以它只适合于对图像进行匹配,检索等应用。对于图像理解则不太适合。而后者更关心一些全局特征,如颜色分布,纹理特征,主要物体的形状等。全局特征容易受到环境的干扰,光照,旋转,噪声等不利因素都会影响全局特征。相比而言,局部特征点,往往对应着图像中的一些线条交叉,明暗变化的结构中,受到的干扰也少。 而斑点与角点是两类局部特征点。斑点通常是指与周围有着颜色和灰度差别的区域,如草原上的一棵树或一栋房子。它是一个区域,所以它比角点的噪能力要强,稳定性要好。而角点则是图像中一边物体的拐角或者线条之间的交叉部分。 2. 斑点检测原理与举例 2.1 LoG与DoH 斑点检测的方法主要包括利用高斯拉普拉斯算子检测的方法(LOG),以及利用像素点Hessian矩阵(二阶微分)及其行列式值的方法(DOH)。 LoG的方法已经在斑点检测这入篇文章里作了详细的描述。因为二维高斯函数的拉普拉斯核很像一个斑点,所以可以利用卷积来求出图像中的斑点状的结构。 DoH方法就是利用图像点二阶微分Hessian矩阵:

基于matlab的图像预处理技术研究文献综述

毕业设计文献综述 题目:基于matlab的图像预处理技术研究 专业:电子信息工程 1前言部分 众所周知,MATLAB在数值计算、数据处理、自动控制、图像、信号处理、神经网络、优化计算、模糊逻辑、小波分析等众多领域有着广泛的用途,特别是MATLAB的图像处理和分析工具箱支持索引图像、RGB 图像、灰度图像、二进制图像,并能操作*.bmp、*.jpg、*.tif等多种图像格式文件如。果能灵活地运用MATLAB提供的图像处理分析函数及工具箱,会大大简化具体的编程工作,充分体现在图像处理和分析中的优越性。 图像就是用各种观测系统观测客观世界获得的且可以直接或间接作用与人眼而产生视觉的实体。视觉是人类从大自然中获取信息的最主要的手段。拒统计,在人类获取的信息中,视觉信息约占60%,听觉信息约占20%,其他方式加起来才约占20%。由此可见,视觉信息对人类非常重要。同时,图像又是人类获取视觉信息的主要途径,是人类能体验的最重要、最丰富、信息量最大的信息源。通常,客观事物在空间上都是三维的(3D)的,但是从客观景物获得的图像却是属于二维(2D)平面的。 图像存在方式多种多样,可以是可视的或者非可视的,抽象的或者实际的,适于计算机处理的和不适于计算机处理的。 图像处理它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在 1964 年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动

主要电力设备故障图像特征及识别方法研究改

摘要 摘要内容 伴随着我国电网规模的日益加大,各类变电设备的运作状态是促使其安全高效运行的最为主要的因素之一。对于各类变电设备的在线状态监测系统的推广越来越发普及。研究基于图像特征的电力设备自动故障识别具有重要意义。 本文对各类主要电力设备,研究各类变电设备故障识别分类及相应故障的图像特征,以及基于红外与紫外图像特征的故障识别方法。对于紫外放电成像技术图像的处理与特征提取,本文从紫外成像技术的基本原理出发,在讲解紫外放电图片特性的基础上,对紫外放电图像使用灰度化预处理,以及应用中值滤波等方法对图像进行降噪。并通过canny算子边缘检测计算紫外光斑面积判断是否发生放电故障。针对红外故障图像,本文在红外成像原理的基础上,对红外图像进行超像素分割及HSV空间颜色提取,对应用卷积神经网络对红外故障图像故障区域检测进行理论上的研究。 关键词:红外成像紫外成像图像处理

ABSTRACT With the increasing scale of China's power grid, the operation of various types of substation equipment is one of the most important factors to promote the safe and efficient operation. The popularization of the on-line condition monitoring system for all kinds of transformer equipment is becoming more and more popular. Research on image feature based automatic fault recognition of power equipment is of great significance. In this paper, various types of main power equipment, the study of various types of substation equipment fault identification and classification of image features, as well as infrared and ultraviolet image features based on fault identification method. For ultraviolet discharge imaging technique to image processing and feature extraction, this paper from the basic principle of UV imaging technology of on the explanation of the ultraviolet discharge picture characteristics based and discharge on the UV image using grayscale preprocessing and application of median filtering method of image in noise reduction. And through the Canny operator edge detection to determine whether the area of the UV spot to determine whether the discharge fault. Aiming at the

遥感图像分类方法的国内外研究现状与发展趋势

遥感图像分类方法的国内外研究现状与发展趋势

遥感图像分类方法的研究现状与发展趋势 摘要:遥感在中国已经取得了世界级的成果和发展,被广泛应用于国民经济发展的各个方面,如土地资源调查和管理、农作物估产、地质勘查、海洋环境监测、灾害监测、全球变化研究等,形成了适合中国国情的技术发展和应用推广模式。随着遥感数据获取手段的加强,需要处理的遥感信息量急剧增加。在这种情况下,如何满足应用人员对于大区域遥感资料进行快速处理与分析的要求,正成为遥感信息处理面临的一大难题。这里涉及二个方面,一是遥感图像处理本身技术的开发,二是遥感与地理信息系统的结合,归结起来,最迫切需要解决的问题是如何提高遥感图像分类精度,这是解决大区域资源环境遥感快速调查与制图的关键。 关键词:遥感图像、发展、分类、计算机 一、遥感技术的发展现状 遥感技术正在进入一个能够快速准确地提供多种对地观测海量数据及应用研究的新阶段,它在近一二十年内得到了飞速发展,目前又将达到一个新的高潮。这种发展主要表现在以下4个方面: 1. 多分辨率多遥感平台并存。空间分辨率、时间分辨率及光谱分辨率普遍提高目前,国际上已拥有十几种不同用途的地球观测卫星系统,并拥有全色0.8~5m、多光谱3.3~30m的多种空间分辨率。遥感平台和传感器已从过去的单一型向多样化发展,并能在不同平台

上获得不同空间分辨率、时间分辨率和光谱分辨率的遥感影像。民用遥感影像的空间分辨率达到米级,光谱分辨率达到纳米级,波段数已增加到数十甚至数百个,重复周期达到几天甚至十几个小时。例如,美国的商业卫星ORBVIEW可获取lm空间分辨率的图像,通过任意方向旋转可获得同轨和异轨的高分辨率立体图像;美国EOS卫星上的MOiDIS-N传感器具有35个波段;美国NOAA的一颗卫星每天可对地面同一地区进行两次观测。随着遥感应用领域对高分辨率遥感数据需求的增加及高新技术自身不断的发展,各类遥感分辨率的提高成为普遍发展趋势。 2. 微波遥感、高光谱遥感迅速发展微波遥感技术是近十几年发展起来的具有良好应用前景的主动式探测方法。微波具有穿透性强、不受天气影响的特性,可全天时、全天候工作。微波遥感采用多极化、多波段及多工作模式,形成多级分辨率影像序列,以提供从粗到细的对地观测数据源。成像雷达、激光雷达等的发展,越来越引起人们的关注。例如,美国实施的航天飞机雷达地形测绘计划即采用雷达干涉测量技术,在一架航天飞机上安装了两个雷达天线,对同一地区一次获取两幅图像,然后通过影像精匹配、相位差解算、高程计算等步骤得到被观测地区的高程数据。高光谱遥感的出现和发展是遥感技术的一场革命。它使本来在宽波段遥感中不可探测的物质,在高光谱遥感中能被探测。高光谱遥感的发展,从研制第一代航空成像光谱仪算起已有二十多年的历史,并受到世界各国遥感科学家的普遍关注。但长期以来,高光谱遥感一直处在以航空为基础的研究发展阶段,且主要

图像处理技术的研究现状和发展趋势

图像处理技术的研究现状和发展趋势 庄振帅 数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。在以后的宇航空间技术,如对火星、土星等星球的探测研究中,数字图像处理都发挥了巨大的作用。数字图像处理取得的另一个巨大成就是在医学上获得的成果。1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置,也就是我们通常所说的CT(Computer Tomograph)。CT的基本方法是根据人的头部截面的投影,经计算机处理来重建截面图像,称为图像重建。1975年EMI公司又成功研制出全身用的CT 装置,获得了人体各个部位鲜明清晰的断层图像。1979年,这项无损伤诊断技术获得了诺贝尔奖,说明它对人类作出了划时代的贡献。与此同时,图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就,属于这些领域的有航空航天、生物医学过程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等,使图像处理成为一门引人注目、前景远大的新型学科。随着图像处理技术的深入发展,从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向

树叶分类数字图像处理在树叶识别中的应用

数字图像处理研究报告 数字图像处理在树叶识别中的应用 侯杰:土木系 侯晓鹏:林科院 苏东川:航院 张伟:精仪 指导教师:马慧敏教授 日期:2007.12.30

数字图像处理在树叶识别中的应用 一、课题意义及背景 1 课题背景 植物的识别与分类对于区分植物种类,探索植物间的亲缘关系,阐明植物系统的进化规律具有重要意义。因此植物分类学是植物科学乃至整个生命科学的基础学科。然而,由于学科发展和社会等原因,全世界范围内目前从事经典分类(即传统的形态分类)的人数急剧下降,且呈现出明显的老龄化趋势,后继乏人,分类学已经成为一个“濒危学科”(Buyck,1999)。这不仅对于植物分类学本身,而且对整个植物科学和国民经济的发展带来重大的不利影响。目前植物识别和分类主要由人工完成。然而地球上仅为人所知的有花植物就有大约25万种,面对如此庞大的植物世界,任何一个植物学家都不可能知道所有的物种和名称,这就给进一步的研究带来了困难。在信息化的今天,我们提出的一种解决方案是:建立计算机化的植物识别系统,即利用计算机及相关技术对植物进行识别和管理[1]。 2 课题意义[2-3] (1)人工进行植物叶形的分类难度很大。这种传统的判别方法要求操作者具有丰富的分类学知识和长期的实践经验,才能开展工作。要做到准确和快速地识别手中的植物是非常困难。并且相应人才极为短缺。 (2)仅为人所知的有花植物就有大约25万种,面对如此庞大的植物世界,任何一个植物学家都不可能知道所有的物种和名称。建立植物识别系统和数据库十分必要。 (3)植物学研究人员在野外考察时, 时常需要获取植物叶片面积等参数。(4)叶子面积大小对植物的生长发育、作物产量以及栽培管理都具有十分重要的意义。 因此,基于计算机图像处理识别技术的树叶图像识别技术对于植物学,农业

遥感图像分类方法研究综述

第2期,总第64期国 土 资 源 遥 感No.2,2005 2005年6月15日RE MOTE SENSI N G F OR LAND&RES OURCES Jun.,2005  遥感图像分类方法研究综述 李石华1,王金亮1,毕艳1,2,陈姚1,朱妙园1,杨帅3,朱佳1 (1.云南师范大学旅游与地理科学学院,昆明 650092;2.云南省寄生虫病防治所,思茅 665000; 3.云南开远市第一中学,开远 661600) 摘要:综述了遥感图像监督分类和非监督分类中的各种方法,介绍了各种方法的优缺点、适用领域和应用情况,并作了简单评述,最后,展望了遥感图像分类方法研究发展方向和研究热点。 关键词:遥感;图像分类;分类方法 中图分类号:TP751 文献标识码:A 文章编号:1001-070X(2005)02-0001-06 0 引言 随着卫星遥感和航空遥感图像分辨率的不断提 高,人们可以从遥感图像中获得更多有用的数据和 信息。由于不同领域遥感图像的应用对遥感图像处 理提出了不同的要求,所以图像处理中重要的环 节———图像分类也就显得尤为重要,经过多年的努 力,形成了许多分类方法和算法。本文较全面地综 述了这些分类方法和算法,为遥感图像分类提供理 论指导。 1 遥感图像分类研究现状 在目前遥感分类应用中,用得较多的是传统的 模式识别分类方法,诸如最小距离法、平行六面体 法、最大似然法、等混合距离法(I S OM I X)、循环集群 法(I S ODAT A)等监督与非监督分类法。其分类结果 由于遥感图像本身的空间分辨率以及“同物异谱”、 “异物同谱”现象的存在,往往出现较多的错分、漏分 现象,导致分类精度不高[1]。随着遥感应用技术的 发展,傅肃性等对P.V.Balstad(1986)利用神经网络 进行遥感影像分类的研究情况以及章杨清等在利用 分维向量改进神经网络在遥感模式识别中的分类精 度问题作了阐述[2], 孙家对M.A.Friedl(1992)和 C.E.B r odley(1996)研究的大量适用于遥感图像分类的决策树结构作了阐述[3],尤其是近年来针对高光谱数据的广泛应用,各种新理论新方法相继涌现,对传统计算机分类方法提出了新的要求[4,5]。 2 基于统计分析的遥感图像分类方法 2.1 监督分类 监督分类是一种常用的精度较高的统计判决分类,在已知类别的训练场地上提取各类训练样本,通过选择特征变量、确定判别函数或判别规则,从而把图像中的各个像元点划归到各个给定类的分类方法[2,3,6,7]。常用的监督分类方法有:K邻近法(K-Nearest Neighbor)、决策树法(Decisi on Tree Classifi2 er)和贝叶斯分类法(Bayesian Classifier)。主要步骤包括:①选择特征波段;②选择训练区;③选择或构造训练分类器;④对分类精度进行评价。 最大似然分类法(MLC)是遥感分类的主要手段之一。其分类器被认为是一种稳定性、鲁棒性好的分类器[8]。但是,如果图像数据在特征空间中分布比较复杂、离散,或采集的训练样本不够充分、不具代表性,通过直接手段来估计最大似然函数的参数,就有可能造成与实际分布的较大偏差,导致分类结果精度下降。为此,不少学者提出了最大似然分类器和神经网络分类器。改进的最大似然分类器多采用Gauss光谱模型作为条件概率密度函数模型,其中最简单的是各类先验概率相等的分类器(即通常所说的最大似然分类器),复杂的有Ediri w ickre ma等提出的启发式像素分类估计先验概率法。Mclachlang J 收稿日期:2004-11-23;修订日期:2005-03-15 基金项目:国家重点基础研究发展计划(973计划)项目(2003CB41505-11)、国家自然科学基金项目(40361007)和云南省自然科学基金项目(2002D0036M和2003C0030Q)资助。

图像特征提取及识别过程

摘要 纹理特征是一种重要的视觉线索,是图像中普遍存在而又难以描述的特征。纹理分类与分割是图像处理领域一个经久不衰的热点研究领域,纹理特征提取作为纹理分类与分割的首要问题,一直是人们关注的焦点,各种纹理特征提取方法层出不穷。 本文在广泛文献调研的基础上,回顾了纹理特征提取方法的发展历程,分析了其研究现状,对纹理特征提取方法进行了较为全面的综述和分类,最后重点研究了基于灰度共生矩阵的图像纹理提取方法,研究如何有效地提取图像纹理特征来对图像进行描述,通过特征值来对图像进行识别。 灰度共生矩阵是一种简单有效的图像纹理特征描述方法,该方法的优势在于:它能利用了图像中像素相对位置的空间信息更加准确地描述图像的纹理,本文就是利用图像灰度共生矩阵的这一特性,从该矩阵中提取相应的统计参量作为纹理特征来实现对图像的识别。 关键字:灰度共生矩阵,纹理特征提取,图像识别

ABSTRACT Texture is a kind of important visual clues in images , it is widespread but cannot easy to be described . Texture classification and segmentation is a enduring popular research field in image processing area. Texture feature extraction has been the focus of attention,due to its priority to texture classification and image segmentation. all sorts of texture feature extraction methods has been emerged in endlessly. On the basis of extensive literature investigation, we review the texture feature extraction methods, analyze the development of the research status of the texture feature extraction methods and make a comprehensive review of its classification . Finally ,based on gray symbiotic matrix image problem extraction methods,we research how to effectively extract image texture feature described by the image characteristic value to image recognition. Graylevel co-occurrence matrix is a simple and effective image texture description method.This method's advantage is: it can use the image pixels relative positions of the spatial information more to accurately describe the texture image.This paper use the graylevel co-occurrence matrix of the properties to extract statistics from the matrix corresponding as texture feature parameters to realize image recognition. KEY WORDS: graylevel co-occurrence matrix, texture feature extraction, image recognition

数字图像处理技术的现状及其发展方向(笔记)

数字图像处理技术的现状及其发展方向 一、数字图像处理历史发展 数字图像处理(Digital Image Processing)将图像信号转换成数字信号并利用计算机对其进行处理。 1.起源于20世纪20年代。 2.数字图像处理作为一门学科形成于20世纪60年代初期,美国喷气推进实验室(JPL)推动了数字图像处理这门学科的诞生。 3.1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置即CT(Computer Tomograph),1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。 4.从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展,人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论。 二、数字图像处理的主要特点 1.目前数字图像处理的信息大多是二维信息,处理信息量很大,对计算机的计算速度、存储容量等要求较高。 2.数字图像处理占用的频带较宽,在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本也高,这就对频带压缩技术提出了更高的要求。 3.数字图像中各个像素是不独立的,其相关性大。因此,图像处理中信息压缩的潜力很大。 4.由于图像是三维景物的二维投影,一幅图像本身不具备复现三维景物的全部几何信息的能力,要分析和理解三维景物必须作合适的假定或附加新的测量。在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。 5.一方面,数字图像处理后的图像一般是给人观察和评价的,因此受人的因素影响较大,作为图像质量的评价还有待进一步深入的研究;另一方面,计算机视觉是模仿人的视觉,人的感知机理必然影响着计算机视觉的研究,这些都是心理学和神经心理学正在着力研究的课题。 三、数字图像处理的优点 1.再现性好;图像的存储、传输或复制等一系列变换操作不会导致图像质量的退化。 2.处理精度高;可将一幅模拟图像数字化为任意大小的二维数组,现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高。 3.适用面宽;图像可以来自多种信息源,图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像组合而成,因而均可用计算机来处理。 4.灵活性高;数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。 四、数字图像处理过程及其主要进展 常见的数字图像处理有:图像的采集、数字化、编码、增强、恢复、变换、

遥感影像云识别方法综述

遥感影像云识别方法综述 国内外对云的检测与分类研究较多,有较多的研究成果报道。其方法大致可以分为两类,一类是基于光谱的方法,主要利用云在不同的光谱波段有不同反射特征,大部分以灰度阈值或灰度聚类的方法实现,主要用于多光谱影像,早期研究较多。如用于A VHRR的ISCCR 法(ROSSOW,1989)、CLA VR法(STOWE,1991)和用于的C02法(WGLIE,1994),近期亦研究用于MODIS的一些云识别与分类的方法,主要为以前方法的改造。另一类是基于纹理的方法主要应用云影像的灰度空间分布特征。纹理特征常以统计模型法、结构法、场模型法或频域/空域联合分析法来度量。其中尤以传统的统计模型研究较多,如灰度共生矩阵(GLCM)、灰度差分矩阵(GLDM)、灰度差分矢量(GLDV)、和差直方图(SADH)等,新近提出的一些方法如场模型法中的分形分维、马尔可夫随机场方法,频域/空域联合分析法中的Gabor变换、小波变换等,有不少的研究成果报道。 1. 基于光谱特征的方法: 主要有ISCCP方法、APLOOL方法、CO薄片法、CLAVR方法等。 ISCCP方法主要由Rossow(1989)Seze和Rossow(1991a)及RossowG和arder(1993)和等开发研制,检测方法中公用到窄的可见光波段(0.6)和红外窗区波段的资料。它假定观测辐射办一自晴空和云两种情况(这两种大气状况相联系的辐射值变化并不相互重叠),把每一个像元的观测辐射值与晴空辐射值比较,若两者的差大于晴空辐射值本身的变化时,定该像元点为云点。因此算法依赖于阈值,阈值勤的大小就确定了晴空计值中不确定性的大小,当像元的车射值明显有别于晴空像元时,认为像元被云覆盖,但当像元部分被云覆盖时,会发生误判。 算法主要由有五部分组成: (1)单一红外图像的空间对比试验。 (2)三个连续红处图像的时间对比试验。 (3)可见光和红外图像的空间/时间的累计统计合成。 (4)每5天的可见光和红处辐射的晴空合成。 (5)每个像元的可见光和红外辐射阈值勤的选取。 APOLLO(The A VHRR Processing scheme Over cloud Land and Ocean)算法主要由Saunders和Kriebel(1988),Kriebel等(1989)和Gesell(1989)研制开发,它利用了A VHRR 五个全分辨探测通道资料。在五个通道资料的基础上,像元被认为是有云像元,必须满足几个条件:像元的反射率比所设定的阈值高或温度比所设定的阈值低;通道2与通道1的比值介于0.7和1.1之间;通道4和通道5的亮度温差大于所设定的阈值;若像元在海洋上,其空间均一性还要大于设定的阈值。若像元通过了所有的多光谱云检测,像元为晴空,只要有一个未通过,就认为像元被云污染,因此这个检测方法具有保守性。利用其中的两个检测,。设定不同的阈值,可区分完全云覆盖像元和部分云覆盖像元。 CKA VR(The NOAA Cloud Advanced Very High Resolution Radiometer)算法(Phase I)(Stowe et al.,1991)利用A VHRR五个通道资料在全球范围内进行云检测。它同样采用了一系列判识阈值,不同之处在于采用2*2的像元矩阵作为判识单位。当2*2的像素点数列中4个像素点全不通过有云判识时,像元矩阵为无云;4个像素点全通过有云识别时,像素点矩阵为完全云盖;4个像素点中有1至3个像元通过有云判识时,认为像元矩阵是混合型。如果被判识为云或混合型的像元矩阵中的4个像元,满足另类晴空检测条件,像元矩阵被重新判别为晴空像元。根据下垫面性质和观测时间的不同,把算法分为白天海洋、白天陆地、夜间海洋和夜间陆地四类。在后来的改进方案中,用9天的合成晴空辐射作为晴空辐射值,并对云污染的像元进行分类。

数字图像处理技术的研究现状与发展方向

数字图像处理技术的研究现状与发展方向 孔大力崔洋 (山东水利职业学院,山东日照276826) 摘要:随着计算机技术的不断发展,数字图像处理技术的应用领域越来越广泛。本文主要对数字图像处理技术的方法、优点、数字图像处理的传统领域及热门领域及其未来的发展等进行相关的讨论。 关键词:数字图像处理;特征提取;分割;检索 引言 图像是指物体的描述信息,数字图像是一个物体的数字表示,图像处理则是对图像信息进行加工以满足人的视觉心理和应用需求的行为。数字图像处理是指利用计算机或其他数字设备对图像信息进行各种加工和处理,它是一门新兴的应用学科,其发展速度异常迅速,应用领域极为广泛。 数字图像处理的早期应用是对宇宙飞船发回的图像所进行的各种处理。到了70年代,图像处理技术的应用迅速从宇航领域扩展到生物医学、信息科学、资源环境科学、天文学、物理学、工业、农业、国防、教育、艺术等各个领域与行业,对经济、军事、文化及人们的日常生活产生重大的影响。 数字图像处理技术发展速度快、应用范围广的主要原因有两个。最初由于数字图像处理的数据量非常庞大,而计算机运行处理速度相对较慢,这就限制了数字图像处理的发展。现在计算机的计算能力迅速提高,运行速度大大提高,价格迅速下降,图像处理设备从中、小型计算机迅速过渡到个人计算机,为图像处理在各个领域的应用准备了条件。第二个原因是由于视觉是人类感知外部世界最重要的手段。据统计,在人类获取的信息中,视觉信息占60%,而图像正是人类获取信息的主要途径,因此,和视觉紧密相关的数字图像处理技术的潜在应用范围自然十分广阔。 1数字图像处理的目的 一般而言,对图像进行加工和分析主要有以下三方面的目的[1]: (1)提高图像的视感质量,以达到赏心悦目的目的。如去除图像中的噪声,改变图像中的亮度和颜色,增强图像中的某些成分与抑制某些成分,对图像进行几何变换等,从而改善图像的质量,以达到或真实的、或清晰的、或色彩丰富的、或意想不到的艺术效果。 (2)提取图像中所包含的某些特征或特殊信息,以便于计算机进行分析,例如,常用做模式识别和计算机视觉的预处理等。这些特征包含很多方面,如频域特性、灰度/颜色特性、边界/区域特性、纹理特性、形状/拓扑特性以及关系结构等。 (3)对图像数据进行变换、编码和压缩,以便于图像的存储和传输。 2数字图像处理的方法 数字图像处理按处理方法分,主要有以下三类,即图像到图像的处理、图像到数据的处理和数据到图像的处理[2]。 (1)图像到图像。图像到图像的处理,其输入和输出均为图像。这种处理技术主要有图像增强、图像复原和图像编码。 首先,各类图像系统中图像的传送和转换中,总要造成图像的某些降质。第一类解决方法不考虑图像降质的原因,只将图像中感兴趣的特征有选择地突出,衰减次要信息,提高图像的可读性,增强图像中某些特征,使处理后的图像更适合人眼观察和机器分析。这类方法就是图像增强。例如,对图像的灰度值进行修正,可以增强图像的对比度;对图像进行平滑,可以抑制混入图像的噪声;利用锐化技

遥感图像分类方法综述

遥感图像分类方法综述 刘佳馨 摘要:伴随着科学技术在我们的生活中不断发展,遥感技术便应运而生,而遥感图像因成为遥感技术分析中的不可缺少的依据,变得备受关注。在本文中,以遥感图像分类方法为研究中心,从传统分类方法、近代分类方法两个方面对分类方法进行了介绍,并以此为基础对分类思想及后续处理进行说明,进而展望了遥感图像分类的研究趋势和发展前景。 关键词:遥感图像;图像分类;分类方法 1 引言 遥感,作为采集地球数据及其变化信息的重要技术手段,在世界范围内的各个国家以及我国的许多部门、科研单位和公司等,例如地质、水体、植被、土壤等多个方面,得到广泛的应用,尤其在监视观测天气状况、探测自然灾害、环境污染甚至军事目标等方面有着广泛的应用前景。伴随研究的深入,获取遥感数据的方式逐渐具有可利用方法多、探测范围广、获取速度快、周期短、使用时受限条件少、获取信息量大等特点。遥感图像的分类就是对遥感图像上关于地球表面及其环境的信息进行识别后分类,来识别图像信息中所对应的实际地物,从而进一步达到提取所需地物信息的目的。 2 遥感图像分类基本原理 遥感是一种应用探测仪器,在不与探测目标接触的情况下,从远处把目标的电磁波特性记录下来,并且通过各种方法的分析,揭示出物体的特征性质及其变化的综合性探测技术。图像分类的目的在于将图像中每个像元根据其不同波段的光谱亮度、空间结构特征或其他信息,按照某种规则或算法划分为不同的类别。而遥感图像分类则是利用计算机技术来模拟人类的识别功能,对地球表面及其环境在遥感图像上的信息进行属性的自动判别和分类,以达到提取所需地物信息的目的。 3 遥感图像传统分类方法 遥感图像传统分类方法是目前应用较多,并且发展较为成熟的分类方法。从分类前是否需要获得训练样区类别这一角度进行划分,可将遥感图像传统分类方法分为两大类,即监督分类(supervised classification)和非监督分类(Unsupervised

高光谱图像分类

《机器学习》课程项目报告 高光谱图像分类 ——基于CNN和ELM 学院信息工程学院 专业电子与通信工程 学号 35 学生姓名曹发贤 同组学生陈惠明、陈涛 硕士导师杨志景 2016 年 11 月

一、项目意义与价值 高光谱遥感技术起源于 20 世纪 80年代初,是在多光谱遥感技术基础之上发展起来的[1]。高光谱遥感能够通过成像光谱仪在可见光、近红外、短波红外、中红外等电磁波谱范围获取近似连续的光谱曲线,将表征地物几何位置关系的空间信息与表征地物属性特征的光谱信息有机地融合在了一起,使得提取地物的细节信息成为可能。随着新型成像光谱仪的光谱分辨率的提高,人们对相关地物的光谱属性特征的了解也不断深入,许多隐藏在狭窄光谱范围内的地物特性逐渐被人们所发现,这些因素大大加速了遥感技术的发展,使高光谱遥感成为 21 世纪遥感技术领域重要的研究方向之一。 在将高光谱数据应用于各领域之前,必须进行必要的数据处理。常用的数据处理技术方法包括:数据降维、目标检测、变化检测等。其中,分类是遥感数据处理中比较重要的环节,分类结果不但直接提取了影像数据有效信息,可以直接运用于实际需求中,同时也是实现各种应用的前提,为后续应用提供有用的数据信息和技术支持,如为目标检测提供先验信息、为解混合提供端元信息等。 相对于多光谱遥感而言,由于高光谱遥感的波谱覆盖范围较宽,因此我们可以根据需要选择特定的波段来突显地物特征,从而能够精确地处理地物的光谱信[2]。目前,许多国家开展大量的科研项目对高光谱遥感进行研究,研制出许多不同类型的成像光谱仪。高光谱遥感正逐步从地面遥感发展到航空遥感和航天遥感,并在地图绘制、资源勘探、农作物监测、精细农业、海洋环境监测等领域发挥重要的作用。

SVM分类方法在人脸图像分类中的应用

SVM分类方法在人脸图像分类中的应用 摘要:本文首先简要综述了人脸识别技术中不同的特征提取方法和分类方法;然后介绍了支持向量机(SVM)的原理、核函数类型选择以及核参数选择原则以及其在人脸分类识别中了应用,最后通过在构建的人脸库上的仿真实验观测观测不同的特征提取方法对人脸识别率的影响、不同的学习样本数对人脸识别率的影响、支持向量机选用不同的核函数后对人脸识别率的影响、支持向量机选用不同的核参数后对人脸识别率的影响。 一、人脸识别简介 人脸识别也就是利用计算机分析人脸图象,进而从中提取出有效的识别信息,用来“辨认”身份的一门技术。人脸识别技术应用背景广泛,可用于公安系统的罪犯身份识别、驾驶执照及护照等与实际持证人的核对、银行及海关的监控系统及自动门卫系统等。 常见的人脸识别方法包括基于KL变换的特征脸识别、基于形状和灰度分离的可变形模型识别、基于小波特征的弹性匹配、基于传统的部件建模识别、基于神经网络的识别、基于支持向量机的识别等。其中特征脸方法、神经网络方法、基于支持向量机的方法等是基于整体人脸的识别,而基于提取眼睛等部件特征而形成特征向量的方法就是基于人脸特征的识别。 虽然人类的人脸识别能力很强,能够记住并辨别上千个不同人脸,可是计算机则困难多了。其表现在:人脸表情丰富;人脸随年龄增长而变化;人脸所成图象受光照、成象角度及成象距离等影响;而且从二维图象重建三维人脸是病态过程,目前尚没有很好的描述人脸的三维模型。另外,人脸识别还涉及到图象处理、计算机视觉、模式识别以及神经网络等学科,也和人脑的认识程度紧密相关。这诸多因素使得人脸识别成为一项极富挑战性的课题。 通常人类进行人脸识别依靠的感觉器官包括视觉、听觉、嗅觉与触觉等。一般人脸的识别可以用单个感官完成,也可以是多感官相配合来存储和检索人脸。而计算机的人脸识别所利用的则主要是视觉数据。另外计算机人脸识别的进展还受限于对人类本身识别系统的认识程度。研究表明,人类视觉数据的处理是一个

相关文档
最新文档