毕业设计(论文)-基于SVM的图像分类系统设计文档

LANZHOU UNIVERSITY OF TECHNOLOGY

毕业设计

题目基于SVM的图象分类系统

学生姓名

学号

专业班级计算机科学与技术3班

指导教师

学院计算机与通信学院

答辩日期

摘要

支持向量机(SVM)方法是建立在统计学习理论基础之上的，克服了神经网络分类和传统统计分类方法的许多缺点，具有较高的泛化性能。但是，由于支持向量机尚处在发展阶段，很多方面尚不完善，现有成果多局限于理论分析，而应用显得较薄弱，因此研究和完善利用支持向量机进行图像分类对进一步推进支持向量机在图像分析领域的应用具有积极的推动作用。

本文通过支持向量机技术和图像特征提取技术实现了一个图像分类实验系统。文中首先引入了支持向量机概念，对支持向量机做了较全面的介绍；然后，讨论了图像特征的描述和提取方法，对图像的颜色矩特征做了详细的描述，对svm分类也做了详细的说明；最后讨论了由分类结果所表现的一些问题。测试结果表明，利用图像颜色矩特征的分类方法是可行的，并且推断出采用综合特征方法比采用单一特征方法进行分类得到的结果要更令人满意。

关键词：支持向量机图像分类特征提取颜色矩

Abstract

The support vector machine (SVM) method is based on statistical learning theory foundation, overcome the neural network classification and traditional statistical classification method of faults, and has high generalization performance. But, because the support vector machine (SVM) is still in the development stage, many still not perfect, the existing results more limited to the theoretical analysis, and the use of appear more weak and therefore study and improve the use of support vector machines to image classification support vector machine to further advance in the application of image analysis play a positive role in promoting.

In this paper, support vector machine (SVM) technology and image feature extraction technology implements a image classification experiment system. This paper first introduces the concept of support vector machine (SVM), the support vector machine (SVM) made a more comprehensive introduction; Then, discussed the image characteristics of description and extraction method, the image color moment features described in detail, also made detailed instructions for the SVM classification; Finally discussed the classification results of some problems. Test results show that using the torque characteristics of the image color classification method is feasible, and deduce the comprehensive characteristic method than using single feature method to classify the results are more satisfactory.

Keywords: support vector machine image classification feature extraction Color Moment

摘要............................................................................. I Abstract .......................................................................... II 第一章前言 (1)

1.1本课题的研究意义 (1)

1.2本论文的目的、内容 (1)

1.3开发技术介绍 (1)

1.3.1 SVM技术及其发展简史 (1)

1.3.2 java技术简介 (2)

第二章系统分析 (3)

2.1 系统需求分析 (3)

2.2 系统业务流程分析 (3)

第三章系统总体设计 (4)

3.1 分类系统的结构 (4)

3.2 图像数据库 (4)

3.3 特征提取模块 (4)

3.4 svm分类模块 (4)

第四章系统详细设计 (6)

4.1 特征提取模块 (6)

4.1.1 颜色矩 (6)

4.2 SVM分类模块 (7)

4.2.1 svm的算法简介 (7)

4.2.2 svm的核函数选择 (8)

4.2.3 svm的核函数 (8)

4.2.4 svmtrain的用法 (9)

4.2.5 svmpredict的用法 (10)

第五章系统测试 (11)

5.1 图像数据 (11)

5.2 提取颜色矩特征 (11)

5.3 svm分类 (12)

5.4 测试结果分析 (13)

第六章软件使用说明书 (14)

设计总结 (16)

参考文献 (17)

外文翻译 (18)

原文 (18)

Abstract (18)

1 Introduction (18)

2 Support vector machines (19)

3 Co-SVM (20)

3.1 Two-view scheme (20)

3.2 Multi-view scheme (20)

3.3 About SVM (21)

4 Related works (23)

译文 (24)

摘要 (24)

1 前言 (24)

2 支持向量机 (24)

3 合作支持向量机 (25)

3.1 双试图计划 (25)

3.2 多视图计划 (26)

3.3 SVM 简介 (26)

4 相关作品 (27)

致谢 (29)

第一章前言

1.1本课题的研究意义

随着信息社会的到来，人们越来越多的接触到大量的图像信息。每天都有大量的图像信息在不断的产生(如卫星、地质、医疗、安全等领域)，这些图像信息的有效组织和快速准确的分类便成了人们亟待解决的课题。图像分类就是利用计算机对图像进行定量分析，把图像中的每个像元或区域划归为若干类别中的一种，以代替人的视觉判读，图像分类的过程就是模式识别过程，是目视判读的延续和发展。是工业和学术界的热点问题。

本文提出了一种利用支持向量机(SupportVector Machine，简称SVM)的图像分类方法。该系统可用于各类图像的分类，给定某类图像的训练数据，可以学习分类规则。对于给定的新图像，即能输出图像的类别。

1.2本论文的目的、内容

首先应该指出的是，在某些方面，SVM同神经网络的研究方法是可以相互借鉴的。正如在对神经网络的研究一样，人们在SVM的研究方面不能抱有矛盾的幻想，一方面想使其功能强大无比，任何情况下都具有极高的泛化能力；另一方面，又要求SVM具有良好的性能，例如全局收敛且收敛速度快。这显然是不现实的，它应该是人们不断为之奋斗的目标。因此在SVM的研究方面必须有所侧重，本文在SVM的研究中偏向于它的性能和应用性，即要求保证全局最优的基础上，尽量提高收敛速度，使其在图像分析中发挥很好的作用：而对SVM的容量控制等理论问题，本文暂不过多涉及。

本文对以下问题做了研究：

1。分析SVM模型中核函数的特性，探讨核函数与SVM分类器性能的关系，为下面的研究做铺垫。

2．利用上述的分析，研究了图像的特征对SVM分类器的影响，主要利用了颜色特征和纹理特征，分别对颜色图像分类、纹理图像分类以及综合特征的图像分类进行了比较，并在Pc机上进行大量的实验，对实验数据进行对比和分析。

1.3开发技术介绍

1.3.1 SVM技术及其发展简史

SVM是支持向量机(SupportVector Machine)的简称，是在统计学习理论基础上发展起来的一种机器学习方法。早在六十年代，SVM的奠基人V.Vapink就开始了统计学习理论的研究。

1971年，V.Vapink和Chervonenkis在“The Necessary and Sufficient Conditions

for the Unifoms Convergence of Averages to Expected values，一文中，提出了SVM的一个重要的理论基础--VC维理论。

1982年，在“Estimation of Dependences Based on Empirical Data”一书中，V.Vapnik进一步提出了具有划时代意义的结构风险最小化原理，为SVM奠定了直接的、坚实的理论基础。

1992年,B.Boser,T.Guyon和V.Vapnik，在“A Training Algorithm for Optimal Margin C1assifiers”一书中，提出了最优边界分类器，由此形成了SVM的雏形。SVM 的提出被认为是机器学习的一个重要革新。

1993年，Cortes和Vapnik，在“The Soft Margin classifier”一文中，进一步探讨了非线性最优边界的分类问题。

1995年，Vapnik在“The Nature of statistical Learning Theory”一书中，完整地提出了SVM分类。

1997年，V.Vapnik，S．Gokowich和A．Smola，发表的“Support Vector Method for Function Approximation，Regression Estimation,and signal Processing”，一文中，详细介绍了基于SVM方法的回归算法和信号处理方法。

1998年，Smola在他的博士论文中详细研究了SVM中各种核的机理和应用，为进一步完善SVM非线性算法做出了重要的贡献。

l999年，B．Schokopf和S．Mika等人在“Input SpaceVersus Feature Space in Kemel-Based Methods”一文中提出了将核变换和核技巧用于空间变换。同年，B．scholkopf，C.J.C.Burges和A．J．Smola在“Advances in Kemel Methods—support Vector Learning”一文中详细阐述了核方法。上述及同期其它学者的工作，将隐含在SVM中的核方法引申出来，并且得以发展和完善。核方法的提出、完善和进一步地应用，是SVM对学习算法的重要贡献，是SVM发展的一个重要里程碑。

1.3.2 java技术简介

Java是一种可以撰写跨平台应用软件的面向对象的程序设计语言，是由Sun Microsystems公司于1995年5月推出的Java程序设计语言和Java平台（即JavaEE, JavaME, JavaSE）的总称。Java自面世后就非常流行，发展迅速，对C++语言形成了有力冲击。Java 技术具有卓越的通用性、高效性、平台移植性和安全性，广泛应用于个人PC、数据中心、游戏控制台、科学超级计算机、移动电话和互联网，同时拥有全球最大的开发者专业社群。在全球云计算和移动互联网的产业环境下，Java更具备了显著优势和广阔前景。

Java是由Sun Microsystems公司于 1995年5月推出的Java面向对象程序设计语言（以下简称Java语言）和Java平台的总称。由James Gosling和同事们共同研发，并在1995年正式推出。Java最初被称为Oak，是1991年为消费类电子产品的嵌入式芯片而设计的。1995年更名为Java，并重新设计用于开发Internet应用程序。用Java 实现的HotJava浏览器（支持Java applet）显示了Java的魅力：跨平台、动态的Web、Internet计算。从此，Java被广泛接受并推动了Web的迅速发展，常用的浏览器均支持Javaapplet。另一方面，Java技术也不断更新。(2010年Oracle公司收购了SUN)

第二章系统分析

2.1 系统需求分析

SVM, Support Vector Machine , 即支持向量机，是一种机器学习算法，不过现今最常拿来就是做分类 (classification) 。也就是说，如果我有一堆已经分好类的东西（可是分类的依据是未知的！），那当收到新的东西时， SVM 可以预测 (predict) 新的数据要分到哪一堆去。

2.2 系统业务流程分析

应用svm分类的步骤如下：

（1）首先搜集各个类的训练集和测试集

（2）从训练集和测试集中提取图片特征

（3）将训练集提取的数据用于svm的学习训练，得到训练模板

（4）通过模板对测试集提取的特征数据用于分类，得到分类结果

系统业务流程图如下图2.2所示：

图2.2 系统业务流程图

第三章系统总体设计

3.1 分类系统的结构

基于支持向量机的图像分类实验系统的框架示意图如下图3.1所示：

图3.1系统结构图

3.2 图像数据库

图像数据库指搜集不同种类的图片作为特征提取的图片数据集。本次我所取的图片以颜色特征为主如下表格3.2所示：

3.3 特征提取模块

该模块主要负责对图像数据库中的图像进行特征提取，并对其进行特征归一化处理，把所提取的特征数据以下格式写到特征输出文件中，以作为下一个模块的输入数据。

[label] [index1]:[value1] [index2]:[value2] ...

3.4 svm分类模块

该模块以特征提取模块的输出文件作为输入，可以对支持向量机的各个参数进行选择，包括核函数及其参数，然后用一定量的样本对该学习机进行学习和训练，用测试样本来测试，得到最后的分类效果。

使用 SVM 的流程大概就是：

1. 准备数据并做成指定格式 ( 有必要时需 svmscale) 。

2. 用 svmtrain 来 train 成 model 。

3. 对新的输入，使用 svmpredict 来 predict 新数据，得到分类结果。

第四章系统详细设计

4.1 特征提取模块

该模块主要负责对图像数据库中的图像进行特征提取，并对其进行特征归一化处理，然后把图像的特征值输出到相应的文件中，以作为下一个模块的输入。

4.1.1颜色矩

颜色是彩色图像最重要的内容之一，被广泛用于图像检索中。但从图像中提取颜色特征时，很多算法都先要对图像进行量化处理。量化处理容易导致误检，并且产生的图像特征维数较高，不利于检索。

stricker和0reng0提出了颜色矩的方法[1]，颜色矩是一种简单有效的颜色特征表示方法，有一阶矩(均值,mean)、二阶矩(方差,viarance)和三阶矩(斜度,skewness)等，由于颜色信息主要分布于低阶矩中，所以用一阶矩，二阶矩和三阶矩足以表达图像的颜色分布，颜色矩已证明可有效地表示图像中的颜色分布，该方法的优点在于：不需要颜色空间量化，特征向量维数低；但实验发现该方法的检索效率比较低，因而在实际应用中往往用来过滤图像以缩小检索范围。

设p(i,j)图像的像素值，N为像素数，则：

Mean=(sum(p(I,j)))/N

Variance=sqrt(sum(p(I,j )-mean)^2/N)

Skewness= Variance= (sum(p(I,j )-mean）^3/N)^1/3

三个颜色矩的数学定义：

其中，P i,j表示图像第i个颜色通道分两种灰度为j的像素出现的概率，N表示图像中的像素个数。

与颜色直方图相比，该方法的另一个好处在于无需对特征进行向量化。因此，图像的颜色矩一共只需要9个分量（3个颜色分量，每个分量上3个低阶矩），与其他的颜色特征相比是非常简洁的。在实际应用中为避免低次矩较弱的分辨能力，颜色矩常和其它特征结合使用，而且一般在使用其它特征前起到过滤缩小范围（narrow down）的作用。

4.2 SVM分类模块

4.2.1 svm的算法简介

近年来，随着统计学习理论和支持向量机越来越受到广泛的关注，陆续提出了许多关于SVM的训练算法，其算法也日益完善。下面就简单介绍一下SVM算法。SVM训练算法主要有三类：二次规划算法，分解算法和增量算法。另外，针对特定的问题，很多研究者在这三类算法的基础上提出了很多改进算法，这些算法在特定问题的解决中表现出了很好的效果。

第一类是二次规划算法。在前面的分析中多次提到，SVM可以归结为一个二次规划(QP)问题，QP是一种常见的优化问题，有一套比较成熟的理论基础。从数学角度分析，SVM是一个求条件极值问题，其通常的解法有罚函数法和单纯形法。

罚函数法的基本思想是将解不满足约束条件的程度作为惩罚项加在目标函数中，将条件极值问题转化为无条件极值问题来处理，求得其解后增大惩罚力度，将上一步的结果作为下一次寻优的起始迭代点，再求解无条件极值问题，直到满足约束为止。

单纯形法是先随机找到一个可行点作为初值点，构造以可行点为顶点的单纯形，然后按某种搜索策略逐步缩小单纯形，直至各项点间的距离在允许误差范围内为止。

第二类是分解算法。当训练样本增加时，二次规划算法存在训练速度慢，效率低下，算法复杂而难以实现等问题。为此，一些学者提出了处理大规模训练集的算法。

Cones和Vapnik提出Chunking算法，该算法每次求解一个子QP问题，得到若干支持向量。用这些支持向量和一些不满足优化条件的样本，构成新的子QP问题，而初始子问题由任意若干个样本构成。重复上述过程，知道所有样本满足优化条件。该方法存在的问题是，当支持向量较多时，算法的训练速度明显变慢。因为该方法实际求解的QP问题中的赫赛(Hessiall)矩阵的规模下降为最多。

P1att提出了SMO(Sequential Minimal和mization序贯最小优化)算法。该算法将工作样本集的规模减到最小一一两个样本的情况，其优点是针对两个样本的二次规划问题可以有解析解的形式，从而避免了多样本情况下的数值解不稳定及耗时问题，同时也不需要大的矩阵存储空间，特别适合稀疏样本，算法避开了复杂的数值求解优化问题的过程。

此外，SVM算法工作集的选择也别具特色，不是传统的最陡下降法，而是采用启发

式策略，通过两个嵌套的循环来寻找待优化的样本变量。在外循环中寻找违背KKT(Karush．Kuhn．Tuckcr)最优条件的样本，然后在内循环中再选择另一个样本，完成一次优化。再循环，进行下一次优化，直到全部样本都满足最优条件，这大大加快了算法的收敛速度。sM0算法主要耗时在最优条件的判断上，所以应寻求最合理即计算代价最低的最优条件判别式。

第三类是增量算法。训练方式是在训练样本单个输入的情况下训练，其训练样本总的个数是未知的。最典型的应用是系统的在线辨识。Ahmed．s．N最早提出了SVM增量训练算法，但只是近似的增量，即每次只选一小批常规二次规划算法能处理的训练样本，然后只保留支持向量，抛弃非支持向量，和新进来的样本混和进行训练，知道训练样本用完为止，实验表明误差可以接受。Cauwenberghs G等人提出了增量训练的精确解，即增加一个训练样本或减少一个样本对Lagrange系数和支持向量的影响，实验表明算法是有效的，特别是减少一个样本时，对模型选择算法LOO(Leave one out)的形象解释，缺点是当样本无限增多时，还是必须抛弃一些样本，使其能够实用。

此外，在以上三类基本算法的基础上，许多学者还提出了其他的算法，如；张学工提出的CSVM算法，将每类训练样本集进行聚类分成若干个子集，用子集中心组成新的训练样本集训练SVM等。这些算法为SVM的广泛应用起到了推动作用。

4.2.2 svm的核函数选择

支持向量机模型最重要的一个参数就是核函数。选择什么样的核函数，就意味着将训练样本映射到什么样的空间去进行线性划分，核函数的选择关系到能否得到正确识别结果，而怎样从理论上保证选择最优的核函数仍是一个有待解决的问题，目前多是通过实验来决定。

4.2.3 svm的核函数

核函数是SVM模型建立的一个主要问题，因为核函数在支持向量机中占有比较重要的地位，所以本节将其单独列出来，对现有的研究成果进行整理和分析，为以后的实验打下坚实的理论基础。

Vapnik在SVM理论中提到，当问题不是线性可分时，利用核函数将样本集映射到某一高维空间，使得样本集在高维空间的像集是线性可分的。

定理：对任给的样本集K，均存在一映射墨K1,K2两类，则必然存在一映射F：Sn →M，F(K)在M中是线性可分的。

该定理说明：对任给的样本集K，均存在一映射F，在此映射下，F(K)(在高维空间中)是线性可分的。

上述即为核函数的存在性定理，该定理为在任意样本集上应用核方法(包括SVM)提供了理论保证。

4.2.4 svmtrain的用法

svmtrain实现对训练数据集的训练，获得SVM模型。Train ( 训练 ) data. train 会接受特定格式的输入 , 产生一个 "Model" 文件。这个 model 你可以想象成 SVM 的内部数据 , 因为 predict 要 model 才能 predict, 不能直接吃原始数据。

用法： svmtrain [options] training_set_file [model_file]；

其中，options（操作参数）：可用的选项即表示的涵义如下所示：

-s svm类型：设置SVM 类型，默认值为0，可选类型有：

0 -- C- SVC

1 -- n - SVC

2 -- one-class-SVM

3 -- e - SVR

4 -- n - SVR

-t 核函数类型：设置核函数类型，默认值为2，可选类型有：

0 -- 线性核：u'*v

1 -- 多项式核： (g*u'*v+ coef 0)deg ree

2 -- RBF 核：e( u v 2) g -

3 -- sigmoid 核：tanh(g*u'*v+ coef 0)

-d degree：核函数中的degree设置，默认值为3； -g g ：设置核函数中的g ，默认值为1/ k ；

-r coef 0：设置核函数中的coef 0，默认值为0；

-c cost：设置C- SVC、e - SVR、n - SVR中从惩罚系数C，默认值为1；

-n n ：设置n - SVC、one-class-SVM 与n - SVR 中参数n ，默认值0.5；

-p e ：设置n - SVR的损失函数中的e ，默认值为0.1；

-m cachesize：设置cache内存大小，以MB为单位，默认值为40；

-e e ：设置终止准则中的可容忍偏差，默认值为0.001；

-h shrinking：是否使用启发式，可选值为0 或1，默认值为1；

-b 概率估计：是否计算SVC或SVR的概率估计，可选值0 或1，默认0；

-wi weight：对各类样本的惩罚系数C加权，默认值为1；

-v n：n折交叉验证模式。

其中-g选项中的k是指输入数据中的属性数。操作参数 -v 随机地将数据剖分为n 部分并计算交叉检验准确度和均方根误差。以上这些参数设置可以按照SVM 的类型和核函数所支持的参数进行任意组合，如果设置的参数在函数或SVM 类型中没有也不会产生影响，程序不会接受该参数；如果应有的参数设置不正确，参数将采用默认值。training_set_file是要进行训练的数据集；model_file是训练结束后产生的模型文件，该参数如果不设置将采用默认的文件名，也可以设置成自己惯用的文件名。

4.2.5 svmpredict的用法

svmpredict 是根据训练获得的模型，对数据集合进行预测，依照已经 train 好的model, 再加上给定的输入 ( 新值 ), 输出 predict ( 预测 ) 新值所对应的类别。用法：svmpredict [options] test_file model_file output_file；

options（操作参数）：

-b probability_estimates：是否需要进行概率估计预测，可选值为0 或者1，默认值为0。model_file 是由svmtrain 产生的模型文件；test_file 是要进行预测的数据文件；output_file 是svmpredict 的输出文件，表示预测的结果值。svmpredict 没有其它的选项。

毕业课程设计格式模板

克拉玛依职业技术学院毕业设计题目专业班级学号学生姓名指导教师

摘要摘要部分说明： “摘要”是摘要部分的标题，不可省略。标题“摘要”选用模板中的样式所定义的“摘要”；或者手动设置成字体：黑体，居中；字号：小三；1.5倍行距，段前为0行，段后1行。设计摘要是设计的缩影，文字要简练、明确。内容要包括目的、方法、结果和结论。单位制一律换算成国际标准计量单位制，除特殊情况外，数字一律用阿拉伯数码。文中不允许出现插图，重要的表格可以写入。摘要正文选用模板中的样式所定义的“正文”，每段落首行缩进2个汉字；或者手动设置成每段落首行缩进2个汉字，字体：宋体，字号：小四，行距：多倍行距 1.25，间距：前段、后段均为0行，取消网格对齐选项。篇幅以一页为限，摘要正文后列出3－5个关键词，关键词与摘要之间空一行。 “关键词：”是关键词部分的引导，不可省略，黑体，小四。关键词请尽量用《汉语主题词表》等词表提供的规范词。关键词之间用分号间隔，末尾不加标点。

1 正文格式说明 (1) 1.1 设计格式基本要求 (2) 1.2 设计页眉页脚的编排 (2) 1.3 设计正文格式 (2) 1.4 章节标题格式 (3) 1.5 各章之间的分隔符设置 (3) 1.6 正文中的编号 (3) 2 图表及公式的格式说明 (5) 2.1 图的格式说明 (5) 2.1.1 图的格式示例 (5) 2.1.2 图的格式描述 (5) 2.2 表的格式说明 (6) 2.2.1 表的格式示例 (6) 2.2.2 表的格式描述 (7) 2.3 公式的格式说明 (7) 2.3.1 公式的格式示例 (7) 2.3.2 公式的格式描述 (8) 2.4 参考文献的格式说明 (8) 2.4.1 参考文献在正文中引用的示例 (8) 2.4.2 参考文献在正文中引用的书写格式 (8) 2.4.3 参考文献的书写格式 (8) 2.4.4 参考文献的书写格式示例 (9) 2.5 量和单位的使用 (9) 2.5.1 使用方法 (9) 2.5.2 中华人民共和国法定计量单位 (9) 2.6 规范表达注意事项 (11) 2.6.1 名词术语 (11) 2.6.2 数字 (11) 2.6.3 外文字母 (12) 2.6.4 量和单位 (12) 2.6.5 标点符号 (12) 3 打印说明 (13)

基于视频图像序列的抛洒物检测毕业设计资料

基于视频图像序列的抛洒物检测第1章概述1.1 论文研究背景如今，中国高速公路里程已达7.4万公里，居世界第二位[1]。随着高速公路、城市公路通行量的不断增加，交通事故所带来的安全隐患也所之增加，在众多危害安全的事故中交通事故是当前最为严重的，而中国交通局对近10年交通事故官方统计显示，世界上因交通事故死亡人数最多的国家中，中国位列前三之中。至今中国每年交通事故约50万起，每年的事故死亡人数均已达到10万人以上，已经连续十年居世界第一。而今，随着我国经济的不断发展，交通需求的不断增长，高速公路和隧道已成为经济社会发展的重要助推器。然而，高速公路在给人们带来巨大的经济效益和社会效益的同时，各类交通事故也明显增加，尤其是各类恶性重大事故频发，据不完全统计，2005年底每万公里死亡1823人，死亡人数以每年近20%的比率递增。由于高速公路和隧道具有车流量大、行车速度高等特点，一旦发生交通事故将会非常严重，不仅一次事故殃及的车辆多、伤亡率高，还会造成严重的交通阻塞和行车延误，而且还可能会引起二次事故的发生，严重影响高速公路和隧道的整体通行能力和运营效率。而高速公路里程长，交通事件自身又有很强的随机性，如何快速检测交通事件，最大限度地减少交通事件的发生和影响，一直是国际交通领域所关注的问题。城市中大货车货运过程中抛洒物事件已经严重危害交通安全，成为造成交通事故的主要原因之一，其带来的安全隐患是我们急需重视及解决的问题。因过往车辆上的抛洒物、坠落物引发的交通事故不仅给通行车辆和司乘人员造成了生命财产损失，影响了道路的通畅，而且给高速公路运营管理单位带来了经济损失和诉讼纠纷，损害了高速公路的社会形象。每天通过车辆数以千万计，路面上抛洒物、坠落物随时随地可能出现[2]。尽管高速公路管理单位已安排保洁工路面巡查，养排中心专职巡查，交警路政也在巡查，但仍不可能做到在时间上、空间上的无缝覆盖。而这些抛洒物、坠落物很有可能随时引发交通事故，给过往司机旅客造成财产甚至生命的损失，给高速公路经营管理带来经济上、法律上的纠纷和后果。如何及时准确的检测到抛洒物事件的发生，高效率的检测路面上产生的抛洒物，并且及时清理避免造成交通事故已经成为国内外交通部门关注的热点问题。

文本分类综述

山西大学研究生学位课程论文（2014 ---- 2015 学年第 2 学期）学院（中心、所）：计算机与信息技术学院专业名称：计算机应用技术课程名称：自然语言处理技术论文题目：文本分类综述授课教师（职称）：王素格（教授）研究生姓名：刘杰飞年级：2014级学号：201422403003 成绩：评阅日期：山西大学研究生学院 2015年 6 月2日

文本分类综述摘要文本分类就是在给定的分类体系下,让计算机根据给定文本的内容，将其判别为事先确定的若干个文本类别中的某一类或某几类的过程。文本分类在冗余过滤、组织管理、智能检索、信息过滤、元数据提取、构建索引、歧义消解、文本过滤等方面有很重要的应用。本文主要介绍文本分类的研究背景,跟踪国内外文本分类技术研究动态。介绍目前文本分类过程中的一些关键技术，以及流形学习在文本分类中降维的一些应用。并且讨论目前文本分类研究面临的一些问题,及对未来发展方向的一些展望。关键词文本分类；特征选择；分类器；中文信息处理 1.引言上世纪九十年代以来，因特网以惊人的速度发展起来，到现在我们进入大数据时代互联网容纳了海量的各种类型的数据和信息，包括文本、声音、图像等。这里所指的文本可以是媒体新闻、科技、报告、电子邮件、技术专利、网页、书籍或其中的一部分。文本数据与声音和图像数据相比，占用网络资源少，更容易上传和下载，这使得网络资源中的大部分是以文本（超文本）形式出现的。如何有效地组织和管理这些信息,并快速、准确、全面地从中找到用户所需要的信息是当前信息科学和技术领域面临的一大挑战。基于机器学习的文本分类系统作为处理和组织大量文本数据的关键技术,能够在给定的分类模型下，根据文本的内容自动对文本分门别类，从而更好地帮助人们组织文本、挖掘文本信息，方便用户准确地定位所需的信息和分流信息。利用文本分类技术可以把数量巨大但缺乏结构的文本数据组织成规范的文本数据,帮助人们提高信息检索的效率。通过对文本信息进行基于内容的分类,自动生成便于用户使用的文本分类系统,从而可以大大降低组织整理文档耗费的人力资源,帮助用户快速找到所需信息。因此文本分类技术得到日益广泛的关注，成为信息处理领域最重要的研究方向之一。 2.文本分类技术的发展历史及现状 2.1文本分类技术发展历史国外自动分类研究始于1950年代末，早期文本分类主要是基于知识工程，通过手工定义一些规则来对文本进行分类，这种方法费时费力，还需要对某一领域有足够的了解，才能提炼出合适的规则。H.P.Luhn在这一领域进行了开创性的研究，他将词频统计的思想用于文本分类中。这一时期，主要是分类理论的研究，并将文本分类应用用于信息检索。在这一段时期，提出了很多经典文本分类的数学模型。比如1960年Maron在Journal of ASM上发表了有关自动分类的第一篇论文“On relevance Probabilitic indexing and informarion retriral”，这是Maron和Kuhns提出概的率标引(Probabilitic indexing )模型在信息检

杭州电子科技大学本科毕业设计论文的写作规范及格式要求

杭州电子科技大学本科毕业设计（论文）的写作规范及格式要求本科毕业论文是本科学生毕业前提交的一份旨在取得学士学位而撰写的学位论文，也是一份具有一定理论和实际价值的学术论文；本科毕业设计则是工科学生毕业前提交的一份旨在取的学士学位而进行的工程设计，其撰写的为毕业设计说明书。本科毕业设计（论文）的内容千差万别，文科与理工科的要求明显不同，毕业设计说明书与毕业论文的撰写格式也有较大的差别。但是，就本科毕业设计（论文）的写作规范和格式而言，仍然是类似的。为了提高学士学位论文的质量，做到学位论文在内容和格式上的规范化与统一化，根据由国家标准局批准颁发的GB7713—87《科学技术报告、学位论文和学术论文的编写格式》，参考省教育厅组织编撰的《普通高等学校本科毕业设计（论文）指导》，特作如下规定：一、毕业设计（论文）写作规范论文或设计说明书内容一般应由八个主要部分组成，依次为：题目，中、英文摘要，关键词，目录，文本主体，致谢，参考文献，附录（必要时）。各部分的具体要求如下： 1、题目题目应该用极为精炼的文字把论文的主题或总体内容表达出来。题目字数一般不宜超过20个汉字。有特殊要求的，如为了给题目加以补充说明，或为了强调论文所研究的某一个侧面等，则可加注副标题。 2、中、英文摘要本科毕业设计（论文）摘要包含中文摘要与英文摘要两种。论文摘要以简要文字介绍研究课题的目的、方法、内容及主要结果。在论文摘要中，要突出本课题的创造性成果或创新见解。中文摘要一般不超过400个汉字，英文摘要的内容则要与中文摘要相一致。 3、关键词本科毕业设计（论文）关键词包括中文与英文两种。关键词是表述论文主题内容信息的单词或术语，其数量一般为3－6个。每一个英文关键词必须与中文关键词相应。 4、目录目录是论文各组成部分的小标题，文字应简明扼要。一般的说，本科毕业设计（论文）目录按三级标题编写，应标明页数，以便阅读。目录中的标题应与正文中的标题一致。目前通用的标题序次结构有以下二种，文科类一般采用第一种，理工科类一般采用第二种。第一种序次：一、（一）、1…… 第二种序次：1.、1.1、1.1.1…… 5、文本主体本科毕业设计（论文）正文要符合一般学术论文的写作规范，要求文字流畅、语言准确、层次清晰、论点清楚、论据准确、论证完整严密，有独立的观点和见解，应具备学术性，科学性和一定的创造性。对英语专业的学生，要求文本主体不得少于6000个英文单词，其它各专业的毕业设计（论文）文本主体一般不得低于15000个汉字。文本主体一般包括引言（或称前言、序言等）、正文和结论三部分。

基于支持向量机的图像分类研究

目录摘要 (2) Abstract (3) 1 引言 (3) 1.1 概述 (4) 1.2 统计学习理论 (4) 1.3 支持向量机及其发展简史 (5) 1.4 研究内容及其现实意义 (6) 2 持向量机模型的建立 (7) 2.1 SVM核函数 (7) 2.2 核函数的选择 (8) 2.3 SVM算法简介 (8) 2.4 SVM学习算法的步骤 (9) 3 图像内容的描述及特征提取 (10) 3.1 图像内容的描述模型 (10) 3.2 颜色特征的描述 (10) 3.2.1 颜色的表示和颜色模型 (10) 3.2.2 颜色直方图 (11) 3.2.3 累积颜色直方图 (12) 3.2.4 主色 (12) 3.3 纹理特征的描述 (12) 4 基于SVM的图像分类方法研究 (13) 4.1 分类系统的结构 (13) 4.1.1 特征提取模块 (13) 4.1.2 SVM分类模块 (13) 4.2 特征提取策略 (14) 4.3 实验 (14) 4.3.1 三种核函数的选择比较实验 (14) 4.3.2 基于颜色特征的图像分类 (17) 4.3.3 基于纹理特征的图像分类 (17) 4.3.4 基于综合特征的图像分类 (17) 5 结论 (18) 参考文献 (19)

摘要支持向量机(SVM)方法是建立在统计学习理论基础之上的，克服了神经网络分类和传统统计分类方法的许多缺点，具有较高的泛化性能。但是，由于支持向量机尚处在发展阶段，很多方面尚不完善，现有成果多局限于理论分析，而应用显得较薄弱，因此研究和完善利用支持向量机进行图像分类对进一步推进支持向量机在图像分析领域的应用具有积极的推动作用。本文研究了图像的颜色、纹理等特征对利用支持向量机进行图像分类的影响。对支持向量机在图像分类中的应用作了较全面的研究。对三种核函数进行了对比实验，实验表明二项式核函数较高斯核函数和sigmoid核函数具有更强的泛化能力；同时，通过实验分析了特征选取对向量机性能的影响，发现综合特征有利于分类效果的提高。在以上研究的基础上，我们建立了一个基于svM的图像分类实验平台，讨论了系统的组成模块和功能，给出了一些图像分类实例，并验证了前述理论研究的结果。关键词：统计学习理论支持向量机图像分类特征提取

人脸识别毕业设计

摘要人脸识别技术(FRT)是当今模式识别和人工智能领域的一个重要研究方向。虽然人脸识别的研究已有很长的历史，各种人脸识别的技术也很多，但由于人脸属于复杂模式而且容易受表情、肤色和衣着的影响，目前还没有一种人脸识别技术是公认快速有效的．本文主要讨论了人脸识别技术的一些常用方法，对现有的人脸检测与定位、人脸特征提取、人脸识别的方法进行分析和讨论，最后对人脸识别未来的发展和应用做了展望。关键字：人脸识别，特征定位，特征提取

ABSTRACT Nowadays the face recognition technology (FRT) is a hot issue in the field of pattern recognition and artificial intelligence．Although this research already has a long history and many different recognition methods are proposed，there is still no effective method with low cost an d high precision．Human face is a complex pattern an d is easily affected by the expression，complexion and clothes．In this paper，some general research are discussed，including methods of face detection and location，features abstraction，and face recognition．Then we analyze and forecast the face recognition’s application and its prospects． Keywords: Face Recognition Technology, Face location，Features abstraction

计算机毕业论文_一种基于潜在语义结构的文本分类模型

一种基于潜在语义结构的文本分类模型摘要：潜在语义索引（LSI）模型，是一种已经成功地应用于文本分类等很多领域的算法。LSI模型能在一定程度上解决一词多义和多词一义问题，并能过滤一部分文档噪音。然而在LSI模型中，对稀有类别很重要的分类特征，可能因为在整个文档集中不重要而被滤掉。针对这一问题，本文提出了一种新颖的扩展LSI模型的文本分类模型。新模型在尽量保留文档信息的同时，增加考虑了文档的类别信息。这样，新模型将能比LSI模型更好地表示原始文档空间中的潜在语义结构。在实验中，本分类模型也表现出了非常好的分类性能。关键词：文本分类潜在语义索引偏最小二乘分析中图分类号：TP18 文献标识码: A 1 引言自动文本分类就是在给定的分类体系下，根据文本的内容自动地确定文本关联的类别。如今，已经有很多基于统计和机器学习的文本分类算法，如：回归模型、K近邻、决策树、朴素贝叶斯和支持向量机等[1]。其中，很多现有的分类算法都是基于从文本中抽取关键词（经常是单独的词）的方法。在这种方法中，假定一个关键词唯一地代表一个概念或语义单元；然而实际的情况是：一个词往往有多个不同的含义，多个不同的词也可以表示同一个语义。这就是所谓的一词多义和多词一义。比如：“马上”可以有“立刻”的意思，也可以理解为“马的上面”；“感冒”、“伤风”和“着凉”却代表着同一种疾病。像这样的情况是很难由计算机自动判别的。一词多义和多词一义，是所有基于语义的算法必须解决的两个主要问题。潜在语义索引（LSI: Latent Semantic Indexing）[2]，是近年来比较有效的算法之一。LSI 把原始的向量空间转换成潜在语义空间，文档和查询就在转换后的语义空间上进行表示和比较。实验表明这种方法可以在一定程度上解决一词多义和多词一义问题：新的语义空间是原始“文档向量矩阵”的线性组合变换得到的，一般认为这个空间能捕捉文档集中的潜在语义结构。由于LSI在信息检索中的优异表现[2]，就有人开始尝试将其应用于文本分类领域。其中，Wiener的工作[3]是很有代表性的。Wiener的实验中以两种方式使用了LSI。（1）利用LSI对原始向量空间降维。把潜在语义空间中权重较低的维滤掉，这样就可以得到原始空间的一个子集，并滤掉一些噪音；（2）将整个文档集按类别进行划分，为每个类别建立一个LSI表示。为每个类别构建一个单独的LSI表示，很重要的一个原因是：有一些对特定类很重要的词，由于词义不确定的问题，在整体考虑所有类的时候，反而会变的不重要。如bank这个词可能对财经类很重要，但如果把所有类放在一起考虑，这个词就有可能因为它的多义性在语义空间中被滤掉（或变得不重要）。实际上，我们发现这种分立的LSI表示，确实可以分别为每个类找到重要的词（或特征）。但在考虑整个文档集的时候，情形就会有所不同：对单个类重要的词并不一定就对分类有大的贡献。文本分类的关键是在整体考虑下，在所有的类别中，为文档找到它最有可能属于的类。这种类别之间的舍取，在每个类别都是单独考虑情况下肯定不可能做到完全公平。在本文中，我们提出了一种对LSI扩展的算法。我们提取的语义特征不仅反映了文档和词的信息，也考虑了文档的类别信息。不同于为每个类建立单独的LSI表示，我们把所有的信息整合在一个LSI表示里。本文组织如下：第一部分是引言，第二部分介绍一些相关的基本概念，第三部分详细阐作者介绍：曾雪强(1978-)，男，硕士研究生，助教，研究方向为文本分类和信息检索。Email: zxq@https://www.360docs.net/doc/a418724415.html,

大连理工大学本科生毕业设计(论文)文本格式要求

大连理工大学本科毕业设计（论文）大连理工大学本科毕业设计（论文）题目业：学生姓名：学号：指导教师：评阅教师：完成日期：大连理工大学 Dalian University of Technology

摘要 “摘要”是摘要部分的标题，不可省略。标题“摘要”选用模板中的样式所定义的“标题1”，再居中；或者手动设置成字体：黑体，居中，字号：小三，1.5倍行距，段后11磅，段前为0。摘要是毕业设计（论文）的缩影，文字要简练、明确。内容要包括目的、方法、结果和结论。单位采用国际标准计量单位制，除特别情况外，数字一律用阿拉伯数码。文中不允许出现插图。重要的表格可以写入。摘要正文选用模板中的样式所定义的“正文”，每段落首行缩进2个汉字；或者手动设置成每段落首行缩进2个汉字，字体：宋体，字号：小四，行距：多倍行距 1.25，间距：段前、段后均为0行，取消网格对齐选项。摘要篇幅以一页为限，字数为400-500字。摘要正文后，列出3-5个关键词。“关键词：”是关键词部分的引导，不可省略。关键词请尽量用《汉语主题词表》等词表提供的规范词。关键词与摘要之间空一行。关键词词间用分号间隔，末尾不加标点，3-5个；黑体，小四，加粗。

The Subject of Undergraduate Graduation Project (Thesis) of DUT Abstract 外文摘要要求用英文书写，内容应与“中文摘要”对应。使用第三人称，最好采用现在时态编写。 “Abstract”不可省略。标题“Abstract”选用模板中的样式所定义的“标题1”，再居中；或者手动设置成字体：Times New Roman，居中，字号：小三，多倍行距1.5倍行距，段后11磅，段前为0行。标题“Abstract”上方是论文的英文题目，字体：Times New Roman，居中，字号：小三，行距：多倍行距 1.25，间距：段前、段后均为0行，取消网格对齐选项。 Abstract正文选用设置成每段落首行缩进2字，字体：Times New Roman，字号：小四，行距：多倍行距 1.25，间距：段前、段后均为0行，取消网格对齐选项。 Key words与摘要正文之间空一行。Key words与中文“关键词”一致。词间用分号间隔，末尾不加标点，3-5个；Times New Roman，小四，加粗。 Key Words：Write Criterion；Typeset Format；Graduation Project (Thesis)

人脸识别算法设计毕业设计

人脸识别算法 The Design and Implementation of Algorithms for Human Face Recognition 1-i

人脸识别算法摘要人脸自动识别是模式识别领域的一项热门研究课题，有着十分广泛的应用前景。本文对人脸位置矫正，人脸的特征提取和识别这些方面进行了研究，并提出了相应的实现算法。人脸位置矫正作为人脸检测定位的一个环节，在计算机人脸识别中具有重要的意义。本文第二章提出了一种基于单人脸灰度图像中眼睛定位的人脸位置矫正方法，它是针对人眼灰度变化特点、人眼几何形状特征及双眼的轴对称性而设计的。实验结果表明，该方法对于双眼可见单人脸灰度图像能实现快速有效矫正，并能在矫正结果中精确给出双眼瞳孔位置。本文第三章提出了一种基于神经网络的主元分析人脸图像识别方法。该方法利用非线性主元分析神经网络对人脸图像提取人脸特征（矢量），并在BP神经网络上实现了对人脸图像的识别。实验结果证明了该方法的有效性和稳定性。关键词 1-ii

人脸位置矫正，人脸特征提取，人脸识别，神经网络，灰度图像，图像块纵向复杂度，主元分析法， 1-iii

The Design and Implementation of Algorithms for Human Face Recognition Student: Yangbo Gu Advisor: Dr. Wenming Cao Department of Computer Science and Technology College of Information Engineering Zhejiang University of Technology Abstract The automatic recognition of human faces is a hot spot in the field of pattern recognition , which has a wide range of potential applications . As the results of our in-depth research ,two algorithms are proposed : one for face pose adjustment , the other for facial feature extraction and face identification . Face pose adjustment , as a loop of human face location, is very important in computer face recognition. Chapter 2 of this thesis presents a new approach to automatic face pose adjustment on gray-scale static images with a single face . In a first stage , the right positions of eyes are precisely detected according to several designed parameters which well characterize the complex changes of the gray parameter in and around eyes and the geometrical shape of eyes . During the second stage , based on the location and the symmetry feature of eyes , the inclination angle is calculated and the face position is redressed . The experimentation shows that the algorithm performs very well both in terms of rate and of efficiency . What’s more , due to the precise location of eyes , the apples of the eyes are detected . 1-iv

中文文本分类算法设计及其实现_毕业设计

毕业设计（论文）任务书毕业设计（论文）题目中文文本分类算法的设计及其实现电信学院计算机系84班设计所在单位西安交通大学计算机系

西安交通大学本科毕业设计（论文）毕业设计(论文)任务书电信学院计算机系84 班学生丰成平毕业设计(论文)工作自2013 年 2 月21 日起至2013 年 6 月20 日止毕业设计(论文)进行地点：西安交通大学课题的背景、意义及培养目标随着文本文件的增多，对其自动进行分门别类尤为重要。文本分类是指采用计算机程序对文本集按照一定的分类体系进行自动分类标记。文本分类器的设计通常包括文本的特征向量表示、文本特征向量的降维、以及文本分类器的设计与测试三个方面。本毕设论文研究文本分类器的设计与实现。通过该毕业设计，可使学生掌握文本分类器设计的基本原理及相关方法，并通过具体文本分类算法的设计与编程实现，提高学生的实际编程能力。设计(论文)的原始数据与资料 1、文本语料库（分为训练集与测试集语料库）。 2、关于文本分类的各种文献（包括特征表示、特征降维、以及分类器设计）以及资料。 3、中科院文本分词工具(nlpir)。 4、文本分类中需要用到的各种分类方法的资料描述。课题的主要任务 1．学习文本特征向量的构建方法及常用的降维方法。 2．学习各种分类器的基本原理及其训练与测试方法。 3．设计并编程实现文本分类器。

毕业设计（论文）任务书 4、对试验结果进行分析，得出各种结论。 5、撰写毕业论文。 6、翻译一篇关于文本分类的英文文献。课题的基本要求(工程设计类题应有技术经济分析要求) 1、程序可演示。 2、对源代码进行注释。 3、给出完整的设计文档及测试文档。完成任务后提交的书面材料要求(图纸规格、数量，论文字数，外文翻译字数等) 1、提交毕业论文 2、提交设计和实现的系统软件源程序及有关数据 3、提交外文资料翻译的中文和原文资料主要参考文献：自然语言处理与信息检索共享平台：https://www.360docs.net/doc/a418724415.html,/?action-viewnews-itemid-103 Svm(支持向量机)算法：https://www.360docs.net/doc/a418724415.html,/zhenandaci/archive/2009/03/06/258288.html 基于神经网络的中文文本分析（赵中原）：https://www.360docs.net/doc/a418724415.html,/p-030716713857.html TF-IDF的线性图解：https://www.360docs.net/doc/a418724415.html,/blog-170225-6014.html 东南大学向量降维文献：https://www.360docs.net/doc/a418724415.html,/p-690306037446.html 指导教师相明接受设计(论文)任务日期2013-02-21~2013-06-20 学生签名：

(完整版)基于matlab的人脸识别系统设计毕业设计

毕业设计 [论文] 题目：基于MATLAB的人脸识别系统设计学院：电气与信息工程学院专业：自动化姓名：张迎

指导老师：曹延生完成时间：2013.05.28

摘要人脸识别是模式识别和图像处理等学科的一个研究热点，它广泛应用在身份验证、刑侦破案、视频监视、机器人智能化和医学等领域，具有广阔的应用价值和商用价值。人脸特征作为一种生物特征，与其他生物特征相比，具有有好、直接、方便等特点，因此使用人脸特征进行身份识别更易于被用户所接受。人脸识别技术在过去的几十年得到了很大的发展，但由于人脸的非刚性、表情多变等因素，使得人脸识别技术在实际应用中面临着巨大的困难。本文针对近年来国内外相关学术论文及研究报告进行学习和分析的基础上，利用图像处理的matlab实现人脸识别方法，这种实现简单且识别准确率高，但其缺点是计算量大，当要识别较多人员时，该方法难以胜任。利用MATLAB实现了一个集多种预处理方法于一体的通用的人脸图像预处理仿真系统，将该系统作为图像预处理模块可嵌入在人脸识别系统中，并利用灰度图像的直方图比对来实现人脸图像的识别判定。关键词：图像处理, Matlab, 人脸识别, 模式识别

ABSTRACT Human face recognition focuses on pattern recognition ,image processi ng andother subjects.It is widely used in authentication,investigation,video surveillance,intelligent robots,medicine and other areas.Facerecognition ha s wide application and business value.Facial feature asabiological character istic,compared with others is direct,friendly andconvenient.Facial featuree mployed in authentication are user-friendly. The technology of face recognition in the past few years obtained the v ery big development, but due to the face of nonrigid, expression and chang eablefactors, the face recognition technology in practical application are fa cing great difficulties. This paper aimed at home and abroad in recent year s the relevant papers and researchreports on study and on the basis of the a nalysis, some units within the data sensitivity places need to enter personne l to carry out limitation design and develop a set of identity verification ide ntification system, the system uses PCA face recognition method, therealiza tion is simple and the accuracy rate of recognition is high,but itsdrawback i s that a large amount of calculation, when to identify more staff,this metho d is difficult to do. The realization of a set of various pretreatment methods in one of the generic face image preprocessing simulation system based on MATLAB, the system is used as the image preprocessing module can be embedded in a face recognition system, and using the histogram matching gray image to realize the recognition of human face images to determine.

基于内容和情感的文本分类方法研究_硕士学位论文

硕士学位论文基于内容和情感的文本分类方法研究

A Thesis Submitted in Partial Fulfillment of the Requirements for the Degree of Master of Engineering Research on Text Classification Methods Based on Content and Emotion Candidate : Zhang Chaoyang Major :Industrial Engineering Supervisor :Associate Professor Huang Jinguo Huazhong University of Science &Technology Wuhan 430074, P.R. China January 2013

独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知，除文中已经标明引用的内容外，本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体，均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名：日期：年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定，即：学校有权保留并向国家有关部门或机构送交论文的复印件和电子版，允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本论文属于保密□, 在_____年解密后适用本授权书。不保密□。（请在以上方框内打“√”）学位论文作者签名：指导教师签名：日期：年月日日期：年月日

毕业设计论文格式模板

毕业设计论文格式模板毕业设计论文格式模板1、毕业设计(论文)的基本任务是：培养学生综合运用所学知识和技能，分析解决工程实际问题的能力。 2、毕业设计应使学生受到综合训练，培养独立工作能力。如调查研究、查阅文献(中、外文资料)、理论分析、制订设计方案，工程设计、计算与绘图、实验研究与数据处理、计算机应用、技术经济分析、质量效益分析等能力，撰写论文或设计说明书。 3、毕业设计应重视开发学生的创造力。 4、毕业设计应培养学生正确的设计思想和树立严谨、科学的工作作风。 5、各专业应对毕业设计下达毕业设计(论文)任务书，内容包括：毕业设计任务(题目);毕业设计内容;完成毕业设计任务(设计时间、完成标准)的要求等。 1、选题应符合本专业培养目标要求，体现本专业特色，力求与工作实际、科学研究及实验室建设相结合，题目应有综合性，有利于巩固、深化和扩充学生所学知识，有利于学生得到较全面的工程训练，有利于培养学生的独立工作能力和勇于创造的科学精神。 2、题目大小和难度适度，设计工作量要饱满，能在教

学计划规定的时间内保质保量按时完成任务。 3、题目类型：理工类以“工程设计”为主;经管类可作“论文”，撰写开发研究报告等。 1、指导教师应由具有中级职称及中级以上职称的老师担任。为保证毕业设计质量，原则上每名教师指导本科毕业生人数不能超过5人，指导专科学生人数不能超过7人。 2、指导教师职责：认真拟定设计任务书、做好设计或实验的必要准备，指导查阅文献和收集、分析资料，指导编制设计工作计划及进程，审定设计总体方案，指导设计或实验，检查设计情况和进度，审阅毕业设计(论文)，认真书写老师评语，力求真实全面反映设计(论文)水平。在指导过程中要教书育人、严格要求、培养学生独立工作的能力，积极引导学生发挥创造性。 3、指导教师应增加面授指导时间，每周不应少于8学时。要根据学生的基础和特点，启发引导，切忌包办代替或放任自流，要认真掌握进度，经常检查及协调。 1、在设计工作中应坚持科学的态度，要有高度的责任感，刻苦钻研、努力创新、高质量地独立完成毕业设计。 2、尊重导师，虚心向导师和参与指导的工程技术人员学习。 3、加强组织纪律性，服从领导、遵守纪律，做好技术保密工作。

基于libsvm的gist和phog特征的图像分类研究

研究生技术报告题目：基于libsvm的图像分类研究编号：20132098 执笔人：刘金环完成时间：2013-11-23

摘要随着科学技术的飞速发展，机器学习与人工智能技术的不断创新，人们对特定信息检索的需求逐渐增加，使得如何对资源进行合理有效的分类成为一个关键问题。支持向量机（SVM）是一种建立在统计学习理论基础之上的机器学习方法，由于其基于小样本训练的优越性，被广泛应用于模式识别的各个领域，在图像检索、人脸识别等中充分了体现了其优越性，越来越受到广泛的关注和重视。本文主要介绍了基于libsvm分类器的分类问题。本文以gist和phog特征为例简单实现了图像的分类问题，并通过查询准确性对这两种分类方法进行对比和分析。由仿真结果可知，gist特征分类要好于phog的特征分类，仿真效果较为理想。

目录 1 课题意义..................................................................................................... 错误！未定义书签。 2 技术要求及性能指标................................................................................. 错误！未定义书签。3方案设计及算法原理.................................................................................. 错误！未定义书签。 3.1基于libsvm的gist特征提取分类.............................................. 错误！未定义书签。 3.1.1算法原理 (1) 3.1.2设计框图 (2) 3.2基于libsvm的phog特征提取分类.............................................. 错误！未定义书签。 3.2.1算法原理.............................................................................. 错误！未定义书签。 3.2.2设计框图.............................................................................. 错误！未定义书签。4代码及相关注释. (4) 4.1基于libsvm的gist特征提取分类仿真结果 (6) 4.1.1代码及注释 (9) 4.1.2测试结果 (9) 4.2基于libsvm的phog特征提取分类仿真结果 (9) 4.2.1代码及注释 (9) 4.2.2测试结果 (12) 4.3基于libsvm的gist特征分类不同训练集测试结果.................. 错误！未定义书签。 4.3.1代码及注释.......................................................................... 错误！未定义书签。 4.3.2测试结果 (14) 5实验结果分析.............................................................................................. 错误！未定义书签。6总结 ............................................................................................................. 错误！未定义书签。

数字图像处理课程设计人脸检测与识别

数字图像处理课程设计

人脸检测与识别课程设计一、简介人脸检测与识别是当前模式识别领域的一个前沿课题，人脸识别技术就是利用计算机技术，根据数据库的人脸图像，分析提取出有效的识别信息，用来 “辨认”身份的技术。人脸识别是模式识别研究的一个热点, 它在身份鉴别、信用卡识别, 护照的核对及监控系统等方面有着广泛的应用。人脸图像由于受光照、表情以及姿态等因素的影响, 使得同一个人的脸像矩阵差异也比较大。因此, 进行人脸识别时, 所选取的特征必须对上述因素具备一定的稳定性和不变性. 主元分析(PCA)方法是一种有效的特征提取方法,将人脸图像表示成一个列向量, 经过PCA 变换后, 不仅可以有效地降低其维数, 同时又能保留所需要的识别信息, 这些信息对光照、表情以及姿态具有一定的不敏感性. 在获得有效的特征向量后, 关键问题是设计具有良好分类能力和鲁棒性的分类器. 支持向量机(SVM ) 模式识别方法,兼顾训练误差和泛化能力, 在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。本此课程设计基于MATLAB，将检测与识别分开进行。其中检测部分使用实验指导书上的肤色模型算法进行，不进行赘述。识别部分采用PCA算法对检测出的人脸图像进行特征提取, 再利用最

邻近距离分类法对特征向量进行分类识别，将在后文具体表述。仿真结果验证了本算法是有效的。二、人脸检测源码 1.img=imread('D:\std_test_images\face3.jpg'); figure; imshow(img); R=img(:,:,1); G=img(:,:,2); B=img(:,:,3); faceRgn1=(R>95)&(G>40)&(B>20)&max(img,[],3)-min(img,[],3)>15& abs(R-G)>15&R>B; figure; imshow(faceRgn1); r=double(R)./double(sum(img,3)); g=double(G)./double(sum(img,3)); Y=0.3*R+0.59*G+0.11*B; faceRgn2=(r>0.333)&(r<0.664)&(g>0.246)&(g<0.398)&(r>g)& g>=0.5-0.5*r; figure; imshow(faceRgn2); Q=faceRgn1.*faceRgn2;