3模式识别与机器学习期末考查

模式识别与机器学习期末考查

试卷

研究生姓名：王晓薇学号：20110777 入学年份：2011 导师姓

名：吴庆祥

试题1（15%）：列出你所知道的模式识别与机器学习中的常用算法, 并给出其优

缺点。

答：1. k-近邻法

近邻法是一种最简单的非参数模式识别方法中的模式匹配法,它主要依据样本

间的多维空间距离来实现分类.其基本规则是，在所有N 个样本中找到与测试样本

的k 个最近邻者，其中各类别所占个数表示成k i , i ＝1，…，c 。定义判别函数

为： g i (x)=k i , i=1, 2,…,c 。

决策规则为：

c i x g j i

i ,,1;)(m ax arg ==

优点：算法简单，易于理解和分析，分类效果好, 在训练样本趋于无穷大时接

近最优。

缺点：可以明显看出它需要的计算量大，存储容量大；没有考虑到决策的风

险；对于近邻法错误率的分析都是建立在样本数趋向于无穷大的假定上的，而这在

实际应用时是很难实现的。而对有限样本集的情况，又缺乏理论上的分析。

2. 贝叶斯决策理论

贝叶斯决策理论是主观贝叶斯派归纳理论的重要组成部分，是基于概率统计的

基本的判别函数分类理论。

贝叶斯决策就是在不完全情报下，对部分未知的状态用主观概率估计，然后用

贝叶斯公式对发生概率进行修正，最后再利用期望值和修正概率做出最优决策。

贝叶斯决策理论方法是统计模型决策中的一个基本方法，其基本思想是：

1. 已知类条件概率密度参数表达式和先验概率

2. 利用贝叶斯公式转换成后验概率

3. 根据后验概率大小进行决策分类

设D 1，D 2，……，D n 为样本空间S 的一个划分，如果以P(D i )表示事件D i 发生

的概率，且P(D i )>0(i=1，2，…，n)。对于任一事件x ，P(x)>0，得到贝叶斯公

式：

∑==n i i i i i i D P D x P D P D x P x D P 1

)

()|()()|()|( 优点：

（1）算法简单，易于理解和分析，其基本概念被众多的先进决策算法运用，

判断结果较精确；

（2）能对信息的价值或是否需要采集新的信息做出科学的判断；

（3）它能对调查结果的可能性加以数量化的评价，而不是像一般的决策方法那样，对调查结果或者是完全相信，或者是完全不相信。

（4）如果说任何调查结果都不可能完全准确，先验知识或主观概率也不是完全可以相信的，那么贝叶斯决策则巧妙地将这两种信息有机地结合起来了；

（5）它可以在决策过程中根据具体情况下不断地使用，使决策逐步完善和更加科学。

缺点：

（1）它需要的数据多，分析计算比较复杂，特别在解决复杂问题时，这个矛盾就更为突出。

（2）有些数据必须使用主观概率，有些人不太相信，这也妨碍了贝叶斯决策方法的推广使用。

3. 逆向传播神经网络

逆向传播神经网络的优点：

（1）每个神经元的运算功能十分简单。

（2）各神经元之间是并行结构互使得其具有高速处理能力。

（3）在神经网络中，知识与信息的存储表现为神经元之间分布式的物理联系，知识存储容量很大。

（4）网状结构似的整个系统的工作不会因为个别的神经元的损失而大大降低系统性能。

（5）它可以实现输入和输出数据之间的非线性映射.

逆向传播神经网络的缺点：

（1）算法的稳定性与学效率成反比。

（2）还没找到某一明确的规则确定学效率的大小，尤其相对于非线性网络来说，学效率的选择更是一个难题。

（3）训练过程也可能陷入局部最小，可以通过变换初始值进行多次训练来决绝这个问题，但又增加了计算的负担。

（4）没有有效的方法可以确定网络层数，太多或太少都会影响系统的性能。

4. 遗传算法

遗传算法是一种基于生物自然选择与遗传机理的随机搜索算法，是一种仿生全局优化方法。遗传算法具有的隐含并行性、易于和其它模型结合等性质使得它在数据挖掘中被加以应用。

遗传算法的优点：

（1）遗传算法解决了传统优化算法容易误入局部最优解的缺点，不用单值迭代，而是从解集合进行搜索，利于全局择优。

（2）遗传算法需要的参数少，容易形成通用算法程序。

（3）遗传算法有极强的容错能力，遗传算法的初始串集本身就带有大量与最优解甚远的信息；该算法具有收敛性，通过选择、交叉、变异操作能迅速排除与最优解相差极大的串。

（4）遗传算法是采用随机方法进行最优解搜索，选择体现了向最优解迫近，交叉体现了最优解的产生，变异体现了全局最优解的复盖。

（5）力称为隐含并行性(Implicit Parallelism)。它说明遗传算法其内在具有并行处理的特质。

遗传算法的缺点：

（1）选取的值范围大，变量多时，收敛速度也随之下降，甚至有时还无法给定取值范围。

（2）可找到最优解附近，但无法精确确定最优解位臵。

（3）遗传算法的参数(n,Pm,Pc)选择还没准确的定数，还需要进一步研究其数学基础理论。

5. 决策树算法

决策树是一种常用于预测模型的算法，它通过将大量数据有目的分类，从中找到一些有价值的，潜在的信息。

优点：由于决策树具有易构造、结构简单、易于理解、分类精度高，且易于转化成SQL语句有效地存取数据库，易于算法实现等优点，决策树尤其适于数据挖掘。描述简单，分类速度快，特别适合大规模的数据处理。

缺点：在学习过程中不能有很多背景知识。是非递增学习算法；ID3决策树是单变量决策树，复杂概念的表达困难；同性间的相互关系强调不够；抗噪性差。决策树的这种明确性可能带来误导。

试题2（15%）：你认为可从几个方面来评价模式识别与机器学习算法？什么叫十组交叉验证法？它可被用来评价模式识别与机器学习算法的什么属性？

答：评价模式识别与机器学习算法

1. 正确性

说一个算法是正确的，是指对于一切合法的输入数据，该算法经过有限时间（算法意义上的有限）的执行都能产生正确（或者说满足规格说明要求）的结果。

2. 时间复杂性

应该怎样计算一个算法的执行时间呢？首先想到的是，我们应选择一种度量，对解决同一个问题的诸多算法用该度量可有效地进行比较。：（1）它能告诉我们算法所用方法（包括数据结构）的时间效率；（2）它与算法描述语言（或程序设计语言）及设计风格无关；（3）它与算法实现过程中的许多细节：诸如增加循环下标、计算数组下标、设臵数据结构指针等簿记运算无关；（4）它应该是足够精确和具有一般性的。一个算法的时间复杂性是指该算法的基本运算次数。

3. 空间复杂度

空间复杂度(Space Complexity)是对一个算法在运行过程中临时占用存储空间大小的量度。一个算法在计算机存储器上所占用的存储空间，包括存储算法本身所占用的存储空间，算法的输入输出数据所占用的存储空间和算法在运行过程中临时占用的存储空间这三个方面。

4. 占用空间

算法执行需要存储空间来存放算法本身包含的语句、常数、变量、输入数据和实现其运算所需的数据（如中间结果等），此外还需要一些工作空间用来对（以某种方式存储的）数据进行操作。

5. 可读性

可读性好的算法有助于设计者和他人阅读、理解、修改和重用。与此相反，晦涩难懂的算法不但容易隐藏较多的错误，而且增加了人们在阅读、理解、调试、修改和重用算法等方面的困难。

6. 坚固性

当输入数据非法时，算法能适当地做出合适的反应。

可用多组数据交叉等方法，用标准数据集对上述指标进行实验结果比较。

十组交叉验证法就是十折交叉验证。英文名叫做10-fold cross-validation，用来测试算法准确性。是常用的测试方法。将数据集分成十分，轮流将其中9

份作为训练数据，1份作为测试数据，进行试验。每次试验都会得出相应的正确率（或差错率）。10次的结果的正确率（或差错率）的平均值作为对算法精度的估计，一般还需要进行多次10折交叉验证（例如10次10折交叉验证），再求其均值，作为对算法准确性的估计。

之所以选择将数据集分为10份，是因为通过利用大量数据集、使用不同学习技术进行的大量试验，表明10折是获得最好误差估计的恰当选择，而且也有一些理论根据可以证明这一点。但这并非最终诊断，争议仍然存在。而且似乎5折或者20折与10折所得出的结果也相差无几。

它可被用来评价模式识别与机器学习算法的算法准确性属性

试题3（15%）：简述在模式识别与机器学习中解决问题的主要步骤。指出那些步骤涉及到学习？是如何进行学习？

答：一、在模式识别与机器学习中解决问题的主要步骤：

(1)数据采集

数据采集是指利用各种传感器把被研究对象的各种信息转换为计算机可以接受的数值或符号(串)集合。这一步的关键是传感器的选取。

(2)数据预处理

为了从这些数字或符号(串)中抽取出对模式识别与机器学习有效的信息，必须进行数据预处理，包括数字滤波和特征提取。数据预处理是一个非常重要的步骤，它影响着整个模式识别与机器学习的成败。

(3)选择或设计模型

对同一个问题或许有许多不同的模型可以描述，不同的模型会导致识别和学习结果的不同，因此需要利用已有的经验和知识来选择或设计适当的模型。在确定了所建立的模型后，就可以估计模型的参数，需要注意的时，应该使得模型对未知数据有良好的适应性。

(4)训练所建立的模型

用前面所得的数据分成两组，一组作为训练数据，一组作为测试数据。设定目标误差，用训练数据对所建立的模型进行训练，达到目标误差，就停止训练，这样就确定了所建立模型的参数。

(5)测试、验证模型

测试模型的目的是为了确定所建立模型是否满足实际应用的要求。测试数据应该和训练用的样本数据不一致，否则，测试所得的结果永远都是满意的。用测试数据对

所建立模型进行测试，观察测试结果是否与实际情况是相符合。若与实际情况相符合，所建立模型就可对未知数据做预测，从而得到进一步的验证。

二、在这些步骤中，步骤(4)训练所建立的模型，涉及到学习。

三特征选取（也称作属性选择）是简化数据表达形式，是在模式识别中根据一定的原则，选取反映被识别模式本质的那些特征的方法或过程。模式识别和机器学习方法首先要解决的一个问题就是特征选择。在数据的前处理中，特征选择是一个非常重要的步骤，特征选择不合理，会影响识别和学习效果。通过特征选择和提取，我们才可得到所采集数据中最有效的信息，最有效的特征，选择出有利于分类或聚类建立模型的变量，从而实现特征空间维数的压缩，以降低后续处理过程的难度，才能基于这些特征对所建立模型进行训练和测试。同时特征选取也是降低存储要求，提高分类精度和效率的重要途径。

试题4（15%）：在使用模式识别与机器学习算法时，常常要进行数据的前处理，请指出在数据的前处理中，应完成些什么工作？什么叫特征选择？特征选择起什么作用？

答：1数据的前处理中，应完成数字滤波和特征提取等工作。数字滤波是为了消除输入数据或信息中的噪声，排除不相干的信号，只留下与被研究对象的性质和采用的识别方法密切相关的特征（如表征物体的形状、周长、面积等等）。特征提取是指从滤波数据中衍生出有用的信息，从许多特征中寻找出最有效的特征，以降低后续处理过程的难度。比如，图像识别时，提取的特征有灰度变化、纹理、形状等。我们对滤波后的这些特征进行必要的计算（比如进行快速傅里叶变换以得到信号功率谱）后，通过特征选择和提取或基元选择形成模式识别与机器学习的特征空间。2特征提取是指从滤波数据中衍生出有用的信息，从许多特征中寻找出最有效的特征，以降低后续处理过程的难度。

3在数据的前处理中，特征选择是一个非常重要的步骤，是模式识别和机器学习的关键，特征选择不合理，会影响识别和学习效果。通过特征选择和提取，我们才可得到所采集数据中最有效的信息，最有效的特征，以降低后续处理过程的难度，才能基于这些特征对所建立模型进行训练和测试。

（1）简化计算特征空间的维数越高，需占用的计算资源越多，设计和计算也就月复杂（2）简化特征空间结构由于特征提取和选择是去除类间差别小的特征，保留类间差别大的特征，因此，在特征空间中，每类所占据的子空间结构可分离性更强，从而也简化了类间分界面形状的复杂度。

试题5（15%）：根据下列的数据集，请利用一种机器学习的算法，设计一个程序，当输入三个数值作为Age, Tall，Weight时，马上就能给出答案，这应该是何种动物？（Sheep, Ox，或 Pig）。例如（0,30,8）=Sheep。

Age Tall Weight Animal

0 30 8 sheep

1 35 10 sheep

2 37 16 sheep

3 40 20 sheep

4 4

5 25 sheep

5 50 35 sheep

6 55 40 sheep

7 60 45 sheep

8 65 50 sheep

9 65 50 sheep

10 65 50 sheep

0 45 15 ox

1 50 25 ox

2 55 35 ox

3 65 45 ox

4 70 5

5 ox

5 75 65 ox

6 80 75 ox

7 85 85 ox

8 90 95 ox

9 95 105 ox

10 105 115 ox

0 15 5 pig

1 17 15 pig

2 20 25 pig

3 23 35 pig

4 27 4

5 pig

5 30 55 pig

6 33 65 pig

7 35 75 pig

8 37 85 pig

9 40 95 pig

10 45 105 pig

（1）用以上30个实例求出十组交叉验证的平均准确率。

两个问题都要提供可执行的Matlab程序。

答：（1）程序如下：直接用以下，每次选出两组数据（同时删去），看运行结果重复十次，

可知答案是70%

（2）用上述数据建立一个KNN模型见件附带程序KNNtrainfromFile.m，在Matlab 7.1 版本中运行这程序，将获得一个训练好的模型存到硬盘上的名字为

TrainingGroup.mat. 在程序useTrainedKNN.m中装入这个训练好的模型利用KNN 算法就可通过Age, Tall，Weight三个数据来识别是什么动物。KNNtrainfromFile.m程序

程序如下：

function asd=KNNtrainingFromFile()

% This program demostrates the application of KNN

namePre='animalExm'; %%%%%%%%%%%%

nameExt1='.txt';

name=[namePre nameExt1];

ptCell=file2cells(name); %converte data file to cellarray

%dispplayPt(ptCell)

im=size(ptCell,2); %number of training samples

jm=size(ptCell{1},2); %number of attributes for each sample.

training=zeros(im,jm-1);

decision{1}=cellstr(ptCell{1}{jm});

num=1;

group(im)=0;

%create training set and group numbers

for i=1:im

fprintf('\n No.%g ',i);

for j=1:jm-1

training(i,j)=str2num(ptCell{i}{j});

fprintf(' %s ',ptCell{i}{j});

end

tt=0;

for k=1:num

ads=cellstr(ptCell{i}{jm});

ads2=cellstr(decision{k});

if strcmp(ads,ads2)

group(i)=k;

tt=1;

break;

end

if tt==0

num=num+1;

decision{num}=cellstr(ptCell{i}{jm});

group(i)=num;

end

strc=char(ptCell{i}{jm});

fprintf('%s GROUP No. %g ',strc,group(i));

end

%test the KNN using samples

fprintf('Input sample\n');

sample =[ 3 60 46; 5 51 36;9 42 96] %examples

fprintf('Sample class\n');

class = knnclassify(sample, training, group)

save TrainingGroup training group%save the KNN model %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%5555

function dispplayPt(ptCell)

fprintf('\n Number of samples= %g\n',size(ptCell,2));

for i=1:size(ptCell,2)

fprintf('No.%g ',i);

for j=1:size(ptCell{i},2)

fprintf(' %s ',ptCell{i}{j}); %{j});

end

fprintf('\n');

end

fprintf('\n\n'); %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

function ptCell=file2cells(filename)

%read a text file adn transfer to cell ptCell

fid = fopen(filename,'r');

line = fgetl(fid);

linecell=line2cell(line);

numInput=size(linecell,2);

s{1}=linecell;

i=2;

while ~feof(fid)

line = fgetl(fid);

linecell=line2cell(line);

if size(linecell,2)~=numInput

s{i-1}

linecell

fprintf('\n Data number is wrong at record No:%g.',i);

fprintf('This data number is %g. It should be %g\n

\n',size(linecell,2),numInput);

break;

end

s{i}=linecell;

i=i+1;

end

ptCell=s;

status = fclose(fid); %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

function acell=line2cell(line)

acell={};

n=0;

while ~isempty(strtok(line))

if ~isempty(findstr(',',line))

delimiter=',';

else

fprintf('\n Data items sould be seperated by ","\n');

end

[token,line]=strtok(line,delimiter);

n=n+1;

acell{n}=token;

end

%%%%end of file2cells %%%%%%%%%%%%%%%%55555555

运行结果如下：

No.1 0 30 8 1 GROUP No. 1

No.2 1 35 10 1 GROUP No. 1

No.3 2 37 16 1 GROUP No. 1

No.4 3 40 20 1 GROUP No. 1

No.5 4 45 25 1 GROUP No. 1

No.6 5 50 35 1 GROUP No. 1

No.7 6 55 40 1 GROUP No. 1

No.8 7 60 45 1 GROUP No. 1

No.9 8 65 50 1 GROUP No. 1

No.10 9 65 50 1 GROUP No. 1

No.11 10 65 50 1 GROUP No. 1

No.12 0 45 15 2 GROUP No. 2

No.13 1 50 25 2 GROUP No. 2

No.14 2 55 35 2 GROUP No. 2

No.15 3 65 45 2 GROUP No. 2

No.16 4 70 55 2 GROUP No. 2

No.17 5 75 65 2 GROUP No. 2

No.18 6 80 75 2 GROUP No. 2

No.19 7 85 85 2 GROUP No. 2

No.20 8 90 95 2 GROUP No. 2

No.21 9 95 105 2 GROUP No. 2

No.22 10 105 115 2 GROUP No. 2

No.23 0 15 5 3 GROUP No. 3

No.24 1 17 15 3 GROUP No. 3

No.25 2 20 25 3 GROUP No. 3

No.26 3 23 35 3 GROUP No. 3

No.27 4 27 45 3 GROUP No. 3

No.28 5 30 55 3 GROUP No. 3

No.29 6 33 65 3 GROUP No. 3

No.30 7 35 75 3 GROUP No. 3

No.31 8 37 85 3 GROUP No. 3

No.32 9 40 95 3 GROUP No. 3

No.33 10 45 105 3 GROUP No. 3 Input sample

sample =

3 60 46

5 51 36

9 42 96

Sample class

class =

1为sheep； 2为ox；3为pig；

试题6（15%）：在你所知道的模式识别与机器学习算法中，那些方法较合适用来解决纯数值型数据的问题，那些方法较适合用来解决包含非数值数据的问题。答：在计算机进行信息处理时，所涉及到的数据包含数值型数据（Numeric）和非数值型数据（NonNumeric）两大类。数值型数据是指能参加算术或逻辑运算的数据；非数值型数据是指不能参加算术运算的数据，这些数据只能参加逻辑运算。纯数值型：

1. 贝叶斯决策法

是基于概率统计的基本的判别函数分类法。只要知道先验概率和条件概率就可以对样本进行判断，算法简单，易于理解和分析，其基本概念被众多的先进决策算法运用，判断结果较精确。

由于数据是纯数值型数据，数据简单，样本间的空间距离易计算，且先验概率和条件概率易求得。

2、BP神经网络算法

神经网络只能处理数值型数据，建立神经网络需要做的数据准备工作量很大. 要想得到准确度高的模型必须认真的进行数据清洗,整理,转换,选择等工作,对任何数据挖掘技术都是这样,神经网络尤其注重这一点.比如神经网络要求所有的输入变量都必须是0-1(或-1 -- +1)之间的实数,因此像"地区"之类文本数据必须先做必要的处理变成数值之后才能用作神经网络的输入。

但每个神经元的运算功能十分简单。各神经元之间是并行结构互使得其具有高速处理能力。在神经网络中，知识与信息的存储表现为神经元之间分布式的物理联系，知识存储容量很大。

3、贝叶斯算法

是一种具有最小错误率或最小风险概率的分类方法，是利用事件的先验概率和条件概率确定事件的后验概率，只要知道各个属性发生的频率数，就可根据结果进行精确的分类，效率高。

非数值型数据:

1、决策树

决策树很擅长处理非数值型数据, 决策树的分类方法.它是从实例集中构造决策树,是一种有指导的学习方法.该方法先根据训练子集(又称为窗口)形成决策树.如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到窗口中,重复该过程一直到形成正确的决策集. 决策树提供了一种展示类似在什么条件下会得到什么值这类规则的方法.是根据样本的必要属性分类的。其算法的特点是通过将大量数据有目的分类，从中找到一些有价值的，潜在的信息。它的主要优点是描述简单，分类速度快，特别适合大规模的数据处理。

2. 近邻法

是一种最简单的非参数模式识别方法中的模式匹配法,它主要依据样本间的多维空间距离来实现分类. 且该算法简单，易于理解和分析，分类效果好。

3、遗传算法，

特点从解集合进行搜索，利于全局择优。该算法具有收敛性，通过选择、交叉、变异操作能迅速排除与最优解相差极大的串。是非数值并行算法之一，解决了非数值数据及大量数据带来的计算量和存储量的问题。

试题7（10%）：请简单回答什么是督导学习？什么是无督导学习？什么是强化学习？各自可用来解决什么类型的问题？

答：1 督导学习，也就是监督学习。通过已有的一部分输入数据与输出数据之间的对应关系，生成一个函数，将输入映射到合适的输出，例如分类。利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程，也称为监督训练或有教师学习。可用来解决训练神经网络和决策树问题。

2督导学习，就是非监督学习。直接对输入数据集进行建模，例如聚类。根据类别未知（没有被标记）的训练样本解决模式识别中的各种问题。可用来解决聚类和特征分析问题。

3强化学习(reinforcement learning，又称再励学习，评价学习)是一种重要的机器学习方法，在智能控制机器人及分析预测等领域有许多应用。所谓强化学习就是智能系统从环境到行为映射的学习，以使奖励信号(强化信号)函数值最大，强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号)，而不是告诉强化学习系统如何去产生正确的动作。由于外部环境提供的信息很少，强化学习系统必须靠自身的经历进行学习。通过这种方式，强化学习系统在行动-评价的环境中获得知识，改进行动方案以适应环境。这类方法适合于动态、复杂的开放环境。

其实很多机器学习都是在解决类别归属的问题，即给定一些数据，判断每条数据属于哪些类，或者和其他哪些数据属于同一类等等。这样，如果我们上来就对这一堆数据进行某种划分(聚类)，通过数据内在的一些属性和联系，将数据自动整理

为某几类，这就属于非监督学习。如果我们一开始就知道了这些数据包含的类别，并且有一部分数据(训练数据)已经标上了类标，我们通过对这些已经标好类标的数据进行归纳总结，得出一个“数据-->类别”的映射函数，来对剩余的数据进行分类，这就属于监督学习。

监督学习中，我们的目标是学习从输入到输出的映射关系，其中输出的正确值已经由指导者提供。然而，非监督学习中却没有这样的指导者，只有输入数据。我们的目标是发现输入数据中的规律。输入空间存在着某种结构，使得特定的模式比其他模式更常出现，而我们希望知道哪些经常发生，哪些不经常发生。

需要注意的是，监督学习和非监督学习从一开始就是相对的，而强化学习在提出时并没有从训练样本歧义性的角度考虑其与监督学习和非监督学习的区别，因此，一些早期的研究中把强化学习视为一种特殊的非监督学习。事实上，对强化学习的定位到目前仍然是有争议的，有的学者甚至认为它是与“从例子中学习”同一级别的概念。

计算机视觉与图像处理、模式识别、机器学习学科之间的关系

计算机视觉与图像处理、模式识别、机器学习学科之间的关系在我的理解里，要实现计算机视觉必须有图像处理的帮助，而图像处理倚仗与模式识别的有效运用，而模式识别是人工智能领域的一个重要分支，人工智能与机器学习密不可分。纵观一切关系，发现计算机视觉的应用服务于机器学习。各个环节缺一不可，相辅相成。计算机视觉（computer vision），用计算机来模拟人的视觉机理获取和处理信息的能力。就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，用电脑处理成为更适合人眼观察或传送给仪器检测的图像。计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图象信号，纹理和颜色建模，几何处理和推理，以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。图像处理（image processing），用计算机对图像进行分析，以达到所需结果的技术。又称影像处理。基本内容图像处理一般指数字图像处理。数字图像是指用数字摄像机、扫描仪等设备经过采样和数字化得到的一个大的二维数组，该数组的元素称为像素，其值为一整数，称为灰度值。图像处理技术的主要内容包括图像压缩，增强和复原，匹配、描述和识别3个部分。常见的处理有图像数字化、图像编码、图像增强、图像复原、图像分割和图像分析等。图像处理一般指数字图像处理。模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类，从处理问题的性质和解决问题的方法等角度，模式识别分为有监督的分类（Supervised Classification）和无监督的分类(Unsupervised Classification)两种。模式还可分成抽象的和具体的两种形式。前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的，属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。应用计算机对一组事件或过程进行辨识和分类，所识别的事件或过程可以是文字、声音、图像等具体对象，也可以是状态、程度等抽象对象。这些对象与数字形式的信息相区别，称为模式信息。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。机器学习(Machine Learning)是研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。机器学习在人工智能的研究中具有十分重要的地位。一个不具有学习能力的智能系统难以称得上是一个真正的智能系统，但是以往的智能系统都普遍缺少学习的能力。随着人工智能的深入发展，这些局限性表现得愈加突出。正是在这种情形下，机器学习逐渐成为人工智能研究的核心之一。它的应用已遍及人工智能的各个分支，如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。机器学习的研究是根据生理学、认知科学等对人类学习机理的了解，建立人类学习过程的计算模型或认识模型，发展各种学习理论和学习方法，研究通用的学习算法并进行理论上的分析，建立面向任务的具有特定应用的学习系统。这些研究目标相互影响相互促进。

《机械基础期末考试试卷》.doc

广东实验技工学校 2012—2013学年第一学期期末考试《机械基础》科期末试卷A卷考试形式：闭卷班级：姓名：学号: 题号- ?四五总分得分 %1.填空题。（每空1分，共25分）。 1 .机器_般由、、和组成。 2.普通V带的标记由、和部分组成。 3 .根据螺纹牙型不同，螺纹可分为、、和螺纹。 4.M12X2-7H8H-S中，12 表示, 2 表示, 7H 表不，S表示O 5.齿轮传动的传动比，指主动轮与从动轮的之比，与齿数成，用公式表示为。 6.标准直齿圆柱齿轮正确啮合的条件为：； 7.蜗轮回转方向的判定不仅与蜗杆的有关，而且还与蜗杆的有关。 8.当急回运动行程速比系数时，曲柄摇杆机构有急回特性。 9.普通平键的规格采用标记，其截面尺寸应根据查表选取。 %1.选择题（每小题2分，共30分）。 1 .普通螺纹的公称直径是指螺纹的（）o A.大径 B.中径 C.小径

2.在相同的条件下，普通V带横截面尺寸（），其传递的功率也（）

A.越小越大 B.越大越小 C.越大越大 3.台虎钳上螺杆螺纹采用的是（） A.三角形螺纹 B.锯齿形螺纹 C.矩形螺纹 4.蜗杆传动中，蜗杆与蜗轮轴线在空间一般交错成（）。 A. 30° B. 60° C. 90° 5.在（）齿轮传动中,容易发生齿面磨损. A.开式 B.闭式 C.开式与闭式 6.国家标准规定，蜗杆以（）参数为标准参数，蜗轮以（）参数为标准参数。 A.端面 B.轴面 C.法面 7.当两轴相距较远，且要求瞬时传动比准确，应采用（）传动。 A.带 B.链 C.轮系 8.家用缝纫机踏板机构采用的是（）机构 A.曲柄摇杆 B.双摇杆 C.双曲柄 9.链的长度用链节数表示，链节数最好取（）o A.偶数 B.奇数 C.任意数 10.键连接主要用于（）场合。 A.拉力 B.横向力 C.扭矩 11.在皎链四杆机构中，能相对机架作整周旋转的连架杆为（）o A.连杆 B.摇杆 C.曲柄 12.凸轮与从动件接触处的运动副属于（）o A.局副 B.转动副 C.移动副 13.从动件作等加速等减速运动的凸轮机构（）。 A.存在刚性冲击 B.存在柔性冲击 C.没有冲击 14.三星轮换向机构是利用（）来实现从动轴回转方向的改变。 A.首轮 B.末轮 C.惰轮 15.在轴上支撑传动零件的部分称为（）o A.轴颈 B.轴头 C.轴身

认知心理学

认知心理学 ★第一章认知心理学导言一、广义的“认知” ：认识和知识，它既包含了一种动态性的加工过程(认识)，也包含了一种静态性的内容结构(知识)。狭义的“认知” ：指那些能使主体获得知识和解决问题的操作和能力。广义的认知心理学泛指一切以认知过程为对象的心理学研究；狭义的认知心理学是以信息加工理论观点为核心的心理学，又被称为信息加工心理学。认知心理学是以信息加工观点研究感知觉、注意、记忆思维和言语等心理过程，以及儿童认知发展和人工智能（计算机模拟）的一门心理科学。二、认知心理学的基本假设：存在着心理加工；人类是主动的信息加工者；心理加工可通过外部行为的测量来推知。三、认知模型：建立的目的：建立模型的目的是提供关于观察对象的一个容易理解的表征，同时用于发展各种假设和帮助进行预测。这些模型都有一个共同的特点：它们都建立在序列事件的基础上。 1、符号操作系统范式：基于信息加工观点，认为许多认知过程是以系列（serially）和序列(sequentially)的方式进行的。又称“信息处理模型”，“符号处理模型”，“串行处理模型”等。符号操作系统范式实际上是把人的认知活动看作为是一种信息处理过程，即可以按照符号结构和符号过程的表征来加工各种信息。Newell和Simon是首先对符号操作系统作出完整论述的认知心理学家。一个完整的符号操作系统应该具有六种功能：输入符号、存储符号、建立符号结构、条件性迁移、复制符号、输出符号。人类认知系统的基本特征：是一个符号运算系统；人类认知是一个多阶段、多层次的信息传递系统；人类信息加工能力的有限性；人是一个具有习得与发展有效认知策略的系统；人是一个新旧图式整合、建构、重构而获得知识的系统；人是一个不断发展的监控认知系统。联结主义范式：联结主义把认知描绘成是简单而大量的加工单元的联结网络，在此网络中的每一个单元的激活水平与来自于环境和其他与之相连接的单元有关。知识贮存在单元之间的联结中，学习就是建立新的联结或改变联结间的激活强度。该模型把信息看成是分布在各个神经元及神经元的连结中的，信息的加工是并行的，因此被称作“并行分布系统”（parallel distributed system）。在计算机和工程领域，人们又把它称作“人工神经网络”。2、联结主义平行分布加工（PDP）：所谓“平（并）行”指的是人可通过对多种处理单位的共同作用对信息进行加工。“分布”则指知识是以处理单位之间相互连接的分布方式储存在系统中的。这些连接单位可以被激活, 彼此可相互作用。 Bechtel (1991)曾归纳了联结主义的三个基本特征:1.信息是通过基本单元来处理的；2.处理单元间是平行联系的,所有的单元可同时、互相作用地完成它们的任务；3.单元间的连接具有权重。联结主义模型的组成部分：1. 一组单元。亦称为“节点”、“认知单元”或“处理单元”。主要是呈现某种水平的激活状态。可以分为三种单元“输入单元、输出单元和隐单元。 2. 激活状态。节点被激活以致产生某些变化，每一单元会产生某种激活状态。 3. 联结模式。兴奋性联结，抑制性联结。决定一个单元通过输入，对其他单元所产生的影响。 4. 节点激活规则。具体说明一个节点如何被输入，又如何与现在的状态相吻合。 5. 节点输出功能。一个节点的输出与某种激活相联系。 6. 学习规则。重要是使联结发生变化。联结主义模型的特点：内在并行性；分布式处理；容错性；自适应性。 ★第二章认知神经科学：加拿大心理学家Hebb用了20年时间与Penfield和Lashley等人合作，终于在1949年出版了《行为的组织》( Organization of Behavior)一书，为现代认知科学奠定了基础。 1949,Hebb率先使用connectionism （联结主义）这一术语对人的大脑模型进行了描述,并提出了著名的算法规则又称Hebb规则（定律）。赫布定律基于以下基本假设：共同激活的神经元成为联合；联合能发生在相邻的或疏远的神经元间，即整个皮层是联合存储；如果神经元成为联合，它们将发展成为功能体或细胞集合。他的《行为的组织》一书中有一个后来被广泛引用的段落：“当细胞 A 的一个轴突和细胞 B 很近，足以对它产生影响，并且持久地、不断地参与了对细胞 B 的兴奋，那么在这两个细胞或其中之一会发生某种生长过程或新陈代谢变化，以致于 A 作为能使 B 兴奋的细胞之一，它的影响加强了。”这个机制以及某些类似规则，现在称为赫布定律，又称突触学习学说。神经科学常用探测技术：多导细胞电活动记录；脑成像技术的发展；时间分辨率(temporal resolution)和空间分辨率(spatial resolution) 1、单细胞记录(single—unit recording) 2、脑电图（EEG Measurement/ 3、事件相关电位(event—related potentials，ERP/ 4、正电子发射断层扫描（PET） 5、磁共振成像(MRI和fMRI) 6、脑磁图(MEG) 认知心理学经典研究方法简介： 1、减法反应时（subtractive method）：用两种反应时的差数来判定某个心理过程的存在。在研究快速信息加工过程如识别、短时记忆应用这种方法。目的是测量包含在复杂反应中的辨别、选择等心理过程所需的时间。

机械基础期末考试题A(含答案)

《机械基础》期末考试题A及答案班级：姓名：学号：一、填空题（每空1分，1×30=30分） 1．构件是（）的单元，零件是（）的单元。 2．机器基本上是由（）、（）和（）三部分组成。 3．机构中瞬时（）速度与（）速度的比值称为机构的传动比。 4．包角是指带与带轮接触弧所对的（）。 5．螺纹按其用途可分为（）螺纹和（）螺纹两大类。6．螺纹的（）是指相邻两牙在中径线上对应两点间的轴向距离。7．齿轮传动的基本要求：一是（），二是（）。8．齿轮轮齿加工方法中的展成法是利用齿轮的( )原理进行轮齿加工的方法。 9．螺纹的种类很多，顺时针旋转时旋入的螺纹称（）；逆时针旋转时旋入的螺纹称（）。按螺旋线的数目不同，又可分为（）螺纹和（）螺纹。 10．铰链四杆机构一般分为三种基本类型：（）机构、（）

机构和（）机构。 11．具有周期性停歇间隙的单向运动称为（）。 12．按照轴承与轴工作表面间摩擦性质的不同，轴承可分为（）和（）两大类。 13．内、外螺纹相互旋合形成的连接称为（）。 14．一个齿轮的轮齿总数叫做（），用代号（）表示。齿距除以圆周率所得到的商称为（），用代号（）表示，单位为（）。二、选择题（每个2分，2×10=20分） 1．平带传动中，带轮包角不得小于（）。 A.180° B.150° C.120° D.160° 2．V带传动中，带轮包角不得小于（）。 A.150° B.180° C.160° D.120° 3．普通螺纹的代号是（） A.R B.Tr C.G D.M 4．传动用滚子链的标记（24A-2×60 GB1243.1）中,60表示: A.节距 B.排距 C.链节 D.链宽 5．标准直齿锥齿轮副的轴交角为（） A.60° B.90° C.120° D.150° 6．标准直齿圆柱齿轮不产生根切现象的最少齿数为（） A.27 B.17 C.18 D.20 7．标准直齿圆柱齿轮的齿形角为（）。Ａ.20° B.30° C.45° D.60°

认知心理学重点整理资料讲解

学习指导：第一章：绪论１、认知心理学的定义认知心理学有广义和狭义两种涵义广义的认知心理学主要探讨人类内部心理活动过程、个体认知的发生与发展，以及对人的心理事件、心理表征和信念、意向等心理活动的研究。狭义的认知心理学，是以信息加工理论观点为核心的心理学，又被称为信息加工心理学。本书中的内容以狭义为主。认知心理学产生的背景及重要事件 : 1956 年是认知心理学发展史中最为重要的一年。１９６７年，美国心理学家奈塞尔出版了《认知心理学》的专著标志着认知心理学的建立。 1、在麻省理工学院的一次会议上，乔姆斯基提交了他关于语言学理论的论文。 2、米勒报告了短时记忆容量为 7 这一重要结果。 3、纽维尔和西蒙讨论了后来极富影响的”通用问题解决者”模型。 4、布鲁纳等从认知加工的观点考察了概念形成的规律。 5、人工智能也在 Dartmouth 会议上创立３、认知心理学的两种研究取向 : 认知心理学的两大范式 1、符号操作系统范式（信息加工学说）：1968 年 S.Paert 的专著《感知器》出版成为符号操作系统范式诞生的标志。完整符号操作系统的六个功能：符号（模式）具有双重属性：一是具有表征外部事物的功能；二是其自身具有物理或形式上的特征，可以标志信息加工的操作。一个完整的符号操作系统应该具有以下六种功能：第一种功能，输入符号（输入）。第二种功能，存储符号（存储）。第三种功能，建立符号结构。第四种功能，条件性迁移（条件传递）。第五种功能，复制符号（复制）。第六种功能，输出符号（输出）。由符号操作系统范式得出三点推论第一个推论，既然人具有智能，它就一定是一个完整的符号操作系统。第二个推论，既然计算机是一个完整的符号操作系统，它就能够表现出某种智能。第三个推论，既然人是一个完整的符号操作系统，计算机也是一个符号操作系统，那么，就能够用计算机来模拟人的认知活动过程。 2、联结主义范式（联结主义学说）：２０世纪８０年代，联结主义范式逐渐形成，并对信息加工的认知心理学理论及其相关的元理论提出了许多不同看法。联结主义认为，人类的认知活动的本质在于神经元之间的联结强度，以及它们之间不断发生的动态变化，即对信息进行的是并行分布的加工处理，这种联结与处理是连续变化的模拟计算，它不同于对物理符号的模拟计算。联结主义理论模型有以下部分组成：一组单元。亦称节点、认知单元、处理单元。激活状态。联结模式。节点激活规则。节点输出功能。学习规则。根据以上联结主义理论的假设，可以概括出它所具有的四个明显的特点：内在并行性、分布式处理、容错性和自适应性。第二章：认知心理学的研究方法１、反应时法在认知心理学研究中的地位：一、涵义反应时是指刺激作用于有机体后到其作出明显反应所需要的时间，即刺激与反应之间的时间间隔；又称为有机体反应潜伏期，

模式识别与机器学习思测试卷附参考标准答案

模式识别与机器学习期末考查思考题 1：简述模式识别与机器学习研究的共同问题和各自的研究侧重点。机器学习是研究让机器（计算机）从经验和数据获得知识或提高自身能力的科学。机器学习和模式识别是分别从计算机科学和工程的角度发展起来的。然而近年来，由于它们关心的很多共同问题（分类、聚类、特征选择、信息融合等），这两个领域的界限越来越模糊。机器学习和模式识别的理论和方法可用来解决很多机器感知和信息处理的问题，其中包括图像/视频分析、（文本、语音、印刷、手写）文档分析、信息检索和网络搜索等。近年来，机器学习和模式识别的研究吸引了越来越多的研究者，理论和方法的进步促进了工程应用中识别性能的明显提高。机器学习：要使计算机具有知识一般有两种方法；一种是由知识工程师将有关的知识归纳、整理，并且表示为计算机可以接受、处理的方式输入计算机。另一种是使计算机本身有获得知识的能力，它可以学习人类已有的知识，并且在实践过程中不总结、完善，这种方式称为机器学习。机器学习的研究，主要在以下三个方面进行：一是研究人类学习的机理、人脑思维的过程；和机器学习的方法；以及建立针对具体任务的学习系统。机器学习的研究是在信息科学、脑科学、神经心理学、逻辑学、模糊数学等多种学科基础上的。依赖于这些学科而共同发展。目前已经取得很大的进展，但还没有能完全解决问题。模式识别：模式识别是研究如何使机器具有感知能力，主要研究视觉模式和听觉模式的识别。如识别物体、地形、图像、字体（如签字）等。在日常生活各方面以及军事上都有广大的用途。近年来迅速发展起来应用模糊数学模式、人工神经网络模式的方法逐渐取代传统的用统计模式和结构模式的识别方法。特别神经网络方法在模式识别中取得较大进展。理解自然语言计算机如能“听懂”人的语言（如汉语、英语等），便可以直接用口语操作计算机，这将给人们带来极大的便利。计算机理解自然语言的研究有以下三个目标：一是计算机能正确理解人类的自然语言输入的信息，并能正确答复（或响应）输入的信息。二是计算机对输入的信息能产生相应的摘要，而且复述输入的内容。三是计算机能把输入的自然语言翻译成要求的另一种语言，如将汉语译成英语或将英语译成汉语等。目前，研究计算机进行文字或语言的自动翻译，人们作了大量的尝试，还没有找到最佳的方法，有待于更进一步深入探索。机器学习今后主要的研究方向如下： 1)人类学习机制的研究；

认知心理学名词解释

认知心理学名词解释认知心理学；认知心理学是研究人的高级心理活动过程的学科，即研究人接受、编码、操作、提取和利用知识的过程，这个过程包括知觉、语言、智能、表象、思维、推理、问题解决、概念形成和创造性。广义的认知心理学主要探讨人类内部的心理活动过程、个体认知的发生与发展，以及对人的心理事件、心理表征和信念、意向等心理活动的研究。狭义的认知心理学是以信息加工理论观点为核心的心理学，又称为信心加工心理学。信息加工理论：20世纪50年代末、信息论、控制论、系统论推动了信息加工理论，用计算机对信息的输入、存储、加工过程来解释人的认知过程的理论。信息装置：即把人视为一个接受信息、加工和处理信息的传递装置。信息编码：即一套信息加工的特殊规则。（它把消息、信号、符号或事物的状态，理解为是由一种形式转换成另一种形式，由一种能量媒介物转换成另一种能量媒介物，或由一种物理状态转换成另一种物理状态的过程。）通道容量：即在一定时间内一个通道所能传递的信息的有限性或极限性。符号操作系统范式；符号操作系统范式（象征的系统）在认知心理学领域又被称为“信息处理模型”、“符号处理模型”、“串行处理模型”等。1968年佩泊特出版《感知器》成为符号操作系统范式诞生的标志。符号操作系统范式把人看作一个“信息处理系统”，或者称作“符号操作系统”。代表人物纽韦尔和西蒙等人。符号：就是模式，任何一个模式只要它能和其他模式相区别，它就是一个符号。信息加工系统：是指能够接收、存储、处理和传递信息的系统。由记忆装置、加工器、效应器和接受器组成。联想记忆；安德森和鲍威尔提出：首先分析简单的命题句子，并把分析后的句子输入到存储器中保持，当出现新句子时，调动已经存储在“网络知识库”中的信息来回答或解决问题。适应性控制；即思维的适应性控制。安德森提出的有关一般性知识存储的认知模型，用程序来说明知识的组织和表象概念的激活过程，并对陈述性知识和程序进行区分。联结主义范式：20世纪80年代兴起，联结主义认为，人类的认知活动的本质在于神经元之间的联结强度，以及它们之间不断发生的动态变化，即对信息进行并行分布式的加工处理，这种联结与处理是连续变化的模拟计算。其实质是用数学与计算模型的说明人类心智的过程与特点。通用问题解决程序；由纽韦尔和西蒙设计，采用启发式程序，用“手段一目标分析”方式，把问题的解决程序通过提出一些子目标的办法一步一步地缩小初始状态和最终目标状态之间的差异，最后解决问题。计算机隐喻是指把计算机作为人脑功能的一种心理模型，从中引申出人的认知过程或心理活动是一种“计算”的观念。抽象分析方法：又称为会聚性证明法，是指采用人与计算机之间的功能类比，并以其他实验分析为辅助，通过结合与抽象，以推理、判断的方式得出结论的研究方法。计算机模拟方法：指用计算机来模拟、检验、发现人的认知活动及其行为表现的规律的研究方法。流程图式是指以作业图或信息流程图的形式表示人的心理活动，并以此分析人的信息加工过程的研究方法。信息加工流程模式：由于认知心理学把人视为计算机式的信息加工系统，因此经常采用流程图的方式来分析与概括人的信息加工过程，它是一种简明、扼要地说明人的心理上活动过程的具体方法。（图例39）

黄庆明模式识别与机器学习第三章作业

·在一个10类的模式识别问题中，有3类单独满足多类情况1，其余的类别满足多类情况2。问该模式识别问题所需判别函数的最少数目是多少？应该是252142 6 *74132 7=+=+ =++C 其中加一是分别3类和 7类 ·一个三类问题，其判别函数如下： d1(x)=-x1, d2(x)=x1+x2-1, d3(x)=x1-x2-1 (1)设这些函数是在多类情况1条件下确定的，绘出其判别界面和每一个模式类别的区域。 (2)设为多类情况2，并使：d12(x)= d1(x), d13(x)= d2(x), d23(x)= d3(x)。绘出其判别界面和多类情况2的区域。

(3)设d1(x), d2(x)和d3(x)是在多类情况3的条件下确定的，绘出其判别界面和每类的区域。 ·两类模式，每类包括5个3维不同的模式，且良好分布。如果它们是线性可分的，问权向量至少需要几个系数分量？假如要建立二次的多项式判别函数，又至少需要几个系数分量？（设模式的良好分布不因模式变化而改变。）如果线性可分，则4个建立二次的多项式判别函数，则102 5 C 个 ·(1)用感知器算法求下列模式分类的解向量w: ω1: {(0 0 0)T , (1 0 0)T , (1 0 1)T , (1 1 0)T } ω2: {(0 0 1)T , (0 1 1)T , (0 1 0)T , (1 1 1)T } 将属于ω2的训练样本乘以（-1），并写成增广向量的形式。 x ①=(0 0 0 1)T , x ②=(1 0 0 1)T , x ③=(1 0 1 1)T , x ④=(1 1 0 1)T x ⑤=(0 0 -1 -1)T , x ⑥=(0 -1 -1 -1)T , x ⑦=(0 -1 0 -1)T , x ⑧=(-1 -1 -1 -1)T 第一轮迭代：取C=1，w(1)=(0 0 0 0) T 因w T (1) x ① =(0 0 0 0)(0 0 0 1) T =0 ≯0，故w(2)=w(1)+ x ① =(0 0 0 1) 因w T (2) x ② =(0 0 0 1)(1 0 0 1) T =1>0，故w(3)=w(2)=(0 0 0 1)T 因w T (3)x ③=(0 0 0 1)(1 0 1 1)T =1>0，故w(4)=w(3) =(0 0 0 1)T 因w T (4)x ④=(0 0 0 1)(1 1 0 1)T =1>0，故w(5)=w(4)=(0 0 0 1)T 因w T (5)x ⑤=(0 0 0 1)(0 0 -1 -1)T =-1≯0，故w(6)=w(5)+ x ⑤=(0 0 -1 0)T 因w T (6)x ⑥=(0 0 -1 0)(0 -1 -1 -1)T =1>0，故w(7)=w(6)=(0 0 -1 0)T 因w T (7)x ⑦=(0 0 -1 0)(0 -1 0 -1)T =0≯0，故w(8)=w(7)+ x ⑦=(0 -1 -1 -1)T 因w T (8)x ⑧=(0 -1 -1 -1)(-1 -1 -1 -1)T =3>0，故w(9)=w(8) =(0 -1 -1 -1)T 因为只有对全部模式都能正确判别的权向量才是正确的解，因此需进行第二轮迭代。第二轮迭代：因w T (9)x ①=(0 -1 -1 -1)(0 0 0 1)T =-1≯0，故w(10)=w(9)+ x ① =(0 -1 -1 0)T

模式识别研究进展-刘成林and谭铁牛

模式识别研究进展刘成林，谭铁牛中国科学院自动化研究所模式识别国家重点实验室北京中关村东路95号摘要自20世纪60年代以来，模式识别的理论与方法研究及在工程中的实际应用取得了很大的进展。本文先简要回顾模式识别领域的发展历史和主要方法的演变，然后围绕模式分类这个模式识别的核心问题，就概率密度估计、特征选择和变换、分类器设计几个方面介绍近年来理论和方法研究的主要进展，最后简要分析将来的发展趋势。 1. 前言模式识别(Pattern Recognition)是对感知信号（图像、视频、声音等）进行分析，对其中的物体对象或行为进行判别和解释的过程。模式识别能力普遍存在于人和动物的认知系统，是人和动物获取外部环境知识，并与环境进行交互的重要基础。我们现在所说的模式识别一般是指用机器实现模式识别过程，是人工智能领域的一个重要分支。早期的模式识别研究是与人工智能和机器学习密不可分的，如Rosenblatt的感知机[1]和Nilsson的学习机[2]就与这三个领域密切相关。后来，由于人工智能更关心符号信息和知识的推理，而模式识别更关心感知信息的处理，二者逐渐分离形成了不同的研究领域。介于模式识别和人工智能之间的机器学习在20世纪80年代以前也偏重于符号学习，后来人工神经网络重新受到重视，统计学习逐渐成为主流，与模式识别中的学习问题渐趋重合，重新拉近了模式识别与人工智能的距离。模式识别与机器学习的方法也被广泛用于感知信号以外的数据分析问题（如文本分析、商业数据分析、基因表达数据分析等），形成了数据挖掘领域。模式分类是模式识别的主要任务和核心研究内容。分类器设计是在训练样本集合上进行优化（如使每一类样本的表达误差最小或使不同类别样本的分类误差最小）的过程，也就是一个机器学习过程。由于模式识别的对象是存在于感知信号中的物体和现象，它研究的内容还包括信号/图像/视频的处理、分割、形状和运动分析等，以及面向应用（如文字识别、语音识别、生物认证、医学图像分析、遥感图像分析等）的方法和系统研究。本文简要回顾模式识别领域的发展历史和主要方法的演变，介绍模式识别理论方法研究的最新进展并分析未来的发展趋势。由于Jain等人的综述[3]已经全面介绍了2000年以前模式分类方面的进展，本文侧重于2000年以后的研究进展。

《机械基础》期末试题B卷及答案

佛山市联创汽车职业学校2013—2014学年第一学期《机械基础》期末考试B 卷该试题适用班级:1207班一、填空题(每2分,共40分)。 1、设计机械零件时,保证零件在规定期限内不产生失效所依据的原则,称为。 2、两构件之间直接接触,又能作一定相对运动的联接,称为。 3、在铰链四杆机构简图中,固定不动的称为。 4、铰链四杆机构可按摇杆的存在情况分为三种基本形式:曲柄摇杆机构、双曲柄机构与双摇杆机构。 5、在曲柄摇杆机构中,存在着一个位置使得曲柄不可转动,机构的这种位置称为。 6、在推程或回程中,从动件所移动的距离称为 ,用h 表示。 7、形位公差带有四个基本要素构成,即公差带的形状、大小、方向与。 8、按结构特点与工作原理;键连接可分为 ,半圆键与楔键联接。 9、螺就是在圆柱(或圆锥)表面上沿切制出的具有相同截面的连续凸起与沟槽。 10、螺旋传动由螺杆(螺旋),螺母与机架组成,将主动件的回转运动变为从动件的。 11、摩擦型带传动按带横街面的形状的不同分为:平带传动、、多楔带传动、圆带传动。 12、常见的齿轮失效形式有、齿面点蚀、齿面磨损、齿面胶合。 13、按照蜗杆齿廓曲线的形状,普通圆柱蜗杆传动又分为、环面蜗杆传动、锥蜗杆传动。 14、根据轮系在运转时各齿轮的轴线相对于机架的位置就是否固定,可以分为与周转轮系两种基本类型。

15、在定轴轮系中的传动比正负号取决于。 16、轴的主要功用就是支承旋转零件,使其具有确定的 , 以传递动力与运动。 17、按摩擦性质,轴承可分为滑动轴承与两大类。 18、滚动轴承代号中的基本代号就是一个基础,由 ,尺寸系列代号与内径代号组成。 19、刚性联轴器按照能否补偿轴线偏移分为与可移式联轴器两大类。 20、牙嵌式离合器的牙型有三角形、、梯形、锯齿形等。二、判断题(每题2分,共30分)。 1、组成机构的各个相对运动部分称为零件。( ) 2、构件与运动副就是机构最基本的组成部分。( ) 3、凸轮从动件的运动规律只有等速运动规律。( ) 4、公差带的大小由公差值决定;公差带相对零线的位置由靠近零线的上偏差或下偏差决定。( ) 5、“//”在形位公差中属于位置(定向)公差。( ) 6、公差带的方向就是指公差带的宽度方向或直径方向。( ) 7、通常用于固定零件之间的相对位置的销联接方式叫做定位销。( ) 8、螺纹的旋合长度分为短、中、长三种,分别用S、N、L表示,在标注时若为中等旋合长度,则应标注“Ｎ”。( ) 9、带传动的设计准则就是:在保证带传动不打滑的条件下,具有一定的疲劳强度与寿命。( ) 10、渐开线的形状取决于基圆的大小,但就是在基圆以内无渐开线。( ) 11、蜗杆常用优质碳素钢或青铜制造。( ) 12、不影响轮系传动比大小,但改变传动比的正负号即改变传动轴的转向,该齿轮

人工智能与模式识别

人工智能与模式识别摘要：信息技术的飞速发展使得人工智能的应用范围变得越来越广，而模式识别作为其中的一个重要方面，一直是人工智能研究的重要方向。在介绍人工智能和模式识别的相关知识的同时，对人工智能在模式识别中的应用进行了一定的论述。模式识别是人类的一项基本智能，着20世纪40年代计算机的出现以及50年代人工智能的兴起，模式识别技术有了长足的发展。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。模式识别的发展潜力巨大。关键词：模式识别；数字识别；人脸识别中图分类号； Abstract:The rapid development of information technology makes the application of artificial intelligence become more and more widely. Pattern recognition, as one of the important aspects, has always been an important direction of artificial intelligence research. In the introduction of artificial intelligence and pattern recognition related knowledge at the same time, artificial intelligence in pattern recognition applications were discussed.Pattern recognition is a basic human intelligence, the emergence of the 20th century, 40 years of computer and the rise of artificial intelligence in the 1950s, pattern recognition technology has made great progress. Pattern recognition and statistics, psychology, linguistics, computer science, biology, cybernetics and so have a relationship. It has a cross-correlation with artificial intelligence and image processing. The potential of pattern recognition is huge. Key words:pattern recognition; digital recognition; face recognition; 1引言随着计算机应用范围不断的拓宽，我们对于计算机具有更加有效的感知“能

模式识别与机器学习期末考查试题及参考答案(20210221222717)

模式识别与机器学习期末考查试卷研究生姓名：入学年份：导师姓名：试题1：简述模式识别与机器学习研究的共同问题和各自的研究侧重点。答：（1）模式识别是研究用计算机来实现人类的模式识别能力的一门学科，是指对表征事物或现象的各种形式的信息进行处理和分析，以对事物或现象进行描述、辨认、分类和解释的过程。主要集中在两方面，一是研究生物体（包括人）是如何感知客观事物的，二是在给定的任务下，如何用计算机实现识别的理论和方法。机器学习则是一门研究怎样用计算机来模拟或实现人类学习活动的学科，是研究如何使机器通过识别和利用现有知识来获取新知识和新技能。主要体现以下三方面：一是人类学习过程的认知模型；二是通用学习算法；三是构造面向任务的专用学习系统的方法。两者关心的很多共同问题，如：分类、聚类、特征选择、信息融合等，这两个领域的界限越来越模糊。机器学习和模式识别的理论和方法可用来解决很多机器感知和信息处理的问题，其中包括图像/ 视频分析（文本、语音、印刷、手写）文档分析、信息检索和网络搜索等。（2）机器学习和模式识别是分别从计算机科学和工程的角度发展起来的，各自的研究侧重点也不同。模式识别的目标就是分类，为了提高分类器的性能，可能会用到机器学习算法。而机器学习的目标是通过学习提高系统性能，分类只是其最简单的要求，其研究更

侧重于理论，包括泛化效果、收敛性等。模式识别技术相对比较成熟了，而机器学习中一些方法还没有理论基础，只是实验效果比较好。许多算法他们都在研究，但是研究的目标却不同。如在模式识别中研究所关心的就是其对人类效果的提高，偏工程。而在机器学习中则更侧重于其性能上的理论证明。试题2：列出在模式识别与机器学习中的常用算法及其优缺点。答：（1）K 近邻法算法作为一种非参数的分类算法，它已经广泛应用于分类、回归和模式识别等。在应用算法解决问题的时候，要注意的两个方面是样本权重和特征权重。优缺点：非常有效，实现简单，分类效果好。样本小时误差难控制，存储所有样本，需要较大存储空间，对于大样本的计算量大。（2）贝叶斯决策法贝叶斯决策法是以期望值为标准的分析法，是决策者在处理风险型问题时常常使用的方法。优缺点：由于在生活当中许多自然现象和生产问题都是难以完全准确预测的，因此决策者在采取相应的决策时总会带有一定的风险。贝叶斯决策法就是将各因素发生某种变动引起结果变动的概率凭统计资料或凭经验主观地假设，然后进一步对期望值进行分析，由于此概率并不能证实其客观性，故往往是主观的和人为的概率，本身带有一定的风险性和不肯定性。虽然用期望的大小进行判断有一些风险，但仍可以认为贝叶斯决策是一种兼科学性和实效性于一身的比较完善的用于解决风险型决策问题的方法，在实际中能够广泛应

机械基础少学时(11重5)期末考试B卷

技师学院2012学年第一学期期末试卷B卷 11级机械基础（重5班）班级姓名学号得分一、填空题（每空1分，共30分） 1.机器一般由___________、___________、___________和___________组成。 2.链轮在轴上必须保证___________和___________固定，最好成水平布置，否则易引起脱链和产生不正常的磨损。 3.V带传动常见的张紧方法有___________和___________。 4.国家标准规定，正常齿的齿顶高系数h a*=___________。 5.齿轮收到严重冲击或轮齿长期工作后，经过多次反复的弯曲，轮齿会突然___________，造成事故。 6. 蜗杆传动由___________和___________组成，通常由___________（主动件）带动___________（从动件）转动，并传递运动和力。 7.采用行星轮系，可以将两个独立的运动___________为一个运动，或将一个运动___________为两个独立的运动。 8.螺旋传动是由___________和___________组成的，主要用来将旋转运动变换为直线运动，同时传递运动和动力。 9.齿轮在轴上的固定方式有___________、___________和___________三种。 10.机构中至少有一个运动副是___________机构，称为高副机构。 11.铰链四杆机构中，固定不动的杆件称为___________；不与机架直接连接的杆件称为___________；杆件与机架用转动副相连接，且能绕该转动副回转中心作整周旋转的杆件称为___________；杆件与机架用转动副相连接，但只能绕该转动副回转中心摆动的杆件称为摇杆。 12.凸轮机构主要由___________、___________和___________三个基本构件组成。 13.间歇机构的常见类型有___________和___________等。二、选择题（每题1.5分，共30分） 1.下列装置中，属于机器的是（）。 A．自行车 B.台虎钳 C. 内燃机 2.机构和机器的本质区别在于（）。

机械基础期末考试答案

精品文档期末考试试卷（A）卷答案 2013-2014学年第二学期科目：《机械基础》一、填空题。（每空1分，共20分） 1.铰链四杆机构按曲柄存在的情况，分为曲柄摇杆机构、双曲柄机构和双摇杆机构三种基本形式。 2.螺纹连接的基本类型有：螺栓连接、双头螺柱连接、螺钉连接和紧定螺钉连接。 3.以凸轮的最小半径所做的圆称为基圆。 4.常用的润滑剂有润滑油和润滑脂。 5.根据两轴的相对位置和轮齿方向的不同，齿轮传动可分为圆柱齿轮传动、圆锥齿轮传动和交错轴的蜗杆蜗轮。 6.标准直齿圆柱齿轮的压力角α=20° 7.由一系列相互啮合的齿轮组成的传动系统称为轮系。 8.运动副是指使两构件之间既能保持直接接触，而又能产生一定相对运动的连接。 9.曲柄摇杆机构能将曲柄的整周回转运动转换为摇杆的往复摆动运动。 10.将主动件的均匀转动转换为时转时停的周期性运动的机构，称为间歇运动机构。 11.在实际生产中，常常利用急回运动，来缩短空回行程时间，从而提高工作效率。 12.锥齿轮传动应用于两轴线相交的场合，通常采用两轴交角为 90°。 13.在铰链四杆机构中，固定不动的杆件称为机架；与机架用转动副相连接的杆件称为连架杆；不与机架直接连接的杆件称为连杆。 14.有惰轮的轮系只能改变从动轮转向，不能改变轮系的传动比。 15.凸轮机构由凸轮、从动件和机架三个基本构件组成。 16.为适应人们的视觉暂现象，要求电影放映机上的卷片机构能使影片作间歇运动，此间歇运动通过槽轮机构实现。 17.凸轮与从动件接触处的运动副属于高副 18.轮系可获得大的传动比，并可作较远距离的传动。二、判断题。（每题2分，共20分，对的打√，错的打×） 1.在铰链四杆机构中，如存在曲柄，则曲柄一定为最短杆。（×） 2.尖顶式从动杆与凸轮接触摩擦力较小，故可用来传递较大的动力（×） 3.轮系中的惰轮可以改变从动轮的转向和轮系传动比的大小。（×） 4.曲柄的极位夹角θ越大，机构的急回特性也越显著。（√） 5.一对能正确啮合的渐开线直齿圆柱齿轮传动，其啮合角一定为20°（√） 6.弹性滑动是带传动的固有特性，是不可避免的。（√） 7.在圆周速度小于30m/s时，带轮最常用的材料为铸铁。（√） 8.齿轮在运动中轴线位置都不动的轮系称为定轴轮系。（√） 9.按凸轮的理论，轮廓曲线的最小半径所做的圆称为凸轮的基圆（√） 10.齿轮传动是靠轮齿的直接啮合来传递运动和动力的。（√）三、选择题：将正确的选项填入答题框（每题2分，共30分） 1.能产生急回运动的平面连杆机构有（ C ） A、双曲柄机构 B、双摇杆机构 C、曲柄摇杆机构 2.不属于凸轮机构从动杆的端部形式有（C ） A、尖顶式 B、滚子式 C、直动式 D、平底式 3.通常根据（ C ）选择平键的宽度和厚度。 A、传递转矩的大小 B、传递功率的大小 C、轴的直径 4.在螺栓连接中，采用弹簧垫圈防松的是（ A ）。 A、摩擦防松 B、机械防松 C、冲边防松 5.普通螺纹的公称直径是指（ A ）。 A、螺纹大径 B、螺纹小径 C、螺纹中径 6.汽车底盘传动轴应选用（ B ） A、齿轮式联轴器 B、万向联轴器 C、滑块联轴器 7.V带是标准件，在标准系列之中规定（ B ）是公称长度。 A、内周长度 B、基准长度 C、计算长度 8.下列传动中，可以用于两轴相交的场合的是（ C ） A、链传动 B、直齿圆柱齿轮传动 C、直齿圆锥齿轮传动 9.润滑良好的闭式蜗杆传动的主要失效形式是（ C ） A、齿面点蚀 B、齿面磨损 C、齿面胶合 10.齿轮在运动中轴线位置都不动的轮系称为（ C ） A、行星轮系 B、周转轮系 C、定轴轮系 11.轮系可获得大的传动比，并可作（ C ）距离的传动。 A、较近 B、都不是 C、较远

认知心理学复习重点整理

认知心理学复习重点选择题20分，5个实验，1个论述题，4个简答题。前七章 1.认知心理学的研究的内容、核心、认知心理学中的两个研究指标：反应时和正确率。 2. 复述分为两种：简单复述和精细复述 3．感觉记忆的研究是用什么方法来研究的？部分报告法 4图像记忆的容量？9到20个保持时间300到500毫秒 5.侧向扩散 6 问题行为图包含的两个成分 7.深层转换语法包含的两个成分 8推理产生错误的原因 9 速度与正确率权衡问题 10 鸡尾酒会效应 11 自由回忆实验 12 人工代理 13 问题空间 14 模式识别 15 追随程序 16 范畴大小效应 17 Burner的人工概念的实验 18 系列位置效应的实验 19 探测刺激的实验探测法的实验（短时记忆的遗忘） 20 注意章节：注意的选择机制知觉选择模型和反应选择模型中枢能量理论计算机模拟法基本逻辑知觉产生的理论 21 Sternberg 短时记忆信息提取方式的实验 22 Paivio 的斑马试验 23 Navon 的整体加工与局部加工实验 24 轮廓比较与命名实验（又称短时记忆视觉编码实验）

1.认知心理学的研究的内容、核心、P1 认知心理学：以信息加工观点为核心的心理学，又可称作信息加工心理学，主要研究认知或认知过程，研究范围包括感知觉，注意，表象，学习记忆，思维和言语等心理过程或认知过程。认知心理学中的两个主要研究指标：反应时和正确率（即作业成绩）。 2.复述P84 复述是一种不出声地对刺激信息进行重复默诵的内部过程。复述可以分为机械性复述或称为保持性复述（maintenance rehearsal)和精致性复述或称为整合性复述(elaborative rehearsal)。 1）简单复述即以前所说的的复述，它有助于项目在短时记忆中保持，即如复述缓冲器，现又称为保持性复述。 2）精致性复述是将要复述的材料加以组织，将它与其他信息联系起来，在更深的层次上进行加工。这种复述又称为整合性复述，可以使信息转入长时记忆。3．感觉记忆的研究是用什么方法来研究的？部分报告法P75 部分报告法：Sperling在每组的视觉刺激信息呈现之后（呈现时间50毫秒），发出一个声音，提示3行字母中的哪一行要求被试报告出来。其中上行的字母与高音相联系，中行的字母与中音相联系，下行的字母与低音相联系。要求被试在字母呈现后，根据出现的声音信号，对相应一行的字母马上做出报告（部分报告法）。 4 感觉记忆P75 当外部刺激直接作用于感觉感觉，产生感觉像后，虽然刺激的作用停止，但感觉像仍可维持极短的片刻。这种感觉滞留在视觉中最为突出。感觉滞留表明感觉信息的瞬间贮存。这种记忆就是感觉记忆或感觉登记。图像记忆的容量为9到20个；保持时间300到500毫秒；声象记忆的容量为8到9个项目，时间为4秒。 5.侧向扩散P89 侧向扩散是指在某一个水平上，或者是较浅的水平或者是较深的水平，加工在横向扩展开来。以阅读为例说明：校对阅读和要点阅读。 6 问题行为图包含的两个成分P10 问题行为图一种分析口语记录的方法称之为问题行为图，这是Newell和Simon提出的分析方法，可以使人直观地看出问题解决过程中所进行的各种操作的序列。这种问题行为图有两个成分组成：1）知识状态，即人在某一具体时刻所知的关于改该作业或问题的全部信息；2）操作，即人每次用来改变其知识状态的手段。 7.Chomsky的生成转换语法包含的两个成分P219——222 包含短语结构语法和转换语法，而以后者最为著名。短语结构语法认为，一个句子是有许多组成成分构成的，其中短语是最重要的结构。Chomsky认为，短语结构语法仍未能完全确切地解释语言。区分句子的两种结构：表层结构和深层结构。