数字图像的特征提取

呵呵,看了半天，原来你只不过要求进行边缘检测就可以，然后再做阈值化而已，太简单了。按照下面做即可：

void RobelEdgeDetect(LPBYTE lpDibTemp, LPBYTE lpDibSave,int width,int height)

{

int i,j;

float R;

float RCos,RSin;

for(j=1;j

for(i=1;i

{

RCos=(float)(lpDibTemp[(j-1)*width+i+1]+2*lpDibTemp[j*width+i+1]+lpDibTemp[(j+1)

*width+i+1]

-lpDibTemp[(j-1)*width+i-1]-2*lpDibTemp[j*width+i-1]-lpDibTemp[(j+1)*width+i-1])

;

RSin=(float)(lpDibTemp[(j+1)*width+i-1]+2*lpDibTemp[(j+1)*width+i]+lpDibTemp[(j+ 1)*width+i+1]

-lpDibTemp[(j-1)*width+i-1]-2*lpDibTemp[(j-1)*width+i]-lpDibTemp[(j-1)*width+i+1 ]);

lpDibSave[j*width+i]=(unsigned char)(float)sqrt(RCos*RCos+RSin*RSin);

for(i=0;i

{

lpDibTemp[width*(height-1)+i]=lpDibTemp[width*(height-2)+i];

lpDibTemp[i]=lpDibTemp[256+i];

}

for(j=0;j

{

lpDibTemp[width-1+width*j]=lpDibTemp[width*j+width-2];

lpDibTemp[width*j]=lpDibTemp[width*(j+1)];

}

for(j=0;j

for(i=0;i

{

lpDibSave[j*width+i]=255-lpDibSave[j*width+i];//反色

if(lpDibSave[j*width+i]> =128) //阈值化

lpDibSave[j*width+i]=255;

else

lpDibSave[j*width+i]=0;

}

ok,一切完成！！！其中，阈值化时，要跟你的图像具体情况而定，当然可以使用自适应阈值最

好了。

对我有用[0] 丢个板砖[0] 引用举报管理 TOP

jluhs

等级：

#11楼得分：0回复于：2002-05-11 11:57:34补充一句：在使用上面的程序时之前，应该将彩色图像变换为灰度图像，将真彩色图转换为灰度图的公式如下：

Y=0.299R+0.587G+0.114B

其中R，G，B为真彩色的三种色彩成分，Y代表灰阶图的亮度。

对真彩色图像中的每一像素作分别这样的转换就可以。

相信这，你会做了！！！！！

数字图像的特征提取

边缘能勾划出目标物体轮廓，使观察者一目了然，图像识别中抽取的重要属性。通常可以分为阶跃状和屋顶状两种。阶跃状边缘位于两边的像素灰度值有明显不同的地方；屋顶状边缘位于灰度值从增加到减少的转折处。边缘上像素值的一阶导数较大而阶导数在边缘处值为零 , 边缘或线条是指图像中像素灰度发生急剧变化的区域边境。存在于目标与背景、目标与目标、区域与区域、基元与基元之间。对图像识别和分析有着十分重要的作用。呈现零交叉。y , 通常一幅图像可以描述成 f x. 灰度变化情况可以用图像的灰度分布的梯度来反映。通常将图像 f x,y 梯度定义为

梯度的模为

导数算子具有突出灰度变化的作用，通常把梯度的模就叫做图像的梯度。边缘的检测就可借助空域微分算子通过卷积完成。对图像运用导数算子，灰度变化较大的点处算得的值较高，因此可将这些导数值作为相应点的边境强度，通过设置门限的方法，提取边境点集。有了上面的定义后，接下来将具体介绍几种较常用的也可以说是比较经典的边缘提取的算子。

2.1 Robert 算法

Robert 算子是用斜向上 4 个像素交叉差分来表示梯度的即

其中的平方根运算使得该处理类似于人类视觉系统中发生的过程。其中ｆ ( ｘ , ｙ ) ｆ( ｘ +1 , ｙ ) ｆ ( ｘ , ｙ +1 和ｆ ( ｘ +1 , ｙ +1 分别为 4 领域的坐标 , 且是具有整数像素坐标的输入图像。

上式也可以简化为

或

所对应的模板如下图所示。

图像中的每一个点都用这 2 个模板做卷积运算得到边缘点。

2.2 Sobel 算法和 Prewitt 算法

对数字图像 f x, Sobel 算法是一种一阶微分算子。y 每个像素考查其相邻点像素灰度的加权差，其表示形式是

对图像水平边缘和垂直边缘的影响较大。

与 Sobel 算子十分相近，Prewitt 算子同样也是一个 3 3 模板算子。其实际上 Sobel 算子正是对 Prewitt 算子的一种加权处理，模板如图所示：

2.3 Laplac 算法

对于阶跃状边缘的二阶导数在边缘处出现零点， Laplac 算子是典型的二阶微分算子。边缘点两边的二阶导数异号，即出现所谓的零交叉，因此，可以利用对图像的各个像素求二阶导数和之和的方法寻找边境。即

可以用差分近似微分，对于数字图像。即可对图像的每个像素取 x 方向和 y 方向的二阶差分之和来近似上式，因此可以表示成

一个与方向无关的各向同性（旋转轴对称）边缘检测算子。对 Laplac 算子有多种模板通常被人们所使用的有以下两种模板（分别是 4 领域和 8 领域）

2 ． 4 LOG 算子

所以为了减小噪声带来影响，由于噪声点 ( 灰度与周围点相差很大的点 ) 对边缘检测有一定的影响。于是就把高斯平滑滤波器和 Laplc 锐化滤波器结合起来，先平滑掉噪声，再进行边沿检测，以取得更好的提取效果。

高斯形滤波器的空间响应函数为 :

Ｋ′为常数 , 其中 . σ为高斯空间常数 .

则拉普拉斯—高斯算子为：

令ω = , 该算子的中心活动区域大约为 . ω称为高期函数的正瓣宽度 , 整个算子的宽度取 3 ω , 或者 8.5 σ , 这种近似保证了高斯函数的 99.7% 区域在算子中 .

常用的 LOG 模板是

-2 -4 -4 -4 -2

-4 0 8 0 -4

-4 8 24 8 -4

-4 0 8 0 -4

-2 -4 -4 -4 -2

2.5 Krisch 算法

如图 7 所示。将 K0 K7 模板算子分别与图像中的 3 3 区域相乘，选择最大的一个，将该最大值作为中央像素的边缘强度，可以用下式表示（ x, Krisch 算子是由 K0 K7 共 8 个方向的模板组成。y 像点的强度。

其中

说明中央像素（ x, 若最大。y 处有 I 方向的边缘通过，边缘方向如图 8 所示。

第三章线特征提取算法的改进

但是由于一幅图像的像素值分布往往极不均衡，第二章中已经介绍了几种较典型的边缘提取的算子。而且边境出也不可能都泾渭分明，所以从不同水平上给提取增加了一定的难度，再加上噪声的影响，就更难以提取出鲜明的线特征了常用的检测算子也不可能对所有的图像都起到良好的作用，当然它有自己独到优势，但同时也在一定水平上存在着不足之处。

3.1 边缘检测算法的实验结果分析

用简单的 2 2 邻域交叉差分来近似梯度值运算。通过检测可以看到所提取出的线特征非常的细腻光滑， Robert 算子是非线性的一阶微分边缘检测算子。连续性也较好，定位也较精确。但它对去噪声的作用很小，所以比较敏感，而且对边缘处灰度值轻微的变化无法给出提取，所以对灰度直方图较靠中间分布的图像，通常会漏掉该提取的边缘，以至于丢失图像的一些

重要线特征信息。对于噪声小且边缘处较分明的图像用此算法较好。

相对于 Robert 算子它从加大边缘检测算子的模板动身，将模板从 2 2 扩大到 3 3 来计算差分算子，而 Sobel 算子是 Prewitt 算子的基础上，对 4- 邻域采用带权的方法计算差分。能在检测边缘的同时对图像进行去噪声处理，但是缺点也显而易见，由于模板扩大，领域中进行比较的像素增多，使得检测进去的边缘较宽。对灰度渐变低噪声的图像有较好的检测效果 ,Sobel 算子和 Prewitt 算子也是著名的一阶微分边缘检测算子。但是对于混合多复杂噪声的图像 , 处置效果就不够理想了

常发生双像素的边缘，同时对噪声非但没法抑制反而会有双倍加强作用。可以看到作用到图像后，提取进去的边缘非常的昏暗，线特征的丢失情况也十分的明显。因此用 Laplac 算子进行检测时需要对图像进行平滑处置，如应用较成功的 LOG 算子，可以减少噪声对提取的影响，但平滑作用越显著 ,Laplac 算子是典型的二阶微分算子。一个与方向无关的边缘点检测算子。优势就在于它对细线和孤立点的检测效果较好。但边缘方向信息容易丢失。去除噪声越好，图像的细节也损失越大 , 边缘精度也就越低。

3.2 改进算法的设计

3.2.1 对彩色图像的预处理

而灰度图像之所以呈现出灰白的颜色是因为它 RGB 三个值都是相同的上面的章节中已经提到进行边缘提取的算法中，由于黑色图像是由 R G B 即红、绿、蓝三原色调和而成的不同的数值赋给它就会调制出不同的颜色。对每一像素中的三原色进行分别处置的所以当对黑色图像进行边缘提取时，提取进去的线条包括有三种颜色的成分，所以看上去比较的杂乱，而对灰度图像进行提取颜色是单一的而且通常呈现出亮白色，那么人们就会清晰的识别出对象。所以在本文中是将黑色图像进行了灰度处置后再对其线特征提取的

1 对彩色图像的灰度化

介绍如何对图像进行灰度化。已有的灰度化算法有很多种，首先。如将每个像素的 R G B 值加起来然后除以三，再将此值重新赋给 R G B 从而得到其灰度值；还有就是本文当中用到算法。设用 imagedata 表示经转换的像素灰度值，那么可以将式子表示成：

imagedata= int 0.3 R+0.59 G+0.11 B

这种表示方法中，上式是利用了 YUV 颜色表示方法。 Y 分量的物理含义就是亮度， U 和V 分量代表了色差信号，因为 Y 代表了亮度，所以 Y 分量包括了灰度图的所有信息，只用 Y 分量就能完全能够表示出一幅灰度图来。当同时考虑 U V 分量时，就能够表示出彩色信息来。这样，用同一种表示方法可以很方便的灰度和黑色图之间切换。与 RGB 间的对应关系是

图像就显示为灰度，因为当 RGB 三个值都一样时。所以代入到上式中就可求出 Y 值，而 U V 值正好为 0

再将每个像素计算出的 imagedata 重新的赋值给 R G B 三个参量，每一个像素都通过此式进行灰度转换之后。以达到此三值的一致，从而形成灰度图。

2 灰度图像的灰度扩展

有些图像看上去整个色调都偏暗，进行了灰度处理之后。对于这样的图像就需要增加物体间的对比度，可以用视觉或通过灰度直方图来观察，如果使用灰度直方图则要观察图像的分布较分散，还是主要集中在一块（左边、右边还是中间）如果是分布较均衡的说明图像自身的灰度分布就较理想如图 10 下）如果集中一块的就要对其进行灰度扩展如图 10 上）

本文中使用了两种灰度扩展的方法：

线性灰度扩展

灰度直方图均衡

1 线性灰度扩展

介绍线性灰度扩展。实验最初，首先。为了方便，只用了一个很简易的想法，即首先给出一

个灰度门限值 T 当然此门限是可以动态调整的而它作用就是 0 255 之间划分一个界限，对逾越此门限的像素值给予丢弃，并用红色填充；但若某一个像素的灰度值小于此门限值，就将其扩展（ 256/T 倍，这样整幅图像就被扩展到 0-255 从而使对比度得到加强。

假设一像素的灰度值为 graydata 经转换后的灰度值为 trgrai 则此式可写成：

trgrai = graydata*256/T

因为并不知道在 256 个值中哪个才是最合适的门限值，所以会增加实验的繁冗。为了填补这样的缺陷于是又采取了下面的方法，利用一算法使在运行顺序时就自动计算出一个较佳的门限值，以供参考。以上的方法是为了实验之初的调试 , 通过动态输入一个门限值 , 使得扩展进去的灰度图像能发生一个较好的提取效果。当然此方法会给调试带来很大的麻烦。

然后从 0 至 255 依次累加像素数，首先统计灰度图像中 256 个灰度级所拥有的像素数。当叠加之和已经占了总像素的 90% 或超过了 90% 就将最后的灰度值作为此幅图像的门限值进行灰度扩展，至于扩展的方法仍利用上面的算法。

2 灰度直方图均衡

由于直方图是对图像上每个像素级发生的次数的绘图，直方图均衡顾名思义就是利用直方图原理进行灰度均衡。从 0-255 灰度级水平地从左到右显示。灰度级发生的次数越多，直方图中该位置的线越高，以此来直观的表示出图像的灰度分布情况。

此处也不例外。也同样是进行了各像素值的个数的统计，那么。前面已经提到对于灰度图像，像素值是 0-255 之间的一个，所以可以定义一个长度为 256 数组 histogram[256] 来存放统计出的个数。当然统计是给灰度均衡做最初的准备的最重要的当然还是像素值转换的算法。这里使用的算法是如下式：

v 表示经变换后得到像素值，其中。 u 就表示变换前的像素值。

需注意的此时的 i 和公式中的 i 一致的因此就可这样理解，通过此式变换后将变换的像素值存入另一长度为 256 数组 transform[i] 中。 transform[i] 中 i 所对应的位置下存的像素值就是值为 i 像素经变换后所得到像素值，即假如原灰度图像的某一像素的值为 25 那么它变换值就在 transform[25] 中。所以可以对图像中的每一像素值进行变换后，再取它对应位置上的值输出，即可得经灰度直方图均衡后的图像。

3.2.2 边缘提取算法的改进

就可以进入本文的重点线特征的提取了上面的叙述我已经了解了一些较常用的边缘提取算子，对图像进行以上的灰度预处理后。同时也看到不同状况下存在缺乏，所以为了得到更好的线特征的提取效果，此基础上进行了一些改进。下面就来具体介绍经改进的算法。

1 四方向的 Sobel 算法

这就需要在提取时注意各方向上的比拟，首先来看对 Sobel 算法的改进。大家知道图像中的线条繁多且通常它走向的规律事先难以判定。来获取线条最佳的走向以提取出准确的线条来。Sobel 算法只用了垂直和水平两个方向来进行检测，获取它最大值。为了得到更加准确的结果就将检测方向扩大为四个： 0 °、 45 °、 90 °、 135 °。

首先说下我开始对模型的理解，希望对你有帮助，PLAYER就是走迷宫的一个图块，从后面程序分析看，是一个1x1像素的矩形，

记住是PLAYER是一个矩形，不是点

PLAY的属性

1：坐标（x，y）。

2：大小，宽高（1，1)这个程序里默认设置，程序就默认他是1，不可配置和更改。从后面

写死的代码可以看出

然后就是迷宫的墙(WALL）了，你可以想象成一条一条直线，

WALL类有几个属性：

1：宽度很小（这个一般在整个程序里都固定一个值，置成1好了,)

2：长度（通过换算，可以转换成一个范围值）

3：位置，也就是起点坐标，和长度一起可以确定一道墙的范围

4：方向。比如一个WALL的位置定了，在屏幕（20， 20）的位置，宽度1, 长度10，那这个点是不是可以往N个方向划一道墙出来，

看看现在大多数的迷宫图，这个线直的居多，这个程序里也是这样的。

1）-------canMove分析

来分析一下往右走一步，能不能走。

case RIGHT: //

nextpos.x += 1; //为什么这里+1，因为PLAY的坐标取的是矩形的左上顶点。矩形自己占了一个像素

//往右能不能走，那就要看右边会不会挨着墙了。

direct = LEFT_WALL;

break

case LEFT: //往左能不能走，就看这个点是不是挨着墙就可以

direct = LEFT_WALL;

break;

假设PLAYER坐标（20，20）

这个PLAYER的4个顶点就是，（20，20），（21，20），（20，21），（21，21），

对了，这里的坐标点是无大小的，就是一个抽象的点（无大小概念）

判断右走，能不能走，只要判断右边顶点有没有挨着墙，所以nextpos.x += 1；

接下来，左走，右走都是 LEFT_WALL：只表示这个WALL是纵方向的。那么宽度呢？宽度好办，我这样判断好了，

假设：

这个墙的宽度是2（一般来说墙会比PLAYER苗条点，这里就不是了），墙的坐标是（19，10），（墙的起点，矩形的话，取左上点）。

墙的长度是10，方向 LEFT_WALL纵方向。

那只要有个点，横坐标 19≤ x ≤ 21，纵坐标 10≤ y ≤ 20，都表示这个点在墙上了。这个前提是我们说墙的坐标，都取左上起点的坐标。

看看判断程序，

if(mazeptr->findNode(CWall(nextpos, direct)) != NULL)

return 1;//RETURN 1就表示往this->curdir方向走，不能走，会撞墙。

找到，就表示撞墙了（哦，不，这只表示你挨着墙了，再挪那么一丁点你就撞啦）。

我们可以猜测一下，CWall这个类的对象放到节点里去，我们可以猜测，这个find方法应该是根据范围来找的，

不然，每一个个像素点都有一个CWall类的话，这个数据库就庞大了。这个方法就可以这么来实现，匹配一下CWALL链表中的一个节点，

先匹配方向，然后根据上面提到的方法来判断是否挨着墙。

总结下 int CPlayer::canMove() CPLayer类只放了一个信息 this->curdir，

至于坐标什么的都是从 path这个路径链表里取一个一个节点出来的。

返回值：1 表示从path取出的节点，按player当前保存的方向来走，走不通

0 -----------------------------------------------，可以走通

-1 path链表错误

上下方向移动的方向和左右移动是类似的，这里就不再说了。

2）-------int CPlayer::autoGo()分析

{

point nextpos;

Node *cur = NULL;

int ret = 0, count = 0;

path.reset();

cur = path.current();

if(cur == NULL)

{

errOut("迷宫无解");

return -1;

}

count = 0;

/*往四个方向都试探下，看能不能走*/

for(;;)

{

count ++;

if(count > 4)

{

errOut("迷宫配置错误");

return -1;//4个方向都不行，退出方法---所以for循环之后的语句能执行到的话就表示某个方向可以走了。

}

cur->data.outdir = (cur->data.outdir + 3)%4; ////

curdir = cur->data.outdir;

ret = canMove();

if(ret == 0)

break;

if(ret < 0)

return -1;

}

nextpos = cur->data.pos;

switch(curdir) /////

{

case RIGHT:

nextpos.x += 1;

break;

case DOWN:

nextpos.y += 1;

break;

case LEFT:

nextpos.x -= 1;

break;

case UP:

nextpos.y -= 1;

break;

}

steps ++;

//这里的indir，这样认为吧，表示这个节点要回到上一节点的话该怎么走。

//这里相等，表示我下一步能走的却是要回到上一步的地方，那这步对于走迷宫来说是浪费时间，

//删掉这个节点吧

if(path.next() != NULL&&cur->data.outdir == cur->data.indir)

{

fillCell(cur->data.pos, 8, cur->data.outdir);

ret = path.deleteFront(NULL); if(ret < 0)

{

errOut("删除节点失败");

return -1;

}

return 0;

}

fillCell(cur->data.pos, 0, cur->data.outdir);

if(nextpos == m_exit) {//m_exit记录了迷宫出口点的坐标，下一步就到出口了，完成！

【CN110020639A】视频特征提取方法及相关设备【专利】

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910312917.8 (22)申请日 2019.04.18 (71)申请人北京奇艺世纪科技有限公司地址 100080 北京市海淀区北一街2号爱奇艺创新大厦10、11层 (72)发明人晋瑞锦　张云桃　 (74)专利代理机构北京集佳知识产权代理有限公司 11227 代理人钱娜　王宝筠 (51)Int.Cl. G06K 9/00(2006.01) G06N 3/04(2006.01) (54)发明名称视频特征提取方法及相关设备(57)摘要本发明提供了一种视频特征提取方法及相关设备，本方案可以对多帧目标视频图像进行时域及空域上的卷积处理，得到第一预设数量通道的第一视频特征，然后对第一预设数量通道的第一视频特征进行分组，并使用不同尺寸的卷积核对各个分组的第一视频特征进行时域上的卷积处理，得到每个分组各自对应的第二预设数量通道的第二视频特征，再对第二视频特征进行空域上的卷积处理，以得到第三预设数量通道的第三视频特征。本方案中，3D卷积神经网络可以将输入的多帧视频图像进行通道分离处理，不同通道在时域上进行不同尺度的卷积处理，分组的方式可以有效地减少网络参数，从而提高视频特征的提取效率，进而使得该网络模型的实际应用效果更佳。权利要求书3页说明书11页附图3页CN 110020639 A 2019.07.16 C N 110020639 A

权　利　要　求　书1/3页CN 110020639 A 1.一种视频特征提取方法，其特征在于，所述方法适用于3D卷积神经网络，包括：获得多帧目标视频图像；对所述多帧目标视频图像进行时域及空域上的卷积处理，得到第一预设数量通道的第一视频特征；对所述第一预设数量通道的第一视频特征进行分组，并使用不同尺寸的卷积核对各个分组的第一视频特征进行时域上的卷积处理，得到每个分组各自对应的第二预设数量通道的第二视频特征；对所述第二视频特征进行空域上的卷积处理，以得到第三预设数量通道的第三视频特征。 2.根据权利要求1所述的视频特征提取方法，其特征在于，所述对所述第二视频特征进行空域上的卷积处理，以得到第三预设数量通道的第三视频特征，包括：合并每个分组各自的第二预设数量通道的第二视频特征，以得到一组包括第三预设数量通道的第二视频特征；分别对一组中的每个通道的第二视频特征进行空域上的卷积处理，以得到第三预设数量通道的第三视频特征。 3.根据权利要求1所述的视频特征提取方法，其特征在于，还包括：对所述第三预设数量通道的第三视频特征进行分组，并使用不同尺寸的卷积核对各个分组的第三视频特征进行时域上的卷积处理，得到每个分组各自对应的第四预设数量通道的第四视频特征。 4.根据权利要求3所述的视频特征提取方法，其特征在于，还包括：合并每个分组各自的第四预设数量通道的第四视频特征，以得到一组包括第五预设数量通道的第四视频特征；将所述第一视频特征进行升维处理，以得到第五预设数量的第五视频特征，并将第五预设数量的所述第四视频特征与第五预设数量的所述第五视频特征分别对应相加，以得到第五预设数量的第六视频特征。 5.根据权利要求1所述的视频特征提取方法，其特征在于，所述获得多帧目标视频图像，包括：获得多帧原始视频图像；对所述多帧原始视频图像中的至少一帧原始视频图像进行分辨率调整，以得到符合3D 卷积神经网络的分辨率要求的目标视频图像。 6.根据权利要求1所述的视频特征提取方法，其特征在于，所述获得多帧目标视频图像，包括：获得多帧原始视频图像；按照预设的帧间隔长度，从所述多帧原始视频图像中间隔抽取原始视频图像，以得到目标视频图像。 7.一种视频特征提取装置，其特征在于，适用于3D卷积神经网络，所述装置包括：视频图像获得单元，用于获得多帧目标视频图像；普通卷积处理单元，用于对所述多帧目标视频图像进行时域及空域上的卷积处理，得到第一预设数量通道的第一视频特征； 2

图像特征提取方法

图像特征提取方法摘要特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息，决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集，这些子集往往属于孤立的点、连续的曲线或者连续的区域。至今为止特征没有万能和精确的图像特征定义。特征的精确定义往往由问题或者应用类型决定。特征是一个数字图像中“有趣”的部分，它是许多计算机图像分析算法的起点。因此一个算法是否成功往往由它使用和定义的特征决定。因此特征提取最重要的一个特性是“可重复性”：同一场景的不同图像所提取的特征应该是相同的。特征提取是图象处理中的一个初级运算，也就是说它是对一个图像进行的第一个运算处理。它检查每个像素来确定该像素是否代表一个特征。假如它是一个更大的算法的一部分，那么这个算法一般只检查图像的特征区域。作为特征提取的一个前提运算，输入图像一般通过高斯模糊核在尺度空间中被平滑。此后通过局部导数运算来计算图像的一个或多个特征。常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。当光差图像时，常常看到的是连续的纹理与灰度级相似的区域，他们相结合形成物体。但如果物体的尺寸很小或者对比度不高，通常要采用较高的分辨率观察：如果物体的尺寸很大或对比度很强，只需要降低分辨率。如果物体尺寸有大有小，或对比有强有弱的情况下同事存在，这时提取图像的特征对进行图像研究有优势。常用的特征提取方法有：Fourier变换法、窗口Fourier变换（Gabor)、小波变换法、最小二乘法、边界方向直方图法、基于Tamura纹理特征的纹理特征提取等。

设计内容课程设计的内容与要求（包括原始数据、技术参数、条件、设计要求等）：一、课程设计的内容本设计采用边界方向直方图法、基于PCA的图像数据特征提取、基于Tamura纹理特征的纹理特征提取、颜色直方图提取颜色特征等等四种方法设计。（1）边界方向直方图法由于单一特征不足以准确地描述图像特征,提出了一种结合颜色特征和边界方向特征的图像检索方法.针对传统颜色直方图中图像对所有像素具有相同重要性的问题进行了改进,提出了像素加权的改进颜色直方图方法;然后采用非分割图像的边界方向直方图方法提取图像的形状特征,该方法相对分割方法具有简单、有效等特点,并对图像的缩放、旋转以及视角具有不变性.为进一步提高图像检索的质量引入相关反馈机制,动态调整两幅图像相似度中颜色特征和方向特征的权值系数,并给出了相应的权值调整算法.实验结果表明,上述方法明显地优于其它方法.小波理论和几个其他课题相关。所有小波变换可以视为时域频域的形式，所以和调和分析相关。所有实际有用的离散小波变换使用包含有限脉冲响应滤波器的滤波器段(filterbank)。构成CWT的小波受海森堡的测不准原理制约，或者说，离散小波基可以在测不准原理的其他形式的上下文中考虑。通过边缘检测，把图像分为边缘区域和非边缘区域，然后在边缘区域内进行边缘定位．根据局部区域内边缘的直线特性，求得小邻域内直线段的高精度位置；再根据边缘区域内边缘的全局直线特性，用线段的中点来拟合整个直线边缘，得到亚像素精度的图像边缘．在拟合的过程中，根据直线段转角的变化剔除了噪声点，提高了定位精度．并且，根据角度和距离区分出不同直线和它们的交点，给出了图像精确的矢量化结果图像的边界是指其周围像素灰度有阶跃变化或屋顶变化的那些像素的集合，边界广泛的存在于物体和背景之间、物体和物体之间，它是图像分割所依赖的重要特征．边界方向直方图具有尺度不变性，能够比较好的描述图像的大体形状．边界直方图一般是通过边界算子提取边界，得到边界信息后，需要表征这些图像的边界，对于每一个边界点，根据图像中该点的梯度方向计算出该边界点处法向量的方向角，将空间量化为M级，计算每个边界点处法向量的方向角落在M级中的频率，这样便得到了边界方向直方图．图像中像素的梯度向量可以表示为[ ( ，)，)，( ，)，)] ，其中Gx( ，)，)，G ( ，)，)可以用下面的

图像颜色特征提取原理

一、颜色特征 1 颜色空间 1.1 RGB 颜色空间是一种根据人眼对不同波长的红、绿、蓝光做出锥状体细胞的敏感度描述的基础彩色模式,R、 G、B 分别为图像红、绿、蓝的亮度值,大小限定在 0～1 或者在 0～255。 1.2 HIS 颜色空间是指颜色的色调、亮度和饱和度,H表示色调,描述颜色的属性,如黄、红、绿,用角度 0～360度来表示;S 是饱和度,即纯色程度的量度,反映彩色的浓淡,如深红、浅红,大小限定在 0～1;I 是亮度,反映可见光对人眼刺激的程度,它表征彩色各波长的总能量,大小限定在 0～1。 1.3 HSV 颜色模型 HSV 颜色模型依据人类对于色泽、明暗和色调的直观感觉来定义颜色, 其中H (Hue)代表色度, S (Saturat i on)代表色饱和度,V (V alue)代表亮度, 该颜色系统比RGB 系统更接近于人们的经验和对彩色的感知, 因而被广泛应用于计算机视觉领域。已知RGB 颜色模型, 令M A X = max {R , G, B },M IN =m in{R , G,B }, 分别为RGB 颜色模型中R、 G、 B 三分量的最大和最小值, RGB 颜色模型到HSV 颜色模型的转换公式为: S =(M A X - M IN)/M A X H = 60*(G- B)/(M A X - M IN) R = M A X 120+ 60*(B – R)/(M A X - M IN) G= M A X 240+ 60*(R – G)/(M A X - M IN) B = M A X V = M A X 2 颜色特征提取算法 2.1 一般直方图法颜色直方图是最基本的颜色特征表示方法,它反映的是图像中颜色的组成分布,即出现了哪些颜色以及各种颜色出现的概率。其函数表达式如下: H(k)= n k/N (k=0,1,…,L-1) (1) 其中,k 代表图像的特征取值,L 是特征可取值的个数,n k是图像中具有特征值为 k 的象素的个数,N 是图像象素的总数。由上式可见,颜色直方图所描述的是不同色彩在整幅图像中所占的比例,无法描述图像中的对象或物体,但是由于直方图相对于图像以观察轴为轴心的旋转以及幅度不大的平移和缩放等几何变换是不敏感的,而且对于图像质量的变化也不甚敏感,所以它特别适合描述那些难以进行自动分割的图像和不需要考虑物体空间位置的图像。由于计算机本身固有的量化缺陷,这种直方图法忽略了颜色的相似性,人们对这种算法进行改进,产生了全局累加直方图法和局部累加直方图法。 2.2 全局累加直方图法全局累加直方图是以颜色值作为横坐标,纵坐标为颜色累加出现的频数,因此图像的累加直方空间 H 定义为:

数字摄影测量复习题含答案

第五章数字影像与特征提取 1.什么是数字影像?其频域表达有什么作用？答：①数字影像是以数字形式保存数字化航空、胶片影像的扫描影像 ②频域表达对数字影像处理是很重要的。因为变换后矩阵中元素的数目与原像中的相同。但其中很多是零值或数值很小，这就意味着通过变换、数据可以被压缩，使其能更有效的存储和传递；其次是影像分解力的分析以及许多影像处理过程。例如滤波、卷积以及在有些情况下的相关运算，在频域内可以更为有利的进行。其中所利用的一条重要关系就是在空间域内的一个卷积，相当于在频率域内其卷积函数的相乘，反之亦然。在摄影测量中所使用的影像的傅立叶谱可以有很大的变化，例如在任何一张航摄影像上总可以找到有些地方只含有很低的频率信息，而有些地方则主要包含高频信息，偶然的有些地区主要是有一个狭窄范围的带频率信息。 2.怎样根据已知的数字影像离散灰度值，精确计算其任意一点上的灰度值？答：：当欲知不位于矩阵(采样)点上的原始函数g（x,y）的数值时就需要内插，此时称为重采样 3.常用的影像重采样方法有哪些？试比较他们的优缺点答：①常用的影像重采样方法有最邻近像元法、双线性插值、双三次卷积法 ②最邻近像元法最简单、计算速度快、且能不破坏原始影像的灰度信息，但几何精度较差；双线性插值法虽破坏原始影像的灰度信息，但精度较高，较为适宜；

双三次卷积法其重采样中误差约为双线性插值的1/3，但较费时； 4.已知/4，4，为采样间隔，用双线性插值计算gk,l 答:g(k,l)=W(i,j) g(i,j）+W(i+1,j) g(i+1,j）+W(i,j+1) g(i,j+1）+W(i+1，j+1) =（1- /4）（/4）*102+（/4/4*112+ 4（1- 4） *118+( /4)* ( /4)*126 =102+13/-1 ５.什么是线特征？有哪些梯度算子可用于线特征的提取？答：①线特征指影像的边缘与线，边缘可定义影响局部区域特征不相同的那些区域间的分界线，而线则可以认为是具有很小宽度的其中间区域具有相同影响特征的边缘对 ②常用方法有差分算子、拉普拉斯算子、LOG算子等

数字图像的特征提取

呵呵,看了半天，原来你只不过要求进行边缘检测就可以，然后再做阈值化而已，太简单了。按照下面做即可： void RobelEdgeDetect(LPBYTE lpDibTemp, LPBYTE lpDibSave,int width,int height) { int i,j; float R; float RCos,RSin; for(j=1;j =128) //阈值化 lpDibSave[j*width+i]=255; else lpDibSave[j*width+i]=0; } } ok,一切完成！！！其中，阈值化时，要跟你的图像具体情况而定，当然可以使用自适应阈值最好了。

图像分割和特征提取技术研究

毕业设计图像分割和特征提取技术研究摘要图像分割是图像分析的第一步，是图像理解的重要组成部分，在有关图像处理的几乎所有领域具有广泛的应用。因此，图像分割一直受到高度重视，对其研究具有十分重要的意义。长期以来，研究人员提出了许多实用的分割算法。随着统计学理论，神经网络，小波理论等在图像分割中的应用日益广泛，遗传算法、尺度空间、非线性扩散方程等近期涌现的新方法和新思想也不断被用于解决分割问题，许多国内外学者也针对一些具体应用提出了许多实用有效的方法。本文介绍了数字图像处理技术中图像分割技术的基本理论和三种图像分割方法(1)基于阈值图像分割；(2)基于边缘检测及算子分割；(3)基于区域特性的图像分割。对基于点的分割方法进行了较全面的叙述，主要研究了图像分割方法中的边缘检测法，区域提取法和阈值分割法。通过大量的理论研习。并编写了MATLAB软件程序，对各分割方法进行了仿真实验，得到分割图像。最后对于仿真进行了数据处理分析，验证了Canny算子的整体效果最好, Prewitt算子分割细致。但对于一幅图像仅仅只有只用一种方法达不到很好的效果，而根据待分割图象的不同特点，结合已知的先验知识，研究符合具体图象特性的分割模型，才是提高图象分割的重要手段。关键词：图像分割；边缘法；区域法；阈值法；分水岭分割法

Lmage Segmentation And Feature Extraction Technology Research Abstract Image segmentation is the first step in image analysis, image segmentation is an important component of image understanding, in almost all areas of the image processing has widely application. As a result, image segmentation has been attached great importance to, its research has the very vital significance. For a long time,researchers put forward many practical segmentation algorithm. With statistics theory, the neural network, wavelet theory has been used increasingly in image segmentation, such as genetic algorithm, scale space, and nonlinear diffusion equation with the recent emergence of new methods and new ideas are constantly being used to solve the segmentation problem, many scholars at home and abroad for some specific application put forward many practical and effective method. Digital image processing techniques were introduced in This paper introduces the digital image processing technology of image segmentation technology in basic theory and three methods of image segmentation. (1) based on threshold image segmentation. (2) segmentation based on edge detection and operator; (3) the image segmentation based on region feature. On the segmentation method based on the point of narrative, mainly studies the edge of image segmentation method, region extraction method and threshold segmentation method. Through a lot of theory study. And write the MATLAB software, the segmentation method, the simulation experiment for image segmentation. Finally analyzed the data processing for simulation.Verify the Canny operator of the overall effect is best. Prewitt operator segmentation and detailed. But for an image only only one way to reach a good effect, and according to the different characteristics of for image segmentation, combined with the known prior knowledge, research in accordance with the specific image segmentation model, is an important means to improve the image segmentation. KEYWORDS：Segmentation；edge method；the regional method；threshold；watershed segmentation

视频内容特征的提取

视频内容特征的提取【摘要】本文是基于视频特征提取的技术研究，主要是对关键帧进行特征提取，得到一个尽可能充分反映关键帧内容的特征空间，作为视频聚类和检索的依据，着重研究了关键帧的视觉特征，包括颜色特征、纹理特征、形状特征等静态特征和运动特征等。【关键词】关键帧；特征；运动 0 引言关键帧是视频的镜头表示帧。基于关键帧的特征检索是基于内容视频检索的重要一部分。虽然人们更倾向于使用语义特征进行视频查询，但由于语义特征很难做到自动提取，所以通常视频检索所采用的是较低层的关键帧的视觉特征，包括颜色特征、纹理特征、形状特征等静态特征，也包括反映镜头一定语义内容的运动特征等。 1 视频特征描述的要求基于内容的视频检索实际上就是基于特征的检索。因此是视频检索的基础，也是难点所在。良好的特征应具有以下特点： 1）可区别性：对于不同的图像来说，其特征值应具有明显的差异，便于比较； 2）可靠性：对相似图像的特征值应比较相近，查询的结果是按特征值相似程度排列的图像集合； 3）独立性：所用的各个特征之间应彼此不相关； 4）特征维度低：检索复杂度随着特征数量和特征维数会迅速增长，不利于检索。 2 静态特征提取 2.1 提取颜色特征色彩是物体表面的一种视觉特性，是人类视觉的重要组成部分。每种物体都有其特有的色彩特征，同一类物体往往有着相似的色彩特征。因此可以根据色彩特征来区分物体。而且颜色特征非常稳定，对于旋转、平移、尺度变化，甚至各种形变都不敏感，表现出相当强的鲁棒性。颜色内容一般包含两个方面，一个对应于全局颜色分布，一个对应于局部颜色信息。按照全局颜色分布来索引图像可以通过计算每种颜色的象素的个数并构造颜色灰度直方图来实现，这对检索具有

图象视觉特征的提取与表示

第1章图像视觉特征的提取和表示 1.1引言图像视觉特征的提取和表示是将图像的视觉信息转化成计算机能够识别和处理的定量形式的过程，是基于视觉内容的图像分类与检索的关键技术，因此，图像视觉特征的提取和表示一直是图像内容分析领域中一个非常活跃的课题。图像底层视觉特征一定程度上能够反映图像的内容，可以描述图像所表达的意义，因此，研究图像底层视觉特征是实现图像分类与检索的第一步。一般来说，随着具体应用的不同，选用的底层特征也应有所不同，在特定的具体应用中，不同底层视觉特征的选取及不同的描述方式，对图像分类与检索的性能有很大的影响。通常认为，一种良好的图像视觉特征的提取和表示应满足以下几个要求： (1)提取简单，时间和空间复杂度低。 (2)区分能力强，对图像视觉内容相似的图像其特征描述之间也应相近，反之，对于视觉内容不相似的图像其特征描述之间应有一定的差别。 (3)与人的视觉感知相近，对人的视觉感觉相近的图像其特征描述之间也相近，对人的视觉感知有差别的图像其特征描述之间也有一定的差别。 (4)抗干扰能力强，鲁棒性好，对图像大小，方向不敏感，具有几何平移，旋转不变性。本章重点讨论当前比较成熟的特征提取方法，在此基础上选取合适的特征提取方法，用于图像分类与检索系统的特征提取模块。接下来，将依次介绍颜色，纹理，形状等特征的提取和表示方法，最后对各种特征的特点加以比较。 1.2颜色特征的提取和表示颜色是图像视觉信息的一个重要特征，是图像分类与检索中最为广泛应用的特征之一。一般来说同一类别的图像之间颜色信息具有一定的相似性，不同类别的图像，其颜色信息具有一定的差异。相对几何特征而言，颜色特征稳定性好，有对大小、方向不敏感等特点。因此，颜色特征的提取受到极大重视并得到深入研究。本章首先介绍几种常用的颜色空间模型，然后介绍各种颜色特征提取和表示方法。 1.2.1颜色空间模型为了正确地使用颜色这一特征，需要建立颜色空间模型，通常的颜色空间模型可用三个基本量来描述，所以建立颜色空间模型就是建立一个3-D坐标系，其中每个空间点都代表某一种颜色。通常来说，对于不同的应用，应该选取不同的颜色空间模型。常用的颜色空间模型主要有：RGB、HIS、HSV、YUV、YIQ、Munsell、Lu*v*和La*b*等。颜色空间模型的选取需要符合一定的标准，下面就这一标准和最常用的颜色空间模型作一些介绍。文献[错误！未找到引用源。]中介绍了选择颜色空间模型的标准主要有以下几个： (1)观察角度的鲁棒性

视频内容特征的提取-精选资料

视频内容特征的提取 0 引言关键帧是视频的镜头表示帧。基于关键帧的特征检索是基于内容视频检索的重要一部分。虽然人们更倾向于使用语义特征进行视频查询，但由于语义特征很难做到自动提取，所以通常视频检索所采用的是较低层的关键帧的视觉特征，包括颜色特征、纹理特征、形状特征等静态特征，也包括反映镜头一定语义内容的运动特征等。 1 视频特征描述的要求基于内容的视频检索实际上就是基于特征的检索。因此是视频检索的基础，也是难点所在。良好的特征应具有以下特点：1）可区别性：对于不同的图像来说，其特征值应具有明显的差异，便于比较； 2）可靠性：对相似图像的特征值应比较相近，查询的结果是按特征值相似程度排列的图像集合； 3）独立性：所用的各个特征之间应彼此不相关； 4）特征维度低：检索复杂度随着特征数量和特征维数会迅速增长，不利于检索。 2 静态特征提取 2.1 提取颜色特征色彩是物体表面的一种视觉特性，是人类视觉的重要组成部

分。每种物体都有其特有的色彩特征，同一类物体往往有着相似的色彩特征。因此可以根据色彩特征来区分物体。而且颜色特征非常稳定，对于旋转、平移、尺度变化，甚至各种形变都不敏感，表现出相当强的鲁棒性。颜色内容一般包含两个方面，一个对应于全局颜色分布，一个对应于局部颜色信息。按照全局颜色分布来索引图像可以通过计算每种颜色的象素的个数并构造颜色灰度直方图来实现，这对检索具有相似的总体颜色内容的图像是一个很好的途径。局部颜色信息是指局部相似的颜色区域，它考虑了颜色的分类与一些初级的几何特征。比如，颜色集是通过抽取空间局部颜色信息来提供颜色区域的有效索引。而颜色矩特征的数学依据是任何颜色的分布均可由它的矩来刻画，且大部分信息集中在低阶矩上。 2.2 提取纹理特征纹理就是图像局部不规则而宏观有规律的特性。它是与物体表面材质有关的图像特征。目前也是基于内容检索系统中所采用的一个重要手段。纹理特征表达是Tamura等人在对人类对纹理的视觉感知的心理学研究的基础上提出的，在视觉上和心理上都是有意义的。纹理特征包括粗糙性（Coarseness）、规则性（Regularity）、线条相似性（Linelikeness）、凹凸性（Roughness）、方向性（Directionality）和对比度（Contrast）等，这些特征都可作为检索项。纹理特征可使用统计方法和结构方法进行分析。结构方法假定图像由较小的纹理基元排列而成，

图像目标提取及特征计算

摘要对图像进行研究和应用时，人们往往对图像中的某些部分感兴趣，这些部分常被称为目标或对象目标或对象特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息，决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集，这些子集往往属于孤立的点、连续的曲线或者连续的区域。本课设需要解决的问题是，利用阈值分割方法,对该图像进行分割,得到提取那个目标后的二值图像，计算该目标的面积、周长、中心坐标等三个参数。阈值分割采用的是全局阈值分割方法,而面积、周长的计算则是先通过将图像转换成二值图像，在通过计算二值图像像素点的方式求取。关键词：阈值分割,边缘检测，像素点

１绪论目标的特征提取是图像处理和自动目标识别（ＡTR)中的一个重要的研究课题,是解决图像识别问题的难点和关键。特征提取是图象处理中的一个初级运算，也就是说它是对一个图像进行的第一个运算处理。它检查每个像素来确定该像素是否代表一个特征。假如它是一个更大的算法的一部分，那么这个算法一般只检查图像的特征区域。作为特征提取的一个前提运算,输入图像一般通过高斯模糊核在尺度空间中被平滑。此后通过局部导数运算来计算图像的一个或多个特征。有时,假如特征提取需要许多的计算时间，而可以使用的时间有限制,一个高层次算法可以用来控制特征提取阶层,这样仅图像的部分被用来寻找特征。由于许多计算机图像算法使用特征提取作为其初级计算步骤,因此有大量特征提取算法被发展,其提取的特征各种各样，它们的计算复杂性和可重复性也非常不同。 2 设计原理 2.1 常用的特征提取的方法提取图像空间关系特征可以有两种方法：一种方法是首先对图像进行自动分割,划分出图像中所包含的对象或颜色区域,然后根据这些区域提取图像特征，并建立索引；另一种方法则简单地将图像均匀地划分为若干规则子块,然后对每个图像子块提取特征,并建立索引。本课程设计是采用的第一种方法,即先对该图像进行分割，得到提取那个目标后的二值图像，计算该目标的面积、周长、中心坐标等三个参数。阈值分割采用的是全局阈值分割方法,而面积、周长的计算则是先通过将图像转换成二值图像,在通过计算二值图像像素点的方式求取。其中计算周长时，先需要对二值图像进行边缘检测,然后再统计其像素点。２.2 阈值分割原理图像阈值化分割是一种最常用,同时也是最简单的图像分割方法,它特别适用于目标和背景占据不同灰度级范围的图像［1］。它不仅可以极大的压缩数据量，而且也大大简化了分析和处理步骤,因此在很多情况下，是进行图像分析、特征

图像特征提取及识别过程

摘要纹理特征是一种重要的视觉线索,是图像中普遍存在而又难以描述的特征。纹理分类与分割是图像处理领域一个经久不衰的热点研究领域,纹理特征提取作为纹理分类与分割的首要问题,一直是人们关注的焦点,各种纹理特征提取方法层出不穷。本文在广泛文献调研的基础上,回顾了纹理特征提取方法的发展历程,分析了其研究现状,对纹理特征提取方法进行了较为全面的综述和分类，最后重点研究了基于灰度共生矩阵的图像纹理提取方法，研究如何有效地提取图像纹理特征来对图像进行描述，通过特征值来对图像进行识别。灰度共生矩阵是一种简单有效的图像纹理特征描述方法，该方法的优势在于：它能利用了图像中像素相对位置的空间信息更加准确地描述图像的纹理，本文就是利用图像灰度共生矩阵的这一特性，从该矩阵中提取相应的统计参量作为纹理特征来实现对图像的识别。关键字：灰度共生矩阵，纹理特征提取，图像识别

ABSTRACT Texture is a kind of important visual clues in images , it is widespread but cannot easy to be described . Texture classification and segmentation is a enduring popular research field in image processing area. Texture feature extraction has been the focus of attention,due to its priority to texture classification and image segmentation. all sorts of texture feature extraction methods has been emerged in endlessly. On the basis of extensive literature investigation, we review the texture feature extraction methods, analyze the development of the research status of the texture feature extraction methods and make a comprehensive review of its classification . Finally ,based on gray symbiotic matrix image problem extraction methods,we research how to effectively extract image texture feature described by the image characteristic value to image recognition. Graylevel co-occurrence matrix is a simple and effective image texture description method.This method's advantage is: it can use the image pixels relative positions of the spatial information more to accurately describe the texture image.This paper use the graylevel co-occurrence matrix of the properties to extract statistics from the matrix corresponding as texture feature parameters to realize image recognition. KEY WORDS: graylevel co-occurrence matrix, texture feature extraction, image recognition

图像颜色特征提取基本知识

、颜色特征 1颜色空间 1.1 RGB 颜色空间是一种根据人眼对不同波长的红、绿、蓝光做出锥状体细胞的敏感度描述的基础彩色模式， R 、 G 、B 分别为图像红、绿、蓝的亮度值，大小限定在0?1或者在0?255。 1.2 HIS 颜色空间是指颜色的色调、亮度和饱和度 ,H 表示色调，描述颜色的属性，如黄、红、绿，用角度0?360 度来表示;S 是饱和度，即纯色程度的量度，反映彩色的浓淡，如深红、浅红，大小限定在0? 1；1是亮度，反映可见光对人眼刺激的程度，它表征彩色各波长的总能量，大小限定在0?1。 1.3 HSV 颜色模型 HSV 颜色模型依据人类对于色泽、明暗和色调的直观感觉来定义颜色，其中H (Hue)代表色度，S (Saturat i on)代表色饱和度，V (V alue)代表亮度，该颜色系统比 RGB 系统更接近于人们的经验和对彩色的感知，因而被广泛应用于计算机视觉领域。已知 RGB 颜色模型，令 M A X = max {R , G, B },M IN =m in{R , G,B }, 分别为 RGB 颜色 2颜色特征提取算法 2.1 一般直方图法颜色直方图是最基本的颜色特征表示方法，它反映的是图像中颜色的组成分布，即出现了哪些颜色以及各种颜色出现的概率。其函数表达式如下：模型中R 、G 、B 三分量的最大和最小值 S =(M A X - M IN)/M A X H = 60*(G- B)/(M A X - M IN) 120+ 60*(B - R)/(M A X - M IN) 240+ 60*(R -G)/(M A X - M IN) ,RGB 颜色模型到HSV 颜色模型的转换公式为 R = M A X G= M A X B = M A X

数字摄影测量学要点

数字摄影测量复习要点（2016.5） 1、摄影测量发展历程模拟摄影测量(1851-1970) 模拟摄影测量主要是根据摄影过程的几何反转，反求地面点的空间位置。它所采用的仪器为光学投影器、机械投影器或光学-机械投影器模拟摄影过程，用光线交会被摄物体的空间位置。解析摄影测量(1950-1980) 1957年，Helava提出用“数字投影代替”物理投影，数字投影就是利用电子计算机实时的进行共线方程的解算，从而交会出被摄物体的空间位置。数字摄影测量(1970-现在）利用数字影像相关技术，实现真正的自动化测图。数字摄影测量与模拟、解析摄影测量的最大区别： 1)处理的原始信息主要是数字影像； 2)以计算机视觉代替人眼的立体观测。 2、数字摄影测量的任务、特点主要任务：使用星载(机载)传感器所获取的可见光影像对地球陆地区域进行信息提取，具体包括：目标量测、影像解译、地形图测绘、正射影像图制作、数字高程模型生成。特点：数据量大、计算机运算速度快、技术精度高。 3、数字摄影测量定义：数字摄影测量是利用影像相关技术来代替人眼的目视观测，自动识别同名点，实现几何信息的自动提取。主要内容：影像及特征点的识别、同名像点的自动相关和匹配、数字影像纠正技术、数字高程模型（DEM）的制作、数字摄影测量系统的完整操作和测绘产品的生产。 4、计算机辅助测图计算机辅助测图（又称数字测图）是利用解析测图仪或具有机助系统的模拟测图仪，进行数据采集和数据处理，测绘数字地图，制作数字高程模型，建立测量数据库。计算机辅助测图系统所处理的依旧是传统像片，且对影像的处理仍然需要人眼的立体量测，计算机则起数据记录与辅助处理的作用，是一种半自动化的方式。计算机辅助测图是摄影测量从解析化向数字化的过渡阶段。

数字图像处理题库

一、基本题目 1. 加色图像的三基色是指：红、绿、蓝 2. HSI 模型中，H 表示色调(Hue)，S 表示饱和度(Saturation)， I 表示亮度(Intensity) 3. CMYK 模式的原色为青色(Cyan)、品红色(Magenta)、黄色(Yellow)和黑色（Black ）。 4. 常见的数字图像文件格式有：BMP 、JPEG 、GIF 、TIFF 、PNG 等 5. 图像按其亮度等级的不同，可以分成二值图像（只有黑白两种亮度等级）和灰度图像（有多种亮度等级）两种。 6. 数字图像对图像进行采集、量化后得到的。图像在空间上的离散化过程称为取样或抽样。被选取的点成为取样点、抽样点或样点，这些点也称为像素。 7. 数字图像显示质量的主要由空间分辨率和灰度分辨率两个因素决定。 8. 存储一幅大小为M ×N ，灰度级为2g 级的图像需要M ×N ×g （bit ）大小的存储空间。 9. 图像退化是图像形成、传输和记录的过程中，由于成像系统、传输介质和设备的不完善，而引起图像质量的下降。图像退化的典型表现为图像模糊、失真、噪声等。 10. 图像边缘是指图像中象素灰度值有阶跃变化或屋顶状变化的那些象素的集合。我们常常利用灰度变换曲线的导数在边缘取极值和零交叉的特点来进行图像的边缘检测。 11. 用函数b kr s +=来对图像象素进行拉伸变换，其中r 表示待变换图像象素灰度值，若系数0,1>>b k ，则输出图像的象素灰度值范围被拉伸（拉伸或压缩），图像变暗（暗或者亮）。 12. 广义的图像处理包含三个层次：图像变换处理，图像分析，图像理解。 13. 图像按其色调不同，可分为无色调的灰度（黑白）图像和有色调的彩色图像两种。 14. 图像的一般可以用多变量函数来表示(,,,,)I f x y z t λ= 15. 对每个取样点灰度值的离散化过程称为量化。量化等级越多（多少），所得图像层次越丰富，灰度分辨率越高（高低），质量越好，但数据量越大。 16. 频率域法是在图像的变换域(或频率域)上进行处理，增强我们感兴趣的频率分量，然后进行反变换，便得到增强了的图像。 17. 图像退化的典型表现为图像模糊、失真、噪声等，我们针对退化进行图像复原的一般过程是：分析退化原因－>建立退化模型－>反向推演－>恢复图像 18. 灰度直方图反映一幅图像中各灰度级象素出现的频率之间的关系，以灰度级

图像特征提取总结

图像常见xx方法简介常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。一、颜色特征（一）特点：颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征，此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感，所以颜色特征不能很好地捕捉图像中对象的局部特征。另外，仅使用颜色特征查询时，如果数据库很大，常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法，其优点是不受图像旋转和平移变化的影响，进一步借助归一化还可不受图像尺度变化的影响，基缺点是没有表达出颜色空间分布的信息。（二）常用的xx与匹配方法（1）颜色直方图其优点在于：它能简单描述一幅图像中颜色的全局分布，即不同色彩在整幅图像中所占的比例，特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于：它无法描述图像中颜色的局部分布及每种色彩所处的空间位置，即无法描述图像中的某一具体的对象或物体。最常用的颜色空间： RGB颜色空间、HSV颜色空间。颜色直方图特征匹配方法：

直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。（2）颜色集颜色直方图法是一种全局颜色特征提取与匹配方法，无法区分局部颜色信息。颜色集是对颜色直方图的一种近似首先将图像从RGB颜色空间转化成视觉均衡的颜色空间（如HSV空间），并将颜色空间量化成若干个柄。然后，用色彩自动分割技术将图像分为若干区域，每个区域用量化颜色空间的某个颜色分量来索引，从而将图像表达为一个二进制的颜色索引集。在图像匹配中，比较不同图像颜色集之间的距离和色彩区域的空间关系（3）颜色矩这种方法的数学基础在于：图像中任何的颜色分布均可以用它的矩来表示。此外，由于颜色分布信息主要集中在低阶矩中，因此，仅采用颜色的一阶矩（mean）、二阶矩（variance）和三阶矩（skewness）就足以表达图像的颜色分布。（4）颜色聚合向量其核心思想是：将属于直方图每一个柄的像素分成两部分，如果该柄内的某些像素所占据的连续区域的面积大于给定的阈值，则该区域内的像素作为聚合像素，否则作为非聚合像素。（5）颜色相关图二纹理特征（一）特点：纹理特征也是一种全局特征，它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性，并不能完全反映出物体的本质属性，所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同，纹理特征不是基于像素点的特征，它需要在包含多个像素点的区域中进行