基于帧间差分法和不变矩特征的运动目标检测与识别

合集下载

帧间差分法运动目标检测过程及原理

帧间差分法运动目标检测过程及原理帧间差分法是一种常用的视频运动目标检测技术，它通过比较视频序列中相邻帧之间的差异来检测目标的运动。

该方法常用于视频监控、智能交通系统、视频分析等领域。

本文将介绍帧间差分法的运动目标检测过程及原理，以及其在实际应用中的优势和局限性。

一、帧间差分法的原理帧间差分法的原理基于一个简单的假设：如果某个像素点在相邻两帧之间的亮度发生了变化，那么这个像素点所对应的物体就有可能发生了运动。

根据这个假设，可以通过计算相邻两帧之间的像素点亮度差异来确定目标的运动。

在实际应用中，帧间差分法通常使用以下公式来计算相邻两帧的像素点差异：D(x,y,t) = |I(x,y,t) - I(x,y,t-1)|D(x,y,t)表示在时间t时刻的像素点(x,y)的差分值，I(x,y,t)表示在时间t时刻的像素点(x,y)的亮度值，t-1表示时间t之前的时刻。

通过计算相邻两帧之间的像素点差异，可以得到一副差分图像，该图像中像素点的数值表示了该点在帧间差分中的差异程度。

接着，可以对差分图像进行阈值处理，将高于阈值的像素点标记为目标像素点，从而实现目标的运动检测。

帧间差分法的运动目标检测过程包括以下几个步骤：1. 视频帧获取和预处理首先需要从视频流中获取连续的视频帧，并对每一帧进行预处理，包括灰度化、降噪、边缘检测等操作，以便后续运动目标检测的准确性和鲁棒性。

2. 帧间差分计算对相邻两帧的视频进行帧间差分计算，得到差分图像。

可以使用绝对差值、差分平均值等方式来计算差分图像。

3. 阈值处理对差分图像进行阈值处理，将高于阈值的像素点标记为目标像素点。

阈值的选择是帧间差分法中需要仔细考虑的一个关键问题，合适的阈值能够更好地区分目标和背景，提高检测准确度。

4. 目标区域提取通过连通域分析、形态学处理等方法，将标记为目标像素点的区域进行进一步的提取和分割，得到目标的位置信息。

5. 目标跟踪和输出对提取得到的目标区域进行目标跟踪和输出，可以采用卡尔曼滤波、光流算法等方法来对目标进行跟踪，最终实现目标的运动检测和输出。

帧间差分法运动目标检测过程及原理

帧间差分法运动目标检测过程及原理
帧间差分法是一种常用的运动目标检测方法，其基本原理是通过对连续帧图像的像素
进行差分运算，找到像素值有较大变化的像素点，从而判断出图像中的运动目标。

1.图像采集：需要连续采集到少于或者等于2帧的图像，这些图像通常是通过视频摄
像机或者其他类似设备获得的。

2.减法运算：将第一帧图像的像素值依次与第二帧图像的像素值相减，得到一个差分
图像。

差分图像中的每个像素值表示了该像素点在两个图像中的变化情况。

根据差分结果，可以得到该像素发生变化的时间、位置和幅度等信息。

3.二值化处理：对差分图像进行二值化处理，将差分图像中的像素值映射为0或者255，得到一个二值化的图像。

二值化后的图像中，像素值为255的部分表示图像中存在运动目标，而像素值为0的部分则表示图像中没有运动目标。

4.目标区域提取：根据二值化后的图像，可以通过对连续的相邻像素点进行连通区域
分析，获得运动目标的位置和大小等信息。

通过设定一定的阈值来确定目标的像素数量或
者面积大小，可以筛选掉一些由于噪声等原因引起的误检测。

5.目标跟踪：在连续的帧图像中进行目标检测后，可以通过对目标的位置信息进行跟踪，进一步判断目标的运动轨迹和速度等特征。

帧间差分法也存在一些局限性。

该方法对于光照变化敏感，当光照发生较大变化时，
会导致图像中的许多像素值发生变化，从而增加了误检测的可能性。

当背景中存在较大的
纹理变化或者噪声时，也容易引起误检测。

在实际应用中，帧间差分法通常与其他方法相
结合使用，以提高运动目标检测的准确性和鲁棒性。

帧间差分法运动目标检测过程及原理

帧间差分法运动目标检测过程及原理帧间差分法是一种常用的运动目标检测方法，依靠帧与帧之间的差异来实现对运动目标的检测。

其原理是通过计算相邻帧之间的差异，将运动目标从静态背景中分离出来，从而实现目标检测。

1. 获取视频流或者图像序列，并将其转换为灰度图像。

该过程可以使用OpenCV等图像处理库实现。

2. 按照时间顺序，每隔一定的时间间隔（例如，每秒钟、每隔几帧）取一帧图像，形成连续的图像序列（也可以直接读取视频流）。

如果采用的是视频流，还需将视频流的时间基准与实际时间对齐。

3. 对于每一帧图像，先将其与上一帧图像做差，得到当前帧的差分图像。

若没有前一帧图像，则将当前帧图像作为背景参考。

4. 对于差分图像，可以应用阈值分割算法（例如Otsu算法、自适应阈值法等）来将其二值化。

此时，目标物体所在的像素值区域将为前景，而背景则为另一种像素值。

5. 对于二值化后的图像，可以应用形态学处理（例如开操作、闭操作等）来去除噪声点和孔洞，从而更准确地提取目标轮廓。

6. 最后，可以利用cv2.findContours()函数查找目标的轮廓。

这些轮廓可以代表单个运动目标或者多个运动目标。

且可以通过测量轮廓的面积、宽度、高度、位置等属性，进一步对目标进行分类与识别。

总结起来，帧间差分法是一种基于视频或图像序列的运动目标检测方法，它的优点是实现简单、速度较快，且对于CMOS或CCD摄像头等图像采集设备不稳定、背景不纯，亮度不均等问题具有较好的适应性。

不足之处在于对于复杂的场景或目标缩放、旋转、部分遮挡等情况，其检测效果容易受到影响。

因此，在实际应用中，我们需根据具体情况选择不同的算法方法来实现更准确、可靠的目标检测。

帧间差分法运动目标检测过程及原理

帧间差分法运动目标检测过程及原理帧间差分法是一种常用的运动目标检测方法，它通过比较相邻帧之间的差异来判断是否存在运动目标。

其基本原理是利用目标在连续帧之间的运动导致像素值的变化，通过对像素值差异的分析来判断是否存在目标。

1. 选择连续的帧：首先选择需要进行运动目标检测的视频序列，并选择连续的几帧作为输入。

通常情况下，选择相邻的两帧或者多帧进行比较。

2. 图像预处理：对选取的帧进行预处理，包括图像增强、降噪等操作。

常用的预处理方法包括平滑滤波、中值滤波等。

3. 帧间差分计算：对连续帧之间的像素进行差分计算，得到差分图像。

差分图像可以通过计算相邻像素的差异来获得，常用的差分计算方法包括绝对差分、平方差分等。

4. 二值化处理：将差分图像进行二值化处理，将差异像素标记为目标像素，无差异像素标记为背景像素。

常用的二值化方法包括阈值法、自适应阈值法等。

5. 目标提取：从二值化的差分图像中提取出目标区域。

可以通过连通区域分析、形态学操作等方法来实现目标提取。

6. 目标跟踪：将提取出的目标区域与原始图像进行叠加，实现目标的跟踪。

可以通过目标的位置、大小等信息来实现目标的跟踪。

帧间差分法的原理是基于连续帧之间的差异来判断是否存在目标。

当目标发生运动时，连续帧之间的像素值会发生变化，差分图像中会出现明显的差异区域。

通过对差分图像进行二值化和目标提取操作，可以得到目标的位置和形状信息。

进一步结合目标跟踪算法，可以对目标进行跟踪和分析。

帧间差分法具有简单、快速、实时性好等优点，适用于对静态相机下的运动目标进行检测。

由于光照变化、背景噪声等因素的干扰，帧间差分法也存在一定的局限性。

在实际应用中通常需要结合其他方法来进行运动目标检测。

帧间差分法运动目标检测过程及原理

帧间差分法运动目标检测过程及原理帧间差分法是一种常用的运动目标检测方法，它通过比较视频序列中不同帧之间的差异来检测运动目标，从而实现目标跟踪和识别。

本文将介绍帧间差分法的运动目标检测过程及原理。

帧间差分法的运动目标检测过程主要包括以下几个步骤：1. 视频帧获取：首先需要获取视频序列，可以通过摄像头、摄像机等设备来获取。

2. 帧间差分处理：将视频序列中相邻的两帧进行差分处理，得到两帧之间的差异，以检测目标的运动情况。

差分处理可以使用像素级的差异或者区域级的差异进行计算。

3. 运动目标检测：通过帧间差分处理得到的差异图像，可以进行阈值处理、边缘检测、连通域分析等操作，以提取出视频序列中的运动目标。

4. 目标跟踪与识别：最后可以对提取出的运动目标进行跟踪和识别，以实现对目标的监控与分析。

二、帧间差分法的原理帧间差分法的原理是基于视频序列中连续帧之间的差异来进行运动目标检测的。

具体来说，帧间差分法的原理包括以下几个方面：1. 差分图像计算：帧间差分法首先通过比较视频序列中相邻帧的像素值，计算出两帧之间的差异。

常见的计算方式包括绝对差分、均方差分等，可以得到表示两帧之间差异的差分图像。

1. 视频监控：帧间差分法可以用于视频监控系统中对目标的运动进行检测与跟踪，从而实现对监控区域的实时监控与预警。

2. 交通监控：在交通监控系统中，帧间差分法可以用于车辆与行人的运动检测与识别，以实现交通流量统计、违规行为检测等功能。

3. 智能驾驶：在智能驾驶系统中，帧间差分法可以用于实时检测路面上的车辆、行人等运动目标，以实现自动驾驶、避障等功能。

4. 人体姿态识别：帧间差分法可以用于对人体姿态的运动进行检测与分析，从而实现人体姿态识别、动作分析等功能。

优点：2. 对光照变化不敏感：帧间差分法在运动目标检测过程中对光照变化不敏感，能够适应不同光照条件下的目标检测需求。

3. 算法简单：帧间差分法的算法相对简单，计算量小，适用于资源有限的嵌入式系统。

帧间差分法运动目标检测过程及原理

帧间差分法运动目标检测过程及原理帧间差分法是一种常用的视频运动目标检测方法，它广泛应用于视频监控、智能交通、智能车辆等领域。

本文将从帧间差分法的原理和检测过程两个方面进行介绍。

一、帧间差分法的原理帧间差分法是一种基于像素级的运动目标检测方法，它利用相邻视频帧之间的像素差异来提取运动目标。

其原理是通过比较相邻两帧图像的像素值之差，来检测图像中的运动目标。

如果相邻两帧图像中某一像素点的像素值之差超过了一个设定的阈值，那么就认为该像素点处于运动状态。

通过对每个像素点进行类似的处理，就可以提取出视频中的运动目标。

帧间差分法的原理比较简单，但是在实际应用中需要考虑的因素较多，例如光照变化、背景干扰、噪声等问题都会对帧间差分法的检测效果产生影响。

帧间差分法通常需要结合其他方法来解决这些问题，以提高检测的准确性和稳定性。

帧间差分法的检测过程通常可以分为以下几个步骤：1. 视频获取：首先需要获取视频数据，可以通过摄像头、视频文件等方式获取到需要进行运动目标检测的视频数据。

2. 视频预处理：在进行帧间差分之前，通常需要对视频数据进行一定的预处理工作，主要包括去噪、增强、背景建模等操作，以减少噪声干扰、提高图像质量，从而提高运动目标检测的准确性。

3. 帧间差分计算：对于每一帧图像，首先需要与上一帧进行差分计算，得到相邻两帧图像之间的像素值差异。

4. 阈值处理：接下来需要对差分图像进行阈值处理，将像素值差异超过设定阈值的像素点认定为运动目标。

通过调整阈值大小可以控制运动检测的敏感度。

5. 运动目标提取：最后将通过阈值处理得到的二值图像进行连通区域分析，提取出视频中的运动目标区域。

需要注意的是，帧间差分法进行运动目标检测时还需要考虑运动目标的轨迹跟踪、运动目标的特征提取等问题，这些问题通常需要结合其他方法来解决。

视频运动目标检测方法研究与分析

视频运动目标检测方法研究与分析视频运动目标检测是计算机视觉领域的一个重要研究方向，它广泛应用于智能视频监控、交通流量统计、自动驾驶、医学图像分析等领域。

目标检测任务的难度主要在于在不同场景下，不同光照条件下，物体会呈现出不同的外观变化，同时还存在图像噪声、遮挡、部分遮挡等问题，这些因素都会对目标检测结果造成干扰。

一、传统视频目标检测方法1. 基于帧间差分法帧间差分法是电子监控领域最早使用的目标检测算法之一，其基本思路是将相邻两帧图像进行相减得到差值图，然后根据设定的阈值进行像素分类。

若差分结果大于阈值，则判断该像素点为运动像素点；反之，若差分结果小于阈值，则认为该像素点是背景像素点。

帧间差分法简单易行，速度较快，但由于只考虑了像素值的变化，无法区分运动目标和噪声或背景像素，且当目标的运动速度较慢、光照条件发生变化时，容易产生误检测。

2. 基于背景建模法背景建模法是一种通过学习并建模背景图像来实现目标检测的算法。

该方法常用的技术有Mixture of Gaussian（高斯混合模型）、Self-Organizing Background Subtraction （自组织背景减法）等。

Mixture of Gaussian方法建立了一个高斯混合模型来对背景进行建模，通过计算像素值与模型高斯分布之间的距离来判断像素点是否属于背景。

该方法在处理室外环境下的背景建模效果优异，但在室内环境下易受到光照变化和阻挡干扰，容易产生误检测。

二、深度学习相关方法在深度学习技术的快速发展下，深度神经网络被广泛应用于目标检测任务中。

1. R-CNN方法系列R-CNN方法系列是一种基于卷积神经网络的目标检测算法。

其主要思路是将输入图像划分为多个候选框，然后通过卷积神经网络对每个候选框进行特征提取。

最后，通过SVM分类器和回归器来计算候选框的置信度和坐标信息，以确定目标类别和位置。

R-CNN方法系列在目标定位和分类任务上取得了不错的效果，但缺点是算法速度较慢，不适用于实时应用场景。

基于帧间差分算法的运动目标检测方法研究

（二）灰度化
灰度图像是一种特殊的彩色图像，其中R，G，B三基色的色彩分量全部相等。图像中的每个像素的数值则是由1个字节，即8位数据显示的。彩色图像经过灰度处理形成灰度图像，这一过渡调节过程即为灰度化处理。由于彩色图像中具有大量的像素值，且这些数值之中都包含有R,G,B三个基色分量，而每个分量的取值有255种，基于此每个像素点则含有255*255*255种取值范围[2]。而灰度图像是一种特殊的彩色图像，因为这种图像R,G,B三个分量相等这一属性。因此在目标检测过程中，为降低图像运算的复杂度，减少信息处理量，普遍地的做法是需要先将大量格式不一的图像统一转化为灰度图像，使得图像的计算量大大缩减，这样操作之后，虽然灰度图像与彩色图像色彩不同，但两者都可以就图像的特征信息精准反映。图像灰度化处理可用四种方法来实现：
一、绪论
视觉是人类感受周围复杂环境变化最直接有效的手段之一。随着计算机和电子技术的普及，诸如视频和图像的各种数字视觉数据急剧增加。面对日益增多的视觉数据，光靠人眼是辨别不过来的。这时我们就需要用计算机视觉的方式来自动识别。由此同时我们就需要在此基础上提出相应的目标检测技术，这种目标检测就是在物体运动的同时同步检测运动目标，这是实时检材中检测手段，可以将其目标检测信息提取出来。
几十年来专家学者坚持不懈刻苦钻研，目标检测方面收获了丰硕的成果，截止目前，关于该研究较为权威的期刊杂志包括 PAML ,IVC；召开的相关会议有ECCV；也有在这方面颇有建树的个人研究比如说；Gibson提出的光流法，以后的学者在他的基础上实施并且进一步完善了该方法；Jain等人踩在前人研究的基石，提出了帧差法，并且实施了具体论证实验，对此方法加以强化佐证；高凯良针对于运动车辆的锁定研究了相应的检测方法；吴君钦主张适用的移动目标检测算法涉及邻近五帧差值算法与背景结合消除算法，上述算法能较好适用于静态背景下的目标检测。以上介绍了很多种有关目标检测技术的算法，然而没有任何一种算法适用于所有情况下的运动目标检测。因此，运动目标检测的关键在于：如何根据现有的相关理论知识，结合具体场景的特点，寻找合适的方法，从而满足实际应用的需求。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

基于帧间差分法和不变矩特征的运动目标检测与识别运动目标的检测与识别技术是视频监视系统的一项核心技术。

目前对运动目标的检测方法主要有三种：光流法、相邻帧差法和背景图像差分法。

光流法计算量大、易受噪声影响，不利于实时处理；背景图像差分法受到光线与天气等因素影响时，需动态确定阈值，也难以满足实时处理的要求。

目标的移动，使得每一个采样点采集的图像是变化的，并且图像的背景、亮度、目标和背景的色差都在发生变化，如何从变化的图像中快速而准确地找到目标是急需解决的问题。

本文将研究如何从变化的图像中迅速地搜索到目标，并对它进行识别。

１运动目标检测方法这里基于帧间差分的方法进行运动目标的检测，通过灰度化、差分、区域标记等步骤，实现运动目标的检测。

１．１图像预处理首先把图像中３×３的像素点集定义为一个像素片或一个窗口，除去边缘两行和两列的像素点，每个像素点都对应９个像素片，计算每个像素片的平均灰度值μ：μｎ＝１９３ｘ＝１!３ｙ＝１!ｐ（ｘ，ｙ）（１）并且计算：σ２ｎ＝１９３ｘ＝１!３ｙ＝１!（ｐ（ｘ，ｙ）－μｎ）２（２）其中ｐ（ｘ，ｙ）表示像素点的灰度值，ｎ是像素片编号。

比较每个像素片的方差σ２ｎ，找出最小值，即找出灰度变化最小的区域，即为这个区域的值，通过这样的处理，可以减少图像的噪声，图像信息无重大丢失。

１．２运动信号产生系统下面所叙述的运动信号产生系统是建立在ｔ检测法基础之上的，通过检测每个窗口的灰度值有无重大变化从而发现运动区域。

首先计算：Ｓ２＝（（ｎ１－１）×σ２ｒｅｆ＋（ｎ２－１）×σ２ｉ）ｎ１＋ｎ２－２（３）式中，ｎ１、ｎ２表示一个窗口的像素点总数，这里ｎ１＝ｎ２＝９。

σ２ｒｅｆ表示前一帧图像像素片的方差。

定义：ｔ＝（μｎ－μｒｅｆ）Ｓ（１／ｎ１＋１／ｎ２）"（４）μｒｅｆ表示前一帧图像像素片的平均灰度值。

把上分位点α设置为０．０２５，然后我们可以从ｔ分布表中估计一个测量标准Ｔ，Ｔ＝２．１１９９。

如此我们就可把图像分成两部分：ｆ（ｘ，ｙ）＝１；ｔ≥Ｔ０；其$它（５）经过上述处理，ｆ（ｘ，ｙ）为１表示的区域是运动的，最终这些区域被分离开来，从而完成运动目标的检测任务。

１．３运动目标的检测实验下面对运动的人体目标进行检测和提取实验，图１（ａ）是一帧图像，直立的是人；图１（ｂ）是人运动后某帧图像；图１（ｃ）为检测运动物体的一帧图像；图１（ｄ）是提取出的运动物体。

２不变矩特征提取方法在模式识别应用领域中，图像的形状特征是特征提取的重要对象，矩特征是其中广泛应用的形状特征之一。

１９６２年由ＨｕＭ．Ｋ．首次提出了图像识别的不变矩理论，并证明了有关矩的平移不变性、比例不变性和旋转不变性。

目前，矩特征已广泛应用于目标识别、景物匹配、形状分析、图像分析以及字符识别等许多方面。

２．１图像模式识别中的特征选取特征提取是对模式所包含的输入信息进行处理和分析，将不易受随机因素干扰的信息作为该模式的特征提取出来。

特征刘艳丽（安徽建筑工业学院１０系，安徽合肥２３０６０１）陈昊余炎峰（合肥工业大学电气与自动化工程学院，安徽合肥２３０００９）ＭｏｖｉｎｇＯｂｊｅｃｔＤｅｔｅｃｔｉｏｎａｎｄＲｅｃｏｇｎｉｔｉｏｎＭｅｔｈｏｄＢａｓｅｄｏｎＩｎｔｅｒ－ｆｒａｍｅＤｉｆｆｅｒｅｎｃｅＡｌｇｏｒｉｔｈｍａｎｄＭｏｍｅｎｔＩｎｖａｒｉａｎｔｓ摘要针对视频监视的复杂背景，提出了一种基于帧间差分法和不变矩特征的运动目标检测与识别方法。

在运动目标检测算法中，首先对定义的像素区域进行数据分析，然后通过帧间的数据差异产生运动信号，捕捉到场景中的运动目标。

在目标识别方法中，首先提取运动目标区域的不变矩特征，并对其矢量进行标准化，然后利用遗传小波神经网络作为模式识别器，实现运动目标的自动识别。

为验证该方法及网络模型的泛化能力，在Ｍａｔａｌｂ７．０中对模型进行了仿真。

关键词：运动目标检测与识别，不变矩矢量标准化，模式识别，遗传小波神经网络ＡｂｓｔｒａｃｔＴｈｉｓｐａｐｅｒｆｏｃｕｓｅｓｏｎｅｘｔｒａｃｔｉｏｎａｎｄｒｅｃｏｇｎｉｔｉｏｎｏｆｍｏｖｉｎｇｏｂｊｅｃｔｓｉｎｖｉｄｅｏｓｅｑｕｅｎｃｅｓｆｏｒｉｎｔｅｌｌｉｇｅｎｔｏｕｔｄｏｏｒｖｉｄｅｏｍｏｎｉｔｏｒｉｎｇｓｙｓｔｅｍｓｂａｓｅｄｏｎｉｎｔｅｒ－ｆｒａｍｅｄｉｆｆｅｒｅｎｃｅａｎｄｍｏｍｅｎｔｉｎｖａｒｉａｎｔ．Ｆｉｒｓｔｌｙｓｔａｔｉｓｔｉｃａｌａｎａｌｙｓｉｓｉｓｐｅｒｆｏｒｍｅｄｏｎｓｍａｌｌａｒｅａｓ（ｔｉｌｅｓ）ｏｆｔｈｅｏｒｉｇｉｎａｌｉｍａｇｅａｎｄｉｎｔｅｒ－ｆｒａｍｅｓｔａｔｉｓｔｉｃａｌｄｉｆｆｅｒｅｎｃｅｓｐｒｏｖｉｄｅｍｏｔｉｏｎｃｕｅｓｉｎｔｏｔｈｅｏｒｉｇｉｎａｌｉｍａｇｅｔｈａｔｄｅｆｉｎｅｒｅｇｉｏｎｓｏｆｉｎｔｅｒｅｓｔ．Ｔｈｅｎｅｘｔｒａｃｔｓｈａｐｅｉｎｖａｒｉａｎｔｍｏｍｅｎｔｃｈａｒａｃｔｅｒｉｓｔｉｃｓｏｆｍｏｖｉｎｇｏｂｊｅｃｔｓｒｅｇｉｏｎａｎｄｓｔａｎｄａｒｄｉｚｅｉｎ－ｖａｒｉａｎｔｍｏｍｅｎｔｖｅｃｔｏｒｓｉｎｏｒｄｅｒｔｏｒｅｃｏｇｎｉｚｅｏｂｊｅｃｔｓ．Ｆｉｎａｌｌｙ，ａＧＡｂａｓｅｄｎｅｕｒａｌｎｅｔｗｏｒｋｉｓｕｓｅｄｔｏｒｅｃｏｇｎｉｚｅｔｈｅｍｏｖｉｎｇｏｂｊｅｃｔｓ．Ｔｏｔｅｓｔｔｈｉｓｍｅｔｈｏｄａｎｄｔｈｅｇｅｎｅｒａｌｉｚａｔｉｏｎｃａｐａｂｉｌｉｔｙｏｆｔｈｅｎｅｔｗｏｒｋｍｏｄｅｌ，ｏｕｒｍｏｄｅｌｗａｓｓｉｍｕｌａｔｅｄｉｎＭａｔａｌｂ７．０．Ｋｅｙｗｏｒｄｓ：ｍｏｖｉｎｇｏｂｊｅｃｔｄｅｔｅｃｔｉｏｎａｎｄｒｅｃｏｇｎｉｔｉｏｎ，ｉｎｖａｒｉａｎｔｍｏｍｅｎｔｖｅｃｔｏｒｓｔａｎｄａｒｄｉｚａｔｉｏｎ，ｐａｔｔｅｒｎｒｅｃｏｇｎｉｔｉｏｎ，ｇｅｎｅｔｉｃｗａｖｅｌｅｔｍｅｕｒａｌｎｅｔｗｏｒｋ基于帧间差分法和不变矩特征的运动目标检测与识别３４《工业控制计算机》２００８年２１卷第７期提取过程是去除冗余信息的过程，具有提高识别精度、减少运算量和提高运算速度的作用。

良好的特征应具有可区分性、稳定性、独立性以及数目小。

矩是一种非常重要的表示目标总体形状的特征量。

二维图形的几个关键特征均直接与矩有关，如图像的大小、形心和旋转情况等等。

不变矩是指物体图像经过平移、旋转以及比例变换仍保持不变的矩特征量，不变矩由于概念清晰，识别率稳定，对具有旋转和缩放变化的目标有良好的不变性及抗干扰性，能有效地反映图像的本质特征。

因此，本文的识别模型将捕捉到的图像的不变矩作为识别特征。

２．２不变矩特征提取设一幅Ｍ×Ｎ二维离散图像ｆ（ｘ，ｙ），ｆ（ｘ，ｙ）表示（ｘ，ｙ）处的灰度等级，其（ｐ＋ｑ）阶几何矩ｍｐｑ和中心矩μｐｑ定义为：ｍｐｑ＝ｘ!ｙ!ｘｐｙｑｆ（ｘ，ｙ）（６）μｐｑ＝ｘ!ｙ!（ｘ－ｘ０）ｐ（ｙ－ｙ０）ｑｆ（ｘ，ｙ）（７）其中，ｘ０＝ｍ１０／ｍ００，ｙ０＝ｍ０１／ｍ００，ｐ、ｑ分别为常数。

对于二维图像，ｘ０表示图像灰度在水平方向上的灰度重心；ｙ０表示图像灰度在垂直方向上的灰度重心。

中心矩特征具有平移及旋转不变性。

归一化的中心矩为：ηｐｑ＝μｐｑ／μｒ００（８）其中，ｒ＝（ｐ＋ｑ＋２）／２，ｐ＋ｑ＝２，３，…。

利用归一化中心矩可导出７个不变矩#１～#７。

不变矩特征提取在不变矩的实际计算过程中，不同图像的不变矩数值分布范围非常大。

为调整其取值范围，对７个不变矩取对数修正为ｘｉ＝｜ｇ｜#ｉ‖，ｉ＝１，２，…，７。

其中，所进行的修正变换应综合考虑不变矩特征的大小及后续神经网络的结构特点。

２．３不变矩矢量标准化不变矩矢量标准化的目的是提高神经网络的计算效率和收敛率。

不变矩特征提取后得到７个不变矩，将这７个不变矩排成一列，构成一维列矢量。

一般情况下，对于灰度图像，不变矩特征取值较大。

如果直接将该矢量输人神经网络进行训练，势必影响神经网络的计算效率和收敛率。

因此，在将该矢量输人神经网络之前，先进行不变矩矢量标准化。

设ｘｍａｘ和ｘｍｉｎ为不变矩输入矢量Ｘ中的最大值和最小值，则不变矩矢量标准化过程可描述为Ｙ＝（Ｘ－ｘｍｉｎ）／（ｘｍａｘ－ｘｍｉｎ），不变矩矢量标准化实质上是对输入矢量实行线性映射，将不变矩输入矢量中的特征转换到［０，１］之间，以便于后续神经网络权值与阈值的调节和运算。

３基于遗传小波神经网络的目标识别对于视频监视系统而言，能够非法侵入监视场景的目标主要是人、车辆和宠物，因此本文主要对这三种运动目标的识别进行研究。

首先按以上方法提取入侵目标区域的７个不变矩特征，再利用基于遗传算法的小波神经网络对目标进行识别。

小波神经网络是以小波函数为基底的一种ＲＢＦ网络，具有良好的函数逼近能力和模式分类能力，具有结构简单、精度高、收敛速度快等优点。

该神经网络的结构设计为３层：输入层含有７个神经元，对应于７个不变矩特征；隐含层激活函数采用Ｍｏｒｌｅｔ小波函数ψ（ｘ）；输出层含有３个神经元，对应于３个识别目标，激活函数采用Ｓｉｇｍｏｉｄ函数σ（ｘ），如图２所示。

图２遗传小波神经网络模型设网络输入Ｘ＝［ｘ１，ｘ２，…，ｘ６，ｘ７］Ｔ，网络输出Ｙ＝［ｙ１，ｙ２，ｙ３］Ｔ，则有：ｙｋ＝σ（ｍｉ＝１!ωｋ，ｉψｉ（７ｊ＝１!Ｕｊ，ｉｘｊ））（ｋ＝１，２，３）（９）ψ（ｘ）＝ｃｏｓ（１．７５×ｘ－ｂｉａｉ）×ｅｘｐ（－０．５×（ｘ－ｂｉａｉ）２）（１０）σ（ｘ）＝（１＋ｅｘｐ（－Ｔｘ））－１（１１）其中Ｕｊ，ｉ、ωｋ，ｉ为权重因子，ａｉ、ｂｉ分别为伸缩因子和平移因子，ｍ隐含层神经元个数，Ｔ为调节常数，取Ｔ＝１００。

传统神经网络训练常采用ＢＰ算法，但存在陷入局部极小值、收敛速度慢和引起震荡等缺点。

而遗传算法具有很强的全局寻优能力，这里采用遗传算法对神经网络进行训练。

训练时涉及以下关键问题：１）染色体编码。

染色体编码采用浮点型编码。

每个染色体包括权重因子，伸缩因子和平移因子。

２）适应度函数。

对任一个体，其目标函数定为神经网络输出值的均方误差：ν＝１ｍｎｍｉ＝１!ｎｊ＝１!（ｙｉ，ｊ＝ｙｐｉ，ｊ）２（１２）式中，ｍ为训练样本数目，ｎ为神经网络输出层神经元个数，ｙｉ，ｊ、ｙｐｉ，ｊ分别为第ｉ个样本的输出层第ｊ个神经元的实际输出和期望输出，再经过如下的指数变换即得到适应度函数：ｆν＝ｅｘｐ（－ν）（１３）３）遗传操作。

取群体规模为５０，交叉概率为０．６，变异概率为０．１。

４实验及仿真结果对于图１（ｄ），利用二阶和三阶归一化中心矩可导出图像的７个不变矩，这７个不变矩便是进行模式识别的特征矩。

下面是具体计算步骤：Ｓｔｅｐ１：令ｐ、ｑ分别为０、１、２，根据式６求出其（ｐ＋ｑ）阶几何矩ｍ１０，ｍ０１，ｍ１１，ｍ２０，ｍ０２，ｍ３０，ｍ０３，ｍ１２，ｍ２１。

同时求得ｘ０＝ｍ１０／ｍ００，ｙ０＝ｍ０１／ｍ００。