运动目标检测算法研究综述

2017年第1期信息通信2017

(总第 169 期）INFORMATION&COMMUNICATIONS(Sum.N o169)

运动目标检测算法研究综述

程爱灵，黄昶，李小雨

(华东师范大学，上海200241)

摘要:运动目标检测技术是计算机视觉的基础，是一个十分有研究意义且很有挑战性的问题。文章从当前运动目标检测问题的相关方法进行分析研究。首先详细介绍了光流法、帧差法和背景差法的算法原理。然后对比了几种算法的优缺点，介绍各算法的适用场景。最后针对研究过程面临的难题，展望了运动目标检测技术新的发展趋势。

关键词：图像处理;光流;运动目标检测；巾贞差法；背景差法

中图分类号:TP391 文献标识码:A文章编号：1673-1131(2017)01-0012-03

〇引言

计算机视觉的最终目的就是使用计算机等智能设备来代替人去对周围环境进行感知、解释及应答。随着科学技术的发展，计算机视觉在越来越多的领域内得到了使用。其中智能视频监控更是在军事、安保、医学和科研等领域被广泛地使用。在智能视频监控中，运动目标的检测与跟踪算法是系统的核心。视频图像的目标检测技术则更是理解图像的基础。

运动目标检测就是在寻找存在运动的区域，检测到的运动区域可以为后续的目标识别和跟踪，行为分析等任务提供可参考的区域[1]。通常视频图像被分为两种:一种是背景是静态的视频，比如监视某一个固定场景;另一种是背景是动态的视频，比如对目标进行跟踪运动的摄像机拍到的视频。在实际生活中其实不会存在完全静止的背景，由于天气和光照的变化，运动目标阴影、干扰物等的影响背景也是动态变化的，这使得运动目标检测在实现过程中有很多的制约和挑战。主要的检测算法有光流法、帧差法和背景差法三种。

1光流法

1.1基本概念

光流是空间运动物体被观测面上的像素点运动产生的瞬时速度场，包含了物体表面结构和动态行为的重要信息[2]。视觉心理学认为人与被观测物体存在相对运动时，被观察物体表面带光学特征(如亮度/灰度信息)部位的运动能提供物体的运动和结构信息，即当人眼（摄像机）与场景中物体存在相对运动时，物体带光学特征部分的移动投影到视网膜平面(成像平面)上就形成了光流场。

光流法的基本原理是：为图像中的每一个像素点赋予一个运动矢量。动态分析各像素点的速度矢量。如果图像中没有目标运动时光流矢量在整个图像中是连续变化的；当图像中存在运动目标时，运动目标形成的矢量场必定与背景的速度矢量场不同，由此即可求出运动目标的位置。

1.3几种常见的光流法

常见的光流法有微分法中的H S算法、L K算法和基于块匹配的模板匹配算法。

(1)H S算法。

Horn和Schunck在基于亮度恒定的光流基本约束方程的基础上假设光流在整个图像上平滑变化，提出了全局平滑性约束。即假设光流场满足光流基本方程的同时也要满足全局平滑性[3]。这就要保证光滑性的误差尽可能的小，误差由下式求得:

保证亮度恒定要求光流基本约束方程的误差尽可能小，误差由下式求得：

Ec(w,v)= \^I x u+1 y v+1]2dxdy(2)

联立公式(1)和(2)，HS光流法中的光流应该满足取下式的最小值：

心加)=>[(|(/，+^+’,)2+乂〔-)+〔轰〕+图+〔|)卜

式中A为平滑控制参数，决定着E c和E s两种误差之间的权重。

(2)L K算法。

由Lucas和Kanade提出的LK算法与H S算法不同，它

1.2算法原理

光流中包含了物体的运动信息，因此可以用来检测图像序列的运动目标。光流法的核心就是求解运动物体的光流信息，即速度。物体在三维空间的运动一般都是相对连续的，因此物体在运动过程中在成像平面所投影的图像也是连续变化的。假设：相邻帧图像的亮度恒定；相邻帧的获取时间连续; 保持空间一致性，即同一物体成像的像素有相同的运动。由此可以推导出光流的基本方程。

设t时刻图像坐标为(x，y)的点P的灰度值是I(x,y,t)，经过 d t后，有水平方向和垂直方向的运动分量分别为u和V，则有

w=去，v=泰P点的灰度值为I(x+dx，y+dy,t+dt)。当dt—0时，灰度值保持不变，即I(x,y,t)= I(x+dx，y+dy，t+dt)，用泰勒公式展开，忽略二阶无穷小量得到光流约束的基本方程：引入了局部平滑性约束，假设在局部空间n上运动矢量保持恒定，使用加权最小二乘法估计光流。

L K算法的误差ELK可由下式求得：

Enc v) =j j w 2 (x,y)?(Ixu + I yv + I t f dxdy(3)

式中，W(x,y)= {W i|i=l，2,…,n}是邻域Q内n个点的权重，靠近中心的加权要比周围大。求解(x，y)处L K光流的过程就是求解上式最小值的过程。

(3)模板匹配法。

模板匹配法在给定的两帧图像L和L中以I I的像素点(X，y)为中心建立(2n+l)*(2n+l)的区域Wi，在12图像中对应的以像素点(x，y)为中心建立(2N+1)*(2N+1)的区域w2中搜索最佳匹配位置(N>n)。定义归一化相关系数公式：

^l i x+ hy+ J^xI^x+ u+ Uy+ v+ j)

I n

J( X Ji2(x+^y+^x Y,I2(x+u+i^y+v+J)

V i，卜_n

目标检测算法

function MovingTargetDetectionByMMI() %Moving Target Detection %Based on Maximun Mutual Information % %EDIT BY PSL@CSU %QQ：547423688 %Email：anyuezhiji@https://www.360docs.net/doc/e2393589.html, %2012-06-01 %读文件 Im1=imread('001.jpg'); Im2=imread('002.jpg'); Im3=imread('003.jpg'); Im1=rgb2gray(Im1); Im2=rgb2gray(Im2); Im3=rgb2gray(Im3); tic; d12=GetDifferenceImg(Im2,Im1); d23=GetDifferenceImg(Im2,Im3); d=d12.*d23; se =; for i=1:4 d = imfilter(d,se); end for i=1:2 d = medfilt2(d,); end %%d=abs((d12-d23).^0.7); d=uint8(d/max(max(d))*255); level = graythresh(d); BW = im2bw(d,level); s=regionprops(BW,'BoundingBox'); figure(1)

subplot(2,2,1); imshow(uint8(d12/max(max(d12))*255)); title('参考帧与前一帧的差值') subplot(2,2,2); imshow(uint8(d23/max(max(d23))*255)); title('参考帧与后一帧的差值') subplot(2,2,3); imshow(BW); title('由前后帧得出的差值') subplot(2,2,4); imshow(Im2); %imshow(d); rectangle('Position',s(1).BoundingBox,'Curvature',,'LineWidth',2,'LineStyle','--','EdgeColor', 'r') title('参考帧与检测结果') %求相邻两帧重合部分差值主函数 function outImg=GetDifferenceImg(R,F) =dwt2(R,'db1'); =dwt2(F,'db1'); CA1=uint8(CA1); CA2=uint8(CA2); fprintf('\n------PSO start\n'); =PSO(CA1,CA2); while mi<1.2 =PSO(CA1,CA2); end fprintf('tx:%f ty:%f ang:%f mi:%f\n',pa(1),pa(2),pa(3),mi); fprintf('------PSO end\n\n'); %pa=; fprintf('------Powell start\n'); mi_old=0; while abs(mi-mi_old)>0.01

运动目标检测方法总结报告

摘要由于计算机技术的迅猛发展，使得基于内容的视频信息的存取、操作和检索不仅成为一种可能，更成为一种需要。同时，基于内容的视频编码标准MPEG-4和基于内容的视频描述标准MPEG-7正在发展和完善。因此提取和视频中具有语义的运动目标是一个急需解决的问题。运动目标提取和检测作为视频和图像处理领域的重要研究领域，有很强的研究和应用价值。运动检测就是将运动目标从含有背景的图像中分离出来，如果仅仅依靠一种检测算法，难以从复杂的自然图像序列中完整地检测出运动的目标。较高的检测精度和效率十分重要，因此融合多种检测方法的研究越来越受到重视。本文介绍了几种国内外文献中的经典的视频运动目标的检测和提取算法，并对各种方法进行了评价和总结。首先介绍了基本的运动目标检测的基本知识和理论，然后介绍了基本的几种目标检测方法及其各种改进方法。对今后的运动目标检测提取的相关研究提供一定的参考。关键词：运动目标检测光流法帧差法背景建模方法

ABSTRACT Because of the rapid development of computer technology, it is possible to access, operate and retrieve the video information based on the content of the video. At the same time, based on the content of the video coding standard MPEG-4 and content-based video description standard MPEG-7 is developing and improving. Therefore, it is an urgent problem to be solved in the extraction and video. Moving object extraction and detection is a very important field of video and image processing, and has a strong research and application value. Motion detection is to separate moving objects from the image containing background, if only rely on a detection algorithm, it is difficult to from a complex natural image sequences to detect moving target. Higher detection accuracy and efficiency are very important, so the study of the fusion of multiple detection methods is becoming more and more important. In this paper, the detection and extraction algorithms of the classical video moving objects in the domestic and foreign literatures are introduced, and the methods are evaluated and summarized. Firstly, the basic knowledge and theory of basic moving target detection is introduced, and then the basic method of target detection is introduced. To provide a reference for the research on the extraction of moving target detection in the future. Keywords: Visual tracking Optical flow method Frame Difference Background modeling method

运动目标检测光流法

摘要运动目标检测方法是研究如何完成对视频图像序列中感兴趣的运动目标区域的“准确定位”问题。光流场指图像灰度模式的表面运动，它可以反映视频相邻帧之间的运动信息，因而可以用于运动目标的检测。MATLAB这种语言可移植性好、可扩展性强，再加上其中有丰富的图像处理函数，所以利用MATLAB 软件来用光流法对运动目标的检测中具有很大的优势。本设计主要可以借助matlab软件编写程序，运用Horn-Schunck算法对图像前后两帧进行处理，画出图像的光流场。而图像的光流场每个像素都有一个运动矢量，因此可以反映相邻帧之间的运动，分析图像的光流场就可以得出图像中的运动目标的运动情况。关键字：光流法；Horn-Schunck算法；matlab

目录 1光流法的设计目的 (1) 2光流法的原理 (1) 2.1光流法的介绍 (1) 2.1.1光流与光流场的概念 (1) 2.1光流法检测运动目标的原理 (2) 2.1.1光流场计算的基本原理 (2) 2.2.2基于梯度的光流场算法 (2) 2.2.3Horn-Schunck算法 (3) 2.2.4光流法检测运动目标物体的基本原理概述 (5) 3光流法的程序具体实现 (6) 3.1源代码 (6) 3.1.1求解光流场函数 (6) 3.1.2求导函数 (9) 3.1.3高斯滤波函数 (9) 3.1.4平滑性约束条件函数 (10) 3.1.5画图函数 (10) 4仿真图及分析 (12) 结论 (13) 参考文献 (14)

1 光流法的设计目的数字图像处理，就是用数字计算机及其他有关数字技术，对图像进行处理，以达到预期的目的。随着计算机的发展，图像处理技术在许多领域得到了广泛应用，数字图像处理已成为电子信息、通信、计算机、自动化、信号处理等专业的重要课程。数字图像处理课程设计是在学习完数字图像处理的相关理论后，进行的综合性训练课程，其目的是：使学生进一步巩固数字图像处理的基本概念、理论、分析方法和实现方法；增强学生应用Matlab编写数字图像处理的应用程序及分析、解决实际问题的能力；尝试所学的内容解决实际工程问题，培养学生的工程实践能力。运动目标检测是数字图像处理技术的一个主要部分，近些年来，随着多媒体技术的迅猛发展和计算机性能的不断提高，动态图像处理技术日益受到人们的青睞，并且取得了丰硕的成果，广泛应用于交通管理、军事目标跟踪、生物医学等领域。因此，基于光流法，实现运动目标的检测是本文的研究对象。结合图书馆书籍、网上资料以及现有期刊杂志，初步建立起运动目标检测的整体思路和方法。 2 光流法的原理 2.1 光流法的介绍 2.1.1 光流与光流场的概念光流是指空间运动物体在观测成像面上的像素运动的瞬时速度，它利用图像序列像素强度数据的时域变化和相关性来确定各自像素位置的“运动”，即反映图像灰度在时间上的变化与景物中物体结构及其运动的关系。将二维图像平面特定坐标点上的灰度瞬时变化率定义为光流矢量。视觉心理学认为人与被观察物体

目标检测综述教学内容

一、传统目标检测方法如上图所示，传统目标检测的方法一般分为三个阶段：首先在给定的图像上选择一些候选的区域，然后对这些区域提取特征，最后使用训练的分类器进行分类。下面我们对这三个阶段分别进行介绍。 (1) 区域选择这一步是为了对目标的位置进行定位。由于目标可能出现在图像的任何位置，而且目标的大小、长宽比例也不确定，所以最初采用滑动窗口的策略对整幅图像进行遍历，而且需要设置不同的尺度，不同的长宽比。这种穷举的策略虽然包含了目标所有可能出现的位置，但是缺点也是显而易见的：时间复杂度太高，产生冗余窗口太多，这也严重影响后续特征提取和分类的速度和性能。（实际上由于受到时间复杂度的问题，滑动窗口的长宽比一般都是固定的设置几个，所以对于长宽比浮动较大的多类别目标检测，即便是滑动窗口遍历也不能得到很好的区域） (2) 特征提取由于目标的形态多样性，光照变化多样性，背景多样性等因素使得设计一个鲁棒的特征并不是那么容易。然而提取特征的好坏直接影响到分类的准确性。（这个阶段常用的特征有SIFT、HOG等） (3) 分类器主要有SVM, Adaboost等。总结：传统目标检测存在的两个主要问题：一是基于滑动窗口的区域选择策略没有针对性，时间复杂度高，窗口冗余；二是手工设计的特征对于多样性的变化并没有很好的鲁棒性。二、基于Region Proposal的深度学习目标检测算法对于传统目标检测任务存在的两个主要问题，我们该如何解决呢？对于滑动窗口存在的问题，region proposal提供了很好的解决方案。region

proposal（候选区域）是预先找出图中目标可能出现的位置。但由于region proposal 利用了图像中的纹理、边缘、颜色等信息，可以保证在选取较少窗口（几千个甚至几百个）的情况下保持较高的召回率。这大大降低了后续操作的时间复杂度，并且获取的候选窗口要比滑动窗口的质量更高（滑动窗口固定长宽比）。比较常用的region proposal算法有selective Search和edge Boxes，如果想具体了解region proposal可以看一下PAMI2015的“What makes for effective detection proposals？” 有了候选区域，剩下的工作实际就是对候选区域进行图像分类的工作（特征提取+分类）。对于图像分类，不得不提的是2012年ImageNet大规模视觉识别挑战赛（ILSVRC）上，机器学习泰斗Geoffrey Hinton教授带领学生Krizhevsky使用卷积神经网络将ILSVRC分类任务的Top-5 error降低到了15.3%，而使用传统方法的第二名top-5 error高达26.2%。此后，卷积神经网络占据了图像分类任务的绝对统治地位，微软最新的ResNet和谷歌的Inception V4模型的top-5 error降到了4%以内多，这已经超越人在这个特定任务上的能力。所以目标检测得到候选区域后使用CNN对其进行图像分类是一个不错的选择。 2014年，RBG（Ross B. Girshick）大神使用region proposal+CNN代替传统目标检测使用的滑动窗口+手工设计特征，设计了R-CNN框架，使得目标检测取得巨大突破，并开启了基于深度学习目标检测的热潮。 1. R-CNN (CVPR2014, TPAMI2015) (Region-based Convolution Networks for Accurate Object d etection and Segmentation)

目标检测方法简要综述

龙源期刊网 https://www.360docs.net/doc/e2393589.html, 目标检测方法简要综述作者：栗佩康袁芳芳李航涛来源：《科技风》2020年第18期摘要：目标检测是计算机视觉领域中的重要问题，是人脸识别、车辆检测、路网提取等领域的理论基础。随着深度学习的快速发展，与基于滑窗以手工提取特征做分类的传统目标检测算法相比，基于深度学习的目标检测算法无论在检测精度上还是在时间复杂度上都大大超过了传统算法，本文将简单介绍目标检测算法的发展历程。关键词：目标检测;机器学习;深度神经网络目标检测的目的可分为检测图像中感兴趣目标的位置和对感兴趣目标进行分类。目标检测比低阶的分类任务复杂，同时也是高阶图像分割任的重要基础;目标检测也是人脸识别、车辆检测、路网检测等应用领域的理论基础。传统的目标检测算法是基于滑窗遍历进行区域选择，然后使用HOG、SIFT等特征对滑窗内的图像块进行特征提取，最后使用SVM、AdaBoost等分类器对已提取特征进行分类。手工构建特征较为复杂，检测精度提升有限，基于滑窗的算法计算复杂度较高，此类方法的发展停滞，本文不再展开。近年来，基于深度学习的目标检测算法成为主流，分为两阶段和单阶段两类：两阶段算法先在图像中选取候选区域，然后对候选区域进行目标分类与位置精修;单阶段算法是基于全局做回归分类，直接产生目标物体的位置及类别。单阶段算法更具实时性，但检测精度有损失，下面介绍这两类目标检测算法。 1 基于候选区域的两阶段目标检测方法率先将深度学习引入目标检测的是Girshick[1]于2014年提出的区域卷积神经网络目标检测模型（R-CNN）。首先使用区域选择性搜索算法在图像上提取约2000个候选区域，然后使用卷积神经网络对各候选区域进行特征提取，接着使用SVM对候选区域进行分类并利用NMS 回归目标位置。与传统算法相比，R-CNN的检测精度有很大提升，但缺点是：由于全连接层的限制，输入CNN的图像为固定尺寸，且每个图像块输入CNN单独处理，无特征提取共享，重复计算;选择性搜索算法仍有冗余，耗费时间等。基于R-CNN只能接受固定尺寸图像输入和无卷积特征共享，He[2]于2014年参考金字塔匹配理论在CNN中加入SPP-Net结构。该结构复用第五卷积层的特征响应图，将任意尺寸的候选区域转为固定长度的特征向量，最后一个卷积层后接入的为SPP层。该方法只对原图做一

运动序列目标检测算法研究及 DSP 实现

运动序列目标检测算法研究及DSP实现李文艳，王月琴，张笑微（西南科技大学信息工程学院四川绵阳621010）摘要：由于实际场景的多样性，目前常用的运动目标检测算法都还存在一定程度的缺陷，因此本文提出了一种将帧差法和背景减法相结合的方法，实现快速精确地检测和提取运动目标。实验结果表明，本方法是比较实用的，能较好满足实时视频监控系统的要求。最后将程序移植到基于DSP的平台上，进行相应的优化后基本满足了实时性的要求。关键词：目标检测；帧差法；背景减法中图分类号：TP751.1 文献标识码：A Algorism Research of Moving Object Detection and DSP Implementation LI Wen-yan，WANG Yue-qin，ZHANG Xiao-wei (Southwest University of Science and Technology Mianyang Sichuan China 621010) Abstract: Because of the environment’s variety, the methods that have been used for moving object detection need to be improved. An algorithm based on two consecutive frames subtraction and background subtraction is presented and it can detect and extract object quickly and accurately. The results show that the proposed method is a practical one. It can meet the need of the real time video surveillance and monitoring system. The coding is transplanted in DSP, and the project is executed successfully on CCS simulator. Keywords: Object detection; Frames subtraction; Background subtraction 引言运动目标的检测在智能监控等领域中得到了广泛的应用。运动目标的检测就是从视频流中去除静止背景提取出运动的目标，运动目标的有效分割对跟踪等后期处理非常关键。本文提出了将帧间差分和背景减法相结合的方法。首先选取一帧作为背景帧, 建立各像素点的高斯模型。再运用帧间差分法对相邻两帧图像进行差分处理, 区分出背景点和变化的区域。然后将变化区域与背景帧的对应区域进行模型拟合区分出显露区和运动物体。 1 运动目标检测算法总体流程采用帧间差分与背景减法相结合的算法进行运动目标检测，包括运动目标的检测和将检测到的运动目标从背景中分割出来两部分，其系统框架流程图如图1所示。图1 运动目标检测流程图这种设计充分利用了被检测区域部分时间静止的特点，具有智能检测的功能，它只在检

视觉目标检测算法说明

视觉目标检测算法说明 1.功能通过安装在战车上的摄像头，检测视野范围内的敌方战车。 2.算法： 2.1目标检测与识别 1.颜色检测采集大量敌方机器人的图片数据，并进行训练，得到对方机器人的颜色区间，并以此为阈值对整幅图像进行颜色检测，找到疑似敌方机器人的区域，量化成二值图。 2.滤除噪声点对得到的二值图像进行开运算处理，滤除颜色检测结果中的噪声点。 3.连通区域检测对图像中的疑似区域进行连通区域检测，计算出每个疑似区域的外部轮廓，用矩形近似表示。 4.连通区域合并根据连通区域之间的距离和颜色相似性，将距离接近且相似性高的连通区域进行合并。 5.形状和大小过滤对大量敌方机器人图片进行训练，得到对方机器人的形状信息（例如长宽比）和大小信息（面积），并以此为依据将不符合的区域过滤掉。经过以上五步的处理，可以初步得到敌方机器人的位置、大小和形状信息。 2.2目标运动跟踪对上步中的检测结果进行运动跟踪。 1.状态估计根据上一时刻地方机器人的运动状态（包括位置和速度），估算当前时刻机器人的运动状态。 2.轨迹关联根据位置和颜色信息，对当前时刻机器人的估计状态和检测结果进行关联。 3.状态更新若上一步中关联成功，更新当前时刻的运动状态。通过对检测结果进行运动跟踪，可以计算出当前时刻敌方机器人的运动速度和方向。 2.3预估提前量

1.评估延迟时间根据己方机器人实际的调试情况，通过多次试验和统计的方法，估算己方机器人从接收命令到炮弹（或子弹）击中目标区域的时间延时（包括图像处理时间、落弹时间和炮弹飞行时间）。 2.计算提前量根据延迟时间和敌方机器人的运动速度，计算炮弹发射的提前量，补偿到敌方机器人的运动状态中。 3.总结：对于机器人战车中的敌方目标检问题，有很多种方法可以实现，视觉检测只是其中的一种方法，而基于颜色识别的目标检测也只是视觉算法中比较简单有效的一种。所以，本段代码只是抛砖引玉的一个样本，适用范围只针对于2014年RoboMasters夏令营的场地和战车，希望可以看到大家更加简单有效的算法。

(完整版)视频目标检测与跟踪算法综述

视频目标检测与跟踪算法综述 1、引言运动目标的检测与跟踪是机器视觉领域的核心课题之一，目前被广泛应用在视频编码、智能交通、监控、图像检测等众多领域中。本文针对视频监控图像的运动目标检测与跟踪方法，分析了近些年来国内外的研究工作及最新进展。 2、视频监控图像的运动目标检测方法运动目标检测的目的是把运动目标从背景图像中分割出来。运动目标的有效分割对于目标分类、跟踪和行为理解等后期处理非常重要。目前运动目标检测算法的难点主要体现在背景的复杂性和目标的复杂性两方面。背景的复杂性主要体现在背景中一些噪声对目标的干扰，目标的复杂性主要体现在目标的运动性、突变性以及所提取目标的非单一性等等。所有这些特点使得运动目标的检测成为一项相当困难的事情。目前常用的运动目标检测算法主要有光流法、帧差法、背景相减法，其中背景减除法是目前最常用的方法。 2.1帧差法帧差法主要是利用视频序列中连续两帧间的变化来检测静态场景下的运动目标，假设f k（x, y）和f（k i）（x, y）分别为图像序列中的第k帧和第k+1帧中象素点（x，y）的象素值,则这两帧图像的差值图像就如公式2-1所示： Diff ki f k（x, y） f（k 1）（x, y）（2-1）2-1式中差值不为0的图像区域代表了由运动目标的运动所经过的区域（背景象素值不变），又因为相邻视频帧间时间间隔很小，目标位置变化也很小，所以运动目标的运动所经过的区域也就代表了当前帧中运动目标所在的区域。利用此原理便可以提取出目标。下图给出了帧差法的基本流程：1、首先利用2-1式得到第k帧和第k+1帧的差值图像Diff k 1；2、对所得到的差值图像Diff k 1二值化（如式子2-2示）得到Qk+1 ；3、为消除微小噪声的干扰，使得到的运动目标更准确，对Q k 1进行必要的滤波和去噪处理，后处理结果为M k 1。 1

(完整word版)基于图像处理的运动物体的跟踪与检测开题报告

1、课题来源随着计算机技术的高速发展，运动物体的检测和跟踪在图像处理、计算机视觉、模式识别、人工智能、多媒体技术等领域越来越受到人们的关注。运动跟踪和检测的应用广泛，在智能监控和人机交互中，如：银行、交通、超市等场合常常使用运动跟踪分析技术，通过定位物体并对其行为进行分析，一旦发现物体有异常行为，监控系统就发出警报，提醒人们注意并即时的处理，改善了人工监督注意力分散、反应时间较慢、人力资源浪费等问题。运动目标的跟踪在虚拟现实、工业控制、军事设备、医学研究、视频监控、交通流量观测监控等很多领域也有重要的实用价值。特别在军事上，先进的武器导航、军事侦察和监控中都成功运用了自动跟踪技术。而跟踪的难点在于如何快速而准确的在每一帧图像中实现目标定位。正因如此，对运动目标的跟踪和检测的研究很有价值。 2、研究目的和意义运动目标检测是图像处理与计算机视觉的一个分支，在理论和实践上都有重大意义，长久以来一直被国内外学者所关注。在实际中，视频监控利用摄像机对某一特定区域进行监视，是一个细致和连续的过程，它可以由人来完成，但是人执行这种长期枯燥的例行监测是不可靠，而且费用也很高，因此引入运动监测非常有必要。它可以减轻人的负担，并且提高了可靠性。概括起来运动监测主要包括三个内容：运动目标检测，方向判断和图像跟踪。运动目标检测是整个监测过程的基础，运动目标的提取准确与否，直接关系到后续高级过程的完成质量。3、国内外研究现状和发展趋势及综述运动目标检测在国外已经取得了一些的研究成果，许多相关技术已经开始应用到实际系统中，但是国内研究相对落后,与国外还有较大差距。传统的视频目标提取大致可以分两类,一类以空间同性为准则,先用形态学滤波器或其他滤波器对图像作预处理;然后对该图像的亮度、色度或其他信息作空间上的分割以对区域作边缘检测;之后作运动估计,并合并相似的运动区域以得到最终的提取结果。如光流算法、主动轮廓模型算法。此类方法结果较为准确但是运算量相对较大。另一类算法主要以时间变化检测作为准则,这类算法主要通过帧差检测图像上的变化区域和不变区域,将运动物体与静止背景进行分割。此类方法运算量小,提取结果不如前类方法准确。此外,还有时空结合方法、时空亮度梯度信息结合的方法等等。 4、研究方法

关于三维目标识别的文献综述

1.1研究背景随着人类社会的快速发展，图像识别已经迅速发展成为一项极为重要的科技手段，其研究目标是，赋予计算机类似于人类的视觉能力，使其通过二维图像认知周边环境信息，包括识别环境中三维物体的几何形状、位置和姿态等。图像识别需综合运用计算机科学、模式识别、机器视觉及图像理解等学科知识，并随着这些学科的发展而前进。图像识别技术己广泛应用到许多领域，例如：宇宙探测、生物医学工程、遥感技术、交通、军事及公安等。针对不同对象和环境有不同的识别方法。由于图像可以提供十分丰富有效的信息，为给识别带来较大方便。因此，图像识别技术一直受到研究者重视，是模式识别领域的研究热点之一。一般来说，图像识别技术大体经历了三个主要阶段即：文字识别、二维图像识别和处理、三维物体识别。文字识别开始于1950年前后，首先是识别字母、数字和符号，后来发展到识别文字，从识别印刷字体到手写文字，并研制出相应的文字识别设备。从六十年代初期开始，人们开始图像处理和识别的研究，逐步发展到识别静止图像和运动图像，最初主要利用成像技术光学技术等，后来人们结合了日新月异的计算机技术，获得巨大成功。接下来是对三维物体识别问题的研究。三维物体识别的任务是识别出图像中有什么类型的物体,并给出物体在图像中所反映的位置和方向，是对三维世界的感知理解。在结合了人工智能科学、计算机科学和信息科学之后，三维物体识别成为图像识别研究的又一重要方向。目前，出于城市规划、工业自动化、交通监控、军事侦察及医疗等各个领域的大量应用需求，三维物体识别已成为一个活跃的研究领域，有较大的实用价值和重要意义，具有广阔前景。设计一个三维物体识别系统，理论上要求它有足够好的通用性、稳健性，且学习简单，即这个系统能够在各种条件下，无需手工干预就能识别任何物体，没有特殊或复杂的过程来获得数据库模型。当然这个需求一般很难达到，实际都是在一定约束条件下进行方法的研究，然后尽可能减约束条件。三维物体识别一般可分为五种主要的研究思路： 1)基于模型(model-based)或几何(geometry-based)的方法； 2)基于外观(appearance-based)或视图(view-based)的方法； 3)基于局部特征匹配的方法； 4)光学三维物体识别 5)基于深度图像的三维物体识别现在主流的是前三项， 1.基于模型或几何的方法如果在识别的过程中，要利用有关物体外观的先验知识，如CAD设计的模型则称为基于模型（model-based）或几何（geometry-based）的三维物体识别。基于模型的方法，从输入图像数据中得到物体描述，并与模型描述进行匹配，以达到对物体进行识别及定位目的。这里的物体模型一般仅描述物体的三维外形，省略颜色和纹理等其他属性，其算法流程如图1-1所示。

检测交通视频中运动目标的程序设计

专业综合实践任务书学生姓名:________专业班级: 指导教师: 工作单位: 信息工程学院题目:检测交通视频中运动目标的程序设计初始条件: （1）提供实验室机房及其matlab软件；（2）数字图像处理的基本理论学习。要求完成的主要任务:(包括课程设计工作量及其技术要求,以及说明书撰写等具体要求): （1）学习运动目标检测的原理及方法，并利用matlab设计程序完成以下功能；（2）读取交通视频文件；（3）运用一种背景建模方法，提取背景图像；（4）读取一帧有运动目标的图像，利用背景差分法，得到差分区域；（5）对差分区域进行数学形态学处理，得到完整的运动目标区域，并显示运动目标检测结果图；（6）对检测的结果进行分析比较；（7）要求阅读相关参考文献不少于5篇；（8）根据课程设计有关规范，按时、独立完成课程设计说明书。时间安排: (1) 布置课程设计任务，查阅资料，确定方案 1.5天； (2) 进行编程设计、调试2天； (3) 完成课程设计报告书、答辩 1.5天；指导教师签名: 年月日系主任(或责任教师)签名: 年月日

目录摘要 (1) 1.概述 (2) 2.设计原理 (3) 2.1 背景提取与更新算法 (3) 2.1.1 手动背景法 (4) 2.1.2 统计中值法 (4) 2.1.3 算术平均法 (4) 2.1.4 Surendra算法 (5) 2.2 背景差分法运动目标检测 (6) 2.3 形态学滤波 (7) 2.4总体方案设定 (9) 2.4.1 算术平均法与Surendra算法相结合的背景建模 (9) 2.4.2 总体程序框图 (10) 3.软件编程实现 (11) 4.结果及分析 (13) 5.心得体会 (17) 参考文献 (18)

运动目标检测原理

运动检测（移动侦测）原理一、引言随着技术的飞速发展，人们对闭路电视监控系统的要求越来越高，智能化在监控领域也得到越来越多的应用。在某些监控的场所对安全性要求比较高，需要对运动的物体进行及时的检测和跟踪，因此我们需要一些精确的图像检测技术来提供自动报警和目标检测。运动检测作为在安防智能化应用最早的领域，它的技术发展和应用前景都受到关注。运动检测是指在指定区域能识别图像的变化，检测运动物体的存在并避免由光线变化带来的干扰。但是如何从实时的序列图像中将变化区域从背景图像中提取出来，还要考虑运动区域的有效分割对于目标分类、跟踪等后期处理是非常重要的，因为以后的处理过程仅仅考虑图像中对应于运动区域的像素。然而，由于背景图像的动态变化，如天气、光照、影子及混乱干扰等的影响，使得运动检测成为一项相当困难的工作。二、运动检测（移动侦测）原理早期的运动检测如MPEG1是对编码后产生的I帧进行比较分析，通过视频帧的比较来检测图像变化是一种可行的途径。原理如下：MPEG1视频流由三类编码帧组成，它们分别是：关键帧（I 帧），预测帧（P帧）和内插双向帧（B帧）。I帧按JPEG标准编码，独立于其他编码帧，它是MPEG1视频流中唯一可存取的帧，每12帧出现一次。截取连续的I帧，经过解码运算，以帧为单位连续存放在内存的缓冲区中，再利用函数在缓冲区中将连续的两帧转化为位图形式，存放在另外的内存空间以作比较之用，至

于比较的方法有多种。此方法是对编码后的数据进行处理，而目前的MPEG1/MPEG4编码都是有损压缩，对比原有的图像肯定存在误报和不准确的现象。目前几种常用的方法： 1.背景减除（Background Subtraction ）背景减除方法是目前运动检测中最常用的一种方法，它是利用当前图像与背景图像的差分来检测出运动区域的一种技术。它一般能够提供最完全的特征数据，但对于动态场景的变化，如光照和外来无关事件的干扰等特别敏感。最简单的背景模型是时间平均图像，大部分的研究人员目前都致力于开发不同的背景模型，以期减少动态场景变化对于运动分割的影响。 2.时间差分（Temporal Difference ）时间差分（又称相邻帧差）方法是在连续的图像序列中两个或三个相邻帧间采用基于像素的时间差分并且阈值化来提取出图像中的运动区域。时间差分运动检测方法对于动态环境具有较强的自适应性，但一般不能完全提取出所有相关的特征像素点，在运动实体内部容易产生空洞现象。 3.光流（Optical Flow）基于光流方法的运动检测采用了运动目标随时间变化的光流特性，如Meyer[2] 等通过计算位移向量光流场来初始化基于轮廓的跟踪算法，从而有效地提取和跟踪运动目标。该方法的优点是在摄像机运动存在的前提下也能检测出独立的运动目标。然而，

交通场景中运动目标的检测文献综述

交通场景中运动目标的检测文献综述摘要:运动目标检测是数字图像处理技术的一个主要部分,是一种基于视频监控系统的运动目标检测方法。这种算法主要包括：图像预处理、运动目标的检测、运动速度的求取。运动目标分割是实现交通场景下车辆检测的前提。常用的分割方法可以分为背景差分法、帧间差分法和基于光流的分割方法等。关键词:数字图像处理;运动目标;检测方法 1 前言运动目标检测是数字图像处理技术的一个主要部分，近些年来，随着多媒体技术的迅猛发展和计算机性能的不断提高，动态图像处理技术日益受到人们的青睐，并且取得了丰硕的成果，广泛英语与交通管理、军事目标跟踪、生物医学等领域。目前,以数字图像处理技术为核心的视频监视系统越来越广泛地应用到交通监管中,它利用摄像机来获取图像,由计算机完成对运动目标的自动检测,如果车辆交通违规时,自动发出预警,记录全程违章视频,这在很大程度上减轻了监控人员的劳动强度,克服可能的人为失误,而且节省大量存储空间,使存储的数据更为有效,为交通违规的后续处理提供了客观依据。交通场景中运动目标的检测是本文的研究对象。结合图书馆书籍、网上资料以及现有期刊杂志的相关信息，初步建立起交通场景中运动目标检测课题研究的整体思路和方法。 2 正文 2.1运动目标运动目标是常生活中常见的．如活动的动物、行驶的运载工具等。在现实生活中，尽管人类的视觉既能看见运动又能看见静止的物体，但是在交通这样的复杂场景中大量有意义的视觉信息都包含在这些运动之中，人们往往只对运动的

物体或目标感兴趣。因此，研究运动目标的检测问题，有着很大的现实意义和应用价值。 2.2运动目标检测的基本概念目前我们主要是通过对动态图像进行分析处理来获取运动目标信息，从而实现对运动目标的检测，它是图像处理与计算机视觉应用研究领域的一个重要课题。，所谓动态图像是由一序列图像组成的，即图像序列。图像序列是用一个传感器(如摄像机、数码相机)采集的一组随时间变化的图像，不同时刻采集的二帧图像或多帧图像中包含了存在于相机与景物之间的相对运动信息。还有景物本身发生变化的运动信息等等，这些信息表现为图像帧之间的灰度变化或诸如点、线、区域等记号的位置和运动方向速度等属性的变化。运动目标检测的目的就是从序列图像中将变化区域从背景图像中提取出来。我们首先用摄像机获取运动目标的视频影像，经视频采集卡将视频信号传输到计算机，利用计算机对其进行相关处理，从视频图像中按一定时间间隔获取序列图像，然后通过对这些序列图像进行特定的处理，就可以检测出我们感兴趣的运动目标。运动目标检测和分析是一种基于视频监控系统的运动目标检测方法。这种算法主要包括：图像预处理、运动目标的检测、运动速度的求取。这种算法在帧差法的基础之上，提取出运动目标，并对其求取运动速度。这种技术可以用于各类图像监控系统，用来检测运动目标，对于现实应用有重要意义。 2.3运动目标检测的基本方法由运动目标所形成的图像序列可分为两种情况：一种是静止背景，一种是运动背景。前一种情况通常发生在摄像机相对静止状态(如监视某一路口车流量的固定摄像机)，后一种情况通常发生在摄像机也在相对运动状态(如装在卫星或飞机上的监视系统)。从处理方法上看，对前一种情况可采用消除背景的方法检测运动目标，处理起来比较简单，如简单的帧间差分或自适应背景对消方法。对后一种情况．处理起来比较复杂，一般是采用突出目标或消除背景的思想检测运动目标。若采用消除背景的方法，则通常需要先进行帧间稳像及配准；若采用突出

视频图像中运动目标检测

毕业论文题目视频图像中运动目标检测方法研究专业电气工程及其自动化班级电气1003 学生曹文学号20113024543 指导教师赵哥君二〇一二年六月八日

摘要在很多现代化领域，运动目标检测都显示出了其重要的作用。尤其是近二十年的社会经济的飞速发展，运动目标检测都彰显了其重要性，在航空、通信、航海等各个方面都有关键性的作用，从而使运动目标检测方法的研究成为各国的研究热门课题。通过阅读大量的相关论文、期刊及其网络资源，了解了高斯背景建模及背景更新的基本原理及思想。在本文中，首先介绍了运动目标检测方法的相关基础知识，如图像的二值化、图像的形态学处理、颜色空间模型。然后重点说明了三种常用的运动目标检测方法的研究，简要阐述了三种研究方法的基本思想。在老师的帮助下进行了相应的实验，最终得出了三种运动目标检测方法的优点和缺点，着重探究了高斯背景建模及其背景更新基本原理及思想。最后，通过相关的程序及软件对混合高斯背景模型进行了相关的实验，进而发现了混合高斯背景建模算法存在的不足之处，如：高斯背景建模的计算量大、运动目标较大时检测效果差等问题，并对对这些问题提出了相关设想及改进。关键词：运动目标检测；二值化；图像的形态学处理；高斯背景建模；背景更新 I

ABSTRACT In many modern fields, moving target detection are showing its important role. Especially nearly twenty years of rapid development of social economy, the moving target detection has shown its importance, in various aviation, communication, navigation and so on have a key role, so the study of moving target detection method has become a research hot topic in countries. By reading relevant papers, a large number of journals and cyber source, understand the basic principle and thought of Gauss background modeling and updating the background. In this paper, firstly introduces the basic knowledge of moving target detection method, such as the two values image, morphological image processing, color space model. Then focus on the study of three methods used for moving object detection, a brief description of the basic ideas of the three kinds of research methods. By the experiment, the results of three kinds of method of moving target detection has advantages and disadvantages, this paper emphatically explores Gauss background modeling and background updating basic principle and thought. Finally, through the program and software related to mixed Gauss background model for the relevant experiments, and found the shortcomings, the presence of mixed Gauss background modeling algorithm such as: the problem of computing Gauss background modeling, moving target volume larger detection effect is poor, and on these problems put forward relevant ideas and improvement. Keywords: moving object detection; two values; I I

基础目标检测算法介绍

基础目标检测算法介绍：CNN、RCNN、Fast RCNN和Faster RCNN 解决目标检测任务的简单方法（利用深度学习）一、CNN 首先我们要说的就是在图像目标检测中用途最广、最简单的深度学习方法——卷积神经网络（CNN）。我要讲的是CNN的内部工作原理，首先让我们看看下面这张图片。向网络中输入一张图片，接着将它传递到多个卷积和池化层中。最后输出目标所属的类别。 1图片的输入 2、将图片分成多个区域 3.将每个区域看作单独的图片。 4.把这些区域照片传递给CNN，将它们分到不同类别中。 5.当我们把每个区域都分到对应的类别后，再把它们结合在一起，完成对原始图像的目标检测

使用这一方法的问题在于，图片中的物体可能有不同的长宽比和空间位置。例如，在有些情况下，目标物体可能占据了图片的大部分，或者非常小。目标物体的形状也可能不同。有了这些考虑因素，我们就需要分割很多个区域，需要大量计算力。所以为了解决这一问题，减少区域的分割，我们可以使用基于区域的CNN，它可以进行区域选择。 2. 基于区域的卷积神经网络介绍 2.1 RCNN简介和在大量区域上工作不同，RCNN算法提出在图像中创建多个边界框，检查这些边框中是否含有目标物体。RCNN使用选择性搜索来从一张图片中提取这些边框。首先，让我们明确什么是选择性搜索，以及它是如何辨别不同区域的。组成目标物体通常有四个要素：变化尺度、颜色、结构（材质）、所占面积。选择性搜索会确定物体在图片中的这些特征，然后基于这些特征突出不同区域。下面是选择搜索的一个简单案例：首先将一张图片作为输入：之后，它会生成最初的sub-分割，将图片分成多个区域：