一种视频对象分割技术的研究与实现
视频分割和运动目标提取方法研究的开题报告

视频分割和运动目标提取方法研究的开题报告【开题报告】一、研究背景随着计算机技术和数字图像处理技术的不断发展,对视频处理的要求逐渐提高。
视频处理领域的一些重要研究任务包括视频分割和运动目标提取。
视频分割是将一段视频切分为不同的场景,而运动目标提取是从视频中提取出具有运动特征的目标。
这两个任务是很多视频处理应用的基础,如视频压缩、视频监控等。
目前,视频分割和运动目标提取方法已经有了很多研究成果,其中包括了传统的基于特征的方法,如基于背景分离法和基于像素的帧差法。
但是这些传统算法的效果受到复杂背景、光照变化等因素的影响,效果有限。
现在,深度学习技术在视频处理领域得到了广泛的应用,如前景检测、物体跟踪等。
二、研究目的和意义本研究的主要目的是结合深度学习方法,提出一种更加准确、鲁棒的视频分割和运动目标提取方法,以提高现有算法的效果。
具体地说,本研究将运用卷积神经网络(CNN)对视频进行特征提取,利用循环神经网络(RNN)学习上下文关系,最终实现视频分割和运动目标提取。
本研究的意义在于:1. 对于视频处理领域,创新地结合卷积神经网络(CNN)和循环神经网络(RNN)等技术,提高视频分割和运动目标提取的效果。
2. 深入研究视频分割和运动目标提取的方法和实现机制,为进一步提高视频处理算法和技术打下基础。
3. 探索在视频处理领域中深度学习技术的应用,为深度学习发展提供新的研究方向和思路。
三、研究方法和步骤1. 数据集采集:采集适合本研究的大规模视频数据集。
2. 特征提取:结合卷积神经网络(CNN)对视频进行特征提取。
3. 上下文关系学习:利用循环神经网络(RNN)学习视频序列之间的时间依赖关系。
4. 视频分割和运动目标提取:利用上述算法对视频进行分割和提取运动目标,最终得到运动物体的位置和特征。
5. 实验验证和性能分析:对比实现的算法与传统方法进行性能测试和分析。
四、预期成果1. 提出基于深度学习的视频分割和运动目标提取方法,实现对运动物体的准确提取。
一种自动分割视频对象的新方法

关键 词 : 频对 象 ; 视 变化检 测 ;差 分边 缘 ;二值 边缘模板 中图分类号 :T 3 14 P 9. 1 文 献标识 码 : A 文章 编号 :09— 56 20 ) 3— 0 1 0 10 3 1 (0 6 O 0 6 — 4
且适用性广的方法L , 4 缺点是易受到噪声的干扰并且由于缺少空间边缘信息而使得对象边缘不准确。 J
本文提出一种利用边缘信息分割视频对象的新 方法。首先对相邻帧进行差分检测和边缘检测。其次通
过差分边缘、 当前帧边缘检测出视频对象的初始边缘模板, 并分为快变和慢变两部分进行跟踪和更新以适应
自 动视频对象的分割方法大致可分为光流法、 运动跟踪法和帧间差运动检测法… 。光流法 受到光流
可靠性的影响 , 对噪声极为敏感 , 计算复杂。运动跟踪法 的思想是根据视频对象 的先前状 态来估计它的
当前状 态 , 征的选 取决 定其 准确性 和有效 性 。利用 帧间差 特征 的运动检 测 时空 法是一 种 简单 、 特 直接 、 快速 、
原始视频数据通常都包含很多与视频内容无关的噪声 , 有的还存在摄像机运动而造成 的全局运动。因 此, 为了提高视频对象分割的效率和准确性 , 首先对视频序列进行去噪和背景的运动估计 和补偿。本文用 中 值滤波器进行去噪, 因为中值滤波器可以保护图像边缘并且可以有效的去除噪声 。
对于背景存在全局运动的序列 , 采用 6 参数的仿射变换模型补偿进行 。变换公式如下式所示。
视频对象分割技术综述

视 频 对 象 分 割 技 术研 究现 状
早在 2 世纪 8 年代末 9 年代初 , o o o 视频对象分 MP G- E 4中, 用 的就是 基 于对象 的编 码 方式 , 仅 割 就 引 起 了许 多 学 者 的 兴 趣 [ 。近 年 来 , 着 采 不 】 q] 随 提高 了压缩效 率 , 且 提 供 了更 加 灵 活 的 视 频 操 作 MP G 4和 MP G 7的推 广 和应 用 。 而 E - E - 视频 对 象 分割 方 式 。而新制 定 的多 媒 体 描 述 国际 标 准 MP G-, 算法 已经成 为多媒体领 域的热点研究课题[ 。在 E 7 | ] 本身就要求支持基于对象方式的内容组织与检索。 然而 , 由于视 频 对 象 分 割 是 一 个 相 当 困难 的 问
QI AN a ZHANG a -a XI Jn _ o Yu n, Xio y n, A g b i
( TheTeeo lcmm u iainEn ie rn n tt t Ai Fo c g n e ig Unv r i , ' 1 0 7 C ia nc t g n eig I si e, r reEn ie rn ie st Xin 7 0 7 , hn ) o u y a
Ab ta t Wi ed vlp n n p l ai fnen t nl tn ad E - dMP G 7 vdooj t src : t t e e me t da pi t no trai a sa drsMP G 4a E - ,i be hh o a c o i o n e c
vdoo jc sg nai eh i e o o r t n da cdv e bet e e tt nag r h r n ie bet emett ntc nq .S mei o u mp t da v ne i oojc g nai l i msae — n a a d sm o ot 8
面向对象的高分影像最优分割尺度方法的研究与应用

9 4・
科 技 论 坛
1 5 2 5之间的影像 对象大小 有利 于提取建 筑物和道路信息 ; 当分割 通过 实验得知 ,均值 方差法 和最大面积 法通过一 定 的结 合使 尺度 6 O左 右时 , 影像 对象适合提取农 田 、 草地等信 息 ; 当分割尺度 用 , 可以获得 比较合理的最优分割尺度 。 具体表现为均值方差法 , 可 为1 0 0 左右 时, 影像对象对森林信息提取效果 明显 。 以同时 获得 多个地物类别 的最 优分割尺度并为 我们生产 和研 究提 由图 3可知该建筑物 为客车站 , 根据 均值方差法 , 当分割尺度 供 了一定的方法 , 并节约 了分析的时间成本 。 最大面积法简单直观 , 为 1 0、 3 0时对于指定地物呈现过分割现象 , 不利于地物信息精确提 在一定条件下 ,最大 面积法可 以为均值方差法提供必要 的补充 , 有 取, 且易导致工作量加大或 出现错分现象 ; 分害 0 尺度为 2 0左右 时可 利于我们获得 比较丰富的影像对象分割层 , 建立层次结构促进后续 以获得 比较理想 的分割效果。 信息提取的准确性 。但是上述方法也有其局 限性 , 目前针对面 向对 由均值方差法 知 , 森林 的最优分 割尺度为 1 0 0左右 ; 而最大 面 象 的最优尺度选 择大多基 于通过人工 目视不 断试验进行 , 很多方法 积法得知森林 的最佳分割尺度 由为 8 O ~ 1 4 0 , 通过 图 4对 比知 , 分割 都在尝试 中, 希望可 以为广大学者提供借鉴 。 尺度为 8 0时可 以将小块树林提取 出来 ;尺度为 1 0 0 、 1 2 0时提取整 参考文献 体提取效果都较好。 即最大面积法可以为面向对象 的最优分割尺度 [ 1 ] 王润生. 图像 理解[ M1 . 北京: 国防科技 大学出版社, 1 9 9 5 . 选择 中提供必要的补充 。 [ 2 ] 章毓 晋. 图像 工程 图像 分析[ M 】 . 北京: 清华 大学出版社 , 2 0 0 6 . 4 . 2分割效果相关指标评价 [ 3 ] 黄 惠萍. 面向对 象影像 分析 中的尺度 问题研 究【 D 】 . 北 京: 中国科 学 本 文应用平 均分 割指数 A S E P1 为获 取影像最佳分 割尺度 的评 院 遥 感应 用研 究所 , 2 0 0 3 : 3 5 — 6 6 . 价指标 , 当平均分割指数最大值 时 , 对应 的分割 尺度为最优分 割尺 [ 4 】 陈春 雷, 武刚. 面向对 象的遥 感影像最优 分割尺度评 价m 遥 感技
一种基于灰度连续区域分割的视频对象分割方法

Ke r s M PEG一 ywo d 4,vdo o jc e me tt n,ge —o sc t ergo ,dfee c a e ie betsg nai o ryc ne ui e in i rn ei g . v f m
tn t d ewhc iesa emo ig px l.Fial h s vn e in r e me td fo t esain r e in c e oj g ih px l r vn —ies u nl y,t oemo ig rgo saesg n e rm h tt ay rgc sa — o cr igt eti ue odn oac ran r l.Th x ei n a rs l h w h tt eag r h i fet ei h e me t g mo ig o jcs ee p r me tl eut s o t a h lo i m sefci n t esg n i vn bet s t v n
陈韩锋 戚飞虎
( 海 交 通 大 学 ,计 算 机 科 学 与 丁 程 系 , 海 ,0 0 0 上 上 203 )
摘 要 针 对 目前 许 多分 割 方 法 e 分 割 边 界 不精 确 、 算 复 杂 和 缓 存 帧 多 等 问 题 , 出 了 一 种 结 合 空 间 区 域 分 割 和 e 计 提 运 动 象 素 检 测 的 自动 分 割 方 法 : 将 当前 视 频 帧 分 割 为 不 同 的 灰度 连 续 区域 , 利 用 二 次 帧 差 确 定 视 频 图像 e 先 再 e的 运 动 象 素 , 后 按 一 定 的 规 则 确 定 哪 些 灰 度 连 续 区域 属 于 运 动 区域 , 而 有 效 地 从 静 止 的 复 杂 背 景 e 割 出运 动 然 从 e分 对 象 区域 . 实验 结 果 表 明这 种 分 割 方 法 计 算 简 单 、 割边 界 比较 精 确 . 分 关 键 词 MP G一 , 频 对 象 分 割 , 度 连 续 区域 , 差 图 . E 4视 灰 帧
视频分割算法的研究

Abtat Vd os met inia ii lpolm ie rcsn ,ts o tn— ae tea ojc rcg io s c: ie g nao d c t rbe i v opo e ig iicnet bsdr r vl beteont n r e t s f u n d s e i , i a ditrc o lmei hsi ot t p l a o s S h td nvdo ojc sg na o eh iu s a n eat n mut da a mp r n pi t n. otes yo ie bet eme tt ntcnq e h s n i i a a ci u i
i mpora i ni c n e a ppi a on vaue n t st ss W O d fe e l ort tntsg f a c nd a lc t l .I hi hei,t i r ntag ihm de e m e a on,i l i g i i ofvi o s g ntt i ncud n
ag it a e f lu e o m ea d pa e i or ai n.To ob i a sa t r e e a on. l or hm m k ul s ft n s c nf m to i t n as t fc o y s g ntt a i m i The m o on una m ou l t i ni sy
m oto o evi o s g e t to i n ft de e h m n i n. a K e w or :v d o s g e a on; m po a—s ailm oto y ds i e e m ntt i t e r l—p ta; i n una m ous ni l y
一种基于交替凸优化的视频对象分割算法

一种基于交替凸优化的视频对象分割算法孙婷【摘要】There are some deficiencies while using existing schemes, such as limited application scenes and over segmentation of motion background.An unsupervised video object segmentation algorithm is proposed, which can automatically detect important objects from video sequences.Markov energy, time and space energy, as well as antagonism energy are introduced from the view of the foreground and background probability distribution.Then, the problem of detecting important objects from the background is modeled as a non convex optimization problem based on the mixed energy minimization, and a method based on Alternation Convex Optimization (ACO) is proposed to decompose the problem into two kinds of two quadratic programming problems.In order to make full use of time-domain correlation to improve the reliability of object segmentation, a forward-backward deliver strategy is also adopted.A comprehensive simulation is carried out based on a variety of video datasets.Experimental results show that the performance of the algorithm in this paper is significantly better than the other latest video object segmentation algorithms.%现有视频对象分割方案多数存在应用场景受限、运动背景过分割等问题, 为此, 提出一种可从视频序列中自动检测重要对象的无监督视频对象分割算法.从前景和背景概率分布的角度引入马尔可夫能量、时空能量和对抗能量.将视频对象分割问题建模为基于3种混合能量最小化的非凸优化问题, 利用基于交替凸优化的方法将其分解为2个二次规划问题.采用前向-反向传递策略, 以充分利用时域相关性从而提高对象分割的可靠性.结合多种视频数据集进行仿真, 结果表明, 与其他最新的视频对象分割算法相比, 该算法的分割性能有明显提高.【期刊名称】《计算机工程》【年(卷),期】2019(045)003【总页数】8页(P242-249)【关键词】视频对象分割;无监督算法;能量最小化;交替凸优化;二次规划问题;前向-反向策略【作者】孙婷【作者单位】西安工业大学艺术与传媒学院,西安 710032【正文语种】中文【中图分类】TP391.410 概述视频对象分割[1]从视频序列的背景中提取重要对象,它是动作识别、视频检索、对象替换和视频融合等多种计算机视觉技术的基础。
视频对象分割技术研究

Ke o d v e betv e e e tt n t oa sg nain sai —e o rlsg ett n y w r s i oojc; i osg nai ;e rl eme t o ;p t tmp a e n i d d m o mp t l a m ao
ZHANG . i一 , IZ a 0 L u - a L a — n Ya d L h o IJ ns n , IJ nJ 4 h i u
,
( . h eod Atly E gnei ol e, ’ nS a x 10 5 C ia; 1 T eScn rlr n ier g C lg a h ni7 0 2 , hn i e n e 2 TeScn r lr Ⅱp . h eodA ie tl y i, 船眦 A a e cdmy, ei 00 5 C ia; B in 10 8 , hn j g 3 TeScn rt la er etteO ̄ ei h izu n S i zu n bi00 8 , hn ; . h o A tl Mitr Rpe nai jt S iah a g, h i h a gHee 50 1 C i e d i ̄y iy s v c n j j a a
T3 1 P 9 文献 标 识 码 A 文 章编 号 10 —3 0 (0 8 1 —0 1 —0 0 3 16 2 0 )0 0 4 3 中 图 分类 号
Reerh o ie jc eetS g nai eh iu o
摘 要 视 频 对 象 分 割 是 新 一 代 视 频 编 码 、 视 频 检 索 、互 联 网 多 媒 体 交 互 等 新 兴 领 域 的 关 键 技 术 。 介 绍 了 视 频
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当 != 3 时, 上式等于 0 16% 。同时根据高斯 分布的 3 特性 , 判决门限取为 3 倍方差。本文需要 提取的运动区域为 : Rm = ( x , y ) dk ( x , y ) ∀ ! ( 8) 2. 3 运动区域生长 本文提出一种在序列图像差分域中进行区域生 长的算法。该方法基于 Bayes 统计模式识别 , 以最 大后验概率( MAP) 为区域生长准则。该算法克服了 传统的时域生长算法只利用图像灰度信息的缺点。 对于复杂图像 , 如区域间边缘灰度变化平缓的图像, 可以得到较好的分割效果。 在差分域中图像分割处理问题可以归结为一个 二值标记 问题。对二维差分 图像中每一个像 素点 d k ( x , y ) 在 t 时刻赋予一个标记量 f 。如果该点属 于运动目标区域则 f = 1, 否则 f = 0。但在图像的标 记问题中 , 不可避免的要加入上下文限制。图像中 各个点不是相互独立的 , 相邻的点会相互影响。在 标记时可以将这种上下文限制作为先验知识, 用马 尔可夫随机场 ( MRF) 进行描述。根据 Bayes 定理: P ( F| D ) = 其中 D = P ( D | F) P( F ) P ( D) ( 9)
Abstract: In this paper a technology of video object segmentation is presented. First ly, the current frame is compen sated after globe moving estimation, and the difference operation is made between the current frame that has been com pensated and the prior frame; then the moving region is obtained from the difference image based on Neyman- Pearson criteria, and in the difference image a new region growing algorithm which overcome the default of the tradit ional algo rithm of region growing in the time- domain is used to obtain the binary segmentation model of video object; finally, based on the moving detection algorithm the labeled blocks that are resulted from noise are eliminated. The experiment result shows that the technology can segment the video object efficiently. Keywords: video objects; globe moving estimation; Neyman- Pearson criteria; region growing; MRF model
第一类错误概率 P 1 ( D 1 | H 0 ) =
( D 1 为差分域中判
决为视频对象的像素集合) 的条件下, 使检测概率 P ( D 1 | H 1 ) 达到极大。定义判决门限为 !。当 dk ( x , y ) ! ! 时 , 判决 H 1 为真, 反之判决 H 0 为真。门限 ! 的选择应满足虚警概率的约束条件, 即 : P 1 ( dk ( x , y ) | H 0 ) = ( 1) - d k( x, y ) 2
本文于 2003 年 12 月收到。王东升 : 博士 ; 李在铭 : 教授。
44
电 子 测 量 与 仪 器 学 报
2005 年
在数学上 , Neyman- Pearson 准 则可表示为: 在 给定
2
2. 1
视频对象分割的关键技术
全局运动估计与背景补偿校正 在运动背景下, 图像坐标中各像素点的运动速
c% C [ 5,6]
:
由于很难确定视频对象的先验分布, 我们采用 不包括先验概率的 Neyman- Pearson 准则进行检测。
1 e Z
U( F )
( 10)
Vc ( F ) 为 能 量 函 数, Z =
第4 期 e
- U( F )
一种视频对象分割技术的研究与实现 是归一化常数 , Vc ( F ) 是基团 c 的势函数。
MPEG- 4 已经成为新一代 的视频图像编码国 际标准。它可以根据图像内容的不同, 将图像分割 为不同的区 域, 形成不 同的视 频对象 平面 ( VOP) 。 然后根据不同的视频对象特征采 取不同的编码技 术。这样可以在保证视觉质量的同时, 提高编码效 率。而且允许用户对多媒体数据进行基于内容的操 作。因此研究 视频对象的分割技 术具有重要的意 义。视频对象分割的原理就是利用运动信息把运动 对象从背景中分离出来。通常的运动检测算法有基 于相邻帧差分的算法和基于背景图像和当前帧差分
45
F
计可以等效为求系统能量函数的最小值。我们提出 如下区域生长算法 : 首先取门限 != 3 对差分图像 进行初始分割 , 得到初始标记场; 然后在初始标记场 中对每一个标记为 f s = 1 的点考察其邻点集 L s 。若 f t = 0( t % L s ) , 则分别用 0、 1 两个标记进行测试, 使 系统能量函数小的标记得到保留。如此迭代进行, 直 到目标区域不在生长。采用形态学滤波方法对得到 的标记场进行修正, 填充空洞和去处毛刺。由于在初 始标记场中不可避免的还有噪声点存在, 导致在标记 场中存在由噪声点得到的标记块。我们采用块匹配 的方法进行运动检测 , 只保留运动变化的标记块。
相邻两帧进行差分检测。然后利用 Neyman- Pearson 准则从差分图像中提取 运动区域 , 根据提 取的运动 区域研 究了一 种在序 列图像差分域中进行区域生长的算法 , 获得了 视频对象的二 值化分割 模板。最 后利用 运动检测 算法剔 除由于 噪声导 致的标 记块。实验结果表明 , 本文所述方法能够有效的分割出 视频对象。 关键词 : 视频对象 ; 全局运动估计 ; Neyman- Pearson 准则 ; 区域生长 ; 马尔可夫随机场
[ ( x - x) + ( y - y) ] ( x, y )
2
~
2
~
2
( 2)
将( 1) 式带入 ( 2) 式得到 : [ ( x - a - bx - cy ) + ( y - d - ex ( x, y ) ( 3)
我们在第 k 帧中选择若干特征点由 ( 3) 式利用 T 最小二乘法估计全局运动参数 P = [ a b c d e f] 。 得到全局运动参数后 , 利用( 1) 式计算图像中各点的 位移 , 对图像进行双线性内插背景补偿校正变换。 2. 2 运动区域提取 经过背景补偿校正后的视频图像, 相邻两帧进行 差分运算。设 I ( x , y , k ) 表示一个视频序列的灰度值。 I ( x , y , k ) = b ( x , y ) + mk ( x , y ) + n k ( x , y ) ( 4) 其中: b ( x , y ) 为背景区域, m k ( x , y ) 、 nk ( x , y ) 为第 k 帧中的运动 目标和噪声。本文假设噪声是 2 均值为零、 方差为 的高斯 噪声。将相邻两帧相 减, 得到邻帧差分图像: dk ( x , y ) = m ( x , y ) + n( x , y ) ( 5) 式中 m ( x , y ) = m k + 1 ( x , y ) - m k ( x , y ) 表示由 于目标运动所引起的灰度变化, 其包含了运动目标的 信息。n ( x , y ) = nk + 1 ( x , y ) - n k ( x , y ) 为相邻两帧的 噪声差。为了提取视频对象可对差分图像进行划分, 检测出运动区域。在统计学上, 这相当于判决以下两 个假设 H 0 和 H 1 之一为真的二元假设检验问题。 H 0!dk ( x , y ) = n ( x , y ) H 1!dk ( x , y ) = m( x , y ) + n ( x , y ) ( 6)
的算法
[ 1- 3]
。
1
引 言
本文提出一种视频对象分割技术。该方法首先 利用块匹配算法对当前帧进行全局运动估计和补偿 校正 , 并将校正后的当前帧与前一帧进行差分检测。 然后利用 Neyman- Pearson 准则在差分图像上进行 初始分割提取出运动区域。根据提取的运动区域研 究了一种在差分域中进行区域生长的算法, 获得了 视频对象的二值化分割模板。该区域生长算法克服 了传统的时域生长算 法只利用图像灰度信息 的缺 点。由于噪声的影响 , 分割模板中可能混有由于噪 声引起的标记块。最后利用运动检测算法剔除由于 噪声导致的标记块。实验结果表明 , 本文所述方法 能够有效的分割出视频对象 , 具有较好的鲁棒性。
d 1 , d 2 , ∃, ds 为 序列 图像 的差 分
域, F = f 1 , f 2 , ∃, f s ( s % D ) 为分割标记场 , P ( F | D ) 为分割标记场的后验概率 , P ( D | F ) 为给定分 割标记场时的条件概率函数 , P ( F ) 为 先验概率函 数, P ( D ) 为一个未知常数。 先验概率函数 P ( F ) 对分割进行空间连通性约束, 可以用马尔可夫随机场(MRF) 模型进行描述。根据马尔 可夫随机场(MRF) 与吉布斯随机场分布的等价性 P( F ) = 其中: U ( F ) =
第 19 卷
第4期
2005 年 8 月
电子测量与仪器学报 JOURNAL OF ELECTRONIC MEASUREMENT AND INSTRUMENT