基于聚类的视频镜头分割和关键帧提取
基于深度学习的视频内容分析与关键帧提取

基于深度学习的视频内容分析与关键帧提取视频内容分析是指通过运用深度学习技术对视频进行分析和理解,从而提取出视频中的关键帧。
深度学习是一种机器学习方法,通过构建多层神经网络模型来模拟人类大脑处理信息的方式。
它可以自动学习和提取特征,以实现对复杂任务的解决。
在视频内容分析中,关键帧提取是一个重要的步骤。
关键帧是指在视频中具有重要信息或变化的帧画面,可以代表视频内容的特征。
通过提取关键帧,可以有效地压缩视频数据,并减少对存储和传输资源的需求。
此外,关键帧提取还在视频搜索、视频摘要和视频内容分析等领域具有广泛的应用。
深度学习在视频内容分析中发挥了重要作用。
首先,深度学习可以通过训练模型来学习和提取视频中的特征,包括颜色、纹理、形状等。
通过大量的视频数据和深度神经网络的训练,可以得到更准确和鲁棒的特征表示。
其次,深度学习可以建立复杂的模型来理解视频的语义信息。
通过深度卷积神经网络和循环神经网络的结合,可以对视频进行时间和空间上的建模,进一步提高关键帧提取的准确性和效果。
在深度学习方法中,常用的模型包括卷积神经网络(CNN)和循环神经网络(RNN)。
卷积神经网络主要用于提取视频帧的空间特征,通过多层卷积层和池化层,可以逐渐减少特征图的尺寸,并提取出有代表性的特征。
而循环神经网络则主要用于处理序列数据,如视频帧的时间顺序。
通过循环隐藏层的记忆性,RNN可以捕捉视频中的时间相关性,从而更好地理解视频的语义信息。
在基于深度学习的视频内容分析中,通常的步骤包括数据预处理、特征提取和关键帧提取。
首先,需要对视频数据进行预处理,例如解码、采样和标准化。
然后,通过卷积神经网络提取视频帧的空间特征,同时利用循环神经网络建立视频帧之间的时间关系。
最后,通过设计适当的评估指标,可以筛选出关键帧,并得到最终的结果。
当前,基于深度学习的视频内容分析与关键帧提取已经取得了许多重要进展。
例如,通过引入注意力机制和生成对抗网络,可以进一步提高关键帧提取的效果。
基于聚类方法改进的关键帧提取算法

2017年7月计算机工程与设计 Ju ly 2017第 38 卷第7 期 COMPUTER ENGINEERING AND DESIGN Vol. 38 No. 7基于聚类方法改进的关键帧提取算法白慧茶,吕进来+(太原理工大学计算机科学与技术学院,山西太原030024)摘要:为准确提取代表视频镜头主要内容的关键帧,减少对视频操作的数据处理量,结合关键帧提取过程中需要人为预先设定阈值以及存在冗余等情况,提出一种基于聚类方法改进的关键帧提取算法。
使用层次聚类方法获得初始聚类结果,利用人工免疫聚类方法对聚类结果进行优化,提取相应数量的关键帧。
实验分析结果表明,该算法在聚类过程中得到了更稳定的聚类结果,提取出的关键帧具有很好的代表性,有效降低了冗余度。
关键词:关键帧提取;层次聚类;人工免疫聚类;聚类结果;冗余度中图法分类号:TP37 文献标识号:A 文章编号:1000-7024 (2017) 07-1929-05doi:10. 16208/j. issnl000-7024. 2017. 07. 041Improved algorithm of key frame extraction based on clustering methodsBAI Hui-ru,LYU Jin-lai+(College of Computer Science and Technology, Taiyuan University of Technology, Taiyuan 030024,China) Abstract:Combining with the presetting artificially of threshold and the presence of redundancy and etc. in the process of key frame extraction,an improved algorithm of key frame extraction based on clustering methods was proposed, to accurately extract key frames that can represent the main content of video shot and reduce the data processing capacity of video operation. The hierarchical clustering method was used to obtain initial clustering results. These results were optimized using the artificial immune clustering method. Corresponding number key frames were extracted Experimental analysis results show that the algorithm can not only get more stable clustering results in the clustering process, but also extract key frames with better representation ,effectively reducing the redundancy.Key words:key frame extraction;hierarchical clustering;artificial immune clustering;clustering result;redundancy〇引言由于视频的数据规模大,结构复杂,导致直接获取视 频信息比较困难,为减少对视频的操作量,达到对视频数 据压缩的效果,需要提取视频序列中最能准确反映并体现 一个镜头甚至整个视频具体内容的关键帧,因此关键帧提 取引起了大量关注,只有对它进行精确地选取,才能为视 频的索引、检索和浏览奠定优良的基础[1’2]。
基于视频聚类的关键帧提取算法

基于视频聚类的关键帧提取算法作者:刘华咏郝会芬李涛来源:《物联网技术》2014年第08期摘要:关键帧可以有效减少视频索引的数据量,是分析和检索视频的关键。
在提取关键帧过程中,为了解决传统聚类算法对初始参数敏感的问题,提出了一种改进的基于视频聚类的关键帧提取算法。
首先,提取视频帧的特征,依据帧间相似度,对视频帧进行层次聚类,并得到初始聚类结果;接着使用K-means 算法对初始聚类结果进行优化,最后提取聚类的中心作为视频的关键帧。
实验结果表明该方法可以大幅提高关键帧的准确率和查全率,能较好地表达视频的主要内容。
关键词:关键帧;特征提取;层次聚类;K-means 算法中图分类号:TP391.4 文献标识码:A 文章编号:2095-1302(2014)08-0059-030 引言随着互联网和多媒体技术的飞速发展,形象生动的数字视频已经逐渐取代单调的文本信息,成为了人们网络生活中传播信息的重要方式之一。
面对互联网上大量的视频,能否在较短的时间内找到需要的视频片段,已经成为了人们越来越关注的问题。
在视频帧序列中,包含视频重要内容的帧可以简单有效地概括视频的主要内容,称为视频的关键帧。
关键帧的提取技术在基于内容的视频检索中有着举足轻重的地位。
在实际应用中,关键帧的提取技术可以分为以下4大类:(1)基于运动分析的关键帧提取技术。
运动分析一般是基于流光运算的,通过分析和计算光流得出视频序列的运动量。
然后比较运动量的值,并选取局部最小值处的帧为关键帧。
这种方法提取关键帧的最大优点是:针对不同结构的镜头,可以根据实际情况提取数量合适的关键帧。
但这种方法计算复杂,时间开销大,而且由局部最小值得到的关键帧不一定能准确描述视频内容。
(2)基于镜头边界的关键帧提取技术[2-3]。
这种方法首先将视频分割成若干个镜头,然后在每个镜头内部分别提取第一帧、中间帧和最后一帧作为关键帧。
这种方法容易设计,计算简单,适合视频内容简单或场景固定的情况,但当镜头变换频繁且变换方式多样时,有可能导致提取的关键帧不能准确地描述视频的内容。
概述基于内容的视频检索的镜头分割技术

概述基于内容的视频检索的镜头分割技术随着经济社会的快速发展和科学技术的飞速进步,视频等多媒体格式的信息量越来越大,来源也更为广泛。
视觉成为人类接受外界信息的重要来源,其中,图像视频信息是视觉信息的主要表达方式,它所包含的信息量也是海量的,远远超过了文本、图片等数据格式。
图像视频在具体、生动、确切、高效等方面有许多优点,由于这些特点就使得人类最重要的通信方式主要为基于视频信息的通信方式和以视频格式传输或携带的信息通信方式。
这种视频信息方式更形象、更生动、更直观,更能够贴近或者还原于实际。
计算机传统上存储数据的方式是基于文本的。
视频数据信息已成为我们日常生活中不可或缺的重要内容,但由于它携带的信息量较大,也成为阻碍其发展的瓶颈,如何提高视频资源的检准率、检全率,其现实意义将非常重大,视频检索的第一步就是镜头。
1 镜头分割在基于内容的视频检索中作用为构建视频资源数据库,首先应对保存的视频文件进行结构化处理。
视频内容有四个层次,按从高到低的结构顺序,依次为视频序列、场景、镜头、帧。
帧是指在数据和数字通信中,按某一标准预先确定的若干比特或字段组成的特定的信息结构。
镜头是构成视觉语言的基本单位。
它是叙事和表意的基础。
在影视作品的前期拍摄中,镜头是指摄像机从启动到静止这期间不间断摄取的一段画面的总和;在后期编辑时,镜头是两个剪辑点间的一组画面;在完成片中,一个镜头是指从前一个光学转换到后一个光学转换之间的完整片段。
场景是指电影、戏剧作品中的各种场面,由人物活动和背景等构成。
连续的图像变化每秒超过24帧(frame)画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面;看上去是平滑连续的视觉效果,这种连续的画面叫做视频。
视频序列由数个视频场景组成,通常指单独的某个视频文件或者视频片段。
场景通常由一个或者多个镜头构成。
镜头由多个连续的图像帧构成。
图像帧指单幅静态的图像,是构成视频文件的最小单位。
在播放视频时,定格时的每一个画面就是一个图像帧。
基于深度学习的视频摘要与关键帧提取算法研究

基于深度学习的视频摘要与关键帧提取算法研究摘要:随着互联网的迅猛发展,视频数据成为人们获取信息和娱乐的重要来源。
然而,随着视频数量的不断增加,人们需要更快速和有效地处理和浏览这些视频内容。
视频摘要和关键帧提取作为视频内容分析和检索的重要技术,能够提供视频的概要信息和代表性帧,帮助用户快速了解和检索视频内容。
本文将基于深度学习的视频摘要与关键帧提取算法进行详细研究和探讨。
首先,我们将介绍视频摘要与关键帧提取的概念和应用领域。
然后,将介绍传统的视频摘要和关键帧提取算法以及其存在的问题和局限性。
接着,我们将详细介绍基于深度学习的视频摘要与关键帧提取算法的原理和方法,并分析其优势和挑战。
最后,将针对该算法进行实验验证,并对未来研究方向进行展望。
关键词:深度学习、视频摘要、关键帧提取、概要信息、代表性帧1. 引言随着数字技术和互联网的高速发展,用户可以方便地拍摄、共享和传播各种视频内容。
然而,海量的视频数据给人们带来了处理和浏览视频内容的难题。
视频摘要和关键帧提取作为视频内容分析和检索的重要技术,为用户提供了更快速和有效获取视频信息的方法。
2. 视频摘要与关键帧提取的概念和应用领域视频摘要是从视频中提取出包含概要信息的视频片段,用于快速浏览和了解视频内容。
关键帧提取是从视频中选择一些代表性的静态图像帧,用于代表整个视频。
视频摘要和关键帧提取在许多应用领域得到了广泛的应用,如视频检索、视频摘要浏览、视频摘要生成等。
3. 传统的视频摘要和关键帧提取算法传统的视频摘要和关键帧提取算法主要基于图像处理和机器学习技术。
常用的算法包括基于视觉特征的聚类算法、基于机器学习的分类算法和基于视觉显著性的算法。
然而,这些传统算法通常需要手工设计特征,并且在处理复杂的视频场景时效果不佳。
4. 基于深度学习的视频摘要与关键帧提取算法深度学习在计算机视觉领域取得了巨大的突破,为视频摘要和关键帧提取算法的发展提供了新的思路。
基于深度学习的视频摘要与关键帧提取算法能够自动学习视频的高级语义特征,并提供更准确和鲁棒的结果。
基于GEP自动聚类算法的视频关键帧提取方法

基于GEP自动聚类算法的视频关键帧提取方法袁晖;元昌安;覃晓;彭昱忠【摘要】视频关键帧提取技术是视频数据处理研究领域的热点研究问题。
该文针对现有的镜头边界检测技术不能有效提取关键帧的不足,提出一种基于小波边缘检测算子的自适应分块视频镜头边界检测算法。
通过检测视频镜头变化,得到分割的镜头,然后对视频帧提取图像特征,并利用基因表达式编程(GEP)的自动聚类功能对视频帧进行聚类,提出并实现了基于GEP自动聚类的视频关键帧提取算法(KFC‐GEP)。
实验证明该方法能较好的提取视频序列的关键帧。
%The technology of key frame extraction is a research focus in video data processing do‐main .A video shot boundary detection algorithm with adaptive division based on wavelet edge detec‐tion is presented to overcome the drawbacks of the available algorithms for shot detection technology in this paper .First ,we obtain the video shot segmentation by detection of video shot change .Fur‐thermore ,we extract the image feature from video ,which cluster by autoclustering based on Gene Expression Programming ,propose and implement the video key frame extraction using an autocluster‐ing algorithm based on Gene Expression Programming (KFC‐GEP) .The proposed method is demon‐strated efficiently and effectively for extracting the key frame in video experimental results .【期刊名称】《广西师范学院学报(自然科学版)》【年(卷),期】2013(000)001【总页数】4页(P98-101)【关键词】镜头边界检测;小波边缘检测;视频关键帧;KFC-GEP【作者】袁晖;元昌安;覃晓;彭昱忠【作者单位】广西师范学院计算机与信息工程学院,广西南宁 530023;广西师范学院计算机与信息工程学院,广西南宁 530023;广西师范学院计算机与信息工程学院,广西南宁 530023;广西师范学院计算机与信息工程学院,广西南宁530023【正文语种】中文【中图分类】TP3910 引言近些年来,随着网络技术及信息采集技术的发展,视频数据呈指数级增长,与之对应的视频数据处理的需求也急剧增长。
基于机器学习的视频内容分析与关键帧提取研究

基于机器学习的视频内容分析与关键帧提取研究视频内容分析是指通过机器学习算法对视频内容进行分析和理解的研究领域。
关键帧提取是视频内容分析的一个重要任务,旨在从视频中抽取出具有代表性和信息丰富度的关键帧,以便于视频摘要、检索和分析等应用。
本文将从视频内容分析的背景和意义、关键帧提取的方法和应用以及未来研究方向等方面进行阐述。
视频内容分析基于机器学习是因为传统的视频分析方法往往需要手工设计特征和规则,而这些方法在面对复杂的视频场景时效果有限。
机器学习算法通过对大量标注数据的学习和训练,能够从数据中提取出有用的特征和模式,实现对视频内容的自动分析和理解。
机器学习在视频内容分析中的应用包括目标识别与跟踪、行为识别与分析、场景理解等多个方面,可以为视频内容的提取和利用提供丰富的信息。
关键帧提取是视频内容分析中的一个重要任务,关键帧指的是视频序列中具有代表性和信息量较大的帧。
关键帧提取的目标是从视频中选取出一些具有代表性,能够表达视频内容主题或重要信息的关键帧图像。
关键帧提取可以通过以下几种方法实现。
首先,基于图像特征的关键帧提取方法是一种常用的方法。
通过对视频中每一帧图像提取特征并计算特征向量,然后根据特征向量之间的相似度进行关键帧的排序和选择。
常用的图像特征包括颜色直方图、纹理特征、形状特征等。
这种方法简单而直接,但是对于复杂的视频场景效果可能有限。
其次,基于视觉注意力模型的关键帧提取方法是一种通过模拟人类视觉注意机制进行关键帧选取的方法。
这种方法认为人类的视觉系统对于视觉场景中的某些特征更加敏感和关注,可以通过计算图像的视觉显著性来选择关键帧。
视觉显著性可以通过计算图像中不同位置的显著图来实现,然后根据显著图的值进行关键帧的选择。
此外,基于深度学习的关键帧提取方法近年来得到了广泛的关注。
深度学习通过构建深层次的神经网络模型,可以更好地提取图像和视频中的特征和模式,并实现对视频内容的理解和分析。
深度学习方法可以通过对视频序列进行卷积神经网络的训练和学习,实现对视频中关键帧的自动提取和选择。
基于K均值聚类的视频关键帧提取技术研究

收稿日期:2020-07-13基金项目:本项目受北京市大学生科学研究与创业行动计划资助作者简介:张一凡(2000-),男,山西太原人,本科,主要研究方向为数字图像处理;李家辰(2000-),男,河南济源人,本科,主要研究方向为图形图像处理。
基于K 均值聚类的视频关键帧提取技术研究张一凡,李家辰,旷远有,刘盼,赵子元(北方工业大学信息学院,北京100144)摘要:文章提出了一种基于k 均值聚类的视频关键帧提取算法。
该算法在视频的镜头分割算法之上,通过层次聚类对视频内容进行初步划分,之后结合k 均值聚类算法对初步提取的关键帧进行直方图特征对比去掉冗余帧,最终确定视频的关键帧序列。
经过大量的实验数据证明,该算法能够提取出冗余度较低、代表性较强的关键帧,一定程度上为视频关键帧提取提供了有效的方法。
关键词:视频镜头分割;关键帧提取;k 均值聚类中图分类号:TP391文献标识码:AResearch on video Key Frame Extraction Based on K-means ClusteringZHANG Yi-fan,LI Jia-chen,KUANG Yuan-you,LIU Pan,ZHAO Zi-yuan(School of Information Science and Technology 袁North China University of Technology,Beijing 100144,China)Abstract :Based on the k-means clustering method,this paper proposes an algorithm for video key frame extraction.The algorithm,including video shots segmentation algorithm,partitions the video content through hierarchical clustering,then combined with k-means clustering algorithm for preliminary extract key frames histogram feature comparison to remove redundant frames,ultimately determine the key frames of video sequences.After a lot of testing,it is proved that the key frame redundancy extracted by this algorithm is relatively small,with high representativeness,and has certain validity of video key frame extraction.Key words:video shots segmential;key frame extaction;k-means clustering随着多媒体信息的日趋增多,视频作为信息的载体,其内容量渐渐宽广,成为信息交互的主流。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
! 基于聚类的镜头分割算法
聚类 技 术 在 信 息 科 学 领 域 得 到 了 广 泛 应 用 !其 基 本思想是从一个初始化的聚类出发! 将一个样本集
+* 制 ! 即 + 分量等分为 $& 块 !,%- 分量 各自等分为 +
块" 建 立 + 分 量 的 直 方 图 为 #
! () !$% !&% & ! !"* 中 的 每 个 元 素 分 配 给 某 个 聚 类 ! 以 达
!,!
采 用改进的聚类算法将其分割为 ! 类 !即 分 割 后 的 镜 头 集 为 " " " "# ! "$ !# ! "! $% " % $ 令 第 一 帧 ## 为 第 一 个 镜 头 ! 其 本 身 即 为 类 内 中 心 ! 该 镜 头 "$%& & ’()(& "# % " ’ $ 抽 取 下 一 帧 # ()*+ ! 利 用 公 式 " , $ ! " - $ ! " . $ 得 到 # ()*+ 与 镜 头 的 相 似 性 为 &
!
摘 要%镜 头 分 割 是 基 于 内 容 的 视 频 检 索 和 浏 览 首 先 要 解 决 的 关 键 技 术 & 视 频 分 割 为 镜 头 后 !下 一 步 的 工 作 就 是 进 行 关 键 帧 提 取 !用 以 描 述 镜 头 的 主 要 内 容 & 提 出 了 一 种 改 进 的 基 于 聚 类 的 镜 头 分 割 和 关 键 帧 提 取 算 法!在 无 监 督 聚 类 中 引 入 一 个 参 考 变 量 !解 决 了 利 用 无 监 督 聚 类 进 行 镜 头 分 割 和 关 键 帧 提 取 时 可 能 产 生 的 帧 序 不 连 续 或 分 割 错 误 的 问 题 & 在 关 键 帧 提 取 阶 段 !将 镜 头 分 割 为 子 镜 头 后 ! 引入图像熵的概念提取关键帧 & 实验结果表明了改进算法在镜头分割和关键帧提取方面的 有 效 性 & 关 键 词 %镜 头 分 割 ’ 中 图 分 类 号 % &’%() 关键帧’ 聚类’ 图像熵 文 章 编 号 % )$$+,""+- # "$$. $ $%,$%/),$/
b 基 金 项 目 % 江 苏 省 自 然 科 学 基 金 资 助 项 目 # 苏 科 基 "$$" ! $$- $
作 者 简 介 % 潘 磊 # )(a$ ! $ ! 男 ! 江 苏 镇 江 人 ! 硕 士 生 ! 主 要 研 究 方 向 为 模 式 识 别 ( 基 于 内 容 的 视 频 检 索 &
到系统或用户的要求" 典型的基于聚类的镜头分割算 法 可 参 阅 参 考 文 献 #! ! +’ " 实 验 中 发 现 ! 通 常 采 用 的 聚 类 算 法 !可 能 导 致 镜 头 出 现 帧 序 号 不 连 续 以 及 镜 头 错 误 分 割 的 问 题 " 如 采 用 参 考 文 献 #"’ 中 的 聚 类 算 法 ! 图
式 中 $6 代 表 像 素 值 为 6 的 像 素 占 图 像 像 素 总 数 的 比 例 ! 容易证明图像熵总是大于 )5 * 的 % 可以看出 ! 当 $6 "
图 & 第五类镜头的几个代表帧
类内中心 7 分量的直方图! 类似地可建立帧与镜头 在 ,%- 分 量 上 的 相 似 性 为 #
+
,-./& 9:83 73;7323<=0=->3 570832 -< =?3 +=? 2?:=
研 究 发 现 !导 致 此 问 题 的 关 键 在 于 聚 类 算 法 存 在 缺 陷 " 由 于 参 考 文 献 #"’ 中 算 法 每 次 将 帧 和 各 个 已 知 镜 头 之 间 进 行 聚 类 比 较 !取 相 似 性 最 大 的 镜 头 作 为 帧
!"&
红外与激光工程
第 !" 卷
容起到决定性的作用 !是对视频节目建立索引的基 础 " 镜 头 是 视 频 的 基 本 物 理 单 元!由 一 个 摄 像 机 连 续 拍摄的时间上连续的若干帧图像组成" 镜头之间的变 换包括两种 #切 变 和 渐 变" 切 变 是 指 一 个 镜 头 不 采 用 任何编辑效果 直 接 变 换 到 另 一 个 镜 头 $渐 变 是 指 一 个 镜头通过某 种 编 辑 手 段!如 淡 入 %淡 出%叠 化 等 !缓 慢 地 变 换 到 另 一 个 镜 头 #$%&’ " 关 键 帧 是 用 来 描 述 一 个 镜 头 内部主要内容 的 某 帧 或 某 几 帧 图 像 !通 过 镜 头 分 割 后 对每个镜头提 取 关 键 帧 !就 可 在 此 基 础 上 对 视 频 建 立 索引! 为视频检索和浏览提 供了快捷简便的手段!并 且极大降低了视频 检索系统的处理时间!使得视频检 索系统的实时性得到很大提高" 所 属 镜 头 !因 此 很 容 易 出 现 上 述 问 题 " 对 此 参 考 文 献
文 献 标 识 码 %*
"#$%& ’(&) ’%*+%,)-)#&, -,$ .%/ 01-+% %2)1-3)#&, 4-’%$ &, 356’)%1#,*0
’*1 234 5 67 849: ! ;<= 5 &=E :G HI3JED:=4JK 9=L M=G:DF9E4:=5N49=OK< 7=4P3DK4E@ :G QJ43=J3 9=L &3JR=:I:O@ S TR3=;49=O ")"$$% ! UR4=9V
74’)1-3) % QR:E K3OF3=E9E4:= 4K 9 P4E9I E3JR=:I:O@ ER9E F<KE W3 D3K:IP3L G4DKEI@ 4= P4L3: D3ED43P9I 9=L WD:XK3Y &R3= Z3@ GD9F3 3[ED9JE4:= X4II W3 J9DD43L :<E 9GE3D KR:E K3OF3=E9E4:= E: L3KJD4W3 F94= J:=E3=E :G KR:EY *= 4FCD:P3L 9IO:D4ERF G:D KR:E K3OF3=E9E4:= 9=L Z3@ GD9F3 3[ED9JE4:= W9K3L := JI<KE3D4=O 4K CD:C:K3LS 9 D3G3D3=J3L P9D49WI3 4K <K3L 4= <=K<C3DP4K3L JI<KE3D4=O E: D3K:IP3 ER3 GD9F3 K3\<3=J3]K 4=J:=E4=<4E@ :D G9IK3 K3OF3=E9E4:= CD:WI3FK XR4JR J9= W3 J9<K3L CD:W9WI@ W@ <=K<C3DP4K3L JI<KE3D4=O^ B<D4=O Z3@ GD9F3 3[ED9JE4:=5 ER3 J:=J3CE :G 4F9O3 3=ED:C@ 4K <K3L 9GE3D KR:E W34=O K3OF3=E3L 4=E: K<W ! KR:EK^ H[C3D4F3=E9I D3K<IEK L3F:=KED9E3 ER3 3GG4J43=J@ :G ER3 4FCD:P3L 9IO:D4ERF 4= KR:E K3OF3=E9E4:= 9=L Z3@ GD9F3 3[ED9JE4:=^ 8%/ 9&1$’ % QR:E K3OF3=E9E4:= ’ _3@ GD9F3 ’ UI<KE3D4=O ’ MF9O3 3=ED:C@
图 ! 第二类镜头的几个代表帧
,-./! 9:83 73;7323<=0=->3 570832 -< =?3 &<6 2?:=
#"’ 提 出 了 一 种 后 处 理 方 法 " 本 文 则 对 聚 类 算 法 进 行
了 改 进 !无 须 进 行 后 处 理 #当 出 现 新 的 镜 头 时 !前 面 已 经分割完毕的镜头不再参加聚类" 为此引入参考变量
被错误地 划 分 到 图 ! 的 第 二 类 镜 头 中 !导 致 第 二 类 镜 头 的 帧 序 号 不 连 续 !而 第 五 类 镜 头 分 割 错 误 "
, ) 5 * ( ,C 3.//.0 ) 5 D 4!2 ( ) 6 * ( -C 3.//.0 ) 6 D 4!2
)& * )!*
式 中 ’ ! #$ ! $&’ $ 5 ! #$ ! +’ $ 6 ! #$ ! +’ ! 则 7,( 空 间 的 直 方 图 + )’ !5 !6 * 为 一 个 三 维 数 组 ! 分 别 对 应 + %, %( 三
图 $ 错误分类的帧
个分量的直方图" 定义帧与镜头在 + 分量上的相似 性为#
$&
,-./$ ,0123 41022-5-36 570832
, + 839,:.& D( " 8-<) 7 ) $ * 9,:.&C7 ) $ * D
$ ( $
)"*
式 中 7 ) $ * 是 帧 7 分 量 的 直 方 图 $ ,:.&C7 ) $ D 是 镜 头
! 引 言
目 前 研 究 的 基 于 内 容 的 视 频 检 索 系 统!一 般 都 是 先进行镜头分 割 !即 在 时 域 上 将 视 频 序 列 按 照 一 定 的
收 稿 日 期 % "‘‘/,‘a,‘) ’ 修 订 日 期 % "‘‘/,‘a,"‘