视频检索技术

合集下载

基于内容的视频检索关键技术研究

基于内容的视频检索关键技术研究
赵伟;冀小平
【期刊名称】《科技情报开发与经济》
【年(卷),期】2009(019)004
【摘要】重点探讨了基于内容的视频检索的一些关键性技术(如镜头检测、镜头聚类、关键帧提取等)的实现原理及其各自的优缺点,并对视频检索的发展趋势提出了一些看法.
【总页数】3页(P116-118)
【作者】赵伟;冀小平
【作者单位】太原理工大学信息工程学院,山西,太原,030024;太原理工大学信息工程学院,山西,太原,030024
【正文语种】中文
【中图分类】G354.47
【相关文献】
1.基于内容的视频检索关键技术研究述评 [J], 张婷婷
2.基于内容的视频检索关键技术研究 [J], 朱爱红;李连
3.基于内容视频检索的关键技术研究 [J], 黄知义;周宁
4.基于内容的视频检索技术在多媒体视频检索中的研究 [J], 邢国军;陈亚峰
5.基于内容的视频检索与挖掘关键技术研究 [J], 李向伟;康毓秀
因版权原因，仅展示原文概要，查看原文内容请购买。

全文检索技术在视频素材检索中的应用

容的查询，部分情况下只能采大取非基于内容的、接的、解间费的、经验的算法，查询结果往往不
尽如人意。ｊ目前的ＭＰＧ一由：Ｅ２
数据格式还不能很好地适合解决基于内容检索问题，等到要
供单独的用户管理、费管理和计权限管理；适应流行的ｌ种软、軎硬
件平台等。
备的信息
虽然在视
素材库管理系统增加了新的、强
维普资讯
全文检索技术在视频素材检索中的应用
从目前的视频数据处理特点全文系统输人任意词，只要检索出相关字幕文件记录．即可调阅读字幕文件和所对应的
容。在这种数据中处理基于内而
文档中的任何字、都能进行检词索，且可以用布尔逻辑（、、并与或
非等）等逻辑运算进行组合检索；
用户可接受的查全率和查准率；支持ＣｉｔＳｒｅｌｎ／ｅｖｒ和Ｂｏｅ／ｅｒｗｓｒＳｒｅ，合于以网络为中心的ｅｖｒ适计算模式，Ｉｔｒｅ技术紧密和ｎｅｎｔ结合，其可应用于Ｉｔｒｅ／使ｎｅｎｔＩｔａｅ；持多媒体的能力，ｎｒｎｔ中支实现文字、图片、像的统一管影
全文检索系统将输人系统的各类文档进行自动标引，用户可以输
数据库出所需素材，比
如通过节目标题、素材主题、业行类别、导、制人、作时间等编摄制字段项目检索；２基于浏览方式（）

基于内容的视频检索中视频镜头检测技术的研究

孙宁孙劲光 ’
大连
孙
字
葫芦岛１５０）２００
１６２）１０１
（辽宁工程技术大学软件学院” 葫芦岛１５０（２００）辽宁工程技术大学电子与信息工程学院
（连机车研究所” 大
摘
要
对基于内容的视频检索中视频镜头检测技术进行研究。首先，特征的选取，使用符合人类感知的ＨＳＶ空间，
ＣｌｓｍｂｅＴ３ａｓＮｕｒＰ９ｌ
ｌ引言
自２０世纪９０年代以来，多媒体已广泛地应用
１ＨＶ空间）Ｓ
ＨＶ颜色空问是一种跟感知相符合的颜色空Ｓ
问，以本文使用ＨＶ颜色空间代替传统使用的所Ｓ
中圈分类号
镜头检测
ＨＶ颜色直方图双阈值比较法。Ｓ
Ｔ３１Ｐ９
ＲｅｅｒｈｏｄｏＳｏｔｃｉｎＴｅｈｏｏｙｉｓａｃｆＶｉｅｈｔＤｅｅｔｃｎｌｇｎＣＢＶＲｏ
ＳｎＮｉｇｕｎＳｎＪｎｕｎｕｉｇａｇＳｎＹｕｕ
ＲＢ颜色空问。从ＲＢ到ＨＶ的转换公式为：ＧＧＳ
设：ａ＝ＭＸ（，，）ｍｎ＝Ｎ（，ｂ，ｍｘＡｒｇｂ，ｉＭＩｒｇ，）８＝
于多个领域。视频己经逐渐成为人类信息传播的
主流载体之一。面对浩如烟海的视频信息，如何快
ＨＳａｈｅｄｆｅｅｅｃａａｔｒｓｉｍｏｈｅｆａｅｓａｏｅｏｉｐｏｖｄｔａｎ — ｃｍｐｒｓｎａｔｃｉｎｍｅｈＶｓｔｉｒｎｃｈｃｅｉｔｃａｎｇｔｒｍｓｉｄｐｔｄｔｍｒｅｗｉｒｏａｉｏｓｄｅｅｔｏｔｏｄ，ａｓｄｎｄｂａｅｏｎｐｒｃｃｌｓａｓｃｈａａｔｒｓｉｓｔｒｓｏｌｈｅａｔａｔｔｔｓｃｒｃｅｔｃａｈｅｈｄｃｏｓｎ．Ｔｈｘｅｍｅｔｓｏｗｓｔａｅｍｅｈｏａｅｇｔｂｅｔｒｒｓｌｉｉｉｉｅｅｐｒｉｎｈｔｔｔｄｃｎｂｏｔｅｕｅ，ｗｈｃａｈｈｅｉｈｃｎ

浅析基于内容的视频检索

关键词：频检索；头检测；视镜分割技术；关键帧提取；态特征提取动
中图分类号：Ｐ７Ｔ３
文献标识码：Ａ
１问题的提出
２Ｏ世纪９Ｏ年代以来，随着计算机硬件和图像处理软件的发
类等方法研究镜头之间的关系，内容相近的镜头组合起来，把逐
基于内容的视频检索（ＢＲ）ＣＶ是一种新的检索技术，它能从数据库中查找到具有指定特征或含有特定内容的视频，它区别于传统的基于关键字的检索手段，融合了视频分割、关键帧和动态特征提取等关键技术，具有如下特点：一，第直接从媒体内容中提取信息线索；二，第基于内容的检索是一种近似匹配，这一点与常规数据库检索的精确匹配方法有明显的不同；第三，动态特征提取和索引建立可由计算机自动实现，这避免了人工描述的主观性，也大大减少了工作量。
一
３基于内容的视频检索技术
３１基于内容的视频检索过程．
首先，视频流经过镜头分割、特征提取并以ＭＥ一ＰＧ７标准描述存人特征数据库。接着，用户便可以通过查询界面寻找检索模
块，计算机通过从所建立的以ＭＥ一ＰＧ７标准描述的视频数据库
基于内容检索时，根据媒体特征进行相似性匹配检索的媒
体特征有：色（ｏｕ）纹理（ｅｔｒ）轮廓（ｋｔｈ、状颜Ｃｌｒ、ｏＴｘｕｅ、Ｓｅ）形ｅ（ｈｐ）空问约束（ｐｔｌｏｓａｔ）动态（ｔｎ、Ｓａｅ、ＳａａＣｎｔｉｓ、ｉｒｎＭｏｉ）领域、念ｏ概（ｏａｅｎｅｔ）结构描述及其他的图像信息。在过去的几年Ｄｍｉｏｅｐｓ、ｎ中，基于内容的视频检索已经成为一个非常活跃的研究领域，并开发出许多具有可视化特征的系统。其中建立视频数据库是一个重要环节，它是图像处理技术和传统数据库技术相结合的产

视频的内容分析与检索技术及其教学应用

需要对视频进行基于内容的分析。基于内容的视频
图１视频分层结构
帧是视频数据的最小单元，是一幅静止的画
面。镜头是视频数据的基本单位，它是摄像头的一次连续的动作，只能拍摄相邻地点连续发生的事情。场景由内容相近的镜头组成，从不同的角度描述同一个事件。而视频序列则由许多场景组成，叙述一个完整的故事结构。层中每一个视频层次的数据都可以用一定的属性加以描述。如：视频序列的属性：主要包括场景的个数和持续时间；场景的属
在视频分析与检索过程中，决定其性能的主要
关键技术如下。（）视频镜头的检测和表示一
基于内容的视频信息检索是一个人机互动的过程。能为用户提供交互界面、多样化的查询手段、方便快速的浏览和导航能力，并满足各种反馈／交
镜头检测的关键是确定从镜头到镜头的转换处，利用镜头之间的转换方式（突变切变和渐如变）找到镜头图像之间的差别。在此基础上可对每个镜头提取出关键帧和运动信息以供浏览和检索之用。一个镜头的关键帧就是反映该镜头中主要内容
二、视频结构的分析
束镜头等；镜头的属性：如持续时间、开始帧号、结束帧号、代表帧集合、特征空间向量等；帧的属性：帧有大量的属性，如直方图、轮廓图ＤＣ及
ＡＣ分量图等。
视频数据的本质是一组连续的图像帧，除了存在时问上的先后关系外，其本身并不具有任何结构信息。要实现基于内容的视频检索，必须为视频建立不同层次的结构索引，并进一步为视频的检索和
的一帧图像或若干帧图像。关键帧的选取一方面必须能够反映镜头中的主要事件，因而描述应尽可能

视频检索中的视频镜头分割技术

列。由于镜头的突变和渐变具有一定模式。可对二进制序列进行视频镜头分割是基于内容的视频检索的第一步．是随后的模式判别．便可以检测镜头的突变与渐变。关键帧的提取、场景聚类和基于内容的查询的基础。镜头分割的（）统计判决机制５准确性将直接影响到后续处理的效果。因此，视频镜头的分割技该方法建立一个统计判决模型．其推导出的判断可使镜头术是基于内容的视频检索的关键技术。从一开始就得到广泛的监测错误率降到最低．但计算复杂度很高。（）其它判断机制。６研究．取得了丰富的研究成果。并本文介绍了目前镜头分割的主要研究方法．对目前主要的典型镜头分割算法进行了介绍和分在实际应用中，除上面常用的判断机制外，还有很多判断机制。同的判断机制产生不同的镜头分割效果。不如基于数学模型析．最后指出当前镜头分割的主要研究方向。１视频镜头分割．的判断机制ｆ１基于学习的判断机制等。３、段视频流从上往下可分为视频、事单元、景、头、２２面向ＭＥ故场镜．ＰＧ压缩域镜头变换检测方法帧。视频常常是通过镜头连接而成的，通过镜头的变换来表示不ＭＰＧ标准是现在广泛运用的国际视频压缩标准．从目前Ｅ同的内容。镜头变换是指一段连续视频图像序列转换到另一段的研究的情况来看．基于压缩的视频分析方法都是在解码和反连续视频图像序列，为突变和渐变（入，出、分淡淡隐现、入）量化后的基础上展开的。滑。主要的方法有两类：一类是对压缩视频突变是一个镜头直接转换为下一个镜头．中间没有时间上的延进行全局或局部解压．得到的视频子集上．用非压缩的镜头在采迟渐变是前一个镜头慢慢地转换为下一个镜头，加入了一些空分割方法进行镜头变换识别．如基于ＤＣ图像序列的镜头分割。间和时间上的编辑效果。镜头的分割或称景物变换探测（ｏｎ另一类是根据运动矢量的统计特性和ＤＴ变换的ＤＣ系数进行ＳｅｅＣＣａｇｅｃｏ— Ｃ，ｈｎｅＤｔｔｎＳＤ）ｅｉ就是根据镜头变换的不同特征把视频分镜头分割割成一个个独立的语义单元。因此镜头变换的检测是镜头分剖基于Ｄ图像序列的镜头分割方法首先从被压缩的图像中Ｃ的前提。部分解压提取出ＤＣ图像．Ｃ图像只有原始图像大小的１４Ｄ／．６２镜头变换的检测方法．但它保留了原来图像的基本信息．用于原始图像场景处理的全般来说，镜头变换的检测方法可以分为两类，即面向非局特性也可用于ＤＣ图像．对分析的准确性也不会造成大的影压缩域镜头变换识别的方法、面向压缩域镜头变换识别方法。响，可供选择的算法较多。２１面向非压缩域镜头变换检测方法．基于运动矢量的统计特性和ＤＴ变换的ＤＣＣ系数进行镜头面向非压缩域镜头变换识别方法．可以简单地归纳为帧问变换识别，主要是利用ＭＰＧ流中的ＩＰＢ帧在发生镜头转换Ｅ、、特征差异度量＋种判断机制的方法。某时表现出的不同特征进行镜头边界判断。２１１帧间特征差异的度量．．３主要的典型算法．不同的特征对于检测不同类型的镜头变换具有不同的作３１基于像素差的算法ｆ１．４用，所以选择哪种特征向量进行度量是镜头正确分割的基础。常基于像素差的算法是指对连续两帧图像的相同位置的像素用的度量特征有帧间灰度，颜色、图像的边缘、度或色度直方灰度值或颜色值进行比较，亮并计算各灰度差或颜色差的总和。帧图、运动矢量等。问差的公式如（— ）：４１式ｘ＜Ｍ Ⅳ 一１２１．．断机制２判（，＝＾）：，，）（，）ｆ（ｙ一Ｙｌ（）固定阈值机制１ｏ（－）４１这种方法在视频中设置一个固定的阈值．来确定镜头变换Ｍ，Ｎ为图像的大小，表示第ｉ，（，表示第ｉｘ）Ｉｉ帧Ｉｘ）ｙ帧（，位ｙ的情况，当帧间差异大于设定的阈值时，则认为发生镜头变换。置的像索值。当ｄｉ大于阈值Ｔ时，ｇＩ，则认为发生镜头转换。（）双阈值机制２用这种方法进行图像差别的计算对噪声和物体运动十分敏这种方法设置两个阚值Ｔ和Ｔ（ＩＴ）分别是镜头突变感，１２Ｔ＜２．物体和摄像机的任何移动都会使帧间差明显增大．而导致从和渐变的阈值。首先用较低的阕值Ｔ来确定渐变过程的起始误检测ｌ帧。如果两连续帧的帧间直方图差Ｄ满足Ｔ（＜２则被认为３２基于颜色直方图的算法１ＤＴ．．是可能的渐变的开始。这时就开始进行帧问直方图差累计Ｐ的由于一个镜头内相邻帧之间的内容变化不大．颜色直方图计算，至满足Ｐ个直＞２且ＤＴ时，＜１则认为是渐变的结柬。具有相似性．可利用直方图的相似性来判断两帧之问是否有镜（）自适应阈值机制３头变换。自适应阈值机制是指在视频流时间轴的不同时段或时刻自若两帧图像Ｉ和Ｉ的直方图为Ｈ和Ｈｉ｛１则帧间颜色直方图动的选择适合该时段或时刻的阈值。来进行镜头边界的判断如的差值计算方法如（— ）：４２式丝果在某时段或时刻的帧间差大于该时段或时刻的阈值、则认为ｄ（，＝＾乃）ｆ（）｜一ＨｊＩｌＨ，ｆＩ（）Ｊｆ发生镜头转换。ｋＯ＝（－）４２（）聚类／｝聚类机制。４桴糊Ｎ表示颜色量化的级数，；）Ｈ（为第１帧第ｋ颜色等级的直Ｉ【；该方法根据视频模糊聚类后得到的各帧属于明显变化ｒＣ方图。ｄＩ０于阚值Ｔ时，认为发生镜头变换。Ｓ１（１大，则和非明显变化（Ｓ）ｉＮＣｉ类场景的隶属度．ａ把视频表示成二进制序直方图法使用像素亮度和色彩的统计值，抗噪能力比较强。

跨媒体检索技术在视频内容分析中的应用研究

跨媒体检索技术在视频内容分析中的应用研究摘要：随着互联网和数字媒体技术的迅速发展，视频数据的规模和多样性呈爆炸式增长，对视频内容的准确分析和检索成为了迫切的需求。

跨媒体检索技术作为一种有效的视频内容分析方法，在提供智能化的检索服务和实现大规模视频分析方面具有广阔的应用前景。

本文将研究跨媒体检索技术在视频内容分析中的应用，并对其实现方法和未来发展进行探讨。

1. 引言随着数字媒体的广泛应用，视频数据正在成为一种重要的信息载体。

然而，由于视频数据的高维特性和庞大数量，传统的视频分析方法已无法满足日益增长的分析需求。

因此，研究开发一种高效准确的视频内容分析方法具有重要意义。

2. 跨媒体检索技术概述跨媒体检索技术是一种能够以一种媒体的内容查询另一种媒体的信息的技术。

它主要通过对视频的音频、文本和图像等多模态信息的分析和提取，将视频数据与其他媒体数据进行有效关联，实现跨媒体内容的检索。

3. 跨媒体检索技术在视频内容分析中的应用3.1 视频内容理解跨媒体检索技术可以用于提升视频内容理解的准确性。

通过分析视频中的图像、音频以及文本信息，可以对视频中的物体、场景、情感等内容进行深入分析。

例如，当用户在搜索引擎中输入一个关键词时，跨媒体检索技术可以返回与该关键词相关的视频片段，并且可以通过分析视频中的语音信息和图像特征等提供更加准确的搜索结果。

3.2 视频目标识别跨媒体检索技术可以用于视频目标识别。

通过分析视频中的图像特征和文本描述，可以准确地识别视频中的目标物体，并且可以实现对视频中目标物体的分类和跟踪。

例如，通过分析视频中的图像特征和文本描述，可以准确地识别汽车、人物等目标物体，并且可以实现对这些目标物体的分类和跟踪，为视频内容的理解和检索提供更多可能性。

3.3 视频内容分析与推荐跨媒体检索技术可以用于视频内容的分析和推荐。

通过分析视频中的图像、音频和文本信息，可以实现对视频内容的自动分析和推荐。

例如，通过分析视频中的图像和音频信息，可以将视频划分为不同的场景，并且可以自动提取出视频中的重要特征，为用户提供个性化的视频推荐服务。

计算机新闻视频检索技术之字幕事件检测算法研究

２１基于帧闽差的算法．
对于时长为￡单帧图像大小为ＨＸＷ的视频序列用｛｝，表示，其中ｔ表示视频帧序列号，ｔＬ，＝｛１≤ ≤ ｎ（），
Ｉ１≤ ｉ≤ Ｈ，ｌ≤ ，≤ ｝。
设。胛为相邻图像帧通过计算固定区域的ＲＢ值与标准蓝色和标准白色的欧式距离来检测字幕事件的发和Ｇ
生，ｌ和
＝
的直方图，全局帧差为：则
厂垂■ —— —— ——— —一
／（（）（） ∑ 般１一）
Ｙｔ：１
（１）
＝
＾ ∑ （。）（）／（一）
Ｙｔ：１
厂垂■— ————— ——一
（２）
新闻视频中的字幕通常出现在屏幕下方的１４范围内，因此局部帧差：
收稿日期：０继勋（９０，，南洛阳人，南工程学院助教。１８一）男河河
维普资讯
第１７卷第２期
高继勋等：计算机新闻视频检索技术之字幕事件检测算法研究
摘要：随着计算机网络的发展，新闻视频成为人们获取信息的主要媒体之一。由于新闻视频数量巨
大，何从海量的新闻视频中找到需要的内容便成为迫切需要解决的问题，闻视频检索算如新法便应运而生，而基于字幕帧的检索便是重要的一种，传统的三种关于字幕帧的提取算法将加以改进，到一种运算速度更快的算法。得
提供了非常重要的语义信息，所以利用新闻视频中的字幕对新闻视频进行检索是新闻视频检索的一个重要途径。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

7
Direct Show是为播放各种类型的视频数据、音频数据或其他多媒体数据而设计的。Direct Show支持MPEG(包括MP3、AVI、MOV、WAV、DVD等格式）。借助于Direct Show，可以很容易地实现多种格式的多媒体数据的回放、传输和捕获。Direct Show使用Filter Graph的模型来管理整个数据流的处理过程。利用Direct Show强大的功能，我们可以这样实现帧的提取。首先建立过滤器图表，与特定的多媒体流相关联，然后加视频抓帧过滤器进图表，并设置回调函数。当图表运行时，抓帧过滤器抓取流过的视频帧(可进行设置，可以是每一帧，也可以是间隔固定帧)，把抓取的帧存储在视频库中。利用Direct Show 能够使开发者专注于各自的分析和处理，而无需考虑带有共性的实现细节，极大地降低了多媒体应用开发的复杂度，并提高了其开发效率。
4
下面对视频检索的原理进行简要的介绍。 2.基于内容的视频检索
基于内容的视频分析和检索研究的目的是通过对视频内容进行计算机处理、分析和理解，建立结构和索引，以实现方便有效的视频信息获取。它是根据视频的内容以及上下文关联，在大规模视频数据中进行检索。基于内容的视频检索包括很多技术，如：视频结构的分析 ( 镜头检测技术 ) 、视频数据的自动索引和视频聚类等。目前，在基于内容的视频检索技术的研究方面，除了识别和描述图像的颜色，纹理，形状和空间关系外，其他主要集中在视频镜头分割，特征的提取和描述(包括：视觉特征，颜色，纹理和形状及运动信息和对象信息等)，关键帧提取和结构分析等方面。基于内容的视频检索的系统框图见下图。
目前，国内外已研发出了多个基于内容的视频检索系统，主要有五种，如下：
1：QBIC系统：QBIC(Query By Image Content) 是由IBM Almade n研究中心开发的，是“基于内容”检索系统的典型代表。此系统主要利用颜色、纹理、形状、摄像机和对象运动等描述视频内容, 并以此实现其检索。QBIC提供了对静止图像及视频信息基于内容的检索手段, 允许用户使用例子图像、构建草图、以及颜色和纹理模式、镜头和目标运动等信息对大型图像和视频数据库进行查询。在视频数据分析方面包括了镜头检测、运动估计、层描述、代表帧生成等多种视频处理手段。 2 ： Visual Seek 系统： Visual Seek 是美国哥伦比亚大学电子工程系与电信研究中心图像和高级电视实验室共同研究的、一种在互联网上使用的“基于内容”的检索系统。它实现了互联网上的“基于内容”的图像/视频检索系统，提供了一套供人们在Web上搜索和检索图像及视频的工具。
5
基于内容的视频检索的系统框图索的目的就是要从大量的视频数据中找到所需的视频片段。视频数据是一个二维非结构化的图像序列，要实现基于内容的视频检索，首先要从多媒体文件中提取视频帧序列，然后对这些图像流进行处理，使之成为结构性的数据，提取其特征，从而达到检索目的。首先，介绍几个关于视频的基本概念。帧(Frame) ：视频流中的基本组成单元，每一帧均可看成是一幅独立的图像。视频流数据就是由连续图像帧构成的。帧是视频的最小单位。镜头(Shot)：摄像机拍下的不间断帧序列，是视频数据流进一步结构化的基础。同一组镜头中，视频帧的图像特征基本保持稳定。若相邻图像帧之间的特征发生了明显变化，则认为是发生了镜头变换。关键帧（ Key Frame ）：关键帧是代表镜头内容的图像帧。在一个视频镜头内，关键帧的数目远小于镜头所包含的图像帧的数目。用关键帧代表镜头可以大大减小计算复杂性。场景 (Scene): 语义上相关和时间上相邻的若干组镜头组成了一个场景。场景是视频所蕴涵的高层抽象概念和语义的表达。像镜头可以由关键帧代表一样，场景也可以使用属于这个场景的所有镜头所对应的关键帧集合来表示。
1
视频检索就是要从大量的视频数据中找到所需的视频片段。根据所给出的例子或是特征描述，系统就能够自动的找到所需的视频片片段。根据提交视频内容的不同，视频检索一般分为镜头检索和片段检索。目前视频检索的多数研究还集中在镜头检索上。而片段检索方面的研究则刚刚开始。实际上，从用户的角度分析，他们对视频数据库的查询通常会是一个视频片段而很少会是单个的物理镜头。从信息量的角度分析，由几个镜头组成的视频片段有比单个镜头更多的语义，它可以表示用户感兴趣的事件。因此查询的结果也比较有意义。由于视频拍摄的多样性和后期编辑的复杂性，片段的相似性有多种可能。把片段检索分为这样两种类型：精确检索和相似性检索。一个完整的视频检索系统的关键技术主要有：关键帧提取、图像特征提取、图像特征的相似性度量、查询方式、以及视频片段匹配等方法。视频检索是一门交叉学科，以图像处理、模式识别、计算机视觉、图像理解等领域的知识为基础，从认知科学、人工智能、数据库管理系统及人机交互，信息检索等领域，引入媒体数据表示和数据模型，从而设计出可靠、有效的检 2 索算法，系统结构以及友好的人机界面。
3
3 ： Video Q 是由美国哥伦比亚大学研究开发的一套全自动基于内容的视频查询系统。它扩充了传统的关键字和主题导航的查询方法，允许用户使用视觉特征和时空关系来检索视频。
4 ： TV—FI 系统： TV—FI(Tsing hua Video Find It)是清华大学开发的视频节目管理系统。该系统可提供视频数据入库、基于内容的浏览、检索等功能 , 并提供多种数据访问模式 , 包括基于关键字查询、示例查询、按视频结构浏览及按用户自定义类别进行浏览等。
视频检索技术
1. 视频检索简述
随着计算机技术和网络技术的发展，信息高速公路的建设，以及多媒体的推广应用, 各种视频资料源源不断地产生, 随之建立起了越来越多的视频数据库，出现了数字图书馆、数字博物馆、数字电视、视频点播、远程教育、远程医疗等许多新的服务形式和信息交流手段。在传统的数据库系统中，信息的检索一般以数值和字符型为主，而在多媒体数据库中集成图像、视频、音频等非格式化信息，它们具有数据量大、信息不定长、结构复杂等特点。每一种媒体数据都有一些难以用字符和数字符号描述的内容线索，如图像中某一对象的形状、颜色和纹理，视频中的运动，声音的音调等。当用户要利用这些线索对数据进行检索时，首先要将其人工转化为文本或关键词形式，这种转换带有一定的主观性，且极其费时，因而仅仅基于关键词的检索已不能满足用户的检索要求。数据库及其它信息系统不仅要能对图像、视频和声音等媒体进行存储以及基于关键字的检索，而且要对多媒体数据内容进行自动语义分析、表达和检索。