一种基于内容相关性的跨媒体检索方法_张鸿

一种基于内容相关性的跨媒体检索方法_张鸿
一种基于内容相关性的跨媒体检索方法_张鸿

第31卷 第5期2008年5月

计 算 机 学 报

CH IN ESE JOU RNA L OF COM PUTE RS

Vo l .31N o .5

M ay 2008

 

收稿日期:2006-06-16;最终修改稿收到日期:2007-12-27.本课题得到国家自然科学基金(60525108,60533090)、国家科技支撑计划课题(2006BAH 02A13-4)、国家“八六三”高技术研究发展计划(2006AA010107)、高等学校科技创新工程重大项目培育资金项目、长江学者和创新团队发展计划(IRT0652)资助.张 鸿,女,1979年生,博士,讲师,主要研究方向为多媒体分析与检索、机器学习.E -mail :z hang -h ong z ju @yahoo .com .cn .吴 飞(通信作者),男,1973年生,博士,副教授,主要研究方向为多媒体分析与检索、统计学习理论.庄越挺,男,1965年生,博士,教授,主要研究领域为多媒体数据库、人工智能、基于内容的多媒体检索、视频动画等.陈建勋,男,1957年生,博士,教授,主要研究领域为基于Web 的多媒体检索和计算机图形学等

一种基于内容相关性的跨媒体检索方法

张 鸿

1),2)

 吴 飞2) 庄越挺2) 陈建勋

1)

1)(武汉科技大学计算机科学与技术学院 武汉 430081)

2)(浙江大学人工智能研究所 杭州 310027)

摘 要 针对传统基于内容的多媒体检索对单一模态的限制,提出一种新的跨媒体检索方法.分析了不同模态的内容特征之间在统计意义上的典型相关性,并通过子空间映射解决了特征向量的异构性问题,同时结合相关反馈

中的先验知识,修正不同模态多媒体数据集在子空间中的拓扑结构,实现跨媒体相关性的准确度量.实验以图像和音频数据为例验证了基于相关性学习的跨媒体检索方法的有效性.关键词 跨媒体检索;异构性;典型相关性;子空间映射;相关反馈中图法分类号T P 391

Cross -Media Retrieval Method Based on Content Correlations

ZH ANG Ho ng

1),2)

 W U Fei 2) ZH UANG Yue -Ting 2) CH EN Jian -Xun

1)

1)

(C o llege o f C omp uter S cience &Technolog y ,Wuhan Univer sity o f Science &Technolog y ,Wuhan 430081)

2)(Institute

o f Ar tif icia l Intellig ence ,Zhej iang Univer sity ,Han gz hou 310027)

A bstract M ost traditional co ntent -based multimedia retrieval metho ds are designed fo r multime -dia data o f single m odality .Such me thods include image re trieval ,audio retriev al ,video retriev -al ,etc .This pape r propo ses a novel cross -media retriev al approach ,w hich can proce ss multime -dia data of different m odalities and m easure cro ss -media similarity ,such as image -audio similari -ty .First statistical m ethod is used to learn canonical co rrelations betw een low -level feature space s of different mo dalities .Then ,sub -space mapping is designed to build an isomo rphic subspace and solv e the hete rogeneity pro blem betw een different lo w -level feature vecto rs .This subspace con -tains m edia objects of different modalities ,and each media object is represented w ith iso morphic vector .Since canonical correlatio ns am ong m ultimedia objects a re furthest preserved during the mapping process ,cross -media similarity can be estima ted with defined distance metric .Fur ther -m ore ,relevance feedback pro vided by users is utilized to learn prior know ledg e and refine multi -m edia topology in the subspace .In this w ay cro ss -media similarity is mo re consistent w ith human perceptio n with the inco rpo ration of user interaction .Bo th im ag e and audio data are selected fo r e xperiments and co mparisons .Given the same visual and auditory features the new approach out -perfo rms ICA ,PCA and PLS methods bo th in precision and recall performance .Overall cro ss -media retriev al results betw een images and audios are ve ry encouraging .

Keywords cro ss -media retrieval ;heterogeneity ;canonical co rrelation ;subspace mapping ;rele -v ance feedback

1 引 言

基于内容的多媒体检索是计算机视觉和信息检索领域的研究热点,其根据视觉、听觉或者几何等底层特征进行相似度匹配而实现检索[1].20世纪90年代初期人们提出了基于内容的图像检索技术,从图像中提取颜色、纹理、形状等底层视觉特征作为图像的索引[2].这种技术后来也被运用到视频检索[3]和音频检索[4],只是针对不同媒体内容所采用的底层特征也不同.这些研究都取得了一定成果,提交任何一种模态的媒体对象例子都可检索到同种模态的相似结果.

然而,现有的多媒体检索系统大都只能检索包含单一模态的多媒体数据库,或虽能处理多模态的媒体数据,却不支持跨媒体的检索,即根据一种模态的多媒体对象检索到其他模态的多媒体对象,例如:以描述“松鼠”外貌的图像为查询例子,检索记录了“松鼠”叫声的音频数据.早在1976年,M cGurk就已经揭示了人脑对外界信息的认知需要跨越和综合不同类型的信息,来自视觉、听觉等不同感官的信息相互刺激、共同作用而形成整体性的理解[5].因此,目前迫切需要研究一种支持不同模态的跨媒体检索方法,突破传统基于内容的多媒体检索对检索模态的限制.

本文以图像视觉特征和音频听觉特征之间的典型相关性分析(Canonical Correlation A naly sis,CCA)①为基础,通过子空间映射解决了不同模态数据特征异构性问题,并提出基于增量学习的相关反馈方法,实现跨媒体相关性的准确度量.虽然CCA方法已经成功应用到图像语义自动标注[6]和基于内容的图像检索[2]等领域,但这些研究大多需要文本信息的辅助,而文本数据本身就代表了一定的语义.因此,对于图像和音频这种非结构化、难以应用文本描述的多媒体数据,需要研究新的方法以挖掘两者间所蕴涵的相关性.本文的方法实现了图像和音频之间的跨媒体检索,能够通过底层异构的视觉特征和听觉特征较好地理解高层的跨媒体语义关系,在检索过程中实现不同模态之间的灵活跨越.

2 挑战及相关研究

跨媒体检索是基于内容的多媒体检索中一个新的研究领域,目前国际上还没有较成熟的跨媒体检索算法和技术.跨媒体检索需要处理不同模态的媒体数据,例如:一个500维的视觉特征向量和一个650维的听觉特征向量,两者可能都表达了相似的语义概念,如爆炸和画面与爆炸的声音,但是计算机却很难根据两个特征向量度量两者在语义层面上的相关程度.以图像和音频为例,跨媒体检索面临的主要挑战包括:

(1)图像视觉特征与音频听觉特征之间不但维数不同,而且具有不同属性,这种异构性造成跨媒体的相关性度量十分困难;

(2)即使解决了特征异构性问题,还需要进一步缩小底层特征与高层语义之间的鸿沟,以提高跨媒体检索精度.

近年来,一些研究者先后提出了类似跨媒体检索思想的研究,挖掘不同模态之间的相关性,与本文的跨媒体内容相关性学习有相似之处,这些方法主要分为以下两类:

(1)基于相关性学习的自动语义标注和检索.文献[6]通过学习图像和关键字之间的典型相关性,以解决图像自动标注问题;类似地,有研究者根据典型相关性实现基于关键字的图像检索[2];除了典型相关性之外,还有其他的相关性挖掘研究,如文献[7]将Web图像的视觉特征和伴随文字特征看成两种不同模态,根据两者之间的标注关系非线性地在图像相似度矩阵和文本相似度矩阵间传递相关性,以提高Web图像检索效率.

(2)多模态特征关联和索引.视频内容同时包含不同模态的底层特征,许多研究通过关联分析和互索引等方法帮助理解视频语义.文献[8]提出一种主题结构模型以组织不同模态的新闻内容,在新闻中出现频率较高的语义概念和多媒体对象之间建立关联,使得用户可以查询不同模态的新闻信息;文献[9]通过挖掘多模态特征进行视频数据库的索引和检索.

上述研究分析了不同模态、异构特征之间的相关性,用来缩小语义鸿沟、提高检索效率.然而,其中大部分方法是为了提高单模态检索效率(如图像检索、视频检索),而不是解决不同模态之间的相关性匹配(如图像和音频之间).另一方面,一些研究在实现不同模态之间的交叉检索时依赖于相关的文本数据(如基于关键字的图像检索),而文本自身就代表了一定的语义信息.因此,这些方法难以有效应用到

821

5期张 鸿等:一种基于内容相关性的跨媒体检索方法

①M agnus Borga.Canonical correlation a tutorial.J anuary12,

2001.http://people.imt.liu.se/~magnus/cca/tutorial/

缺乏文本描述的跨媒体检索中,如直接根据视觉和听觉特征度量图像和音频数据在语义上的相似度.

3 视觉和听觉特征的相关性保持映射

不同模态的媒体数据在底层特征匹配上面临异构性和不可度量挑战,如果采用传统的特征分析方法,如主成分分析(Principal Com po nent A nalysis, PCA)[10]、独立成分分析(Independent Com po nent Analy sis,ICA)[11]和偏最小二乘法(Par tial Least S quares)[12],需要分别对不同模态的特征矩阵进行降维,从而得到两个维数相同的子空间.但这样会丢弃不同模态在底层特征上潜在的相关性信息,使得降维得到的子空间难以准确反映高层语义联系,造成跨媒体检索效率较低.

与上述方法不同,本节通过典型相关性分析同时对视觉特征矩阵和听觉特征矩阵进行相关性求解和子空间映射,解决异构性和不可比性问题,更为重要的是映射得到的子空间在最大程度上保证了视觉和听觉特征之间的典型相关性不变.

3.1 相关性学习

相同语义、不同模态的媒体数据在底层特征上具有潜在相关性,例如,“松鼠”图像的视觉特征和“松鼠”音频的听觉特征在统计意义上存在一定相互关联.本节采用典型相关分析(Cano nical Correlatio n Analy sis,CCA)方法挖掘这种不同模态之间的典型相关性.

两个变量场X与Y之间的相关性定义如下:设有n个样本、p个变量组成的变量场,记为X(n×p),另有n个样本、q个变量组成的变量场Y(n×q),以最大限度地提取X与Y之间相关性的主要特征为准则,从X中提取组合变量L,从Y中提取组合变量M,如下所示:

X(n×p)W X(p×m)

L(n×m);

Y(n×q)W Y(q×m)

M(n×m)(m

其中,W X,W Y为空间特征向量,又称为典型变量.按式(1)把具有较多个变量的变量场X与Y之间的相关化为较少组合变量L与M间的相关,通过W X, W Y的数值分布来确定X与Y的空间相关分布形式,而W X,W Y的数值大小则表示了所对应变量的重要程度.于是问题归结为如何求解典型变量W X, W Y.定义相关系数为ρ=r(L,M),在式(3)的约束下,使相关系数最优化.

ρ=r(L,M)=W

T

X C X Y W Y

W T X C XX W X W T Y C YY W Y

(2)

v(L)=L T L=W T X X T XW X=1;

v(M)=M T M=W T Y Y T Y W Y=1(3)其中式(2)的C XY表示X(n×p)和Y(n×q)构成的协方差矩阵.结合式(2)和(3),使用拉格朗日乘子法可以得到C X Y C-1YY C Y X W X=λ2C X X W X,即将最优化问题转换为形如Ax=λBx的特征根问题,并进一步根据式(1)得到最小变量组合L(n×m),M(n×m),以最大限度地揭示X(n×p),Y(n×q)之间的相关性.

3.2 同构子空间的映射

给定多个语义类别的图像和音频作为训练数据,设已知语义类别的个数为z,未知每幅图像和每段音频例子与语义类别之间的所属关系,可以采用如下所示的半监督式相关性保持映射方法构建同时容纳图像和音频对象的同构子空间S*.

半监督式相关性保持映射.

1.对每个语义类别C i(i∈[1,z]),随机选择一些图像

A i和音频

B i进行语义标注;

2.分别求出A i,B i聚类质心[13]CtrA i,CtrB i;

3.分别以Ctr A i,CtrB i为初始质心对图像数据集和音频数据集进行K-M eans聚类[14];

4.聚类结果中与初始聚类质心CtrA i划分到相同类别的图像被赋予与CtrA i相同的语义;

5.聚类结果中与初始聚类质心CtrB i划分到相同类别的音频被赋予与CtrB i相同的语义;

6.对每个语义类别C i中所有图像和音频数据提取视觉特征矩阵X和听觉特征矩阵Y,计算X,Y之间的典型变量,以此为基向量映射得到低维子空间.

上述方法在只对少量图像和音频数据进行语义标注的情况下,通过K-M eans聚类划分语义类别,分别求取每个类别的视觉和听觉典型变量,将典型变量映射得到的子空间命名为CCA子空间S*.

4 CCA子空间中的跨媒体检索

4.1 不同模态间的相关性度量

设x i=(x i1,…,x ik,…,x ip)(x ik∈R)表示初始的视觉特征向量,y j=(y j1,…,y jk,…,y jq)(y jk∈R)表示初始的听觉特征向量.经过半监督式的相关性保持映射后生成大量复数,定义x i经过子空间映射后的向量为x′i=(x′i1,…,x′ik,…,x′im)(x′ik=a+b×i,(a,b∈R)),同理可得y j对应CCA子空间中的映射结果y′j.

由于存在大量复数而无法直接在CCA子空间

822计 算 机 学 报2008年

S*中计算距离,因此,将子空间中每一维上的坐标值转换为极坐标形式:

x′ik=(βik,x′ik)

βik=arctg(b/a),x′ik=a2+b2

(4)对y′j也用式(4)的方法进行变换,则图像x′i和音频y′j之间的距离定义为每一维上极坐标距离的平方和的2次方根,即

 CCAdis(x′i,y′j)=sqrt∑m

k=1

(x′i k2+y′jk2-

2×x′i k×y′jk×cosβik-βjk)(5) 从而,对于用户提交的图像查询例子R,可以采用CCAdis计算子空间中图像R与音频对象之间的距离以衡量跨媒体相关性大小.然而,由于语义鸿沟的存在,CCA子空间S*的映射过程虽然保留了视觉和听觉特征间的典型相关性,但是CCAdis的计算结果不能准确反映整个数据集范围内的跨媒体语义关系.因此,需要对CCAd is的结果进行修正,定义修正后的跨媒体相关性为

CrossCor(x′i,y′j)=CCAd is(x′i,y′j)+γ(x′i,y′j)

(6)其中γ(x′i,y′j)为修正因子,表示子空间中不同模态样本之间CCA dis与真实的跨媒体语义关系之间的差值.γ(x′i,y′j)初始化为0,并在基于增量学习的相关反馈过程中通过提取用户交互中的先验知识进行更新.

4.2 基于增量学习的相关反馈

相关反馈方法的使用可以结合用户的感知先验知识,以修正查询向量和整个数据集的拓扑关系,从而提高查询效率.本节提出的基于增量学习的跨媒体相关反馈作用于CCA子空间S*,而不是初始的视觉和听觉特征空间.因此,子空间S*中数据集的分布关系直接影响反馈算法的设计和效率.

子空间S*是基于相关性保持映射而得到的,这种相关性保持特性使得图像和音频数据在子空间中形成一定的聚类效果(实验部分将给出子空间中单模态数据的聚类分析),因此我们有如下假设:假设.在子空间S*中,相似语义、相同模态的媒体对象分布在比较集中的区域.

基于上述假设,本节以增量学习方式传播相关反馈中的跨媒体语义信息,修正图像和音频数据集在CCA子空间中的拓扑结构,同时更新修正因子γ的取值,使得式(6)的计算结果更准确地反映图像和音频对象在语义上的跨媒体相关程度.设R为提交的图像查询例子,用户对返回的音频例子进行评判,得到音频正例集合P和音频负例集合N,相关反馈算法描述如下.

相关反馈算法:

1.p i∈P,调用CCA dis找到p i在音频数据库中的k-近邻T={t1,…,t j,…,t k},并按距离进行升序排列;

2.令γ(R,p i)=-τ(τ>0),以等差的方式依次修改集合T中每个元素对应的修正因子γ值:γ(R,t j)=-τ+j×d1(d1=τ/k);

3.n i∈N,调用CCAdis找到n i在音频数据库中的k-近邻H={h1,…,h j,…,h k},并按距离进行升序排列;

4.令γ(R,n i)=τ(τ>0),以等差的方式依次修改集合H中每个元素对应的修正因子γ值:γ(R,h j)=τ-j×d2 (d2=τ/k);

5.根据式(6)重新计算与查询例子R相似的音频对象,作为新的查询结果返回.

为了更好地说明上述相关反馈机制修正不同模态的数据集在子空间中的拓扑结构,以松鼠、汽车、鸟类三个语义类别的图像和音频为例进行描述: CCA子空间中同时保留了松鼠、汽车、鸟类三个语义类别中的跨媒体典型相关性,这些相关关系在子空间中可能会产生“交叉”或“重叠”,使得在修正因子γ=0的情况下式(6)找到的与鸟类音频之间距离最小的图像有可能是一幅汽车的照片;相关反馈过程中重新对修正因子γ进行赋值,使得式(6)度量的鸟类音频与鸟类图像之间的距离变小,而鸟类音频与汽车图像之间的距离变大,从而更加符合高层的跨媒体语义关系.

4.3 新媒体对象在CC A子空间中的定位

如果查询例子不在数据库中,则此查询例子定义为“新”媒体对象.同构子空间映射算法不能对单一的媒体对象分析相关性并降维映射.为了实现“新”媒体对象在CCA子空间中的定位,需要结合用户反馈中的先验知识.设“新”媒体对象为Z,如果可以准确计算出Z的CCA坐标,则以Z为查询例子的跨媒体检索可以用上述方法实现.Z的CCA坐标的计算如下:

(1)提取Z的底层特征,使用欧氏距离,检索与Z同模态的媒体对象数据库,找到Z的K-近邻作为返回结果;

(2)用户标注两个反馈正例{y1,y2},设y j(j= 1,2)的CCA坐标表示为y j=(y j1,y j2,…,y jm),

则Z的CCA坐标为Z={z1,…,z k,…,z m},其中z k=Mean(y1k+y2k).

此外,还可以根据反馈正例对应的典型变量实现Z的子空间坐标映射.

823

5期张 鸿等:一种基于内容相关性的跨媒体检索方法

5 实验结果与分析

为了验证上述算法的有效性,我们在Win XP 下用VC6.0实现了一个原型系统,支持图像和音频间的跨媒体检索.实验数据集包括10个语义(鸟类、狗、汽车、爆炸、老虎、飞机等等)的多媒体对象,每个语义类别中分别有100幅图像和70段音频数据,其中60幅图像和60段音频例子作为训练数据,其余共400幅图像和100段音频数据作为“新”媒体对象.实验中的图像来自于Co rel 图像库,并从课题组参加TRECVID2006竞赛[3]中搜集了与图像数据相应的音频例子,以进行图像-音频之间的跨媒体检索实验.

从图像数据集提取的视觉特征有HSV 颜色直方图、颜色聚合向量(co lor coherence vecto r )和Tamura 纹理.从音频数据集提取的听觉特征包括质心(centroid )、衰减截止频率(fo lloff )、频谱流量(spectral flux )和均方根(roo t mean square ),这些特征在一定程度上综合反映了音频数据所具有的短时间内平稳、长时间内动态变化的特性.音频是时序数据,所收集的音频例子持续时间均不超过8s ,不同持续时间的音频例子中提取的听觉特征向量的维数也不同,本文采用模糊聚类算法

[4]

,对音频数据集

中提取的所有特征向量统一降维,得到维数相同的音频例子索引.

以下实验结果中的“平均”是指分别在每个语义类别中随机选择了10个不同的查询例子,得到检索结果的平均值.5.1 不同方法得到的跨媒体检索结果

为验证本文方法对图像和音频两种不同模态之间跨媒体检索的有效性,实验根据第3节的方法分析视觉特征和听觉特征之间的典型相关性,并提取典型变量,映射得到保持相关性的CCA 子空间S *

,用式(5)计算图像和音频在子空间中的距离,得出在没有相关反馈情况下的跨媒体检索结果.

实验与传统的PCA 、ICA 和PLS 方法做了对比,分别用这三种方法通过相同的降维映射步骤实现跨媒体检索,过程如下:(1)计算视觉特征矩阵的子空间基向量,映射得到子空间S 1;(2)同样将听觉特征向量都映射到与S 1相同维数的子空间S 2中;(3)根据图像和音频在S 1,S 2中的坐标计算两者间的欧氏距离,以度量跨媒体相关性从而实现检索.

图1列出了本文的方法与传统PCA ,ICA 以及

PLS 方法得到的跨媒体检索结果,其中查准率和查

全率采用与基于内容的图像检索在性能检测时相同的方法计算[7].

图1 没有相关反馈时的跨媒体检索结果对比

图1中的结果是以图像为查询例子检索音频和以音频为查询例子检索图像得到的平均值.可见,在选择相同的视觉和听觉特征作为输入的情况下,本文方法优于传统的PCA ,ICA 和PLS 方法.这是因为典型变量的计算过程是根据视觉和听觉特征的协方差矩阵分析潜在的跨媒体相关性信息,从而映射得到的CCA 子空间S *可以更好地反映高层的语义关系;而传统的PCA ,ICA 和PLS 方法虽然已证明在处理单一模态的特征矩阵时十分有效,但是难以挖掘两种不同的特征矩阵之间的潜在关联.

图2 以汽车的音频为查询例子返回的相似图像

图2是一个具体的跨媒体检索例子,其中输入

824计 算 机 学 报2008年

为一段5.3s 的汽车音频,系统根据本文的方法计算相关性大小(见图2中每幅图像下方的数字),并返回前15个相似图像.可见,返回结果中有12幅图像与音频查询例子描述了相同语义.5.2 相关反馈对跨媒体检索性能的改善

实验在每轮反馈时分别提供2个反馈正例和2个反馈负例,并设定基于增量学习的相关反馈算法中参数τ为

τ=Max (CrossCor )-Min (CrossCor )

(7)

由于在新一轮反馈之后CrossCor (x i ,y j )的值随着γ(x i ,y j )的改变而更新(见第4节中式(6)),因此参数τ可以根据不同的反馈情况而动态更新.

图3显示了当返回结果个数固定为15时,随着相关反馈中用户交互的不断融入,返回结果中正确结果个数的变化过程,包括以音频为查询例子检索图像(I -by -A )和以图像为查询例子检索音频(A -by -I )两部分.

可以看到,经过两次相关反馈I -by -A 和A -by -I 得到的正确结果个数分别比反馈之前提高了44.9%和24.2%,当反馈次数大于等于3时,跨媒体检索结果趋于稳定.由此可见,本文的方法能够快速学习,并修正图像与音频数据集的拓扑结构,从而有效地提高跨媒体检索效率

.

图3 相关反馈对跨媒体检索性能的改善

5.3 相关性保持映射对单模态数据的聚类检测

上述跨媒体检索结果反映的是全局范围上图像和音频数据集之间的拓扑关系,而在CCA 子空间

S *中的单模态检索效率则取决于相关性保持映射得到的局部(即图像数据集内部和音频数据集内部)聚类效果.全局数据关系和局部数据关系在一定程度上相互影响,因此,单模态检索虽然不是本文的研究重点,但是为保持实验的完整性,除了验证全局意义上跨媒体检索的有效性之外,实验还从局部意义上说明了跨媒体检索可达到较好检索性能的原因.图4显示了在相关性保持映射得到的CCA 子

空间S *中根据式(5)得到的图像检索和音频检索

结果.

当返回结果个数为35时,图像检索和音频检索中分别返回25.5和29.1个正确结果,这说明了:相

关性保持映射不但将初始的图像和音频特征向量投影到一个同构的子空间中,而且变换后的特征向量在各自的单模态内部形成较好的聚类效果.这也验证了4.2节中在介绍相关反馈算法之前给出的假设,这也是全局范围内的跨媒体检索和相关反馈策略得以有效实施的前提.

图4 同构子空间中的图像检索和音频检索

6 结束语

传统基于内容的多媒体检索技术受限于单模态,不同模态之间的异构性、相关性度量以及语义提取一直是它面临的主要问题.本文提出并实现了一种基于内容相关性的跨媒体检索方法,使得用户可以通过提交一种模态的查询例子,检索不同模态的媒体对象,并且通过相关反馈有效地修正跨媒体查询结果.

该方法是以分析不同模态媒体数据的底层内容特征为基础,因此除了实验中的音频和图像数据,同样适用于其他两种模态的多媒体对象.不足之处在

于相关性学习只针对两种不同模态的特征矩阵,当

引入第三种模态的媒体数据时,需要建立新的模型以分析三种模态间的相关性,我们可以通过邻接图和多示例学习等方法来改进.

此外,进一步的研究还包括:跨媒体相关性的传递和求精,例如用信念度传递的方式从多个数据空间的角度,而不是从单一角度度量相关性.

考文献

[1]

Zhang H on g -Jiang ,Zhong Di .Schem a for visu al featu re -based im age indexing //Proceeding s of the SPIE ,S torage and Retrieval for Im age an d Video Database .San Diego ,US A ,1995:36-46

825

5期张 鸿等:一种基于内容相关性的跨媒体检索方法

[2]David R H,John S T.KCCA for different level precision in

conten t-based image retrieval//Proceedings of the3rd Inter-

n ational W orkshop on Conten t-Based M ultim edia Indexing.

Rennes,France,2003:51-56

[3]S noek C G M,Worring M,Geu seb roek J M.Seman tic video

search engine//P roceedings of th e TREC VID W orkshop.

Gaithersbu rg,US A,2004:102-105

[4]Zhao Xue-Yan,Zhuang Yue-Ting,Wu Fei.Audio clip re-

trieval with fast relevance feedback based on con strained fuzz-

y clu stering and stored Index table//Proceedings of the Pacif-

ic-Rim Conference on M ultimedia.Taiw an,China,2002: 237-244

[5]M cGurk J M.Hearin g lips an d seeing voices.Natu re,1976,

264(5588):746-748

[6]Hardoon D R.A correlation approach for au tom atic image

ann otation//Proceedings of the2nd International C onferen ce

on Advanced Data M ining and Applications.Xi′an,China,

2006:681-692

[7]Wang Xin-Jing,M a Wei-Ying,Xu e Gui-Rong,Li Xing.

M ulti-model similarity propagation and its application for w eb

image retrieval//Proceedings of the AC M M ultimedia Con-

ference.New York,US A,2004:944-951

[8]M a Qiang,Akiy o Nadamoto,Katsumi https://www.360docs.net/doc/bc9657357.html,plemen-

tary information retrieval for cross-media new s content.Pro-

ceeding s of Information Sy stem s,2006,31(7):659-678 [9]Adams W H,Iyengar G,Lin C Y.Semantic indexing of

mu ltimedia con tent using visual,au dio and text cues.E uras ip

Jou rnal on Applied Signal Processing,2003(2):170-185 [10]Joliffe I T.Principal Component Analysis.New York:

Sp ringer-Verlag,1986:74-81

[11]H an sen L K,Larsen J,Kolenda T.On independent compo-

nent analysis for multimedia sig nals//Gu an L,Kung S Y,

Larsen J.M u ltimedia Im age and Video Proces sing.London:

C RC Press,2000:175-200

[12]Lu W en-Cong,Chen Nian-Yi,Li Guo-Zheng,Yang Jie.

M u ltitask learning u sing partial least square m ethod//Pro-

ceeding s of the7th In ternational Conference on Information

Fusion.S tock holm,Sw eden,2004:79-84

[13]Zhang H ong,Zhu ang Yue-Ting,W u Fei.C ros s-m odal cor-

relation learnin g for clus tering on image-audio dataset//Pro-

ceeding s of the ACM M u ltimedia.Augsbu rg,German,

2007:273-276

[14]Xing E P,Ng A Y,J ordan M I,Ru ssell S.Dis tance metric

learning w ith ap plication to clustering w ith side-information.

Advances in Neural Information Processing S ystem s.Cana-

da,2003,15:505-

512

ZHANG Hong,bor n in1979,Ph.D.,

lec ture r.Her research interests include

content-based multimedia analy sis and

re triev al,machine lea rning.

WU Fei,bo rn in1973,P h.D.,assistant pr ofessor.His

research interests include content-ba sed multimedia re triev al

and statistical learning theo ry.

ZHUANG Yue-Ting,bo rn in1965,Ph.D.,pr ofesso r.

H is research interests include multimedia databa se,ar tificial

intellig ence,content-ba sed multimedia ret rieval and video-

based car to on.

CHEN Jian-Xun,bo rn in1957,Ph.D.,professo r.His

r esear ch inte rests include Web-based multimedia retrieval

and com puter g raphics.

Background

Cro ss-media retrieval discussed in this pape r is a new re-

search topic in content-based multimedia analy sis a nd retriev-

al area.M ost re sear cher s fo cus on how to calculate the simi-

larity between tw o multimedia objects of the same modality.

C ross-media similarity between multimedia o bjects of differ-

ent modalities is difficult to mea sure because of content heter-

o geneity.T his pape r so lv es the problem o f cro ss-media simi-

larity measure w ith semi-supe rvised learning methods,and

suppo r t user interactio n in relev ance feedback.T his paper

basically implements a primary cro ss-media re trieva l sy stem.

T he main limitatio n is tha t cro ss-media indexing strategies

need to be inco rpo rated w he n the size o f multimedia da tabase

is huge.T his w o rk is suppo rted by the Na tional N atural

Scie nce F oundatio n of China(N os.60533090,60525108),

Key T echno lo gy R&D P rog ram(2006BA H02A13-4),the

Na tional High T echno lo gy Research and Deve lopment P ro-

g ram(863P rog ram)of China(2006A A010107),P rog ram for

Changjiang Scholar s and Innova tive Research T eam in U ni-

v ersity(I RT0652,P CSI RT).H etero geneo us multimedia data

stored in digital libr arie s and data centers is semi-str uctured

or unstr uctured,and these multimedia data is co nnected fro m

bo th semantic and co ntent lev el.Abov e pr ojects focus on in-

telligent processing and integ rativ e re triev al techniques to

bet te r utilize multimedia reso urces.T he resea rch team focu-

ses on multimedia semantic learning by content analysis,cross-

media retrieval algo rithms,multimedia da tabase index ing,

etc.,and has published some papers.This pape r fo cuse s on

the part of cro ss-media retriev al alg orithm,w hich solv es the

problem of cross-media similarity measure.

826计 算 机 学 报2008年

2018文献检索途径与方法---线上课程2

找不到的都选C 1、CNKI学术文献总库收录文献类型不包括()。* D.科技报告 8、CNKI的句子检索是指()。* D.全文的同一句或同一段中同时包含两个词 10、CNKI收录的文献数据库不包括()。* 15、CNKI的检索结果不可以按照()进行排序。* D.作者姓名 27、万方数据库无法检索()。* D.年鉴 30、CNKI的检索结果不可以按照()进行分组浏览。* D.主题 3、CNKI数据库的核心期刊遴选体系是()。* A.北大核心期刊要目总览 7、在CNKI学术文献总库中检索“狂犬病发病率”,选择以下哪种检索方式最合适()* A.句子检索 8、维普中文科技期刊数据库的检索途径不包括()。* A.引文检索 11、CNKI的检索结果不可以按照()进行分组浏览。* A.来源数据库 19、CNKI的检索结果可以实现()的批量导出和下载。* A.题录文摘 20、CAJViewer浏览器是下列哪个数据库专用的全文阅读器()* 23、CNKI的检索结果默认按照()格式进行显示。* A.列表 27、()可以实现原貌打印封面和目录页。* 29、CNKI中可检索到核心期刊影响因子的检索方式是()。* A.期刊导航 30、以下哪个数据库可创建个人数字图书馆()* 7、维普数据库不能实现以下哪个功能()* B.查看基金 13、CNKI跨库检索中不包含()。* B.期刊导航 18、CNKI中提供()种格式的全文下载。* B.二 19、CNKI中可以为用户提供有关事实问题答案的检索方式是()。* B.句子检索 21、在维普数据库的传统检索界面检索作者王伟发表的文献,可以通过勾选()选项排除同名不同单位的其他作者。*

文献检索(完整版)

武汉工程大学 文献检索课 综合实习报告 检索课题(中英文):Today’s average car cortains more than 15000 separate, individual parts that must work together.These parts can grouped into four major categories:engine,body,chassis and electrical equipment. 现代汽车有超过15000个零件组成,分成几个必须在一起工作的功能部分,重要包括4个功能部分:引擎,车身,底盘和控制。 姓名: X X 学号: 系(院):总成绩______________________ 班级(文献检索课): 说明及要求 1、本报告中的题录格式书写要求:第一作者、文献标题、文献出处(刊名、年、卷期、起止页码),参照以下格式: Morse SP. Factors in the emergence of infectious disease. Emerg Infect Dis 1995; 53(2): 117-21 2、若指定数据库查不到相关文献,写出检索式,在“检出篇数”一项内填写零。 3、检出篇数指按检索词或检索式实际检出的篇数,而非经人工筛选的切题篇数。列出题录可经人工筛选出最切题的。 4、检索式包括检索词、字段限定、检索途径(简单或高级检索等) 5、在检索结果不理想时,如检出篇数为零时可进行检索词调整,在报告中应对检索策略作说明。 6、“综合检索实习报告”为本课程考核形式,5月30日前由各班班长统一收齐后交报告的打印稿。如两份检索报告相同,两份都记为零分。

文献检索的方法

文献检索的方法 一、文献检索方法 查找文献的方法分为如下三种: 1. 直接法 直接利用检索工具(系统)检索文献信息的方法,这是文献检索中最常用的一种方法。它又分为顺查法、倒查法和抽查法。 (1)顺查法 按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。这种方法能收集到某一课题的系统文献,它适用于较大课题的文献检索。例如,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。 (2)倒查法 倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。此法的重点是放在近期文献上。使用这种方法可以最快地获得最新资料。 (3)抽查法 抽查法是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。 2. 追溯法 不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地追溯查找“引文”的一种最简便的扩大信息来源的方法。它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的相关文献。 3. 综合法 综合法又称为循环法,它是把上述两种方法加以综合运用的方法。综合法既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行追溯检索,分期分段地交替使用这两种方法。即先利用检索工具(系统)检到一批文献,再以这些文献末尾的参考目录为线索进行查找,如此循环进行,直到满足要求时为止。 综合法兼有常用法和追溯法的优点,可以查得较为全面而准确的文献,是实际中采用较多的方法。对于查新工作中的文献检索,可以根据查新项目的性质和检索要求将上述检索方法融汇在一起,灵活处理。 二、文献检索途径

文献检索和阅读技术指导

中科院大博士是如何进行文献检索和阅读 一.如何进行文献检索 我是学自然科学的,平时确实需要不少外文文献,对于自然科学来讲英文文献检索首推Elsevier,Springer等。虽然这些数据库里面文献已经不算少了。但是有时还会碰到查不到的文献,而这些文献的数据库我们所在研究所或大学又没有买,怎么办?我基本通过以下向个途径来得到文献。 1.首先在Google 学术搜索里进行搜索,里面一般会搜出来你要找的文献,在Google学术搜索里通常情况会出现“每组几个”等字样,然后进入后,分别点击,里面的其中一个就有可能会下到全文,当然这只是碰运气,不是万能的,因为我常常碰到这种情况,所以也算是得到全文文献的一条途径吧。可以试一下。同时,大家有没有发现,从Google学术搜索中,还可以得到一些信息,Google学术搜索中会显示出你搜索文章的引用次数,不过这个引用次数不准确,但是从侧面反应了这篇文章的质量,经典文章的引用次数绝对很高的.同时如果你用作者进行搜索时,会按引用次数出现他写的全部的文章,就可以知道作者的哪些文章比较经典,在没有太多时间的情况下,就可以只看经典的. 2.如果上面的方法找不到全文,就把文章作者的名字或者文章的title在Google 里搜索(不是Google 学术搜索),用作者的名字来搜索,是因为我发现很多国外作者都喜欢把文章的全文(PDF)直接挂在网上,一般情况下他们会把自己的文章挂在自己的个人主页(home page)上,这样可能也是为了让别的研究者更加了解自己的学术领域,顺便推销自己吧。这样你就有可能下到你想要的文献的全文了。甚至可以下到那个作者相近的内容的其它文章。如果文献是由多个作者写的,第一作者查不到个人主页,就接上面的方法查第二作者,以此类推。用文章的title来搜索,是因为在国外有的网站上,例如有的国外大学的图书馆可能会把本校一年或近几年的学术成果的Publication的PDF全文献挂在网上,或者在这个大学的ftp上也有可能会有这样类似的全文.这样就很可能会免费下到你想要的全文了. 3.如果上面两个方法都没有查到你要的文献,那你就直接写邮件向作者要。一般情况下作者都喜欢把自己的文献给别人,因为他把这些文献给别人,也相当于在传播他自己的学术思想。下面是本人向老外作者要文献的一个常用的模板: Dear Professor ××× I am in ××× Institute of ×××, Chinese Academy of Sciences.I am writing to request your assistance. I search one of your papers: 。。。。。。。。。。。。。。。。。(你的文献题目)

计算机检索主要途径和方法

计算机检索主要途径和方法 计算机检索途径和方法一、计算机检索概念与原理利用计算机在相关的机读数据库中查找所需文献信息的方式和过程。检索题目检索标识输入计算机标识匹配输出结果目前,绝大多数计算机检索系统完成的匹配为字符串的匹配,而非概念匹配。分析检索要求制定检索策略分析检索题目或内容特点,提取主要概念,找出研究主题和该主题的研究方面,涉及的指标,拟定或查寻相应的检索标志,明确其间的逻辑关系以编制检索算式。计算机检索原理匹配检索提问标识文献特征标识字符串匹配检索系统进行检索标识与文献标识的字符串匹配阿司匹林≠ 阿斯匹林gastric cancer gastric cancer ×gastric tumor 二、计算机检索主要途径和方法1、分类途径按照学科体系和专业类属关系将所收信息进行分类,查找时按类逐级点开。2、主题途径以主题词关键词描述收录信息的特征查找时直接使用最能反映检索要求的事物名称或概念词。依据主题语言规范化程度的不同,主题途径又分为主题词途径、关键词途径和文本词自由词3、篇名途径(摘要/全文)以出现在文献题目中的自由词为检索目标。二、计算机检索主要途径和方法 4、著者途径检索某些特定作者的文献。5、刊名途径检索某些特定出版物的文献。分类途径分类途径主题途径: 主题词主题途径: 自由词(篇名)主题途径: 自由词(篇名)关键词6、逻辑运算逻辑与,运算符多为“AND”或“”逻辑运算包

括逻辑或,运算符多为“OR”或“” 逻辑非,运算符多为“NOT”或“-” A AND B逻辑与:反映概念的交叉和限定关系。A AND B:表示检出同时含有检索词A和检索词B的记录例:心瓣膜病的术后并发症心脏瓣膜疾病AND 手术后并发症 A B A OR B逻辑或:反映概念的或存关系。A OR B:表示检出含有检索词A或检索词B 的记录。例:心瓣膜病及心力衰竭病人的护理心脏瓣膜疾病/护理OR 心力衰 竭/护理 A B A NOT B逻辑非:反映概念之间的剔除关系。 A NOT B:表示在含检索词A的记录中,删除含检索词B 的记录。例:不伴有心律失常的心瓣膜病心脏瓣膜疾病AND NOT 心律失常逻辑运送的优先顺序非与或自上而下从左至右如需改变运算的优先顺序,使用小括号将优先部分括起。如:妇女与儿童吸烟的危害(妇女OR 儿童)AND 吸烟7、截词(通配符)检索⑴有限截词使用“?”、“!”等通配符进行替代检索。一个通配符代表任意一个字符或汉字。如:胃肿瘤:胃肠肿瘤,胃窦肿瘤等。⑵无限截词:使用“”进行截词检索。“”可代替任意的字符。如:child:child children childhood等。肝炎疫苗:肝炎疫苗,肝炎减毒活疫苗,肝炎病毒基因疫苗等。8、二次检索即在当前检索结果中再按现查询条件进一步检索。有些检索系统,二次检索可进行三种逻辑运算。有些检索系统仅默认AND运算的二次检索,多次二次检索可逐渐缩小文献范

网络信息检索途径和方法

网络信息检索方法与途径 作为知识经济时代不可缺少的工具,因特网正将全世界丰富的信息资源带到我们每个人的面前。可以说,人们所需要的信息绝大多数都可在因特网上获得,而且大多数都可以免费获得,关键在于能否准确地找到。用户若想花最少的时间和金钱,获得网络上丰富的信息,掌握一定的检索方法和技巧必不可少。 图书馆作为信息的集散地,在网络的影响下纷纷向着电子化、数字化、网络化方向发展,为了使更多的读者充分利用图书馆资源并实现资源共享,众多图书馆建立了馆藏机读目录数据库并提供网络服务。目前。网上有6000多个电子图书馆,包括美国国会图书馆在内的600多所著名公共图书馆、大学图书馆及4000多个学术机构的馆藏机读书目数据库,通过网络对外开放,它可以完全不受时间、距离的限制,这也是在网络环境下的图书馆优于传统图书馆的地方。 网络的开放性及交互性使得网上有很多动态性很强的信息,如网上新闻、政策法规、通告、会议消息、论文集、研究成果、产品消息、广告、BBS等,这些网上动态信息都是网络信息资源的重要组成部分。 网络信息检索是一种基于超文本方式的信息查询方式,超文本查询是以结点为单位组织各种信息,一个结点是一个“信息块”。在信息的组织上采用网状结构,结点之间通过关系链加以链接,构成表达特定内容的信息网络。网络信息检索策略设计遵循快、准、全及低成本的原则,以实现检索策略最优化。与传统信息检索相比,网络信息检索具有如下特点:

(1)具备网状链拉结构。能够按照不同查询条件链接结构,按照不同查询条件链接点信息,以供浏览、查询,具有较强的索引功能。 (2)信息丰富。结点媒体多样化,每个结点都能集成文本、图形、图像、声音、视频、动画等多种媒体,并能用多窗口图形界面予以表现。 (3)导航能力强。可引导读者在复杂的网络信息图中漫游而不至于迷失方向。用户可以利用导航机制了解其所在网络图中的位置。 (4)良好的编辑功能。包括修改、增加、删除结点和链接的能力,对结点内的信息也具有良好的编辑能力,可以进行多窗口编辑。 (5)数据库(Database)可共享。通过网络共享数据库,可使多个用户同时使用数据库内的信息。 随着因特网信息像原子裂变一样迅速膨胀,要想在浩瀚无边的信息海洋中迅速而准确地获取自己需要的信息,就必须要有专门的搜索工具,在绝大部分的网络信息资源类型中,如果没有这样的工具,任何人都只能是望网兴叹。因此,网络搜索引擎在这种情况下应运而生。搜索引擎,其实也是一个网站,只不过该网专门为用户提供信息检索服务,它使用特有的程序把因特网上的所有信息归类,以帮助人们在浩如烟海的信息海洋中搜寻到自己所需要的信息。搜索引擎按其工作方式分为两类:一类是分类目录型的检索,把因特网中的资源收集起来,由其提供的资源的类型不同而分成不同的目录,一层层地进行分类,人们要找自己想要的信息可按其分类一层层进入,就能找到自己想要的信息;另一类是基于关键词的检索,这种方式用户可以用逻辑组合方式输

信息检索基本方法教案

第五章信息检索的基本方法 5.1 布尔逻辑检索Boolean logic 由GEORGE BOOLE 1815-1864提出,目前大多数搜索引擎都采用 与AND,*,& 或OR,+ ,︱ 非NOT,—,! 逻辑“与”:用关系词AND表示(可写作“*”或“&”)。逻辑“与”表示AND 所连接的两个检索词必须同时在结果中出现才满足检索条件。 逻辑“或”:用关系词OR表示(可写作“+”或“︱”),逻辑“或”表示OR所连接的两个检索词只要有一个能出现在结果中就算满足了检索条件。 逻辑“非”:用关系词NOT表示(可写作“and not”“—”或“!”),逻辑“非”表示NOT后面的那个检索词一定不能在检索结果中出现。 例如:校庆AND 武汉大学 高等教育* 中国 湖南OR 湖北 移动学习+ 泛在学习 大学NOT 武汉大学 玉米–甜玉米 例如,用GFsoso检索,电子AND 读书笔记 电子读书笔记OR 读书笔记软件 5.2 位置限制检索 临近检索(Proximity Search) 以Dialog为例,收900多个数据库 (1)PRE/0,P/0 表示前后词序不能颠倒,中间不能插入其他词,但可以插入符号。 With, (W) 例如:Wuhan P/0 University

(2)PRE/#,P/# 表示前后词序不能颠倒,中间可插入一定数量的单词,即插入#个单词。 例如:Wuhan P/1 University 检索结果:Wuhan Medical University; Wuhan Agriculture University; Wuhan Technology University; (3)NEAR/0,N/0 表示前后词序可以颠倒,但中间不能插入单词。 例如:Wuhan N/0 University 检索结果:Wuhan University;Wuhan – University;Wuhan ,University University, Wuhan; University-Wuhan; University Wuhan (4)NEAR/#,N/# 表示前后词序可以颠倒,中间可以插入#个单词。 例如:Wuhan N/1 University 检索结果:Wuhan Medical University; Wuhan Agriculture University; Wuhan Technology University; University of Wuhan; University in Wuhan; University at Wuhan (5)(s)是sentence的缩写,A(s)B表示A和B必须同时出现在记录的同一个句子或短语中,但次序可以随意改变,A与B之间可以有若干个其他的词。 如:resin (s) ester (酯化树脂) 【练习】1、查找computer和game的间隔不大于100个单词的网页 2、检索“杂交玉米”的外文文献,要求两词间隔1个词,前后次序固定。hybrid、corn 答案:1、computer near/100 game 2、hybrid p/1 corn hybrid w/1 corn

文献信息检索的方法和途径

文献信息检索的方法和途径 自控1106 张国旺 110240173 文献检索方法有多种,主要有: (一)时序检索法。时序检索法是按时间先后次序由近及远或由远及近地查找文献信息的方法。分顺时法、逆时法和分段法三种。 1·顺时序法。这是以课题研究所涉时间为检索起点,由远及近地检索所需文献的方法。适用于需要系统掌握有关文献的研究课题。优点:查全率高并可系统掌握现有的研究成果,便于分析、比较和筛选文献。缺点:所需的检索工具书刊或数据库较全、时间较多,否则反而影响文献检索质量。 例如,查汕头经济特区的发展史料,即可采用顺时法。所涉工具书刊除《全国报刊索引·社会科学》分册及其数据库和中国人民大学书报资料中心编的复印资料有关经济类各分册和索引外,《经济年鉴》、《汕头经济特区年鉴》及有关经济专题索引等检索工具,也是不可或缺的。 2·逆时序法。这是以课题研究所涉时间为检索起点,由近及远地检索所需文献的方法,又称倒查法。适用于新课题或老而有新进展的课题研究所采用。例如“汕头与深圳经济特区利用外资结构的分析研究”,即可采用此法。优点:可迅速掌握本课题的研究动态、新观点、新数据等文献信息,缩短查资料的时间。缺点:漏检率高,以至影响对现有文献的有效利用。 3·分段法。是顺时法与逆时法交替使用的检索方法,又称循环法、交替法。采用此法查找文献大致有两种情况:一是已知在某一时期内有关本课题文献的集中与分散情况;二是已知某一专题学术会议中必议题与时间。凡与本课题有关的

文献集中期,则列为重点检索的时间范围,其它时间内的文献可作为补充性检索。优点:目标明确,可迅速掌握切题文献信息和节省检索时间。但对本课题的研究动态及其脉络必须有清晰的了解。 (二)跟踪检索法。利用所见图书或论文的后附引文索引、脚注、参考文献等所提供的文献线索,循踪觅迹地扩大检索范围的检索方法,又称追溯法、扩展法。这种由此及彼地扩大检索范围的检索方法,往往可以查到意想不到的切题文献。在检索工具不完备的条件下,广泛地利用文献综述或述评、研究报告等文献后所附的参考文献,不失为扩大检索范围的好方法。但扩展法所索文献往往不系统、漏检率也高。 例如:一位研究员要研究一篇大致题为“抗药性害虫适应高温胁迫机理研究”的开题报告,是在完成某一课题的基础上发现某害虫对某农药产生抗药性后,其对高温适应性显著提高。要解决的问题是要阐明为什么该害虫对这种农药产生抗药性后其对高温适应能力反而提高,这方面问题鲜有报道,从何入手?是否有相关借鉴? 再检索害虫对这种药剂的抗药性与其高温适应性之间的联系。

博士生文献检索和阅读方法

中科院大牛博士是如何进行文献检索和阅读 --好习惯受益终生一、如何进行文献检索 我是学自然科学的,平时确实需要不少外文文献,对于自然科学来讲英文文献检索首推Elsevier,Springer等。虽然这些数据库里面文献已经不算少了。但是有时还会碰到查不到的文献,而这些文献的数据库我们所在研究所或大学又没有买,怎么办?我基本通过以下向个途径来得到文献。 1.首先在Google 学术搜索里进行搜索,里面一般会搜出来你要找的文献,在Google 学术搜索里通常情况会出现“每组几个”等字样,然后进入后,分别点击,里面的其中一个就有可能会下到全文,当然这只是碰运气,不是万能的,因为我常常碰到这种情况,所以也算是得到全文文献的一条途径吧。可以试一下。同时,大家有没有发现,从Google学术搜索中,还可以得到一些信息,Google学术搜索中会显示出你搜索文章的引用次数,不过这个引用次数不准确,但是从侧面反应了这篇文章的质量,经典文章的引用次数绝对很高的.同时如果你用作者进行搜索时,会按引用次数出现他写的全部的文章,就可以知道作者的哪些文章比较经典,在没有太多时间的情况下,就可以只看经典的。 2.如果上面的方法找不到全文,就把文章作者的名字或者文章的title在Google 里搜索(不是Google 学术搜索),用作者的名字来搜索,是因为我发现很多国外作者都喜欢把文章的全文(PDF)直接挂在网上,一般情况下他们会把自己的文章挂在自己的个人主页(home page)上,这样可能也是为了让别的研究者更加了解自己的学术领域,顺便推销自己吧。这样你就有可能下到你想要的文献的全文了。甚至可以下到那个作者相近的内容的其它文章。如果文献是由多个作者写的,第一作者查不到个人主页,就接上面的方法查第二作者,以此类推。用文章的title来搜索,是因为在国外有的网站上,例如有的国外大学的图书馆可能会把本校一年或近几年的学术成果的Publication的PDF全文献挂在网上,或者在这个大学的ftp 上也有可能会有这样类似的全文.这样就很可能会免费下到你想要的全文了。 3.如果上面两个方法都没有查到你要的文献,那你就直接写邮件向作者要。一般情况下作者都喜欢把自己的文献给别人,因为他把这些文献给别人,也相当于在传播他自己的学术思想。下面是本人向老外作者要文献的一个常用的模板: Dear Professor ××× I am in ×××Institute of ×××, Chinese Academy of Sciences.I am writing to request your assistance. I search one of your papers: 。。。。。。。。。。。。。。。。。(你的文献题目) but I can not read full-text content, would you mind sending your papers by E-mail? Thank you for your assistance. Best wishes !(or best regards) ××× 本人的经验是讲英语的国家的作者给文章的机率会大,一般你要就会给,其它不讲英语的国家,如德国,法国,日本等国家的作者可能不会给。出于礼貌,如果你要的文献作者E-mail

信息检索基本方法教案.doc

布尔逻辑检索 Boolean logic 由 GEORGE BOOLE 1815-1864提出,目前大多数搜索引擎都 采用与AND,*,& 或OR,+ ,︱ 非 NOT,—, ! 逻辑“与” : 用关系词 AND表示 ( 可写作“ * ”或“ &”) 。逻辑“与”表示 AND 所连接的两个检索词必须同时在结果中出现才满足检索条件。 逻辑“或” : 用关系词 OR表示 ( 可写作“ +”或“︱” ), 逻辑“或”表示 OR所连接的两个检索词只要有一个能出现在结果中就算满足了检索条件。 逻辑“非” : 用关系词 NOT表示 ( 可写作“ and not ”“ —”或“ ! ” ), 逻辑“非”表示 NOT后面的那个检索词一定不能在检索结果中出现。 例如:校庆AND武汉大学 高等教育 *中国 湖南 OR 湖北 移动学习 + 泛在学习 大学 NOT 武汉大学 玉米–甜玉米 例如,用 GFsoso检索,电子AND读书笔记 电子读书笔记 OR 读书笔记软件 位置限制检索 临近检索( Proximity Search) 以 Dialog 为例,收 900 多个数据库 (1)PRE/0, P/0表示前后词序不能颠倒,中间不能插入其他词,但可以插 入符号。 With,(W) 例如: Wuhan P/0 University (2)PRE/#, P/#表示前后词序不能颠倒,中间可插入一定数量的单词,即

插入 #个单词。 例如: Wuhan P/1 University 检索结果:Wuhan Medical University ; Wuhan Agriculture University ; Wuhan Technology University ; (3)NEAR/0,N/0表示前后词序可以颠倒,但中间不能插入单词。 例如:Wuhan N/0 University 检索结果: Wuhan University;Wuhan–University;Wuhan,University University, Wuhan; University-Wuhan; University Wuhan (4)NEAR/#,N/#表示前后词序可以颠倒,中间可以插入#个单词。 例如: Wuhan N/1 University 检索结果: Wuhan Medical University; Wuhan Agriculture University; Wuhan Technology University; University of Wuhan; University in Wuhan; University at Wuhan (5)(s)是 sentence 的缩写, A( s) B 表示 A 和 B 必须同时出现在记录的同一个句子或短语中,但次序可以随意改变, A 与 B 之间可以有若干个其他的词。 如: resin (s) ester (酯化树脂) 【练习】 1、查找 computer 和 game的间隔不大于 100 个单词的网页 2、检索“杂交玉米”的外文文献,要求两词间隔 1 个词,前后次序固 定。 hybrid 、corn 答案: 1、computer near/100 game 2、hybrid p/1 corn hybrid w/1 corn

4文献检索的原理方法与步骤1

重点:文献检索的方法步骤 难点:文献检索原理 授课内容:第四章文献信息检索原理及方法步骤 4.1 检索原理 文献检索包含文献的存储与检索两个部分,对用户而言,后者更为重要。只有经过组织有序的信息集合体才能提供检索的途径,才有用于检索的功能。文献的编排、组织与检索查询有对应的关系,因此了解一个文献系统的组织方式也就找到了检索的根本方法。 ⑴检索点:每件信息都包含有其内部及外部特征(即信息的属性),文献与课题的主要特征信息可以用来作为检索的出发点和匹配依据,它们称作检索点(access point),这些检索点包括分类、主题、著者、题名、机构名称、代码等。 ⑵检索手段:检索是通过检索工具(系统)和检索方式方法来实现的。无论是用手工检索书本式的工具,还是用计算机检索数据库获取文献资料,都有分类、主题、代码等多种检索途径。 ⑶检索系统:包含网络条件、技术设备(存储服务器、计算机)及文献信息集合体(数据库)。 检索系统按存储的媒体和技术手段来分,检索系统有两种:手工检索工具(印刷型的检索性刊物与参考工具书)和计算机检索系统(各种数据库)。

文献存储和检索原理:是使用户的课题提问标识与检索系统中的信息特征标引标识尽相一致地选择与匹配。如图1—3: 图6—1 信息用户的需求和信息集合的比较与选择,即匹配的过程。从用户需求出发,对一定的信息集合(系统)采用一定的技术手段,根据一定的线索与准则指出(命中)相关信息。 各种检索系统的检索原理基本相同。简单地讲,就是检索提问标识与存储在检索工具中的标引标识进行比较,两者一致或信息标引的标识包含着检索提问标识,具有该标识的信息就从检索工具输出,输出的信息就是检索命中的信息。 信息检索的全过程包括存储和检索两个过程。存储过程就是按照检索语言(主题词表或分类表)及其使用原则对原始信息进行处理,形成信息特征标识,为检索提供经过整序(即形成检索途径)的信息集合的过程。具体来说,信息的存储包括对信息的著录、标引以及编排正文和所附索引等。所谓信息的著录是按照一定的规则对信息的外表特征和内 容特征加以简单明确的表述。信息的标引是就信息的内容按一定的分类表或主题词表给出分类号或主题词。检索过程则是按照同样的分类表(或主题词表)及组配原则分析课题,形成检索提问标识,根据存储所提供的检索途径,从信息集合中查获与检索提问标识相符的信息特征标识的过程。因此

常用网上信息检索方法综述

常用网上信息检索方法综述 学生姓名:常** 专业:信号与信息处理学号:201520601001 教师:黄文清老师

摘要 因特网的普及和发展给人们带来了空前丰富的信息资源,越来越多的用户利用网络阅读和查询所需信息,网上阅读和检索已成为人们获取信息的重要途径。如何认识和利用浩瀚如海的网络信息,快速查找并准确获取所需资源,需要掌握一定的网络检索方法和技巧以便捷地对互联网进行检索查询,提高搜索的命中率。 关键词:因特网;信息资源;检索方法

ABSTRACT The popularity of the Internet and development brings unprecedented rich information resources, more and more users use the network reading and required information query, online reading and retrieval has become an important way of access to information. Such as how to understand and use the vast sea of network information, quick search and accurately obtain the resources needed, need to master certain network retrieval methods and techniques to conveniently Internet search queries, improve search hits. Keywords: Internet, Information resources, Retrieval methods

信息检索原理与技术考试大纲重点整理培训讲学

《信息检索原理与技术》 第1章信息检索概论 (1)一次文献信息:是指作者以自己的研究成果为基础创作或撰写的、未经过加工的原始文献,如期刊论文、研究报告、学位论文等。 (2)二次文献信息:是指对一次信息加工整理而成的文献,如目录、文摘、索引等各种书目信息,具有汇集性、工具性、综合性、系统性的特点。 (3)三次文献信息:是对一、二次信息综合、分析等深加工的产物,如评论、进展报告、百科全书、期刊书目等。 (4)文献:记录有知识的一切载体,即知识信息必须通过文献载体进行存储和传递。 (5)构成文献的要素:构成文献内核的知识信息、负载知识信息的物质载体、记录知识信息的符号和技术。 (6)文献的特征:知识性(文献的本质,离开知识信息,文献信息便不复存在);传递性(帮助人们克服时间与空间上的障碍,在时空中传递人类已有的知识,使人类的知识得以流传和发展);动态性(其所蕴含的知识随着人类社会和科技的发展在不断地、有规律地运动着) (7)信息、知识和文献的联系:信息作为物质的一种普遍属性,是生物以及具有自动控制系统的机器通过感觉器官和相应的设备与外界进行交换的一切内容,它是有形的、独立于行动和决策、经过处理改变形态、物质产品、与环境无关、可以复制的;知识作为信息的一部分,是一种特定的人类信息,也是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映,它是无形的、与行动和决策相关、经过处理能改变思维、精神产品、环境改变含义、经过学习才能转让、无法复制的;文献是知识的一部分,是进入人类社会交流系统的活动着的知识。 (8)文献信息流有序化阶段的三个环节: ①替代。描述文献特征,对一次文献信息进行不同程度的提炼或压缩,形成目录、文摘、索引等二次文献信息。从文献信息流的运动角度看,“替代”是文献信息流的流量、流向得到测度并合理调节。 ②改组。从一次文献信息中提取数据、事实和有关结论,按照易于查阅的提醒重新组合,其改组的结果,产生了手册、名录、辞典、目录等类型的文献信息。其目的是使一次文献信息更容易被理解和使用。 ③综合。利用二次文献对一次文献所包含的知识加以综合并融入到现有知识体系中去,成为整个知识体系的有机组成部分,产生的主要成果是不断再版的百科全书、专著、教科书及综述、评论性文章。 文献信息流失一个以研究活动为起点。按顺时针的线性顺序移动,是一次、二次、三次文献信息的演变过程。对于“文献信息链”的研究,有利于从整体的角度了解文献信息的有序化、动态性特征,从而探索文献信息的产生、演变规律及其结构形态。 (9)信息检索:广义理解分为信息的存储与检索。信息的存储主要包括在某一专业领域范围内的信息选择的基础上对信息的内外特征进行描述、加工并使其有序化,形成信息集合。信息的检索是指借助一定的设备与工具,采用一系列方法与策略从信息集合中查询所需的信息。狭义的信息检索仅指该过程的后一部分。存储是检索的基础、检索是存储的反过程。信息检索的本质是用户的信息需求和一定的信息集合的匹配。

信息检索原理与技术考试大纲重点整理

信息检索原理与技术考试大纲重点整理

序移动,是一次、二次、三次文献信息的演变过程。对于“文献信息链”的研究,有利于从整体的角度了解文献信息的有序化、动态性特征,从而探索文献信息的产生、演变规律及其结构形态。 (1)信息检索:广义理解分为信息的存储与检索。信息的存储主要包括在某一专业领域范围内的信息选择的基础上对信息的内外特征进行描述、加工并使其有序化,形成信息集合。信息的检索是指借助一定的设备与工具,采用一系列方法与策略从信息集合中查询所需的信息。狭义的信息检索仅指该过程的后一部分。存储是检索的基础、检索是存储的反过程。信息检索的本质是用户的信息需求和一定的信息集合的匹配。 (2)信息检索系统:指为了满足用户的信息需求而建立的存储,经过加工了的信息集合,拥有一定的输入、匹配、输出的技术设备,提供一定的检索服务功能的一种相对独立的实体。 (3)信息检索入口:又称检索点或检索知识,是指用以标识信息的外部特征和内容特征的属性值的集合。检索知识包括主题词、分类号、著者、标题、机构、代码等。 (4)信息检索的一般原理:P7 (5)检索系统由物理构成(硬件、软件和数据库)和逻辑构成(文献与数据的选择与抽取子系统、词表子系统、标引子

系统、查询子系统、用户与系统交互子系统、匹配子系统)(6)检索工具的构成:编辑说明与凡例、分类表与主题表、正文、辅助索引、资料来源目录与附录。 (7)检索系统的功能:报道功能、存储功能、检索功能。(8)信息检索理论:标引理论、检索模型、检索结果的可视化。 (9)现代信息检索技术与方法:全文检索、多媒体检索、超文本及超媒体检索、联机检索、网络信息检索、智能检索、跨语言检索、跨平台检索。 第2章信息检索模型 (1)最初的信息检索模型是以数学知识为基础的原因:第一,数学是个有几千年历史的学科,被大家所熟知,并且通俗易懂。第二,人们的信息有很大的模糊性,甚至用文字不能表达,而文字具有很大程度的抽象性和概括性,这样就很容易表达出人们信息检索的需求,能够很方便快捷地组建信息检索模型。 (2)信息检索模型的类型:P18 (3)布尔检索模型:采用布尔代数和集合论的方法,用布尔表达式表示用户提问,通过对文献标识与提问式的逻辑运算来检索文献。 (4)布尔逻辑运算符:逻辑与(AND)、逻辑或(OR)、逻

文献检索的基本方法和途径——内容

所谓检索工具是按一定学科一走主题进行收集、整理,并给以文献检索标识,及时报道的二次文献,具有存储、检索和报道信息的功能。 检索工具应具备下述三个条件: (1)详细记录所著录文献线索,读者可根据这些线索查找所需文献。 (2)根据检索标识,如分类号、主题词、文献号代码等寻找所需文献。 (3)提供检索的必要手段,如分类索引、主题索引等,便于读者检索。 检索工具的类型 按出版形式划分 按加工程度划分

按收录范围划分

按检索方法划分 检索工具内容结构 检索工具的内容结构大致由四部分组成: 编辑使用说明 为使用者提供必要的指导,包括编制目的、使用范围、收录年限、各种著录格式、查找方法及注意事项,常以编辑说明作一介绍。 正文部分 检索工具记录的不是文献的全文,仅著录文献的外部特征和内容特征,包括文献篇名、著者和文献来源正文部分。是检索工具的主体,如为文摘式,除上述项目外还有文摘供读者进行文献筛选。 索引部分 检索工具正文部分多按分类编排,检索时为提高检索效率,可利用各种索引,如主题索引、著者索引、专利索引等,索引种类越多,检索途径越多,检索效率越高。 附录部分 包括摘用的刊物、各种名称的缩写、文字的翻译、术语和文献入藏单位及代号等。 检索工具的质量评价 各种检索工具都必须具备存储、检索和报道信息的功能,检索工具质量大致可从下述几个方面进行综合评价。 1.看学科收录范围是否广泛,以专业面覆盖的大小、摘录出版物的类型多少、报道量的多少为主要的衡量标准。 2.报道速度快慢。从文献发表到检索工具中的时间差。 3.检索途径多寡,索引体系是否齐全。 4.标引质量高低,对文献进行标引的深度。

信息检索的基本原理

图书馆胡小莉

目录 第一节信息检索的涵义及类型 第二节信息与信息源 第三节信息检索途径与步骤 第四节信息检索效果的评价 4123

学习目的和要求 1、掌握信息检索的基本概念和类别 2、掌握常用的布尔逻辑、截词、位置检索等检索技术 3、了解信息检索的基本流程

第一节信息检索的涵义及类型 信息检索的涵义 广义:是指将信息按一定的方式组织和存储起来, 并根据信 息用户的需要找出有关信息的过程和技术。全称为“信息存 储与检索”。 狭义:是指该过程的后半部分,即从信息集合中找出所需要 的信息的过程, 相当于人们通常所说的信息查寻。 信息检索的原理:就是将读者(用户)的信息需求与存贮在信息集合体中的信息进行比较和选择,即匹配(match)的过程。即对信 息集合与需求的匹配与选择。

检索与查找的区别 检索查找、搜索、搜寻英文Retrival或Retrieval search 过程和方法有一定的策略,是 系统的查找资料随机或更随意一些。 技能需要一定的专门知 识和技能 简单,任意词用途课题或专题日常生活 结果检索前通常不知道 会有什么结果 通常知道结果效率迅速、准确一般 如果不刻意区分:你完全可以认为它们没有区别!

信息检索的类型 根据信息检索对象形式不同,分为: 分类检索内容 书目检索以文献线索为检索对象的文献检索; 信息用户通过检索获得的是与检索课题有关的一系列文 献线索,然后再通过阅读决定取舍。 全文检索以文献所含的全部信息作为检索内容的; 可以查找到原文或相关的句、段、节、章等文字。 计算机检索发展趋势之一 数据检索以数值或图表形式表示的数据为检索对象; 数据检索是一种确定性检索,用户检索到的各种数据是 经过专家测试、评价、筛选过的,可直接用来进行定量 分析。 事实检索以从文献中抽取的事项为检索内容; 包括事实、概念等非数值信息和数据信息; 确定性检索,用户获得的是有关某一事物的具体答案

文献检索方法

概论思考题 1.简述文献检索的定义。 2.简述文献信息资源类型的划分。 3.简述文献数据库的检索途径。 4.主题语言有几种?简要阐述其特点。 5.什么事查全率和查准率,二者之间有何关系? 6.简述常用的文献检索技术。 7.试述扩大检索范围、提高查全率的方法。 1、文献检索是指根据学习和工作的需要获取文献的过程。近代认为文献是指具有历史价值的文章和图书或与某一学科有关的重要图书资料,随着现代网络技术的发展,文献检索更多是通过计算机技术来完成。 2、按加工情况分,可有一次文献、二次文献和三次文献; 按载体形式分,可有书写文献、印刷文献、缩微文献、音像文献、机读文献等; 按内容的学科范围分,则有社科文献、科技文献等。 一种具体的文献可能具有两种或两种以上文献类型的特征,如《南京大学学报(社科版)》

既是期刊,又是一次文献,也是印刷文献和社科文献。国家标准《文献类型与文献载体代码》(GB3469-83)根据实用标准,将文献分成26个类型,即:专著、报纸、期刊、会议录、汇编、学位论文、科技报告、技术标准、专利文献、产品样本、中译本、手稿、参考工具、检索工具、档案、图表、古籍、乐谱、缩微胶卷、缩微平片、录音带、唱片、录相带、电影片、幻灯片、其他(盲文等)。 按文献表现形式特征有11类:图书、报刊、学位论文、会议资料、专利文献、科技报告、产品资料、科技档案、标准资料、政府出版物和网络文本。 4、主题语言是直接以表达主题内容作为标识、以字顺作为主要组织方式的检索语言。主题语言具有的特征一般有:直接以词语作为检索标识;以字顺作为主要检索途径;以特定的事物、问题、现象,即主题为中心集中信息资源;通过参照系统等方式揭示概念之间的关系。主题语言按选词方式分为:(1)关键词语言(2)标题词语言(3)单元词语言(4)叙词语言。 5、查全率和查准率是检索系统最为流行和重要的两个性能和效果评价指标。查全率(R)和查准率(P)的定义可以用如下公式表示:R=检出的相关信息量/检索工具中相关信息总量×100%;P=检出的相关信息量/检出的信息总量×100% R和P之间具有密切关系,如果检索工具的查全率较高,则其查准率将相对下降;反之查准率高,则查全率低;而且查全率和查准率只能相对提高,二者永远不可能达到100%。 6、(1)布尔逻辑检索 利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种技术。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。 (2)截词检索 截词检索是计算机检索系统中应用非常普遍的一种技术。由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等。这是就要用到截词检索 (3)位置检索 位置检索也叫全文检索、邻近检索。所谓全文检索,就是利用记录中的自然语言进行检索,词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限制。这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。 (4)字段限定检索 字段限定检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。在检索系统中,数据库设置的可供检索的字段通常有两种:表达文献主题内容特征的基本字段和表达文献外部特征的辅助字段。

相关文档
最新文档