信息检索中的相关性研究_马芳

合集下载

信息检索与信息素养概论(第二版)第7章 中文报刊与图书数据库检索方法

信息检索与信息素养概论(第二版)第7章 中文报刊与图书数据库检索方法

检索字段选择更加明确
以上图片截图来源于/ZK/index.aspx
《信息检索与信息素养概论》
二、维普资讯网 3 高级检索
维普的高级检索可用选择式,更有为专业人士提供的直接输入检索式的检索方式
以上图片截图来源于/ZK/index.aspx
《信息检索与信息素养概论》
二、维普资讯网 4 期刊导航
期刊导航共四种查询方式, 点击之后逐步检索,步骤和 前几种方法一样。
以上图片截图来源于/journal/index.aspx
《信息检索与信息素养概论》
二、维普资讯网 (三)检索结果
维普资讯网检索结果界面多数可显示检索条件、检索命中文献总篇数,并将检索 中结果以“序号、全文下载、标题、作者、出处”的等等题录形式加以显示。如
《信息检索与信息素养概论》
二、维普资讯网 3 检索范围、年限时间选择 2 传统检索
2 检索式的输入
或5 进行二次检索
1 检索入口选择
4检索入口选择
以上图片截图来源于/zk/custom.aspx
《信息检索与信息素养概论》
二、维普资讯网 3 高级检索
与快速基本检索和传统检 索相比多了相对应的比较
详细结果显示
两种也读方式: 在线阅读 下载全文
注意:维普资讯网的全文显示格式有维普浏览器和PDF全文浏览器两种,第一次阅读全文必须下载安装其中一 个,否则无法阅读全文。
《信息检索与信息素养概论》
三、万方数据知识服务平台
(一)数据库概况
国内最大的数字资源库系统,由中国科技信息研究所直属的万 方数据公司开发。包含科技信息系统(学位论文数据库、数字化期 刊、学术会议数据库、商务信息系统)。其中,数字化期刊数据库 子系统是以中国科技论文与引文数据库及其他相关数据库中的期刊 条目部分内容,基本包括我国文献计量单位中自然科学类统计源期 刊和社会科学类核心源期刊,集纳理、工、农、医、人文五大类70 多个类目共2500多种科技类核心期刊全文。不仅是我国首家网上期 刊的出版联盟,而且是核心期刊测评和论文统计分析的数据源基础。

基于机器翻译的跨语言信息检索方法

基于机器翻译的跨语言信息检索方法

基于机器翻译的跨语言信息检索方法跨语言信息检索是信息检索领域的一个重要研究课题,随着全球化的发展和互联网的普及,不同语言之间的信息获取需求越来越迫切。

而应运而生,成为研究者关注的焦点之一。

在传统的信息检索系统中,用户通常只能利用所掌握的语言进行查询,这限制了信息的获取范围。

而跨语言信息检索则能够帮助用户利用一种语言输入查询,然后将查询翻译成其他语言进行检索,从而获取更多的相关信息。

然而,由于不同语言之间存在词汇、语法、语境等方面的差异,跨语言信息检索面临着种种挑战。

为了克服跨语言信息检索中的困难,研究者们提出了各种方法和技术。

其中,基于机器翻译的跨语言信息检索方法是一种比较常见和有效的方法。

这种方法利用机器翻译技术将用户查询翻译成目标语言进行检索,然后将检索结果翻译回用户输入的语言,最终呈现给用户。

通过这种方式,用户可以获取到更广泛的信息,同时也能够跨越语言障碍。

基于机器翻译的跨语言信息检索方法有许多优点。

首先,它能够有效地扩展用户的检索范围,让用户获取到更多的相关信息。

其次,这种方法可以帮助用户快速了解其他语言的信息,促进了不同语言之间的文化交流和信息共享。

此外,基于机器翻译的跨语言信息检索方法还可以提高信息检索系统的覆盖率和准确率,为用户提供更好的检索体验。

然而,基于机器翻译的跨语言信息检索方法也存在一些挑战和限制。

首先,机器翻译技术的准确性和流畅度直接影响了跨语言信息检索的效果。

如果机器翻译的质量不高,可能会导致检索结果不准确或不完整。

其次,不同语言之间的语言特点和文化背景差异也会影响翻译的质量,从而影响跨语言信息检索的效果。

另外,对于一些特定的领域或专业术语,机器翻译的效果可能会受到影响,导致信息检索的准确性下降。

为了提高基于机器翻译的跨语言信息检索方法的效果,研究者们提出了许多改进和优化的方案。

例如,可以结合机器学习和人工智能等技术,提高机器翻译的准确性和流畅度;可以利用语料库和大数据等资源,改进翻译模型,提高跨语言信息检索的效果;还可以研究词向量和语义分析等技术,提高对于语义信息的理解和处理能力。

信息检索题库+参考答案终极版

信息检索题库+参考答案终极版

四川师范大学信息检索课后作业A、信息素养B、信息安全C、信息检索D、信息评价2.(第1章?多选)信息素养的基本构成具体包括(ABCD)A、信息知识B、信息意识C、信息能力D、信息伦理3.(第1章?多选)信息意识具体包括(ABCD)。

A、4.(第A、B、D、信息素养教育的目标是培养终身学习能力,而信息素养教育自身也是一个终身学习的过程,信息素养教育与终身学习能力是一个相互增进、螺旋提高的关系。

5.(第1章?多选)信息素养是指:基于(ABC),通过确定、检索、获取、评价、管理、应用信息解决所遇到的问题并以此重构自身知识体系的综合能力和基本素质。

A、信息意识B、信息知识C、信息伦理D、信息评价6.(第1章?多选)2000年1月18日,美国大学与研究图书馆协会(ACRL)标准委员会审议通过了《高等教育信息素养能力标准》,其中包含5项标准和22项具体指标。

下列属于5项标准的是(ABCD)。

A、具有信息素养的学生能够确定所需信息的性质和范围B、具有信息素养的学生能够有效和高效地获取所需信息C、具有信息素养的学生能评价信息及其来源并将选取的信息整合入其知识基础和价值体系中D、具有信息素养的7.(第A、8.(第A、9.(第A、10.(第一种基本人权。

√11.(第1章?判断)作为信息素养的基本构成,信息知识、信息意识、信息能力和信息伦理四个要素相辅相成、不可分割。

其中,信息意识是先导,信息知识是基础,信息能力是核心,信息伦理是保障,四个要素共同构成了一个统一的整体。

√12.(第1章?判断)2005年北京高教学会图书馆工作研究会提出了《北京地区高校信精品文档-可编辑息素质能力指标体系》。

这个指标体系从信息意识、信息知识、信息能力、信息伦理四个方面提出了高校学生应具有的信息素养要求,具体由7个一级指标,19个二级指标,61个三级指标组成。

√13.(第1章?判断)以“信息社会在行动:信息素养与终身学习”为主题的《亚历山大宣言》指出,信息素养和终身学习是信息社会的灯塔,照亮了通向发展、繁荣和自由的道路。

《信息检索技术》书中答案

《信息检索技术》书中答案
(A)信息的存储(B)信息的收集(C)信息的传递(D)信息的处理
答案1.D 2.C 3.A 4.B 5. B 6. B 7.C 8.A 9.A 10.B
第4章专利与标准文献检索
一、填空题
1.世界上的发明可分为两大类型:一类是____________;一类是_____________。
2.______________是指对产品的形状、构造或者其结合所提出的适于实用的新的技术方案。
(A)万方数据库 (B)CNKI(C)维普中文科技期刊数据库(D)中国知网
6.万方数据资源按照资源的类型来分,可以分为_________信息资源。
(A)全文类 (B)文摘题录类 (C)事实型(D)多媒体类
答案1.B 2.ABCD 3.ABCD 4.ABC 5.BD 6.ABD
第3章搜索引擎应用
一、填空题
6.针对性强
7.先进性
8.标准文献的标准号或标准名称
二、判断题
1.新颖的茶具造型及图案设计属于外观设计专利保护的对象。( )
2.国际专利分类(IPC)一共分为8个部,其中D部的内容是人类生活所需。( )
3.专利号即为专利申请号( )
4.按照标准化对象划分,通常把标准分为技术标准、管理标准和工作标准三大类。( )
(A)检索有关三门的相关信息(B)检索蛇盘岛的相关信息
(C)检索三门蛇盘岛的相关信息(D)检索除了三门以外的蛇盘岛信息
3、某同学打算使用搜索引擎在因特网上查找“嫦娥二号”探月卫星发射时使用的燃料信息,为了提高搜索效率,他应使用的最佳关键词是()
(A) 嫦娥二号 燃料(B) 嫦娥
(C) 嫦娥二号(D) 发射 燃料
6.检索工具按信息加工的手段可以分文__________、____________、___________。

信息检索原理

信息检索原理

D9 法律 90 法的理论(法学) 91 法学各部门 92 中国法律 920.0 理论 (类名含义:中国法律理论) 921 国家法、宪法 923 民法 . . .
中图分类法 (3)
涉及二个或二个以上概念的课题属于多概念课 题,对多概念课题缺点分类关系时,应注意以下几 点: .并列概念课题:对于涉及同一研究对象的几个方 面或者涉及几个并列研究对象的课题,凡是有主次 关系的,应取其重点或主要研究对象归类。设计统 一研究对象几个方面的都需要检索时,应在所涉及 的几个类目中同时查找。 比如:“新闻宣传研究”,如果侧重于“新闻” 就取“G212 新闻财富和报道”,如果侧重宣传, 则取“G223 广播电视宣传和群众工作”。如果设 计二个方面时,“新闻”和“宣传”都要查找。
分析研究课题,明确检索要求 选择检索工具或检索系统 确定检索途径 实施检索,记录和阅读文献线索 索取原始文献
3.1 研究课题的分析
分清课题性质 前沿探索性 调查研究性 面象应用性 课题背景知识的获取 利用网络搜索引擎 查阅图书馆相关馆藏,专著、工具书 询问专业人员 概念(检索词)提取 主要检索词、辅助检索词、禁用词 例如:关于中国唐诗的韵律研究 Study on the market management in China
根据课题的已知条件和课题范围和检索效率要求,选择 合适的检索途径。题名/关键词/摘要/主题/全文
主题途径
分类检索语言(分类法、分类表) 分类表,依据学科之间的逻辑归属关系,采用树型层次结构, 列举出人类全部知识类别,并对每一知识分别标以相对固定的类 号代码形成的一种类表。通常是一种从总到分、从一般到具体, 层层划分、逐级展开并具有某种符号代码体系的知识体系表。 特点:常落后于当前研究现状,分类表相对呆板的学科关 系使得确定前沿概念、跨学科概念或非常具体的概念分类困难。 主题检索语言 关键词 自然语言性质的主题语言,自由词,指从标题、文摘或正 文中抽出的能表达文献主题内容的实意词。自然性,随意性。 主题词(叙词) 以正式、规范的词或词组形式固定各种事物概念。从自然 语言中优选出并经规范化处理的名词术语。

信息检索知识点

信息检索知识点

信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。

2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进展相符性比较,但凡信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,那么具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。

3.为什么说信息存储和检索是两个不可分割的有机体.检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。

存储过程主要是利用检索语言对文献进展标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进展标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进展比较。

检索过程是存储过程的逆过程。

因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。

4.信息检索的方法〔1〕顺查法〔2〕倒查法〔3〕抽查法〔4〕追溯法〔5〕循环法5.信息检索的途径〔1〕部特征途径a)分类途径b)主题途径〔2〕外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:〔1〕简单,形式简洁,易于理解;〔2〕可操作性强,应用广泛;〔3〕构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常准确的语义概念;〔4〕能处理构造化提问。

缺点:〔1〕表达用户复杂需求效果欠佳〔2〕准确匹配无法提供定量比较〔3〕匹配标准不尽合理〔4〕检索结果不易控制7.概率排序原那么:如果一个检索系统对用户的每个检索提问的反响是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。

8.什么是计算机信息检索.所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那局部信息的过程。

我国护理人员流失现状的文献计量分析

我国护理人员流失现状的文献计量分析

当代护士2021年4月第28卷第11期(中旬刊)・103・我国护理人员流失现状的文献计量分析卓俟岐马芳白阳娟摘要目的了解我国护理人员流失的现状、发展趋势,为减少护理人员流失提供相关策略。

方法检索中国知网数据库、万方数据库、维普数据库,运用文献计量学方法对建库以来我国护理人员流失论文的发文量、机构、省份、关键词、基金、期刊进行分析。

结果共纳入302个研究;研究发现综合医院比专科医院、学校、或附属医院更关心人员流失的问题;发文地区主要集中在北京、江苏、上海等经济发达地区;研究热点集中在流失的原因及对策;13个研究获得基金支持;共发表在111种医学期刊上,发文较分散。

结论我国护理人员流失问题普遍存在,亟待解决。

但相关研究质量参次不齐,发文地域相对集中,研究内容及对象局限,研究认可度不高,基金支持不够。

关键词:护理人员;流失;文献计量学人员流失是指专业技术人员由于各种原因流动而放弃原来所从事的专业岗位或离开国土赴境外就业的一种人力资源流通现象⑴。

近年来,护理人员流失造成护士短缺已经成为一个全球性的问题S6]。

护士离职加剧了护理人力资源的严重短缺,影响着护理质量及患者满意度,影响护理事业的发展⑺o科技的进步,人们生活水平的提高,对医疗卫生的要求也在不断的提高,尤其对护理服务质量的要求也随之提高⑻。

2017年我国注册护士总数380万人左右,每千人口护士数2.74,医护比为1:1・11⑼。

我国护理人力资源仍然严重短缺,且各级医疗卫生机构普遍存在护理人力资源持续流失的问题[⑹。

本研究对近年来发表的有关护理人员流失的相关文献进行文献计量学分析,以了解护理人员流失研究现状、特点,以及发展趋势,为减少人员流失举措提供依据,也为护理研究者今后开展有关护理人才流失领域的研究提供参考。

1资料与方法1.1文献来源与检索策略计算机检索中国期刊全文数据库(CNKI)、维普中文科技期刊数据库(VIP)、万方数据库,以主题=“护理人员”or“护士”or“护理”or“护理人力资源”or“护理人才”and“流失”or“离职”or“辞职”进行精确检索,检索时间设定为“不限一2018年12月8日”。

基于自然语言处理技术的跨语言信息检索研究

基于自然语言处理技术的跨语言信息检索研究

基于自然语言处理技术的跨语言信息检索研究一、前言随着全球化的发展和文化交流的日益频繁,跨语言信息检索成为信息科技领域的一项重要研究课题。

自然语言处理技术的定量化处理和自动化分析将会极大地促进跨语言信息检索研究的进展。

本文就基于自然语言处理技术的跨语言信息检索研究进行探讨。

二、自然语言处理技术在跨语言信息检索中的应用1、语言翻译技术语言翻译技术将文本从一种语言翻译为另一种语言,这为跨语言信息检索提供了技术保障。

此外,利用自然语言处理技术,更好地实现了语言翻译技术的自动化和定量化处理。

2、文本相似度匹配技术文本相似度匹配技术是利用自然语言处理技术更好地处理跨语言信息检索中的文本匹配问题。

在跨语言信息检索中,为了保证搜索结果的准确性,在文本匹配阶段需要对文本特征进行分析和提取,并利用文本相似度匹配技术进行匹配和排序。

三、基于自然语言处理技术的跨语言信息检索研究进展1、跨语言信息检索模型跨语言信息检索模型是通过对文本语言之间的异质性进行模型化,实现不同语言之间信息检索的技术。

基于自然语言处理技术,研究人员已经开发出一系列跨语言信息检索模型,为跨语言信息检索提供了广阔的研究空间。

2、跨语言信息检索中的语言选择问题跨语言信息检索中的语言选择问题是指,当使用者需要检索一种语言的信息时,如何选择用于查询翻译的目标语言。

针对这一问题,研究人员已经开发出一系列基于自然语言处理技术的语言选择算法,为跨语言信息检索中的语言选择问题提供了解决方案。

四、自然语言处理技术在跨语言信息检索中的应用案例1、文献库检索案例以医学论文库检索为例,研究人员使用了自然语言处理技术进行跨语言信息检索。

结果表明,在使用自然语言处理技术后,检索效果得到了显著提升。

2、跨语言交互式信息检索案例研究人员利用自然语言处理技术实现了跨语言交互式信息检索系统,该系统在跨语言检索效果和用户体验方面均得到广泛认可。

五、自然语言处理技术在跨语言信息检索中面临的挑战1、语言差异性问题不同语言之间存在差异,对自然语言处理技术提出了更高的要求。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

88888888888888888888888888888888888888888科技情报开发与经济SCI -TECH INFORMATION DEVELOPMENT &ECONOMY 2009年第19卷第14期Considerations about the Sustainable Development of Local Literature WorkHE Wei-bingABSTRACT :This paper expounds the concepts and connotations of the sustainable development and the local literature ,points out some shortages existing in the current local literature work ,and puts forward some assumptions of realizing the sustainable development of the local literature work .KEY WORDS :library ;local literature work ;sustainable development[3]熊焰.地(市)县公共图书馆地方文献资源建设和利用研究[J ].中国图书馆学报,2002(6):81.[4]黄桂凤.图书馆的地方文献资源开发利用[J ].图书馆杂志,2007(4):25.[5]贾立菲.谈地方文献的开发与利用[J ].中国图书馆学报,2006(6):104.[6]潘志强.区县图书馆地方文献工作探讨[J ].图书馆杂志,2007(8):46.(责任编辑:王永胜)────────────────第一作者简介:贺卫兵,男,1966年12月生,1988年毕业于江西大学(现为南昌大学)历史系,馆员,现任萍乡市图书馆副馆长,江西省萍乡市安源区昭萍西路2号,337000.当数据检索的精确性被信息检索的不确定性所代替后,用户的查询与检出文档的关系也就由匹配关系变为相关关系,因此相关性这一概念就突显出来,成了信息检索中的核心领域。

相关性是信息检索乃至情报学中的一个重要的、关键的概念,这在中外的有关研究者中已经得到了共识。

1“相关性”的概说信息检索本身就是一种相关性检索,而不是确定性检索,它不直接回答用户所提问题本身,而只是提供与解决问题有关的文献信息。

在信息检索中,相关性主要是指检索系统针对用户的信息需求从文档集合中检出的文档与用户需求之间的一种匹配关系。

检索相关性问题远比定义复杂得多,人们在决策过程中产生了信息需求,其中一部分是对数据的需求,而更多的是对某个主题文献的需求,而后者所对应的是一种相关性检索而非前者的确定性检索。

信息检索中相关性的研究主要有两个分支:一是以Mooers ,Taube ,Perry ,Salton 等为代表的来自计算机科学界,他们的研究主要围绕信息检索系统展开,包括系统的分析、设计、检索算法以及性能评估等,尤其是表征用户信息需求的查询表达式与文档的匹配算法和模型是核心的研究内容,他们被称为系统中心学派。

另一个是来自图书情报界,他们的研究重点是用户或者检索中介在检索过程中的认知、交互以及情境等层面,被称为用户中心学派。

因此,相关性概念也可以从这两个研究分支来划分:面向系统的相关性和面向用户的相关性。

(1)系统相关性学派。

面向系统的相关性也称系统观的相关性,它包括两个方面:一是用户提交的查询与信息检索系统对该查询分析理解后形成的系统执行的检索表达式之间的匹配关系;二是检索出的文档与系统执行的检索表达式之间的匹配关系。

面向系统的相关性是查询表达式与文档内容的一致性匹配,是文档所涵盖的内容对查询表达式的适合程度,它的着眼点主要是信息检索交互模型中的文档库、检索表达式、匹配过程和检索输出。

这种相关性明确定义了信息检索以及信息检索系统研究与发展的目标,简单明了,易于操作。

(2)用户相关性学派。

面向用户的相关性主要研究用户以及用户或者检索中介与系统之间的关系,这种相关性是主观的、模糊的。

一方面,人们对检索系统检索出的结果与用户的特定查询可以有多种“相关”方式;另一方面,不同的用户对同一检索结果的相关性判断存在差异。

不同的用户对同一真实信息需求的感觉会有差异;同一用户就同一真实信息需求向不同信息检索系统所发出的查询会有一定程度的差异。

2相关性的影响因素检索系统的工作过程包含存储和检索两个互逆的过程。

检索是存储的逆过程,对检索过程的分析,可以发现影响检索相关性的因素主要有:文章编号:1005-6033(2009)14-0089-02收稿日期:2009-03-10信息检索中的相关性研究马芳(中山大学资讯管理系,广东广州,510275)摘要:在信息检索中,相关性是一个关键性的概念。

从相关性的动态、多维的内涵出发,介绍了在信息检索中相关性的学派、影响因素及评价,总结了提高信息检索相关性的措施。

关键词:信息检索;系统相关性;用户相关性中图分类号:G354文献标识码:A892.1信息源信息检索系统的开发人员对原始信息源进行加工,提取出标题、关键词、文摘等信息,我们比较题名、题录、文摘和全文对相关性判断的不同影响,发现文献的主题内容是影响判断的最重要因素。

文献内容越是具体越有利于相关性判断。

(1)系统文献数据库。

文献数据库的规模、学科属性、收录范围等是检索到多少相关文献的前提。

(2)系统检索语言。

在传统的检索工具和系统中采用人工语言进行标引和检索,检索相关性较高。

在目前海量信息环境下使用自然语言,而自然语言缺乏控制使检索相关度较低。

如何转换和控制自然语言,使模糊的查询表达能够逐渐明确,是提高检索相关性的关键。

2.2信息需求的表达检索者不一定意识到自己实际上想查询什么信息,他所表达出来的需求即请求也可能与真正的需求或感觉到的需求有一段距离。

古希腊哲学家柏拉图有句名言:“人们要询问的既不是他知道的,又不是他不知道的。

如果他知道,则没有必要再问;如果他不知道,则他也不知如何去问”。

2.3时间与环境特定文档相对于某一查询来说,有可能在某个时刻是相关的,但在另外某一时刻又可能是不相关的,因此对文档相关性的判断不是恒定不变的。

实验条件的变化可能导致判断的变化,不同的检索行为在主题、任务和情景方面呈现出差异。

用户在判断时的知识状态等也会影响判断结果。

2.4用户的特性用户的认知过程与信息需求的用户角度相关。

系统要达到“领会”用户要提交的查询所表达的需求,很大程度上取决于判断者的教育程度。

一般认为用户的专业知识越高深,相关性判断的一致性就越好;专业知识越少,相关性判断就越宽大。

3提高信息检索相关性的策略研究相关性的目的是为了促进信息检索效率的提高,根据各种因素,从系统和用户两方面入手来提高检索的性能。

3.1从系统的角度提高检索系统相关性的措施(1)以用户为中心的设计思想。

相关性判断最终是由用户所决定的,相关性的不确定因素主要也是由用户引起的,因而我们应该建立以用户为中心的思想,减少其不确定性因素。

从人性化服务的理念设计系统,帮助用户发现问题、认识问题、提出问题、修正问题及寻求解决途径等。

(2)相关算法的优化。

相关度的算法影响检索结果文档的排序。

一般系统检索结果的相关度排序主要采用词频和位置加权算法,但这种算法在自然检索语言环境下不准确。

链接分析法应用了引文检索语言的原理,在关键词文本匹配的基础上,利用Web超链结构,对一个网页与其他网页的链接关系进行分析,以此确定该网页在检索结果中的排列顺序级。

Google和百度正是根据这一技术思路开发并使用了独特的排序算法。

(3)提供信息引导功能。

为应对当代信息环境下检索用户的资源迷向问题,智能检索系统提供了信息引导功能,帮助用户确定自己需要的信息所在领域,为用户提供详细、科学的信息分类知识。

当用户输入关键词后,系统可推断关键词信息所在的领域,并将这些领域信息告知用户,让用户确定。

对于不同的用户,系统将学习用户提交的关键词和领域信息,并记录在其用户模型中;当用户下次提交查询任务时,自动让用户确认相关信息,避免用户重复操作。

(4)相关反馈技术。

传统检索系统不关心用户对检索结果的相关性判断,若同一用户反复进行同一查询,其结果没有任何改进。

因此我们采用相关反馈技术,可使用户对系统返回的初步查询结果表明满意程度,系统根据用户的反馈对其查询意图预测,进而改进检索结果,提高检索的相关性。

3.2从用户角度提高检索系统相关性的措施(1)提高用户对信息需求的表达能力。

表达较明确的需求会导致对文献较一致的相关性判断,但判为不相关的比率较大;而表达较含混的需求会使人们对文献的相关性判断分歧较大,但判为相关的文献较多。

信息需求的表达语句与相关的文献中的语句相呼应,需要用户不但要对自己的需求有确切的认识,还要将这种认识明确地表达出来,而且要符合一般该类文献的用词特点。

(2)提高用户对检索系统的选择能力。

用户在信息检索之前必须选择能够满足自己需求的信息检索系统,这是用户获得相关文档的前提。

用户对系统的正确选择依赖于用户对信息需求的正确认知,即首先要分析自己的信息需求属于哪一领域或哪一学科,再考察各系统中所包含文献的范畴、来源、质量等,针对信息需求选择合适的信息检索系统。

(3)提高用户对知识的理解能力。

针对同样的信息检索结果,知识水平较高的人在进行相关性判断时表现得较为严格,判断出的相关文献较少;而随着知识水平的降低,对相关性的判断也会越来越松。

当用户亲自进行信息检索时,可以结合自己已掌握的知识和已拥有的材料判断文献的相关性。

4结语相关性是一个不断发展的概念,随着信息检索从传统的实验室信息检索发展到用户导向的信息检索和认知导向的信息检索,使得人们对相关性的理解和认识也不断深化,相关性概念的内涵和外延都得到了进一步的扩展和深化。

事实上,它已经从静态的、二元论的系统观点扩展到动态的、多维的认知观点,并将信息检索系统和认知行动者这两个最重要的要素有机地联系在一起,覆盖了从信息检索、信息查寻到信息活动和知识管理等多个领域。

希望通过上述从系统和用户的观点对相关性类型及改善策略所做的讨论能对信息检索的理论研究及检索系统的开发工作提供必要的相关信息,相信这些必将推动情报学理论和实践的进一步发展。

参考文献[1]夏咏梅.浅析信息检索评价中“相关性”问题的内涵[J].情报检索,2003(6):25-26.[2]莫祖英.信息检索中的相关性[J].情报探索,2006(12):117-118.[3]黄丽红.信息检索中“相关性”的探究[J].图书馆学研究,2006(2):66-67.[4]赵荣,宋慧敏.检索相关性及其提高路径[J].科技导报,2005,23(11):63-65.[5]成全,司辉.信息检索相关性评价及其改善策略研究[J].情报杂志,2008(2):131-133.(实习编辑:薛艳)────────────────第一作者简介:马芳,女,1985年8月生,2008年毕业于东北师范大学,现为中山大学资讯管理系情报学专业2008级在读硕士研究生,广东省广州市新港西路135号,510275.(下转第97页)马芳信息检索中的相关性研究本刊E-mail:bjb@sxinfo.net信息工作研究90The Studies of Correlation in Information RetrievalMA FangABSTRACT :In information retrieval ,the correlation is a key concept .Starting from the dynamic and multidimensional connotations of the correlation ,this paper introduces the schools ,influencing factors and evaluation of the correlation in information retrieval ,and sums up the measures for strengthening the correlation in information retrieval .KEY WORDS :information retrieval ;system -oriented correlation ;user-oriented correlation(上接第90页)在维权中不能发挥人事档案应有的依据和凭证作用。

相关文档
最新文档