信息检索相关性研究综述及发展趋势_王雅坤
信息检索研究报告范文

信息检索研究报告范文随着信息时代的到来,信息量爆炸式增长,如何快速高效地获取所需信息成为了人们迫切需要解决的问题。
信息检索技术就应运而生,它是一种利用计算机和互联网技术对大量信息进行分类、索引、存储、检索和分析的技术。
因此,信息检索技术在当今社会中具有广泛应用和深远影响。
二、研究内容本次研究旨在探讨信息检索技术的现状和发展趋势。
主要包括以下内容:1. 信息检索技术的定义和分类2. 信息检索技术的原理和流程3. 信息检索技术的应用领域和案例分析4. 信息检索技术的发展趋势和展望三、研究方法本研究采用文献综述和案例分析相结合的方法。
在文献综述方面,主要收集了国内外相关学术期刊、会议论文、专业书籍和网站的相关文献资料。
在案例分析方面,主要选取了具有代表性的信息检索技术应用案例进行分析。
四、研究成果经过研究,我们得到了以下成果:1. 信息检索技术的定义和分类信息检索技术是指利用计算机和互联网技术对大量信息进行分类、索引、存储、检索和分析的技术。
根据检索方式的不同,可以将信息检索技术分为基于关键词检索、基于内容检索、基于语义检索和基于推荐系统检索等几种类型。
2. 信息检索技术的原理和流程信息检索技术的原理是通过对文本信息进行分析和处理,将其转化为计算机可以识别和处理的形式,然后利用检索算法进行匹配和排序。
信息检索技术的流程包括建立索引、查询处理、评价和排序等几个步骤。
3. 信息检索技术的应用领域和案例分析信息检索技术的应用领域非常广泛,包括网络搜索引擎、企业信息管理、数字图书馆、知识管理等多个方面。
其中,著名的搜索引擎包括Google、百度、必应等。
在案例分析方面,我们选取了基于内容检索的视频推荐系统、基于语义检索的医学文献检索系统进行分析。
4. 信息检索技术的发展趋势和展望信息检索技术在大数据和人工智能时代将会得到更广泛的应用和发展。
未来的信息检索技术将更加注重个性化和智能化,能够根据用户的需求和兴趣进行精准推荐。
试述信息检索的未来发展趋势5

试述信息检索的未来发展趋势信息检索(Information Retrieval ) 又成为情报检索,萌芽于图书馆的参考咨询工作,20世纪50年代才固定成专用术语。
信息检索是从大量相关信息中利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。
信息检索包括存储与检索两个部分。
存储是对有关信息进行选择、并对信息特征进行著录标引和组织,建立信息数据库;检索则根据提问制定策略和表达式,利用信息数据库。
这里要理解概念分析。
概念分析即将概念转化成系统语言,是存储与检索共有的过程,因此从这个意义上说,信息存储是信息检索的逆过程,两者是不可分割的一个整体。
信息检索的研究从属于图书馆学与情报学。
涉及到自然科学、社会科学、人文科学的许多学科和领域。
通用的方法有:观察法、实验法、调查法、模拟法、归纳与演绎法、分析与比较法等;还使用文献计量学法、信息计量学法、目录学、分类学、主题法、著录法、排序法、咨询法等独特的研究方法。
信息检索能较全面地掌握有关的必要信息;还能提高信息利用的效率,节省时间与费用一般公信度高的,较准确的信息才会被收集、组织或存储在检索工具或数据库中,有目的地查检检索工具所获得的必要信息比直接泛阅信息要快数十倍;也能提高信息素质,加速成才信息素质(Information Lliteracy)是指具有获取信息的强烈意识,掌握信息检索的技术和方法,拥有信息鉴别和利用的能力。
中国的高等教育法明确要求大学生要具备信息素质。
在未来的发展中,信息检索将会趋向因特网信息检索。
因特网通过标准通信方式(TCP/IP 协议)将世界各地的计算机网络连接起来,。
在因特网上,信息存放在世界各地的计算机上,任何网络包括校园网、企业网、国家网,只要通过一个结点介入因特网,整个子网就有可能成为因特网的一个部分,网上用户就可以通过计算机和因特网共享信息资源或者交换信息。
开放的信息资源和信息检索工具超文本链接和使用的简便性等特点,使因特网成为知识经济的重要组成部分。
多媒体信息检索技术综述与未来发展方向展望

多媒体信息检索技术综述与未来发展方向展望综述:随着互联网和移动互联网的迅猛发展,多媒体信息的产生和存储量不断增加,导致了对多媒体信息的高效检索和管理的需求越来越迫切。
在传统的文本检索技术无法满足人们对多媒体信息描述和查询的需求的背景下,多媒体信息检索技术应运而生。
多媒体信息检索技术是一门涉及多媒体信号处理、内容特征提取、相似度计算、索引技术等多个领域的交叉学科。
其目标是通过对多媒体内容的分析和处理,实现用户对多媒体信息的准确、快速的检索。
现有的多媒体信息检索技术可以分为两大类:基于内容的检索和基于上下文的检索。
基于内容的检索主要利用图像、视频、音频等多媒体信息的内容特征进行检索。
其中,图像检索通常利用颜色、纹理、形状和空间布局等特征描述图像的内容;视频检索主要通过关键帧提取和运动分析等方法对视频内容进行描述和检索;音频检索则可以利用频谱、声谱图和梅尔频谱系数等特征来描述音频的内容。
基于内容的检索可以实现对多媒体信息的精确匹配,但对噪声和语义信息的处理较为困难。
而基于上下文的检索则更注重用户的查询意图和查询环境等上下文信息。
它通过分析用户的查询历史、位置、时间等上下文信息,将其与多媒体信息的语义信息进行匹配,从而提供与用户查询意图更加相关的结果。
基于上下文的检索可以提供个性化的检索结果,但对于用户隐私保护和数据安全等问题也提出了挑战。
目前,多媒体信息检索技术已经取得了一些重要的进展。
例如,图像检索技术中,基于深度学习的方法已经能够实现更准确的图像识别和分类,提高了图像检索的效果;视频检索技术中,基于视频内容分析和表达的方法可以实现对视频中运动物体的检索;音频检索技术中,基于音频内容分析和音乐信息检索的方法可以实现对音乐的自动分类和标记。
未来发展方向展望:在未来,多媒体信息检索技术仍然面临着一些挑战和机遇,其发展方向主要包括以下几个方面:1. 深度学习在多媒体信息检索中的应用:深度学习作为一种强大的机器学习方法,在图像、视频和音频等领域已经取得了一些重要的成果。
国内信息检索技术发展现状及未来趋势分析

国内信息检索技术发展现状及未来趋势分析概述:国内信息检索技术是指通过计算机及相关技术,从文本、图像、音频等多种形式的信息中快速有效地寻找出与用户需求相匹配的信息。
随着互联网的普及和技术的不断进步,信息检索技术在国内得到了广泛的应用和发展,整个行业正在朝着更加智能、便捷和个性化的方向发展。
发展现状:1. 多样化的检索引擎:国内已经涌现出了许多具有不同特色和功能的信息检索引擎,例如百度、搜狗、360搜索等。
这些搜索引擎通过不断优化算法和技术,提供了更加精确和高效的搜索结果,满足了用户的多样化需求。
2. 语义检索技术的发展:传统的关键词检索方式容易受到词语的歧义和语义差异的限制,而语义检索技术能够更好地理解用户的需求并提供相关的搜索结果。
目前,国内已经涌现出了一些具有语义分析和理解能力的搜索引擎,如百度的“百度标签”和搜狗的“搜狗智能搜索”,它们能够根据用户的搜索意图进行相关度排序,提高搜索结果的准确性和相关性。
3. 数据挖掘和机器学习的应用:随着大数据时代的到来,信息检索技术正越来越多地融合了数据挖掘和机器学习的方法。
通过分析海量的用户数据和信息,检索系统可以学习用户的兴趣和喜好,提供更加个性化的搜索结果。
同时,机器学习的技术也被应用在了搜索结果排序、相关性分析等方面,提高了搜索的准确性和效率。
未来趋势:1. 智能化发展:未来的信息检索技术将更加智能化,通过深度学习、自然语言处理和图像识别等技术,实现对复杂多样的信息进行准确、高效的检索。
例如,基于语义分析和机器学习的智能搜索引擎将能够根据用户的上下文理解搜索意图,从而提供更加精准的搜索结果。
2. 多模态检索:随着多媒体信息的快速增长和智能设备的普及,未来的信息检索技术将面临更多的多媒体数据。
多模态检索技术将能够通过同时处理文本、图像、音频等多种形式的信息,提供更加全面和丰富的搜索结果。
3. 社交化搜索:未来的信息检索技术将与社交网络和用户生成内容进行更深的融合。
大规模信息检索技术发展趋势及应用

大规模信息检索技术发展趋势及应用一、引言随着互联网的发展和信息技术的不断进步,信息爆炸的时代已经到来。
海量的信息需要被组织、管理和检索,以满足人们对各种信息的需求。
大规模信息检索技术应运而生,成为信息管理和智能决策的重要工具。
本文将从技术发展趋势和实际应用方面,探讨大规模信息检索技术的最新进展。
二、技术发展趋势1. 自然语言处理技术的发展自然语言处理技术是大规模信息检索技术的核心。
传统的检索系统主要依靠关键词匹配,但这种方式无法准确理解用户的查询意图,导致检索结果的准确性有限。
随着自然语言处理技术的不断发展,大规模信息检索系统能够更好地理解和解释用户的查询需求,提供更加准确的检索结果。
2. 人工智能技术的融合人工智能技术在大规模信息检索中扮演着重要的角色。
机器学习、深度学习和模式识别等技术的应用,使得大规模信息检索系统能够从大量数据中学习并改进搜索算法,提高检索效率和准确性。
此外,人工智能技术还能够实现自动化的信息抽取、数据挖掘和知识图谱构建,进一步提高信息检索的效果。
3. 多媒体信息检索的发展现实生活中的信息不仅仅包括文本,还包括图片、音频和视频等多媒体形式。
传统的文本检索系统无法有效处理这些多媒体信息,因此多媒体信息检索成为了一个热门研究方向。
近年来,图像识别、音频处理和视频搜索等技术的发展,为多媒体信息检索提供了新的解决方案。
通过将文本信息与多媒体信息相结合,可以实现更加全面和准确的信息检索。
三、实际应用1. 电子商务领域随着电子商务的快速发展,大规模信息检索技术在电子商务领域扮演着重要的角色。
通过自然语言处理和人工智能技术,电子商务平台能够根据用户的搜索意图,智能推荐商品和服务,提高用户的购物体验。
此外,电子商务平台还可以根据用户的历史行为和购买记录,进行个性化的信息推送和广告定制,提高商家的销售额和用户满意度。
2. 社交媒体分析社交媒体平台如微博、微信和Facebook等成为了人们获取信息和互动交流的重要渠道。
信息检索技术发展趋势分析

信息检索技术发展趋势分析信息检索技术发展趋势分析随着社会的快速发展和科技的不断创新,人们对于信息的需求越来越大。
而信息检索技术作为满足人们获取信息需求的关键技术之一,也在不断发展和完善。
首先,人工智能技术的快速发展将给信息检索技术带来革命性的变革。
传统的信息检索技术主要依靠关键词匹配的方式,但是这种方式往往会存在一定的局限性,无法准确地满足用户的需求。
而人工智能技术将通过深度学习和自然语言处理等技术,实现对用户意图的理解,从而提供更加精准的搜索结果。
例如,谷歌的“BERT”模型能够理解搜索意图,更好地匹配用户的需求,提供更加准确和个性化的搜索结果。
其次,语义搜索技术的发展也是信息检索技术的重要趋势之一。
传统的关键词匹配方式可能无法理解搜索语句中的上下文和语义关系,导致搜索结果的准确性不高。
而语义搜索技术利用自然语言处理和知识图谱等技术,可以理解搜索语句的意义和语义关系,从而提供更加精准的搜索结果。
例如,微软的“Bing”搜索引擎利用知识图谱技术,能够根据用户的搜索语句和上下文,提供更加准确的搜索结果。
另外,移动互联网的普及也推动了信息检索技术的发展。
随着智能手机的普及,人们越来越依赖移动设备获取信息。
因此,信息检索技术需要适应移动设备的特点,提供更加方便快捷的搜索体验。
例如,谷歌和百度等搜索引擎已经推出了移动端的搜索应用,提供针对移动设备的优化搜索结果和搜索界面,方便用户在移动端获取所需信息。
最后,随着大数据技术的快速发展,信息检索技术也面临着处理海量数据的挑战。
传统的信息检索技术可能无法高效地处理大数据环境下的搜索需求。
因此,信息检索技术需要不断引入大数据技术,提高搜索效率和准确性。
例如,谷歌的“MapReduce”和“Bigtable”等大数据处理技术,帮助提高了搜索引擎的处理能力和搜索结果的质量。
综上所述,信息检索技术在人工智能、语义搜索、移动互联网和大数据等方面都面临着新的发展机遇和挑战。
信息检索技术的研究与改进

信息检索技术的研究与改进信息检索技术一直是信息科学领域中的一个重要研究方向,随着信息社会的快速发展,信息量的爆炸性增长和信息检索需求的不断提高,信息检索技术的重要性愈发凸显。
信息检索技术主要指的是从大量的信息资源中有效地检索出用户需要的信息,是各类信息服务系统中的核心技术之一。
本文将探讨信息检索技术的研究现状和存在的问题,以及未来可能的改进方向。
信息检索技术包括信息存储、索引构建、查询处理和结果排序等多个环节。
在信息存储方面,传统的信息检索系统通常采用倒排索引技术,将文本信息按照关键词建立索引,以支持快速的检索操作。
然而,随着多媒体信息和非结构化数据的普及,传统的索引技术面临着挑战。
对于图片、音频、视频等非文本信息,如何有效地提取特征并建立索引成为了一个重要的研究方向。
近年来,基于深度学习的图像和音视频检索技术取得了显著进展,通过学习大量数据,系统能够自动学习到有效的特征表示,提高了检索的准确性和效率。
在查询处理方面,信息检索系统旨在根据用户提供的查询条件,从信息资源中匹配相关内容。
传统的检索系统采用基于关键词匹配的方式,通过计算文档和查询之间的相似度进行排序。
然而,基于关键词的检索存在语义歧义和信息冗余的问题,导致检索结果的准确性不高。
随着自然语言处理和知识图谱等技术的发展,基于语义的检索系统逐渐成为研究热点。
这种系统通过理解用户的查询意图,结合领域知识和语义关系,实现更精准、更智能的信息检索。
除了传统的信息检索技术,个性化推荐技术也成为了信息服务领域的重要方向。
个性化推荐旨在根据用户的兴趣和偏好,为用户推荐相关的信息资源。
传统的协同过滤和内容推荐技术在这方面取得了不错的效果,但是也存在一些问题,如冷启动、数据稀疏等。
为了解决这些问题,近年来涌现出了一些基于深度学习的推荐系统,例如深度神经网络和迁移学习等技术被广泛应用于个性化推荐领域,取得了较好的效果。
信息检索技术的研究还面临着一些挑战和问题。
大数据时代下的文献信息检索研究

大数据时代下的文献信息检索研究近年来,随着大数据技术的不断发展,文献信息检索也在不断地迎来新的机遇与挑战。
如今,无论是学术界还是产业界,对于大数据时代下的文献信息检索研究都已经成为了一种迫切的需求。
本文将从几个方面探讨大数据时代下的文献信息检索研究的现状与发展趋势。
一、背景与意义在当今社会,人类已经进入了一个以数据为核心的时代,随处可见的各种传感器和设备大大丰富了数字信息的来源,这就使得文献信息系统和技术面临着巨大的变革。
而正是在这种背景下,文献信息检索也需要进行相应的更新和升级,以适应当前大数据时代的需求。
在这一背景下,文献信息检索的研究也显得尤为重要。
二、现状与问题目前,文献信息检索已经成为了学术界和产业界不可或缺的一部分。
许多研究人员致力于开发各种文献检索系统,并不断尝试设计更加高效和精准的检索算法。
然而,尽管研究者们付出了艰辛的努力,但仍存在一些明显的问题:1、精度和相关性低。
研究表明,当前的文献检索系统往往难以从海量的数据中筛选出高质量的文献资料,甚至会出现漏洞和疏漏。
2、时间和效率低。
由于需要处理的文献数量非常大,大多数检索系统在检索速度和效率方面还无法得到完美的解决。
3、用户体验不佳。
尽管许多文献检索系统允许用户自定义检索条件,但很多时候,用户还是面临着诸如维度过高、界面不友好、结果不明确等各种问题。
三、发展趋势尽管目前的文献检索系统还面临着很多挑战和困难,但是随着大数据技术的不断进步,其未来发展的前景仍然充满了巨大的潜力。
在未来的某个时候,文献检索系统可能将发生如下变化:1、更加精准和高效。
未来的文献检索系统将会通过大数据的分析和挖掘,不断优化其检索算法,从而让用户更容易地找到他们所需要的文献资料。
2、更加智能化和自适应。
未来的文献检索系统将充分利用人工智能和机器学习等先进技术,帮助用户在海量的文献中快速定位到所需领域,并高效地提供有用的信息。
3、更加专业化和个性化。
未来的文献检索系统将更加注重用户的个性化需求,如果用户在某些领域有较高的专业知识,那么系统也将通过技术手段来为其提供更为精准的服务。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
89
王雅坤 成 全:信息检索相关性研究综述及发展趋势
信宿之间的信息交换作为通信, 同时考虑到通信过 程受到噪音的干扰和相关反馈机制的影响。 在信息 检索的交互过程中,排除这种通信的不确定性,相关 性被理解成如何在系统与用户之间建立一种有效的 通信方式。 相关性在系统与用户之间建立起了某种 关联, 这种关联的影响因素从系统的角度看包含主 题知识、主题文档、系统文件以及文档的表示;从用 户的角度看则包括信息需求、需求的表达、用户的认 知结构、信息需求的用途及其价值。这些因素所形成 的 关 联 Saracevic 称 其 为 “ 相 关 性 的 不 同 视 角 ” , 如 从 主题文档的视角来看, 相关性是指查询主题与文档 主题之间的关联度;而从系统的视角来看,相关性则 成为检索系统中系统文件与文档操作与用户的信息 需求表达之间的关联度。
通信相关性模型从通信交流的广义框架层次给 相关性作了定位, 但对于信息检索相关性的交互性 及动态性特征不能给予充分的体现。 3.3 情境相关模型
上 世 纪 70 年 代 末 到 80 年 代 初 的 近 十 年 时 间 是 相关性模型研究的冬眠时期, 这段时间理论界并未 出现新的相关性理论框架模型, 学者们大多依赖于 原有的模型体系研究检索系统的相关性问题, 直到 80 年 代 中 期 相 关 性 模 型 的 研 究 才 开 始 复 苏 。 1990 年 意 大 利 锡 拉 库 扎 大 学 的 学 者 Schamber 、Eisenberg 和 Nilan [16] 提 出 了 情 境 相 关 性 模 型 , 该 模 型 将 情 境 关 系、用户关联性、多维性、时间依赖性和动态性特征 全部纳入到相关性的基本特性当中。 考虑到信息交 换和信息通信的动态变化特征, 相关性被学者们理 解为对某一特定时间信息与信息需求之间相互关系 质量评价的动态概念。
Saracevic 将 这 些 成 果 划 分 成 为 系 统 相 关 、 通 信 相关、情境相关、心理相关和交互式相关这五种类型 的相关模型。 这些不同种类的相关模型在信息检索 相关性问题的描述方法及解决思路上各有优劣。 3.1 系统相关模型
系统模型是出现得最早也是应用最广泛的模 型 , 自 上 世 纪 50 年 代 系 统 模 型 出 现 以 来 , 已 被 广 泛 认同并逐渐演化为我们所熟知的 “传统信息检索模 型”。 系统模型将信息检索描述成对应的两极元素: 系统和用户。 系统端将给定的数据信息按一定的数 据结构组织起来以便于与用户的信息提问进行匹 配,匹配的过程遵照系统预先定义的算法进行;用户 端则将信息用户的问题和信息需求转化成系统所能 理解的检索提问式; 信息检索的过程就是文档与信 息需求提问式相互匹配的过程。 系统模型对相关性 的描述和评价主要依托文档与信息需求提问间的匹 配来实现, 而系统的相关反馈机制则对于用户信息 需求提问式的修正具有良好的指导作用。
见“相关性”在信息科学中的重要地位。 当前, 各国学者已对信息检索的相关性问题展
开了深入研究,就其主题领域来看,主要包括相关性 的基本概念研究、理论模型研究、用户认知研究、影 响 因 素 研 究 以 及 当 前 基 于 Web 的 相 关 性 研 究 新 发 展 等 [4]。 各 个 领 域 在 相 关 性 研 究 的 不 同 时 期 都 有 所 侧重, 本文即就上述五个方面对相关性研究的现有 成果进行分析并指出该领域研究未来的发展趋势。
系统相关性模型的着眼点集中在检索系统中文 档的获取、表达、组织与匹配,关注的是系统内部操 作方面的问题。由于检索系统实现的方法多种多样, 因而, 从系统角度评价信息检索则更多地依赖于寻 求与系统构成相适应的不同的方法和算法从而达到 提高信息检索相关度的目的。 传统的信息检索模型 和与之对应的系统相关性模型从最初的布尔逻辑精 确匹配开始, 一直致力于寻求最优的相关性匹配算 法,基于概率的、向量空间的、逻辑的、自然语言处理 的相关性匹配在系统模型研究的各个阶段发挥着重 要 的 作 用 。 对 于 信 息 检 索 相 关 性 的 评 价 研 究 从 20 世 纪 50 年 代 末 60 年 代 初 到 1990 年 的 TREC 评 价 一 直 都植根于系统模型。 3.2 通信相关模型
·信息技术与系统·
信息检索相关性研究综述及发展趋势 *
王雅坤 1 成 全 2 (1. 河 北 大 学 期 刊 社 保 定 河 北 071002 ) (2. 国 家 图 书 馆 研 究 院 北 京 100081 )
摘 要:文章从相关性的基本概念 、理论模型、用户认知、影响因素以及 当 前 基 于 Web 的 相 关 性 等 方 面 对 信 息
* 本文系国家社会科学基金项目“馆藏资源元数据的语义描述及关联网络构建研究(项目编号:11CTQ002)研究成果之一。 收稿日期:2011-12-12;责任编辑:魏 志 鹏
88
2012 年第 1 期
接有效性的一种测度, 并试图用数学方法证明相关 性 (Relevance)与 关 联 性 (Relation)之 间 具 有 等 价 关 系 [ 6 ] ; Saracevic (1970 ,1975 ,1976 ) 则 建 议 从 文 档 、 词 与 文 献 引用等各种文献特征上来定义检索的相关性; Cooper (1971 ) 利 用 数 理 逻 辑 给 相 关 性 做 了 一 个 明 确 的 定 义 ,Wilson(1973)则 在 Cooper 研 究 的 基 础 上 对 数 理逻辑相关性描述做了进一步扩充,并将“情境相关 性”的概念首次引入到相关性的研究中,这些成果成 为 第 二 阶 段 研 究 工 作 的 基 础 [7]。
在 第 二 阶 段 (1977 至 今 ) , 由 于 相 关 性 各 领 域 研 究成果的相继出现, 使相关性的概念描述也呈现出 许多新的时代特征。 首先是从面向用户及认知方法 的观点重新审视相关性, 认为相关性是个多维的认 知概念, 在很大程度上依赖于用户个人对信息的理 解以及信息需求的情境;相关性是一个动态的概念, 它依赖于信息与用户某一特定时间所需信息之间关 系质量的评价;以用户的观点来看,相关性是个复杂 的 、系 统 的 、可 测 度 的 概 念 [8]。 其 次 是 一 些 学 者 试 图 给信息检索定义一个逻辑模型来理解相关性概念, 这 项 工 作 由 Rijsbergen (1986 ,1989 ) 开 创 , 之 后 又 吸 引 了众多学者的参与。
2 信息检索相关性基本概念研究
对信息检索相关性基本概念方面的研究工作始 于 20 世 纪 50 年 代 末 , 各 国 学 者 借 助 数 学 工 具 及 各 种概念提取方法从各个角度对“相关性”的含义及内 容 进 行 了 深 入 剖 析 [5]。 而 相 关 性 的 基 本 概 念 研 究 以 1976 年 为 边 界 经 历 了 前 后 两 个 阶 段 。核心研究 内 容 之 一 , 其 概 念 的 起 源 可 以 追 溯 到 17 世 纪 的 早 期 图书馆用户认识到查找相关信息的问题, 但由于客 观原因, 相关性只是作为一种朦胧意识停留在人们 头 脑 中 , 直 到 20 世 纪 20 年 代 少 数 学 者 (Lotka (1926 ) ,Zipf (1949 ) ,Urquhart (1959 ) ,Price (1965 ) ) 才 陆续从各个领域开始了相关性的研究工作。 在信息 科 学 界 ,Saracevic [1] 认 为 Bradford [2] 是 最 先 使 用 相 关 性 一 词 的 学 者 , 其 在 20 世 纪 30 年 代 发 表 的 “ 文 献 的 混沌状态”一文中首次提出“主题相关”的概念。 而 此后关于“相关性”的探讨并未引起学界更大范围的 关 注 , 直 到 1958 年 国 际 科 学 信 息 会 议 (ICSI ) 的 召 开 , “ 相 关 性 ” (Relevance ) 才 作 为 信 息 科 学 领 域 的 一 个 重 要 概 念 被 学 术 界 认 可 [3], 至 此 “ 相 关 性 ” 逐 渐 成 为信息科学尤其是信息检索领域经久不衰的研究课 题 , 甚 至 知 识 交 流 学 派 的 代 表 人 物 Saracevic 认 为 信 息科学之所以成为独立学科, 而不再隶属于图书馆 学或文献学的原因就在于它开展了相关性的研究, 也在于相关性能够解释科学交流中的诸多问题,足
第 一 阶 段 (1959 -1976 ) 的 主 要 成 果 有 :Maron 和 Kuhns (1960 ) 利 用 概 率 论 定 义 相 关 性 的 概 念 , 提 出 相 关 性 并 非 只 是 简 单 的 是 / 非 选 择 问 题 ;Rees (1966) 认 为相关性受文档所包含的信息概念的影响, 认为相 关信息是对用户原来所具备的知识而言有用的信 息 ;Goffman (1970 ) 和 Newill (1967 ) 把 相 关 性 当 成 连
3 信息检索相关性理论模型研究
从 20 世 纪 70 年 代 开 始 , 信 息 科 学 界 开 始 尝 试 建立相关性的理论框架, 在诸多理论框架研究的学 者 当 中 Saracevic 和 Mizzaro 的 研 究 成 果 较 全 面 系 统 。 Saracevic (1970 ,1975 ,1996 ) [9] [10] [11] 从 直 觉 、 哲 学 、 交 流科学以及基本属性等方面阐述了相关性的广义框 架, 阐述了信息科学框架中的涉及相关性本质四种 模型,即系统、通信、情境以及心理模型,在基于信息 检索交互的分层模型的基础上, 提出了第五种模型 即交互式模型,并列举出相关性的所有可能的层次, 该模型借用了人机交互研究中阐释理论以及语言学 中 的 分 层 理 论 ;Mizzaro [12] 提 出 了 四 维 框 架 以 描 述 相 关 性 , 即 : ① 信 息 资 源 , 包 括 文 献 (document ) 、 文 献 的 替 代 品 (surrogate ) 以 及 信 息 (information ) ; ② 用 户 信 息需求的描述,包括信息问题、信息需求、查询请求 以 及 查 询 表 达 式 ;③时 间 ,时 间 维 非 常 典 型 地 体 现 了 相 关 性 判 断 的 动 态 性 ;④构 件 ,信 息 资 源 和 用 户 信 息 需求的描述以及二者结合中的所有元素都可以分解 为 主 题 (topic ) 、 任 务 (task ) 和 背 景 (context ) 等 三 个 组