网络信息检索技术
网络信息检索

网络信息检索网络信息检索是指通过互联网进行信息搜索并获取所需内容的过程。
随着互联网的快速发展,网络信息检索已经成为人们获取信息的一种主要方式。
首先,网络信息检索可以帮助人们高效地获取所需的信息。
在过去,人们需要通过查阅书籍、资料等方式获取信息,而现在只需要在搜索引擎中输入关键词,就可以迅速地找到相关的信息。
这样不仅节省了时间,还能增强信息的实时性和准确性。
其次,网络信息检索使得信息的获取更加全面和多样化。
通过互联网,人们可以获取到世界各地的信息,涵盖了各个领域的知识。
不论是新闻、科技、娱乐还是学术研究,只要有网络连接,人们就可以同时获取到大量的信息资源。
这种全面性和多样性使得人们能够更好地了解世界、拓宽视野。
此外,网络信息检索还使得信息的共享变得更加便捷。
通过网络信息检索,人们可以轻松地把自己的观点、知识和经验分享给其他人。
无论是通过博客、社交媒体还是专业的知识分享平台,人们都可以发布和传播自己的文章、视频、图片等形式的媒体内容,实现了信息的自由流动。
然而,网络信息检索也存在一些问题。
首先,网络信息的真实性和可信度存在一定的挑战。
虽然现在有一些算法和方法来筛选和过滤信息,但仍然存在一些虚假信息和谣言,给人们带来困惑和误导。
其次,网络信息检索也可能导致信息过载的问题。
由于网络上信息呈爆炸式增长,人们有时很难找到自己真正需要的信息,也容易被各种信息所干扰。
综上所述,网络信息检索在今天的互联网时代扮演着极为重要的角色。
它不仅提供了高效、全面和多样化的信息获取方式,还促进了信息的共享与交流。
然而,我们也需要保持对信息真实性的判断力,并学会应对信息过载的问题,以更好地利用网络信息检索为我们的学习、生活和工作带来便利和价值。
网络信息检索是当今互联网时代的重要工具和技术。
它不仅改变了我们获取信息的方式,还为我们提供了全球范围内的知识、娱乐和资源。
本文将继续探讨网络信息检索的重要性,并进一步讨论它的应用领域、技术挑战和未来发展趋势。
基于搜索引擎的网络信息检索技术

基于搜索引擎的网络信息检索技术在信息爆炸的时代,网络已经成为了人们获取信息的主要渠道,而搜索引擎就是人们在网络上获取信息的主要工具之一。
搜索引擎通过收集互联网上的信息并进行分类整理,使用户能够通过输入关键词来快速地获取所需的信息。
本文将主要介绍基于搜索引擎的网络信息检索技术。
一、搜索引擎的分类搜索引擎可以分为两大类,一类是基于内部数据库构建的搜索引擎,常见的有百度、谷歌等,这种搜索引擎的特点是数据量庞大,搜索速度快。
另一类是基于元搜索技术实现的搜索引擎,该类搜索引擎不会建立自己的数据库,而是通过调用多个其他搜索引擎的结果来进行搜索,常见的有dogpile、clusty等。
二、搜索引擎的原理搜索引擎最基本的原理就是根据关键词在内部数据库中进行匹配查询,通过分析关键词的语言、用词、顺序、相关度等因素,从海量的网页中筛选出最相关的结果。
在具体实现上,搜索引擎一般分为三个步骤:1.爬取:搜索引擎通过网络爬虫(crawler)的方式访问互联网上的网页,并将其存储至自己的数据库中,这个过程叫做爬取。
2.索引:搜索引擎将爬取到的网页进行分词、去重、建立反向索引等操作,建立自己的数据库。
3.检索:用户输入关键词后,搜索引擎会通过自己的索引库进行匹配,找到最相关的结果并展示给用户。
三、搜索引擎的优化对于网站所有者来说,排名更靠前的搜索结果会吸引更多的用户点击。
而对于搜索引擎公司来说,给用户展示更优质的搜索结果也能提升用户黏性。
因此,搜索引擎优化(SEO)成为了一个非常重要的话题。
搜索引擎优化的核心在于提升网站在搜索引擎中的排名。
一般来讲,搜索引擎会根据不同的算法体系对网站进行评分,从而计算出不同的排名。
因此,网站所有者需要在设计网站、编写内容、建立链接等方面做出合理的优化。
四、搜索引擎对信息检索的重要性搜索引擎的发展一方面大大方便了人们获取信息,也加速了人们获取信息的速度和方便度。
而对于信息的检索来说,搜索引擎也成为了不可或缺的工具。
网络搜索与信息检索技术

网络搜索与信息检索技术随着互联网的快速发展和普及,人们获取信息的方式也发生了翻天覆地的变化。
通过网络搜索引擎,我们可以轻松地获取到庞杂而丰富的信息资源,而其中背后起着重要作用的就是网络搜索与信息检索技术。
本文将为您详细介绍网络搜索与信息检索技术的定义、原理和应用领域。
一、网络搜索与信息检索技术的定义网络搜索与信息检索技术是通过利用计算机和互联网的力量,对海量的、分散的、异构的信息资源进行收集、分析、筛选和组织,以提供准确、有效、个性化的搜索结果的一种技术手段。
二、网络搜索与信息检索技术的原理1. 数据收集:网络搜索与信息检索技术通过网络爬虫程序定期抓取互联网上的各类网页,并存储为一个个的索引文件,以备后续的处理和查询。
2. 数据分析:在数据收集的基础上,搜索引擎会对抓取到的网页进行分析和处理,提取出页面的关键字、标题、描述等信息,并建立相应的索引文件,用于加速后续的搜索过程。
3. 查询处理:当用户输入查询关键词后,搜索引擎会通过与索引文件的对比,找到与查询条件匹配的网页,并按照一定的算法进行排名,以显示最相关的结果。
4. 结果展示:搜索引擎将根据排名规则,将搜索结果展示给用户。
常见的展示方式包括网页链接、摘要和相关图片等。
三、网络搜索与信息检索技术的应用领域1. 学术研究:学术界通过网络搜索与信息检索技术可以方便地查找到大量相关的期刊论文、学位论文等,为科研工作者提供了便捷的文献检索工具。
2. 商业应用:在商业领域,网络搜索与信息检索技术被广泛应用于市场调研、竞争情报等领域,帮助企业了解市场动态,预测趋势,优化产品和服务。
3. 搜索引擎优化:对于网站营销人员而言,网络搜索与信息检索技术是其工作的核心。
优化网站的结构和内容,提高网站在搜索引擎中的排名,有助于增加流量和提升用户体验。
4. 社交媒体:社交媒体平台通过网络搜索与信息检索技术,可以根据用户的兴趣和需求,推荐相关的朋友、话题和资讯,提供个性化的服务。
信息检索技术在互联网搜索中的应用

信息检索技术在互联网搜索中的应用互联网的快速发展使得我们可以在网上轻松获取各种信息。
但是因为信息的爆炸性和网络的匿名性,我们不得不在浩如烟海的信息中寻找出自己所需要的资料。
然而,人工的搜索难免会有误判和疏漏,而信息检索技术则是一种有效的方法来处理这些问题。
信息检索技术是一种处理和组织信息的技术。
它通过分析和处理信息来帮助用户快速找到他们需要的信息。
这种技术可以应用于各种各样的工作中,例如智能客服、搜索引擎、大数据分析等。
在这篇文章中,我们将重点分析信息检索技术在互联网搜索中的应用。
一、信息检索技术信息检索技术是一种基于自然语言处理和数据挖掘的技术。
它通过处理和解释用户的搜索词汇,帮助用户找到他们所需要的信息。
信息检索技术通常是通过搜索索引来实现的。
搜索索引是一种包含搜索引擎所找到的网页的数据库。
通过搜索索引,搜索引擎可以从海量数据中快速查询用户所需要的信息。
信息检索技术的核心是分词、索引和排序。
分词指的是将用户的搜索词汇拆分成各个单词。
这个过程是通过自然语言处理技术来实现的。
分词的目的是让搜索引擎能够更好地理解用户的搜索词,从而更准确地匹配信息。
索引是将搜索引擎所搜集到的网页和内容分门别类地存放在数据库中。
这样,当用户使用搜索引擎进行搜索时,搜索引擎可以更快速地找到用户所需要的信息。
排序是将搜索引擎所找到的所有网页按照用户的需求按照相关性、可信度、时间等多个指标进行排序。
通过排序,搜索引擎可以帮助用户更快地找到他们所需要的信息。
二、信息检索技术在搜索引擎中的应用信息检索技术的应用非常广泛,其中最常见的就是搜索引擎。
搜索引擎是一种通过搜索索引来帮助用户查找互联网上信息的工具。
搜索引擎利用信息检索技术帮助用户快速地找到他们所需要的信息。
在搜索引擎中,信息检索技术负责将用户的搜索关键词拆分成各个单词,并将这些单词与搜索索引中的内容进行匹配。
通过匹配,搜索引擎可以找到与用户的搜索词相关的网页。
然后,搜索引擎会通过排序来显示与用户需求相关的信息。
网络信息检索技术简介.ppt

数字图书馆标准体系
1. 数字资源加工和描述标准体系 ,这类
标准体系的内容主要涉及:数字文件 格式标准、数字文件标识标准、数字 对象描述性元数据模式框架和具体描 述格式、元数据内容描述体系。
2. 数字资源生命周期标准框架,围绕数
字资源创建、描述、组织、检索、服 务和长期保存的整个生命周期来规划、 设计、组织标准规范。
互联网信息检索基础平台
解决方法:以Web技术中的Webservice为 核 心,结合OAI元数据采集系统构 建馆内资源整合系统。
二.组织间的信息共享整合
各个高校科研机构一般都有很多自有的特 色数据资源,但这些资源的使用一般都限 于各个单位内部,缺乏一种协调管理和共 享机制,各单位投入大量的资金,建立的 信息资源的使用效率极为低下,而且存在 很多资源重复建设问题。
标准在数字图书馆建设中的重要性
通过从图书馆自身建 设和资源共享两方面分 析,
可以说,在数字化网 络化环境下,任何孤立、 封闭的数字图书馆系统 都将失去生存和发展的 能力,而实现一个开放、 互操作和集成的数字图
书馆系统的基础是标准 规范。
数字图书馆与互联网基础研究
随着数字图书馆研究的进一步发展, 数字图书馆基本概念已经扩展成为“新一 代互联网的信息管理模式”研究。
数字图书馆与互联网基础研究
➢ 数字图书馆的一个较为公认的定义就是:数字图 书馆是采用现代高新技术支持的数字信息资源系 统,是下一代互联网上信息资源的管理模式,它 将从根本上改变目前互联网上信息分散、不便使 用的现状。
➢ 数字图书馆研究和互联网基础体系研究已经相互 融合而不再是毫不相关的两个独立领域。
➢ 标准制定时以简单易行为原则,同时加 强和国际化组织的合作。在图书馆这样 的环境中,一些看似精美,但复杂程度 较高的标准一般都难以实施。而要让数 字图书馆的解决方案真正成为整个互联 网的解决方案,和一些互联网标准化组 织如IETF(Internet Engineering Task Force)、W3C(World Wide Web Consortia)等合作,数字图书馆研究要 进一步发展,走国际化合作的道路是必 由之路。
第三章 网络信息检索

第三章网络信息检索第一节网络信息检索的基本方法1、布尔逻辑检索逻辑检索是一种比较成熟、较为流行的检索技术。
逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符,主要的运算符有:(1)逻辑―与‖逻辑―与‖用AND(或﹡)表示。
检索词A、B若用逻辑―与‖相连,即A AND B(A*B),则表示同时含有这两个检索词才能被命中。
例如,要检索儿童教育的文献,检索逻辑式可表示为:child AND education(2)逻辑―或‖逻辑―或‖用OR(或+)表示。
检索词A、B若用逻辑―或‖相连,即A OR B(A+B),则表示只要含有其中一个检索词或同时含有这两个检索词的文献都将被命中。
例如,要检索―计算机‖或―机器人‖方面的文献,检索逻辑式可表示为:computer OR robot. (3)逻辑―非‖逻辑―非‖用NOT(AND NOT,BUT NOT)(或-)表示。
检索词A、B若用―非‖相连,即A NOT B(A-B),则表示被检索文献在含有检索词A而不含有检索词B时才能被命中。
例如,要检索有关―能源‖方面的文献,但涉及―核能‖方面的文献不要,检索逻辑式可表示为:energy NOT nuclear(energy –nuclear)。
1、搜索引擎的定义搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具,简言之,搜索引擎就是一种在因特网上查找信息的工具。
用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果反馈给用户。
搜索引擎一般都有固定的显示格式,内容详简程度不一,常常带有URL、题名、标题、关键词、摘要(文本描述摘录)、超链接文件大小、检索结果总数、相关度估计、评论等。
搜索引擎的检索结果一般按查询的相关程度进行排列,最相关的通常排在最前面。
2、搜索引擎的常用检索方法(1)简单搜索(simple search)指输入一个单词(关键词),提交搜索引擎检索后反馈结果。
它也叫单词搜索。
网络信息检索的原理及技术

检索过程
收集标引过程
分布式搜索引擎的一般结构
网络空间
用户
复制管理器 中介器 对象缓存
中介器
收集器
………… .
9.3.1网络信息的采集
• 定义:是实现网络信息检索的第一环节,其主要任
务是为网络信息资源库录入信息源。
• 广义上:网络信息采集包括网络信息检索系统的所
有信息采集和录入活动。
• 狭义上:是指网络搜索引擎的信息采集。
• 1.数据库组织方式:将所有获得的信息资源按照固定的记录格式存储组织,用户通过
关键字及其组配可以知道所需要的信息线索
• 2.超链接方式:把不定长的基本信息单元存放在节点上,这些基本信息单元可以使单个
字,句子,章节,文献,甚至是图像,音乐或者录像。
• 3.主页方式:通过各种频道栏目,根据网站定位的用户对象,需求的动态,一次信息等
重要的,所以它的PageRank值最高。
网页A级别=(1-系数)+系数×—网—页—1—级—别—
网页1链出个数
+ —网—页—2—级—别—...+—网—页—N—级—别—
网页2链出个数
网页N链出个数
9.7网络信息检索的研究热点
• 9.7.1 海量数据的存储与处理
A
Group
B
Group
C
Group
(1)海量数据的 磁盘列存储技术
(随便告诉大家元数据是元数据是一种二进制信息,用以对存储在公共语言 运行库可移植可执行文件 (PE) 或存储在内存中的程序进行描述)
MARC元数据的概念 MARC元数据:是利用计算机识读和处理的目录。MARC主要用
于图书馆管理软件中,采访、编目、典藏等环节都有重要的 作用,也方便馆际之间的数据交流,是统一文献著录规范。 我简练点叫它“英文机读目录格式” ,如果是“中国范”的 CNMARC就叫“中国机读目录格式”
网络信息检索技术应用

网络信息检索技术应用在当今信息爆炸的时代,人们日常接触到的信息量已经远远超出个人的处理能力。
为了更有效地获取所需信息,网络信息检索技术应运而生,成为人们获取信息的利器。
本文将从网络信息检索技术的基本原理、分类、应用领域和未来发展趋势等方面进行探讨。
网络信息检索技术的基本原理网络信息检索技术是指利用计算机和网络技术从庞大的信息资源中准确、高效地找到用户所需要的信息的一种方法。
其基本原理是通过建立庞大的索引库,对各种信息进行索引和分类,用户通过输入检索关键词,系统根据索引库中的信息进行匹配,将相关信息呈现给用户。
网络信息检索技术的分类网络信息检索技术可以按照不同的指标进行分类,常见的分类包括按照检索对象的类型、检索方式和检索引擎的种类等。
根据检索对象的类型,可以分为文本检索、图片检索、音频检索等;根据检索方式,可以分为全文检索、关键词检索、自然语言检索等;根据检索引擎的种类,可以分为谷歌、百度、必应等不同的搜索引擎。
网络信息检索技术的应用领域网络信息检索技术在现代社会的各个领域都有广泛的应用。
在教育领域,学生可以通过搜索引擎获取各种学习资料;在医疗领域,医生可以通过检索相关信息来帮助诊断疾病;在商业领域,企业可以通过市场信息检索技术来了解消费者需求等。
网络信息检索技术的未来发展趋势随着人工智能技术的不断发展,网络信息检索技术也将迎来新的发展机遇。
未来,网络信息检索技术将更加智能化,能够根据用户的搜索习惯和需求进行个性化推荐;同时,在保护用户隐私的前提下,对用户进行更精准的信息服务。
综上所述,网络信息检索技术作为当今信息社会中不可或缺的一部分,将在未来得到更广泛的应用和发展。
我们期待着网络信息检索技术在为人们提供便捷、高效信息获取的同时,不断推动着信息社会的进步和发展。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
网络信息检索技术网络信息检索中,基本的检索技术有布尔逻辑检索、截词检索、位置检索、限制检索等。
一、布尔逻辑检索逻辑检索是一种开发较早、比较成熟、在信息检索系统中广泛应用的技术。
布尔逻辑检索就是采用布尔关系运算符来表达检索词与检索词之间逻辑关系的检索方法,目前最常用的布尔逻辑运算符主要包括逻辑“与"(AND)、逻辑“或"(OR)、逻辑“非”(NOT)。
(一)逻辑“与”逻辑“与”,也称为逻辑乘,用AND表示,是用来组配不同含义检索词之间的限定关系。
检索词A、B以AND (或“*")相连,即A AND B (或A*B),表示同时包含A、B两词的文献才是命中记录,因而逻辑“与”运算用于对检索词进行限定,从而缩小检索范围,提高检索结果的查准率。
例如,要查找children education (儿童教育)方面的文献,检索逻辑式可表示为“children * education”或者“children AND education” o运算的结果是同时含有检索词children和检索词education的文献才被检索出来。
(二)逻辑“或”逻辑“或”,也称为逻辑加,用OR或者"+”表示,是用来组配同义或者同族检索词之间的并列关系。
检索词A、B若以OR或“+”相连,即A OR B(或A+B),表示只要含有A、B之一或者同时包含A、B的文献都是命中记录。
因而逻辑“或” 运算可用于扩大检索范围。
例如,要查找“汽车”方面的文献,因为汽车在英语中可以用car或者automobile表示,所以为了将有关汽车的文献全部检出,避免漏检,检索逻辑式就可表示为“car OR automobile”或者“car + automobile” o运算的结果是含有car或者automobile任意一个或者同时两个的文献均被检索出来。
(三)逻辑“非”逻辑“非”用NOT或者"-”来表示,是用来组配概念的包含关系,可以从原检索范围中排除一部分,因而使用逻辑“非”运算可以缩小检索范围。
检索词A、B 若以NOT (或“-”)相连,即A NOT B (或A-B),表示只含有检索词A而不含有B的文献才是命中记录。
逻辑“非”可用于缩小检索范围,但是不一定能提高文献命中的准确率。
在使用时要注意,避免将相关的有用文献排除在外。
例如,要查找有关“energy (能源)”,但又不涉及“nuclear (核能)”方面的文献,检索逻辑式可表示为“energy NOT nuclear”“energy-nuclear”。
运算的结果是含有energy,但不含有nuclear的文献将被检索出来。
这三种逻辑式的文氏图如下:图3-1布尔逻辑文氏图上面三种检索逻辑式是最为简单的布尔逻辑运算。
在检索实践中,可以根据实际需要,组合使用多个布尔运算符,以准确表达检索主题。
布尔逻辑检索与人们的思维习惯一致,表达清晰,方便用户进行扩检和缩检,而且易于计算机实现,因此,在计算机信息检索系统中得到广泛使用。
但是它无法反映检索词对于检索的重要性,无法反映概念之间内在的语义联系,因而检索结果不能按照用户定义的重要性排序输出。
使用布尔逻辑运算符的注意事项:布尔逻辑检索在联机检索、光盘检索和网络检索中都有广泛的应用,但是不同的检索工具的布尔逻辑检索技术存在一定的差异,因此,使用布尔逻辑检索需要注意以下问题:1、布尔逻辑检索的执行顺序。
三种布尔逻辑检索运算符之间的运算顺序为NOT、AND、OR。
有括号时,先执行括号内的逻辑运算。
2、不同检索工具的布尔逻辑检索有不同的表现形式和使用规则。
首先,不同检索工具表示布尔逻辑关系的符号不同,有的用“+”、"-”表示AND、NOT,有的用ANDNOT代替NOT (如Excite搜索引擎),有的要求运算符必须大写,有的则要求为小写形式;其次,不同检索工具的检索词之间的默认布尔逻辑关系不同,有的检索工具检索词之间的默认关系是AND,有的检索工具的检索词之间的默认关系是OR;此外,不同检索工具支持布尔逻辑的方式不同,有的检索工具使用符号来实现布尔逻辑关系,一些检索工具则完全省略了任何符号,直接用文字和表格来体现不同的逻辑关系,如用All of These Words表示AND,ffi Any of These Words 表示。
口,用None of These Words 表示NOT。
二、截词检索截词检索是指在检索式中使用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化,用检索词的词干或不完整的词形查找信息的一种检索方法。
并认为凡满足这个词局部中的所有字符的文献,都为命中的文献。
在实际检索的过程中,为了减少检索词的输入量,同时又扩大检索范围,保证查全率,可以使用截词检索。
截词的方式有多种。
按截断的位置来分,可分为后截断、中截断和前截断;按截断的字符数量来分,可分为有限截断和无限截断。
有限截断是指说明具体截去字符的数量,通常用“?”表示;而无限截断是指不说明具体截去字符的数量,通常用“x”表示。
(一)后截断后截断是最常用的截词检索技术,是将截词符号放置在一个字符串右方,以表示其右的有限或无限个字符将不影响该字符串的检索,是一种前方一致的检索。
这种方法可以省略输入各种词尾有变化的检索词的麻烦,有助于提高查全率。
例如,输入“inform x”,则前6个字符为inform的所有词均满足条件,因而能检索出含有informant、informal> information> informative> informed> informer 等词的文献。
而输入“inform??”,可检索出含有inform、informal> informed> informer 的文献。
(二)前截断前截断是将截词符号放置在一个字符串左方,以表示其左方的有限或无限个字符不影响该字符串检索,是一种后方一致的检索。
这种检索方法在各种词头有变化的复合词的检索中应用比较多,有助于提高查全率。
例如,输入%magnetic”,可以检索出含magnetic> electro-magnetic等词的文献。
(三)中截断中截断是把截断符号放置在一个检索词的中间。
一般地,中截断只允许有限截断。
中截断主要解决一些英文单词拼写不同,单复数形式不同的词的输入。
例如,输入%?1”,可以检索出含有词cat、cut的文献;输入“modation” 可以检索出含有词moderation、modernization、modification 的文献。
利用截词检索技术可以减少检索词的输入量,简化检索,扩大检索范围,提高查全率。
但是,不同的检索工具有不同的截词规则,使用的截词符号也没有统一的标准,如Dialog系统用“?”,BRS系统用“ $”,ORBIT系统用“#”等。
三、位置检索位置检索,也称临近检索,主要是通过位置运算符来规定和限制检索词之间的相对位置或者检索词在记录中的特定位置来实施检索的技术。
这里我们只介绍位置检索中的词位置检索。
词位置检索主要是利用位置逻辑算符限定检索词之间的位置,来反映要检索的信息概念。
常用的词位置算符有(W)与(nW)、(N)与(nN)以及(X)与(nX)三类。
(一)(W)算符与(nW)算符(W)算符是Word和With的缩写,它表示在此算符两侧的检索词必须按输入时的前后顺序排列,而且所连接的词之间除可以有一个空格、一个标点符号或一个连接号外,不得夹有任何其他单词或字母,且词序不能颠倒。
(nW)算符的含义是允许在连接的两个词之间最多夹入n个其他单元词。
例如,“VISUAL(W)FOXPRO”可以检出VISUALFOXPRO 或VISUAL FOXPRO;“control(1W) system”可以检出含有contro1 system、control of system 和contro1 in system 的文献。
(二)(N)算符与(nN)算符(N)算符是Near的缩写,它表示在此算符两侧的检索词必须紧密相连,所连接的检索词之间不允许插入任何其他单词或字母,但词序可以颠倒。
(nN)算符表示在两个检索词之间最多可以插入n个单词,且这两个检索词的词序任意。
例如,“control(1N)system”不仅可以检出含有control system、control of systcm 和control in system 的文献,还可以检出含有system of control、system without control 等的文献。
(三用)算符与(nX)算符(X)算符要求其两侧的检索词完全一致,并以指定的顺序相邻,且中间不允许插入任何其他单词或字母。
它常用来限定两个相同且必须相邻的词。
(nX)算符的含义是要求其两侧的检索词完全一致,并以指定的顺序相邻,两个检索词之间最多可以插入n个单元词。
例如,“side (1X)side”可以检索到含有side by side的文献。
四、限制检索限制检索是通过限制检索范围,从而达到约束和优化检索结果的一种方法。
限制检索的方式有多种,常用的有字段限制检索和限制符限制检索。
(一)字段检索数据库记录是由若干个字段组成的,字段检索是把检索词限定在数据库记录的特定字段中的检索方法,如果记录的相应字段中含有输入的检索词则为命中记录。
字段限制检索可以缩小检索范围,提高查准率。
数据库中提供的可供检索的字段通常分为基本索引字段和辅助索引字段两大类。
基本索引字段表示文献的内容特征,有TI (篇名、题目)、AB (摘要)、DE (叙词)、ID (自由标引词)等;辅助索引字段表示文献的外部特征,有AU (作者)、CS (作者单位)、JN (刊物名称)、PY (出版年份)、LA (语言)等。
在检索提问式中,可以利用后缀符'/”对基本索引字段进行限制,利用前缀符“=”对辅助索引字段加以限制。
例如,“(information retrieval / TI OR digital library / DE)AND PY = 2006”所表达的检索要求是,查找2006年出版的关于信息检索或数字图书馆方面的文献,并要求information retrieval 一词在命中文献的TI (篇名)字段中出现,digital library一词在DE (叙词)字段中出现。
(二)限制检索限制符检索是使用AU(作者)、CS (作者单位)、JN (刊物名称)、PY (出版年份)、LA (语言)等限制符号从文献的外部特征方面限制检索范围和检索结果的一种方法。
限制符的用法与后缀符相同,而它的作用则与前缀符相同。
例如,“aircraft / TI, PAT”表示检索结果只包含aircraft这一主题的专利文献。