信息检索06-组配检索及其运算符

合集下载

文献信息检索 ppt课件

文献信息检索 ppt课件
10
分类途径 根据分类语言进行检索的途径,它是一种按学科范 畴和体系来划分事物的检索语言,以分类表的形 式体现。国内文献分类一般使用《中国图书馆图 书分类法》(简称《中图法》).(P30) 专利使用《国际专利分类法》(IPC)分类。国外 分类法很多,比较常见的有《美国国会图书馆分 类法》(LC)、《国际十进分类法》等。
shoe)”,才能得到满意的查全率。当然,如果下位词太 多,则不能全部选择。如果下位词检索效果不理想,也可 以在上位词中检索。海南黄花梨病虫害防治,没有专门的 书,但在《景观植物病虫害防治 》一书中有一节专门论述。
❖ 不同外来词译法的变化:如:“欧几里德”、“欧几里 得”、“欧基里德”、“欧几理德 ”、“Euclid”。 “aspirin”、“阿斯匹林”, “阿司匹林”, “乙酰水 杨酸”。
❖ 考虑相应的同义词。对同一事物,人们对其有不同 的称呼和表达,如“计算机”又称“电脑”、“图 形图像与图形图象”要用逻辑或进行检索。
36
❖ 上位词、下位词:检索词有上位词下位词之分,一般来说, 如果检索上位词,要同时检索下位词,如在EBSCO中,我
们检索“芭蕾舞服装(ballet costume)”,必须同时 检索“芭蕾舞裙(ballet skirt)”、“芭蕾舞鞋(toe
2
精品资料
• 你怎么称呼老师? • 如果老师最后没有总结一节课的重点的难点,你
是否会认为老师的教学方法需要改进? • 你所经历的课堂,是讲座式还是讨论式? • 教师的教鞭 • “不怕太阳晒,也不怕那风雨狂,只怕先生骂我
笨,没有学问无颜见爹娘 ……” • “太阳当空照,花儿对我笑,小鸟说早早早……”
词汇。
❖ 检索词的词干后(前)加一个“?”(有的系统 为加*),表示词干后(前)可以有任意个字符。

用于组配检索词和限定检索范围的布尔逻辑运算符

用于组配检索词和限定检索范围的布尔逻辑运算符

`在信息检索中,可以使用布尔逻辑运算符来组配检索词和限定检索范围。

以下是常用的布尔逻辑运算符及其功能:
AND(与):使用AND运算符可以将多个检索词组合在一起,要求检索结果必须同时包含所有的检索词。

例如,"apple AND orange"将检索包含同时包含"apple"和"orange"的结果。

OR(或):使用OR运算符可以将多个检索词组合在一起,要求检索结果包含其中任意一个检索词。

例如,"apple OR orange"将检索包含"apple"或"orange"的结果。

NOT(非):使用NOT运算符可以排除某个检索词,要求检索结果不包含该检索词。

例如,"apple NOT orange"将检索包含"apple"但不包含"orange"的结果。

()(括号):使用括号可以改变布尔运算符的优先级,从而调整组配检索词的顺序和逻辑关系。

例如,"(apple OR orange) AND banana"将先进行"apple OR orange"的组配,然后再与"banana"进行AND操作。

通过使用这些布尔逻辑运算符,您可以灵活地组配检索词并限定检索范围,以获得更精确和符合需求的检索结果。

需要注意的是,不同的搜索引擎或数据库可能对布尔逻辑运算符的使用语法略有不同,因此在具体的检索系统中,您可以查阅相关的操作手册或帮助文档来了解具体的语法规则和示例。

信息检索考题汇总

信息检索考题汇总

1.评价信息网站的标准不应该包括下列哪项流动性简洁性2.你在网上找到的信息是来源多样化,包括商业、政府或个人3.为了得到图书馆书架上的一本书,你需要知道图书索书号4.南航图书馆的图书顺序排架,以下哪项是正确的?TP301/1005、TP311.1/1002、TP313/1030、TP39/1025、5在电子数据库(联机目录、期刊数据库),能找到最多相关检索结果的方法是主题查询6为了扩大检索,你该使用下列哪个布尔运算符or7当查询数据库时,在检索词尾我们有时会使用截词符(*),其目的是检索出这个词形开头的所有词的纪录8当你因为使用了不恰当的主题词导致找不着所需信息时,应采取下列哪种方法:试着用一个同义词来替换你刚才用的主题词9想查询本专业领域的核心期刊及其影响因子的情况,应利用哪个数据库Journal Citation Reports(JCR1某研究员发表了一篇文章被SCI收录,如果他希望日后这篇文章被人引用时,能接到系统自动发出的通知,他必須在个性化功能中设定:My Preferences Citation Alerts1下列哪些数据库可查会议文献Ei Engineering Village 2 (EI)ACM Digital Library (ACM1下列哪些可能是当前的、最新的信息源因特网上的文章或信息1我校图书馆网站站主页网址是?1在百度检索文本输入框中分别输入中国银行和“中国银行”,其检索结果应为:______前者多,后者少;前者的结果包含后者1网络信息是否应该给予法律保护其知识产权?应该1剽窃是在你的著作中包含了他人的观点,但是你却没有标明你是引用别人的1期刊的引文通常提供主题查询或关键词查询的机会作者、刊名、日期、页码1南京航空航天大学图书馆采取的分类法是:______中国图书馆分类法1检索结果偏少,对检索词应该如何调整增加同义词变换为上位词增加相关词1中国图书馆分类法采用:______字母和数字相结合的混合号码1这篇文献是会议文献吗,请判断。

网络信息资源开发练习题第1章 信息资源检索基础知识

网络信息资源开发练习题第1章 信息资源检索基础知识

第1章信息资源检索基础知识第一部分选择题一、单项选择题。

在每小题列出的备选项中只有一项是最符合题目要求的,请将其选出。

1.文献的三个基本属性是知识性、物质性和(D)A.符号性B.交流性C.传递性D.记录性2.在信息概念的诸多层次中,最重要的两个层次是从客体出发的本体论层次和从主体出发的(B)A.客观论层次B.认识论层次C.主观论层次3.通常依据信息表达形式和所依附的载体将信息资源分为口语信息资源、体语信息资源、文献信息资源和(A)A.实物信息资源B.记录型信息资源C.多媒体信息资源D.样本信息资源4.一般是以纸张为存储载体,以印刷技术为主要记录手段,如油印、胶印、复印、激光打印等的文献信息资源是(D)A.书写型信息资源B.记录型信息资源C.声像型信息资源D.印刷型信息资源5.属于一次信息资源的是( A )A.期刊论文B.百科全书C.综述D.文摘6.文献检索工具可以进一步细分为四种检索工具:目录、文摘、索引和 ( B )A.书目B.题录C.摘要D.年鉴7.在布尔检索法中,“A or B”表示査找出( C )A.含有检索词 A同时含有检索词 B的文献B.含有检索词 A而不含检索词 B的文献C.含有 A、B之一或同时包含 AB两词的文献D.含有检索词 B而不含检索词 A的文献8.使用国家图书馆的高级检索方式,检索式“主题=(民用飞机)”的含义是(A)A.检索主题词字段含有民用飞机的记录B.检索作者字段含有民用飞机的记录C.检索标题字段含有民用飞机的记录D.检索关键词字段含有民用飞机的记录9.以刊载新闻为主的出版周期最短的定期连续性出版物是(B)A.图书B.报纸C.期刊D.会议论文10.用来组配检索词的并列关系的组配运算符是(A)A.逻辑“与”B.逻辑“或”C.逻辑“非”D.以上均不是11.以磁性材料为载体,以磁录技术为主要记录手段而形成的,如磁带、磁盘、光盘等的文献信息资源是( C )A.多媒体信息资源B.记录型信息资源C.声像型信息资源D.机读型信息资源12.二次检索指的是(C )A.第二次检索B.检索了一次之后,结果不满意,再检索一次C.在上一次检索的结果集上进行优化的检索D.与上一次检索的结果进行对比,得到的检索13.检索语言中,用未经规范化处理的自然语言词汇表达的是( D )A.标题词B.主题词C.叙词D.关键词14.检索有关“飞机”、“车辆”、“轮船”等文献,从理论上说主题词应该是( D )A.“飞机”、“车辆”、“轮船”任意一个B.“交通工具”C.“飞机”、“车辆”、“轮船”三者D.这三个词的任意一个加上“交通工具”15.位置检索主要有词位置检索、同字段检索和 ( A )A.同句检索B.F算符检索C.L算符检索D.X算符检索16.没有经过规范化处理的自然语言,通常从文献的题名、摘要或正文中直接抽取出来,能够揭示信息内容特征的具有检索意义的词汇是 ( A )A.关键词B.叙词C.单元词D.标题词17.由政府部门及其所设立的专门机构发布、出版的文献信息资料是 ( B )A.档案文献B.政府出版物C.标准文献D.科技报告18.只检索最新的信息,检索的时间跨度小,非常适合于信息跟踪,便于及时了解有关主题领域的最新发展动态的检索是 ( B )A.回溯检索B.定题检索C.计算机检索D.事实检索19.检索效果是指检索服务的有效程度,其中由检索系统完成其功能的能力确定,主要表征检索系统的性能和服务质量的是 ( C )A.服务效果B.经济效果C.技术效果D.功能效果20.对于信息检索用户来说,影响查全率和查准率的因素中不包括( D )A.检索词使用不当B.检索系统选择不恰当C.检索课题要求不明确D.检索系统内信息存储不全面21.能够反映事物之间的相关和从属派生等关系,便于用户按学科门类进行族性检索的检索语言是 ( D )A.主题语言B.代码语言C.引文语言D.分类语言23.在检索时如果检索工具不全或者检索系统收录内容不完整,为了扩大信息线索,此时可以借助于(D)A.顺查法B.倒查法C.抽查法D.回溯法24.按照标引的工作方式分类,标引可以分为人工标引、计算机辅助标引和(A)。

网络信息检索技术

网络信息检索技术

网络信息检索技术网络信息检索中,基本的检索技术有布尔逻辑检索、截词检索、位置检索、限制检索等。

一、布尔逻辑检索逻辑检索是一种开发较早、比较成熟、在信息检索系统中广泛应用的技术。

布尔逻辑检索就是采用布尔关系运算符来表达检索词与检索词之间逻辑关系的检索方法,目前最常用的布尔逻辑运算符主要包括逻辑“与"(AND)、逻辑“或"(OR)、逻辑“非”(NOT)。

(一)逻辑“与”逻辑“与”,也称为逻辑乘,用AND表示,是用来组配不同含义检索词之间的限定关系。

检索词A、B以AND (或“*")相连,即A AND B (或A*B),表示同时包含A、B两词的文献才是命中记录,因而逻辑“与”运算用于对检索词进行限定,从而缩小检索范围,提高检索结果的查准率。

例如,要查找children education (儿童教育)方面的文献,检索逻辑式可表示为“children * education”或者“children AND education” o运算的结果是同时含有检索词children和检索词education的文献才被检索出来。

(二)逻辑“或”逻辑“或”,也称为逻辑加,用OR或者"+”表示,是用来组配同义或者同族检索词之间的并列关系。

检索词A、B若以OR或“+”相连,即A OR B(或A+B),表示只要含有A、B之一或者同时包含A、B的文献都是命中记录。

因而逻辑“或” 运算可用于扩大检索范围。

例如,要查找“汽车”方面的文献,因为汽车在英语中可以用car或者automobile表示,所以为了将有关汽车的文献全部检出,避免漏检,检索逻辑式就可表示为“car OR automobile”或者“car + automobile” o运算的结果是含有car或者automobile任意一个或者同时两个的文献均被检索出来。

(三)逻辑“非”逻辑“非”用NOT或者"-”来表示,是用来组配概念的包含关系,可以从原检索范围中排除一部分,因而使用逻辑“非”运算可以缩小检索范围。

计算机信息检索原理

计算机信息检索原理

截词的类型
依截断的位置分: 前截断、后截断和中截断 依有无限定分: 非限制性截词和限制截词。
非限制性截词
是在词干后面加上一个“?”号,表示允许 在词干后出现的字符数不限。 如:comput? 命中记录中会出现“compute‖、 ―computed‖、―computer‖、―computing‖、 ―computers‖、―computable‖、 ―computations‖、―‖computerize、 ―computerization‖等相关词。
如:analy?e?,命中记录中将出现“analyzer‖|和 “analyses‖等词汇。
“ ? ”出现在词干尾,若有“???”,表示 允许该处可填入0-3个任意字符;若有“? □?”则表示该处最多可填入 1 个字符,比如 加“S‖来表达一词的复数形式。 如: work???,命中记录中会出现“ work‖、 ―works‖、―worker‖、―workers‖及“working‖ 等词汇。 如: work? □?, 命中记录中只会出现“ work‖ 和“works‖。
① 逻辑“或”(OR)运算符: 也可用“ + ”代替,是用 来组配具有同义或同族概念的词。 如:检索提问式:“A OR B”或“A + B” 其含义是数据库记录中任何一条记录,只要含有“A”或 “B”中任何一个检索词即为命中的文献(如下图阴影 部分)。
“OR”算符的基本作用是扩大检索范围,增加命中文献 量,提高文献的查全率。如: “微机 + 电脑 + PC机”、 “微机 or 电脑 or PC机”
building(W)construction 检索命中的记录将有 “building construction‖或“building-construction‖ 等形式。 building(1W)construction 命中记录中除以上形式外, 还可能有 “building and construction‖,―building under construction‖等形式。 building(2W)construction除前面那些形式外,命中记 录中还可能会出现有“building design and construction‖,―building code and construction‖、 ―building in composite construction‖等形式。n的选 择需要认真考虑。

信息检索技术

信息检索技术

为了提高检索的广度和准确度,常常需要对检索词之间的位置关系加以限定。
•**全文检索的运算方式,不同的检索系统有不同的规定,主要差别有两点: • 规定的位置算符不同; • 位置算符的职能和使用范围不同。 下面介绍几种数据库经常使用的位置运算符:
1.W - With
W 算符是With的缩写,表示在此算符两侧的检索词必须按输入时的前后 顺序排列,不能颠倒。所连接的词之间除可以有一个空格、标点或连接号外不得 夹有任何其他单词或字母。
5)核心词太多


对于由A、B、C、D、E多个主题组合的 多主题概念课题,如果将所有主题混在 一起同时组配,会造成“零结果”现象。 因为,只要A、B、C、D、E其中之一的 检索结果为零,则经过布尔逻辑“和” 的运算,检索结果=A*B*C*D*E =0 。
第三节 机检基础知识


计算机检索式(逻辑表达式): 检索词+有关算符 1、布尔逻辑算符 2、截词算符 3、字段限定符 4、位置算符
一、布尔逻辑检索
在计算机文献检索中,用户的检索需求是通过检索提问式表达的,逻辑算 符在检索提问式中起着逻辑组配作用,它们能把一些具有简单概念的检索词(或 检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索需求。
一、布尔逻辑检索
在计算机文献检索中,用户的检索需求是通过检索提问式表达的,逻辑算 符在检索提问式中起着逻辑组配作用,它们能把一些具有简单概念的检索词(或 检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索需求。
布尔逻辑(组配)算符:系统中采用的逻辑组配算符是布尔代数中的逻辑运 算符AND/*(与)、OR/+(或)、NOT/—(非)。
2. 中截断 (通配符或屏蔽) 是把截断符号置于一个检索词的中间,对词中间出现变化的

文献检索总结

文献检索总结

Web of Science®| 逻辑运算符词Pisces 的记录。

(honey bee* OR honeybee* OR Apis mellifera) SAME danc* 可查找在以danc 开头的任何单词(如dance、dances、dancing)所在的句子中包含括号内的任一单词或短语(如honey bee、honey bees、honeybee、honeybees、Apis mellifera)的记录。

Web of Science®目录| 索引| 关闭帮助Web of Science®目录| 索引| 关闭帮助高级检索字段标识AD=地址AU=作者CF=会议例如:CF=(IEEE AND Cell*)CI=城市CU=国家/地区FG=授权号新字段标识!FO=基金资助机构新字段标识!。

FT=资助正文新字段标识!GP=团体作者OG=组织数据PS=省/州PY=出版年例如:TS=cell AND PY=2007SA=街道地址SG=下属组织SO=出版物名称TI=标题TS=主题ZP=邮政编码Web of Science®目录| 索引| 关闭帮助高级检索1. 在“高级检索”文本框中输入“检索历史”表中的两个或两个以上检索式编号。

允许使用布尔运算符(AND、OR、NOT)。

2. 单击检索。

3. 在“检索历史”表中,单击“结果”栏中的链接,查看您的检索结果。

检索式组配检索示例#1(或者任何检索式编号)刷新检索式结果。

在这种情况下,您可能希望先选择其他入库时间,或者更改语种、文献类型和/或分类注释。

#1 AND #2查找在检索式#1 和#2 中都出现的所有记录。

#2 NOT #3查找在检索式#2 中但不在检索式#3 中的所有记录。

#2 OR #3查找检索式#2 和#3 中的所有记录,包括这两个检索式共有的记录。

(#2 NOT #1) AND #3查找在检索式#2 中但不在检索式#1 中的所有记录,并且只查找同时在检索式#2 和#3 中的记录。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• CL= G354* AND KY= 信息 • KY= Solar energy AND PY= 2002 • KY= 房奴 OR TI= 房奴 OR AB= 房奴
• 问号?代表至多1个字符(包括空字符)
• 星号*代表任意多个字符(包括空字符)
• authori?e
– 可以代替authorise
• 位置符的形式有:W、W()和NEAR
– 在原文中两个词之间只充许有一个字符的符号或 空格
– 在原文中两个词的前后位置与检索词一致
• 两个关键词的前后位置将决定其限定与被限关系,而被限 定词总是核心概念
• 两个关键词在文中的距离越近其关联度越高
– 低利用率文献合作储存的理论和实践 – 低利用率期刊文献的合作存储策略
• 以下组配表达式是错误的
– K1 AND K2 OR K3
• 但当K1 AND K2 在概念内涵上约等于K3 时,可以使用 如下格式
– 商业银行 AND 竞争力 OR 商业银行核心竞争力
• 圆括号可以嵌套使用,但不能并列使用 • 以下组配表达式是允许的:
– (K1 OR K2)AND K3 – ((K1 OR K2)AND K3)AND K4
• 在第一步检索中使用过的词,在二次检索(在结果 中检索)时不应重复使用
谢谢观赏
WPS Office
Make Presentation much more fun
@WPS官方微博 @kingsoftwps
– B22 – B221 - B229 – B229.1 - B229.9
• 汽车*能查到下位概念 – 汽车发动机 – 汽车底盘
• 发动机*不能查到下位概 念 – 汽车发动机 – 飞机发动机
• 运算符形式是:> 、≥ 、< 、≤ • 通常以选项的形式出现 • 常用于出版日期等日期型和数值型字段
• 用于控制两个检索词在原文中出现的距离
• 逻辑与运算符的相关度控制力不如位置算符高
组配词之间只有逻辑与运算符的,要按词的重要性高低由左到右排列
AND
K1
AND
K2
K3
• 组配词之间既有逻辑与运算符又有逻辑或运算符的, 逻辑或连接的词要用圆括号括起来,并放在检索表达 式的最前面
• 以下组配表达式是正确的
– (K1 OR K2 )AND K3
• 逻辑非运算关系常用于同形异义词中的辩析区分 • 排除检索结果中有可能出现的其他概念
– 不是一般地排除不需要的概念
• 排除概念的方法
– 使用分类号组配 – 特征词排除检索结果中可能包含但不需要概念
xor 包昌火 XOR 谢新洲
表示在逻辑或关系中排除交叉概念部分 常用于查找有合著情况的单一作者撰写的资料
第5章
组配检索及其运算符
and 航空 AND 发动机
*
• 作用:提高查准率,降低误检率 • 特点:词间距任意,词序任意 • 语境词的限定问题
• 苹果? • (水果 OR 农产品 OR 梨 OR 香蕉)AND 苹果
• 概念等同的词 • 概念从属的词 • 可替换的高度相关词 • 不相邻的词
• “语言相关性” ≠ 语言 AND 相关性 • 结论:

*英汉双解*
– 可查出:牛津英汉双解词典
• 注意

*英汉词典*
– 不能查出:牛津英汉双解词典
关键词字段与题名字段检索原理 对结果的影响
—— 任意匹配与首字匹配
• 题名字段一般采用任意匹配 – 结构方程 模型 媒体营销
• 关键词字段一般采用首字匹配 – 结构方程模型 社会化媒体营销
• B22*可查到该类号及其效*
– 可以代替 绩效

绩效评估

绩效评价

绩效测评
• 前方一致(截词检索)

牛津*
– 可查出:牛津
– 可查出:牛津英汉双解词典
• 后方一致

*双解词典
– 可查出:牛津英汉双解词典
• 前后一致

牛津*双解词典
– 可查出:牛津英汉双解词典
– motor?bicycle
• 任意一致(模糊检索)
– 固定词组的查准率高于单词的逻辑与组配 – 中文检索表达式中逻辑与组配的单字(不是指单词)
总数一般不宜超过8个
or • 物流 OR 供应链
+
• 包含了逻辑与检索结果 • 提高查全率,降低漏检率
概念等同
或从属关 系的词
可替换的
高度相关 词
不相邻的词
not • KY=疲劳 NOT CL=T*
-
• 检索入口
– 检索窗口上输入检索词的数据库字段接口
• 检索字段
– 数据库中面向用户进行文本匹配的字段
• 检索项
– 与检索字段是同义词
• 检索入口与检索字段的关系
– 一对一 – 一对多
可用的词形 标题中匹配情况
题名字段
可以使用短语甚至短句 只能查出标题里出现的概念
关键词字段
只能使用单词和词组 可以查到标题中没有出现的概念
• 以下组配表达式是不允许的
– (K1 OR K2)AND (K3 OR K4)
• 只有在检索结果中有可能大量出现某个不需要的概 念时才有必要使用逻辑非运算符。
• 以下检索策略是错误的
– 085工程 AND 内涵建设 NOT 建筑工程
• 以下检索策略有必要使用逻辑非运算符
– (乳酸菌 OR 双歧杆菌)AND 酸奶 NOT 发酵
相关文档
最新文档