应用化学文献检索 布尔逻辑
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在检索系统中,数据库设置的可供检 索的字段通常有两种:
表达文献主题内容特征的基本字段和 表达文献外部特征的辅助字段 基本字段包括:篇名、文摘、叙词、 自由标引词四个字段
辅助字段包括除基本字段以外的所 有字段
每个字段都用2个字母表示字段标识符
基本字段:TI(题名)、AB(摘要)、 DE(主题词)、KW(关键词)
检索表达式简称为检索式,是一个既 能反映检索课题内容、又能为计算机 识别的算式,是进行计算机检索的依 据,又称为检索提问式
检索表达式主要是运用各种逻辑运算 符号、位置逻辑算符、截词符及其它 限制符号等,把检索词连接组配起来, 确定检索词之间的关系,准确表达检 索课题的内容
布尔逻辑算符
(1)逻辑“与” 运算符为 and 或 *
运算符为 OR 或 +
用于检索词并列关系(同义词、近义 词)的组配,实现检索词概念范围的 并集,它可以扩大检索范围,防止漏 检,有利于提高查全率
如检索式为:A or B或者A + B 表示检出所有含有检索词A或检索词B 的记录
例如:检索有关“计算机”的文献资 料 计算机 OR 电脑
wenku.baidu.com
(3)逻辑“非”
如: Railway(2N)Bridge
Railway Bridge, Bridge of the Railway
(F)-(Field):表示在此算符两侧的检 索词必须同时出现在同一字段内
如: economic(F)knowledge
economic(F)knowledge ,一篇标 题为“the Economic Impact of Knowledge-Based”的文献记录为命中 文献
运算符为“NOT”或“-”
用来从原来的检索范围中排除不需要 的概念,可以缩小检索范围,增强检索 的准确性
如检索式为:A NOT B 表示检出含有检索词A,但同时不含检 索词B的记录
如:检索动物的乙肝病毒(不要人的)
hepatitis B virus(乙肝病毒) not human(人类)
截词检索
附加字段:AU(著者)、BN(国际 标准书号)、SN(国际标准刊号)、 CS(著者单位)、JN(刊名)或JA (刊号)、LA(语言)、PY(出版 年)、SO(来源出版物)
注意事项:
各个数据库所设立的字段是互不相同 的,即使同一字段,也可能采用不同 的字段代码
在数据库中,字段名称通常放置在 下拉菜单中。
截词:是指检索者将检索词在他认为 比较合适的地方截断 截词检索:则是用截断的词的一个局 部进行的检索,并认为凡是满足这个 词局部中的所有字符的文献,都为命 中的文献。
截词符一般用“?”、“$”或“*” 表示
截词方式按截断部位可分为: 前截词检索、后截词检索、中间截词 检索、前后截词检索等 按截断部位可分为:
有限截词(一个截词符只代表一个字符)
无限截词(一个截词符可代表多个字符)
后截词检索:是最常用的截词检索技 术。将截词符号放置在一个字符串后 面,使词的前方保持一致,也称为前 方一致检索
例如:如输入“employ?(或 eemmppllooyy*、)employing、employee、 employer、employment等词的文献
例如:输入“*magnetic” magnetic( 有磁性的)、electro-magnetic (电磁的)、paramagnetic (顺磁的)、 thermo-magnetic(热磁的)等词汇
例如:输入“*检索”
文献检索、专利检索、商标检索、 信息检索等
中截词检索:截去某个词的中间部分, 使词的两边保持一致,也称为两边一 致检索
如:检索式CD(W)ROM
CD ROM 和 CD-ROM
(nW)-(nWith):表示算符两侧的检索 词之间最多可以插入n(n=1, 2 ,3 …) 个词,但检索词顺序不能颠倒
如:检索式 laser(1W)printer
laser printer, laser clour printer, laser and printer
检索字段可以几个字段同时使用, 以提高查准率,这种方式通常出现 在数据库的高级检索中。
计算机检索技术
计算机信息检索的实质是“匹配运 算”,即由检索者把检索提问变成计 算机能识别的检索表达式输入到计算 机中,由计算机自动对数据库中各文 档进行扫描、匹配。
计算机检索技术主要指检索词的组 配技术和检索表达式的构成规则。
检索词包括主题词、关键词、名称、 分类号、分子式、专利号及各种号 码等
无限截断:指允许截去的字符数量不限 上面的前截词、后截词都是
词位置检索
词位置检索法:运用位置运算符进行 检索的一种方法
位置运算符:用于指明检索项在记录 中的位置关系的符号。
常用的位置逻辑算符:(W)与 (nW)、(N)与(nN)、(X)与 (nX )三类
(W)-(With):要求检索词A紧挨着检 索词B,之间除可以有一个空格或有一 个标点符号,或一个连接号外,不得 夹有任何其他单饲或字母,并且顺序 不得颠倒
(N)-(Near):表示在此算符两侧的检 索词之间必须紧密相连,所连接的词 间不允许插入任何其他单词或字母, 但词序可以颠倒
如: information (N) economy
information economy 和 economy information
(nN)-(Near):表示在此算符两侧的检 索词之间最多可以插入n(n=1, 2 ,3 …) 个词,且词序可以颠倒
用于交叉概念或限定关系的组配, 实现检索词概念范围的交集,可以缩 小检索范围,提高查准率
如检索式为:A and B或者A * B 表示检出同时含有检索词A和检索词B 的记录
例如:检索“胰岛素治疗糖尿病” 方 面的文献信息
insulin (胰岛素) and diabetes(糖尿病)
(2)逻辑“或”
后截断主要使用在如下几个方面:
▪词的单复数,如bag? ▪年代,如199?
▪同根词,如用politic ?可检索 出political、politicalize、 politically、politician等同根 词
前截词检索:将截词符号放置在一个 字符串前面,使词的后方保持一致, 也称为后方一致检索
例如:输入“pract?e”
practice和practise
前后截词检索:截去某个词的前后部 分,使词的中间保持一致,也称为中 间一致检索
例如:输入“?ar?”
part, smart, department, care等
有限截断:指限定截去有限个字符
例如:用“? ?”表示截断1个字符 输入product? ? 检索出含有product、products的记录 用“?? ?”表示截断2个字符
(S)-(Subfield):表示在此算符两侧的 检索词必须同时出现在同一子字段内
如关键词字段中的一个关键词就是一 个子字段
字段检索
字段检索是限定检索词在数据库记录 中出现的字段范围的一种检索方式, 计算机只对限定字段进行查找字段检 索,即指定检索词出现的字段,被指定 的字段也称检索入口、检索途径,大多 数据库可利用字段检索进一步编制检 索表达式。