布尔逻辑检索表达式
第4章 信息检索技术

如:?经济 则数据库中含有经济、工业经济、农业经济 等方面的文献均为命中文献。
3、中截断 (通用字符法或屏蔽)
是把截断符号置于一个检索词的中间,对词中 间出现变化的字符数加以限定。一般中截断仅允许 有限截断。
应用:用于英美单词的不同拼写方式或单复数的 特殊变化。
例如: defence defense
作用:扩大检索范围,增加命中文献量;提高检 索结果的查全率。3、逻辑“非”———————————————A
逻辑运算符: 逻辑表达式为: B
“not”或“-” A not B 或 A-B
其含义为:检索记录中含有检索词A,但不能
含有检索词B的文献,才算命中文献。
例如,在EI COMPENDEX(1998)文档中 检索提问式 SS PATENT NOT GERMAN 所得结果为: S1 S2 S3 110 325 108 PATENT GERMAN PATENT NOT GERMAN
1. 后截断 将截词符号放在一个字符串的右方,满足截词符左 方所有字符的记录都为命中记录。 无限截断:是在检索词词干后面加一个截词符,表 示不限制词尾可变化的字符位数,即查找词干相同的所有 词。例: comput* 表示允许其后可带有任何字符且数 量不限,相当于查找compute、 computed、 computes、 computing、 computer、 computers、computerize、 computerized、computation、 computations、 computational、 computationally 等词。
主题字段 (基本字段)
标题、叙词、关键词、文摘、 分类号等
字段 非主题字段 (辅助字段)
作者、作者工作单位、连续 出版物编号、使用语言、出版 者等
2017第二讲(1)-信息检索概述 二

6. 输出检索结果
根据检索系统提供的检索结果输出格式,选择需要的 记录以及相应的字段(全部字段或部分字段),将结果显 示在屏幕上、存储到磁盘或直接打印输出,网络数据库检 索还可以提供电子邮件发送,整个检索完成。
第三节 检索效果的评价
• 检索效率 检索效率是衡量检索效果好坏的指征,一般通 过查全率和查准率两方面来反映。 查全率:指系统在进行某一检索时检索出的相关文 献与系统文献库中的相关文献总量之比率。 查准率:指系统在进行某一检索时,检索出的相关 文献量与检索出的文献总量之比率。 与查全率和查准率相对应的指标是漏检率和误检率。
检索效果的评价公式
查全率=被检出相关文献量/相关文献总量 =(a/a+c)×100%
例如:查有关“雷尼替丁的含量测定”的文献
运用布尔逻辑技术的检索式可写成: 雷尼替丁 AND 含量测定
其作用是缩小检索范围,提高查准率。
逻辑或:是一种具有概念并列关系的组配
用OR(or)或 +算符表示 A OR B:表示让系统查找含有检索词A或B,或同时包 括检索词A和检索词B的信息。
如:查有关 “维生素C”的文献 (“维生素C”: vitamin C 又称 L-ascorbic acid抗坏血酸)
例: 自行车(模糊) 扩展概念:脚踏车、单车等
精确检索
也称精确匹配或完全匹配,结果中包含与检索词完全相同的内容。
提示
目前计算机数据系统除了提供专业检索要 写检索表达式检索外,更多的会提供其他 检索途径如基本检索、高级检索等,其检 索界面以检索输入框及检索条件限定框的 格式让用户根据已知条件一步步构建检索 表达式来检索文献(构建原理是一致的)
trace elements not zone 微量元素 not 锌
布尔逻辑

举例:查找菠萝方面的文献 检索式为:菠萝+凤梨 为了保证查全率,对那些大家都认同的缩写与 全称要用逻辑或算符。如查找有关计算机辅助设计 方面的文献.用英文检索时如只输入这个词组的缩 写CAD或全称Computer Aided Design 就会造成漏 检,必须输入检索式CAD+computer Aided Design 才能保证查全率。
其意义为:检索记录中含有检索词A,但不能 含有检索词B的文献,才算命中文献。
A
B
用途及检索功能: 用于缩小检索范围, 提高查准率。
常用检索技术-布尔逻辑算符
举例:检索“植物保护但不包括害虫”方面的 文献 采用检索式:植物保护-害虫
常用检索技术-布尔逻辑算符
如在维普数据库中输入检索词:植物保护
常用检索技术-布尔逻辑算符
3、同时使用逻辑“与” (AND)和逻辑 “或”(OR)检索时,应把“或”运 算放在“与”运算的左边。 例如:正确的检索式: (医学+生物)* 健康报
常用检索技术-布尔逻辑算符
布尔运算符优先级比较 有括号时:括号内的先执行; 无括号时:NOT > AND > OR 例:检索“唐宋诗歌”的有关信息。 关键词:唐、宋、诗歌; 检索表达式: (唐 OR 宋)AND 诗歌; 唐 AND 诗歌 OR 宋 AND 诗歌; 错误表达式: 唐 OR 宋AND诗歌; 唐 AND 宋AND诗歌; 唐 AND 宋OR诗歌; 唐 OR 宋OR诗歌;
常用检索技术-布尔逻辑算符
常用检索技术-布尔逻辑算符
如果采用检索式:“植物保护not害虫”这样的 “逻辑非”进行逻辑组配,如下图
常用检索技术-布尔逻辑算符
常用外文数据库的检索利用(综合类)

defen?e defence defense
检索技术
词根检索,即输入一个 词,系统会自动检索出 同一词根的一组词。 例如输入gene,可以检 索出gene、genic、genome 等。
IEE/IEEE全文 数据库默认词 根检索。啊啊
有些数据库需要加 入词根运算符如 “$”才进行词根检 索。啊啊啊啊
检索技术
4
位置算符检索
1. (W)——WITH、 WITHIN 表示在此算符两侧的检索词必须按此前后的顺序 排列,顺序不许颠例
information (W) retrieval 或 information with retrieval
注:不同的数据对不同的运算符有不同的要求和表示方法,比 如有的采用Wn有的采用nW,还有的不支持位置算符,使用时 请先参考数据库的帮助
检索技术
5
短语检索
短语检索(phrase search),也称为词组检索,或 字符串检索。它是将一个词组或短语用双引号“ "" ” 括起作为一个独立运算单元,进行严格匹配,以提 高检索准确度的一种方法。
截词的位置 截词的类型 截词的数量 有限截断、无限截断 前截断、后截断、中间截断
检索技术
2 截词检索
无限截断
不限制被截断的字符数量
例如输入educat*,可以检索出:educator、 educators 、educated、educating、education、 educational等等。
有限截断
检索技术
4
位置算符检索
3. (N) —— Near 、ADJ 由(N)连接的检索词在记录中出现的顺序可以调 换,即查找两个连在一起的单词,但两词之间不能 插入任何词。有的系统用 ADJ (adjacent) 表示。
布尔检索

检索词A和检索词B用“或”组配,检索式为:
A OR B,或者 A+B 它表示检出所有含有A词或者B词的记录。
2-4
逻辑“非”
逻辑“非”是一种具有概念排除关系的组配,用“–”或 “NOT”算符表示。
检索词A和检索词B用“非”组配,检索式为: A Not B,或者 A-B
它表示检出含有A词,但同时不含B词的记录。
常用的检索技术
检索技术是指应用于信息检索过程
的原理、技术、方法、策略的总称,是 检索系统为了提高检索效率,从概念相 关性、位置相关性等方面对检索提问进 行组配、加权、扩展、截词、邻近、限 定的比较和运算处理技术。
2-1
布尔检索
布尔检索(boolean retrieval)是用
布尔逻辑算符将检索词、短语或代码 进行逻辑组配的一种技术,也是目前 最常用的一种检索技术。
2-11
(F)算符
(F) 算符是“Field”的缩写,表示在此运算符 两侧的检索词必须同时出现在文献记录的统 一字段内,如出现在篇名字段、文摘字段、 叙词字段、自由词字段,但两个词的前后顺 序不限,夹在两个词之间的词的个数也不限。 要求被连接的检索词出现在统一的字段中, 字段类型和词序均不限。例如: environmental(F) impact/DE,TI表示这两个词 必须同时出现在叙词字段和篇名字段中。
2-18
确定检索词
2.删除 删除是对自然语言中不具有实质性检索意义的虚词 (如介词、连词、副词等),或者使用频率较低的 词,或者专指性太高、过分宽泛的词,或者过分具 体的限定词、禁用词,或者不能表达课题实质的高 频词,或者存在蕴含关系可以合并的词,一律予以 删除,使自然语言转换成为关键词和主题词的集合。 如上例中的“与”、“的”、“关系”、“研究” 。 例2:检索“中国非常规天然气工业的发展前景研 究”方面的相关文献。进行拆分以后,工业、发展、 前景、研究这四个自由词具有一定的检索意义,但 是由于或者是意义过于宽泛、或者是不能表达课题 实质、或者是存在蕴含关系的原因,没有必要全部 作为检索词,根据需要可以保留1-2个作为检索词。
第三章 网络信息检索

第三章网络信息检索第一节网络信息检索的基本方法1、布尔逻辑检索逻辑检索是一种比较成熟、较为流行的检索技术。
逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符,主要的运算符有:(1)逻辑―与‖逻辑―与‖用AND(或﹡)表示。
检索词A、B若用逻辑―与‖相连,即A AND B(A*B),则表示同时含有这两个检索词才能被命中。
例如,要检索儿童教育的文献,检索逻辑式可表示为:child AND education(2)逻辑―或‖逻辑―或‖用OR(或+)表示。
检索词A、B若用逻辑―或‖相连,即A OR B(A+B),则表示只要含有其中一个检索词或同时含有这两个检索词的文献都将被命中。
例如,要检索―计算机‖或―机器人‖方面的文献,检索逻辑式可表示为:computer OR robot. (3)逻辑―非‖逻辑―非‖用NOT(AND NOT,BUT NOT)(或-)表示。
检索词A、B若用―非‖相连,即A NOT B(A-B),则表示被检索文献在含有检索词A而不含有检索词B时才能被命中。
例如,要检索有关―能源‖方面的文献,但涉及―核能‖方面的文献不要,检索逻辑式可表示为:energy NOT nuclear(energy –nuclear)。
1、搜索引擎的定义搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具,简言之,搜索引擎就是一种在因特网上查找信息的工具。
用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果反馈给用户。
搜索引擎一般都有固定的显示格式,内容详简程度不一,常常带有URL、题名、标题、关键词、摘要(文本描述摘录)、超链接文件大小、检索结果总数、相关度估计、评论等。
搜索引擎的检索结果一般按查询的相关程度进行排列,最相关的通常排在最前面。
2、搜索引擎的常用检索方法(1)简单搜索(simple search)指输入一个单词(关键词),提交搜索引擎检索后反馈结果。
它也叫单词搜索。
文献检索总结

Web of Science®| 逻辑运算符词Pisces 的记录。
(honey bee* OR honeybee* OR Apis mellifera) SAME danc* 可查找在以danc 开头的任何单词(如dance、dances、dancing)所在的句子中包含括号内的任一单词或短语(如honey bee、honey bees、honeybee、honeybees、Apis mellifera)的记录。
Web of Science®目录| 索引| 关闭帮助Web of Science®目录| 索引| 关闭帮助高级检索字段标识AD=地址AU=作者CF=会议例如:CF=(IEEE AND Cell*)CI=城市CU=国家/地区FG=授权号新字段标识!FO=基金资助机构新字段标识!。
FT=资助正文新字段标识!GP=团体作者OG=组织数据PS=省/州PY=出版年例如:TS=cell AND PY=2007SA=街道地址SG=下属组织SO=出版物名称TI=标题TS=主题ZP=邮政编码Web of Science®目录| 索引| 关闭帮助高级检索1. 在“高级检索”文本框中输入“检索历史”表中的两个或两个以上检索式编号。
允许使用布尔运算符(AND、OR、NOT)。
2. 单击检索。
3. 在“检索历史”表中,单击“结果”栏中的链接,查看您的检索结果。
检索式组配检索示例#1(或者任何检索式编号)刷新检索式结果。
在这种情况下,您可能希望先选择其他入库时间,或者更改语种、文献类型和/或分类注释。
#1 AND #2查找在检索式#1 和#2 中都出现的所有记录。
#2 NOT #3查找在检索式#2 中但不在检索式#3 中的所有记录。
#2 OR #3查找检索式#2 和#3 中的所有记录,包括这两个检索式共有的记录。
(#2 NOT #1) AND #3查找在检索式#2 中但不在检索式#1 中的所有记录,并且只查找同时在检索式#2 和#3 中的记录。
维普数据库检索方法

” 的文献。
逻辑非的作用:在检出的文献集合中排除无用的 文献,缩小检索范围,提高查准率。
A
B
6
注意 !
① 布尔逻辑检索的执行顺序。3种布尔逻辑检索 运算符之间的运算顺序为NOT、AND、OR。有()时, 先执行括号内的逻辑运算。
同单位同 名作者,可以选择作者单位来限制同名作者范围。 查看分类表:可以直接点击按钮,会弹出分类表页,操
作方法 同分类检索。 查看相关机构:查看相关机构,即可显示以该机构为主
办(管)机 构的所属期刊社列表。 查看变更情况:查看变更情况,系统会显示出该期刊的
曾用刊名 记录,以获得更多的信息。
不同字段检索可调整检出文献篇数
17
高级检索的两种方式:
(一)向导式检索
1、检索界面 2、检索规则 3、扩展功能 4、扩展检索条件
(二) 直接输入检索式检索
18
(一)向导式检索
⑴ 检索界面 分栏式检索词输入方法。可选择逻辑运算、
检索项、匹配度外,还可以进行相应字段扩展 信息的限定,最大程度的提高了“检准率”。
(1) 精确:检索结果完全等同或包含与检索字/词完 全相同的词语;
(2) 模糊:检索结果包含检索字/词或检索词中的词 素。
在以下字段用到匹配关系 关键词、作者、第一作者、分类号、栏目信息、基金
资助 作者简介
10
3 同名作者的使用
维普数据库提供这样一个不同于其他数据库的 功能,就是用作者字段进行检索的时候,为了防 止重名重姓的作者混淆文献结果,可以先根据作 者单位进行作者的筛选,然后再继续检索,这样 可以防止误检。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
布尔逻辑检索表达式
布尔逻辑检索表达式是一种用于描述检索条件的表达式,常用于信息检索和数据库查询等领域。
它可以通过逻辑运算符(如AND、OR 和NOT)来组合多个条件,以便筛选出符合要求的数据。
以下是一些常见的布尔逻辑检索表达式的示例:
1. 单个条件的表达式:
- age > 18:表示年龄大于18岁的条件;
- name = "John":表示姓名为"John"的条件;
- price < 100:表示价格小于100的条件;
2. 多个条件的表达式:
- age > 18 AND gender = "male":表示同时满足年龄大于18岁和性别为男性的条件;
- (name = "John" OR name = "Jane" AND age > 20:表示姓名为"John"或"Jane"且年龄大于20岁的条件;
- category = "electronics" AND (price < 100 OR brand = "Apple":表示分类为"electronics"且价格小于100或品牌为"Apple"的条件;
3. 复合条件的表达式:
- NOT (age > 18 AND gender = "male":表示年龄不大于18岁或性别不为男性的条件;
- (NOT name = "John" OR (NOT age > 20):表示姓名不为"John"或年龄不大于20岁的条件;
- NOT (price < 100 OR brand = "Apple":表示价格不小于100且品牌不为"Apple"的条件;
使用布尔逻辑检索表达式可以更精确地控制检索条件,提高检索结果的准确性和相关性。