计算机检索的方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(nN)算符:
(nN)表示两词间可插入最多n个词,词序可变。 information(1N)retrieval
可检出: information retrieval retriveal of information
如检索式environment (2N) protection 就可检索出包含“environment protection”、“environment of the protection ”、“environment of water protection”、 “protection of forest environment”等内容的结果。
科技文献检索
上一讲重点回顾
1、 《中图法》
2、工具书的类型及使用
3、手工检索的方法
第三讲 计算机检索
每节技巧 引入
第一节
运算符 第二节 搜索引擎及搜索技巧 第三节 搜索引擎及举要
引入
脱机检索
联机检索
从50年代中期到60年代 从60年代中期到70年代初, 从80年代初到现在,信息用 中期,特点是不对一个检 用户可以通过检索终端设 漫长的手工检索阶段 户可借助国际通讯网络直接与 索提问立即作出回答,而 80年代,CD-ROM的 备与检索系统中心计算机 检索系统联机,从而实现不受 是集中大批提问后进行处 进行人机对话,从而实现 出现及发展,使得光 地域限制的国际联机信息检索, 理,且进行处理的时间较 对远距离之外的数据库进 盘检索的数据结构、 使人们可以在很短的时间内查 长,人机不能对话。 行检索的目的。 检索指令与远程联机 遍世界各国的信息资料,使信 检索系统一样,但通 息资源共享成为可能。 信成本却大大降低。
filetype:文件类型,用于在特定类型的文件中检索你需要
的内容。 例如,检索:工业工程 filetype:ppt,就是搜索那些在文档 内容中出现了“工业工程”四个字的ppt文件,得到的结果 都是ppt文件。
这可能ຫໍສະໝຸດ Baidu搜索“工业工程
幻灯片”的效果还要好。
这里文件类型可以是,文本文档.txt,Office文档
第一节
运算符
2. 位置算符
(F)算符:
如:television (L)high definition (F)是field的缩写,表示此算符两侧的检索词必须同时出现 命中记录的规范词字段(de)中出现的匹配词是: 在信息记录的同一个字段内,两词的词序不限,两词间插入词 TELEVISION-High definition。
全国各省网速?
全国平均网速100.9KB/S
全国平均网速100.9KB/S
网民年龄结构
网民学历结构
2006-2010年网页规模变化
第三讲 计算机检索
引入 第一节
运算符 第二节 搜索引擎及搜索技巧 第三节 搜索引擎及举要
第一节
1. 布尔逻辑算符
运算符
使一些具有简单概念的检索单元通过组配 成为一个具有复杂概念的检索式,用以表达用 户的信息检索要求。 主要有OR、AND、NOT。
(nW)算符:
运算符
(nW)是n words的缩写,表示此算符两侧的检索词之间允 许插入最多n个词,且词序不可变。 如wear (1W) material相当于检索 wear materials、wear of materials等词。
第一节
2. 位置算符
(N)算符:
运算符
(N)是near的缩写,表示此算符两侧的检索词必须紧密相 连,词序可变,词间不允许插入其他词或字母,但允许有一空 格或标点符号。
如.xls、.ppt、.doc、.rtf,WordPerfect文档,Adobe 的.pdf文档,Flash动画文档的.swf文档,电子书文档.chm 等等。
第一节
运算符
9. inurl 在特定的URL链接中搜索
inurl:限定词,用于在特定的URL链接(也就是网址,网页
地址)中搜索你需要的结果。 很多网站把某一类具有相同属性的资源名称显示在URL链接 中,常见的有“mp3”、“midi”、“pdf”、“doc”等。用 这个语法的好处是,你是在已经被分类的专题资料中搜索, 所以检索结果的相关性非常高。 例如,要搜索二泉映月的mp3:二泉映月 inurl:mp3,就是 在URL链接中含有“mp3”的页面中搜索,所以得到的搜索 结果自然是相关度非常高的。
第一节
运算符
3. 截词符和通配符(*或?)
主要应用于西文数字资源的检索
一般用“*”代表一个字符串,用“?”代表任意一个字符
作用:主要是提高查全率,减少检索词的输入量,提高检索 效率。 按截词位置可分为前截词、后截词、前后截词和中间截词;
按截断字符数的不同,可分为有限截断和无限截断。
第一节
拼法,defen*e可同时检出defence和defense的结果。
前后截词:词干的前后各有一个截词符,允许检索词的前端
和尾部各有若干变化形式。 如?computer?可检索computer、computers、computerize、 computerized、computerization、minicomputer、 minicomputers、microcomputer、microcomputers等结果。
找到相关网页约11,700,000篇 找到相关网页约2,100,000篇
第一节
运算符注意问题
运算符
在不同的数据库中,所使用的逻辑符号可能是不同的,
有的用“and、or、not” 有的用“*、+、-”。一些网 络检索工具如搜索引擎甚至用“︺、,、-”(即空格、 逗号、减号)来表示。 位置算符对提高检索的查准率有重要作用,但网络检 索中基本上只支持(W)、(nW)和(N)、(nN)检 索式。 在不同的数据库和联机检索系统中,所使用的截词符 号没有统一的标准,有的用“?”,有的用“*”,有 的用“#”,用的用“$”等。 即便常用的“?”和“*”在不同的数据库中其用法也 是不一定相同的。
的数量不限。用此算符时须指定所要查找的字段,如题名字段、 文摘字段、叙词字段等。
(S)算符:
(S)是subfield的缩写,表示两个检索词须同时出现在文献记 录的同一子字段中,两词的词序不限,两词间插入词的数量不 限。它比(F)的限制更严格 。
(L)算符:
(L)是link的缩写,表示两个检索词之间存在从属关系或限制 关系。如果其中一个为一级主题词,那么另一个就是二级主题 词。
如: Industrial Engineering(S) optimization 命中记录出现的匹配情况如: Industrial Engineering (often now supplemented as "Industrial & Systems Engineering" or "Industrial & Operations Engineering") is a branch of engineering dealing with the optimization of complex processes or systems.
第一节
4. 字段限制检索
运算符
对检索词范围(时间、国别、语种、信息类型等)进行约束
或压缩的方法,它大多通过检索系统的限制符号或限制命令 来实现。
例如有一检索表达式“microcomputer*(patent
technology)*(Time=1998)*(Language=English)”
光盘检索
网络化 联机检索
引入
■ 数据来源自CNNIC2011年1月19日发布的《第27次中 国互联网络发展状况统计报告》
截至 2010 年底,我国网民规模已占全球网民总数 的 23.2%,亚洲网民总数的 55.4%。
引入
■ 数据来源自CNNIC发布的《中国互联网络发展状况统计报告》
互联网普及率最高的省份或地区?
第一节
1. 布尔逻辑算符
运算符
逻辑或(+,OR):表达检索词间的并列关系。 如:A+B,表明结果中含有A或B都为检索命中。 作用:放宽提问范围,增加 检索结果,起扩检作用,提 高查全率。
第一节
1. 布尔逻辑算符
运算符
逻辑与(*,AND):表达检索词间的交叉关系。 如:A*B,表明结果必须同时含有A和B才为命中。 图中两者共同的部分只计一次,故避免了命中文献的 重复出现。 作用:增加限制条件,即增 加检索的专指性,以缩小提 问范围,减少文献输出量, 提高查准率。
里的:是半角符号,也就是英文的标点符号)。
例如,检索:工业工程 site:www.gdpa.edu.cn,
就是检索广东石油化工学院教育网中关于“工业工程”的内
容。
如不加限制搜索工业工程关键字,结果有14,700,000条,加
限制是32条。
第一节
运算符
8. filetype 在特定的文件类型中搜索
运算符
3. 截词符和通配符(*或?)
右截词,又称后截词、前方一致。允许检索词尾有若干变化。
例如comput*将检索出computer 、computing、
computerised、computerized、computerization等结果。
左截词,又称前截词、后方一致,允许检索词前有若干变化。 例如*physics就可检索到physics、astrophysics、
biophysics、chemophysics、geophysics等词的结果。 *computer可检索computer、minicomputer、 microcomputer等结果。
第一节
运算符
3. 截词符和通配符(*或?)
中间截词:又称前后方一致。允许检索词中间有若干变化。 例如wom*n,检索到woman、women的结果。英美的不同
第一节
1. 布尔逻辑算符
运算符
逻辑非(-,NOT):表达检索词间的排除关系。
如:A - B,表明结果是A中不包含B的那部分。 作用:逻辑非用于排除不希 望出现的检索词,能够缩小 命中文献范围,增强检索的 准确性。
第一节
1. 布尔逻辑算符
运算符
在上述逻辑算符中,其运算优选级顺序为NOT, AND,OR,但是可以用括号改变它们之间的运算顺序。 例如,(A OR D) AND B,表示先执行“A OR D”的 检索,再与B进行AND 运算。
也就是英文的引号。
例如,用baidu检索:防火墙教程 如果不加制的直接搜索,是五个字随机组合的页面,找到相
关网页约9,900,000篇,用时0.107秒 。
如果检索:“防火墙教程” ,则找到相关网页约15,500篇,
用时0.060秒 。
第一节
运算符
7. site 对特定的网站进行搜索
site:网站域名,用于在特定的网站中检索你需要的内容(这
第一节
运算符
10. intitle 搜索的关键字包含在网页标题中
intitle:检索内容,用于在网页标题中搜索你需要的结果。 网页设计的一个原则就是要把页面的关键内容用简洁的语言
表示在网页标题中。因此,只查询标题栏,通常也可以找到 高相关率的专题页面。 例如,搜索:intitle:工业工程,得到的搜索结果中,所有网 页的标题中都包括了“工业工程”四个字,可想而知这样的 结果是命中率非常高的。
例:查找“市场经济条件下信息咨询或信息检索对信 息服务的影响”的信息。 “市场经济*(信息咨询+信息检索)*信息服务”
第一节
1. 布尔逻辑算符

运算符
布尔运算符优先级比较 有括号时:括号内的先执行; 无括号时:NOT > AND > OR 例:检索“明清小说”的有关信息。 关键词:明、清、小说; 请选择下列正确的表达式: 错误表 A. 明OR 清AND小说; 达式 B. 明 AND 清AND小说; C. 明 OR 清OR小说; D. 明AND 清OR小说; 正确检索表达式: (明 OR 清)AND 小说; 明 AND 小说 OR 清 AND 小说;
它表示需求主题是“关于1998年微型机专利技术的英文信
息”。
太复杂了!
第一节
5. 优先算符()
运算符
将表达式的某一部分用括号括起来,表示命令计算机首先运
算()中的提问式,而不按计算机系统默认的运算符优先级 别运行。
6. “”
搜索完整的短语或者句
第一节
运算符

可以用于搜索完整的短语和句子,这里的“”是半角符号,
第一节
2. 位置算符
(W)算符:
运算符
(W)是with(word)的缩写,可简写为“( )”,表示此算符两 侧的检索词必须按此前后顺序相邻排列,词序不可变,且两词 之间不许有其他的词或字母,但允许有一空格或标点符号。 CD (W) ROM相当于检索 CD ROM或CD-ROM。
第一节
2. 位置算符
相关文档
最新文档