常见的检索技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
常见检索技术
作者:陈亚萍学号:1101212925
手工检索(manual retrieval)是一种传统的检索方法,即以手工翻检的方式,利用工具书(包括图书、期刊、目录卡片等)来检索信息的一种检索手段。
与之对应的计算机检索(computer-based retrieval)简称机检,是指利用计算机通过各种数据库查找所需文献信息的方法,检索过程是由人操纵计算机完成的,其匹配是由计算机进行的。在检索过程中,人是整个检索方案的计设者和操纵者。利用机器及计算机,配合以相应的搜索语言和逻辑对相关课题进行检索是检索技术的发展趋势。
检索表达式,又称检索式、检索提问式,是机检中用来表达检索提问的一种逻辑运算
式。构建检索表达式需要用到相关逻辑检索及检索技术。
(一)常用检索方法概述
1.布尔逻辑运算检索——是指利用布尔运算符连接各个检索词,然后由计算机进行相应逻辑
运算,以找出所需信息的方法。它使用面最广、使用频率最高。
2.位置运算检索——位置算符检索是用一些特定的算符(位置算符)来表达检索词与检索词
之间的临近关系,并且可以不依赖主题词表而直接使用自由词进行检索的技术方法。
3.截词检索与词根检索——截词检索是预防漏检提高查全率的一种常用检索技术,大多数系
统都提供截词检索的功能。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。词根检索是指输入某一单词,系统会自动匹配与该词具有相同词根的其他词。
4.字段检索——限定如主题、关键词等某个字段进行检索。
5.全文检索——将文件中所有文本与检索项匹配的文字资料检索方法。
6.精确检索——指检索词与结果完全匹配的检索技术。与之对应的模糊检索,则是指检索词
的基础上进行相应的扩展。
7.其他检索技术(禁用词、嵌套、限制词、大小写敏感词等)
(二)分述
1.布尔逻辑检索(Boolean retrieval)
乔治·布尔(George Boole,1815年11月-1864年),爱尔兰数学家,哲学家。1848年,布尔出版了T he Mathematical Analysis of Logic,这是他对符号逻辑诸多贡献中的第一次。1854年,他出版了《The Laws of Thought》,这是他最著名的著作。在这本书中布尔介绍了现在以他的名字命名的布尔代数。由于其在符号逻辑运算中的特殊贡献,很多计算机语言中将逻辑运算称为布尔运算,将其结果称为布尔值。布尔逻辑在检索中主要分为与、逻辑或、逻辑非。
(1)逻辑与
示例数据库:CNKI 检索式:智能机器人*控制
示例数据库:ScienceDirect 检索式:intelligent robot AND control
由结果可见,逻辑与重在“同时”,及检索字段里出现and/*前后的检索词。
含义表示检出含有A词或者B词的记录。
用法常用于连接同一概念的不同表达方式,或者相关词,以防漏检。运算符OR 或者+
检索式 A OR B 或者A+B
例如:在中文数据库中检索二氧化硫方面的文章
数据库:CNKI 检索式:二氧化硫OR SO2
在英文数据库中检索传感器方面的文章
示例数据库:CSA 检索式:sensor OR detector
由上述检索结果可见,逻辑或的意义为OR/+前后的检索词“出现其一或同时出现”,这样能够保证课题的查全率。
(3)逻辑非
含义检出含有A词,但同时不含有B词的记录。
用法常用于排除某些概念,以达到精确检索的目的。
运算符NOT 或-
检索式 A NOT B 或者A-B
例如:在中文数据库中查非酒精饮料方面的文章
示例数据库:万方检索式:饮料NOT 酒精
(4)注意
☻逻辑运算符在中文数据库中多使用符号*,+,-,在英文数据库中使用字母and,or,not,具体如何使用,请参考数据库的帮助或说明。
☻逻辑运算顺序:如果有括号,先执行括号内的运算;没有括号时,各系统有不同的规定,检索时,请参考数据库的帮助或说明。
2.位置算符检索
用法:用来指定词与词的位置关系
(1)W/n——算符两侧的两个检索词按此前后衔接的顺序排列,词序不可变,词与词之间相互距离不超过n个词(注意:是单词,不是字母)。W即with。
示例数据库:World Scientific 检索式:solar Near/2 energy
(2)N/n——算符两侧的检索词之间的距离不超过n个词,词序可变。N即Near。
示例数据库:World Scientific 检索式:solar Near/2 energy
(3)Same——算符两侧的检索词在同一个子字段或同一个自然句中,使用SAME 运算符(而非AND 运算符)是缩小检索范围的好方法。
(4)Paragraph——算符两侧的检索词在同一个段落中。
3.截词检索与词根检索
(1)截词检索
截词检索或称通配符扩展检索,是预防漏检提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。用某个符号来代替英文单词的一部分,通常用于相同词干或部分拼写相同的词,常用的截词符有* ? 等。?代表任意一个字符,*代表零个或多个字符。截词检索可分为:
有限截词
放在词中间或末尾,一个符号表示一个字母。例如:
示例数据库:Web of Science (SCI) 输入wom*n 检出woman,women