信息检索
第三章 信息检索的基本知识

1、逻辑“或”(和) 、逻辑“
————————————————— A
B
用符号“ 或 表示, 用符号“or”或“+”表示,其逻辑表达式为: 表示 其逻辑表达式为: A or B 或 A+B 其意义为检索记录中凡含有检索词A或检索词 , 其意义为检索记录中凡含有检索词 或检索词B, 或检索词 或同时含有检索词A和 的 均为命中文献。 或同时含有检索词 和B的,均为命中文献。
分 析 课 题
检索词: 检索词: : :
富营养化(水华), ),处理 富营养化(水华),处理 治理,修复), ),湖泊 (治理,修复),湖泊
ቤተ መጻሕፍቲ ባይዱ
, ,
,
检索工具: 检索工具:
1. 2. 3. 4. 5. 6. 7. 8. 中文科技期刊全文数据库(维普) 1989中文科技期刊全文数据库(维普) 1989-现在 中国科技成果数据库(万方) 1986中国科技成果数据库(万方) 1986-现在 中国期刊全文数据库(同方) 1979中国期刊全文数据库(同方) 1979-现在 中国优秀博硕士学位论文全文数据库(同方)1999中国优秀博硕士学位论文全文数据库(同方)1999-现在 中国学位论文文摘数据库(万方) 1989中国学位论文文摘数据库(万方) 1989-现在 中国学术会议论文全文数据库(万方) 1995中国学术会议论文全文数据库(万方) 1995-现在 中国重要会议论文全文数据库(同方) 2000中国重要会议论文全文数据库(同方) 2000-现在 中国重大科技成果数据库(万方) 1990中国重大科技成果数据库(万方) 1990-现在
中图分类法
中图法》 个基本部类, 《中图法》分 5个基本部类,将知识门类分为 哲学” 社会科学” 自然科学” “哲学”、“社会科学”、“自然科学”三大部 马克思主义、列宁主义、 类。马克思主义、列宁主义、毛泽东思想是指导 我们思想的理论基础,作为一个基本部类, 我们思想的理论基础,作为一个基本部类,列于 首位。此外,考虑到图书本身的特点, 首位。此外,考虑到图书本身的特点,对于一些 内容庞杂,类无专属, 内容庞杂,类无专属,无法按某一学科内容性质 分类的图书,概括为“综合性图书” 分类的图书,概括为“综合性图书”,作为一个 基本部类,置于最后。 22个大 基本部类,置于最后。在此基础上扩展为 22个大 类。 标记符号采用拉丁字母与阿拉伯数字相结合的混 合号码制。 合号码制。
信息检索基础知识

TP 自动化技术、计算技术
3 计算技术、计算机
31
计算机软件
316
操作系统
.1
分时操作系统
.2
实时操作系统
.7
Windows操作系统
39
计算机的应用
… F25 物资经济 F250 物资经济理论 F252 物资流通
… F5 交通运输经济 F50 交通运输经济理论
… F53 铁路运输经济 F54 陆路、公路运输经济
匹配有其匹配标准,这里涉及到两者一致性、 相关度等问题,按一定的标准筛选出符合要求的 信息。
精选ppt
3
信息检索一般过程
信息源
信息分析、 著录、标引
信息的表示
用户
检索语言
用户需求分析
数据库 匹配过程
输出检索结果 精选ppt
检索表达式
4
信息检索的过程往往需要一个评价反馈途径,多次比较匹配, 以获得最终的检索结果。其图示如下:
9
责任者 及其单位
中图分类号 文献标示码
关键词
正文
精选ppt
题名 摘要
10
分类语言
也属于主题语言。分类语言是按学科范畴划分而构成的一 种语言体系,它集中反映学科的系统性、反映它们的相关、 从属、派生等关系,从总体到局部分层、分面展开,形成 分类体系。由类目号码及名称作为检索语言,构成分类类 目表,如前述图书分类表、专利分类表用的都是分类语言 。
13
……
主题语言
包括:关键词语言、单元词语言、标题词语言、叙词语言等,它们有不同 的主题词表。主题词表达概念本身,在主题词表中通过参照系统来指示词 汇之间的关系。如”交通运输”、“国际物流”。主题语言分为规范主题语
信息检索

中文书本式的检索工具
《国内总书目》--《全国新书目》《科技新 书目》:查找国内出版的图书目录 《外文新书通报》:查找国外新书目录 《全国报刊索引》:查找国内期刊论文的工 具 科技 文献书目型数据库检索系统 事实型数据库检索系统 数值型数据库检索系统 全文数据库检索系统
“逻辑或”的组配种类
同义词 同一个人多个姓名 通用的英文缩写 化学物名称 Eg:CAD
逻辑非
用于排除含有不需要概念的信息,可缩小所 检索信息的范围。 逻辑运算符:“NOT”、“-” 逻辑表达式:“A NOT B ”“A-B” 语义表示:被检索文献中含有A而不含有B
4字段(限制)检索
在检索系统中,数据库设置的可供检索的字 段通常有两种: 表达文献主体内容特征的基本字段 表达文献外部特征的辅助字段 基本字段包括篇目(TI)、文摘 (AB)…… 辅助字段包括作者(AU)、语种 (LA)……
4字段(限制)检索
为了缩小检索范围,可利用字段代码来限制检索词 出现的字段,以提高检索速度和命中率。 如: economic models in ti(表示只在题 目字段中查找文献) economic models in de(只在主题词中 查找) economic models in ab(只在文摘中查 找) au = Smith,J.C (查作者为Smith,J.C 的 文章) py = 1998(只查1998年的文章) la =Chinese (只查语种为中文的文献)
位置算符检索即运用位置算符表示两个检索 词间的位置。 如果说布尔逻辑算符是表示两个概念之间的 逻辑关系的话,位置算符表示的是两个概念 在信息中实际物理位置关系。
检索时会经常遇到这样的问题?
信息检索---名词解释

一、名词解释信息检索:信息检索最普通的理解就是信息查找。
它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。
信息检索又叫做信息存储与检索(information storage and retri)。
信息检索可以分为事实检索、数据检索、文献检索。
特性检索:也称强相关性检索,强调向用户提供高度对口的信息。
强调检索的准确性,对检索结果的数量不作要求。
族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。
注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息,对准确性要求较低。
特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。
其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。
OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。
参考工具书:是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。
年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。
手册:是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。
名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。
搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。
图书:论述或介绍某一领域知识的出版物。
期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。
什么是信息检索

什么是信息检索?1、信息检索是一门关于如何查找文献、知识和信息的工具性课程,被认为是开启知识宝库的金钥匙。
2、信息检索课程是一门对于本科生到博士生都具有很强实用性的课程,对于帮助我们学生提高科研能力和拓宽科研领域具有重要的作用。
开设信息检索课的作用大学生需要学习,如何提高自己获取和利用文献信息的能力;进入工作岗位后如何更新自己的知识结构,使自己不落伍.所以,获取知识和信息的能力成为了大学生必须具备的重要能力之一.信息检索这门课主要讲授检索文献的一些基本方法,培养学生检索文献的技能.学习和科技需要文献,个人全面素质的提高需文献,生活中也离不开各种信息.我们在信息检索课中,老师侧重介绍了信息检索工具与检索技巧!但对于今后我们的生活中,这种检索思想将会发挥更大的作用,所以平时我们应多积累一些有关互联网上的检索工具(包括搜索引擎和检索技巧)方面的知识,这方面的能力可能带给我们更大的实惠。
信息检索课程作为一门方法课程,它不仅使我们的信息意识更为敏锐,而且使我们了解了信息组织与检索的原理,让我们学会了操作使用各种专业文献信息数据库和网络检索工具。
通过老师认真指导在我们不断练习的基础上,我们不仅掌握了娴熟的检索操作技能,而且逐步掌握了如何选择合适得信息源,如何确切表达特定的信息需求,以与如何应对检索过程中出现的各种问题。
在信息检索课中学习到了什么?1、通过信息检索课程学习,知道了什么是信息,信息的有哪些类型,信息有什么特征,信息有什么作用。
2、通过信息检索课程的学习,知道什么是信息检索,信息检索的类型有哪些,知道了信息检索的过程,知道了信息检索的方法和途径,知道了信息检索的技巧和策略,学会了如何去评价信息。
3、通过信息检索课程的学习,知道了网络上原来还有那么多数字图书馆,有那么多知识数据库。
4、通过信息检索课程的学习,发现搜索引擎并不是仅仅用来搜索网页和MP3,还可以用来搜索重要的知识,发现了搜索引擎原来还有如此多的笑秘密。
信息检索

专业科训信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。
狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。
信息检索有广义和狭义的之分。
广义的信息检索全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
狭义的信息检索为“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。
狭义的信息检索包括3个方面的含义:了解用户的信息需求、信息检索的技术或方法、满足信息用户的需求。
一·按存储与检索对象划分,信息检索可以分为:1·文献检索·2数据检索 3·事实检索以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。
二·按存储的载体和实现查找的技术手段为标准划分:1·手工检索 2·机械检索 3·计算机检索其中现在发展比较迅速的计算机检索是“网络信息检索”,也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。
按检索途径划分:(1)直接检索,(2)间接检索三·检索方法信息检索方法包括:普通法、追溯法和分段法。
1.普通法是利用书目、文摘、索引等检索工具进行文献资料查找的方法。
运用这种方法的关键在于熟悉各种检索工具的性质、特点和查找过程,从不同角度查找。
普通法又可分为顺检法和倒检法。
顺检法是从过去到现在按时间顺序检索,费用多、效率低;倒检法是逆时间顺序从近期向远期检索,它强调近期资料,重视当前的信息,主动性效果较好。
信息检索

1.什么是信息检索?从广义的角度讲,信息检索包含信息存储和信息获取两个过程。
信息存储指通过对大量无序信息的选择和收集、著录和标引等方法,建成各种各样的信息检索工具或信息检索系统,使之成为有序化信息集合的过程。
获取是存储的逆过程,其实质是根据特定的需求,运用以组织好的检索系统,将特定的信息查找出来。
存储是获取的前提和基础,没有存储就没有获取,而获取是存储的目的,二者密切联系,互相依存,缺一不可。
狭义的信息检索是指广义的信息检索的后一个过程,即信息获取的过程,相当于人们所说的信息查检等。
具体来说,狭义的信息检索指通过一定的方法,从已存储的信息中检索出与用户提问相关的文献、数据和事实的过程,即根据用户的特定要求查找所需信息的过程。
2.信息检索效果的评价指标有哪些?(1)检索效果有效性评价,即检索技术效果的评价,是对检索系统满足检索要求的有效程度的评价,主要以查全率和查准率为评价标准。
(2)检索系统使用的评价,包括系统对用户是否需要,是否实用有多大的实用效果,即检索的社会效果的评价,需要应用社会学方法。
(3)检索费用——效率评价,即检索的经济效果的评价,包括检索系统完成检索服务的成本及时间消耗,需要应用经济学方法。
评价信息检索效果的指标主要有6个:收录范围、查全率、查准率、响应时间、用户负担和输出形式。
附:查全率=【检出相关文献信息量/检索系统中相关文献信息总量】*100%=(a/a+c)*100%查准率=【检出相关文献信息量/检出文献信息总量】*100%=(a/a+b)*100%漏检率=【漏检相关文献信息量/检索系统中相关文献信息总量】*100%=(c/a+c)*100%误检率=【误检文献信息量/检出文献信息总量】*100%=(b/a+b)*100% 3.什么是检索语言?检索语言的实质是用于表达一系列概括文献信息内容的概念及其相互关系的概念标识系统。
它可以是从自然语言中精选出来并加以规范化的一套词汇,可以是代表某种分类体系的一套分类号码,也可以是代表某一类事物的某一方面特征的一套代码(如化合物的各种代码),用于对文献内容进行主题标引、特征描述或逻辑分类。
信息检索的方法

信息检索的方法
信息检索方法有顺查法、倒查法、抽查法、追溯法。
1、顺查法
一般用于重大课题和各学科发展史以及新兴学科等方面的研究
课题的全满检索。
2、倒查法
目的是获取近期发表地最新文献信息。
是一般科研人员最常用地方法,在确认某项成果是否创新时,也适合用倒查法。
3、抽查法
抽查法重点对某一时间段进行检索,多用于检索专题调查报告。
4、追溯法
追溯法可以利用原始文献新附的参考文献追溯检索;还可以利用专门编制的引文索引进行追溯查找。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2012-2013第一学期
《文献信息检索与利用》考核题
姓名:
学号:
学院:
年级:
专业:
任课老师:
成绩:
一、自拟一道与本专业有关的检索课题进行检索,至少应包括两个以上的主题。
(温馨提示:自拟的题目不能和其他同学重复,主
题重复,试卷退回重做或做不及格处理。
)
题目:浅谈土地资源集约利用管理与土地价值评估
1、使用CNKI数据库、重庆维普期刊数据库或者万方数据资源系统检索与课题密切相关期刊学术论文,写出检索词、检索式(检索式包括检索词、检索途径、检索词之间的逻辑关系)、检出的结果数,保存三条记录的题录。
(20分)选择的检索工具:维普全文数据库
检索词:土地资源;土地价值
检索式:ti=土地资源and ti=土地价值
其他检索限制(如:模糊、精确、时间等)高级
检出结果数: 21条
三条记录:
a.罗丽.浅谈土地资源集约利用管理与土地价值评估[J].科技创新导报,2011,(10):225-225 b.张伟华.基于土地资源集约利用管理目的的土地价值评估[J].大科技,2012,(7):21-22 c.陈雅萍.显化城市土地价值刍议[J].中小企业管理与科技,2008,(20):23-23
(拷贝屏幕粘贴处)
2、使用CNKI学位论文数据库或万方学位论文数据库,检索该课题的学位论文,写出检索词、检索式(检索式包括检索词、检索途径、检索词之间的逻辑关系)、检出的结果数,保存题录三条。
(10分)
选择的检索工具:万方学位论文数据库摘要
检索词:土地资源 ;土地价值
检索式: ti=土地资源and ti=土地价值
其他检索限制(如:模糊、精确、时间等)高级
检出结果数:3条
三条记录:
a.黄伟芳.城市土地资源使用价值及其影响因素研究——以广州市十区为例[D].广东:中山大学,2006
b.蔡妹妹.对休闲农业利益分配问题的研究——基于土地资源价值重构
的角度[D].浙江:浙江工商大学,2008 c.李旭.城镇历史性商业街区土地资源价值评价方法研究--以湖南新宁
老城区为例[D].北京:北京建筑工程学院,2011
(拷贝屏幕粘贴处)
3、使用百度、Google等搜索引擎检索该课题,写出5条检索结果,并将检索结果与题1中的检索结果进行比较分析,写出你的使用评价。
(10分)
选择的搜索引擎:百度
检出结果数:约 1880000个
5条记录:
a.浅谈土地资源集约利用管理与土地价值评估_百度文库
b.浅谈土地资源集约利用管理与土地价值评估—《科技创新导报》—201... c.浅谈土地资源集约利用管理与土地价值评估-【维普网】-仓储式在线... d.基于土地资源集约利用管理目的的土地价值评估张伟华--维普资讯网
e.浅谈开发区土地资源集约利用与评价--《黑龙江科技信息》2010年16期
(拷贝屏幕粘贴处)
使用评价:我觉得两者各有千秋。
.百度搜索出来的数量远远多于万方数据库,而且速度也快,内容更多,更全面,范围更广;但从另一方面讲,万方数据库所搜到的课题比百度的要精准,要专业,分类更为细致。
百度里能统一搜到万方数据库的相关论文,但在万方数据库搜索时,有时会因各种原因查找不到想要的资料文献。
就个人而言,本人更喜欢用百度,但也努力学习用各个数据库检索想要的资料,相信在以后我们总会需要它。
4、根据EBSCO、ProQuest、Wiley、NSTL、Ovid、秀或学术谷歌、国道数据库的收录范围,任选其中一个数据库检索与课题密切相关的外文论文,写出检索词、检索式(检索式包括检索词、检索途径、检索词之间的逻辑关系,以及可能存在的位置算符和截词符)、检出的结果数,保存三条记录的题录。
(10分)
选择的检索工具:EBSCO数据库
检索词:land resources ;land value
检索式:ti=land resources and ti=land value
其他检索限制(如:模糊、精确、时间等)高级
检出结果数: 4条
三条记录:
a.Yanjing Zhang,Ruiping Analysis of Land Expropriation Compensation Based on Non-Market Value of Cultivated Land Resources[J].Journal of
Agricultural Science (1916-9752); Mar2011, Vol. 3 Issue 1, p233-238
b.Cramer, Lori A.; Kennedy, James J.; Krannich, Richard S.; Quigley,
Thomas Forest Services Values and Their Implications for Land Management
Decisions Affecting Resource-Dependent Communities[J]. Rural Sociology.
Fall93, Vol. 58 Issue 3, p475-491
c.Fagin, Todd D.; Wikle, Thomas of Meat and Oil: Conservation, Resource Management, and America's National Grasslands[J]. American Geographical
Society's Focus on Geography.,Summer2012, Vol. 55 Issue 2,p41-47
(拷贝屏幕粘贴处)
二、检索你的某个专业老师(也可以是其他学院的老师)发表的论文情况,写出发表论文数量、论文被引用次数,保存论文题录3条。
(15分)
选择的检索工具:中国知网(CNKI)全文数据库
选择的专业老师名字:政治与公共管理学院黎兴强
发表论文数量: 8条
论文被引用次数:
三条记录:
a.黎兴强.中国旅游规划体系新框架的探讨[J].旅游学刊,2011,(11):12-19 b.黎兴强.国外住房补贴模式的国际比较及其对中国的启示[J].消费导刊,2009,(03):26-27
c.黎兴强.对中国住房制度改革的思考[J].经济研究导刊,2009,(03):172-174
(拷贝屏幕粘贴处)
三、使用“海南教育科研数字图书馆”或“读秀学术搜索”检索某种图书,并通过文献传递方式发送到您的邮箱。
(10分)
(拷贝屏幕粘贴处)
四、任选超星、书生之家、方正或数图电子图书,简述检索方法,并在其中一个电子图书库中检索出你感兴趣的2种图书,并保存题录信息。
(15分)
选择的检索工具:超星电子图书
检索方法:ti=红楼梦 and au=曹雪芹
Ti=三国演义 and au=罗贯中
两条条记录:
a.曹雪芹.红楼梦.长春:吉林人民出版社,2006 b.罗贯中.三国演义.长春:吉林人民出版社,2006
(拷贝屏幕粘贴处)
五、写出你学习《文献信息检索与利用》课程的感想、建议和评价。
(10分)
学习《文献信息检索与利用》最大的感受就是:纸上得来终觉浅,绝知此事要躬行。
在还没做题、平时没上机操作之前,觉得这门课程是特别简单的。
但实际操作时,却遇到了许多问题,很多平时忽略的细节此时成了成败的关键。
或许说现在我们可能还用不到这门课程,但我想这个用不到应该更多的是我们没有使用这课程的意识。
相信要是我们能从现在起培养这个意识,我们将会受益匪浅。
再者,对于这门课程,如果条件允许,我希望可以有更多的上机操作的机会,这样我们可以对课本上的知识更好得理解和记忆。
最后,感谢李老师对我们的悉心教导!。