文献检索课件-第二章

合集下载

数据库文献检索PPT课件

数据库文献检索PPT课件
零次文献 一次文献 二次文献 三次文献
➢第一章 概述
➢1.1 信息、知识、文献、情报 ➢1.2 文献的等级与主要类型 ➢1.3 主要文献信息源及其特点
1.2 文献的等级与主要类型
二、文献的主要类型
按照不同的标准,文献可以划分为不同 的类型
———————————————————————————
区别标准
➢1.1 信息、知识、文献、情报 ➢1.2 文献的等级与主要类型 ➢1
二、文献的主要类型
印刷型 印刷型文献是以纸质材料为载体,以印
刷为记录手段而形成的文献形式,是目前整 个文献中的主体。
特点:是不需要特殊设备,可以随身携 带,随处随时阅读。但存贮密度小,体积 大,占据空间大,不便于保存。
➢第一章 概述
➢1.1 信息、知识、文献、情报 ➢1.2 文献的等级与主要类型 ➢1.3 主要文献信息源及其特点
1.2 文献的等级与主要类型
二、文献的主要类型
缩微型 缩微型文献是以感光材料为载体,以照
相为记录手段而形成的一种文献形式,包 括缩微胶卷、缩微平片、缩微卡片等。
特点:体积小,便于收藏和保存,价格 便宜等,但阅读需要有较复杂的阅读设备 来支持。
➢第一章 概述
➢1.1 信息、知识、文献、情报 ➢1.2 文献的等级与主要类型 ➢1.3 主要文献信息源及其特点
1.2 文献的等级与主要类型
二、文献的主要类型
声像型 声像型文献是以磁性和感光材料为介质
记录声音、图像等信息的一种文献形式。 特点:存取快捷,可闻其声,见其形,
易理解。
➢第一章 概述
➢1.1 信息、知识、文献、情报 ➢1.2 文献的等级与主要类型 ➢1.3 主要文献信息源及其特点
文献类型

同济大学文献检索课件

同济大学文献检索课件
第二章 计算机信息检索概论
第一节 计算机信息检索的发展

计算机信息检索是利用计算机查找出符合读者所需信 息的过程。 计算机信息检索的发展史 脱机信息检索阶段(20世纪50年代中期到60年代中 期) 联机信息检索阶段(20世纪60年代中期到70年代初 期) 跨国联机信息检索阶段(20世纪70年代中期至今) 光盘信息检索阶段(20世纪80年代中期至今) 网络信息检索阶段(20世纪90年代至今)
第二节 计算机信息检索的基础知识
一、计算机信息检索系统的构成

物理构成 :计算机硬件、软件、数据库 数据库构成:文档(File) 、记录(Record) 、字段(Field)
数据库
文档1
文档2
文档3

记录1
记录2
记录3

字段1
字段2
字段3


逻辑构成 :信息采集与建立数据库子系统、标准化子系 统、用户子系统

(SO)European Journal of Human Genetics advance online publication, 27 September 2006; doi:10.1038/sj.ejhg.5201711. PMID: 17003842 [PubMed - as supplied by publisher]
(AB)Pulmonary arterial hypertension is a progressive disease, characterised by increased proliferation of
pulmonary artery smooth muscle cells, vasoconstriction and remodelling of the vascular wall leading to right heart failure and death. The idiopathic form is rare (idiopathic arterial primary hypertension (IPAH); formerly PPH, MIM#. untranslated region in exon 7 (g.8129T>C) was observed in five patients. It appeared in 46% of the control group. The frequency of this alteration in the coding region of the VIP gene could therefore not be correlated with the appearance of IPAH. Apart from the importance of VIP signalling, genetic and/or environmental modifiers might therefore contribute to the development and perpetuation of the disease.

文献检索第二章

文献检索第二章
事实检索 :在检索工具中存贮的是从原始文献、或有关图 书中抽取的各种事实,用户通过检索,可获得有关某一事物的 具体答案。这种检索也是一种确定性检索。其检索工具系指参 考工具书。
A
7
数据检索 :指以数值或图表表示的数据为检索对象。在检索 工具中存贮着大量的数值型数据,如各种统计数据、人口数据、 气象数据、企业或财政数据、科学技术常数等,并提供一定的 运算推导能力。它是一种确定性检索,用户通过检索可获取经 过核实、整理的数据信息。可以借此进行定量分析。而该种检 索工具系指有关参考工具书。
A
4
二、文献信息检索的基本原理
文献信息检索原理,简言之,就是检索提问标识与存贮在 检索工具中文献的标引、标识进行比较,如果两者一致,或者 工具中文献的标引标识包括了检索提问的标识,那么包含标引 标识的工具中的文献线索、数据或文献等就输出(即检索出) 这种文献信息表明为命中或切题的。
早期的文献信息检索,主要根据文献的外表和内容的特征,
采用手工方式实现检索。随着计算机技术迅猛发展,引进
了文献信息的检索,文献检索逐渐进入机械化、计算机化
新阶段,提高了检索速度,拓展了检索领域。
A
5
三、文献信息检索的类型
1.按其存贮内容与检索的对象划分
文献信息 线索检索
按其存贮内 容与检索的
对象划分
事实检索
数据检索 全文检索
A
6
文献信息线索检索 :检索工具中存贮的是目录、题录、文 摘、索引等二次文献信息,用户通过检索所得到的是有关课题 的一系列文献信息线索 。
根据一定方法,从已经存贮好的有关大量文献信息
集合中,查出特定的相关文献信息的全过程。具体而言,
就是依据特定课题的要求,利用各种检索工具如目录、

文献检索-第二章 文献检索基本知识(100829)(包括第三章)

文献检索-第二章  文献检索基本知识(100829)(包括第三章)

二、检索语言的种类
1、按表达文献特征划分
描述文献外部特征 检索语言 描述文献内容特征
学科分类—分类索引
描述 文献 内容 特征
研究对象—主题索引
所包含的关键词—关键词索引
分析单元性概念—叙词索引、单元词索引 分子式、结构式—分子式索引、结构 式索引 地理位置等特种内容—经纬度索引等 特种索引
2、按结构划分 分为分类语言、主题语言、代码语 言、引文语言。
第二节 检索语言
一、检索语言的定义:
从上节“检索原理”可以看出, 必须有同样的检索标识系统(即检索 语言)来标引文献特征和检索提问, 这是文献检索成败的关键。这就要求 信息标引人员和信息用户应当具有必 要的检索语言的基本知识。
文献检索时,检索标识和用户提 问都需要用一定的语言来表达,这种 标引人员表达检索标识和信息用户(检 索者)表达检索提问所共同采用、共同 理解的语言,就是信息检索语言。
②叙词语言 它是以叙词作为文献内容标识和检 索依据的一种主题语言。叙词是从文献 的题目,摘要或正文中抽取出来,用以 表达文献基本内容的概念单元。叙词受 词表控制,词表中词与词之间无从属关 系,都是相互独立的概念单元。检索时, 利用这些概念单元组配起来,表达一个 复杂的概念。叙词语言特别适用于计算 机检索。
③关键词语言 它是以关键词作为文献内容标识和检 索依据的一种主题语言。关键词是从文献 的题目、正文或摘要中直接抽取出来,未 经规范化处理的自由词汇。关键词不受词 表控制,标引文献时根据文献内容选择恰 当的词汇进行组配,以表达文献的内容特 征。
第三节
检索工具基础知识
一、什么是检索工具? 检索工具是积累和查找文献线索的 工具。它报导文献的存在,揭示文献 的内容,帮助科技人员鉴定和选择文 献、开发和利用文献资源。检索工具 具有存贮和检索两方面的功能。

第二章 文献信息检索基础

第二章 文献信息检索基础

理的名词术语,具有单一性、组配性好的特 点。
(2)分类语言:直接体现知识分类的等
级制概念标识系统;如中图分类号、杜威 十进制分类法等。
《中国图书馆图书分类法》即《中图法》
《中国图书馆图书分类法》
体现学科的系统性,反映事物的从属、 派生关系,并从上至下、从总体到局部 层层划分,展开,是一种等级分明的语 言。分为五大部类,22个大类,分别用 22个大写字母表示(其中除掉L、M、W、 Y)。
1.前方一致

也叫后截断,将截词符置于一个字符串的后面,以表示其后的有限或无 限个字符的检索。
无限截词
如: ? Physic? 可检出physic、physical、physican、physicalism
有限截词
截断两个字符
中间有 空格
如:? physic?? 可检出physic、physical、physican 截断一个字符 如:? cat? ? 可检出cat、cats
2.3 综合法
综合法又称为循环法,它是把上述两种方法
加以综合运用的方法。综合法既要利用检索 工具进行常规检索,又要利用文献后所附参 考文献进行追溯检索,分期分段地交替使用 这两种方法。即先利用检索工具(系统)检 到一批文献,再以这些文献末尾的参考目录 为线索进行查找,如此循环进行,直到满足 要求时为止。 综合法兼有常用法和追溯法的优点,可以查 得较为全面而准确的文献,是实际中采用较 多的方法。
能包含特征B。可以缩小检索范围,有利于提高查 准率。 A – B(逻辑非)
例:自由分配方面的文献(排除海南大学师生的著作) 提问式::(关键词=‘自由分配’) not (单位=‘海南大学')
三、位置算符
也叫邻近检索, 在检索词之间使用, 规定算符两边的检索词出现在记录中

文献信息检索ppt课件

文献信息检索ppt课件

和B的文献,才算命中文献。

3、逻辑“非”
————————————————
AB
用符号“not”或“-”,其逻辑表达式为: A not B 或 A-B
其意义为:检索记录中含有检索词A,但不能 含有检索词B的文献,才算命中文献。

逻辑提问式(布尔逻辑组配):
计算机检索的基本技术,主要通过逻辑运算 符(布尔算符)“与(and,*)”、“或 (or,+)”、 “非(not,-)”等将检索词连接 的提问式。
注意:优先级为not, and, or,用括号保证优 先权;运算符两侧必须各有一个空格(半角)。
实例:
膜法提取甘露醇中的微生物污染控制 (膜法+膜集成)*甘露醇*(细菌污染+微生物污 染)
写出以下检索词,并用上述布尔逻辑符写出检 索式:
固氮和固碳的生化机理或基因机制
(二)、位置算符
在检索词之间使用,规定算符两边的检索词出现 在记录中的的位置,以提高检准率。比如:如果 不用with位置算符,则词组可能被系统识别为逻辑 运算,protein disulfide isomerase(蛋白质二 硫键异构酶)可能被识别成“protein AND disulfide AND isomerase”。尤其是出现数字等 符号时不易识别成词组。
AB
用符号“or”或“+”表示,其逻辑表达式为:
A or B
或 A+B
其意义为检索记录中凡含有检索词A或检索词B,
或同时含有检索词A和B的,均为命中文献。
例:
2、逻辑“与”
————————————————
AB
用符号“and”或“*”表示,其逻辑表达式为:
A*B

文献检索PPT课件

文献检索PPT课件
(1)文献(信息)标引和存储过程; (2)文献(信息)的需求分析和检索过程。
2020/10/13
8
§2.应用科技文献的重要性
1.科技文献对促进科学发展的重要作用; 2.科技文献对促进国民经济发展的重要 作用; 3.科技文献对提高科学研究水平的重要作用。
2020/10/13
9
§3.学习科技文献检索方法的重要性
2020/10/13
11
查全率:利用检索系统进行某一课 题检索时,检索出的相关信息量(w)与该系统 信息库中存储的相关信息量(x)的比率称为查 全率(R),用公式可以表示为:
R=w/x×100% 查准率:利用检索系统进行某一课 题检索时,检索出的相关信息量(w)与检出信 息总量(m)的比率称为查全率(R),用公式 可以表示为: P=w/m×100%
2020/10/13
14
§1.科技图书
1. 教科书与专著 2. 字典、百科全书与年鉴
2020/10/13
15
§2.期刊
1.原始论文期刊: 杂志;学报;公报、通报、快报 一次文献:指以作者本人的研究工作或 研制成果为依据撰写,以公开发行进入社 会流通使用的专著、学术论文、专利说明 书、科技报告等。
2020/10/13
16
2.检索工具期刊: 文摘;索引;题录和目录 二次文献:是对一次文献信息进行
整理、加工的产品。即把大量的、分散 的、无序的一次文献信息资源收集起来, 按照一定的方法进行整理、加工, 使之系统化而形成的各种目录、索引 和文摘。
2020/10/13
17
3.综述性论文期刊: 评论杂志 三次文献:是根据一定的目的和需求,
2020/10/13
3
本课程教学要介绍的三个章节:

文献检索PPT课件完整版

文献检索PPT课件完整版

文献
概念:记录有知识的一切载体。 四大要素:内容、载体、记录符号、记
录方式
关系
信息>知识>情报,这三者可以被 记录,储存,传递。
知识是系统化了的信息(不一定知 道,了解),通过交流,传递→情报 (被理解了的知识),通过思维决策→ 新的知识。
载体是信息、知识、情报的负载物, 当这三者一旦固化在载体上 称为文献。
编排方法:字顺、类序、自然顺序。 类型:检索工具书,参考工具书。
事实数据型信息检索
事实数据库定义:p75-76 数值数据库定义:P76 分类:学科范围,内容和编排体例。 数据库实例:1、物竞化学品数据库 ppt
2、国研网 ppt
按内容和编排体例
字典,词典(辞典):p76 在线辞海 百科全书:p78 类书:p79 政书:p80 年鉴:p80 中国年鉴网 ppt 名录:p82 机构名录 ,人名录 ppt,地名录 手册:p82 传记:p83 中国人物传记网 ppt 数表、公式:p83 图表:p83 图录、年表、历表、专门性表谱、网上图谱
概念 特征 ISBN
图书
概念
由出版社(商)出版的不包括封面和封底 在内的49页以上的印刷品,具有特定的书 名和著者名,编有国际标准书号,有定价 并取得版权的出版物称为图书。(广义/狭 义,学科划分,文种划分,用途划分。)
特点
内容比较系统,全面,成熟,可靠,出版 周期长,传递信息速度较慢,内容新颖性 较弱。具有书名、作者、出版社、出版时 间、页码、价格,标准编码。
ppt
课外作业:图书馆六楼,翻阅参考工具书,具体了解工具书 的编排和检索。
机构信息检索
机构类型: 院校科研机构检索:工商企业机构检索:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(1)准确
关键词表述准确是获得良好检索结果的必要前提。提
高关键词的准确性,需要注意两个方面:一是避免错别字;
二是避免有歧义的字、词。
• 作为关键词同时应避免最常用的词;
• 即使需要使用这些常用词,需加以限定; • 对于简单、通俗,容易产生歧义的关键词,也应该加一些 限制性的修饰词; • 采用搜索语法组合关键词,也可有效地提高搜索质量。
2.3 计算机检索的技术
2.3.1 布尔逻辑检索 2.3.2 截词检索 2.3.3 字段检索 2.3.4 位置检索 2.3.5 限制检索
2.3.4 位置检索
概括地说,位置检索是一类针对自然语言文本中检索 词之间特定位置关系而进行的检索匹配技术。位置检索允 许用户使用自然语言作为检索入口,并可深入到原文的章、 节、段、句等文本范围内进行信息的查找和匹配。
(4)选择多个关键词 关键词数量太少,不能准确地限定检索范围, 可能会得出大量的检索结果;太多则可能不被搜 索引擎识别,也会影响搜索效果。 每个搜索引擎对关键词数量的要求和态度不 同。
(5)根据网页特征选择查询词
很多类型的网页都有某种相似的特征。 • 例子一,要去“黄山”旅游,想了解一下相关事宜早作准
(2)力求简练
目前的搜索引擎在处理自然语言方面的能力 不是很强,因此在提交搜索请求时,用户最好把 自己的想法提炼成简单的,而且与希望找到的信 息内容主题关联的查询词。
关键词一般不能选没有检索意义的助词、介
词、连词、形容词或副词等,而多选用名词、短 语。
(3)具有代表性
也就是说,关键词要能成为被查询事物的典 型标志,时间、人物、地点一般可以成为增加关 键词代表性的有效限制因素。 另外,多用专业术语和专业名词,专业术语 和专业名词作为关键词所检索出来的结果一般与 搜索的主题相关性很大。
重庆中考数学试卷 filetype:doc
文献检索课件 filetype:ppt
在进行限制检索时,还需要考虑到以下几点:
(1)尽量使用“高级搜索”选项;
(2)细化查询; (3)网页快照; (4)搜索引擎的工具条;
高级搜索
细化查询
网页快照
搜索引擎的工具条
2.4 引文、跨库检索
常用位置运算符 按照两个检索词出现的顺序和距离,可以有多 种位置算符。对同一位置算符,检索系统不同, 规定的位置算符也不相同。以美国Dialog联机检 索系统使用的位置算符为例,介绍常用的几种位
置算符。
ProQust学位论文全文数据库属于之一。
(1)“(W)”算符
“W”是“with”的缩写。这个算符表示其两 侧的检索词必须紧密相连,除空格和标点符号外, 不得插入其他词或字母,两词的词序不可以颠倒。 “(W)”算符还可以使用其简略形式“()”。
(1)准确
关键词表述准确是获得良好检索结果的必要前提。提
高关键词的准确性,需要注意两个方面:一是避免错别字;
二是避免有歧义的字、词。
• 作为关键词同时应避免最常用的词;
• 即使需要使用这些常用词,需加以限定; • 对于简单、通俗,容易产生歧义的关键词,也应该加一些 限制性的修饰词; • 采用搜索语法组合关键词,也可有效地提高搜索质量。
备。
• 例子二,查找诗人李白的个人资料。
经常总结搜索实践中各类网页的特征现象,并应用到
查询词的选择中,就会使得搜索变得准确而高效。
2.2.2 关键词选择的技巧
(1)高频词法; (2)善用“搜索提示”; (3)巧用“相关搜索”; (4)搜索语法的灵活运用。
• • • • • •
科学膳食 营养科学 科学饮食 幼儿饮食营养 健康营养饮食 饮食卫生和营养
了提高检索的准确率。
字段分为主题字段和非主题字段。
字段类型
由于各检索系统提供的字段检索符号及字段 代码可能各不相同,在具体检索时,如果使用检 索命令方式,应认真阅读系统的说明文件,以便 选择合乎系统语法要求的符号或代码。
用户也可以通过菜单选择方式进行字段检索, 这样,只需要从检索界面上设置的字段列表中选 择相应字段位置就可以了,从而不必对系统的检 索语法进行大量记忆。
(2)年代; (3)作者; (4)同根词。 需要注意的是,使用后截词有可能检出无关 词汇。尤其是在使用无限后截词时,如果所选字 符串(或词干)太短,会造成大量误检,或是发 生溢出,导致检索失败。
(2)前截词检索 与后截词检索相对,前截词检索是将截词符 号置放在一个字符串左方,以表示其左的有限或 无限个字符不影响字符串的检索。
中国知网
A——晶体生长
B——计算机模拟
万方数据库
A——晶体生长
B——计算机模拟
2.3 计算机检索的技术
2.3.1 布尔逻辑检索 2.3.2 截词检索 2.3.3 字段检索 2.3.4 位置检索 2.3.5 限制检索
2.3.2 截词检索
所谓截词(Word Truncation),是指检索者 将检索词汇在他认为合适的地方截断;而截词检 索,则是指使用被截断的词汇进行检索匹配,并 认为凡满足这个词局部中所有字符(串)要求的 记录,都为命中结果。 目前,各检索系统中使用的截词符号互不相同, 也没有统一的规定,我们下面举例中使用“*”表 示不限截断,使用“?”表示有限截断。
(2)“(nW)”算符 “(nw)”是“nWord”的缩写,表示此算符 两侧的检索词之间允许插入n个词,顺序不可颠倒, 而且检索词之间不允许有其他的词或字母,但允 许有空格或连字符号。
(3)“(N)”算符 “N”是“near”的缩写。这个算符表示其两 侧的检索词必须紧密相连,除空格和标点符号外, 不得插入其他词或字母,两词的词序可以颠倒。
(1)准确
关键词表述准确是获得良好检索结果的必要前提。提
高关键词的准确性,需要注意两个方面:一是避免错别字;
二是避免有歧义的字、词。
• 作为关键词同时应避免最常用的词;
• 即使需要使用这些常用词,需加以限定; • 对于简单、通俗,容易产生歧义的关键词,也应该加一些 限制性的修饰词; • 采用搜索语法组合关键词,也可有效地提高搜索质量。
(4)“(nN)”算符
“(nN)”算符表示允许两词插入最多为n个其他词, 包括实词和系统禁用词。允许词序发生颠倒。
(5)“(F)”算符
“F”算符是“field”的缩写。这个算符表示其两侧 的检索词必须在同一字段(例如同在题目字段或文摘字段) 中出现,词序不限,中间可插入任意检索词项。
(6)“(S)”算符 “(S)”算符是“sub-field/sentence”的 缩写。这个算符表示运算符的两侧的检索词只要 出现在记录的同一字段内(例如,在文摘中的一 个句子就是一个字段),此信息即被命中。要求
• 2.4.1 引文检索 • 2.4.2 跨库检索
2.4.1 引文检索 引文检索,就是指对文章的参考文献进行的 检索,是从学术论文中引证关系入手进行检索的 一种方法,是利用被引文献来查找原文献的检索 途径。

源 文
献 施引著者 或来源作者
前截词和后截词一样,也存在隐含的“逻辑或” 运算。在有些情况下,前、后截词检索还可以结 合起来使用。
目前,检索系统中的前截词检索还是比较少 见的。
(3)中截词检索
中截词检索又称“通用字符法”或“内嵌字 符截断”,也有称为“屏蔽”的。这种截词是把 截词符号置放在一个检索词的中间,而不是左右 两侧。一般来说,中截词只允许检索词的有限截
超星数字图书馆
A——网络
B——发展
逻辑或(OR)
用逻辑“或”运算符将同一字段内两个被检 索词(A或B)进行组配并检索的检索方式称逻辑 “或”检索,其检索结果将包括所带有A或B两个 检索中任意一个检索词的记录。
同时包含检索词A长
B——计算机模拟
中国知网
A——晶体生长
断。
2.3 计算机检索的技术
2.3.1 布尔逻辑检索 2.3.2 截词检索 2.3.3 字段检索 2.3.4 位置检索 2.3.5 限制检索
2.3.3 字段检索
通过限制检索词在命中结果记录中出现的位 置(主要指记录的不同字段位置)来实现的。从 本质上说,字段检索仍属于布尔检索的范畴,可 以认为是一种受限的布尔检索,其主要目的是为
B——计算机模拟
万方数据库
A——晶体生长
B——计算机模拟
超星数字图书馆
A——网络
B——发展
逻辑非(NOT)
用逻辑“非”运算符将同一字段内两个被检索 词(A非B)进行组配并检索的检索方式称逻辑 “非”检索,其检索结果将包括所有带A检索词而 不带B检索词的记录。
维普期刊资源
A——晶体生长
B——计算机模拟
被连接的检索词必须同时出现在记录的同一句子
中(同一字段),不限制它们在此字段中的相对
词序,中间插入词的数量也不限。
2.3 计算机检索的技术
2.3.1 布尔逻辑检索 2.3.2 截词检索 2.3.3 字段检索 2.3.4 位置检索 2.3.5 限制检索
2.3.5 限制检索
为了提高查准率,将检索限制在网页(记录)的一个 特定部分或几个部分进行的检索,称之为范畴检索,也就 是限制检索。 (1)site:按网域搜索
截词检索的分类
截词检索有多种不同方式,一般按照截断的 位置来分,截词可分为后截断、前截断和中截断。 (1)后截词检索
即将截词符号置放在一个字符串右方,以表 示其右的有限或无限个字符不影响该字符串的检 索匹配。
Science Direct数据库
归纳起来,后截词主要使用在以下四个方面:
(1)词的单复数;
(2)inurl:按URL搜索
(3)intitle:按网页标题搜索 (4)link:按链接搜索 (5)filetype:按文件格式查找文件
关键字 site:网站域名
inurl:关键词1 关键词2
intitle:三峡文化
相关文档
最新文档