02信息检索语言.ppt.Convertor
第2章--信息检索PPT课件

经济
文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
S
T U V X Z
农业科学
工业技术 交通运输 航空、航天 环境科学、安全科学 综合性图书
《中国图书馆分类法》
中国图书馆分类法分类表共分22个大类,再分17个 二级目录,医药卫生属于R大类。 《中图法》采用汉语拼音字母和阿拉伯数字组成的 混合制号码作类目标识,用一个字母标记一个基本
的问题;
另一方面是特定原始文献的查找,即在查找特定
的文献线索后,找出原始文献的过程。
第一节 信息检索基础
一、信息检索概念
(二)信息检索的意义和作用 信息检索 有助于知识更新 ,有助于同学们扩大视野 ,了解和把握有关学科中出现的新思想、新观点与 新知识。掌握信息检索技术是快速、准确地获取和 利用最新信息的有效途径。 信息检索有助于科学研究,了解和把握有关学科的 起源和发展过程。 有助于独立自主地解决自己在学习、生活和工作中 所遇到的疑难问题。 是接受终身教育的必要手段。 节省时间,提高效率。
第二节 信息检索语言
二、检索语言的种类
(一)分类检索语言 分类检索语言又称分类法,是用分类号(字母、数 字或它们的组合)来表达各种概念的,并将各种概 念按学科性质进行分类和系统排列的信息检索语言。 它以树状结构的形式,按知识门类的逻辑次序反映事物 的从属、派生关系,构成具有上位类和下位类隶属、同 位类并列的概念等级体系。 能较好体现概念的族性关系,从学科专业的角度检索资 料,比较方便,扩大、缩小检索范围方便。
(一)按信息检索的对象划分
数据信息检索 利用数据库、工具书等以数值或数据为对象的检 索,也称为数值检索。检索包含分子式、分子量 、公式 、图表等特定数据的信息。
第二章信息检索语言

D3 小说
D4 散文 ……
C3现代
C4当代 ……
分类语言的标记符号
标记符号:文献分类法中用以表示类目的代号, 又称分类号。 作用:它具有固定类目的位置,明确各个类目的 先后次序,在一定程度上显示类目之间的隶 属、并列关系以及描述某个类目的含义。 标记符号的要求 :
– – – – 容纳性 表达性 简短性 助记性
4.检索语言的类型
• 按规范程度分
– 自然语言 – 规范化语言
• 按组配方式分
– 先组式语言 – 后组式语言
• 按照描述信息特征划分
– 内容特征语言
• 分类语言/主题语言
– 外部特征语言
• 名称语言/著者语言/序号语言
二、分类语言
• 亦称体系分类语言,是以学科范畴和学科体 系为基础来划分事物的一种检索语言。在信 息存储和检索中,它是一种对信息内容的概 念进行逻辑分类和有规律地系统排列而构成 的检索语言,并以分类表(分类法)的形式体现。 • 分类语言最显明的特点是系统性,具有族性 检索的功能,有利于人们从学科专业的角度 进行全面性的检索。
等级列举式分类法
U448各种桥梁 U448.1 桥梁、按用途分 U448.11 人行桥 U448.12 两用桥 U448.13 铁路桥 …… U448.2 桥梁、按结构分
分面组配分类法
地区分面 E1 中国
E2 朝鲜
体裁分面 D1 诗歌
D2 戏剧
时代分面 C1 古代
C2 近代
E3 韩国
E4 日本 ……
• 同一著者的不同作品:
鲁迅:《热风》I210.4 L824 鲁迅:《华盖集》I210.4 L824/2 鲁迅:《两心集》I210.4 L824/3
• 版本不同:
02检索语言

第2章检索语言【本章要点】●介绍检索语言的概念、功能及类型●总结检索语言的主要理论基础●阐述分类检索语言的结构与性能●分析主题检索语言的原理与性能●论述分类主题语言一体化检索语言的原理、性能及类型●探讨网络环境下检索语言的发展2. 1 检索语言概述2.1.1检索语言的概念(04北师)retrieval language,是为沟通文献标引与文献检索而编制的人工语言。
广义的检索语言泛指信息检索过程中涉及的人工语言和自然语言。
狭义的检索语言指根据信息检索的需要,按照一定的规则对自然语言进行规范,并专门用于信息标引和用户检索的人工语言。
2.1.2检索语言的功能(06华南师范简答)1.标引信息内容特征及某些外表特征,保证不同标引人员表达信息的一致性2.对内容相同及相关的文献信息加以集中或揭示其相关性3.使信息的存储集中化、系统化、组织化,便于检索人员按照一定的排列次序进行有序化检索4.便于将标引用语和检索用语进行相符性比较2.1.3检索语言的分类1.按描述文献的特征:描述文献外表特征(题名、组织、文献编号、引文等)的检索语言和描述文献内容(分类语言、主题语言、代码语言)特征的检索语言2.按结构或原理:分类语言、主题语言、代码语言和引文语言3.按信息标识的组合使用方法:先组式语言、后组式语言和散组式语言4.按语言的规范化程度:人工语言和自然语言2. 2 检索语言的理论基础检索语言以概念逻辑为基础,知识分类是概念逻辑的基础,检索语言的创制以术语学的研究成果为基础。
2.2.1概念逻辑1.概念逻辑的含义:是一种科学思维方法,通过明确各自概念及其相互关系而揭示事物的本质属性及各种事物之间的联系与区别。
2.概念是反映对象本质属性的思维形式,是对事物本质属性的概括。
①概念的内涵是概念所反映的对象的本质属性的总和。
②概念的外延是概念所反映对象的范围。
2.21.1概念间的关系1.相容关系:指两个概念的外延至少一部分是重合的。
信息检索原理课件

原则文件主要收藏国家技术监督局及各部、省、市旳技术监督局。 国家技术监督局收藏了全部国内技术原则和世界发达国家旳技术原则。 学位论文除收藏于学位授予单位外,国家图书馆、中国科技信息研究
所、中科院文件中心是国家法定旳学位论文收藏单位。
检索工具根据不同旳划分原则可分为不同旳类型: 根据信息旳检索方式划分,有手工检索工具、机械检索工具。 根据信息旳收录范围划分,有综合性检索工具、专业性检索 工具和单一性检索工具。 根据信息载体形式划分,有课本式、卡片式、缩微式和磁性 材料。 根据著录信息旳格式划分,有目录、题录、文摘、搜索引擎。
②信息检索系统
假如检索目旳不是很明确,或者只是经过对按学 科进行分类旳大量资料进行阅读,就能够选择分类检 索。假如想对某一主题旳资料进行迅速旳查找,就能 够选择初级般检索。假如进行较深旳专业性查找,就 能够选择高级检索。
④构造检索策略
构造检索策略涉及三方面内容:选择检索途径、拟定检索词、利用检索技术。 选择检索途径:在利用检索工具或检索系统查找信息时,要拟定检索旳入口, 即经过哪种检索途径来查找文件旳线索。常用旳检索途径有分类检索途径、主题 检索途径、著者检索途径、序号检索途径及专科途径。分类途径是按照学科分类 体系和事物性质作为检索标识来检索信息旳一种途径。主题途径是以代表文件内 容实质旳,经过规范化旳名词或词组作检索标识来检索信息旳一种途径。著者途 径是根据已知著者姓名来查找该著者刊登旳信息旳一种途径。号码检索途径是以 文件信息特有编号特征,并按编号顺序编排和检索信息旳途径。专科途径是根据 学科特点尤其设置旳便于专科性检索旳一种途径。一般说,假如对要检索文件信 息旳专业学科分类比较明确,常使用分类途径;若对所查专业学科分类不了解或 多涉及多种学科,则多使用主题途径;在已知著者旳名称旳情况下,著者途径是 最佳旳选择;若已知文件信息旳序号,涉及专利号、ISBN号、ISSN号、登记号等, 则选择序号途径。 拟定检索词:检索词能够是一种单元词,体现一种单一概念;也能够是一种 或多种词组,体现多种概念。检索词能够由检索顾客提出,也能够在数据库中旳 受控词表(主题词表、分类表等)中选择,在人工检索语言和自然检索语言并用 旳数据库中,最佳先浏览一下主题词表、叙词表和分类表,两者并用,以确保查 全查准。 利用检索技术:用布尔逻辑检索技术、位置逻辑检索技术、截词检索技术和
信息检索2章 PPT课件.ppt

• 目录型检索工具 • 一般以整本的图书、期刊等作为报道单元,仅著
录出版物的外表特征,不著录具体篇章。仅提供检 索线索,主要用于了解出版物的出版或收藏单位。
2.2.3.2检索工具的选择
4.考虑检索工具的检索功能 5.检索工具的检索费用 返回目次
2.3 检索方法及检索途径
2.3.1 检索方法 2.3.2 检索途径
2.3.1检索方法
1.常规法 利用常规检索工具查找有关文献。 分为顺查法、倒查法、时间抽样法
• 顺查法
• 以所检索课题研究的发生时间为检索起点,按 事件发生、发展的时序,由远及近,由旧到新的 顺序查找。
• 特点:所查得的文献较为系统全面,基本上可反 映某学科专业或某课题发展的全貌;缺点是费时 费力,工作量较大。一般在申请专利的查新调查 和新开课题时采用这种方法。
• 逆查法
• 与顺查法相反,由近及远,由新到旧的查找。
• 多用于查找新课题,在基本上获得所需信息时 即可终止检索。可保证文献信息的新颖性,也可 提高查准率。但由于这种方法不太关注历史渊源 和全面系统性,影响检索的全面性。
• 报道内容:文献篇名.著者.刊名.出版年,月 (卷,期),页码
• 实例:下
【实例】 在《中文科技期刊数据库》的期刊论文著录格式如下: 【题 名】 辽宁老工业基地振兴与发展中的生态产业研究 【作 者】 张军涛 【机 构】 东北财经大学公共管理学院,辽宁大连116025 【刊 名】 社会科学辑刊.2004(1).-74-78 【ISSN号】 1001-6198 【C N 号】 21-1012 【馆藏号】 80414X 【关键词】 生态产业 循环经济 环境—经济协调发展
第2讲检索语言与检索技术-课件PPT

信息检索途径
• 检索途径:又称检索点或检索入口,包括信息源外表 特征与内容特征 –外表特征:从构成文献信息源的载体、符号系统和 记录方式三要素中提取出的特征构成。 –内容特征:由分析构成文献信息源的信息内容要素 的特征与学科属性形成。
内容特征途径
主题途径 分类途径
代码途径
外表特征途径 题名途径 责任者途径
• 主题语言(标题词、单元词、叙词)的规范化处理:
①词义规范:对同义词(如计算机与电脑)、近义词 (如实验与试验)、学名和俗名(如发动机与马达) 、不同译名(激光与莱塞)、简称与全称(如中国与 中华人民共和国)、不同写法(如X射线与爱克斯射线 )等进行选择;对多义词、同形异义词进行限定说明 ,如杜鹃既表示一种鸟,也表示一种花,就须限定说 明为,杜鹃(动物)、杜鹃(植物)。
• 主题语言和分类语言的区别
–①揭示对象不同
• 主题法揭示文献论述的具体事物或主题概念(“是什么”); • 分类法揭示的是文献内容的学科属性(“属什么”)。
–②使用标识
• 主题法直接用词语表示文献主题; • 分类法则以抽象化的类目代号——“分类号”作为文献内
容标识和检索标识。
• 前者直观易懂,后者较简洁,但也较费解。
• 基本功能
–对文献信息内容(及某些外表特征)加以标引; –对内容相同及相关的信息加以集中或揭示其相关性; –对大量信息加以系统化或组织化; –便于将标引用语和检索用语进行相符性比较。
信息检索语言
• 整个信息检索过程刻画为三个方面:即信息的存储与 组织、信息的检索实施、信息的展示。其中的关系如 下图所示:
信息检索技术
检索技术
检索题目的 词语切分
常 用 的 检 索 技 术
布尔逻辑检索
信息检索技术PPT课件

按按照照选选词词方方式式的的不不同同划划分分
2020/3/21
标题词 单元词
叙词 关键词
13
2.1.2 主题语言
标题词语言
最早使用的主题语言之一,以规范化的自然语义作为标识 来表示文献涉及的主题概念。其中表达主题的词语称为标题词
单元词语言
从文献内容中抽选出来的最基本的词汇,将代表最一般、 最基本的、不可再分割的概念的词作为单独标引文献的单位 单元词是构成标题词的组件,绝大部分单元词都不是具体的标题。
检索词A和检索词B用“与”组配,检索式为:
A AND B,或者 A * B
它表示检出同时含有A、B两个检索词的记录。
例:图书馆教育 library AND education
2020/3/21
21
2.3.1 布尔逻辑检索 逻辑“或”
一种具有概念并列关系的组配,用“OR” 或“+”或“|”算符表示
检索词A和检索词B用“或”组配,检索式为:
2020/3/21
23
2.3.2 截词检索
定义:用给定的词干做检索词,用以检索出含有该词干的全部检索词的记录。 又称为通配符,不同的检索系统中使用的符号不同, 通常用“*”、“?” 来表示。
方式:后截断、前截断、中间截断 代码: *—无限截断 ?—有限截断
作用:扩大检索范围、提高查全率、减少检索词的输入量、节省检索时间等作用。
2.1.3 代码语言、自然语言
代码语言
是指对事物的某方面特征,用某种代码系统来表示和排列事物 概念,从而提供检索的检索语言。 通常用数字、字母或用它们结合的形式或以分段的方式来表示 其各部分的含义。 适用:科技报告、专利文献
第二讲 第二章 信息检索原理74.ppt.Convertor

第2章信息检索原理2.1 信息检索的基本概念2.1.1信息检索的定义和类型1.信息检索的定义检索的含义“检索就是查找”,这仅仅是一种狭义的解释。
从广义的角度讲,检索包括“存贮”和“查找”两个过程。
没有存贮就没有查找,存贮是为了查找,但查找必须有存贮,两者缺一不可。
“检索”(Retrieval)一词是一个外来词,来源于英语“Information Retrieval”(信息检索)第2章信息检索原理信息检索是指从任何信息集合中查出所需信息的活动、过程与方法。
广义的信息检索还包括信息存贮,两者又往往合并称为"信息存贮与检索"(Information storage and retrieval)。
第2章信息检索原理1.2.3文献的内部特征和外部特征文献的内容特征:就是可以从某种角度反映文献内容的特征。
文献的内部特征包括文献的题目、摘要、由著者或图书情报人员给出的主题词及其分类号。
文献的外部特征:是与内容特征关系不是十分密切的一些特征,包括文献的作者姓名、作者所在的工作单位名称,期刊刊名、会议录名称、专利说明书的专利号和科技报告的报告号等。
这些特征通常在文献的封面或扉页出现。
第2章信息检索原理2.2.1信息检索的一般原理无论是手工检索,还计算机检索,各种检索系统的检索原理基本相同。
简单地讲,就是检索提问标识与存贮在检索工具中的标引标识进行比较,两者一致或信息标引的标识包含着检索提问标识,则具有该标识的信息就从检索工具输出,输出的信息就是检索命中的信息。
存贮过程就是按照检索语言(主题词表或分类表)及其使用原则对原始信息进行处理,形成信息特征标识,为检索提供经过整序(即形成检索途径)的信息集合的过程。
信息检索同样包括存储和检索两个过程。
第2章信息检索原理(1)信息检索根据检索对象不同,可分为:文献检索、数据检索、事实检索A.文献检索(Document Retrieval)。
文献检索是以文献为检索对象的信息检索。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二部分信息检索语言
数据库系统工程师、讲师、系统分析师潘恩林
信息检索语言:它是根据信息存储和检索的需要而编制的人工语言。
1.信息检索语言的含义
描述信息内部分类语言
特征单元词
标题词
主题语言叙词
检索关键词
语言
题名(书名、篇名、刊名等)
描述信息外责任者
部特征号码(如专利号、文献序号)
机构
年月
2.信息检索语言分类
3.信息检索语言的原理
详见信息检索语言的原理.pdf
分类语言是以学科体系为基础,用号码作为概念标识,按分类编排的检索语言。
《中国图书馆图书分类法》介绍
4.分类语言
A马克思主义、列宁主义、N 自然科学总论
毛泽东思想、邓小平理论O 数理科学和化学
B 哲学P 天文学、地球科学
C 社会科学总论Q 生物科学
D 政治、法律、R 医药、卫生
E 军事S 农业科学
F 经济T 工业技术
G 文化、科学、教育、体育U 交通运输
H 语言、文字V 航空、航天
I 文学X 环境科学、劳动保护科学
J 艺术Z 综合性图书
K 历史、地理
类目
《中图法》是由大大小小几千万个类目组成的,每个类目都有类号和类名。
例如:F25 物资经济C252.81 设备流通
类号类名类号类名
详见 2.主要体系分类检索语言.pdf
5.主题语言介绍
主题语言是以语词作为概念标识,按字顺编排的检索语言。
主题语言包括:
标题语言
单元词语言
叙词语言
关键词语言
标题语言——最早使用的一种主题语言。
它以规范化的名词术语作为标识,来表达文献涉及的主题概念。
单元词语言——是从文献内容中抽选出来的最基本的词汇,将代表最一般、最基本的、不可再分割的概念单元的词作为单独标引文献的单位。
叙词语言——叙词语言是以叙词(即主题词)作为文献内容标识,通过概念组配(不同于字面组配)来表达主题的检索语言。
叙词是从自然语言中优选出来并经过规范化处理的名词术语。
关键词语言——直接从文献题目、摘要或正文中抽取出来的能表达文献主题内容的具有实质意义的词语。
6.在文献的篇名和摘要中如何提取关键词
◆提取实质意义的词语
例如:都市文明与女性文学关系论断
关键词:都市文明女性女性文学
◆避免使用普通、泛指的检索意义不大的词
“发展”、“趋势”、“现状”
◆以概念为单位,把重叠的概念进行拆分
例如:经济领域犯罪的心理分析
关键词:经济犯罪犯罪心理分析。