检索语言类型

合集下载

② 检索语言2009

② 检索语言2009

7 矿山安全劳动保护 8 矿山开采 80 一般性问题 81 可燃矿物开采 82 煤矿开采 83 油页岩开采 84 煤地下气化 85 金属矿开采 87 非金属矿开采 88 矿区复垦 ……
.11 竖井开拓 .12 斜井开拓 .13 平峒开拓 .18 综合开采 .2 各种煤层开采
.21 各种倾角煤层开采 .25 各种厚度煤层开采 .3 …… 各种采煤方法
自然科学
R 医药卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学
综合图书
Z 综合性图书
DDC 杜威十进制分类
000 100 200 300 400 500 600 700 800 900 Generalities Philosophy Religion Social Science Language Science Technology Arts Literature History
主题语言原理
主题词:是描述文献内容特征的知识单元, 主题词:是描述文献内容特征的知识单元,即在概念上不能 再分的基本概念。 再分的基本概念。 原理:以词语为基础,以概念组配作为其特点的一种语言。 原理:以词语为基础,以概念组配作为其特点的一种语言。 概念: 概念: 字面组配:实质是词语的分析与组合, 字面组配:实质是词语的分析与组合,即拆词 概念组配:实质是概念的分析与综合, 概念组配:实质是概念的分析与综合,即拆义 示例:多媒体课件的制作、 示例:多媒体课件的制作、生物合成咖啡因 语词排列顺序: 语词排列顺序:
主题语言种类
叙词语言: 叙词语言:从自然语言中优选出来并经过规范化处理的名词 术语,利用用代关系显示概念间的相互关系。 术语,利用用代关系显示概念间的相互关系。 国内: 国内:汉语主题词表 国外:Thesaurus、 国外:Thesaurus、Descriptors 关键词语言: 关键词语言:是适应目录索引编制过程自动化的需要而产生 的。它是将文献中原有的能描述文献概念的具有关键性的词 关键词)抽出,不加规范或只作少量的规范化处理, (关键词)抽出,不加规范或只作少量的规范化处理,按字 顺排列的一种检索语言。 顺排列的一种检索语言。 Keywords 标题词语言:用语词作为概念标记,按语词的顺序, 标题词语言:用语词作为概念标记,按语词的顺序,利用参 照系统间接显示概念间的相互关系。 照系统间接显示概念间的相互关系。 Subject Headings

信息检索名词解释

信息检索名词解释

1)信息检索(information retrieval) 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。

所以,它的全称又叫信息存储与检索(information storage and retrieval), 这是广义的信息检索。

狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。

相当于我们所说的信息查询(information search)。

2)零次文献:也叫灰色文献,未经公开发表或未交流于社会的文献。

如私人笔记,设计草图、实验记录、文章草稿、会议记录、书信文书、以及档案等。

其主要特点是内容新颖,但不成熟,不公开交流,难以获得。

3)一次文献(Primary Document): 以著者本人的研究或研制成果为依据而创作或撰写的文献,习惯上称做原始文献。

如期刊论文、科技报告、专利说明书、会议论文、学位论文等。

体现创作性。

其主要特点是内容新颖丰富,叙述具体详尽,参考价值大,但数量庞大、分散。

4)二次文献(Secondary Document):就是检索工具。

是将大量分散的无组织的一次文献经浓缩,整序的加工整理,编辑成目录、题录、文摘、索引等检索工具或数据库。

如文摘,目录、索引等。

它有存贮、检索、报道的功能。

体现高度的浓缩性。

其主要功能是检索、通报、控制一次文献,帮助人们在较少时间内获得较多的文献信息。

二次文献具有汇集性、工具性、综合性、交流性等特点。

5)三次文献(Tertiary Document):在一、二次文献的基础上,经过综合分析而编写出来的文献,如专题述评、动态综述、学科年度总结,进展报告以及数据手册、百科全书等参考工具书。

三次文献是情报研究的产物和成果。

具有很强的的综合性。

总之,一次文献(创造性),二次文献(有序化),三次文献(高度浓缩,提炼,再创造)。

6)以上四个级别的文献中,零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不作为我们利用的文献类型。

文献检索知识

文献检索知识

文献检索知识一、文献检索的涵义文献检索的概念有狭义和广义之分。

狭义的检索(Retrieval)是指依据一定的方法,从已经组织好的大量有关文献集合中,查找并获取特定的相关文献的过程。

这里的文献集合,不是通常所指的文献本身,而是关于文献的信息或文献的线索。

如果真正要获取文献中所记录的信息,那么还要依据检索所取得的文献线索索取原文。

广义的检索包括信息的存储和检索两个过程(Storage and Retrieval)。

信息存储是指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。

而检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。

依据检索对象的不同,文献检索可分为三种类型:(1)以查找文献线索为对象的文献检索;(2)以查找数值与非数值混合情报为对象的事实检索;(3)以查找数据、公式或图表为对象的数据检索。

二、文献检索的基本原理信息检索的基本原理是:通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。

其中存储是为了检索,而检索又必须先进行存储。

存储的过程,主要对信息源进行标引,将其外表和内容的特征(如文献的标题、作者、来源和主题等)用特定的检索语言转化为一定的标识(如主题词、分类号和类目名称等),再将这些标识按一定的顺序编排后输入检索系统,从而为检索提供有规可循的途径。

为了保证文献信息能存得进、取得出,就必须使文献存储所依据的规则与文献信息检索所依据的规则尽量做到一致。

也就是说,为了检索过程的顺利进行和达到较高的检索效率,除了在存储和检索过程的各个环节必须依据一定的方法和规则外,还必须有统一的检索语言和名称规范作为存储人员和检索人员的共同依据。

主题检索语言的特点

主题检索语言的特点

主题检索语言的特点(叙词法的特点):直接性:即直接用自然语言名词术语作为标识符号,最直观、最方便,一目了然。

专指性:是指解释和查找文献主题的深度而言。

集中性:主题检索语言对反映同一主题的各个方面的文献可以达到高度集中的效果。

多元性:是指对文献主题内容采用多个主题词进行组配标引和检索,揭示与查找该文献的途径多,从而提高对文献的揭示能力和利用率。

适应性:通过增补新的主题词或通过组配,主题检索语言在表达新概念的文献和新的研究课题的资料时具有很强的适应能力。

标引就是对文献主题分析的结果赋予检索标识的过程。

主题标引:是一种将文献主题的自然语言形态,转换为主题法语言形态(叙词、标题词、关键词、单元词)的标引,这是建立主题检索系统的依据。

分类标引:是一种将文献主题的自然语言形态,转换为分类语言形态的标引,即转换成分类号码的一种标引,这是建立分类检索系统的依据。

浅标引:是一种标引深度较浅的主题标引,主要用于手工检索系统,即把文献中最重要的概念作为主题标识的标引。

深标引:是一种标引深度较深的主题标引,主要用于计算机检索系统,它反应文献中主要的和次要的概念。

标引深度是指对一片文献所赋予的全部检索标识的数量。

就主题标引而言,则指标引一篇文献平均所给予的主题词的数量。

标引等级是指将文献中的概念根据主次按等级划分,分为三个等级,一级概念标引1.一级概念标引,也称主要标引。

仅仅揭示文献的主要论点。

2.二级概念标引,也称次要标引。

3.三级概念标引,也称不要标引。

2.加权标引:是指一种采用打星号的方式区分主要、次要标引的方法。

既为所标引主题词确定IM和NIM词的过程。

加权标引的目的是突出文献重点,划分标引等级。

主题分析概念:是指根据文献存储与检索的要求,对文献内容进行分析,从中提炼主题概念,确定主题类型、剖析主题结构和确定概念间关系的过程主题分析的意义在于使标引者尽可能的掌握一定的分析方法,遵循共同的分析步骤,客服因分析不一致造成的标引不一致,保证标引的初始环节达到较高的一致性主题标引的原则一、基本原则(一)真实性(二)客观性(三)全面性(四)准确性(五)专指性(六)一致性二、选词原则(一)首选专指词(二)次选组配词(三)选择上位词或靠近义词(四)标引自由词三、选词注意事项(一)随时注意主题词的增删,尽量使用新词表。

计算机信息检索2

计算机信息检索2

22
2.4 信息检索系统的基本概念
二次文献(检索工具)的类型
索引(index) 是对一组信息集合的系统化的指引, 通常依附于其他检索工具。
2019/5/3
23
2.5 文献信息检索的步骤
1. 明确检索要求,分析课题涉及的概念
明确检索要求就是要搞清楚需要查找的课题属于 什么学科,所需情报的文献类型及语种,查找文 献的年代,所需文献的最佳篇数,允许支配的检 索费用。 分析课题所涉及的主要概念,找出能代表这些概 念的若干个词或词组,这些词或词组将作为检索 词在检索中使用。
篇目按照一定的排检方法编排而成 的,供人们查找篇目出处的检索工 具。
2019/5/3
21
2.4 信息检索系统的基本概念
二次文献(检索工具)的类型
文摘 (Abstracts) 是以精练的语言把文献信息的重要
内容摘录下来,并按一定的著录规则 与排列方式编排起来,供读者查阅使 用的一种检索工具。
2019/5/3
5
2.3.1 检索语言种类
按构成原理
⑴分类语言:体系分类语言 ⑵主题语言
①叙词语言—概念组配是叙词语言的最主要 特征.
②关键词语言—不加规范化处理是关键词 语言的主要特征.
2019/5/3
6
2.3.2 分类检索原理与检索方法
分类检索原理:
⑴分类法(表)的定义:按照文献信息的内容和形
式等, 根据科学学科之间的逻辑归属关系, 采用 层次型或树杈型结构, 列举人类所有的知识类别, 并对每一种知识门类分别标以相对固定的代码, 从而形成的类表。
2019/5/3
33
2.6 会议馆藏信息
《1976-1978年西文科技会议 录联合目录》 《西文科技学术会议录联合目 录(续编)》 图书馆的OPAC系统

检索语言与检索途径

检索语言与检索途径

(三)分类检索途径的基本规则

分类检索的基本步骤:

–ቤተ መጻሕፍቲ ባይዱ
– – –
分析课题内容,明确其学科属性。 查阅检索工具的分类目次表,根据分类号(或分类名) 确定需查检的类目,记录选定的类目所在页码。 逐条阅读所确定类目下的文献著录,根据文献题目或 文摘等提供的信息再次进行筛选,确定所需文献。 抄录选定的文献题录或文摘 根据文献题录或文献所提供的线索获取原始文献。
(二)体系分类语言的优缺点(续)
2.缺点:
(1)体系分类语言在标引和检索拥有复杂主题的文献 时很难达到精确,尤其对涉及边缘学科、交叉学科的 文献处理较为困难。 (2)体系分类语言是一种先组式语言,故体系分类表 不能随时进行修改,对一些新学科、新概念和新技术 等难以及时作出反应。 (3)体系分类虽利于族性检索,却不利于特性检索。
再由书中查 寻人参条目
三、主题语言
(一)主题语言特点 (二)主题语言的类型 (三)《中国中医药学主题词表》简介 (四)主题语言的优缺点
(一)主题语言特点
1.概念化
(1)独立概念 (2)普遍概念 (3)属概念 (4)种概念 (5)并列概念 (6)同一概念 (7)相关概念 (8)复合概念
(二)体系分类语言的优缺点
1.优点:
(1)体系分类具有反映学科体系的特点,在文献检索 中,对于熟知本专业学科结构的科技人员来说,无疑 十分方便,也容易接受和掌握。 (2)在体系分类中,同类文献被集中在一起。因此, 非常有利于开展族性检索,能够十分简捷的获取同一 学科或同一专业的文献。 (3)体系分类是按照学科结构的一种逻辑分类,因而 通过某一类目的上位类目和下位类目的选择,就能灵 活地扩大或缩小检索范围。
R21 中医预防、卫生学 22 中医基础理论 24 中医临床学 25 中医内科 26 中医外科 271 中医妇产科 272 中医儿科 273 中医肿瘤科

关于检索词的那些事儿——检索词的概念、类型以及叙词词表的语义参照关系

关于检索词的那些事儿——检索词的概念、类型以及叙词词表的语义参照关系

— —检索词的概念、类型及叙词词表的语义参照关系主要内容检索词的概念、分类受控词在实际检索中的叙词的语义参照关系作用Search Term 或Search word检索词是表达信息需求和检索课题内容的基本单元,也是与系统中有关数据库进行匹配运算的基本单元,检索词选择恰当与否,直接影响检索效果。

什么是检索词一、从词的性质来划分,检索词可以划分为四类:2、表示作者的检索词。

如作者姓名、机构名。

3、表示分类的检索词。

如分类号4、表示特殊意义的检索词。

如ISBN、ISSN、引文标引词等。

1、表示主题的检索词标题词单元词叙词关键词《中国图书馆分类法》是当今国内图书馆使用最广泛的大型综合性分类法体系,简称《中图法》。

《中图法》中图法分类号是典型的体系分类语言,是以学科为基础划分,便于用户从学科专业的角度查找文献。

特点:(1)《中图法》采用拉丁字母与阿拉伯数字相结合的混合制标记符号,以拉丁字母标记基本大类。

(2)《中图法》分为五大部类,22基本大类如:TP39 表示计算机应用方面的文献中国图书馆分类法A 马克思主义、列宁主义、毛泽东思想、邓小平理论B 哲学、宗教中国图书馆分类法C D E F G H I K 社会科学总论政治、法律军事经济文化、科学、教育、体育语言、文字文学、艺术历史、地理社会科学自然科学N O P Q R S T U V X 自然科学总论数理科学和化学天文学、地球科学 生物科医药、卫生 农业科学 工业技术交通运输航空、航天环境科学、安全科学中国图书馆分类法中国图书馆分类法综合类图书 Z综合性图书二、从语言的规范性方面来划分,检索词又可以划分为两类:2、非受控词(uncontrolled term)是指非规范化的自然语言,如关键词。

1、受控词(controlled term)是经过规范化处理的检索语言,又叫人工语言。

取自主题词表、叙词表、分类表等。

如标题词,叙词。

所谓规范化处理,就是在文献存储时,对文献中的同义词、近义词、多义词等加以严格的控制和规范,使得同一主题概念的文献相对集中在一个主题词下。

信息检索教程(第三版)PPT6

信息检索教程(第三版)PPT6

3.2.1 概念逻辑
2.概念逻辑方法 检索语言在表达各种概念及其相互关系时,普遍地应用了概念逻辑的原理,有效地利 用了
“概念的划分与概括”和 “概念的分析与综合”这两种逻辑方法来建立自己的结构 体系。 (1)概念的划分与概括 (分类) 即利用概念内涵由反映事物本质属性的概念因素构成,概念因素的增加或减少可以形 成新的
之间相互交叉渗透和综合而形成的新知识领域很困难,也难以反映客观实际中多维的知 识 空间结构。
3.3.2 体系分类法
(三)主要体系分类法介绍 目前,国内常见的体系分类法有 《中国人民大学图书馆图书分类法》,简称 《人大
法》,初版于1953年; 《中国图书馆分类法》,简称 《中图法》,初版于1975年,名为 《中 国图书馆图
1.标引信息内容特征及某些外表特征,保证不同标引人员表达信息的一致性 2.对内容相同及相关的文献信息加以集中或揭示其相关性 3.使信息的存储集中化、系统化、组织化,便于检索人员按照一定的排列次序进行 有
序化检索 检索语言将表达成千上万个信息主题概念的全部信息标识排列成一个有序的系统。排 列
信息标识的方法主要有三种: ①分类排列法,用于号码标识系统; ②字顺排列法,用于 语词标识系统和代码标识系统; ③分类和字顺结合的排列法,即先按照分类排,再按字顺 排,用于语词标识系统 (如分
3.1.3 检索语言的分类
2.描述文献内容特征的检索语言 描述文献内容特征的语言指主要依据文献内容特 征而形成的检索语言,这是检索语言 研究的核心部分,具体有分类语言、主题语言 和代码语言。
3.1.3 检索语言的分类
(二)按结构或原理,可分为分类语言、主题语言、代码语言和引文语言 分类语言用分类号来表达各种概念,将各种概念按学科性质进行分类和系统编排。分
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

检索语言类型
检索语言类型是指根据特定的关键词或语句来搜索并确定文本或文章所属的语言类型。

在信息爆炸的时代,检索语言类型的需求日益增长,尤其是对于翻译、语言学研究和信息处理领域来说,准确判断语言类型是非常重要的。

一、什么是检索语言类型?
检索语言类型是指根据特定的关键词或语句来搜索并确定文本或文章所属的语言类型。

目前常见的语言类型包括中文、英文、法文、德文、俄文等。

1. 翻译需求:在进行翻译工作时,需要准确判断待翻译文本的语言类型,以便选择合适的翻译人员或工具。

2. 语言学研究:语言学家需要对不同语言类型进行分类研究,以深入了解语言的特点和规律。

3. 信息处理:在信息处理和文本挖掘领域,需要根据语言类型进行分类和分析,以便更好地处理和利用大量的语言数据。

三、如何进行检索语言类型?
1. 关键词检索:根据文本中的关键词或特定词汇进行检索,比如"你好"、"hello"等关键词可以判断文本为中文或英文。

2. 语句结构分析:通过分析句子的结构和语法特点,可以初步判断文本的语言类型。

3. 词频统计:通过统计文本中不同词汇的出现频率,可以判断文本所属的语言类型。

四、检索语言类型的应用领域
1. 翻译工作:在翻译行业中,准确判断语言类型是保证翻译质量的关键。

2. 语言学研究:语言学家可以通过分析不同语言类型之间的差异和共性,深入研究语言现象。

3. 信息处理和文本挖掘:在大数据时代,对海量的语言数据进行分类和分析,可以帮助人们更好地处理和利用信息资源。

五、检索语言类型的发展趋势
随着人工智能和自然语言处理技术的不断发展,检索语言类型的准确性和效率将得到进一步提高。

未来可能出现更智能化的语言类型检索工具,能够根据更多的语言特征和数据进行判断。

同时,多语种的检索语言类型技术也将得到广泛应用,以满足全球化时代多语言交流的需求。

六、总结
通过检索语言类型,我们可以准确判断文本所属的语言类型,从而进行翻译、语言学研究和信息处理等工作。

随着技术的不断发展,检索语言类型的准确性和效率将得到进一步提高,为人们的工作和生活带来更多便利。

相关文档
最新文档