检索语言

合集下载

常用的检索语言

常用的检索语言

常用的检索语言检索语言在信息检索领域起着非常重要的作用,它是用户与搜索引擎进行交互的桥梁。

本文将介绍几种常用的检索语言,包括关键词检索、布尔检索、模糊检索和自然语言检索。

一、关键词检索关键词检索是最常见的一种检索方法,用户通过输入与所需信息相关的关键词来进行检索。

搜索引擎会根据关键词在数据库中的索引进行匹配,返回相关的结果。

关键词检索对于用户来说比较简单直观,但也存在一些问题。

比如,如果用户输入的关键词过于模糊,可能会返回大量与用户需求不相关的结果;如果用户输入的关键词过于具体,可能会导致相关结果过少。

二、布尔检索布尔检索是一种基于逻辑运算的检索方法,用户可以通过使用布尔运算符(如AND、OR、NOT)来组合多个关键词进行检索。

布尔检索可以更精确地表达用户的需求,提高检索结果的相关性。

例如,用户可以通过输入“电影AND 喜剧”来检索同时包含电影和喜剧两个关键词的相关内容。

三、模糊检索模糊检索是一种考虑到用户输入的不完整或错误的情况下进行的检索方法。

搜索引擎使用模糊匹配算法,将用户输入的关键词与数据库中的内容进行模糊匹配,返回与用户需求最相近的结果。

模糊检索可以有效地解决用户拼写错误或输入不完整的问题,提高搜索的准确性。

四、自然语言检索自然语言检索是一种使用自然语言进行检索的方法,用户可以用自然语言的形式描述自己的需求,而不需要使用特定的检索语法。

搜索引擎会将用户的自然语言转化为机器可理解的查询语言,然后进行检索并返回相关结果。

自然语言检索可以使用户更加方便地表达需求,但也存在一些挑战,如语义理解和查询解析的问题。

总结:常用的检索语言包括关键词检索、布尔检索、模糊检索和自然语言检索。

不同的检索方法适用于不同的用户需求和场景。

关键词检索简单直观,适用于用户已经清楚知道自己需要什么的情况;布尔检索可以更精确地表达用户需求,提高检索结果的相关性;模糊检索可以解决用户输入不完整或错误的问题,提高搜索的准确性;自然语言检索可以使用户更加方便地表达需求,但也面临语义理解和查询解析的挑战。

第二章 检索语言

第二章  检索语言

(一)分类检索语言的类型
1.体系分类法 2.组配分类法
(二)分类检索语言的特点
分类检索语言是信息管理领域经典的 检索语言之一,以1876年《杜威十进分类法》 的问世为标志,已走过了一个多世纪的历 程,形成了自成体系的一套信息组织和检 索方法。
二、分类检索语言结构
(一)类目 1.类目的划分 2.引用次序 3.类目的排列 4.类名的确定 5.类目之间相互关系的处理
一、检索语言的概念 传统意义上的检索语言仅指根据信息
检索需要而创制的人工语言,又称情报语 言、情报存储与检索语言、文献语言、文 献工作语言、索引语言、标引语言、标引 符号、标识系统等。
二、检索语言的基础
(一)概念逻辑 概念逻辑,是一种科学思维方法,通
过明确各种概念及其相互关系而揭示事物 的本质属性及各种事物之间的联系与区别。
词为基础,以概念组配为基本原理,对文 献主题进行描述的后组式检索语言。
(二)叙词表的编制
叙词表是叙词法的核心体现。目前, 国内的叙词表已有七八十种之多。常用的 有《汉语主题词表》、《化工汉语主题词 表》、《机械工程主题词表》、《电子技 术汉语主题词表》、《国防科学技术叙词 表》等。
五、主要主题词表介绍
(一)《汉语主题词表》 《汉语主题词表》是我国第一部大型的
综合性的叙词表,由中国科技信息研究所 和北京图书馆负责主持,1975年开始编制, 1980年正式出版。
(二)《中国分类主题词表》
《中国分类主题词表》是在《中图法》 编委会主持下,经全国40个单位160位专家 学者的共同努力,历时8年编制而成的,于 1994年6月正式出版。
(二)单元词法
单元词又称元词,是从自然语言中选 取,经过规范化处理,表达主题最小的、 最基本的、字面上不能再分的名词术语。

第2章 检索语言

第2章 检索语言
传统意义上的检索语言,是应文献信息的加工、存贮和 检索的共同需要而编制的专门语言,它是表达概括文献信息 内容的概念及相互关系的一种概念标识系统。

广义上的检索语言,指信息检索过程中涉及的人工语言 和自然语言。

人工语言是根据一定的规则人为编制而成的检索语言,有严格的使用规则,可用 于表述文献主要内容,建立信息检索系统。 自然语言是人类交流时使用的语言,不受任何限制,未经加工和规范。




2.1 2.2 2.3 2.4 2.5 2.6
检索语言概述 检索语言的理论基础 分类检索语言 主题检索语言 分类主题一体化检索语言 网络信息检索语言
2.1 检索语言基本知识

2.1.1 检索语言概述 2.1.2 检索语言的功能 2.1.3 检索语言的类型
2.1.1 检索语言概述
3.代表类事物特征的一套代码;
世界常见的检索语言主要有:



《杜威十进制分类法》 《国际十进制分类法》 《冒号分类法》 《中国图书馆分类法》 《中国人民大学图书馆分类法》 《汉语主题词表》
2.1.2检索语言所具备的功能




(1) 对文献的信息内容及其外表特征加以规范化 的标引; (2) 对内容相同及相关的文献信息加以集中或揭 示其相关性; (3) 可使文献信息的存贮集中化、系统化、组织 化,便于检索者按一定的排列次序进行有序化检 索; (4) 便于将标引用语和检索用语进行相符性比较。

狭义上的检索语言,仅指根据信息检索的需要,按照一 定的规则对自然语言进行规范,并专门用于信息标引和用户 检索的人工语言。

2.1.1 检索语言概述
检索语言又称情报语言、情报存储与检索语 言、文献语言、索引语言、标引语言、标示系 统等。 1.从自然语言中精选出来并加以规范化的词汇;

检索语言

检索语言

33 电子数字计算机 34 电子模拟计算机
317 程序包 319 各种专用程序
35 混合电子计算机
36 微型计算机 38 其它计算机
3R95151 信造息血处系理疾病
类目之间的关系: ❖从属关系 ❖并列关系
39 计算机的应用
-
392 各种专用数据库 393 计算机网络 399 在其他各方面的应用
《中图法》类目表等级关系
例:“网络浏览器”类号、类目展开示例: T 工业技术 TP 自动化技术、计算机技术 TP3 计算技术、计算机技术 ……. TP39 计算机的应用
…… TP393 计算机网络
…… TP393.0 一般性问题
…… TP393.09 计算机网络应用程序
…… TP393.092 网络浏览器
信息检索语言和方法 1. 概念
检索语言(Retrieval language) 是用来描 述文献特征和表达检索提问的一种专门语言。不 同的检索语言构成不同的检索标识和索引系统, 提供不同的检索点和检索途径。
-
2. 检索语言的类型
检索语言
描述文献内 容特征的语言
分类语言 主题语言 代码语言
描述文献外 表特征的语言
TP1 自动化基础理论 2 自动化技术及设备 3 计算技术、计算机 6 射流技术(流控技术) 7 遥控技术 8 远动技术
30 一般性问题
312 程序语言、算法语言 313 汇编程序
31 计算机软件
314 编译程序、解释程序
315 管理程序、管理系统
32 一般计算器和计算机 316 操作系统
-
❖论述两个具有从属关系的主题,按较大的概念的 主题入类。即多级主题涉及上下位概念则入上位类。
例:“论软件需求分析方法和工具的选用” 软件需求分析方法 TP311.5 软件工程 工具的选用 TP311.56 软件工具 入TP311.5

检索语言

检索语言

3.靠词标引 某些文献主题过于专指,词表中既无专指主题 词,又无法组配标引则可采用靠词标引。 上位词标引:选用最直接的上位主题词标引。 甲基莲心碱——→生物碱类 近义词标引:选择含义相近的主题词标引。 上消化道出血 ——→胃肠出血 自由词标引
4
.组配标引
主题词——主题词交叉组配
胃溃疡出血 肛温 贲门肿瘤 孢子虫感染 ——→消化的溃疡出血+胃溃疡 ——→体温+直肠 ——→胃肿瘤+贲门 ——→原虫感染+孢子虫纲
中图法二十二个大类
A 马克思主义、列宁主义、 毛泽东思想 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N O P Q R S T U V X Z 自然科学总论 数理科学和化学 天文学、地球科学 生物科学 医药、卫生 农业科学 工业技术 交通运输 航空、航天 环境科学 综合性图书
④特征词(Check Tags)
人类、动物、病headings)
副主题词是限定主题概念的规范化词汇,对主题词起 细分作用或揭示多个主题词之间的关系。 副主题词没有独立的检索意义,其作用是增加主题概 念的专指性,提高检索效率 。 副主题词现有82个,使用范围详见37页。

Acquired Immunodeficiency Syndrome ⑵ C2.782.815.616.400.40 C2.800.801.400.40 ⑶ 83 ⑷ see related AIDS Arteritis, Central Nervous System HIV Seroprevalence ⑸ X AIDS X Immunodeficiency Syndrome, Acquired ⑹XR CD4-Positive T-Lymphocytes XR HIV-1

检索语言的定义

检索语言的定义

检索语言的定义
检索语言的定义:
检索语言是一种用于在数据库或文件系统中搜索和获取信息的编程语言。

它是
一种特殊的编程语言,旨在帮助用户有效地执行搜索和过滤操作以从大量数据中提取所需的信息。

检索语言通常用于查询和操作存储在数据库中的数据。

它提供了一种结构化的
方式来定义查询条件和过滤规则。

用户可以使用比较运算符、逻辑运算符和其他操作符来指定搜索条件,以获取满足特定条件的记录。

不同的数据库系统使用不同的检索语言。

一些常见的检索语言包括结构化查询
语言(SQL)和XQuery。

SQL是一种广泛使用的关系型数据库语言,用于管理和
操作关系型数据库。

XQuery则是一种用于XML数据查询和转换的标准查询语言。

除了数据库系统,文件系统中的搜索工具也可以使用检索语言来提供高级搜索
功能。

这些工具在文件中搜索特定的文本字符串或者根据文件属性来搜索文件。

总之,检索语言是一种重要的工具,使用户能够准确、高效地从数据库或文件
系统中检索所需的信息。

它提供了一种灵活和强大的方式来定义搜索条件,以便满足用户的需求。

无论是在数据库管理还是文件管理领域,检索语言都扮演着至关重要的角色。

检索语言的名词解释

检索语言的名词解释

检索语言的名词解释
检索语言,也称为信息检索语言或信息检索词汇,是一种专门设计的语言,用于描述和表示文献主题和内容特征,以便计算机进行信息检索。

检索语言的主要作用是将自然语言中任意性的文本转化为规范化的、可比较的、可操作的检索工具,从而能够高效地检索出所需要的文献。

常见的检索语言包括关键词语言、分类语言和主题语言等。

其中,关键词语言是基于文献中出现的词汇进行检索的语言;分类语言则是根据文献的内容和主题,将其划分到不同的知识类别中,然后通过类别的关系进行检索;主题语言则是将文献的主题进行规范化的描述,形成一个标准化的主题词表,然后通过主题词进行检索。

检索语言在图书馆、情报中心、档案馆、网络搜索引擎等领域广泛应用,是实现信息高效检索的重要工具之一。

检索语言名词解释

检索语言名词解释

检索语言名词解释检索语言就是用来存储和检索信息的计算机程序。

它主要包括三方面的内容:一是作为“目标”的信息,二是由其实现的机器或计算机程序,三是对机器或计算机程序进行有效控制和管理的算法。

在实际应用中,检索语言分两种类型,一种称为“记录检索语言”,另一种称为“过程性检索语言”。

1。

记录检索语言指的是专门针对数据库而设计的程序语言,这些程序语言采用一种表格形式将数据库中的相关信息集中到一个固定位置上。

这样使用者只需要选择他们需要的记录即可。

2。

过程性检索语言是针对数据库中每一条记录的某个特定的字段进行检索,常用的是记录内检索和关键字段检索。

记录内检索通过限制检索范围来实现,关键字段检索则通过确定检索关键字来实现。

3。

数据挖掘3。

数据挖掘(data-mining,简称: dba)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

4。

事务检索语言的最主要特点是能够直接调用存储于数据库系统中的事务数据,因此,这种检索语言主要用于检索数据库中已有的事务记录,这种检索语言称为事务检索语言。

事务检索语言的基本组成部分是事务数据表。

5。

触发式检索语言的输入与输出必须有一个规律性的控制信号,以便进行数据库的控制操作。

这种控制信号通常由计算机外部提供。

触发式检索语言的典型代表是Windows环境下的SQL语句。

6。

存储过程是一个由SQL语句构成的功能模块,它实际上是一组可执行的语句。

存储过程允许你把一个数据库的大部分操作都写成一个过程,并让这个过程自动执行。

7。

视图(View),是一种图形化显示控制台,它被集成到开发环境中。

视图是一种对象,是一种数据透明的查询手段,它以“快照”形式返回数据库中的数据,并且是动态生成的。

7。

视图是一种对象,是一种数据透明的查询手段,它以“快照”形式返回数据库中的数据,并且是动态生成的。

8。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
I25 中国小说 R521.2 支气管淋巴结核
类名或类目
分类号
资料法中的类号
注释
体系分类法的作用
强调知识的系统化组织 符合人们认识事物的习惯 便于检全某一学科、专业的文献 因课题可随时扩大或缩小检索范围
主题语言 以反映文献内容的主题词或关键词作
为文献存储和检索的标识,并按一定的顺
序排列而成的一种检索语言。 优点:直接性、专指性强,比较适合专 深课题的检索。 主题词、关键词
neoplasm

neoplasm carcinoma
使用规范化的词能相对提高检索效率,但对检索 者和情报存储人员选词上要求比较严格。
按描述的内容划分
题名、刊名 文献外表特征 责任者姓名 专利号、档案号等
检 索 语 言
文献内容特征
分类语言 主题语言
分类号
叙词
关键词
分类语言
是使用分类方法将文献主题概念区分、 归纳形成类目体系,然后以号码为基本字符 ,用分类号表达类目体系中每个主题概念的 检索语言。 体系分类法、分面组配式分类法、 半分面分类法
类目按概念之间的逻辑隶属关系,再往下 逐级展开,划分出更专指、更具体的类目。
如“R521.2支气管淋巴结核”
R R5 R52 R521 R521.1 R521.2 医药、卫生 内科学 结核病 肺结核 原发综合征 支气管淋巴结核
《中图法》的分类号采用拉丁字母和阿拉 伯数字相结合的混合号码。当一个类号的数 字超过三位时,为了醒目而加上圆点‚.”, 并无其他意义。
由简单至复杂进行层层划分,逐级展开,形成
一个严格有序的直线性知识门类等级体系。
《中国图书馆分类法》(CLC) 主 要 类 型 《中国图书资料分类法》
《中国科学院图书馆图书分类法》
《美国国会图书馆图书分类法》 《杜威十进分类法》
中国图书馆分类法
简称《中图法》,为国内94%的信息机 构所使用。 1975年首次出版,1999年出版第四版, 并随后推出电子版。2010年9月已出版 第五版。
主题语言
字顺表的参照系统
“见‛、‚代‛参照(款目 词) “属‛、‚分‛参照 (91年取 消) 相关参照
“见”、“代”参照
用于规范同义词、近义词,反映词与 词之间的同义关系。
例1 例2 Cancer
款目词
see

Neoplasms
主题词
Tumor
see
Neoplasms
逆参照:
例3 Neoplasms 主题词 X(代) Cancer X Tumor
医学主题表(MeSH)
先天性肾发育不全 ①肾疾病(C12)/先天性(C1-12,…) ②肾(A5)/畸形(A1-10,…) 分析:以上两种组配都符合各自的组配范围, 似乎都是正确的,但是‚/先天性‛说明语中规定, 与疾病主题词组配,表明出生时或出生前存在的疾 病,不包括形态学畸形和分娩时的损伤,两者分别 用‘畸形’和‘损伤’。‚/畸形‛的说明语中规 定:与器官组配,表明因先天性缺陷而致器官的形 态改变。②符合说明语的范畴,是正确组配。
(C, F3)
表明诊断的各个方面,包括检查、鉴别诊断及预后, 但不包括普查、放射照相诊断等,对后几种分别用“预防 和控制”、“放射照相术”等。
Nursing 护理
(C,E1-4,F3)
表明对疾病的护理和护理技术,包括诊断、治疗 和预防操作中的护理作用。
副主题词使用举例
例1:查“心脏疾病的治疗”方面的文
不受限制。
缺点: 同一主题的文献可能分散在不同的词
下,从而造成漏检。如要提高查全率, 就必须分别检索表达同一主题的关键 词的同义词、近义词等。
常用主题词表
《医学主题词表》(MeSH) 《医学主题词注释字顺表》 《中国中医药学主题词表》
《汉语主题词表》
医学主题词表(MeSH) 《医学主题词表》( Medical Subject Headings,简称MeSh),是美国国立医学图书馆 编制的权威性主题词表。它是一部规范化的可 扩充的动态性叙词表。美国国立医学图书馆以 它作为生物医学标引的依据,编制了《医学索 引》(Index Medicus)及建立计算机文献联机 检索系统 Medline 数据库。
例如副主题词治疗(therapy)与疾病主题 词组配,可用于综合疗法。例如:消化性溃疡的 心理疗法,用消化性溃疡/治疗;心理疗法组配。
医学主题表(MeSH)
副主题词治疗应用(therapeutic use)
与药物、生物制品和物理作用物主题词组
配,指用于预防和治疗疾病,包括兽医用
药。
例如红霉素治疗链球菌感染,用红霉
副主题词使用说明
Blood 血液 (B2, C, D1-11) (C, F3)
用于表明血液中各种物质的存在或分析,但不包括血 清诊断和积压血清。后两者分别用“诊断”和“免疫学”。
Complication 并发症 Diagnosis 诊断
表明两种疾病同时存在或相继存在的状况,即同时 存在的疾病或后遗症、并发症。

Heart diseases / Therapy 治疗 心脏疾病
例2:查“肝肿瘤 CT诊断”方面的文献
Liver neoplasms / radiography
肝肿瘤 放射照相术
医学主题表(MeSH) 在《医学主题词注释字顺表MeSHAAL》中, 对每个范畴类目的主题词和副主题词的组配原则 进行了严格规定,组配时要按照规则进行。
文献检索教研室 李梅
主要内容
信息组织 分类语言 检索语言 主题语言 主题标引
信息组织
是根据检索的需要,以各种类型的信息 资源为对象,利用一定的规则和方法,依 据信息资源的外部特征或内容特征,通过 对其特征的分析、选择、处理,将无序的 信息资源组织为有序集合的过程。
信息组织与文献检索的关系
信息组织是文献检索的基础和前提。 文献检索则是信息组织的目的和归 宿,是信息组织的反向过程。
词后,系统会自动显示该主题词所能组配
的副主题词。《MeSh》有一个副主题词表,
1989-1990年IM使用的副主题词是77个,
1991-1994年是80个,每年略有变化。目 前使用的副主题词是92个。
副主题词
副主题词(Subheadings) ,与主题词进行组 配,对某一主题词的概念进行限定或复分,使主题词 具有更高的专指性。如诊断(Diagnosis,DI)、药 物治疗(Drug Theray,DT)、血液供给(Blood Supply,BS)等。正确选择副主题词也很关键。
例如肺发育不全,输入主题词‚肺‛后,在副 主题词菜单中选择‚畸形‛表示发育不全;又如双子 宫,用子宫/畸形组配检索。
副主题词表 (Subheading)
abnormalities 畸形 (A1-10,A13-14, B2) administration& dosage (D) 投药与剂量 blood 血液 (B2, C, D1-24, F3) complications 并发症 (C, F) diagnosis 诊断 (C, F3) etiology 病因学 (C, F3) epidemiology 流行病学 (C, F3,Z) metabolism 代谢 (A2-16,B,C,D,F3) virology 病毒学 (A,B1-3,B5-7……)
《MeSh》汇集约20,000多个医学主题词。
Family Health
N1.400.300 91; was see under FAMILY 1979-90 Family Life Cycles see Family Family Planning 主题词
主题语言
N2.421.143.401+ 树状结构号 68; BIRTH CONTROL was see under CONTRACEPTION 1975, was see under FAMILY PLANNING 1968-74, 建词年份 was see heading 1963-67 变更情况 see related 63-67: Family planning see Birth control 参照系统 Contraception 68-74: Birth control see under Family X Birth Control planning 75--: Birth control see under Contraception X Planned Parenthood XR Contraception XR Population Control
体系分类法
概 念 原 理 作 用 类 型
体系分类法
是根据文献所属的学科内容分门别类 地系统化组织、揭示文献的一种方法,亦 称等级列举式分类法、枚举式分类法。 主要用于文献的排架管理和检索工具的 编排组织。
体系分类法的原理
以学科门类为基础,根据文献的内部和某 些外部特征,运用概念划分的原则,按知识门 类的逻辑次序由总体到分支、由一般到具体、
款目词
相关参照
提示主题词含义相近,指引查找相关主题词
主题词 例: Contraception see related 参见 Family planning
相关主题词
Family Planning 主题词 see related 相关主题词 Contraception
副主题词 在进行检索时,用户输入一个主题
对一词多义、多词一义的词语,检索不便
控制语言
又称规范语言、人工语言,采用经过人工控 制的规范性的词语或符号作为检索标目,来专
指或网罗相应的概念,这些规范化的标目能较
好地对同义词、近义词、相关词、多义词及缩
略词等概念进行规范。
例如:‚肿瘤‛
同义词 tumor 肿 tumour cancer
人为规定的词
主题词
相关文档
最新文档