林业科学数据元数据标准.

林业科学数据元数据标准.
林业科学数据元数据标准.

林业科学数据元数据标准(V3.10版)

1 主题内容与适应范围

本标准规定了用来描述林业科学数据集及提供信息服务所需要的信息,包括林业科学数据共享元数据内容框架和林业科学数据共享元数据标准。提供了有关林业科学数据集的标识、内容、分发、数据质量、数据表现、参照系和元数据参考信息等内容。

本标准适用于林业科学数据集元数据整理、建库、汇编、发布及共享服务。

本标准的元数据分为两级,即核心元数据和详细元数据。核心元数据规定了描述数据集最关键的信息内容。在核心元数据的基础上,考虑林业科学研究的特点,建立满足林业科学数据共享建设的详细元数据。用户可以在核心元数据的基础上,根据具体需求和数据的实际情况选用、扩充详细元数据内容,建立相应级别的元数据库。

2 规范性引用文件

下列规范性引用文件通过本部分的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准。但是,鼓励根据本标准达成协议的各方,研究是否可使用这些文件的最新版本。但是不注日期的引用文件,其最新版本适用于本标准。ISO和IEC 成员维护目前有效国际标准的注册。

科学数据共享工程技术标准—科学数据共享元数据标准内容1.4

SDS/T 2112—2004 科学数据共享工程技术标准

GB/T 1.1—2000 标准化工作导则

GB/T 7408-1994 数据元和交换格式信息交换日期和时间表示方法

GB/T 4880.2-2000 语种名称代码第2部分:3字母代码

GB/T 2260-2002 中华人民共和国行政区划代码

GB/T 7156-1987 文献保密等级代码

SDS/T 2111—2004 元数据标准化原则与方法

SDS/T 2122—2004 科学数据共享工程数据分类编码

ISO 19115 地理信息—元数据(Geographic information—Metadata)

3 术语和定义

3.1 数据集dataset

数据集是可以表示的数据集合,数据集可以是数据库,也可以是数据库中的一个(逻辑组成)部分。本标准所指的数据集是指不可再细分的数据集,即可以用一个数据字典能够唯一描述的数据集合。3.2 数据集系列dataset series

数据集系列是同一主题的多个数据集的组合,都符合相同产品规范。

3.3 元数据metadata

元数据是关于数据的数据,用来描述数据的内容、覆盖范围、质量、管理方式、数据的所有者、数据的提供方式等有关信息。

3.4 元数据元素metadata element

元数据元素是元数据的基本单元。

3.5 元数据实体metadata entity

元数据实体是描述数据同类特征的元数据元素的集合。元数据实体可以是单个实体,也可以是包括一个或多个实体的聚合实体。

3.6 元数据子集metadata section

元数据子集是指相关的元数据实体和元素的集合。

3.7 核心元数据core metadata

在林业科学数据共享工程中,描述林业科学数据集最基本属性、领域在制定其元数据内容标准时必须选择的元数据实体和元数据元素。

3.8 详细元数据detail metadata

在林业科学数据共享工程中,详细和完整描述林业科学数据集的元数据内容。详细元数据包含核心元数据的全部内容。

4 符号与约定

本标准采用二种方式定义和描述元数据:核心元数据采用摘要表示,详细元数据采用字典描述。4.1 摘要表示

摘要表示使用定义、英文名称、数据类型、值域、短名、注解、子元素和扩展巴氏范式来描述元数据。

4.1.1 定义

描述元数据的基本内容。

4.1.2 英文名称

元数据的英文名称,一般用英文全称。

4.1.3 数据类型

元数据的有效值域和允许对该值域内的值进行有效操作的规定。

例如整型、实型、布尔型、字符型、日期、关联、复合型等。

4.1.4 值域

说明元数据元素、实体的取值范围。

4.1.5 短名

元数据的英文缩写名称,具体缩写规则如下:

(1)短名在本标准范围内必须唯一。

(2)采用与国际标准类似的英文名称作为短名。

4.1.6 注解

对元数据的含义的进一步解释,包括该元数据的约束/条件(必选、可选或条件必选)和最大出现次数。当该元数据为条件必选时,应注明其约束条件。

4.1.6.1 约束/条件

说明元数据实体或元数据元素是否必须选取的属性。包括必选(M)、可选(O)和条件必选(C)。

必选M

表明该元数据实体或元数据元素必须选择。

可选O

根据实际应用可以选择也可以不选的元数据实体或元数据元素。已经定义的可选元数据实体和可选元数据元素,可指导领域元数据内容标准制定人员充分说明其数据。

可选元数据实体可以有必选元素;但这些元素只当可选实体被选用时才成为必选的。如果一个可选

元数据实体未被选用,则该实体所包含的元素(包括必选元素)也不选用。

条件必选 C

说明可以进行电子处理的条件,当该条件满足时,至少一个元数据实体或元数据元素必选。“条件必选”用于以下三种可能性之一:

—表示在2或2个以上元数据实体或元数据元素中进行选择。至少存在一个元数据实体或元数据元素必选。

—当已经选用另一个元数据实体或元数据元素时,此元数据实体或元数据元素为必选。

—当另一个元数据元素已经选择了一个特定值时,此元数据元素为必选。

4.1.6.2 最大出现次数

说明元数据实体或元数据元素可以具有的最大实例数目。只出现一次的用“1”表示,重复出现的用“N”表示。不为1的固定出现次数用相应的数字表示,如“2”、“3”、“4”等。

4.1.7 子元素

子元素是通过一定的表示规则以确定一个元数据子集或元数据实体中包含的下一级的元数据实体或元数据元素。表示规则为:“标识符= 表达式”。表达式中各符号的含义如下:

表1 表达式的符号含义

例如:

子元素:浏览图=

文件名称+

0{文件说明}1 +

0{文件类型}1

4.1.8 扩展巴氏范式

扩展巴氏范式可以更加规范化的表示一个元数据子集或元数据实体与其下一级的元数据实体或元数据元素之间的关系,便于系统实现。与子元素的表示法不同的是,扩展巴氏范式用“,”代替子元素中的“+”表示“与”关系,{}中均使用该元数据元素的短名,并以“;”作为表达式的结尾。

例如:

扩展巴氏范式:graphOver = bgFileName , 0{bgFileDesc}1 , 0{bgfileType}1;

4.2 字典描述

数据字典以表格的形式描述元数据的特征属性。字典中加灰的行定义元数据实体。数据字典通过以

下七个属性定义元数据实体和元数据元素。

4.2.1 名称/角色名称

名称/角色名称是赋给元数据实体或元数据元素的一个标记。

元数据实体名称以一个大写字母开头。元数据实体名称中没有空格,而是多个单词连写,其中每一个新的单词开头为大写字母(如:XnnnYmmm)。元数据实体名称在本标准的数据字典中是唯一的。

元数据元素名称在元数据实体中是唯一的,但在本标准的数据字典中并不是唯一的。通过元数据实体和元数据元素名称的组合,可使元数据元素名称在一个应用中唯一(如:元数据.元数据字符集)。

角色名称用以标识元数据抽象模型关联,并由“角色名称:”开头,将其与其它元数据元素相区分。

4.2.2 短名和域代码

短名的定义及命名规则参见5.1.5节。

对于代码表和枚举构造型,本标准为每一个可能的选择均提供了一个代码。这些域代码由三位数字表示,并在该代码表中是唯一的。每个代码表或枚举的第一行包含一个英文短名,是该代码表或枚举的英文名称缩写。

4.2.3 定义

参见4.1.1节。

4.2.4 约束/条件

参见4.1.6.1节。

4.2.5 最大出现次数

参见4.1.6.2节。

4.2.6 数据类型

参见4.1.3节。

4.2.7 域

对元数据实体而言,域说明其包含的行数。

对元数据元素而言,域说明其有效值或使用自由文本。“自由文本”表明对字段的内容没有限制。应使用基于整型的代码表示包含代码表的域值。

4.2.8 级别

说明元数据的分级,“*”表示为核心元数据内容。

5 林业科学数据共享核心元数据

林业科学数据核心元数据元素为元数据子集和实体中必选的元数据元素,可用于数据集编目、数据交换网站活动和对数据集的描述。

5.1 内容组成

林业科学数据核心元数据与详细元数据的关系如下表所示:

表2 核心元数据与详细元数据关系表

5.2 林业科学数据核心元数据定义

5.2.1 元数据标识符

定义:元数据的唯一标识

英文名称:metadataIdentifier

数据类型:字符型

值域:自由文本

短名:mdid

注解:必选项;最大出现次数为1;必须是第一个著录项目、标识符须唯一、由字母(含下划线(_)短划线(-)点(.)斜线(/)逗号(,)和空格())或数字组成

5.2.2 元数据语种

定义:元数据使用的语言

英文名称:language

数据类型:字符型

值域:语种代码<<代码表>>(6.2.11)

短名:mdLang

注解:必选项;最大出现次数为1

5.2.3 元数据字符集

定义:元数据集使用的字符编码标准的全名

英文名称:characterSet

数据类型:字符型

值域:字符集代码<<代码表>>(6.2.3)

短名:mdChar

注解:必选项;最大出现次数为1

5.2.4 元数据联系方

定义:对元数据信息负责的单位或个人

英文名称:citedResponsibleParty

数据类型:复合型

短名:citRespParty

注解:可选项;最大出现次数为N

子元素:元数据联系方=

1{元数据联系人姓名| 元数据联系单位}1 +

0{元数据联系方联系信息} 1

扩展巴氏范式:citRespParty =1{rpIndName | rpOrgName}1, 0{ rpCntInfo } 1;

5.2.4.1 元数据联系人姓名

定义:元数据联系人姓、名、头衔,用分隔符隔开

英文名称:individualName

数据类型:字符型

值域:自由文本

短名:rpIndName

注解:条件必选项;最大出现次数为1;未选用元数据联系单位和元数据联系人职务时为必选

5.2.4.2 元数据联系单位

定义:元数据联系单位名

英文名称:organisationName

数据类型:字符型

值域:自由文本

短名:rpOrgName

注解:条件必选项;最大出现次数为1;未选用元数据联系人名和元数据联系人职务时为必选

5.2.4.3 元数据联系方联系信息

定义:与元数据联系人和/或元数据联系单位联系所需的信息

英文名称:Contact

数据类型:复合型

短名:Contact

子元素:元数据联系方联系信息=

元数据联系人电话信息+

0{元数据联系方地址}1

扩展巴氏范式:Contact = cntPhone , 0{ cntAddress }1 ;

5.2.4.3.1 元数据联系人电话信息

定义:与元数据联系人或元数据联系单位通话的信息

英文名称:phone

数据类型:复合型

短名:cntPhone

注解:可选项;最大出现次数为1

子元素:元数据联系人电话信息=

1{元数据联系人语音电话}n +

0{元数据联系人传真}n

扩展巴氏范式:cntPhone =1{ voiceNum }n ,0{ faxNum }n ;

5.2.4.3.1.1 元数据联系人语音电话

定义:与元数据联系人或元数据联系单位通话的语音电话号码

英文名称:voice

数据类型:字符型

值域:自由文本

短名:voiceNum

注解:可选项;最大出现次数为N

5.2.4.3.1.2 元数据联系人传真

定义:元数据联系人或元数据联系单位的传真号码

英文名称:facsimile

数据类型:字符型

值域:自由文本

短名:faxNum

注解:可选项;最大出现次数为N

5.2.4.3.2 元数据联系方地址

定义:与元数据联系人或联系单位联系的物理地址和电子邮件地址

英文名称:address

数据类型:复合型

短名:cntAddress

注解:可选项;最大出现次数为1

子元素:元数据联系方地址=

1{元数据联系方详细地址}n +

0{元数据联系方所在城市}1 +

0{元数据联系方所在行政区}1 +

0{元数据联系方邮政编码}1 +

0{元数据联系方所在国家}1 +

0{元数据联系方电子邮件地址}n

扩展巴氏范式:cntAddress = 1{ delPoint }n , 0{ city }1 , 0{ adminArea }1 , 0{ postCode }1 , 0{ country }1 , 0{ eMailAdd }n;

5.2.4.3.2.1 元数据联系方详细地址

定义:元数据联系方所在位置的详细地址

英文名称:delilveryPoint

数据类型:字符型

值域:自由文本

短名:delPoint

注解:可选项;最大出现次数为N

5.2.4.3.2.2 元数据联系方城市

定义:元数据联系方所在城市

英文名称:city

数据类型:字符型

值域:自由文本

短名:city

注解:可选项;最大出现次数为1

5.2.4.3.2.3 元数据联系方行政区

定义:元数据联系方所在省、自治区、直辖市

英文名称:administrativeArea

数据类型:字符型

值域:自由文本,可参考GB/T 2260-2002

短名:adminArea

注解:可选项;最大出现次数为1

5.2.4.3.2.4 元数据联系方邮政编码

定义:元数据联系方邮政编码

英文名称:postalCode

数据类型:字符型

值域:自由文本

短名:postCode

注解:可选项;最大出现次数为1

5.2.4.3.2.5 元数据联系方所在国家

定义:元数据联系方所在国家

英文名称:country

数据类型:字符型

值域:自由文本

短名:country

注解:可选项;最大出现次数为1

5.2.4.3.2.6 元数据联系方电子邮件地址

定义:元数据联系人或元数据联系单位的电子邮件地址

英文名称:electronicMailAddrss

数据类型:字符型

值域:自由文本

短名:eMailAdd

注解:可选项;最大出现次数为N

5.2.5 元数据创建日期

定义:创建元数据的日期

英文名称:metadatadateStamp

数据类型:日期型

值域:日期,可参照GB/T 7408-1994 短名:mdDateSt

注解:必选项;最大出现次数为1

5.2.6 元数据标准名称

定义:执行的元数据标准名称

英文名称:metadataStandardName

数据类型:字符型

值域:自由文本

短名:mdStanName

注解:可选项;最大出现次数为1

5.2.7 元数据标准版本

定义:执行的元数据标准版本

英文名称:metadataStandardVersion

数据类型:字符型

值域:自由文本

短名:mdStanVer

注解:可选项;最大出现次数为1

5.2.8 数据集名称

定义:已知的数据集名称

英文名称:title

数据类型:字符型

值域:自由文本

短名:resTitle

注解:必选项;最大出现次数为1

5.2.9 数据集日期

定义:数据集的参照日期

英文名称:date

数据类型:复合型

值域:参见引用信息.日期引用<<数据类型>>

短名:refDate

注解:必选项;最大出现次数为1

5.2.10 数据集摘要

定义:数据集内容的简单说明

英文名称:Abstract

数据类型:字符型

值域:自由文本

短名:abstract

注解:必选项;最大出现次数为1

5.2.11 数据集负责方

定义:数据集负责人或单位及其联系方法

英文名称:citedResponsibleParty

数据类型:复合型

短名:citRespParty

注解:可选项;最大出现次数为N

子元素:数据集负责方=

1{数据集负责人姓名| 数据集负责单位}1 +

0{负责方联系信息} 1

扩展巴氏范式:citRespParty = 1{rpIndName | rpOrgName}1 , 0{ rpCntInfo } 1;

5.2.11.1 数据集负责人姓名

定义:数据集负责人姓、名、头衔,用分隔符隔开

英文名称:individualName

数据类型:字符型

值域:自由文本

短名:rpIndName

注解:条件必选项;最大出现次数为1;未选用负责单位和负责人职务时为必选

5.2.11.2 数据集负责单位

定义:数据集负责单位名

英文名称:organisationName

数据类型:字符型

值域:自由文本

短名:rpOrgName

注解:条件必选项;最大出现次数为1;未选用负责人名和负责人职务时为必选

5.2.11.3 数据集负责方联系信息

定义:与数据集负责人和/或负责单位联系所需的信息

英文名称:Contact

数据类型:复合型

短名:Contact

子元素:数据集负责方联系信息=

数据集负责人电话信息+

0{数据集负责方地址}1

扩展巴氏范式:Contact = cntPhone , 0{ cntAddress }1;

5.2.11.3.1 数据集负责人电话信息

定义:与数据集负责人或负责单位通话的信息

英文名称:phone

数据类型:复合型

短名:cntPhone

注解:可选项;最大出现次数为1

子元素:数据集负责人电话信息=

1{数据集负责人语音电话}n +

0{数据集负责人传真}n

扩展巴氏范式:cntPhone = 1{ voiceNum }n ,0{ faxNum }n;

5.2.11.3.1.1 数据集负责人语音电话

定义:与数据集负责人或负责单位通话的语音电话号码

英文名称:voice

数据类型:字符型

值域:自由文本

短名:voiceNum

注解:可选项;最大出现次数为N

5.2.11.3.1.2 数据集负责人传真

定义:数据集负责人或负责单位的传真号码

英文名称:facsimile

数据类型:字符型

值域:自由文本

短名:faxNum

注解:可选项;最大出现次数为N

5.2.11.3.2 数据集负责方地址

定义:与数据集负责人或负责单位联系的物理地址和电子邮件地址英文名称:address

数据类型:复合型

短名:cntAddress

注解:可选项;最大出现次数为1

子元素:数据集负责方地址=

1{数据集负责方详细地址}n +

0{数据集负责方城市}1 +

0{数据集负责方行政区}1 +

0{数据集负责方邮政编码}1 +

0{数据集负责方所在国家}1 +

0{数据集负责方电子邮件地址}n

扩展巴氏范式:cntAddress = 1{ delPoint }n , 0{ city }1 , 0{ adminArea }1 , 0{ postCode }1 , 0{ country }1 , 0{ eMailAdd }n;

5.2.11.3.2.1 数据集负责方详细地址

定义:数据集负责方所在位置的详细地址

英文名称:delilveryPoint

数据类型:字符型

值域:自由文本

短名:delPoint

注解:可选项;最大出现次数为N

5.2.11.3.2.2 数据集负责方城市

定义:数据集负责方所在城市

英文名称:city

数据类型:字符型

值域:自由文本

短名:city

注解:可选项;最大出现次数为1

5.2.11.3.2.3 数据集负责方行政区

定义:数据集负责方所在省、自治区、直辖市

英文名称:administrativeArea

数据类型:字符型

值域:自由文本,可参考GB/T 2260-2002

短名:adminArea

注解:可选项;最大出现次数为1

5.2.11.3.2.4 数据集负责方邮政编码

定义:数据集负责方邮政编码

英文名称:postalCode

数据类型:字符型

值域:自由文本

短名:postCode

注解:可选项;最大出现次数为1

5.2.11.3.2.5 数据集负责方国家

定义:数据集负责方所在国家

英文名称:country

数据类型:字符型

值域:自由文本

短名:country

注解:可选项;最大出现次数为1

5.2.11.3.2.6 数据集负责方电子邮件地址

定义:数据集负责人或负责单位的电子邮件地址

英文名称:electronicMailAddrss

数据类型:字符型

值域:自由文本

短名:eMailAdd

注解:可选项;最大出现次数为N

5.2.12 数据集格式名称

定义:数据集存储格式名称

英文名称:name

数据类型:字符型

值域:自由文本

短名:formatName

注解:可选项;最大出现次数为1

5.2.13 数据集格式版本

定义:数据集存储格式版本(日期、版本号等)

英文名称:version

数据类型:字符型

值域:自由文本

短名:formatVer

注解:必选项;最大出现次数为1

5.2.14 关键词说明

定义:关键词种类、类型和参考资料

英文名称:descripriveKeywords

数据类型:复合型

短名:descKeyes

注解:可选项;最大出现次数为N

子元素:关键词说明=

1{关键词}n +

0{词典基本信息}1

扩展巴氏范式:descKeys =1{keyword }n , 0{thesaInfo}1;

5.2.14.1 关键词

定义:用于描述数据集主题的通用词、形式化词或短语

英文名称:keyword

数据类型:字符型

值域:自由文本

短名:keyword

注解:必选项;最大出现次数为N

5.2.14.2 词典基本信息

定义:正式注册的词典或类似的权威关键词资料的基本信息

英文名称:thesaurusInformation

数据类型:复合型

值域:参见引用信息.引用<<数据类型>>

短名:thesaInfo

注解:可选项;最大出现次数为N

5.2.15 数据集访问限制

定义:为保护隐私权或知识产权,对访问数据集施加的限制和约束

英文名称:accessConstraints

数据类型:字符型

值域:限制代码<<代码表>>(6.2.9)

短名:accessConsts

注解:条件必选项;最大出现次数为N;当不选用“使用限制”时为必选

5.2.16 数据集使用限制

定义:为保护隐私权或知识产权,对使用数据集施加的限制和约束

英文名称:useConstraints

数据类型:字符型

值域:限制代码<<代码表>>(6.2.9)

短名:useConsts

注解:条件必选项;最大出现次数为N;当不选用“访问限制”时为必选

5.2.17 数据集安全限制分级

定义:对数据集处理限制的名称

英文名称:classification

数据类型:字符型

值域:安全限制分级代码<<代码表>>(6.2.4)

短名:class

注解:必选项;最大出现次数为1

5.2.18 数据集语种

定义:数据集采用的语言

英文名称:language

数据类型:字符型

值域:语种代码<<代码表>>(6.2.11)

短名:dataLang

注解:必选项;最大出现次数为N

5.2.19 数据集字符集

定义:数据集使用的字符编码标准全称

英文名称:charactreSet

数据类型:字符型

值域:字符集代码<<代码表>>(6.2.3)

短名:dataChar

注解:条件必选项;最大出现次数为N

5.2.20 数据集分类

定义:数据集的分类信息

英文名称:topicCategory

数据类型:复合型

短名:tpCat

子元素:数据集分类=

类别名称+

类别编码+

分类标准

扩展巴氏范式:tpCat = catename, catecode, catestd;

5.2.20.1 类别名称

定义:用于描述数据集类别的通用词、形式化词或短语

英文名称:categoryName

数据类型:字符型

值域:自由文本,参见《科学数据共享工程数据分类编码》和各领域数据分类编码标准中各种分类的取值规定

短名:catename

注解:必选项;最大出现次数为1

5.2.20.2 类别编码

定义:类别名称对应的编码

英文名称:categoryCode

数据类型:字符型

值域:自由文本,参见《科学数据共享工程数据分类编码》和各领域数据分类编码标准中各种分类的取值规定

短名:catecode

注解:必选项;最大出现次数为1

5.2.20.3 分类标准

定义:分类标准名称

英文名称:categroyStandard

数据类型:字符型

值域:数据集分类标准代码<<代码表>>(6.2.12)

短名:catestd

注解:必选项;最大出现次数为1

5.2.21 数据志说明

定义:数据集生产者对数据源和处理步骤的一般说明英文名称:statement

数据类型:字符型

值域:自由文本

短名:statement

注解:必选项;最大出现次数为1

5.2.22 数据集在线资源链接地址

定义:可以获取资源的在线资源信息

英文名称:online

数据类型:复合型

值域:参见引用信息.在线资源<<数据类型>>

短名:onLineSrc

注解:可选项;最大出现次数为N

元数据的概念

元数据的概念 元数据(Metadata),即关于数据的数据,是对数据和信息资源进行描述的信息。通常认为,元数据是为了更为有效地管理和使用数据而对它进行说明的信息。所以元数据与其描述的数据内容有着密切联系,不同领域的数据的元数据在内容 上差异很大。地理空间数据的元数据是地理空间的空间数据和属性数据以外的描述地理信息空间数据集的内容、质量、状态和其它特性的一类数据,它是实现地理空间信息共享的核心标准之一。其中,对空间数据某一特征的描述,称为一个空间元数据元素。空间元数据是一个由若干复杂或简单的元数据项组成的集合。它与非空间元数据的主要区别在于其内容中包含大量与空间位置有关的描述性信息。 研究元数据的作用和意义 元数据可用来帮助数据提供者和数据使用者解决数据转换、沟通和理解的问题。归纳起来,元数据主要有下列几个方面的作用: 1)、用来组织、管理和维护空间数据,建立数据文档,并保证即使其主要工作人员退休或调离时,也不会失去对数据情况的了解 2)、提供数据存储、数据分类、数据内容、数据质量及数据分发等方面的信息,帮助数据使用者查询检索所需地理空间数据 3)、用来建立空间信息的数据目录和数据交换中心,提供通过网络对数据进行查询检索的方法或途径,以及与数据交换和传输有关的辅助信息 4)、通过空间元数据,人们可以接受并理解空间信息,帮助数据使用者了解数据, 以便就数据是否能满足其需求作出正确的判断并与自己的空间信息集成在一起,进行不同方面的科学分析和决策。 元数据是使数据充分发挥作用的重要条件之一。它可以用于许多方面,包括数据文档建立、数据发布、数据浏览、数据转换等。元数据对于促进数据的管理、使用和共享均有重要的作用。元数据对于建立空间数据交换网络是十分重要的,往往网络中心通过设在中心的元数据库可以实时地连接各个分发数据的分节点元数据库,帮助潜在的用户找到其特定应用所需要的数据,实现数据共享。 一个完整的元数据系统通常包括三部分,即元数据标准、元数据管理工具和元数据库。不同的元数据库可能采用不同的管理工具,唯一能够在不同数据管理软件间交换元数据的途径是统一元数据标准,只有在统一的标准前提下,才能跨越操作系统平台和数据库软件平台进行数据的互操作,实现数据共享。 DIF 元数据标准

中文数字化期刊的dc 元数据标准设计实例情报科学vol1 21no1 6

中文数字化期刊的DC 元数据标准设计实例 刘廷元 (西南石油学院图书馆,成都610500) 摘 要 文章将元数据标准的使用作为各种不同的数字化期刊仓储资源共享的一种可行性方法进行了论 述。研究集中在三个方面:首先,讨论了数字化期刊采用元数据标准的必要性;其次,讨论了数字化期刊的 DC 元数据定义与限定;最后,提供了一个用DC 111元数据和H TM L 410语法设计的中文数字化期刊元数据 标准实例。 关键词 元数据 标准 数字化期刊 中文期刊 设计 中图分类号 G 35311 文献标识码 A 文章编号 100727634(2003)0620609204 An Exam ple of the DC M etada ta Standard D esign for Ch i nese D ig ita l Journa ls L iu T ingyuan (L ib rary of Sou thw est Petro leum In stitu te ,Chengdu 610500) Abstract T h is article deseribes the u se of m etadata standards as a viab le m ean s fo r shared resou rces among vari ou s differen t digital j ou rnalw arehou ses .O u r study concen trates on th ree con ten ts :F irst ,the article discu ssed under the necessity of u sing the m etadata standard in digital j ou rnals .Second ,the article discu ssed the sem an tic defin iti on and li m itati on of the DC elem en t set fo r digital j ou rnals .F inally ,w e p rovided the m etadata standard of the Ch inese digital j ou rnals and an examp le of the design w ith the DC 1.1m etadata and H TM L 4.0syn tax . Keywords M etadata Standard D igital Jou rnal Ch inese Jou rnal D esign 收稿日期:2002-09-09 数字化信息的结构化存储、有序化组织和高效、准确的 检索,是数字化图书馆与商业数据库共同面临的一个问题。由于WWW 空间的无限扩大,使得解决全球信息资源的无组织问题更加迫切。目前,因特网上既有OCL C 、U nCover 那样庞大的数字化期刊服务,也有BaderL ine 、EBSCO ho st 、P roQ uest D irect 、Sp ringer 数字化期刊、CN K I 中国学术期刊网、维普中文科技期刊、万方中国数字化期刊网这样新兴的数字化全文期刊数据库服务,以及不断增加的上千种的网上出版期刊。然而,这样巨大的期刊信息资源仓储却是以异构方式存在的,它们提供各自不同的信息存储、组织、检索与浏览方法,不能实现跨仓储的统一查找利用,造成了极大的信息资源浪费。 因特网上分布式的异构数字化期刊仓储如同一个没有索引卡片的传统图书馆。但是,如果我们为这些数字化期刊的信息存储、组织、检索与浏览加上一个无形的统一索引目录——元数据标准,网上数字化期刊就会成为一个单一的、虚拟的、有组织的信息集合体,实现全球期刊信息的资源共享和跨仓储无缝查找,使期刊文献检索的查全率和查准率大大提高,从而极大地方便广大读者和用户。 1 数字化期刊采用DC 元数据标 准的必要性 大多数数字化期刊(尤其是全文期刊数据库)都习惯采用自己特有的数字信息储存、检索技术,人为地使自己的产品在使用方式、字段、接口设计等方面造成差异和封闭。强调产品的差异性而又不遵守统一的制作标准与规范,谋求利润最大化而又自我封闭,这就是数字化期刊制作与出版过程中普遍存在的二律悖反现象。正是由于这种分布式的异构与封闭,才阻碍了当今信息资源的透明、公开、可扩展、互操作性、组织性和规模化建设,使数字化期刊在当今知识经济时代难以受到人们更多的喜爱。 具体地说,数字化期刊采用元数据标准的必要性主要有以下四个方面。 (1)元数据描述能够为数字化期刊建立一种计算机普遍 可以理解的框架体系,使数字化期刊资源得以透明、公开。因为元数据描述了数字化信息的内容、权利和外部环境这些基本特征,使得计算机系统可以自动辨识、抽取、分析和整合,进而使得数字化期刊信息简单、有效的被其它信息资源仓储利用。 (2)元数据的描述、标识和语法能够融入因特网通用的 语言中,被迅速地装载或转换进各种索引数据库,使数字化期刊资源具有可扩展和互操作性。一方面,建立在通用标记语言(SG M L )和扩展标记语言(X M L )之上的元数据语言,是国际互联网的通用语言,能够非常方便地被相同的元数据语言装载。另一方面,即使是对于各种不同数字化期刊仓储类型的元数据体系,只要我们以W F 和RD F 为基础,通过语 第21卷第6期 2003年6月     情 报 科 学   V o l 121,N o 16June, 2003

元数据与元数据标准现状

元数据与元数据标准现状 福建省空间工程研究中心黄瑞垠 目前国内外研究领域对元数据含义的理解虽然存在认识深浅的区别,但总体上达成了共识[[i]]。学者们大都认可“元数据是关于数据的数据”或“描述数据的数据”的观点,但对于其具体含义,又有不同阐述。张晓林等[[ii]]认为“元数据是描述信息资源或数据等对象的数据,其使用目的在于:识别资源、评价资源、追踪资源在使用过程中的变化,实现简单高效地管理大量网络化数据,实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理”。肖珑[[iii]]认为元数据“是用于提供某种资料的有关信息的结构化数据(Structured data)”。张智雄[[iv]]将元数据定义为“描述任何Internet数据和资源,促进Internet信息资源的组织和发现的数据”。李郎达[[v]]引用国际图联对元数据的定义:“Metadata即描述资料的资料,可用来协助对网络电子资源的辨识、描述、指示其位置的任何资料”。 根据以上定义,参考其他学者的观点,关于元数据,可小结如下: (1)元数据的目标:元数据的根本目标是使数据库更易于使用,或为计算机辅助软件工程(CASE)服务。 (2)元数据的内容:元数据包括对数据集的描述;对数据集中各数据项(来源、数据所有者、数据生产历史)等的说明;数据质量的描述,如:数据精度、分辨率、源数据的比例尺等;数据处理信息,如量纲的转换等;数据转换方法;数据库更新、集成的方法等等。 (3)元数据的性质:元数据是数据的描述性数据;对不同领域的数据库,元数据的内容有很大差异;元数据应尽可能反映数据的特征及规律。 (4)元数据的作用:通过元数据可以检索、访问数据库,可以有效利用计算机的系统资源,可以对数据进行加工处理和二次开发等。 在此基础上,我们将元数据概括为以数据高效利用和交换为目的的数据集说明性数据,它主要包括对数据集、与数据集相关信息、数据集各数据项说明以及数据用户访问、检索、更新数据库的方法,同时元数据也包括基于不同数据领域,如何尽可能全面反映基本数据的信息。

CELTS-42基础教育教学资源元数据规范1

基础教育教学资源元数据应用规范 (CELTS-41) 教 育信息化技术标准 CELTS-42 基础教育教学资源元数据规范 CELTS-42 CD1.6 教育部教育信息化技术标准委员会 发布

目录 1 概述 (2) 1.1 目的 (2) 1.2 范围 (2) 2 规范性引用文件 (2) 3 术语定义与缩略语 (3) 3.1 本应用规范使用的基础术语 (3) 3.2 缩略语 (5) 4 元数据元素属性定义 (6) 4.1 元数据元素的属性描述 (6) 4.2 数据元素定义的规定 (7) 5 元数据结构 (7) 5.1 元数据的基本结构 (7) 5.2 元数据元素及定义 (7) 6 限定词汇与编目词汇表 (11) 6.1 限定词汇 (11) 6.2 本规范的限定词与编目方式定义 (14) 6.3 受控词汇和编目方案 (22) 6.4 一致性 (29) 7 参考文献 (31) 附录 A 供参考的部分教育学科课程分类第三级词汇表(课程内容) (33) A.1 语文课程内容分类 (33) A.2 数学课程内容分类 (34) A.3 英语课程内容分类 (37) A.4 地理课程内容分类 (38) A.5 历史课程内容分类 (39) A.6 化学课程内容分类 (40) A.7 物理课程内容分类 (43) A.8 生物课程内容分类 (48) A.9 信息技术课程内容分类 (49) A.10 音乐课程内容分类 (50) A.11 美术课程内容分类 (50)

CELTS-42基础教育教学资源元数据规范 1 概述 1.1 目的 本规范提供一个面向基础教育的教学资源数据模型。制定本规范旨在对希望在学校、企业、其他机构和个人的教学资源中使用元数据的用户提供一套资源编目准则,以使读者能快速、有效地在国家基础教育资源库及门户网站中检索到所需的教学资源,广泛地实现资源共享。 1.2 范围 本规范在《CELTS-3学习对象元数据:信息模型规范》(以下简称《学习对象元数据规范》)的基础上,结合我国基础教育的实际,定义了一组面向基础教育的教学资源元数据元素。 本规范依照教育部颁布的《义务教育课程设置实验方案》、《义务教育各学科课程标准(实验稿)》以及《学习对象元数据规范》,同时参考《都柏林核心集元数据(DCMES)》、《中国图书馆图书分类法》、美国GEM项目及澳大利亚EdNA项目的词汇分类方法,定义了一组用于元数据元素编目的受控词汇及相应的词汇表。 本规范通过与《学习对象元数据规范》的元素间映射来实现与CELTS的一致性。 本规范包括﹕ ?概述 ?规范性引用文件 ?术语定义与缩略语 ?元数据元素属性定义 ?元数据结构 ?限定词汇及编目词汇表 ?一致性 ?参考文献 2 规范性引用文件 下列文件中的条款通过本规范的引用而成为本应用规范的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本应用规范。然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本应用规范。 ?ISO 639:规定人类语言表示方法的国际标准。 ?ISO 646:规定ASCII字符集的国际标准。 ?ISO 8601:规定日期和时间表示方法的国际标准。 ?ISO 3166:规定国家名称表示方法的国际标准。

《公用数据元目录》标准

科学数据共享通用标准培训系列教材 《公用数据元目录》标准 培训教材 科学数据共享工程办公室 2005年12月

目录 目录.................................................................................................................................- 2 - 一、编制背景.....................................................................................................................- 3 - 二、编制思路.....................................................................................................................- 3 - (一)、国内外数据元标准化情况............................................................................- 4 - (二)、本标准的解决思路........................................................................................- 4 - (三)、本标准的解决方案........................................................................................- 5 - (四)、本标准与其他标准的关系............................................................................- 5 - (五)、本标准的适用范围........................................................................................- 6 - 三、标准总体结构.............................................................................................................- 6 - 四、标准内容要点解析......................................................................................................- 7 - (一)、范围...............................................................................................................- 7 - (二)、术语和定义....................................................................................................- 7 - (三)、数据元的表达格式........................................................................................- 8 - (四)、数据元值的表示方法....................................................................................- 8 - (五)、数据元分组..................................................................................................- 10 - (六)、数据元目录..................................................................................................- 11 - (七)、数据元维护与管理......................................................................................- 11 - (八)、数据元索引..................................................................................................- 11 - 五、标准使用...................................................................................................................- 12 - (一)、数据元目录系统的建立..............................................................................- 12 - (二)、数据元注册系统的建立..............................................................................- 13 - (三)、领域公用数据元目录的制定......................................................................- 13 - (四)、常见问题.........................................................................................................- 19 -

专门数字对象描述元数据规范

专门数字对象描述元数据规范 研制工作手册 (试行) 《专门数字对象描述元数据规范》子项目组 2003年3月 为了保证子项目组研制的各种元数据规范在功能、数据结构、格式、语义语法等方面的一致性和整体性,同时也为了今后在更大范围内实现与其他系统或数字图书馆的互操作和数据共享,项目组特制定本手册。 手册主要内容包括: 1,描述元数据的定义及功能 2,元数据规范的设计原则 3,描述元数据的基本结构、元素组成与扩展规则 4,描述体系与定义方法 5,元数据规范应用的相关规则 6,设计流程与工作规范 7,文档规范 本手册为试行稿,其中很多内容尚需在实际工作过程进行修订,涉及到核心元素集、元素定义方法、扩展规则、描述体系等方面的内容,将与“基本描述元数据规范”子项目组进一步探讨后确定。各工作小组可暂时按此执行,在执行过程中如有问题,可向子项目组提出,并在子项目组会议上讨论修改并通过。 一、描述元数据的定义及功能 描述元数据:即用于描述或标识数字对象内容的元数据。 设计描述元数据规范时,要充分考虑和实现元数据的下列功能: 描述:对信息对象的内容、属性等的描述,是元数据最基本的功能,为信息对象的检索与利用奠定了基础。 定位:即有关信息资源的位置方面的信息,如DOI、URL、URN等的记录,由此可知信息对象之所在,有利于信息的发现和检索。 管理:对信息对象的权限管理(版权、所有权、使用权)的揭示和描述。 检索:在描述过程中,将信息对象中的重要信息抽出标引并加以组织,建立它们之间的关系,为用户提供多层次、多途径的检索体系,从而有利于用户发现其真正需要的信息。 评估和选择:由于元数据的描述,使用户在不必浏览信息对象本身的情况下,对信息对象有了基本了解和认识,可以对其价值进行评估,从而决定信息的取舍。 交互:包括与编目人员和用户之间的交互。元数据在结构上呈现出一定的开放性,允许

空间数据质量特性与质量控制.

空间数据质量特性与质量控制 范志坚1,2,方源敏1,汪虹2 (1.昆明理工大学国土资源工程学院昆明 650093;2.云南省基础地理信息中心昆明 650034) 摘要:本文主要讨论空间数据质量特性、质量控制所涉及的内容。结合笔者最近从事空间数 据库建库的具体实践和工作体会,探讨从位置精度、属性精度、时间精度、数据完整性和逻辑一致性等方面对数据质量进行全面控制,最终建成一个质量可靠的空间数据库。 关键词:地理信息系统;空间数据库;空间数据;质量特性;质量控制 Quality characteristic and Quality control of Spatial data Fan Zhi-jian1,2,Fang Yuan-min1,Wang-Hong2 (1.Faculty of Land Resources Engineering,Kunming University of Science and Technology,Kunming 650093,China;2.Yunnan Provincial Geomatics center,Kunming 650034,China) Abstract:This paper mainly talks over contents which are involved with quality characteristic and quality control of spatial data.Integrating with concrete practice and work experience which the writer has recently been engaged in establishing spatial database,a very comprehensive control of data quality should be discussed from aspects of positional accuracy、attribute accuracy、temporal accuracy、data compression、as well as logic conformance and so on.Finally,a dependable spatial database should be set up. Key words:GIS;spatial database;spatial data;quality characteristic;quality control 0 引言 空间数据库是随着地理信息系统(GIS)的开发和应用而发展起来的数据库新技术,它是地理信息系统的重要组成部份,是地理信息系统应用部份的前题和基础。空间数据库为此建立了如实体、关系、数据独立性、完整性、数据操作、资源共享等一系列基本概念。以空间数据存储和操作为对象的空间数据库,把被管理的数据从一维推向了二维、三维甚至更高维。空间数据库是一种应用于空间数据处理与信息分析领域的具有工程性质的数据库,它所管理的对象主要是空间实体。在空间数据库中,空间数据质量的好坏,直接影响到空间数据库的经济效益和社会效益。 要得到高质量的空间数据,最重要的是在空间数据生产和使用过程中进行质量管理和质量控制。通过质量管理和质量控制,可以分析影响产品质量的原因,进而提高空间数据的质量。空间数据的质量是空间数据库生存和发展的保障,缺少质量指标的空间数据将无法得到用户的信任,且直接影响到地理信息系统应用、分析、决策的正确性和可靠性。由此可知,空间数据质量是空间数据库的生

国家基础地理信息系统元数据标准(草案)

国家基础地理信息系统(NFGIS)元数据标准草案(初稿) 1. 主题内容与适用范围 本标准提供国家基础地理信息系统(NFGIS)元数据的内容,包括NFGIS数据的标识、内容、质量、状况及其他有关特征。本标准可用于对NFGIS数据集的全面描述、数据集编目及信息交换网络服务。 2. 参考标准 ISO 15046-15地理信息--元数据(CD 2.0) FGDC 地理空间数据元数据内容标准(CSDGM)v.2.0 3. 术语 3.1 元数据 是关于数据的数据,即关于数据的内容、质量、状况和其他特性的信息。也可译为描述数据或诠释数据。 3.2 元数据元素(元数据Element) 元数据最基本的信息单元。 3.3 元数据实体(元数据Entity) 同类元数据元素的集合。 3.4 元数据子集(元数据Section) 相互关联的元数据实体和元素的集合。 3.5 信息交换网络(Clearinghouse) 数据生产者、管理者和用户之间的分布式、电子连接的网络。 3.6 数据志(Lineage) 数据继承信息,包括获取或生产数据使用的原始资料说明、数据处理中的参数、步骤等情况及负责单位的有关信息等。 3.7 引用文献(Citation) 数据集引用或参考使用的资料、数据集、模型、文献等。 4. NFGIS 元数据层次结构和性质 4.1 元数据层次结构 本标准规定NFGIS元数据分为三层:元数据子集、元数据实体和元数据元素。 元数据元素是元数据的最基本的信息单元,元数据实体是同类元数据元素的集合,元数据子

集是相互关联的元数据实体和元素的集合。在同一个子集中,实体可以有两类即简单实体和复合实体,简单实体只包含元素,复合实体既包含简单实体又包含元素,同时复合实体与简单实体及构成这两种实体的元素之间具有继承关系。 4.2 元数据性质 本标准定义三种性质的元数据子集、实体和元素: 必选(Mandatory)──元数据的核心内容,适用于各种被描述对象,是元数据文件必须包含的子集、实体或元素。 一定条件下必选(Conditional )──针对不同的被描述对象特征元数据文件所必须提供的子集、实体或元素。 可选(Optional)──该子集、实体或元素是可选的,由用户决定是否将其包含在元数据文件中。 5. NFGIS 元数据分级和特征 5.1 元数据分级 本标准规定元数据分为两级,即: 基本元数据──提供地理数据源基本文档所需要的最少的元数据元素集。它包括回答下列问题的元数据元素: "是否有特定主题的数据集('什么')?"、"是否有特定地区的数据集('何处')?"、"是否有特定时段的数据集('何时')?" 以及"订购或了解数据集更多情况的联系人('谁')? 完全元数据──提供完整的地理数据源(单独的数据集、数据集系列、各种地理要素)文档所需要的必选的和可选的元数据元素集。它完整地定义全部元数据,以便标识、评价、摘录、使用和管理地理信息。 5.2 元数据特征 本元数据标准定义了8种特征: 5.2.1 名称 赋给元数据实体或元素的标记。 5.2.2 标识码 计算机中使用的定义每个元数据实体和元素的唯一代码。代码结构为: xx xx xx 前两位为元数据子集,两位数字码 中间两位为元数据实体/独立元素,两位数字码 后两位为元数据实体包含的元素,两位数字码

科学数据规范化分析与管理

科学数据规范化分析与管理
中国科学院计算机网络信息中心 胡良霖 2008年05月

提纲
1. 2. 3.
基本概念 科学数据的特点 科学数据规范化
规范化分析 3.2 规范化管理
3.1
4. 5.
示例模型 科学数据规范化工作模式

1. 基本概念
数据(data) 对事实、概念或指令的一种形式化表示,适用于以人 工或自动方式进行通信、解释或处理。 数据集(dataset) 可以标识的数据集合。 注:数据集可以是一个数据库或一个或多个数据文件。 元数据 (metadata)
定义和描述其他数据的数据。
数据模型(data model) 以反应信息结构的某种方式对数据组织的描述。 描述数据、数据关系、数据语义以及一致性约束的概 念工具的集合。[《数据库系统概念》(第三版)]
注:以上概念除特殊注明外均摘自GB/T18391.1-2002《信息技术的规范化与标准化 第一部分:数据 元的规范化与标准化框架》

1. 基本概念
数据元(data element)
用一组属性描述其定义、标识、表示和允许值的数据单元,在 一定语境下,通常用于构建一个语义正确、独立且无歧义的特 定概念语义的信息单元。
注:数据元也是构建元数据和元数据实体的基本单元。
数据元目录(data element directory)
列出并定义了全部相关数据元的一种信息资源。
注:数据元目录可有不同层级,例如,ISO/IEC委员会级、国际协会 级、行业部门级、公司级、应用系统级。
数据元值(data element value)
数据元允许值集合中的一个值。
数据元值的长度(data element value length)
数据元值中字符的数目。
注:按ASCII字符数目计算数据元值的长度,一个汉字相当于2个字符。
注:以上概念释义均出自GB/T18391.1-2002。

元数据的构成方式

元数据的构成方式 (徐枫宦茂盛)通过元数据的描述,能够使信息资源的使用者了解数据的内容、特征、作用、获取方式等信息。 元数据是关于数据的数据,在建立信息资源目录体系的过程中,元数据主要是对信息资源从外部特征进行而非从内部结构进行描述。通俗地讲,元数据就是信息资源的标签或卡片,通过元数据的描述,可以使信息资源的使用者能够了解数据的内容、特征、作用、获取方式等信息,能够对信息资源是否满足特定的应用需求做出适当的评价,并根据评价的结果决定是否采取进一步的措施来获取该信息资源。 元数据是信息资源目录体系建立的基础,构建一个信息资源目录体系首要和基础性的工作就是建立描述各个信息资源的元数据库,元数据库中存储的是描述各种来源、各种类型的信息资源的描述信息。无论用户以何种方式查询信息资源目录,包括以分类目录的形式进行查询、或者以多关键词的形式进行查询,其本质都是对后台元数据库的检索,只是从表现层提供了不同形式的人机查询接口。根据所描述的信息资源对象的不同,可以建立不同的元数据库,分别对各类信息资源进行描述。

元数据的组成 为能够对信息资源进行准确和高效的描述,元数据本身具有自身的逻辑结构。一般来说,元数据本身是层次化、树状结构的。处于树状结构最底端的叶子节点称之为元数据元素,包含了元数据元素的节点称之为元数据实体,当然元数据实体也可以只包含元数据实体。根据实际需求,元数据实体或者元数据元素可以多次出现。例如,信息资源可以有不同的分类,可以按照信息资源的来源进行分类,也可以按照信息资源的不同应用主题进行分类,因此,“信息资源分类”元数据实体就可以出现多次。 元数据一般分三个方面对信息资源进行描述。 一是对信息资源基本内容的描述。包括信息资源的标题、摘要、关键词等基本信息。标题是信息资源的名称,通过标题使用者能够初步掌握信息资源的基本范围。其次,使用者可以通过摘要,了解信息资源的主要内容、用途等各种信息。一般情况下,用户主要通过摘要作为信息资源适用性评价的主要依据。所以,在信息资源元数据的著录过程中,摘要的填写一般都由专业人员完成,只有专业人员才能够对信息资源的内容有准确的把握和深入的理解,能够提供有关信息资源内容的更加权威的解释。根据信息资源对象的不同,描述信息资源基本内容的元数据实体和元数据元素还可

《元数据的作用 [元数据的构成方式]》

《元数据的作用[元数据的构成方式]》 (徐枫宦茂盛)通过元数据的描述,能够使信息资源的使用者了解数据的内容、特征、作用、获取方式等信息。元数据是关于数据的数据,在建立信息资源目录体系的过程中,元数据主要是对信息资源从外部特征进行而非从内部结构进行描述。通俗地讲,元数据就是信息资源的标签或卡片,通过元数据的描述,可以使信息资源的使用者能够了解数据的内容、特征、作用、获取方式等信息,能够对信息资源是否满足特定的应用需求做出适当的评价,并根据评价的结果决定是否采取进一步的措施来获取该信息资源。 元数据是信息资源目录体系建立的基础,构建一个信息资源目录体系首要和基础性的工作就是建立描述各个信息资源的元数据库,元数据库中存储的是描述各种来源、各种类型的信息资源的描述信息。无论用户以何种方式查询信息资源目录,包括以分类目录的形式进行查询、或者以多关键词的形式进行查询,其本质都是对后台元数据库的检索,只是从表现层提供了不同形式的人机查询接口。根据所描述的信息资源对象的不同,可以建立不同的元数据库,分别对各类信息资源进行描述。 元数据的组成 为能够对信息资源进行准确和高效的描述,元数据本身具有自身的逻辑结构。一般来说,元数据本身是层次化、树状结构的。处于树状结构最底端的叶子节点称之为元数据元素,包含了元数据元素的节点称之为元数据实体,当然元数据实体也可以只包含元数据实体。根

据实际需求,元数据实体或者元数据元素可以多次出现。例如,信息资源可以有不同的分类,可以按照信息资源的来源进行分类,也可以按照信息资源的不同应用主题进行分类,因此,“信息资源分类”元数据实体就可以出现多次。 元数据一般分三个方面对信息资源进行描述。 一是对信息资源基本内容的描述。包括信息资源的标题、摘要、关键词等基本信息。标题是信息资源的名称,通过标题使用者能够初步掌握信息资源的基本范围。其次,使用者可以通过摘要,了解信息资源的主要内容、用途等各种信息。一般情况下,用户主要通过摘要作为信息资源适用性评价的主要依据。所以,在信息资源元数据的著录过程中,摘要的填写一般都由专业人员完成,只有专业人员才能够对信息资源的内容有准确的把握和深入的理解,能够提供有关信息资源内容的更加权威的解释。根据信息资源对象的不同,描述信息资源基本内容的元数据实体和元数据元素还可以进行有选择的增加。例如,描述空间信息资源时,可以增加空间参照系、图示表达等元数据实体,描述科学数据资源时需要增加数据质量等元数据实体。 二是对信息资源的获取方式进行描述。包括信息资源的分发者信息、信息资源的在线获取地址信息等。通过提供分发者联系信息,使用者可以直接联系信息资源的分发部门,这对于不能直接在网络上进行数据交换的信息资源获取非常有效。其次,使用者还可以通过信息资源的在线地址来下载、查询、浏览信息资源。使用者甚至可以提供专门的电子订单处理系统,并将入口信息加入到元数据内容中,方便

元数据的标准

元数据的标准 1、数字图书馆资源组织框架 2. 元数据开发应用框架 元数据的基本意义Metadata(元数据)是“关于数据的数据”; 元数据为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具;元数据为分布的、由多种数字化资源有机构成的信息体系(如数字图书馆)提供整合的工具与纽带。 离开元数据的数字图书馆将是一盘散沙,将无法提供有效的检索和处理。 3. 元数据应用环境 3.1 Metadata的应用目的 (1)确认和检索(Discovery andentification),主要致力于如何帮助人们检索和确认所需要的资源,数据元素往往限于作者、标题、主题、位置等简单信息,Dublin Core是其典型代表。(2)著录描述(Cataloging),用于对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体、位置与获取方式、制作与利用方法、甚至相关数据单元方面等,数据元素数量往往较多,MARC、GILS和FGDC/CSDGM是这类Metadata的典型代表。 (3)资源管理(Resource Administration),支持资源的存储和使用管理,数据元素除比较全面的著录描述信息外,还往往包括权利管理(Rights/Privacy Management)、电子签名(Digital Signature)、资源评鉴(Seal of Approval/Rating)、使用管理(Access Management)、支付审计(Payment and Accounting)等方面的信息。 (4)资源保护与长期保存(Preservation and Archiving),支持对资源进行长期保存,数据元素除对资源进行描述和确认外,往往包括详细的格式信息、制作信息、保护条件、转换方式(Migration Methods)、保存责任等内容。 3.2 Metadata在不同领域的应用根据不同领域的数据特点和应用需要,90年代以来,许多Metadata格式在各个不同领域出现 例如: 网络资源:Dublin Core、IAFA Template、CDF、Web Collections 文献资料:MARC(with 856 Field),Dublic Core 人文科学:TEI Header 社会科学数据集:ICPSR SGML Codebook 博物馆与艺术作品:CIMI、CDWA、RLG REACH Element Set、VRA Core 政府信息:GILS 地理空间信息:FGDC/CSDGM 数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images 档案库与资源集合:EAD 技术报告:RFC 1807 连续图像:MPEG-7 3.3 Metadata格式的应用程度 不同领域的Metadata处于不同的标准化阶段: 在网络资源描述方面,Dublin Core经过多年国际性努力,已经成为一个广为接受和应用的事实标准;在政府信息方面,由于美国政府大力推动和有关法律、标准的实行,GILS已经

空间数据质量在GIS中的影响

地理信息系统(GIS)的基础是空间数据,空间数据的核心是质量,空间数据的生产与质量控制是一个相互作用的过程,生产数据是为了应用,而数据质量是一个关系到数据可靠性和系统可靠性的重要问题。随着数据质量在建设数字地球、进行矿产预测的计算机模拟中发挥着越来越重要的作用,但如果空间数据的质量及其精度未能引起足够的重视,由这些空间数据进行重新运算和组合产生的空间数据就不是最终需要的结果,可能导致最终决策错误。要提高空间数据的质量,减小空间数据误差,就要对空间数据误差产生和扩散的所有过程和环节进行控制。在数据采集时对元数据进行跟踪,采取相应的措施提高数据质量。以地图数字化为例,对纸质地图进行数字化前应对其进行校正或配准,选用精度比较高的数字化仪和扫描仪提高栅格数据的精度等;根据空间数据质量评价的标准还应制定相应的细则来提高数据质量;对采集和处理空间数据人员进行岗前培训等也都能减小误差的传播。 1 GIS 空间数据质量控制研究现状 GIS 空间数据的质量优劣直接影响着GIS应用中分析结果的可靠程度及应用的真正实现,也影响着GIS产业的健康发展。因此,近年来国内外越来越关注GIS数据的精度和质量控制的研究。GIS数据的质量控制问题涉及面很广,包括数据质量的衡量标准、表示方法,数据误差的来源和性质,评价方法和控制方法及相关政策等。如政府部门积极制定法规保障数据质量;将数据作为产品,采用管理产品质量的方法管理数据质量;数据质量的教育、培训与咨询;初步形成了地理数据质量的系列国际标准,如ISO 19100系列标准中地理信息质量标准;方法上,主要成果和结论,包括直线不确定性模型的改进、曲线不确定性模型的建立;将平差理论引入GIS数据误差处理和质量控制,并提出了实用方法;对GIS 数字化误差的性质、分布进行了深入研究;从抽样检验的理论出发,探讨了GIS 产品的质量控制技术和方法。 2 空间数据质量的概念 2.1空间数据的质量 空间数据是有关空间位臵、专题特征以及时间信息的符号记录,而数据质量是空间数据在表达这3个基本要素时所能达到的准确性、一致性、完整性以及它们三者之间统一性的程度。由于现实世界的复杂性、模糊性以及人类认识和表达能力的局限性,空间数据在表达上不可能完全达到真值,只能在一定程度上接近真值。用户根据需要对空间数据的处理也会导致出现一定的质量问题。所以空间数据的误差产生于各种数据源及空间数据的输入和处理过程中。 2.2与空间数据质量相关的几个概念 2.2.1误差(Error)反映了数据与真实值或公认的真值之间的差异,它是一种常用的数据准确性的表达方式。

林业科学数据元数据标准

林业科学数据元数据标准(V3.10版) 1 主题容与适应围 本标准规定了用来描述林业科学数据集及提供信息服务所需要的信息,包括林业科学数据共享元数据容框架和林业科学数据共享元数据标准。提供了有关林业科学数据集的标识、容、分发、数据质量、数据表现、参照系和元数据参考信息等容。 本标准适用于林业科学数据集元数据整理、建库、汇编、发布及共享服务。 本标准的元数据分为两级,即核心元数据和详细元数据。核心元数据规定了描述数据集最关键的信息容。在核心元数据的基础上,考虑林业科学研究的特点,建立满足林业科学数据共享建设的详细元数据。用户可以在核心元数据的基础上,根据具体需求和数据的实际情况选用、扩充详细元数据容,建立相应级别的元数据库。 2 规性引用文件 下列规性引用文件通过本部分的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的容)或修订版均不适用于本标准。但是,鼓励根据本标准达成协议的各方,研究是否可使用这些文件的最新版本。但是不注日期的引用文件,其最新版本适用于本标准。ISO和IEC成员维护目前有效国际标准的注册。 科学数据共享工程技术标准—科学数据共享元数据标准容1.4 SDS/T 2112—2004 科学数据共享工程技术标准 GB/T 1.1—2000 标准化工作导则 GB/T 7408-1994 数据元和交换格式信息交换日期和时间表示方法 GB/T 4880.2-2000 语种名称代码第2部分:3字母代码 GB/T 2260-2002 中华人民国行政区划代码 GB/T 7156-1987 文献等级代码 SDS/T 2111—2004 元数据标准化原则与方法 SDS/T 2122—2004 科学数据共享工程数据分类编码 ISO 19115 地理信息—元数据(Geographic information—Metadata) 3 术语和定义 3.1 数据集dataset 数据集是可以表示的数据集合,数据集可以是数据库,也可以是数据库中的一个(逻辑组成)部分。本标准所指的数据集是指不可再细分的数据集,即可以用一个数据字典能够唯一描述的数据集合。3.2 数据集系列dataset series 数据集系列是同一主题的多个数据集的组合,都符合相同产品规。 3.3 元数据metadata 元数据是关于数据的数据,用来描述数据的容、覆盖围、质量、管理方式、数据的所有者、数据的提供方式等有关信息。 3.4 元数据元素 metadata element

相关文档
最新文档