ELK元数据管理规范

ELK元数据管理规范
ELK元数据管理规范

ELK数据接入

元数据管理规范

版本历史

目录

1概述5

1.1文档目的 5

1.2文档范围 5

1.3读者对象 5

1.4术语及定义5

2原始数据规范 6

2.1数据格式定义 6

2.2业务文档化6

3数据传输 7

3.1Filebeat传输规范 7

3.1.1数据格式 7

3.1.2配置规范 7

3.2Logstash传输规范7

3.2.1数据格式 7

3.2.2配置规范 7

3.3Kafka消息中间件数据规范7

4数据存储 7

4.1ES存储规范7

4.1.1索引格式 7

4.2HDFS存储规范8

4.3MySQL存储规范8

5附录8

1.概述

a.文档目的

本文档针对所有接入ELK平台的元数据进行约束,从数据接入方式和格式,到数据传输和存储制定标准规范,为开发者对数据的操作和二次开发提供参考。

b.文档范围

此文档包含原始数据格式规范,数据传输配置参考,以及数据最终落地和存储规范。

c.读者对象

此文档对所有内部开发人员提供元数据操作和管理约束。

d.术语及定义

ELK:Elasticsearch、Logstash和Kibana的简称。

ES:Elasticsearch的缩写。

2.原始数据规范

a.数据格式定义

所有原始数据要求能从接入处体现其关联业务,因此需要对涉及到的业务进行编号,编号规则暂定如下:

i.编号由字母和数字组成,数字长度一般为4位。

ii.字母为业务名称缩写,数字为业务对应的工作编号,如lens0001。接入数据分为日志文件和HTTP实时数据两种。对于日志文件,业务编号需在文件名中体现出来。HTTP接口接入方式则根据数据的输入输出对其配置,一般来说,使用Logstash接入需保证pipeline的ID与业务编号一致,如果数据流向kafka消息中间件,对应topic的名称则为业务编号。

b.业务文档化

所有业务和对应编号信息需由统一文档进行管理,以方便查询。每个新的业务和数据接入展开时,也要求及时更新文档,备注更新日期和开发者姓名。

文档必需提供的信息包括:

●业务编号

●业务名称

●业务简介

●业务开始时间

●数据接入方式

●数据接入路径(包括配置文件路径等)

●更新日期

●开发者姓名

3.数据传输

a.Filebeat传输规范

i.数据格式

Filebeat主要用于数据收集和传输,它可以读取任何格式的数据并作简单的处理,我们在使用中读取的数据格式主要是json格式。

ii.配置规范

Filebeat配置文件后缀为.yml,配置内容包括prospectors、processors和output三个部分。每一个配置文件的命名为filebeat-加上对应的业务名称,如filebeat-lens0001.yml。

Prospectors部分用来指定要传输的文件所在路径,这里我们只对文件进行读取收集,因此只要配置文件路径就行。

output部分指定数据输出信息,可配置的输出端有kafka,logstash和Elasticsearch等。

processors部分只有在需要对数据进行简单处理的时候才定义,常用的设置包括对json格式解析和字段的增减等。

下面示例是读取Jason格式文件解析后传入kafka的配置:

filebeat.prospectors:

- type: log

enabled: true

paths:

- /home/elk/logs/test/test.log

processors:

- decode_json_fields:

fields: ["message"]

max_depth: 3

target: ""

overwrite_keys: true

- drop_fields:

fields: ["message", "beat", "input_type"]

output.kafka:

enabled: true

hosts: ["192.168.30.93:9092","192.168.30.93:9093","192.168.30.93:9094"]

topic: test

b.Logstash传输规范

i.数据格式

Logstash可接收来自日志文件、Filebeat、Kafka等几十种不同来源的数据,在目前的架构场景中,最频繁接入的是来自Kafka和HTTP接口的数据。

对于业务产生的数据,无论从哪种来源接入,均严格要求符合标准Json格式。

ii.配置规范

Logstash的配置分为三部分:Input、output和Filter,每一部分相当于组件所带的插件。

Input插件指定Logstash读取的数据源,一个Logstash进程可以有多个输入源,所以原则上一个Logstash进程可以应付一台服务器上所有日志,但在实际应用中,对于不同业务应配置不同Logstash进程。

Output插件和Input插件一样允许配置多个输出源。我们把数据从输入到输出的完整配置称为一个事件管道(Event Pipeline),对于每个Pipeline需定义唯一ID,ID名需包含所对应的业务编号。

Logstash最强大的功能在于它的Filter插件,Logstash提供丰富的内置功能,并且集成ruby语言,让我们可以随心所欲地使用该插件对数据进行清洗、转换和过滤。在配置filter插件时,应尽量避免重复操作,尽可能地提高数据处理的效率。

下面示例为Logstash从Kafka接收Json数据并清洗过滤后写入ES的配置:input {

kafka {

bootstrap_servers => ["192.168.30.93:9092,192.168.30.93:9093"]

topics => ["test"]

group_id => "test"

client_id => "test01"

consumer_threads => 3

auto_offset_reset => "earliest"

codec => json

}

}

filter {

json {

source => "message"

}

ruby {

code => '

time = Time.now

event.set("ds",time.strftime("%Y-%m-%d"))

event.get("header").each {|k, v| event.set(k, v)} //内部字段合并到外层

'

}

split {

field => "[body][app]"

target => "app"

}

mutate {

remove_field => ["@timestamp", "@version", "body", "header"]

}

}

output {

elasticsearch{

hosts => ["192.168.30.93:9201","192.168.30.93:9202"]

index => "kafka2es-%{+YYYY.MM.dd}"

}

}

c.Kafka使用规范

数据接入Kafka时应根据不同业务使用不同Topic来接收,Topic的命名需与业

务编号一致,并且每条数据应遵守标准json格式。

因为partition数量在创建后只能增加不能减少,所以在创建Topic时应根据需求指定partition数量,建议consumer线程数(消费者个数)设置为partition 数目。

4.数据存储

a.ES存储规范

数据输出到ES应遵守统一的索引命名规则和mapping定义标准,具体规范如

下:

i.索引名

索引名称需以项目编号为前缀,后缀应根据数据存储周期添加写入日

期,如lens1001-20180601。

ii.Mapping结构

首次导入数据时需提前创建字段对应Mapping结构,避免由ES自动

生成。日志常见字段格式中,时间字段需使用date类型,IP地址使

用ipv4类型,经纬度使用geo-point类型。

只索引需要被搜索的字段,其余字段可只存储不加入索引以减少内存

占用,。

iii.其他规范

ES中的每个文档为一个json对象,所以往ES写入的数据时应为Json

格式。过期或不使用的数据应及时清除,

HDFS存储规范

数据存储到HDFS时,需按照规范存储到指定路径,文件名需包含业务编号,

并根据需要对其进行分区存储,所有数据对应业务存储信息应文档化说明。

在使用Hive建立HDFS对应的外部表时,表名和业务文件名一致,对于临时表应在使用结束后删除,日志数据也需按存储周期定时更新。

b.MySQL存储规范

对于存储到MySQL的数据需文档化说明业务对应的所有表信息及数据字典等。表名以业务编号为前缀,建表语句中需对表和所有字段进行注释,每张表必须包含创建时间(create_time)和更新时间(update_time)两个字段。

5.附录

Filebeat Reference

Logstash Reference

Elasticsearch Reference

常用项目管理工具

常用项目管理工具—本人看到的文章,共享 ---来源:不详。 随着IT行业的发展,IT行业内的项目拓展和投资比比皆是。为了提高项目管理水平,赢得市场竞争,特别是在加入WTO后在国内、国际市场上拥有与国际接轨的项目管理人才,越来越多的业界人士正通过不同的方式参加项目管理培训并力争获得世界上最权威的职业项目经理(PMP)资格认证。同时,大部分的IT行业项目管理人士正尝试使用项目管理软件对自己的项目进行辅助管理,为了方便大家的使用,现对项目管理作一简要介绍。 目前市场上项目管理软件种类较多,具有代表性的为微软项目管理软件2000,但大多以美国项目管理协会(PMI)的项目管理理论为基础,在使用过程中要注意以下内容: 一、项目管理软件特征 1.预算及成本控制 大部分项目管理软件系统都可以用来获得项目中各项活动、资源的有关情况。人员的工资可以按小时、加班或一次性来计算,也可以具体明确到期支付日;对于原材料,可以确定一次性或持续成本;对各种材料,可以设立相应的会计和预算代码。另外,还可以利用用户自定义公式来运行成本函数。大部分软件程序都应用这一信息来帮助计算项目成本,在项目过程中跟踪费用。项目过程中,随时可以就单个资源、团队资源或整个项目的实际成本与预算成本进行对比分析,在计划和汇报工作中都要用到这一信息。大多数软件程序可以随时显示并打印出每项任务、每种资源(人员、机器等)或整个项目的费用情况。 2.日程表 日程表程序主要用来对项目中各个单项资源或一组资源确定工作时间。可以用这些日程表计算出项目的进度计划。大部分系统软件都对基本工作时间设置一个默认值,比如星期一到星期五,早上8点到下午5点,中间有一小时的午餐时间。对于各个单项资源或一组资源,可以修改此日程表。例如:修改上、下班时间,按非工作时间输入公司假期,输入各种换班(白天、夜晚),包括节假日以及数量单位(小时、天、周)。汇报工作进程时要用到这些日程表,它通常可以根据每个单项资源按天、周或月打印出来,或者将整个项目的日程打印成一份全面的,可能有墙壁大的项目日程表。 3.电子邮件 一些项目管理软件程序的共同特征是可以通过电子邮件发送项目信息。这一功能使得用户不必通过打印机或屏幕显示,直接从电子邮件中获得信息。通过电子邮件,项目团队成员可以了解重大变化,比如最新的项目计划或进度计划,可以掌握当前的项目工作情况,也可以发出各种业务表格。 4.图形 对于有大量活动事项的项目工程,人工制出一份甘特图或网络图,或人工进行修改制图是一件极其乏味而又容易出错的工作。当前项目管理软件的一个最突出的特点是能在最新数据资料的基础上简便、迅速地制作各种图表,包括甘特图及网络图。有了基准计划后,任何修改就可以轻易地输入到系统中,图表自动会反映出这些改变。项目管理软件可以将甘特图中的任务连接起来,显示出工作流程。特别是用户可以仅用一个命令就在甘特图和网络图之间来回转换显示。另外,图形和表格通常有以下功能供用户使用: . 进行任务和关系的交互式操作处理。例如,通过图表连接任务,改变优先关系或通过扩展活动持续显示功能来改变活动持续时间。

电子文件元数据规范

电子文件元数据规范 1 范围 本规范适用于九省区各级国家档案馆、各级党政机关、社会团体、企事业单位对电子文件进行以保证凭证性为目的的管理活动。其他社会组织可参照执行 在电子文件管理过程中使用元数据可实现以下目的: ——确保并证明归档电子文件的真实性、完整性与有效性,从而保证其凭证价值; ——有利于归档电子文件的保护,实现长期保存; ——在异构的信息系统中对归档电子文件进行规范、有效的管理,保证归档电子文件的可捕获、可收集、查长期利用; ——对归档电子文件及馆(室)藏档案数字化资源进行集成管理,实现有效、方便地查询、检索与利用。 2 规范性引用文件 下列文件中的条款通过本规范的引用而成为本规范的条款。凡是注明日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本规范,然而,鼓励根据本规范达成协议的各方研究是否可使用这些文件的最新版本。 GB 2312-1980 信息交换用汉字编码字符集基本集 GB/T 3760-1995 文献叙词标引规则 GB/T 3792.1-1983 文献著录总则 GB/T 7156-2003 文献保密等级代码 GB/T 7408-2005 数据元和交换格式信息交换日期和时间表示法 GB/T 9704-1999 国家行政机关公文格式 GB/T 11714-1997 全国组织机构代码编制规则 GB/T 11821-2002 照片档案管理规范 GB/T 13959-1992 文件格式与代码编制方法 GB/T 13967-1992 全宗单 GB/T 15418-1994 档案分类标引规则 GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充 GB/T 18894-2002 电子文件归档与管理规范 DA/T 1-2000 档案工作基本术语 DA/T 12-1994 全宗卷规范 DA/T 13-1994 档号编制规则 DA/T 18-1999 档案著录规则 DA/T 19-1999 档案主题标引规则 DA/T 22-2000 归档文件整理规则 DA/T 31-2005 纸质档案数字化技术规范 《中华人民共和国电子签名法》 中办发[1996]14号中国共产党机关公文处理条例 国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知 国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知 国家档案局第6号令《电子公文归档管理暂行办法》,2003年7月28日 国家档案局第8号令《机关文件材料归档范围和文书档案保管期限规定》,2006年12月19日ISO 15489 Information and documentation—Records management ISO 23081-1 Information and documentation – Records Management Processes – Metadata for Records—Part 1: Principles

石竹元数据管理软件 MetaOne Catalog_1.5

MetaOne产品简介

MetaOne 功能简介 MetaOne 基本功能 元模型/元数据管理 元数据关系维护 自动获取/批量导入 元数据版本管理 基本分析功能 元数据全文检索 系统管理 MetaOne 高级功能 元数据发布流程管理 高级分析功能 元数据分析 基本分析:血统分析、影响分析、映射分析等 高级分析:差异分析、表重要程度分析、表无关程度分析等 血统分析 元数据是企业数据资源管理、使用的基础。MetaOne 作为企业实施元数据管理的软件支撑平台,其先进的理念、成熟的技术让业界耳目一新。 元模型/元数据管理 元模型支持CWM 规范,可完全扩展;元数据展现树型化,体系结构清晰直观;支持常规数据类型,及针对企业应用的特殊类型,如大文本、枚举、公式编辑器、URL 等。 自动获取/批量导入元数据 自动获取:PowerCenter 、DataStage 、Oracle 、DB2、DB2 OLAP SERVER 、 Essbase 、TeraData 等 批量导入:Excel 格式、XMI 格式、Erwin 、PowerDesigner 等 元数据全文检索 多种组合条件的模糊查询,可在整个元数据环境随时检索所需信息 系统管理 基于角色的用户权限管理;用户可定制系统参数; 元数据发布流程管理 提供元数据发布流程管理,规范企业元数据的管理流程。可以让企业更好地管理和跟踪元数据的整个生命周期, 在元数据的流程管理中, 可以安全地创建、获取、扩展的元数据信息。 元数据关系维护 图形化的元数据关系维护,拖拉鼠标轻松实现,效果直观易于维护; 图形化维护ETL 程序内部的字段级映射关系,清晰追溯数据来源及加工过程。 元数据版本管理 元数据版本变更记录、版本变更查询、版本浏览、版本恢复

电子证照数据标准

电子证照数据标准

ICS13.220.10 点击此处添加中国标准文献分类号DB35 福建省地方标准 DB 35/ T XXXX—2015 电子证照数据标准 点击此处添加标准英文译名 点击此处添加与国际标准一致性程度的标识 (工作组讨论稿) XXXX-XX-XX发布XXXX-XX-XX实施

目次 前言....................................... II 1 范围 (1) 2 规范性引用文件 (1) 3 术语和定义 (1) 4 证照目录组成 (2) 4.1 证照名称 (2) 4.2 证照目录信息 (2) 5 电子证照编号 (2) 6 电子证照文件组成 (3) 6.1 电子证照元数据 (3) 6.1.1 基本元数据 (3) 6.1.2 扩展元数据 (3) 6.1.3 元数据要求 (3) 6.2 电子证照照面内容 (3) 6.2.1 电子证照模版 (4) 6.2.2 电子证照照面信息 (4) 6.3 签发单位电子印章 (4)

6.4 数字签名 (4) 7 电子证照文件封装 (4) 7.1 封装内容 (4) 7.2 封装方法 (4) 7.3 逻辑结构 (4) 附录A(资料性附录)电子证照目录信息 (5) 附录B(规范性附录)照面信息元数据字典XML结构 (6) 附录C(规范性附录)颁证单位/持证者代码类型编码 (11) 附录D(规范性附录)基本元数据的信息结构.. 12附录E(规范性附录)扩展元数据的信息结构.. 13附录F(规范性附录)电子证照XML数据文件.. 14

前言 本标准按GB/T 1.1-2009《标准化工作导则第1部分:标准的结构和编写》给出的规则起草。 本标准由福建省数字福建建设领导小组办公室提出。 本标准由福建省信息化标准化技术委员会归口。 本标准起草单位:福建省空间信息工程研究中心、福建省数字福建建设领导小组办公室、福建省经济信息中心、福建凯特信息安全技术有限公司。 本标准主要起草人:朱勤东、郑彦翎、李鹏伟、涂平、林丽、郑剑平。

CELTS-42基础教育教学资源元数据规范1

基础教育教学资源元数据应用规范 (CELTS-41) 教 育信息化技术标准 CELTS-42 基础教育教学资源元数据规范 CELTS-42 CD1.6 教育部教育信息化技术标准委员会 发布

目录 1 概述 (2) 1.1 目的 (2) 1.2 范围 (2) 2 规范性引用文件 (2) 3 术语定义与缩略语 (3) 3.1 本应用规范使用的基础术语 (3) 3.2 缩略语 (5) 4 元数据元素属性定义 (6) 4.1 元数据元素的属性描述 (6) 4.2 数据元素定义的规定 (7) 5 元数据结构 (7) 5.1 元数据的基本结构 (7) 5.2 元数据元素及定义 (7) 6 限定词汇与编目词汇表 (11) 6.1 限定词汇 (11) 6.2 本规范的限定词与编目方式定义 (14) 6.3 受控词汇和编目方案 (22) 6.4 一致性 (29) 7 参考文献 (31) 附录 A 供参考的部分教育学科课程分类第三级词汇表(课程内容) (33) A.1 语文课程内容分类 (33) A.2 数学课程内容分类 (34) A.3 英语课程内容分类 (37) A.4 地理课程内容分类 (38) A.5 历史课程内容分类 (39) A.6 化学课程内容分类 (40) A.7 物理课程内容分类 (43) A.8 生物课程内容分类 (48) A.9 信息技术课程内容分类 (49) A.10 音乐课程内容分类 (50) A.11 美术课程内容分类 (50)

CELTS-42基础教育教学资源元数据规范 1 概述 1.1 目的 本规范提供一个面向基础教育的教学资源数据模型。制定本规范旨在对希望在学校、企业、其他机构和个人的教学资源中使用元数据的用户提供一套资源编目准则,以使读者能快速、有效地在国家基础教育资源库及门户网站中检索到所需的教学资源,广泛地实现资源共享。 1.2 范围 本规范在《CELTS-3学习对象元数据:信息模型规范》(以下简称《学习对象元数据规范》)的基础上,结合我国基础教育的实际,定义了一组面向基础教育的教学资源元数据元素。 本规范依照教育部颁布的《义务教育课程设置实验方案》、《义务教育各学科课程标准(实验稿)》以及《学习对象元数据规范》,同时参考《都柏林核心集元数据(DCMES)》、《中国图书馆图书分类法》、美国GEM项目及澳大利亚EdNA项目的词汇分类方法,定义了一组用于元数据元素编目的受控词汇及相应的词汇表。 本规范通过与《学习对象元数据规范》的元素间映射来实现与CELTS的一致性。 本规范包括﹕ ?概述 ?规范性引用文件 ?术语定义与缩略语 ?元数据元素属性定义 ?元数据结构 ?限定词汇及编目词汇表 ?一致性 ?参考文献 2 规范性引用文件 下列文件中的条款通过本规范的引用而成为本应用规范的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本应用规范。然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本应用规范。 ?ISO 639:规定人类语言表示方法的国际标准。 ?ISO 646:规定ASCII字符集的国际标准。 ?ISO 8601:规定日期和时间表示方法的国际标准。 ?ISO 3166:规定国家名称表示方法的国际标准。

元数据管理平台

元数据管理平台 技术白皮书 北京亿信华辰软件责任有限公司 2018年4月

目录 1.前言 (1) 1.1.关于本白皮书 (1) 1.2.背景介绍 (1) 1.3.产品定位 (1) 2.产品架构 (2) 2.1.概述 (2) 2.2.数据源层 (2) 2.3.采集层 (2) 2.4.数据层 (3) 2.5.功能层 (3) 2.6.访问层 (3) 3.产品功能特色 (4) 3.1.规范的元模型管理 (4) 3.2.端到端的自动化采集 (5) 3.3.全面的采集适配器 (5) 3.4.可灵活定制的采集模板 (6) 3.5.便捷的元数据检索 (7) 3.6.完善的元数据管理 (7) 3.7.强大的元数据版本管理 (8) 3.8.实时的元数据变更监控 (8) 3.9.数据地图鸟瞰全局 (9) 3.10.丰富的元数据分析应用 (9) 3.10.1.血缘分析 (9) 3.10.2.影响分析 (10) 3.10.3.全链分析 (10) 3.10.4.关联度分析 (11) 3.10.5.属性差异分析 (11) 3.11.出色的元数据检核机制 (12) 3.11.1.一致性检核 (12) 3.11.2.属性填充率检核 (12) 3.11.3.组合关系检核 (12) 3.12.自助式门户 (13) 3.13.丰富的服务接口 (13) 4.产品技术优势 (13)

4.1.系统设计原则 (13) 4.1.1.先进性 (14) 4.1.2.可维护性 (14) 4.1.3.可靠性 (14) 4.1.4.易用性 (15) 4.1.5.安全性 (15) 4.1.6.扩展性 (15) 4.2.可扩展采集适配器设计 (16) 4.3.采用MOF规范 (16) 4.4.支持基于XMI的数据交换 (17) 4.5.运用REST FUL架构 (18) 5.软硬软件环境 (19) 5.1.服务器配置推荐 (19) 5.2.客户端配置 (20) 5.2.1.客户端(建议配置) (20) 5.2.2.客户端浏览器 (20)

元数据的标准

元数据的标准 1、数字图书馆资源组织框架 2. 元数据开发应用框架 元数据的基本意义Metadata(元数据)是“关于数据的数据”; 元数据为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具;元数据为分布的、由多种数字化资源有机构成的信息体系(如数字图书馆)提供整合的工具与纽带。 离开元数据的数字图书馆将是一盘散沙,将无法提供有效的检索和处理。 3. 元数据应用环境 3.1 Metadata的应用目的 (1)确认和检索(Discovery andentification),主要致力于如何帮助人们检索和确认所需要的资源,数据元素往往限于作者、标题、主题、位置等简单信息,Dublin Core是其典型代表。(2)著录描述(Cataloging),用于对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体、位置与获取方式、制作与利用方法、甚至相关数据单元方面等,数据元素数量往往较多,MARC、GILS和FGDC/CSDGM是这类Metadata的典型代表。 (3)资源管理(Resource Administration),支持资源的存储和使用管理,数据元素除比较全面的著录描述信息外,还往往包括权利管理(Rights/Privacy Management)、电子签名(Digital Signature)、资源评鉴(Seal of Approval/Rating)、使用管理(Access Management)、支付审计(Payment and Accounting)等方面的信息。 (4)资源保护与长期保存(Preservation and Archiving),支持对资源进行长期保存,数据元素除对资源进行描述和确认外,往往包括详细的格式信息、制作信息、保护条件、转换方式(Migration Methods)、保存责任等内容。 3.2 Metadata在不同领域的应用根据不同领域的数据特点和应用需要,90年代以来,许多Metadata格式在各个不同领域出现 例如: 网络资源:Dublin Core、IAFA Template、CDF、Web Collections 文献资料:MARC(with 856 Field),Dublic Core 人文科学:TEI Header 社会科学数据集:ICPSR SGML Codebook 博物馆与艺术作品:CIMI、CDWA、RLG REACH Element Set、VRA Core 政府信息:GILS 地理空间信息:FGDC/CSDGM 数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images 档案库与资源集合:EAD 技术报告:RFC 1807 连续图像:MPEG-7 3.3 Metadata格式的应用程度 不同领域的Metadata处于不同的标准化阶段: 在网络资源描述方面,Dublin Core经过多年国际性努力,已经成为一个广为接受和应用的事实标准;在政府信息方面,由于美国政府大力推动和有关法律、标准的实行,GILS已经

4电子文件通用元数据规范

电子文件元数据标准 (征求意见稿) 1.范围 本标准适用于各级机关、团体、企事业单位、社会组织。本标准规定了电子文件元数据的结构、定义、编码体系。 本标准描述的数字对象为通用的电子文件核心元数据,主要为原生电子文件与数字化文件(文本、图像)元数据。根据发展需要,扩展编制图形、影像、声音等文件类型的元数据标准。 2.编制目的 2.1 对文件及相关实体进行标准化描述; 2.2 实现不同机构、不同系统之间文件及信息的互操作; 2.3 为电子文件在不同时间、不同空间、不同应用软件中的再利用提供统一的元数据; 2.4 为电子政务、办公自动化、电子文件中心、文档管理、档案管理等系统提供成熟的电子文件全过程管理的设计模式。 3.规范性引用文件 下列文件中的条款,通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 2659-2000 世界各国和地区名称代码 GB/T 2260-2002 中华人民共和国行政区划代码 GB/T 11714-1997 全国组织机构代码编制规则 GB/T 9704-1999 国家行政机关代码编制规则 GB 2312-1980 信息交换用汉字编码字符集基本集 GB/T 4880-1991 语种名称代码 GB/T 4880.2-2000 语种名称代码第2部分:3字母代码 GB/T 4881-1985 中国语种代码 GB/T 3792.1-1983 文献著录总则 GB/T 13959-1992 文件格式与代码编制方法 GB/T 15418-1994 档案分类标引规则 GB/T 3760-1995 文献叙词标引规则 GB/T 9704-1999 国家行政机关公文格式 GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充 GB/T 18894-2002 电子文件归档与管理规范 GB/T 7156-2003 文献保密等级代码 GB/T 19667 基于XML电子公文格式规范 DA/T12-1994 全宗卷规范 DA/T13-1994 档号编制规则 DA/T18-1999 档案著录规则 DA/T 19-1999 档案主题标引规则 DA/T 22-2000 归档文件整理规则 DA/T 1-2000 档案工作基本术语

大亚湾核电站电子文档元数据著录研究

大亚湾核电站电子文档元数据著录研究 作者:廉旭姣 来源:《办公室业务(上半月)》 2019年第12期 文/生态环境部核与辐射安全中心廉旭姣 【摘要】元数据在核电站电子文档管理中占据着重要地位,电子文档元数据描述了电子文 档的内容、属性、背景和结构等信息,较全面地反映描述对象的全过程,便于电子文档的检索、存取、利用以及信息共享等。大亚湾核电站电子文档的元数据,能够较好地解决电子文件的真 实性、完整性和长期可用性,提升电子文档管理和开发利用的效率,是实现电子文档凭证价值 和参考价值的重要工具。 【关键词】电子文档;元数据;著录 大亚湾核电站的文档管理贯穿于核电生产活动中的各个方面,根据HAF040《核电厂质量保 证安全规定》的要求,必须按照书面程序和指令建立和执行有关质量保证记录的产生、鉴别、 收集、标引、立卷、存放和处理的制度,必须在质量保证大纲实施过程中编写质量保证记录, 以证实核电厂已经按照特定要求完成影响质量的各项活动。为此,大亚湾核电站制定出了严格 的文档管理体系,具体的工作大致分为文档控制、文档管理和文档服务,从文件的产生、生效、分发、使用、记录报告的收集等各个环节进行了文件控制管理。为了有效地运作文件管理体系,依据《核电电子文件元数据》NB/T20418-2017的要求,分析大亚湾核电站文档管理元数据著录 的规范。 一、元数据标准体系 元数据标准体系由元数据标准框架、根据元数据标准框架扩展出来的专门元数据标准以及 对应的元数据标准管理系统和元数据著录系统构成。其中,元数据标准框架又由核心元数据标 准和它的扩展原则构成。它们之间的相互关系如图所示。 二、元数据元素定义方法 元数据表中各个元素都用13个属性进行描述:1.编号:按一定规则排列的元数据的顺序号。 2.中文名称:元数据元素的中文标识。 3.英文名称:元数据元素的英文标识。 4.定义:元数据 元素含义的描述。元数据的一般定义是关于数据的数据(data?about?data)。详细来讲,元数据是指提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描述。其作用是 描述信息资源或数据本身的特征和属性,规定数字化组织,具有定位、发现、证明、评估、选 择等功能。标识信息是指:根据文档的来源信息,为科学、有序地管理文件及档案而赋予文档

元数据管理

1.前言 数据仓库中的数据是从许多业务处理系统中抽取、转换而来,对于这样一个复杂的企业数据环境,如何以安全、高效的方式来对它们进行管理和访问就变得尤为重要。解决这一问题的关键是对元数据进行科学有效的管理。元数据是关于数据、操纵数据的进程和应用程序的结构和意义的描述信息,其主要目标是提供数据资源的全面指南。元数据不仅定义了数据仓库中数据的模式、来源以及抽取和转换规则等,而且整个数据仓库系统的运行都是基于元数据的,是元数据把数据仓库系统中的各个松散的组件联系起来,组成了一个有机的整体。2.元数据 2.1 元数据的概念 按照传统的定义,元数据(Metadata)是关于数据的数据。在数据仓库系统中,元数据可以帮助数据仓库管理员和数据仓库的开发人员非常方便地找到他们所关心的数据;元数据是描述数据仓库内数据的结构和建立方法的数据,可将其按用途的不同分为两类:技术元数据(Technical Metadata)和业务元数据(Business Metadata)。 技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据。

业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。业务元数据主要包括以下信息:使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数据的来源;系统所提供的分析方法以及公式和报表的信息。 2.2 元数据的作用 在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:(1)描述哪些数据在数据仓库中;(2)定义要进入数据仓库中的数据和从数据仓库中产生的数据;(3)记录根据业务事件发生而随之进行的数据抽取工作时间安排;(4)记录并检测系统数据一致性的要求和执行情况;(5)衡量数据质量。 与其说数据仓库是软件开发项目,还不如说是系统集成项目[1],因为它的主要工作是把所需的数据仓库工具集成在一起,完成数据的抽取、转换和加载,OLAP分析和数据挖掘等。 3.数据仓库元数据管理现状 元数据管理的主要任务有两个方面:一是负责存储和维护元数据库中的元数据;二是负责数据仓库建模工具、数据获取工具、前端工具等之间的消息传递,协调各模

电子文件元数据自动采集的原则与实施路径研究

电子文件元数据自动采集的原则与实施路径研究 摘要:本文通过理论研究与实证分析,进一步论证了元数据是电子文件管理的命脉,是电子文件真实性、可靠性、完整性与可用性的重要保障,是对电子文件实施前端控制和全程管理的关键,是实现自动化管理和智能分析的重要基础;同时展示了对《文书类电子文件元数据方案》的实施与拓展,对元数据实现自动采集的需求分析、原则与思路以及具有可操作性的研究成果。 关键词:电子文件元数据自动采集 本文系“电子文件元数据自动采集与智能分析实证研究”的项目成果。通过探讨理论架构并系统实施电子文件元数据自动采集,实现标准化、自动化管理,全面提升机构电子文件管理水平,同时为电子文件内容信息智能分析奠定基础;通过智能分析研究,充分挖掘隐含在电子文件内容信息中的知识关联,深度开发,支持决策。 一、元数据自动采集需求分析 元数据是描述文件背景、内容、结构及其整个管理过程的数据。不同于传统意义上的著录,元数据内涵更丰富,功能更全面,要求更严格,不可能由档案管理人员在文件归档后进行著录,更不可能由形成机构文件管理人员或业务人员手工录入。元数据需要全程规划,需要嵌入系统,需要实时自动采集,需要真实、动态地再现电子文件管理的背景信息及过程信息。实现元数据自动采集,是元数据自身管理的要求,也是形成机构实际业务的需求。 (1)元数据管理要求 国际标准《信息与文献电子办公环境中文件管理原则与功能要求》(ISO 16175 1-3)一再强调,文件管理元数据(metadata)包括“识别、认证文件和文件背景关联等信息以及生成、管理、维护和使用文件的人员、流程和系统的信息,文件管理政策”。只有伴有界定了关键特征元数据的文件才是真实有效的文件,这些特征必须被清晰地记录下来。元数据在文件捕获点上对文件进行详细说明,固化文件与其业务背景的关联,对文件实施管理控制。在整个生命周期中,新的元数据不断伴随业务的开展、提供利用而持续增加,以长期保证真实性、完整性、可靠性、可用性,使得对文件的管理成为可能。 在电子文件管理系统中必须实现元数据的有效管理。电子文件管理系统(ERMS)作为专门用于对文件的维护和处置予以管理的系统,具有如下属性:在背景中生成文件;管理和维护文件;依据要求的时间长度维护文件;文件管理元数据要可以设定。

2018年系统元数据管理系统分析

2018年系统元数据管理系统分析 1. 现状分析 随着经营分析系统规模不断扩大,系统所积累数据量也越来越大,收集到的海量数据背后隐藏着大量珍贵重要的信息,但也同时提高了系统的数据管理难度:一方面难以对这些数据进行有效解释,缺乏对业务流程执行的实时监控和管理;另一方面各部门数据与数据整合的难度也不断加大,影响到了经营分析系统中的数据质量。 如何对现有数据进行深层发掘,并揭示出埋藏在元数据中的趋势、因果关系、关联模式等核心信息?这是下一步深化经营分析系统应用的电信运营商需要解决的头等大事。构建BI,首先要保证的是数据质量。元数据管理解决的问题就是如何把业务系统中的数据分门别类地进行管理,并建立数据与数据之间的关系,为数据仓库的数据质量监控提供基础素材。 1.1 目前的困境 使用者(决策层、业务分析人员): 1) 经营分析系统中存在有很多报表,不同报表中存在一些相同的指标,这些指标往往不一致,给业务分析和决策工作造成很多困惑,必须花费很大的精力去检查核实。 2) 对于很多指标,不清楚其具体含义,不清楚其反映的问题,不清楚其具体算法和来龙去脉。

数据仓库项目开发维护者: 1) 不同报表中的同一指标不一致,必须花费很大的精力去检查,目前基本上是通过手工检查表和存储过程的方式,效率较低。 2) 没有完善的开发、维护规范。比如,新增一张分析报表,开发人员根据业务人员的需求制作完成之后,往往没有整理完善相应的数据指标解释和元数据管理,造成日后检查困难。 3) 开发、维护规范的执行力较低,没有行之有效的管控手段。不严格按照规范执行,随着项目的发展和时间的推移,导致数据仓库项目的健壮性和可维护性呈几何级数下降,给数据仓库的建设带来大量的重复工作。 1.2 什么是元数据管理 元数据最本质,最抽象的定义为:data about data (关于数据的数据)。而对于经营分析数据仓库而言,形象的定义为:元数据就是数据仓库的规范。这些规范包括对各种指标的定义、解释;包括对各表中数据的来龙去脉、数据的大小和格式的定义。 元数据管理,就是要建立一套行之有效的规范以及该规范的管控体系,实现从管理到查询到综合分析的全面管控,管理层次从接口到ETL处理、业务逻辑处理、结果展现处理和指标分析的方方面面,构成数据仓库应用系统的核心和基础。做到开发者能严格遵守规范,维护者和使用者有规范可查,有力的保障数据仓库项目的健壮性和可维护性。

元数据管理方案

元数据管理方案 1.1元数据抽取 为了简化元数据生成工作,系统提供自动生成元数据的功能,即元数据抽取。通过元数据自动抽取,用户可以方便、快捷地获得大量的元数据信息。 1.1.1抽取的对象 元数据抽取主要针对的对象有以下几种: 已有目录:已建业务应用系统中现有的目录资源。 数据库:各种数据库资源,包括关系型数据库、XML数据库等。 格式化电子文件:电子文件,例如Word、PDF、XLS等文件。 1.1.2元数据抽取的流程 元数据抽取的流程有4个主要步骤,分别为: 数据源信息获取:解决要从哪个数据源获得元数据的问题。 内容/结构分析:解决要从数据源中获得哪些元数据的问题。 元数据提取:解决如何从数据源中获取元数据的问题。 存储入库:解决元数据存储的问题。 1.1.3电子文档的元数据抽取 对于电子文档,首先各部门的文档格式不尽相同,另外它们的安全级别也各不相同,同时由于信息化建设水平的不一致,有的部门文档分散在各处,有的部门文档是集中存放的,甚至已经建立了完善的电子系统进行管理。 针对以上状况,对于电子文档的元数据抽取需要进行以下的抽取流程: 整理归档 对于分散在各处的电子文档(纸质文档需要先进行电子化处理),必须由专人进行统

一整理,根据公开共享的前提进行集中,这种集中可以是物理上集中的,也可以是逻辑上集中的。但要满足以下原则,第一根据安全级别,便于外界访问;第二便于文档的增量发布;第三便于采集工具的自动化采集编目。各部门只有在文档完全整理归档的情况下,进行自动化采集才是切实可行的。在整理归档的时候,各部门根据各自情况进行归档,没有必要千篇一律,也没有必要制定繁琐和呆板的规则,只要能够满足以上的原则即可。 ●根据安全级别,建立相应的访问机制 由于受到安全级别的限制,所以对于需要共享的数据要进行安全方面的限制,限制的手段可以有:用户名/密码、数字证书、物理隔断等等,根据实际情况建立安全访问机制,做到重要信息不泄露,不丢失。 ●编目处理 现阶段,主流格式的电子文档,主要包含:word、excel、ppt、pdf等。对主流格式的电子文档,要提供自动采集工具进行编目处理。采集的范围主要是文档的标题和内容,对于其它的元数据内容,要提供手工配置的方式进行辅助。另外,在工具的采集效率上,要提高增量文档发布后的采集效率。 对于格式特殊、内容有加密算法的文档,是很难通过抓取工具进行采集的,这些文档主要通过手工编目的方式来处理。 对于存在管理库的文档,就需要对数据库来进行编目采集,详见数据库元数据抽取部分。 ●保存元数据 采集后的数据要放到数据库或者保存到硬盘上,另外要根据目录体系标准,把数据分解为元数据,然后进行存储 1.1.4数据库元数据抽取 数据中心需要抽取的数据库类型主要为Sql server,首先利用ETL工具从源数据库中将所需数据抽取至中心数据库基础业务库中,在利用元数据著录工具对抽取出来的数据进行元数据著录。

《元数据的作用 [元数据的构成方式]》

《元数据的作用[元数据的构成方式]》 (徐枫宦茂盛)通过元数据的描述,能够使信息资源的使用者了解数据的内容、特征、作用、获取方式等信息。元数据是关于数据的数据,在建立信息资源目录体系的过程中,元数据主要是对信息资源从外部特征进行而非从内部结构进行描述。通俗地讲,元数据就是信息资源的标签或卡片,通过元数据的描述,可以使信息资源的使用者能够了解数据的内容、特征、作用、获取方式等信息,能够对信息资源是否满足特定的应用需求做出适当的评价,并根据评价的结果决定是否采取进一步的措施来获取该信息资源。 元数据是信息资源目录体系建立的基础,构建一个信息资源目录体系首要和基础性的工作就是建立描述各个信息资源的元数据库,元数据库中存储的是描述各种来源、各种类型的信息资源的描述信息。无论用户以何种方式查询信息资源目录,包括以分类目录的形式进行查询、或者以多关键词的形式进行查询,其本质都是对后台元数据库的检索,只是从表现层提供了不同形式的人机查询接口。根据所描述的信息资源对象的不同,可以建立不同的元数据库,分别对各类信息资源进行描述。 元数据的组成 为能够对信息资源进行准确和高效的描述,元数据本身具有自身的逻辑结构。一般来说,元数据本身是层次化、树状结构的。处于树状结构最底端的叶子节点称之为元数据元素,包含了元数据元素的节点称之为元数据实体,当然元数据实体也可以只包含元数据实体。根

据实际需求,元数据实体或者元数据元素可以多次出现。例如,信息资源可以有不同的分类,可以按照信息资源的来源进行分类,也可以按照信息资源的不同应用主题进行分类,因此,“信息资源分类”元数据实体就可以出现多次。 元数据一般分三个方面对信息资源进行描述。 一是对信息资源基本内容的描述。包括信息资源的标题、摘要、关键词等基本信息。标题是信息资源的名称,通过标题使用者能够初步掌握信息资源的基本范围。其次,使用者可以通过摘要,了解信息资源的主要内容、用途等各种信息。一般情况下,用户主要通过摘要作为信息资源适用性评价的主要依据。所以,在信息资源元数据的著录过程中,摘要的填写一般都由专业人员完成,只有专业人员才能够对信息资源的内容有准确的把握和深入的理解,能够提供有关信息资源内容的更加权威的解释。根据信息资源对象的不同,描述信息资源基本内容的元数据实体和元数据元素还可以进行有选择的增加。例如,描述空间信息资源时,可以增加空间参照系、图示表达等元数据实体,描述科学数据资源时需要增加数据质量等元数据实体。 二是对信息资源的获取方式进行描述。包括信息资源的分发者信息、信息资源的在线获取地址信息等。通过提供分发者联系信息,使用者可以直接联系信息资源的分发部门,这对于不能直接在网络上进行数据交换的信息资源获取非常有效。其次,使用者还可以通过信息资源的在线地址来下载、查询、浏览信息资源。使用者甚至可以提供专门的电子订单处理系统,并将入口信息加入到元数据内容中,方便

数据仓库中元数据的管理

数据仓库中元数据的管理M etadata M anagem en t i n a Data W arehouse 同济大学计算机科学与工程系(上海200092) 史金红 吴永明 【摘要】 介绍了数据仓库中四种基本类型的元数据,说明了不同类型元数据的收集和维护方法,并着重对分布式元数据的集成和管理进行了详细的阐述。 关键词:数据仓库,数据商场,决策支持,元数据 【Abstract】 T h is p ap er in troduces fou r typ es of m etadata and the m ethods of co llecting and m ain tain ing them.It focu ses on the m etadata m anagem en t and in tegrity. Key words: da ta warehouse,da ta mart, dec ision support,m etada ta 1 引言 随着社会的发展和计算机技术的进步,人们已不满足于用计算机只作简单的数据处理和事务处理。进一步用现有的数据进行分析和推理,从而为决策提供依据的需求导致了决策支持系统(D SS)的出现。90年代以来计算机技术、网络技术和数据库技术的迅速发展为D SS提供了必要的技术环境, OL T P和办公自动化普遍应用积累的大量数据为D SS提供了必要的数据基础,日趋激烈的市场竞争促进了各级管理和决策人员对D SS的实际需求,因此自从1991年W.H.Inm on提出数据仓库的概念和1993年E.F.Codd提出OLA P概念以来,已有许多商品化的数据仓库管理系统和联机分析处理工具软件面市。以上诸因素的共同作用促成许多公司、机构纷纷为提高自己的竞争能力建立数据仓库系统以进行决策支持。 元数据是成功的数据仓库的重要组成部分,它可以帮助数据仓库项目小组明确而全面地理解潜在数据源的物理布局以及所有数据元的业务定义,帮助数据仓库用户有效地使用仓库中的信息,帮助数据库管理员了解某些表的变化将对数据仓库产生怎样的影响以及不同商业过程对应的应用等等。项目小组在开发过程中应当识别元数据并将它收入到元数据商店中,实施适当的过程捕作企业数据结构和应用的变化,从而修改相应的元数据,并向用户提供适当的工具访问元数据。 2 元数据的基本类型 元数据按照其用户可以分为技术元数据和商业元数据。技术元数据提供给数据仓库的技术人员,数据仓库技术人员在仓库的开发和维护中使用这类元数据。商业元数据是商业用户在仓库中寻找他们所需商业信息的一个辅助。但是,技术人员可能也需要访问几种类型的商业元数据,如和商业用户讨论信息需求和建立企业的数据模型。同样,商业用户也需要尝试高水平的技术元数据。 元数据按其内容可以分为四个基本类型: 1)关于数据仓库潜在数据来源的信息,包括现有的业务系统、可得到的外部数据和目前手工维护的信息。例如,一个组织可以从中识别数据来源的潜在仓库数据源有:几个现有的应用程序,由财务部门保存的基于PC机的电子报表,从某一卖主处购买的销售数据,目前由顾客服务部门在纸上保存的顾客联系记录。 2)关于数据模型的信息,包括业务实体、关系、企业规则和企业数据模型。 3)关于业务数据与仓库数据结构间的映射信息。只要那些来源中的一个数据元与仓库建立了映射关系,就应该记录下这些数据元间的逻辑联系以及发生的任何变换或变动。 4)关于数据仓库中信息的使用情况。了解这类信息对更好地调整仓库性能、更多地利用现有查询以及理解仓库中的信息怎样用于解决企业问题是很重要的。 3 元数据的收集和维护 在适当的时间收集适当的元数据是成功实施元数据驱动的数据仓库的基础。为保证较高的准确

CJJT 187-2012 建设电子档案元数据标准

刖B 根据住房和城乡建设部《关于印发〈2008年工程建设标准规范制订、修订计划(第一批)〉的通知》(建标[2008]102号)的要求,标准编制组经过深入的调查研究,认真分析总结国内外科研成果,结合实践经验,并在广泛征求意见的基础上,编制本标准。 本标准的主要技术内容是:1.总则;2.术语;3.基本规定;4.元数据内容;5.元数据扩展;6.元数据管理。 本标准由住房和城乡建设部负责管理,由住房和城乡建设部城建档案工作办公室负责具体技术内容的解释。执行过程中如有意见或建议,请寄送住房和城乡建设部城建档案工作办公室(地址:北京市海淀区三里河路9号,邮政编码:100835)0本标准主编单位:住房和城乡建设部城建档案工作办 公室 珠海市城市建设档案馆 本标准参编单位:深圳市世纪伟图科技开发有限公司 珠海市建设工程质量监督检测站 南京市城市建设档案馆 大连市城市建设档案馆 上海市城市建设档案馆 本标准主要起草人员:蒋仕鹊姜中桥李琦张志敏 周健民黄春晓陈澈沆崔丽梅 王策高雅刘静 本标准主要审查人员:王毅刘越男刘家真潘世萍 冯丽伟蔡学美张斌秦屹梅 权进立李宗波赵淑芳 4

目次 1总则 (1) 2术语 (2) 3基本规定 (4) 4元数据内容 (6) 4.1元数据元素集 (6) 4.2文件实体 (6) 4.3业务实体 (18) 4.4责任者实体 (23) 4.5关系实体 (29) 5元数据扩展 (32) 6元数据管理 (33) 附录A元数据元素表 (34) 本标准用词说明 (37) 引用标准名录 (38) 5

Contents 1General Provisions (1) 2Terms (2) 3Basic Requirements (4) 4Contents of Metadata (6) 4.1Element Set of Metadata (6) 4.2Record Entity (6) 4.3Business Entity (18) 4.4Agent Entity (23) 4.5Relationship Entity (29) 5Extension of Metadata (32) 6Management of Metadata (33) Appendix A Form of Metadata Elements (34) Explanation of Wording in This Standard (37) List of Quoted Standards (38) 6

元数据的概念

元数据的概念 元数据(Metadata),即关于数据的数据,是对数据和信息资源进行描述的信息。通常认为,元数据是为了更为有效地管理和使用数据而对它进行说明的信息。所以元数据与其描述的数据内容有着密切联系,不同领域的数据的元数据在内容 上差异很大。地理空间数据的元数据是地理空间的空间数据和属性数据以外的描述地理信息空间数据集的内容、质量、状态和其它特性的一类数据,它是实现地理空间信息共享的核心标准之一。其中,对空间数据某一特征的描述,称为一个空间元数据元素。空间元数据是一个由若干复杂或简单的元数据项组成的集合。它与非空间元数据的主要区别在于其内容中包含大量与空间位置有关的描述性信息。 研究元数据的作用和意义 元数据可用来帮助数据提供者和数据使用者解决数据转换、沟通和理解的问题。归纳起来,元数据主要有下列几个方面的作用: 1)、用来组织、管理和维护空间数据,建立数据文档,并保证即使其主要工作人员退休或调离时,也不会失去对数据情况的了解 2)、提供数据存储、数据分类、数据内容、数据质量及数据分发等方面的信息,帮助数据使用者查询检索所需地理空间数据 3)、用来建立空间信息的数据目录和数据交换中心,提供通过网络对数据进行查询检索的方法或途径,以及与数据交换和传输有关的辅助信息 4)、通过空间元数据,人们可以接受并理解空间信息,帮助数据使用者了解数据, 以便就数据是否能满足其需求作出正确的判断并与自己的空间信息集成在一起,进行不同方面的科学分析和决策。 元数据是使数据充分发挥作用的重要条件之一。它可以用于许多方面,包括数据文档建立、数据发布、数据浏览、数据转换等。元数据对于促进数据的管理、使用和共享均有重要的作用。元数据对于建立空间数据交换网络是十分重要的,往往网络中心通过设在中心的元数据库可以实时地连接各个分发数据的分节点元数据库,帮助潜在的用户找到其特定应用所需要的数据,实现数据共享。 一个完整的元数据系统通常包括三部分,即元数据标准、元数据管理工具和元数据库。不同的元数据库可能采用不同的管理工具,唯一能够在不同数据管理软件间交换元数据的途径是统一元数据标准,只有在统一的标准前提下,才能跨越操作系统平台和数据库软件平台进行数据的互操作,实现数据共享。 DIF 元数据标准

相关文档
最新文档