元数据标准

元数据标准
元数据标准

电子文件元数据标准

(征求意见稿)

1.范围

本标准适用于各级机关、团体、企事业单位、社会组织。本标准规定了电子文件元数据的结构、定义、编码体系。

本标准描述的数字对象为通用的电子文件核心元数据,主要为原生电子文件与数字化文件(文本、图像)元数据。根据发展需要,扩展编制图形、影像、声音等文件类型的元数据标准。

2.编制目的

2.1 对文件及相关实体进行标准化描述;

2.2 实现不同机构、不同系统之间文件及信息的互操作;

2.3 为电子文件在不同时间、不同空间、不同应用软件中的再利用提供统一的元数据;

2.4 为电子政务、办公自动化、电子文件中心、文档管理、档案管理等系统提供成熟的电子文件全过程管理的设计模式。

3.规范性引用文件

下列文件中的条款,通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。

GB/T 2659-2000 世界各国和地区名称代码

GB/T 2260-2002 中华人民共和国行政区划代码

GB/T 11714-1997 全国组织机构代码编制规则

GB/T 9704-1999 国家行政机关代码编制规则

GB 2312-1980 信息交换用汉字编码字符集基本集

GB/T 4880-1991 语种名称代码

GB/T 4880.2-2000 语种名称代码第2部分:3字母代码

GB/T 4881-1985 中国语种代码

GB/T 3792.1-1983 文献著录总则

GB/T 13959-1992 文件格式与代码编制方法

GB/T 15418-1994 档案分类标引规则

GB/T 3760-1995 文献叙词标引规则

GB/T 9704-1999 国家行政机关公文格式

GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充

GB/T 18894-2002 电子文件归档与管理规范

GB/T 7156-2003 文献保密等级代码

GB/T 19667 基于XML电子公文格式规范

DA/T12-1994 全宗卷规范

DA/T13-1994 档号编制规则

DA/T18-1999 档案著录规则

DA/T 19-1999 档案主题标引规则

DA/T 22-2000 归档文件整理规则

DA/T 1-2000 档案工作基本术语

中办发[1996]14号中国共产党机关公文处理条例

国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知

国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知

ISO15489 信息与文件—文件管理

ISO23081-1 信息与文献—文件管理流程—文件元数据-总则

ISO23081-2 信息与文献—文件管理流程—文件元数据-概念与实施问题

ISO14721 空间数据和传输系统—开放档案信息系统—参考模型

ISO11179 信息技术--元数据元素的规范与标准化

ISAD(G)档案著录规则(总则)

W3C Namespaces in XML XML的命名空间(Namespaces)

4.术语与定义

下列术语和定义适用于本标准。

4.1通用术语

4.1.1业务系统Business system

将硬件、软件、信息或服务、政策、程序、人有机地组合在一起,实现对机构业务信息的保存、整理和提供。如:电子政务系统、办公自动化系统等。

4.1.2电子文件管理系统 Electronic Records Manage System (ERMS)

为了满足业务对电子文件管理需要而设计的系统,用以捕获、保存、提供获取业务处理过程中产生的有证据价值的文件的功能。电子文件管理系统包括:档案工作者和文件使用者;授权政策、责任分配、权力授予、程序和做法;政策声明、程序手册、用户指南和其他用以批准和颁布政策的文件、程序和做法;文件本身;控制和记录的专门资料和文件系统;软件、硬件、其它设备、必要工具等。

4.1.3实体Entity

指过去、现在和将来存在的任何具体或抽象的事物以及它们之间的联系。比如:人、物体、事件、想法、过程等等。

4.1.4文件实体Record entity

在处理公务或事务过程中,由团体或个人形成或接收和保存的任何形式或载体的记录信息。可以是单份文件,也可以是文件的集合。

4.1.5责任者实体Agent entity

对文件的信息内容负有责任的个人或团体。

4.1.6业务实体Business entity

指业务过程中对文件进行处理与管理的一系列活动。

4.1.7关系实体Relationship entity

描述文件、责任者、业务等实体自身、相互关系及这种关系的背景信息实体。

4.1.8电子文件元数据Electronic Records Metadata

描述电子文件内容、背景和结构信息及整个管理流程的数据。

4.1.9元数据集Metadata schema

规定和描述标准元数据集元素以及元素间相互关系的框架。语句集为元数据元素提供正式的结构(句法)和语义(定义)。

4.1.10元数据结构Metadata structures

元数据集由一系列的元素组成,元素之间的相互关系形成了元数据的结构。元数据结构体现元数据扩展的方法与机制。元数据抽象模型的建立对其元素的扩展与整个元数据方案的规范具有参考作用。

4.1.11元数据语义Metadata Semantic

元数据的本质是描述对象的各种属性及相关关系等内容,每一个元素的语义明确定义了其含义、内涵与外延。语义定义是一个元数据规范的基本要素,也是元数据应用与元数据互操作的最重要的基础。

4.1.12元数据句法Metadata syntax

句法的问题即是一个形式化描述的问题,元数据集所有语义与结构及描述的内容以计算机可读或人可读的形式化方法描述出来。从标准、开放、互操作角度,采用标识语言对元数据集进行描述。本标准采用XML语言对元数据集进行描述。

4.1.13编码体系 Encoding Scheme

编码体系有助于对元素修饰词值的理解。这类体系包括控制词表及正规的符号或解读方式。值的表示采用来自控制词表的标记符号(如分类体系或主题词表的术语)或者具有特定含义,或以一定形式组成的字符串。

4.1.14信息总体 Information Package

电子文件与其元数据可以分开保存,也可以被封装在一起保存,后者称为电子文件信息总体。封装是指创建的一个由电子文件及其元数据组成的自我包含的实体。

信息总体便于对电子文件的独立理解,支持并长期保证电子文件的真实性、可靠性和完整性,同时提供电子文件与其形成背景之间的可靠而有意义的逻辑联系。

电子文件封装入信息总体,该文件可以存在于任何存储或操作环境中,因其包含了嵌入其中的有关开始和过程的所有细节,包括那些用于存取、传递和表述文件的细节。信息总体需要将元数据捕获的多个点包含进文件,因为文件的处理历史像其最初的捕获元数据一样至关重要。

本标准采用ISO14721《信息技术--元数据元素的规范与标准化》定义的封装技术,定义了信息总体的封装格式,包含维护真实性的技术机制。

信息总体封装格式(E ncapsulating Format for I nformation P ackage - EIP)见附录B。.

4.1.15信息总体固化 Fixity of Information Package

电子文件元数据与其文件一样,需要受真实性规则、规范或标准的控制,以保证电子文件具有可信性,这种控制称为元数据固化。本标准采用数字签名技术来进行信息总体的固化。

4.2数据模型概念

4.2.1属性Attribute

物体或实体的特征。

4.2.2类别Class:

对具有相同属性,操作,方法,关系和语义的对象集的描述。

4.2.3概念数据模型/概念模型Conceptual data model/conceptual model

通过数据模型对现实世界进行抽象地表达。

5.总则

电子文件形成、捕获、登记、分类、存储和保管、利用、跟踪、处置、传输、归档移交及长期保存等过程中都需记录在元数据中,并应保持连续、一致,以确保电子文件的真实性、完整性与有效性。为实现电子文件全过程管理与监控,电子文件及其元数据与结构稳定、定义良好的元数据标准相一致,特制定本标准。

本标准的制定遵循国际文件管理的系列标准规范: 按ISO15489《信息与文件—文件管理》规定的文件管理过程要求定义电子文件管理元数据,采用ISO/TS 23081《信息与文献—文件管理流程—文件元数据》定义的电子文件管理元数据概念模型、实体及关系模型;采用ISO14721《空间数据和传输系统—开放档案信息系统—参考模型》定义的信息包(SIP、AIP及DIP)数据模型,实现电子文件内容、背景、结构信息的封装,以确保在分散与集中管理过程中电子文件的真实性、完整性、有效性,确保电子文件在不同应用系统间的安全传输;采用ISO14721定义的数字信息长期保存模型,实现电子文件的长期保存与利用。

本标准支持元数据值的再利用、元数据元素的互操作及可扩展性和模块化。

元数据来源于机构文件处理方案、主题词表或关键词表、编码方案、电子政务系统、办公自动化系统、电子文件管理系统、档案管理系统、E-mail系统、网站。

6.元数据概念模型

文件管理业务系统的各个流程,需要通过元数据实现对文件或档案的管理。元数据最主要的用途之一是用来描述业务系统中实体。关键实体如下:

文件实体:文件本身,不管是单份文件还是文件集合体;

责任者实体:业务环境中的人或组织结构;

业务实体:业务办理。

根据元数据类型,可将元数据分为下列几类:关于文件自身的元数据、关于责任者的元数据、关于业务工作或过程的元数据、关于业务规章制度、政策以及法规的元数据、关于文件管理过程的元数据。

图1 主要实体及其相互关系

电子文件元数据模型的建立是以文件连续体理论为基础的。文件实体、责任者实体和业务活

动实体,是用元数据帮助确保文件真实性、完整性和有效性,实施档案化管理必须充分关注的要素。

文件作为交流、传递、贮存、利用信息的工具,其生成、处理、运转必然与文件责任者处理某项事务相关。对该事务的办理,形成文件的业务活动,构成了文件的来源

..。这种业务活动构成了文件的背景。

责任者作为文件的形成和处理者,为业务活动或事务处理活动的实施者。作为业务活动的主体,责任者与业务活动的推进息息相关,人们的业务活动自身也是划分为一定层次并且与相关文件群体(文件集合)的层次相对应。从微观到宏观区分为以下层次:1)事务处理:即处理每一件具体事务的业务活动,在这种业务活动中形成的文件一般情况下可以构成一个文件组合(案卷)。2)业务活动:即处理某种类型事务而进行的职能活动,有可能是由某个机构的一个职能部门进行;也可能该职能活动属于某个相对独立的业务活动项目,是其中的一个子项目。在这种职能活动中形成的文件,往往构成全宗内的一个类别(系列)。3)业务职能:即具有相对独立性的业务活动过程。其中以主体为核心的,是由一个立档单位进行的全部业务活动,在该项业务活动中形成的全部文件往往构成一个主体全宗;以客体为核心的相对独立而又具有相当规模的业务活动,则是围绕着该客体而跨立档单位进行的,所形成的文件一般情况下可以构成一个客体全宗。

人们进行的业务活动,同时也决定了文件所拥有的和将要拥有的各种有机联系。除了在处理

同一项业务活动过程中形成的所有文件相互之间

......的联系以外,还有:业务活动与文件的联系;业务活动承担者(即文件形成者和处理者)与文件的联系。它们是与文件的形成产生过程同步共生的。因此,(由业务活动承担者进行的)“业务活动”所诱发形成的“与文件有关的各种有机联系”是文件来源信息的重要组成部分,因而也是文件背景信息的重要组成部分。

7.电子文件元数据集(Metadata schema)

7.1电子文件元数据元素简表

7.1.1文件实体(Record Entity)

1.1 文件层级(Record Category)

1.2文件标识(Record Identifier)

1.3 文件题名(Record Title)

1.4文件分类(Record Classification)

1.5 文件主题(Record Subject)

1.6文件摘要(Record Abstract)

1.7文件日期(Record Date)

1.8文件语种(Record Language Type)

1.9文件种类(Record Form)

1.10文件覆盖范围(Record Coverage)

1.11文件技术环境(Record Technical Environment.)

1.12文件位置(Record Location)

1.13文件权限(Record Rights)

1.14文件处置(Record Disposal)

1.15文件管理历史(Record Management History)7.1.2责任者实体(Agent Entity)

2.1责任者层级(Agent Category)

2.2责任者标识(Agent Identifier)

2.3责任者描述(Agent Description)

2.4责任者权限(Agent Rights)

2.5责任者行为历史(Agent Activity History)

7.1.3业务实体(Function Entity)

3.1业务层级(Function Category)

3.2 业务标识(Function Identifier)

3.3 业务法规依据(Function Mandate)

3.4业务描述(Function Description)

3.5业务权限(Function Rights)

3.6业务处理过程(Function Event Identifie r)

7.1.4关系实体(Relation Entity)

4.1关系实体标识(Relation Entity Identifier)

4.2关系实体类型(Relation Entity Classification)

4.3相关实体标识(Identifier Of The Related Entity)

4.4相关实体类型(Type Of The Related Entity)

4.5关系定义(Relationship Definition)

4.6关系时间(Relationship Time)

7.1.5长期保存实体(Preservation Entity)

5.1签名信息(Signature Info)

5.2锁定签名信息(Lock Signature Info)

5.3编码(Encoding)

7.2电子文件元数据总体框架表

7.3电子文件元数据模块元素及应用层次对应表7.3.1文件实体(Record Entity)

7.3.2责任者实体(Agent Entity)

7.3.3业务实体(Function Entity)

7.3.4关系实体(Relation Entity)

7.3.5长期保存实体(Preservation Entity)

8.电子文件元数据元素定义方法

本标准对元数据的定义采用国际标准ISO11179-3:2003《信息技术--元数据元素的规范与标准化》和国际上元数据开发应用的最佳实践来完成。元数据元素的语义构成采用11个属性来描述:

9.电子文件元数据元素定义及描述9.1文件实体Record Entity

9.1.1文件层级Record Category

9.1.2文件标识Record Identifier

9.1.3文件题名Record Title

9.1.4文件分类Record Classification

9.1.5文件主题Record Subject

9.1.6

文件摘要Record Abstract

9.1.7文件日期Record Date

9.1.8文件语种Record LanguageType

9.1.9文件种类Record Form

9.1.10文件覆盖范围 Record Coverage

9.1.11文件技术环境 Record Technical Environment

9.1.12文件位置Record Location

相关文档
最新文档