卫生健康信息数据集元数据标准2023年

合集下载

卫生健康行业数据模型介绍V2

卫生健康行业数据模型介绍V2

HRA00.01.003
HR42.03.001 卫生事件发生地点
本人卫生事件发生地点
S AN..20
HHRRABH00R01B..0012.0.10100.10303 HR0H2RH.0R0202.10.0.200.002.00201 新生健儿康新性档生别案儿代标性码别识代符码 标标识识个新新人生生健儿儿康生生档理理案性性的别别唯的的一代代标码码识符
序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
5/13/2020 32
一级类目 A基本信息
B公共卫生
C医疗服务
二级类目 01儿童保健 02妇女保健
03疾病控制
04疾病管理
数据集标准名称 个人信息基本数据集 出生医学证明基本数据集 新生儿疾病筛查基本数据集 儿童健康体检基本数据集 体弱儿童管理基本数据集 婚前保健服务基本数据集 妇女病普查基本数据集 计划生育技术服务基本数据集 孕产期保健服务与高危管理基本数据集 产前筛查与诊断基本数据集 出生缺陷监测基本数据集 预防接种基本数据集 传染病报告基本数据集 结核病防治基本数据集 艾滋病防治基本数据集 血吸虫病病人管理基本数据集 慢性丝虫病病人管理基本数据集 职业病报告基本数据集 职业性健康监护基本数据集 伤害监测报告基本数据集 中毒报告基本数据集 行为危险因素监测基本数据集 死亡医学证明基本数据集 高血压病例管理基本数据集 糖尿病病例管理基本数据集 肿瘤病例管理基本数据集 精神分裂症病例管理基本数据集 老年人健康管理基本数据集 门诊诊疗基本数据集 住院诊疗基本数据集 住院病案首页基本数据集 成人健康体检基本7数据集

元数据的标准

元数据的标准

元数据的标准引言概述:元数据是指描述数据的数据,它包含了关于数据的各种属性和特征。

在信息时代,元数据的标准化变得尤其重要,因为它可以提高数据的可理解性、可管理性和可重用性。

本文将从四个方面详细阐述元数据的标准。

一、元数据标准的定义和意义1.1 元数据标准的定义:元数据标准是一套规范或者约定,用于描述和组织元数据的结构、内容和格式。

它可以确保元数据的一致性和可互操作性。

1.2 元数据标准的意义:元数据标准化可以匡助组织和管理大量的元数据,使其更易于查找和使用。

同时,它还可以提高数据的可信度和可靠性,促进数据共享和集成。

1.3 元数据标准的作用:元数据标准化可以提高数据的质量和价值,减少数据冗余和错误。

它还可以促进数据的交流和共享,为数据分析和决策提供支持。

二、元数据标准的制定和应用2.1 元数据标准的制定过程:制定元数据标准需要明确标准的范围和目标,采集和分析现有的元数据,制定元数据的结构和内容,最后进行标准的评审和发布。

2.2 元数据标准的应用场景:元数据标准可以应用于各种领域,如数据管理、数据集成、数据分析和数据共享等。

它可以匡助用户快速准确地理解和使用数据。

2.3 元数据标准的实施策略:实施元数据标准需要建立元数据管理系统,培训和指导用户使用标准,监控和评估标准的使用效果,并进行必要的调整和改进。

三、元数据标准的关键要素3.1 元数据标准的结构:元数据标准应包括元数据的基本信息、关系信息和业务信息等。

它应该具有一定的层次结构,以便于组织和管理元数据。

3.2 元数据标准的内容:元数据标准的内容应包括元数据的定义、命名规则、数据类型、数据格式、数据范围和数据约束等。

它应该能够满足不同用户的需求。

3.3 元数据标准的管理:元数据标准的管理包括元数据的采集、存储、更新和维护等。

它应该建立合理的元数据管理流程和机制,确保元数据的有效性和一致性。

四、元数据标准的挑战和未来发展4.1 元数据标准的挑战:元数据标准化面临着标准的多样性、应用的复杂性和变化的快速性等挑战。

2023年卫生健康信息统计工作重点工作任务清单

2023年卫生健康信息统计工作重点工作任务清单

2023年卫生健康信息统计工作重点工作任务清单摘要:一、卫生健康信息统计工作的重要性二、2023年卫生健康信息统计工作的主要任务三、卫生健康信息统计工作的具体要求四、加强卫生健康信息统计工作的保障措施正文:卫生健康信息统计工作是卫生健康事业发展的重要组成部分,对于了解卫生健康事业的发展情况、科学制定卫生健康政策具有重要意义。

2023年,卫生健康信息统计工作的重点任务主要包括以下几个方面:一、卫生健康信息统计工作的重要性卫生健康信息统计工作是卫生健康事业的重要组成部分,是了解卫生健康事业的发展情况、科学制定卫生健康政策的重要依据。

因此,卫生健康信息统计工作的重要性不容忽视。

二、2023年卫生健康信息统计工作的主要任务2023年,卫生健康信息统计工作的主要任务包括:1.完善卫生健康信息统计制度,加强信息统计工作的规范化建设;2.加强卫生健康信息统计数据的收集、处理、分析和发布,保证信息统计数据的准确、及时、全面;3.加强卫生健康信息统计工作的信息化建设,提高信息统计工作的效率和质量;4.深入开展卫生健康信息统计研究,为卫生健康政策制定提供有力支持。

三、卫生健康信息统计工作的具体要求卫生健康信息统计工作的具体要求包括:1.加强组织领导,建立健全卫生健康信息统计工作责任制;2.强化人员培训,提高卫生健康信息统计人员的专业素质;3.完善工作流程,确保卫生健康信息统计工作的规范运行;4.加强质量控制,保证卫生健康信息统计数据的质量。

四、加强卫生健康信息统计工作的保障措施加强卫生健康信息统计工作的保障措施包括:1.加大资金投入,确保卫生健康信息统计工作的正常开展;2.完善技术支持,提高卫生健康信息统计工作的信息化水平;3.建立激励机制,调动卫生健康信息统计人员的积极性;4.加强协作配合,形成卫生健康信息统计工作的合力。

总之,卫生健康信息统计工作是卫生健康事业发展的重要支撑,2023年卫生健康信息统计工作的重点任务已经明确,相关要求和工作措施也已经提出。

元数据的标准

元数据的标准

元数据的标准一、引言元数据是描述数据的数据,是对数据进行管理和利用的基础。

在数据管理和数据分析的过程中,元数据的标准化是非常重要的,它能够提高数据的质量、可理解性和可重用性。

本文将介绍元数据的标准格式,包括元数据的定义、分类、组成和标准化的步骤。

二、元数据的定义元数据是描述数据的数据,它包括数据的属性、结构、语义和使用方式等信息。

元数据可以匡助用户理解数据的含义、来源、格式和使用方法,从而更好地管理和利用数据。

元数据可以分为结构元数据、业务元数据和技术元数据等不同类型。

三、元数据的分类1. 结构元数据:描述数据的结构和组织方式,包括数据表、字段、关系等信息。

2. 业务元数据:描述数据的业务含义和使用规则,包括数据词汇、业务规则和数据质量要求等信息。

3. 技术元数据:描述数据的存储、传输和处理方式,包括数据格式、编码方式和数据接口等信息。

四、元数据的组成元数据由多个属性组成,每一个属性都包含一定的信息。

常见的元数据属性包括:1. 名称:描述数据的名称或者标识符。

2. 描述:对数据的详细描述,包括数据的含义、用途等信息。

3. 类型:描述数据的类型,如文本、数字、日期等。

4. 长度:描述数据的长度或者容量。

5. 约束:描述数据的约束条件,如惟一性、非空等。

6. 格式:描述数据的格式,如日期格式、数字格式等。

7. 来源:描述数据的来源,包括数据源、数据提供者等信息。

8. 更新时间:描述数据的更新时间和频率。

9. 所属系统:描述数据所属的系统或者应用程序。

五、元数据的标准化步骤元数据的标准化是为了提高数据的一致性和可理解性,使数据能够被更广泛地共享和利用。

元数据的标准化步骤包括:1. 确定标准:选择适合组织的元数据标准,如Dublin Core、CDISC等。

2. 分析元数据需求:了解组织的数据管理需求,确定需要采集和管理的元数据。

3. 设计元数据模型:根据元数据需求,设计元数据的模型和结构,包括属性和关系等。

卫生健康行业信息标准分析V1

卫生健康行业信息标准分析V1

类关系模式
卫生信息系统的设计与开 发
数据集模式 数据集内容构成的描述
按活动对数据的类、类关 系、属性、属性数据类型、 值域等进行设计,并用通 用方式进行表达
把数据集的内容划分为实 体、属性,并用通用方式 进行表达
适用情况举例
公共卫生信息资源规划、 组织、主题数据集设计与 发布等
公共卫生信息资源规划、 组织、主题数据集设计与 发布等
+ identifier: II [0..1]
is a function performed by
+ postalAddress: AD [0..1]
+ telecomAddress: BAG<TEL> [0..*]
0..* oversee {be overseen
{fun1ction as}
0..*
+ telecomAddress: BAG<TEL> [0..*]
0..* oversee {be overseen
{fun1ction as}
0..*
TreatingSite
co n stra i n ts {be a member of Exclusive Or}
be a member of
by} 0..*
类关系模式
class View CM: Common
HealthcareFacility
+ effectiveDateRange: IVL<TS.DATETIME> [0..1]
+ identifier: II [0..1]
is a function performed by
+ postalAddress: AD [0..1]

医药卫生数据元标准-药学数据中心

医药卫生数据元标准-药学数据中心

医药卫生科学数据共享工程数据标准HSDS/T XXX—2005医药卫生数据元标准The basic principles and methods for the standardizationof data elements in Medical Sciences(征求意见稿)2006-02-25××××-××-××发布××××-××-××实施医药卫生科学数据共享网标准体系建设项目组目录前言 (5)1范围 (7)2规范性引用文件 (7)3术语与缩略语 (8)3.1 术语 (8)3.2 缩略语 (11)4医药卫生科学数据共享数据元标准研究概述 (12)4.1 数据元概述 (12)4.1.1数据元简介 (12)4.1.2数据元与其它数据概念的关系 (13)4.1.3科学数据共享工程中的数据元 (15)4.2 医药卫生科学数据共享数据元标准研究概述 (15)4.2.1数据元标准研究的内容 (15)4.2.2数据元标准研究的目的 (16)5数据元的表达格式 (16)5.1 数据元基本属性 (16)5.1.1基本属性模型 (16)5.1.2必选属性与其他选择属性 (18)5.2 基本属性规范 (19)5.2.2定义类属性 (21)5.2.3关系类属性 (21)5.2.4表示类属性 (23)5.2.5管理类属性 (26)5.3 基本属性描述 (27)5.3.1常规描述符 (27)5.3.2属性描述规则 (27)6数据元的值域规范 (29)6.1 穷举域 (30)6.2 可重复利用域与通配数据元 (30)6.3 数据元值域的规范定义和来源 (30)7数据元的提取 (31)7.1 自上而下的数据元提取法 (31)7.2 自下而上的数据元提取法 (32)8数据元的命名规则 (32)8.1 名称语义内容的规则 (32)8.1.1语义规则 (32)8.1.2名称成分语义 (33)8.1.3分隔符语义 (35)8.2 名称格式的规则 (36)8.2.2词法规则 (36)8.3 唯一性规则 (36)9数据元的定义 (36)9.1 数据元定义规则 (36)9.2 数据元定义指南 (37)9.3 数据元定义要求 (38)9.3.1前提 (38)9.3.2规则 (38)9.3.3指导原则 (41)10数据元的分类 (45)10.1 数据元分类模式 (46)10.1.1关键字 (46)10.1.2主题词表术语 (46)10.1.3分类法和本体论分类单元 (47)10.2 数据元的分类属性 (47)10.3 分类属性描述 (49)10.3.1分类组分标识符 (49)10.3.2分类组分名称 (49)10.3.3分类模式类型 (49)10.3.4分类模式标识符 (50)10.3.6分类模式版本 (50)10.3.7分类模式项类型 (50)10.3.8分类模式项值 (51)11数据元的注册与管理 (51)附录(资料性附录) (53)A.1什么是元数据 (53)A.2数据元、元数据、元模型 (54)前言医药卫生科学数据共享网是跨基础医学、临床医学、公共卫生、中医药学四个数据中心和药学、特种医学主体数据库,“物理上合理分布,逻辑上高度统一”的资源共享服务系统,数据元则是共享资源在共享网层面上实现数据的一致性表达、交换和共享的基础。

主数据的元数据标准

主数据的元数据标准
主数据元数据标准是指对组织中的主数据进行描述和定义的规范。

主数据是组织中共享的核心数据,例如客户信息、产品信息等。

元数据则是描述数据的数据,提供了关于数据的信息,包括其定义、结构、关系和用途等方面的信息。

以下是定义主数据元数据标准的一些建议:
1. 标识和描述:元数据应该包括对主数据的唯一标识符以及有关主数据的描述,以确保在整个组织中对主数据有一致的理解。

2. 数据类型和格式:元数据标准应该定义主数据属性的数据类型和格式,确保数据的一致性和准确性。

3. 业务规则:描述与主数据相关的业务规则,包括验证规则、计算规则和其他与主数据值相关的约束。

4. 关系:描述主数据实体之间的关系,包括层次关系、关联关系等。

例如,客户和订单之间的关系。

5. 历史和变更信息:元数据应该记录关于主数据变更的历史信息,以支持数据追溯和审计。

包括创建日期、修改日期等。

6. 数据所有权和责任:定义主数据的所有者和负责人,以确保对主数据的管理和维护有明确的责任。

7. 数据访问权限:描述谁有权访问和修改主数据,以确保数据的安全性和合规性。

8. 数据质量指标:定义用于度量和监控主数据质量的指标,包括准确性、完整性、一致性等。

9. 版本控制:如果适用,定义主数据版本控制策略,以确保组织中使用的是最新的和准确的主数据。

10. 元数据管理流程:描述元数据的创建、维护、更新和删除的过程,确保元数据本身也是可管理和可追溯的。

通过定义和遵循这样的主数据元数据标准,组织可以更好地管理和维护其关键的主数据,提高数据质量和一致性,支持业务决策和运营。

2023年卫生健康信息统计工作重点工作任务清单

2023年卫生健康信息统计工作重点工作任务清单摘要:1.卫生健康信息统计工作重点任务清单概述2.2023 年全国卫生健康信息化工作培训会议3.河南省卫生健康委制定的卫生健康信息化建设管理措施4.2023 年全国卫生健康重点工作任务5.2023 年政府工作报告卫生健康工作重点6.2023 年基层卫生健康工作重点7.2023 年全国卫生健康财务工作重点正文:2023 年卫生健康信息统计工作重点任务清单概述卫生健康信息统计工作在推动我国卫生健康事业发展中起着至关重要的作用。

为了提高卫生健康信息统计工作的效率和质量,2023 年制定了一系列重点任务清单。

本文将从以下几个方面详细介绍2023 年卫生健康信息统计工作的重点任务。

2023 年全国卫生健康信息化工作培训会议为了更好地推进卫生健康信息化建设,河南省卫生健康委于5 月11 日召开了全省2023 年全民健康信息化工作培训会。

会议明确了统筹全省卫生健康信息化建设,升级改造全民健康信息平台等八项重点工作。

同时,省卫生健康委还制定了《健康河南数字化改革三年攻坚行动》,明确了2023-2025 年全省信息化工作思路,并出台了《河南省卫生健康委信息化建设管理办法》,以实现统一资金使用、统一项目规划、统一软件开发、统一人员培训、统一日常监管,为信息化科学发展提供制度保障。

河南省卫生健康委制定的卫生健康信息化建设管理措施为了保证卫生健康信息化建设的顺利推进,河南省卫生健康委制定了一系列管理措施,包括制定信息化建设规划、加强项目管理、统一软件开发、加强人员培训和日常监管等。

这些措施将为卫生健康信息化建设提供有力的组织保障。

2023 年全国卫生健康重点工作任务在2023 年全国卫生健康重点工作任务中,科学、精准、高效地做好新冠乙类乙管常态化防控工作继续加强监测预警,加强重点人群管理和分级分层分流医疗卫生服务体系建设,加强医疗物资保障,推进老年人等人群疫苗接种,筑牢个人卫生健康第一道防线。

元数据的标准

元数据的标准一、引言元数据是描述数据的数据,是对数据进行管理、组织和使用的重要工具。

元数据的标准化可以提高数据的质量和可用性,促进数据的共享和交换。

本文将介绍元数据的标准格式,包括元数据的定义、分类、组成部份和标准化的重要性。

二、元数据的定义元数据是描述数据的属性、特征和结构的数据,它提供了对数据的理解和解释。

元数据可以包括数据的名称、类型、格式、来源、描述、关系等信息。

通过元数据,用户可以更好地理解和使用数据。

三、元数据的分类根据不同的应用领域和目的,元数据可以分为三类:技术元数据、业务元数据和管理元数据。

1. 技术元数据:技术元数据描述数据的技术特性和结构,包括数据的存储方式、数据字典、数据格式、数据模型等信息。

2. 业务元数据:业务元数据描述数据的业务含义和用途,包括数据的定义、业务规则、数据质量要求等信息。

3. 管理元数据:管理元数据描述数据的管理和管理信息,包括数据的归档、备份、安全性、访问权限等信息。

四、元数据的组成部份元数据由多个组成部份组成,每一个组成部份都提供了对数据的不同方面的描述。

常见的元数据组成部份包括:1. 数据标识符:用于惟一标识数据的标识符,如数据的名称、编号、版本号等。

2. 数据描述:对数据进行详细的描述,包括数据的含义、用途、来源、格式、结构等。

3. 数据关系:描述数据与其他数据之间的关系,包括数据的依赖关系、关联关系、层次关系等。

4. 数据质量:描述数据的质量特征,包括数据的准确性、完整性、一致性、可靠性等。

5. 数据访问权限:描述数据的访问权限和安全性要求,包括数据的保密性、完整性、可用性等。

6. 数据更新记录:记录数据的更新历史和变更信息,包括数据的创建时间、修改时间、责任人等。

五、元数据的标准化的重要性元数据的标准化对于数据管理和数据交换具有重要意义。

1. 提高数据质量:通过规范的元数据标准,可以提高数据的准确性、完整性和一致性,减少数据错误和冗余。

2. 促进数据共享:标准化的元数据可以提供一致的数据描述和结构,方便不同系统和组织之间的数据共享和交换。

元数据标准


Metadata的应用目的
(1)确认和检索(Discovery Identification),主要致力于如何帮助人们检索和确认所需要的资源,数 据元素往往限于作者、标题、主题、位置等简单信息,Dublin Core是其典型代表。
(2)著录描述(Cataloging),用于对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体、 位置与获取方式、制作与利用方法、甚至相关数据单元方面等,数据元素数量往往较多,MARC、GILS和 FGDC/CSDGM是这类Metadata的典型代表。
元数据以非特定语言的方式描述在代码中定义的每一类型和成员。
存储的信息
程序集的说明。 标识(名称、版本、区域性、公钥)。 导出的类型。 该程序集所依赖的其他程序集。 运行所需的安全权限。 类型的说明。 名称、可见性、基类和实现的接口。 成员(方法、字段、属性、事件、嵌套的类型)。 属性。 修饰类型和成员的其他说明性元素。
意义
说到元数据的意义,可以从其应用目的来谈的。虽然做数据仓库言必称元数据,必称技术、业务元数据,但 其到底用于何处?离开了目标去谈元数据,就发现元数据包含太多的东西,因为他是描述数据的数据嘛。
还是那客户关系系统来比喻,这个系统维护客户信息当然是有目的的,是要用这些信息进行一些自动的流程 处理、去挖掘一些客户潜在的价值、做好客户服务。当然没有必要去维护客户的生命特征信息,诸如指纹、犯罪 史等,这些信息跟客户关系管理的目标关系不大。元数据也是如此,你可以将所以数据的结构、大小、什么时间 创建、什么时间消亡、被那些人使用等等,这些信息可以延伸得太广,如果不管目标,而试图去建一个非常完美 的元数据管理体系,这是一种绝对的"自上而下"做法,必败无疑。
元数据提供所有必需的有关已编译代码的信息,以供您从用不同语言编写的 PE文件中继承类。您可以创建 用任何托管语言(任何面向公共语言运行库的语言)编写的任何类的实例,而不用担心显式封送处理或使用自定 义的互用代码。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

卫生健康信息数据集元数据标准1 范围本标准规定了数据集元数据内容框架、卫生健康信息数据集核心元数据、卫生健康信息数据集参考元数据、引用信息与代码表。

本标准适用于作为卫生健康信息数据集属性的统一规范化描述,也可用于卫生健康领域针对数据集制定专用元数据标准的依据。

2 规范性引用文件下列文件中的内容通过文中的规范性引用而构成本标准必不可少的条款。

其中,注日期的引用文件,仅该日期对应的版本适用于本标准;不注日期的引用文件,其最新版本 (包括所有的修改单) 适用于本标准。

GB/T 2260 中华人民共和国行政区划代码GB/T 7408 数据元和交换格式信息交换日期和时间表示方法WS/T 306 卫生健康信息数据集分类与编码规则RFC 2396 统一资源定义符:通用语法3 术语和缩略语下列术语和缩略语适用于本标准。

3.1 术语3.1.1元数据 metadata定义和描述其他数据的数据。

3.1.2数据集 dataset具有一定主题,可以标识并可以被计算机化处理的数据集合。

3.1.3元数据元素 metadata element元数据的基本单元。

3.1.4元数据实体 metadata entity一组说明数据相同特性的元数据元素。

可以包含一个或若干个元数据实体。

3. 1.5元数据子集 metadata section元数据的子集合,由相关的元数据子集和元数据元素组成。

3. 1.6数据元 data element用一组属性规定其定义、标识、表示和允许值的数据单元。

3.2 缩略语XML:可扩展标记语言 (Extensible Markup Language)4 数据集概述4.1 数据集基本概念对数据集概念的详细解释可见WS/T 306。

4.2 卫生健康信息数据集对卫生健康信息数据集的阐述可见 WS/T 306。

5 卫生健康信息数据集元数据概述5.1 元数据内容组成卫生健康信息数据集元数据规定了两个层次的元数据内容的集合:核心元数据与参考元数据,其中参考元数据包含了核心元数据,它们之间的内容包含关系见图1。

图 1 核心元数据与参考元数据的内容包含关系5.2 元数据结层次构元数据结构:元数据元素、元数据实体和元数据子集。

元数据元素是元数据的最基本的信息单元。

例如,数据集名称、数据集标识符、元数据创建日期等,是最基本的属性信息单元,用元数据元素来表示。

元数据实体是同类元数据元素的集合,用于一些需要组合若干个更加基本的信息来表达的属性。

例如“数据集提交和发布方”需要“单位名称”、“联系人”、“联系电话”、“通讯地址”等若干个基本信息来说明,而数据集“关键词说明”需要“关键词”和“词典名称”来说明,对于“数据集提交和发布方”和“关键词说明”这类属性用元数据实体来表示。

元数据子集由共同说明数据集某一类属性的元数据元素与元数据实体组成,例如标识信息、内容信息、分发信息等。

5.3 元数据的摘要描述5.3.1 元数据的摘要描述符主要采用摘要描述方法定义和描述卫生健康信息数据集的元数据内容。

摘要描述的方法通过表1 所列的描述符针对元数据的元素、实体与子集进行定义。

“约束”表示一个描述符是“必选” (M),还是“条件选” (C),或者是“可选” (O),摘要描述符见表1。

表 1 摘要描述符元数据子集、实体或元素的中文名称,即为核心元数据的元数据实体或元数据元素的中文名称。

5.3.3 定义描述元数据子集、实体或元素的基本内容,是卫生健康信息数据集某个属性和特征的概念与说明。

5.3.4 英文名称元数据子集、实体或元数据元素的英文名称,一般使用英文全称。

英文名称中,词汇均采用无缝连写。

元数据子集与实体英文名称的每个词汇的首字母均为大写,元数据元素英文名称的首词汇全部小写,其余词汇的首字母采用大写。

5.3.5 数据类型对元数据的有效值域和允许对该值域内的值进行有效操作的规定。

元数据实体与元数据子集的数据类型为复合型,元数据元素的数据类型包括为数值型、布尔型、字符串、日期型和复合型等。

当元数据元素的数据类型为复合型的时候,表明该元数据元素使用了引用信息中的引用数据类型。

引用数据类型是由一组元素组成、能被重复引用的元素集合。

例如,“数据集提交和发布方”和“元数据维护方”两个属性,要共同用到“单位名称”、“联系人”、“联系电话”、“通讯地址”、“邮政编码”和“电子邮件地址”这一组子元素来表示,为了表达的方便,卫生健康信息元数据定义了一个叫做“负责方”的数据类型见本标准9. 1. 1 条款,供“数据集提交和发布方”和“元数据维护方”进行引用。

5.3.6 取值规则元数据子集、实体或元素取值方式的说明。

5.3.7 短名元数据元素、实体或子集的英文缩写名称,具体缩写规则如下:a) 短名在本标准范围内必须唯一。

b) 对存在国际或行业惯用英文缩写词汇的元数据元素或元数据实体,采用惯用英文缩写作短名。

c) 对于根据英文名称或自定义的短名,在可以保证其 (本标准范围中的所有短名范围内) 唯一性的情况下取每个词汇的前 3 位字母作为其短名,当如此取词时发现不能够保证短名标识的唯一性时,应当延展取词的位数,通常增加 1 位。

如果仍然不能满足唯一性要求,则照此顺延。

d) 元数据子集、元素和元数据实体的短名中,词汇均采用无缝连写。

元数据子集与实体短名中每个词汇的首字母均为大写;元数据元素短名的首词汇全部小写,其余词汇的首字母采用大写。

5.3.8 子元素子元素是通过一定的表示规则以确定一个元数据实体中包含的下一级的元数据实体或元数据元素。

表示规则为:“标识符 = 表达式” 。

表达式中各符号的含义见表 2。

表 2 表达式的符号含义例如:子元素:关键词说明=1 {关键词}n +0 {词典名称}15.3.9 注解对元数据子集、实体或元素的含义的进一步解释,包括该元数据的约束/条件 (必选、可选或条件必选) 和最大出现次数。

当该元数据为条件必选时,应注明其约束条件。

5.3.9.1 约束/条件以“必选项”、“可选项”、“条件可选”等文字说明元数据子集、实体或元素是“必须(M)”、“可选 (O)”或者“条件可选 (C)”。

可选元数据子集或元数据实体可以有必选元数据实体或元素。

但这些必选的实体或元素只有当上一级的可选子集或实体被选用时才成为必选的;如果上一级的可选元数据子集或实体未被选用,则其所包含的必选实体或元素也不选用。

5.3.9.2 最大出现次数说明元数据子集、实体或元素可以重复出现的次数。

只允许出现一次的用“1”表示,允许重复出现 (但重复的次数不是固定值) 的用“N”表示。

不为 1 的固定出现次数用相应的数字表示,如“2” 、“3” 、“4”等。

5.4 适用功能5.4.1 数据集元数据著录对具体的卫生健康信息数据集选择元数据内容进行描述时,以核心元数据作为著录 (根据必选、可选等约束条件) 的基础,然后根据需要可以选择参考元数据的内容进行著录,见图2:图 2 直接作为著录标准的使用方式用户针对卫生健康信息数据集进行元数据著录的示例,可参照本标准附录 A (以只著录核心元数据内容为例)。

5.4.2 制定专用标准的依据在卫生健康领域内,以数据集为对象制定专用的元数据标准时,可依照本标准进行制定。

所制定的数据集专用元数据标准,必须包含核心元数据的内容,同时将参考元数据的内容作为扩展内容的参考,使用方式见图3:图 3 作为制定专用标准依据时的使用方式要在卫生健康信息参考元数据的基础上继续进行元数据内容的扩展时,应当符合附录 B 的要求。

6 元数据内容框架卫生健康信息数据集元数据的全集,即参考元数据的内容规定了7个元数据子集,分别如下:a ) 元数据标识信息 (子集):包含元数据本身的基本信息,如名称、维护方、创建日期等。

b) 数据集标识信息 (子集):包含元数据所描述的数据集的基本信息,包括名称、标识符、提交或发布方等。

c ) 内容信息 (子集):内容信息提供数据内容特征的描述信息,包括摘要、特征数据元等。

d) 分发信息 (子集):分发信息包含有关资源分发者的信息以及用户获取资源的途径。

e ) 数据质量信息 (子集):数据生产者有关数据集数据志信息的一般说明。

f) 限制信息 (子集):包含对数据集和元数据进行访问和使用的限制信息。

g) 维护信息 (子集):包含关于元数据或数据集的更新频率及更新范围的信息。

参照UML类图中聚集关系与依赖关系的表示方法,概要描述了卫生健康信息数据集参考元数据的内容框架 (见图4) 。

图 4 卫生健康信息参考元数据内容构成7个子集是参考元数据这一整体的组成部分,在图4中标记出了各自的可出现次数。

元数据标识信息 (子集) 、数据集标识信息 (子集) 、限制信息 (子集) 和维护信息 (子集) 中有元数据元素使用到了引用信息中由本标准定义的数据类型,所以它们对引用信息存在依赖关系。

7 卫生健康信息数据集核心元数据7.1 概述卫生健康信息核心元数据包括8个必选元数据元素或实体,10个可选元数据元素与实体。

卫生健康信息数据集核心元数据内容见表3,其中的第四列“约束”是指该元数据元素或元数据实体是“必选 (M) ”,或者是“可选 (O) ” ,第五列是说明核心元数据在参考元数据中的相应位置。

表 3 卫生健康信息数据集核心元数据内容7.2 摘要描述7.2.1 数据集名称 (必选)定义:能够简要描述卫生健康信息数据集主题与内容的标题英文名称:datasetTitle数据类型:字符串取值规则:自由文本短名:dataTitle注解:必选项;最大出现次数为 17.2.2 数据集标识符 (必选)定义:卫生健康信息数据集的唯一标识符英文名称:datasetIdentifier数据类型:字符串取值规则:按照“提交机构-编号-版本号”的命名规则进行赋值。

提交机构使用机构标准名称,版本号用一位整数加两位小数的表示方式,例如“2. 10”(版本)。

短名:dataID注解:必选项;最大出现次数为 17.2.3 数据集摘要 (必选)定义:数据集内容的简单说明英文名称:abstract数据类型:字符串取值规则:自由文本短名:abstract注解:必选项;最大出现次数为 17.2.4 数据集提交或发布方 (必选)定义:提交或发布数据集,并对数据集的真实性、正确性负责的单位或部门英文名称:datasetContact数据类型:复合型取值规则:负责方<<数据类型>> (见本标准9. 1. 1)短名:dataContact注解:必选项;最大出现次数为N7.2.5 关键词说明 (必选)定义:关键词种类、类型和参考资料英文名称:DescriptiveKeywords数据类型:复合型短名:DescKeys子元素:关键词说明=1 {关键词}n +0 {词典名称}1注7.2.5.1定解:必选项;最大出现次数为N关键词义:用于描述数据集主题的通用词、形式化词或短语英文名称:keyword 数据类型:字符串取值规则: 自由文本7.2.5.2定名:keyword 解:必选项;最大出现次数为 N词典名称义:正式注册的词典名,或类似的权威关键词资料名称 英文名称:thesaurusName 数据类型:字符型 取值规则: 自由文本 短 名:thesaName注 解:可选项;最大出现次数为 17.2.6 数据集语种 (必选)定 义:数据集采用的语言英文名称:datasetLanguage 数据类型:字符串取值规则:语种代码<<代码表>> (见本标准 9.2. 1) 短 名:dataLang注 解:必选项;最大出现次数为 N 7.2.7 数据集特征数据元 (可选)定 义:卫生健康信息数据集中,能够表达数据集核心内容与特征资源的数据元列举 英文名称:characteristicDataElement 数据类型:字符串取值规则: 自由文本,数据元之间使用英文状态下的逗号分开 短 名:charaDataEle注 解:可选项;最大出现次数为 1 7.2.8 数据集发布日期 (可选)定 义:卫生健康信息数据集进行提交或发布的日期 英文名称:datasetPublicationDate 数据类型: 日期型取值规则:按照 GB/T 7408-2005 规定,格式应当为 YYYY-MM-DD 短 名:dataPubDate注 解:可选项;最大出现次数为 1 7.2.9 数据集分发格式 (可选)定 义:分发数据的格式说明 英文名称:DistributionFormat 数据类型:复合型 短 名:DistFormat 子 元 素:分发格式 =分发格式名称+ 0 {版本}1注 解:可选项;最大出现次数为 N 7.2.9.1 分发格式名称定 义:数据集分发格式名称 英文名称:formatName短注数据类型:字符串取值规则: 自由文本,默认为文件扩展名称 7.2.9.2定 名:formName 解:必选项;最大出现次数为 1 版本义:数据集分发格式所对应的软件版本 (日期、版本号等) 英文名称:formatVersion 数据类型:字符串 取值规则: 自由文本 短 名:formVer注 解:可选项;最大出现次数为 17.2.10 在线访问地址 (可选)定 义:可以对数据集进行在线访问或获取的信息 英文名称:online 数据类型:字符型取值规则: 自由文本,按照 RFC 2396 规定填写 短 名:online注 解:可选项;最大出现次数为 N 7.2.11 数据集分类 (可选)定 义:数据集的分类信息 英文名称:DatasetCategory 数据类型:复合型 短 名:DataCat子 元 素:数据集分类 =类目名称+ 类目编码+ 分类标准注 解:可选项;最大出现次数为 N 7.2.11.1 类目名称定 义:对应于所使用的某种分类方法所得到的具体类目名称 英文名称:categoryName 数据类型:字符串 取值规则: 自由文本 7.2.11.2定 名:cateName 解:必选项;最大出现次数为 1 类目编码义:类别名称对应的编码 英文名称:categoryCode数据类型:字符串 取值规则: 自由文本 短 名:cateCode注 解:必选项;最大出现次数为 17.2.11.3 分类标准短 注短 注定义:所依据的分类标准名称英文名称:categroyStandard数据类型:字符串取值规则:自由文本短名:cateStd注解:必选项;最大出现次数为 17.2.12 相关环境说明 (可选)定义:说明数据集生产的处理环境,包括软件、计算机操作系统、文件名和数据量等英文名称:environmentDescription数据类型:字符串取值规则:自由文本短名:envirDesc注解:可选项;最大出现次数为 17.2.13 元数据创建日期 (必选)定义:创建、采集元数据的日期英文名称:metadataDateStart数据类型:日期型取值规则:按照 GB/T 7408-2005 规定,格式应当为 YYYY-MM-DD短名:mdDateStart注解:必选项;最大出现次数为 17.2.14 元数据标识符 (必选)定义:元数据的唯一标识英文名称:metadataIdentifier数据类型:字符串取值规则:在7.2.2 的数据集标识符取值前加“MD- ”字样。

相关文档
最新文档