数字资源长期保存元数据规范
数字教材资源开发的技术标准和规范

数字教材资源开发的技术标准和规范为了保证开发的资源能够运用于最终的数字教材制作,数字资源必须达到一定的技术标准。
同时,为了保证数字教材的成功,在课程设计、交互设计、美术设计上,要遵循统一的规范。
一、资源技术标准1.图片数字化的阅读往往以图片为导向,图片的重要性不言而喻。
图片不仅是文字资料的补充,更能帮助学生理解教学内容,吸引学生的注意力。
(1)图片的基本要求。
根据来源不同,图片可以分为示意图片、实拍照片。
示意图片一般指公式图、流程图、结构图等,用来描述特定事务或过程信息等。
一般由手工或计算机绘制成, 它的特征是以线条为主。
示意图片应清晰,图片上的文字字号在“五号”(12磅)以上,图像尺寸的长或宽在500px以上,解析度96DPI以上。
传统出版物中的图片是黑白的,需要重新上色才可以使用。
实拍照片是指在实验现场、操作现场、实物展示现场等地方,使用数字照相设备拍摄的真实照片。
此类图片对清晰度要求较高,尺寸1920X 1080 (像素200万)以上,解析度96DPI以上。
以上两种图片都可以通过扫描获取。
但扫描图片需要注意底纹,一般需经过处理才能应用。
(2)图片格式的要求。
按照计算机运算影像呈现的方式,图片可为位图和向量图两种。
位图以像素作为最小单位,由一个一个点组合而成,所以位图放大过后会出现原来像素的点状。
常用的格式有BMP、JPG、GIF、PNGoBMP格式支持全彩色(1677万色),它是非压缩格式,因此文件较大。
JPG 格式支持全彩色(1677万色),它属于一种破坏性的压缩格式,压缩比例过大时,会造成图形的破坏。
但其文件较小,是使用率最高的图片格式。
GIF格式只支持256色,不适用于复杂照片的储存,适合制作简单的图标,应用于网页设计。
PNG格式支持全彩色(1677万色),也支持256阶的透明度储存(GIF只有2阶),是一种非破坏性的储存方式。
文件大小介于BMF和JPG之间。
在数字教材制作中,图片一般采用JPG PNG格式。
图书馆数字资源的数字保存

图书馆数字资源的数字保存在当今数字化发展的时代,图书馆作为知识的宝库,不仅仅承载着大量的纸质书籍,也开始逐渐拥抱数字资源。
数字资源的出现,使得图书馆在信息传播、知识推广方面更加便捷高效。
然而,数字资源的数字保存也成为了一个亟待解决的问题。
本文将就图书馆数字资源的数字保存进行探讨。
1. 数字资源的重要性数字资源是指以数字形式存在的各类信息资源,如电子书籍、数据库、期刊论文等。
与传统纸质资源相比,数字资源具有以下几个显著优势。
1.1 便捷获取:数字资源可以通过网络随时随地访问,读者无需到图书馆现场,便能获取所需信息。
1.2 空间节约:数字资源不占用实体空间,大大节约了图书馆的存储成本。
1.3 多媒体性:数字资源可以包含图像、音频、视频等多种媒体形式,为用户提供更加丰富的阅读体验。
2. 数字资源的数字保存挑战2.1 格式标准:数字资源的格式繁多,包括PDF、DOC、EPUB等,不同格式可能需要不同的保存方式和技术支持。
2.2 版权保护:数字资源涉及版权问题,图书馆需要确保在数字保存过程中合法使用,并保护原创作者的权益。
2.3 技术更新:随着科技的发展,数字资源的保存技术也在不断更新。
图书馆需不断跟进新技术,确保数字资源长期保存和可持续利用。
3. 数字资源的数字保存策略为了有效保护和管理数字资源,图书馆需要制定科学合理的数字保存策略。
3.1 数据备份:图书馆应定期对数字资源进行备份,并存储于多个地点,避免因硬件故障或自然灾害导致数据丢失。
3.2 元数据管理:图书馆应建立完善的元数据系统,对数字资源进行准确的描述和索引,以便读者进行快速检索。
3.3 数字资源更新:图书馆应与数字资源提供方保持紧密合作,及时获取资源的最新版本,并更新到馆藏中,确保读者获取到最新、准确的信息。
4. 数字资源的数字保存技术4.1 数据加密:为保护数字资源的安全性,图书馆可以采用数据加密技术,对资源进行加密处理,确保只有授权用户才能访问。
数字资源的长期保存精品文档

2019/10/5
34
四、典型案例介绍
7、中国国家图书馆的保存活动
争取国家政Βιβλιοθήκη 上的支持和公众意识的提高 数字报纸数据库
2119种报纸 1800个报纸网站 80个网站上的PDF文件
网络信息资源保存项目WICP /
2019/10/5
35
四、典型案例介绍
13,527
2007.12
2019/10/5
5
图3.3 中国网站数量增长情况
万个
160.0 140.0 120.0 100.0
80.0 60.0 40.0 20.0
0.0
网站数量
66.9
67.8
2004.12 2005.06
69.4 2005.12
78.8 2006.06
84.3 2006.12
131.2 2007.06
8、中国WEB信息博物馆infomall/
“中国Web信息博物馆”是在国家 973和 985项目支持下,北京大学网络实验室开发建设 的中国网页历史信息存储与展示系统。目前已经 维护有30亿以中文为主的网页,并以平均每月四 千五百万网页的速度扩大规模。
2019/10/5
36
/
市场失效前的限制性保存使用 市场失效后的国家保存使用
2019/10/5
24
四、典型案例介绍
2、澳大利亚网络信息资源保存PANDORA
主要收集本国出版或记录本国事件的出版物。包括网 上免费开放资源,也包括商业型电子出版物。以文本 文件和图像文件为主。由于技术上的原因,没有收录 数据库。
采购的数据库的保存活动 中国科学院国家科学图书馆开展了多种保存活动 北京大学开展了中国WEB博物馆 ……
浅析数字资源的长期保存和永久获取

一
还可 以取 阅, 但是一份 电子信息就必须经 过数 字存 储设备保存并且精心维 护方可 确保 后续 的阅取 。由于 电子信 息是 经过 数字存储设备来保存, 所 以如果要读取必 须 首先系统地把字节和 比特 翻译成 我们 可以识别 的信息 。这个无疑给我们 的存 取带来一定挑战 。软件和操作 系统在 日 新月异的更新, 因此我 们不得不 面对着不 断过时的 旧系统给我们数据读 取带来 的 不便 。图书馆作 为专业 的信息储藏机构,
・
4 6・
科 技 论 坛
浅析数字资源的长期保存和永久获取
刘 彩 霞
( 天津科技 大学 图书馆 , 天津 3 0 0 2 2 2 ) 摘 要: 数字资源的保存越 来越成为业 内人 士关注的热 点。如何 实现长期存储 , 不仅 涉及技 术 问题 同时也是经 济和管理各方面的协 调 问题。本文作者从保 存和 获取的角度浅析数 字资源的长期存储并列举荷 兰国家图书馆 UV C 的成熟案例 以期对我们会有所启发。 关键 词: 长期保存 ; 永久获取 ; 通 用虚拟计算机 ( t _ wc)
图1 OA I。 图书馆在九十年代末期经历 了 由纸质图书馆 向数 字图书馆 的变迁, 也有越来越 多的人开始关注数 图 2 保 存 元数 据与 数 字 资 源长 期 保 存 功 能 实现 流 程 图 字信息的存储 。比如电子期刊, 图书馆不在储存他们, 而是通过协议 浏览器, 但会 提供采用原来浏览软件来浏览原始格式数字资源 的一 方式 提供链接让读者阅取 。 数据保存相对来说还是一个 比较新 的领 个工具, 这个工具称为仿真工具 。仿真工具 在新 的环境下工作, 使原 域, 但是 已经有一些专家学者在这方 面做 出了杰 出的贡献。我们现 来 的浏览器和原来 的工作平台适应于新的环境 。 如果数字资源的原 在知道如果要成 功保存数字 资源, 必须做 到以下两步 : 长期存储, 元 始样式需要重点保存, 迁移法并不是第一选择, 并且耗 时耗力 。仿真 数据 注册 。 法可 以保证资源 的原始面貌但是开发 和维 护仿 真工具非常复杂, 也 2 数 字信 息 的长 期 存储 很 困难, 成本也很高 。同时不 同格式的数字资源也给我们带来 了不 2 . 1 长期存储 。对数字文件的描述和存储 已经在过去 的十年里 同的挑 战。比如 出版物保持其原样是重点 , 而数码录音资料外观就 引起 了业 内的广泛关注。 同时也引发了对元数据标准的存档系统的 没有 内容保真那么重要 了。对于长期保存 而言, 没有哪一种方式是 研发。长期存储 系统与其他的系统不 同在于它必须侧重存储 。获取 完美 的, 综合 二者是 明智之选 。下文我们 以一个成功的案例来分析 的过程应该单独被划分 出来 。 过去的几年里美 国空间数据 系统咨询 数字资源的长期获取 。 委员会 ( C C S D S ) 研发 了国际标 准模 型——开放档案 信息系统 ( O p e n 对 于数字信 息的长期存储 我们 就以荷兰 K B ( , 荷兰 国家 图书馆) A r c h i v a l I n f o r m a t i o n S y s t e m, O A I S ) 。O A I S 参考模型在一致性方面起 的 e — D e p o t 项 目为例 。 e — D e p o t系统是荷兰国家图书馆针对长期 了非常重要 的作用, 并逐渐成为众多存储项 目遵循的标准, 还被广泛 保存 和持久存 取荷兰电子出版物 的需要而提 出的专 注于长期存储 用于开发保存工具盒存储系统, 现 已正式成为 I S O 1 4 7 2 1 : 2 0 0 3国际 的和大规模存 档的 自动化系统 。2 0 0 2年 I B M将 e — D e p o t 的核心数 标 准 。如 图 1 。 字信 息 存档 系 统正 式 交 付 于 K B ,标 志着 这 一 系统 的 建 成 。 2 . 2元数据 注册 。 第二步是对元数据 的注册。 为了知道我们存储 e — D e p o t的核心技术是 I B M产 品: D I A S , 是存取和维护数 字对象 的大 信息的基本情况我们需要 录入例如作者, 标题, 等信息 。但在数字时 型受控存档环境。e — D e p o t 提 出需要将 电子出版物的长期保存功 能 代我们还需要 了解 文档的技术细节, 才可以获取文档。 比如什么格 从出版物 的生产者 中分离出来, 构建大型受控存档环境 。它包括 几 式, 由什么运行程序开启什么操作 系统 和硬件 来支持程序等等 。这 个部分 比如 ( 内容管理 C o n t e n t M a n a g e r ,以及 D B 2 ,和 T S M, 还有 类的信息都叫做 表征信息 , 也 叫做技术元数 据。我们 在存 储 电子 B u s i n e s s O b j e c t s ) 。在荷 兰 国家 图 书馆 内, D I A S与 图书 馆 的基 础设 施 数据的时候需要考虑信息的环境和真实性 。文件 的状态如何? 信息 相联 系使得图书馆可 以每天 2 4小时 自动下载和存储批 量的电子期 创建的环境怎样? 人们更加关心 的是诸如此类 的问题, 信息的真实性 刊。e — D e p o t采用了将仿真和迁移相结合来实现对特定数字对象 的 会更加引起人们的关注。我们如何相信我们所看 到的信息资源。为 保存 , 提出了 U V C ( u n i v e ma l v i r t u l a c o mp u t e r , 通用虚拟计算机) 方法 。 了保护信息我们研发了加密技术, 但 是具 有讽 刺的是加密技术却是 这个 方法也 叫虚拟计算机为基础的保存方 法, 这个方法基 于模拟 的 信息保存 的最大隐患。 幸运的是我们还可以通过注册稳固性信息和 保存技术但是又不要求硬件全部模拟 。 他一方面可 以模拟原始数据 来源信息的形式来保证 信息的真 实性 。在这个领域 , 同样 的国际协 模式, 同时又通过转换 软件将原始数据解码为一种技术独立格式 语
电子地文件资料元大数据要求要求规范

电子文件元数据规范1 范围本规范适用于九省区各级国家档案馆、各级党政机关、社会团体、企事业单位对电子文件进行以保证凭证性为目的的管理活动。
其他社会组织可参照执行在电子文件管理过程中使用元数据可实现以下目的:——确保并证明归档电子文件的真实性、完整性与有效性,从而保证其凭证价值;——有利于归档电子文件的保护,实现长期保存;——在异构的信息系统中对归档电子文件进行规范、有效的管理,保证归档电子文件的可捕获、可收集、查长期利用;——对归档电子文件及馆(室)藏档案数字化资源进行集成管理,实现有效、方便地查询、检索与利用。
2 规范性引用文件下列文件中的条款通过本规范的引用而成为本规范的条款。
凡是注明日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本规范,然而,鼓励根据本规范达成协议的各方研究是否可使用这些文件的最新版本。
GB 2312-1980 信息交换用汉字编码字符集基本集GB/T 3760-1995 文献叙词标引规则GB/T 3792.1-1983 文献著录总则GB/T 7156-2003 文献保密等级代码GB/T 7408-2005 数据元和交换格式信息交换日期和时间表示法GB/T 9704-1999 国家行政机关公文格式GB/T 11714-1997 全国组织机构代码编制规则GB/T 11821-2002 照片档案管理规范GB/T 13959-1992 文件格式与代码编制方法GB/T 13967-1992 全宗单GB/T 15418-1994 档案分类标引规则GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充GB/T 18894-2002 电子文件归档与管理规范DA/T 1-2000 档案工作基本术语DA/T 12-1994 全宗卷规范DA/T 13-1994 档号编制规则DA/T 18-1999 档案著录规则DA/T 19-1999 档案主题标引规则DA/T 22-2000 归档文件整理规则DA/T 31-2005 纸质档案数字化技术规范《中华人民共和国电子签名法》中办发[1996]14号中国共产党机关公文处理条例国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知国家档案局第6号令《电子公文归档管理暂行办法》,2003年7月28日国家档案局第8号令《机关文件材料归档范围和文书档案保管期限规定》,2006年12月19日ISO 15489 Information and documentation—Records managementISO 23081-1 Information and documentation –Records Management Processes –Metadata for Records—Part 1: PrinciplesISO 14721 Open archives information system (OAIS)ISO/IEC 11179-3 :2004 INFORMATION TECHNOLOGY - SPECIFICATION AND STANDARDIZATION OF DATAELEMENTS - PART 3: BASIC ATTRIBUTES OF DATA ELEMENTSGUIDE FOR MANAGING ELECTRONIC RECORDS FROM AN ARCHIVAL PERSPECTIVE, COMMITTEE ON ELECTRONIC RECORDS,ICA(国际档案理事会电子文件管理委员会《电子文件管理指南》),1997 W3C Namespaces in XML XML的命名空间(Namespaces)3 术语与定义3.1电子文件(Electronic Records)电子文件是指在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传送的文件。
数字化档案馆标准

数字化档案馆标准
数字化档案馆标准是指在数字化档案馆建设和运维中需要遵守和
执行的一套规范和准则。
这些标准旨在确保数字档案馆的有效运作,
保证数字化档案的质量、可访问性和可持续性。
以下是一些常见的数
字化档案馆标准:
1. 数字化档案馆建设标准:包括数字档案馆系统的设计、构建
和配置要求,以及相关设备和技术的选择和部署等。
2. 数字化档案采集标准:包括数字档案的扫描、摄影、数字化转换等
采集过程中的操作规范,以确保源文件的完整性和准确性。
3. 数字化档案描述标准:包括描述数字化档案的元数据规范,如档案
名称、日期、作者、主题、关键词等,以便于索引和检索。
4. 数字化档案保存标准:包括数字化档案的长期保存和备份策略、文
件格式选择、数据完整性验证等,以确保档案的保存和可持续访问性。
5. 数字化档案安全标准:包括数字化档案的存储和传输安全要求,包
括访问控制、数据加密、身份认证等,以保护档案的机密性和完整性。
6. 数字化档案访问标准:包括数字化档案的在线访问和检索接口的设计、用户权限管理、用户界面的友好性等,以提供方便、快捷、准确
的档案访问服务。
这些标准的制定和执行可以提高数字化档案馆的效率和可信度,
促进档案资源的广泛应用和共享。
同时,数字化档案馆标准还可以为
数字化档案的互操作性和互联性提供保障,对于数字化档案的联合利
用和资源整合具有重要意义。
书馆数字资源的标准与规范

书馆数字资源的标准与规范在数字化时代,图书馆作为信息资源的守护者和传播者,扮演着重要的角色。
为了更好地管理和利用数字资源,制定和遵守一定的标准与规范显得尤为重要。
本文将从数字资源的标准化、获取与处理、存储与检索以及合规与使用四个方面,探讨书馆数字资源的标准与规范。
一、数字资源的标准化数字资源的标准化是保证资源质量和有效管理的基础。
首先,数字资源的格式应遵循国际通用标准,如PDF、EPUB等,以保证资源的可读性和通用性。
其次,数字资源的命名规范也应符合一定标准,包括资源的名称、作者、出版日期等信息的准确填写,同时还需制定统一的资源索引规则,以方便资源的分类和检索。
二、数字资源的获取与处理获取和处理数字资源的标准与规范是确保资源获取和处理的高效性和准确性。
首先,数字资源的采购途径应符合法律法规和版权要求,确保资源来源的合法性和可信度。
其次,在数字资源的整理和移植过程中,应统一采用可靠的工具和技术,同时建立统一的元数据标准,以保证资源的高效利用和管理。
三、数字资源的存储与检索数字资源的存储和检索标准与规范是保证资源长期保存和高效利用的关键。
首先,数字资源的存储应遵循一定的规范,包括数据的备份与恢复机制、安全性保障及空间利用效率等方面的要求。
其次,针对资源的检索,需要建立统一的检索词标准和分类体系,同时制定查询策略,以提供用户方便快捷的资源访问体验。
四、数字资源的合规与使用数字资源的合规与使用标准与规范是保护资源知识产权和用户权益的根本。
首先,数字资源的版权问题需得到严格遵守,确保资源的合法使用和传播。
其次,对于用户使用数字资源的行为,图书馆应建立相应的规章制度,并提供必要的使用指引与培训,以提高用户对资源合规使用的意识和能力。
总结起来,数字资源的标准与规范涉及到资源的获取、处理、存储、检索以及合规与使用等多个环节。
只有依照规定的标准与规范进行有效的管理,图书馆才能更好地保障数字资源的质量和可持续利用性,为用户提供更好的服务体验。
元数据仓储建设元数据规范

3.1元素说明项
在本规范中,每个元素都从标签、定义、元素的著录内容、注释、元素修饰词、编码体系修饰词及其用法、规范文档、必备性、可重复性等几方面进行定义,详见表1“元素的说明项目”。
表1:元素的说明项目
项目
项目定义与内容
标签
元素在本元数据规范中的标签。
定义
元素在本元数据规范中的定义。
元素的著录内容
对元素著录内容的细化说明。
注释
对元素著录时任何注意事项的说明。
元素修饰词
若有元素修饰词,给出元素修饰词在本标准规范中的标签,其著录内容在下面具体说明。
编码体系修饰词及其用法
元素取值依据的各种受控词表和规范标记,或者其形式遵循的特定解析规则。因此,一个使用某一编码体系表达的值可能会是选自某一受控词表的标志(例如取自一套主题词表的标志)或一串根据规范标记格式化的字符(例如作为日期标准表达的“2000-01-01”)。
有则必备
可重复
使资源可以获得和利用的责任实体
6Байду номын сангаас
日期
出版日期
有则必备
不可重复
用于注明电子资源出版或颁布的日期。在具体著录时,对派生资源著录印刷版原件的出版
日期。
发布日期
有则必备
不可重复
著录资源的发布日期,如数据库的发布日期等
创建日期
有则必备
不可重复
著录资源的创建日期,主要指原生电子资源的创建日期,如图像的拍摄日期等
定义:创建资源内容的主要责任者或者对资源内容做出贡献的其他实体。
元素的著录内容:一般为个人、团体的名称,可以包括除责任方式以外的修饰成份,如责任者的生卒年、朝代、国别、外文原名等。
注释:由个人或团体的名称来表示。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字资源长期保存元数据规范
该项目是由全国图书馆标准化技术委员会于2011年立项的文化行业标准制修订项目。
由国家图书馆牵头,联合清华大学图书馆、上海图书馆、吉林省图书馆共同研制。
项目计划编号为WH2011-028。
本项目的制定重点就在于制定图书馆数字资源长期保
存元数据的数据字典,并制定相关应用纲要,实现与其他主要保存元数据框架的映射。
同时根据中文数字信息资源的特点和数字资源的流程制定专有的文件格式定义技术元数据。