纸质档案数字化工作技术标准

合集下载

《纸质档案数字化技术规范》(DAT 31-2005)

《纸质档案数字化技术规范》(DAT 31-2005)

《纸质档案数字化技术规范》(DAT 31-2005)《纸质档案数字化技术规范》(DA/T 31-2005)(2008-05-07 12:48:46)(中华人民共和国档案行业标准 DA/T 31-2005,中华人民共和国国家档案局2005年4月30日发布,2005年9月1日起实施)1 范围本标准规定了纸质档案数字化的主要技术要求。

本标准适用于用扫描仪对各种纸质档案的数字化加工处理。

2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。

凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。

凡是不注日期的引用文件,其最新版本适用于本标准。

GB,T 17235.1 连续色调静态图像的数字压缩编码T 17235.2 连续色调静态图像的数字压缩编码 GB,GB,T 18894—2002 电子文件归档与管理规范ITU(CCITT)G3 二值图像压缩算法ITU(CCITT)G4 二值图像压缩算法DA,T18—1999 档案著录规则档案管理软件功能要求暂行规定国家档案局档发[2001]6号3 术语和定义下列术语和定义适用于本标准。

3.1数字化 Digitization用计算机技术将模拟图像转换为数字图像的处理过程。

3.2纸质档案数字化Digitization of Paper—Based Records 对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。

3(3数字图像 Digital Image表示景物图像的整数阵列。

一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。

在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。

3(4黑白二值图像 Binary Image只有黑白两级灰度的数字图像。

它对应于黑和白的两种状态文字稿、线条图、指纹图等。

中华人民共和国档案行业标准 纸质档案数字化技术规范

中华人民共和国档案行业标准 纸质档案数字化技术规范

2 规 范性 引用文 件
下 列 文 件 中 的条 款 通 过 本 标 准 的 引 用 而 成 为 本 标 准 的条 款 。 凡 是 注 日期 的 引用 文 件 , 随后 所 有 的修 改 其 单 ( 包括 勘 误 的 内容 ) 修 订 版均 不适 用 于 本标 准 , 不 或 然
对 档 案 进 行 数 字 化 转 换 后 ,数 字 罔 像 与 案 原 件 在色彩 、 何等方面的偏离程度。 儿
清 除 图像 冗 余 或 对 图 像 近 似 的 仟 一 种 过 程 ,其 目
的是对 图像 以更 紧凑的形式表示。 纸质档案数字化过程
中 , 常 见的 有 TF ( 4 、 E 等压 缩 格 式 。 较 IF G )J G P
4纸质档 案数 字化 基本 要 求
4 1 本 原 则 .基
纸 质档案数 字化 的基本 原则是使 档案信息 资源准 确、 方便 、 快捷地提供利用 , 使可以公开的档案信息 资源

采用扫描 仪或数码相 机等数码设 备对纸质档 案进 行数字化加工 , 将其转化 为存储 在磁带 、 磁盘 、 光盘等载
体 上并 能被 计 算 机 识 别 的 数 字 图 像 或 数 字 文 本 的处 理
过程 。 33 数 字 图 像 d i lm g . i t ae ga i
纸 质 档 案 的数 字 化 ,必 须 符 合 国 家 档 案 开 放 规 定 以
及有关规定 。
3 术语 和定 义
下 列 术 语 和 定 义适 用 于 本 标 准 。
31 数 字 化 d izt n , i tai gi o
用计算 机技 术将模拟 信号转换 为数字信 号的处理 +
过程。
3 纸 质档 案数字化 dg i t n f ae b s crs . 2 it ao pp r ae r od iz i o - de

DAT 31-2005 纸质档案数字化技术规范

DAT 31-2005 纸质档案数字化技术规范

纸质档案数字化技术规范DA/T 32-2005(2005年4月30日发布2005年9月1日实施)一、概述国家标准《纸质档案数字化技术规范》DA/T 31—2005是由中国国家档案局颁布的,其批准时间为2005年4月30日,实施时间为2005年9月1日。

该标准共分为十三章。

其中包括范围,规范性引用文件,术语和定义,纸质档案数字化基本要求,档案整理,档案扫描,图像处理,图像存储,目录建库,数据挂接,数据验收,数据备份,数字化成果管理等。

该技术规范的出台结束了我国纸质档案数字化的初探阶段,标志着我国各级档案馆馆藏数字化技术的成熟。

二、主要条款简介第一章范围本标准规定了纸质档案数字化的主要技术要求。

本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。

第二章规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。

凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。

凡是不注日期的引用文件其最新版本适用于本标准。

GB/T 17235.1-1998 信息技术连续色调静态图像的数字压缩及编码第一部分:要求和指南。

GB/T 17235.2-1998 信息技术连续色调静态图像的数字压缩及编码第二部分:一致性测试GB/T 18894-2002 电子文件归档与管理规范。

第三章术语和定义下列术语和定义适用于该标准。

(1)数字化digitization用计算机技术将模拟信号转换为数字信号的处理过程。

(2)纸质档案数字化digitization of paper-based records采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。

(3)数字图像digital image表示实物图像的整数阵列。

一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。

纸质档案数字化技术规范

纸质档案数字化技术规范

纸质档案数字化技术规范根据国家档案局2005年4月30日发布的《纸质档案数字化技术规范》,制定本局纸质档案数字化技术规范。

特对图像扫描、图像处理、图像存储作如下说明。

一、图像扫描1、扫描方式a、根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。

大幅面档案可采用专用数码平台进行扫描或者采用图像拼接方式处理。

同一页面有两个以上文件,需分别扫描。

b、纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。

2、扫描色彩模式、分辨率及扫描格式扫描色彩模式、分辨率及扫描格式的选择见下表:彩色档案举例:带红头的文书档案。

对清晰度有较高要求的图纸可适当提高分辨率。

二、图像处理图像处理以无限还原档案原貌为标准,注意图像偏斜度、清晰度、失真度、排列顺序等等。

三、图像存储1、图像存储格式黑白原稿:*.tiff;彩色档案、图纸:*.pdf, jpg文件需通过pdf转换器来转换成pdf文件。

转换器可以网上下载。

2、图像文件的命名命名原则:以纸质档案目录数据库为依据,将每一份图像文件命名为档案目录数据库中该份文件的档号。

通过档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。

a、命名格式(一)对立卷改革之前的纸质文书档案进行扫描,其图像文件命名格式由全宗号、目录号、案卷号、顺序号所组成,各字段间用“-”连接,即以xxx-xxx-xxxx-xxxx.tiff(或pdf)表示,数据结构见下表:b、命名格式(二)立卷改革后形成的纸质文书档案的扫描,其图像文件命名由全宗号、年度、保管期限、档案室编件号等四部分组成,各字段间用“-”连接,即以xxx-xxxx-xxxx-xxxx.tiff (或pdf)表示,数据结构见下表:全宗号用三位代码标识,用阿拉伯数字标识某一属类全宗的顺序号。

如“002”表示2号全宗。

年度以四位阿拉伯数字标注公元纪年,如“2002”表示2002年。

最新档案数字化规范标准

最新档案数字化规范标准

最新档案数字化规范标准档案数字化是将传统的纸质档案转换为电子形式,以便于存储、检索和利用。

随着信息化时代的到来,档案数字化已成为档案管理工作的重要组成部分。

以下是最新档案数字化规范标准的具体内容:一、档案数字化的目的与意义档案数字化旨在提高档案的保存质量,延长档案的使用寿命,同时提高档案的利用效率和安全性。

通过数字化,档案可以更易于检索、复制和传播,满足现代社会对信息资源的需求。

二、档案数字化的基本原则1. 完整性:确保数字化过程中档案内容的完整性,不得遗漏任何部分。

2. 准确性:数字化后的档案应与原始档案保持一致,无误读或错误。

3. 可读性:数字化后的档案应清晰易读,便于电子设备上的查看和打印。

4. 安全性:在数字化过程中要确保档案信息的安全,防止数据泄露或损坏。

三、档案数字化的流程1. 档案预处理:包括档案的清洁、修复、分类和排序。

2. 扫描:使用高分辨率扫描仪对档案进行扫描,确保图像质量。

3. 图像处理:对扫描后的图像进行去污、去噪、矫正等处理,提高图像质量。

4. 格式转换:将图像转换为通用的电子格式,如PDF或JPEG。

5. 数据录入:将档案的元数据录入数字化管理系统。

6. 质量检查:对数字化后的档案进行质量检查,确保符合标准。

7. 存储与备份:将数字化档案存储在安全的服务器上,并进行定期备份。

四、档案数字化的技术要求1. 扫描分辨率:彩色档案推荐使用300dpi,黑白档案推荐使用600dpi。

2. 色彩管理:确保扫描过程中色彩的准确性和一致性。

3. 文件格式:推荐使用无损压缩的PDF/A格式,以保证档案的长期保存和兼容性。

4. 元数据标准:遵循国际标准,如Dublin Core或EAD,以便于档案的检索和管理。

五、档案数字化的安全管理1. 访问控制:设置用户权限,确保只有授权人员才能访问数字化档案。

2. 数据加密:对存储的档案数据进行加密处理,防止未授权访问。

3. 备份策略:制定定期备份计划,确保档案数据的安全和可恢复性。

纸质档案数字化规范

纸质档案数字化规范

纸质档案数字化规范
一、总体要求
1、纸质档案数字化必须贯彻落实“以人为本”的方针,尊重用户权益
实现信息共享。

2、纸质档案数字化的内容应充分反映历史价值、文化传承,合理应用
信息技术,实现信息资源的统一集成,确保信息安全与完整性。

二、技术标准
1、采用图像处理技术,对纸质档案进行拍摄和扫描,根据记录需求,
把纸质档案图像、音频、视频数据处理成图像格式、文本格式、文档
格式进行存储。

2、要求文件格式和质量达到标准,采用TIFF带压缩格式保存,便于
存储、检索和调阅,合理利用格式的优势,强化档案的管理、查阅等。

3、利用数据库技术、信息检索技术、图像检索技术等技术,帮助档案
馆实现档案资源的有效管理和识别与应用,优化档案管理能力。

三、管理规范
1、纸质档案数字化时必须完成鉴定,确定档案类别和合法性,保证清晰、完整的档案信息。

2、将原有的档案索引体系迁移至电子文档管理系统,以实现档案的集中、统一、有序管理,保证信息的安全。

3、对档案数字化过程,应记录处理环节,对每一步处理做出核实,并
记录正确性和完整性。

4、定期进行档案数字化管理培训和质量测试,保证档案数字化工作质量。

纸质档案数字化技术规范标准

纸质档案数字化技术规范标准

字化加工,将其转化为存储在磁带、磁盘、光盘等载体上
并能被计算机识别的数字图像或数字文本的处理过程。

3·3数字图像digital image

表示实物图像的整数阵列。一个二维或更高维的采样
并量化的函数,由相同维数的连续图像产生。在矩阵(或
其他)网络上采样——连续函数,并在采样点上将值最小
化后的阵列。
知识回顾 Knowledge Review
放映结束 感谢各位的批评指导!
谢 谢!
让我们共同进步
9 目录建库
• 9·1数据格式选择

目录建库应选择通用的数据格式。所选定的数据格式
应能直接或间接通过XML文档进行数据交换。
• 9·2档案著录

按照《档案著录规则》(DA/T18)的要求进行著录,建
立档案目录数据库。
• 9·3目录数据质量检查

采用人工校对或软件自动校对的方式,对目录数据库
的建库质量进行检查。核对著录项目是否完整、著录内容
• 破损严重、无法直接进行扫描的档案, 应先进行技术修复,折皱不平影响扫描质 量的原件应先进行相应处理(压平或烫平等) 后再进行扫描。
• 5·5档案整理登记
• 制作并填写纸质档案数字化加工过程 交接登记表单,详细记录档案整理后每份 文件的起始页号和页数。
• 5·6装订
• 扫描工作完成后,拆除过装订物的档 案应按档案保管的要求重新装订。恢复装 订时,应注意保持档案的排列顺序不变, 做到安全、准确、无遗漏。

7·1·1对图像偏斜度、清晰度、失真度等进行检查。
发现不符合图像质量要求时,应重新进行图像的处理。

7·1·2由于操作不当,造成扫描的图像文件不完整或

纸质档案数字化基本流程与技术要求内容

纸质档案数字化基本流程与技术要求内容

纸质档案数字化基本流程及技术要求纸质档案数字化的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份等。

具体流程如下:(一)档案整理在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保档案数字化质量。

1、目录数据准备按照《档案著录规则》(DA/T18)等的要求,规范档案中的目录内容。

包括确定档案目录的著录项、字段长度和内容要求。

如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,应进行修改。

(详见附件)2、拆除装订在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物;将档案原件的装订线拆除,排好顺序,不得出现任何漏缺页及顺序差错,更不能对档案原件有任何损坏。

3、区分扫描件和非扫描件按要求把同一案卷中的扫描件和非扫描件区分开。

普发性文件区分的原则是:无关的重份的文件要剔除,有正式件的文件可以不扫描原稿。

4、页面修整对破损严重、无法直接进行扫描的档案,应先进行技术修复、裱糊;折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等)后再进行扫描。

5、档案整理登记制作并填写纸质档案数字化加工过程登记表,详细记录档案整理后每份文件的起始页号和页数。

(二)档案扫描1、扫描方式(扫描前必须准备一台专业的高速扫描仪,并带平板)根据档案幅面的大小(A4、A3、AO等)选择相应规格的扫描仪或专业担描仪,如工程图纸可采用0号图纸扫描仪进行扫描。

普通A4纸质文件,采用高速扫描仪的自动进纸方式扫描;纸质过薄、透明的(如信纸、便签纸)采用高速扫描仪的平板扫描;纸质过厚、照片等档案采用高速扫描仪的平板扫描;对文件页面贴有附属小页面、纸张时,将大小页面单独在平板中扫描;2、扫描模式(纸质档案扫描一般采用黑白、灰度和彩色三种模式)页面为黑白两色,字迹清晰的、不带图片的档案材料,采用黑白方式;页面为黑白两色,清晰度较差或者带有图片的档案材料,以及页面多为彩色文字的档案,采用彩色或灰度模式(因情况而定);页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,采用彩色模式扫描。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

纸质档案数字化工作技术标准
1、档案前处理要求:
1)应对拟数字化的档案进行涉密性、完整性、有序性及档案实体与目录的一致性检查。

档案实体破损、残缺的要进行登记,征求同意后对破损、残缺档案进行裱糊抢救,目录错误的要予以修正,无数字化目录的要予以著录。

如果该档案为涉密档案,则不进行全文扫描,并予以标记。

2)扫描前,对档案进行拆卷并整理,对不平整的档案进行平整处理,对错误、漏编的页号进行修正或补编页号。

扫描结束,档案需进行恢复性、规范性整理装订。

拆卷和装订不能损害档案原件。

拆卷时不允许裁切档案纸张,装订时应尽量按原有顺序原孔装订,案卷不掉页,右边和底边整齐,左侧不及装订线的要加装订边。

2、档案整理要求
具体整理方法参照《机关档案业务建设规范》、《归档文件整理规范》。

档案整理的归档范围和保管期限参照国家档案局第8号令《机关文件材料归档范围和文书档案保管期限规定》。

具体任务包括:区分归档年度、鉴定保管期限、剔除重份文件、组卷、编写页码、打印目录、打印封面、打印备考表、盖归档章、填写档号项、装订、装盒、填写背脊、入库、上架等,具体以业务性标准规范标为准。

3、档案著录要求
(1)、需符合国家档案局发布的《纸质档案数字化技术规范》、《档案著录规则》和安徽省档案局发布的《文书档案文件级目录数据库结构与著录细则》在数字化加工方面的相关规定,并按太和县档案局要求,将档案数据著录进太和县档案局档案管理软件系统中。

著录的档案信息要求准确无错别字、符号正确、题名完整通顺、无缺项,对传统方法整理的档案案卷题名、会议记录类档案、无明确题名的通知等需总结完整通顺,符合著录规则,对不完整的题名需要按照要求自拟题名。

(2)、卷内目录需与案卷目录对应,按要求进行录入,并进行校对,确保准确,著录完成后按太和县档案局要求打印相应目录。

(3)、著录时,在文件、会议记录或其他档案材料中如遇到有人员职务任免、离退休、工资福利、关系调动、奖励处罚等的人名需要全部著录到人名项中。

4、扫描和图像处理要求:
1)扫描时应根据纸质档案的材质选择相应的扫描设备和扫描方式,避免纸张褶皱、撕裂、破损等情况的发生,保证档案不受损。

2)对纸张脆化、较古老、超薄的和不可拆卷的档案需要采用专业不拆卷非接触冷光源扫描仪进行扫描。

3)档案扫描图像色彩模式采用24位真彩式,采用TIFF格式存储,按照统一标准对图像文件命名,以目录数据库内该文件档号对扫描图像进行分文件夹命名,标准以太和县档案馆提供的技术标准为准。

A4纸张大小档案扫描的原始图像文件和修图后的图像文件,必须是TIFF格式,采取适当比例压缩,图像文件容量大小控制在500KB至1MB,A3纸张大小的图像文件控制在500KB至2MB。

特殊情况最大不超过5M。

压缩后的图像文件应清晰、完整,颜色无异常,放大100%比例时图像不失真、无锯齿点。

4)扫描分辨率一般为300dpi,对于案卷中出现字迹较小、较密集、贴有照片以及珍贵档案等情况,分辨率提高到600dpi。

扫描后的图像应清晰、不失真、完整、不影响图像的利用效果和打印后的效果,扫描图像的打印效果不能低于对应的复印效果。

5)对于档案中的“筒子页”,一般应平摊开后进行整幅扫描。

大幅页面可分页扫描后,拼接成一页。

6)扫描时应认真核对实际扫描页码、页数与前处理时填写的页码、页数是否一致,不一致时应注明具体原因和处理方法。

扫描时要保证放纸端正、不压边、不漏扫、错扫,严格确保图像质量,漏扫、压边的要及时补全、补正。

图像顺序要与原档案中页码顺序一致,不可颠倒错乱,不可出现多页、重复页或漏页现象。

7)图像处理后保证图像信息与原档案内容完全一致,不删除页面任何有用信息,包括正文内容、页眉、页脚、手写注释和印鉴等,不裁切纸张部分。

扫描的页面内容基本居中显示,不出现明显偏左或偏右现象。

不准出现页面内容残缺或将其它页面信息扫入本页的现象。

8)图像处理后左右偏斜度控制在2度以内,视觉上基本无偏差。

对方向不正确的图像进行旋转还原,以符合阅读习惯。

9)对图像页面中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等应进行去污处理。

对图像页面中出现的装订孔、装订洞等应进行技术处理,给予补全,保持和档案原件一致。

残缺页、破损页需用相应大小白纸裱糊后方可进行扫描。

处理过程中应遵循在不影响可读性和可理解性的前提下展现档案原貌的原则,由于档案本身因陈旧、破损或不洁等造成页面上有污点的,如果在页面视图下无法看清,或该污点嵌在文本行中无法清除,可不予清除。

10)保证扫描图像字迹清晰、颜色恰当,不宜过浅或过深,不出现字迹笔画残缺或字迹笔画叠合而
影响阅读的情况。

档案原件存在斑迹变质、颜色过浅、过深或深浅不一致时,保证档案原件能辨认的扫描图像也必须可以辨认。

纸张太薄或字体颜色过浓,扫描时倒映反面文字,文字上的污点无法去污时,采取措施保证正文文字可以看清楚。

11)同一份文件如果纸张大小一致,扫描后的图像大小也需要基本保持一致,合并成PDF文件后,不允许出现明显宽度、高度偏差。

同一份文件,如果纸质档案材质基本一样,扫描后的图片明暗度、色泽也需要基本保持一致。

同一份文件原则上采取同一型号同样设置扫描仪进行扫描,如遇特殊情况,需要高扫、平板同时扫描,也需要保持扫描图像分辨率、亮度、大小尺寸等一致。

相关文档
最新文档