纸质档案数字化的基本流程及技术要求

合集下载

档案数字化的服务方案

档案数字化的服务方案

档案数字化的服务方案随着信息技术的发展和应用,档案数字化已经成为各个领域的重要工作之一。

档案数字化的服务方案旨在将传统的纸质档案转化为数字化形式,以提高档案管理的效率和便利性。

本文将介绍档案数字化的服务方案及其优势。

一、数字化服务方案的流程档案数字化的服务流程主要包括以下几个步骤:1. 档案准备:对待数字化的档案进行分类、整理和清点,确保档案内容的完整性和准确性。

2. 扫描:使用高质量的扫描设备对纸质档案进行扫描,将其转化为数字化的图像文件。

3. 图像处理:对扫描得到的图像文件进行图像增强、去噪、裁剪等处理,以提高图像质量和可读性。

4. 文本识别:通过光学字符识别(OCR)技术,将图像文件中的文字转化为可编辑和可搜索的文本。

5. 数字化存储:将处理后的图像文件和文本文件存储在电子设备或云端服务器中,以实现长期保存和便捷访问。

二、档案数字化的服务方案优势1. 提高档案管理效率:数字化档案可以实现快速检索、高效共享和远程访问,大大提高了档案管理的效率。

不再需要翻阅大量纸质档案,只需在电脑上输入关键词即可找到需要的档案信息。

2. 节省空间和成本:数字化档案不再占用大量的实体空间,可以减少档案室和文件柜的使用,节省了办公空间和相关设备的成本。

3. 加强档案保护:纸质档案容易受到自然灾害、人为破坏和时间侵蚀的影响,数字化档案可以通过多重备份和安全控制,保证档案的安全性和完整性。

4. 方便信息共享和合作:数字化档案可以通过电子邮件、即时通讯工具和云端平台进行共享和合作,便于多人同时访问和编辑档案,提高了工作效率和协作能力。

5. 支持数据分析和挖掘:数字化档案可以进行数据挖掘和分析,发现隐藏在大量档案中的有价值信息,为决策和研究提供支持。

三、档案数字化服务方案的应用领域档案数字化的服务方案广泛应用于各个领域,包括但不限于以下几个方面:1. 政府机关和事业单位:政府机关和事业单位通常拥有大量的纸质档案,数字化服务方案可以帮助其提高档案管理效率,加强信息共享和协作,提升公共服务水平。

纸质档案数字化流程

纸质档案数字化流程

纸质档案数字化流程随着信息技术的快速发展,数字化已经成为了一个不可避免的趋势。

在这个数字化的时代,纸质档案的管理和保管也面临着巨大的挑战。

如何将纸质档案数字化,成为了许多企业和机构所关注的问题。

本文将从纸质档案数字化的流程、必要性、技术手段以及应用案例等方面进行探讨。

一、纸质档案数字化的流程纸质档案数字化的流程可以分为四个阶段:准备阶段、扫描阶段、数据处理阶段和归档阶段。

1. 准备阶段准备阶段是纸质档案数字化的第一步,主要是对纸质档案进行分类、整理和筛选。

在这个阶段中,需要先确定数字化的范围和目标,对纸质档案进行分类,根据档案的重要性和使用频率进行筛选,将需要数字化的纸质档案进行整理,清除多余的纸张和文件夹,调整文件的顺序和编号。

2. 扫描阶段扫描阶段是纸质档案数字化的核心环节,主要是将纸质档案转换成数字化的图像文件。

在这个阶段中,需要使用扫描仪将纸质档案进行扫描,将扫描的图像文件保存在计算机中。

在扫描的过程中,需要注意扫描的分辨率和色彩模式,以保证数字化的质量和准确性。

3. 数据处理阶段数据处理阶段是将数字化的图像文件进行编辑、整理和处理,主要是为了方便后续的使用和管理。

在这个阶段中,需要使用图像处理软件对数字化的图像文件进行编辑和整理,如对图像进行裁剪、旋转、缩放、调整亮度和对比度等操作,以及对图像进行OCR识别等处理,将图像文件转换成可编辑的文本文件。

4. 归档阶段归档阶段是将数字化的文档进行存储和管理,主要是为了方便后续的检索和使用。

在这个阶段中,需要将数字化的文档进行分类和编目,建立数字化档案库,以便于后续的检索和管理。

同时,需要对数字化的文档进行备份和保护,以避免数据的丢失和损坏。

二、纸质档案数字化的必要性纸质档案数字化的必要性主要体现在以下几个方面:1. 提高档案利用率纸质档案的管理和利用存在着许多的限制,如存储空间、检索效率、档案保护等问题。

而数字化可以将纸质档案转换成电子文档,提高档案的利用率和检索效率,方便用户的使用和管理。

档案数字化加工方案

档案数字化加工方案

档案数字化加工方案1. 简介档案数字化加工是将传统纸质档案通过扫描、OCR(光学字符识别)等技术转化为电子文档,实现档案数字化存储和管理的过程。

本文将介绍档案数字化加工的意义、流程以及相关技术和注意事项。

2. 档案数字化加工的意义2.1 提高档案存储和管理效率传统纸质档案存储和检索繁琐,档案数字化加工可以将档案转化为电子文档,实现快速检索和管理,大大提高存储和管理效率。

通过关键词检索等技术,可以快速定位所需档案,节省了大量寻找和整理的时间。

2.2 加强档案的安全性和可持续性纸质档案容易受到自然灾害、人为破坏等因素的影响,数字化档案可以通过数据备份和加密等措施提高档案的安全性。

另外,电子文档可以实现远程存储和备份,即使发生灾害也能够保证档案的可持续性。

2.3 便于档案的共享和利用数字化档案可以在不同地点、不同终端之间进行共享,便于多部门之间的协作和信息共享。

此外,数字化档案可以结合数据分析等技术,为决策和业务提供更多参考依据,提升档案的价值和利用率。

3. 档案数字化加工的流程档案数字化加工通常包括以下几个主要步骤:3.1 档案准备在数字化加工之前,需要对纸质档案进行整理和分类,确保档案的完整性和准确性。

同时,还需要评估档案的重要性和保密级别,为后续的数字化工作做好准备。

3.2 扫描和成像扫描是将纸质档案转化为数字化格式的关键步骤。

通过扫描设备可以将纸质档案逐页进行扫描,并生成对应的图像文件。

在扫描过程中,需要选择合适的扫描分辨率和格式,以及调整图像质量,保证数字化档案的清晰度和可读性。

3.3 文字识别和编目通过OCR技术可以将扫描的图像文件转化为可编辑的文本文件,实现对档案中文字的识别和提取。

在文字识别过程中,需要进行文本校对和编辑,确保准确性和完整性。

同时,还需要对档案进行编目和分类,建立合适的档案目录结构,方便后续的检索和管理。

3.4 数字档案存储和管理将生成的数字化档案进行存储和管理是数字化加工的最后一步。

最新档案数字化规范标准

最新档案数字化规范标准

最新档案数字化规范标准档案数字化是将传统的纸质档案转换为电子形式,以便于存储、检索和利用。

随着信息化时代的到来,档案数字化已成为档案管理工作的重要组成部分。

以下是最新档案数字化规范标准的具体内容:一、档案数字化的目的与意义档案数字化旨在提高档案的保存质量,延长档案的使用寿命,同时提高档案的利用效率和安全性。

通过数字化,档案可以更易于检索、复制和传播,满足现代社会对信息资源的需求。

二、档案数字化的基本原则1. 完整性:确保数字化过程中档案内容的完整性,不得遗漏任何部分。

2. 准确性:数字化后的档案应与原始档案保持一致,无误读或错误。

3. 可读性:数字化后的档案应清晰易读,便于电子设备上的查看和打印。

4. 安全性:在数字化过程中要确保档案信息的安全,防止数据泄露或损坏。

三、档案数字化的流程1. 档案预处理:包括档案的清洁、修复、分类和排序。

2. 扫描:使用高分辨率扫描仪对档案进行扫描,确保图像质量。

3. 图像处理:对扫描后的图像进行去污、去噪、矫正等处理,提高图像质量。

4. 格式转换:将图像转换为通用的电子格式,如PDF或JPEG。

5. 数据录入:将档案的元数据录入数字化管理系统。

6. 质量检查:对数字化后的档案进行质量检查,确保符合标准。

7. 存储与备份:将数字化档案存储在安全的服务器上,并进行定期备份。

四、档案数字化的技术要求1. 扫描分辨率:彩色档案推荐使用300dpi,黑白档案推荐使用600dpi。

2. 色彩管理:确保扫描过程中色彩的准确性和一致性。

3. 文件格式:推荐使用无损压缩的PDF/A格式,以保证档案的长期保存和兼容性。

4. 元数据标准:遵循国际标准,如Dublin Core或EAD,以便于档案的检索和管理。

五、档案数字化的安全管理1. 访问控制:设置用户权限,确保只有授权人员才能访问数字化档案。

2. 数据加密:对存储的档案数据进行加密处理,防止未授权访问。

3. 备份策略:制定定期备份计划,确保档案数据的安全和可恢复性。

DA/T纸质档案数字化技术规范

DA/T纸质档案数字化技术规范

纸质档案数字化技术规范DA/T31-20051 范围本标准规定了纸质档案数字化的主要技术要求;本标准适用于用扫描仪对各种纸质档案的数字化加工处理;2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款;凡是注日期的引用文件,其随后所有的修改单不包括勘误的内容或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本;凡是不注日期的引用文件,其最新版本适用于本标准;GB/T 连续色调静态图像的数字压缩编码GB/T 连续色调静态图像的数字压缩编码GB/T 18894 2002 电子文件归档与管理规范ITUCCITTG3 二值图像压缩算法ITUCCITTG4 二值图像压缩算法DA/T18 1999 档案著录规则档案管理软件功能要求暂行规定国家档案局档发20016号3 术语和定义下列术语和定义适用于本标准;数字化 Digitization用计算机技术将模拟图像转换为数字图像的处理过程;纸质档案数字化Digitization of Paper Based Records对普通黑色字迹清晰的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程;3.3数字图像 Digital Image表示景物图像的整数阵列;一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生;在矩阵或其他网络上采样一连续函数,并在采样点上将值最小化后的阵列;3.4黑白二值图像 Binary Image只有黑白两级灰度的数字图像;它对应于黑和白的两种状态文字稿、线条图、指纹图等;3.5连续色调静态图像 Continuous tone Still Image以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像;3.6失真度 Distortion Measure对档案原件进行数字化转换后,在同等测试环境下,数字图像与档案原件色彩、几何、压缩算法等差值;3.7可懂度 intelligibility表示数字图像向人或机器提供信息的能力;3.8清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表现;3. 9分辨率Resolution指单位长度内图像包含的点数或像素数;TIFF Tagged Tmage File Format标记图像文件格式;一种基于标记的无损不丢失信息压缩格式,用于在应用程序之间和计算机平台之间交换文件;因为它存储图像细微层次的信息非常多,图像的质量也得以提高,故而非常有利于原件为黑白档案的复制储存;JPEG Joint photographic Experts Group联合照片专家组;一种丢失少量信息的压缩格式,尤其适用于屏幕和打印显示,支持所有主要计算机平台和Web浏览器;JPEG格式文件小,影像质量多数情况下均可接受;考虑储存空间及传输效率,原件为彩色的档案可迁此格式复制储存;4 数字化基本流程纸质档案数字化的基本流程主要包括案卷整理、目录建库、批量扫描、数据处理、信息存储、检索利用等工序;4.1 案卷整理对需要扫描的案卷进行适当整理,做出标识;4.2 目录建库为数字化的档案检索而建立必要的目录数据库;4.3 批量扫描按照档案数字化具体任务的整体安排按计划分批次进行扫描;4.4 数据处理4.4.1 对扫描图像进行校对,确保图像完整无误,并视需要对有问题的扫描图像进行纠偏、去污、拼接等技术处理;4.4.2 对裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件,以及数据的挂接、检验、上载、质量检查和备份;4.5 信息存储根据不同的扫描图像选择适当数据格式、编码方式和存储介质对信息进行保存;4.6 检索利用按用户需求提供检索利用;5 案卷整理在批量扫描之前,按下述步骤对案卷进行整理,确保档案数字化质量;5.1 分件5.1.1 把同一案卷中的扫描件和非扫描件分开;5.1.2 在扫描件中将大图、照片插入指示页,便于扫描工序批量扫描,实际图像放在图像处理时进行重扫,替换指示页;5.1.3 填写数据加工过程处理单见附录A,对需要特殊处理的页,标识清楚;5.2 分页对批量扫描前的档案进行页号、件号的标注;如在标注中与原档案中的件数、页号不一致,应以此为准;5.3 拆卷去除档案中原来的装订物,以便后续扫描工作的进行;5.4 装卷按档案保管要求恢复原装订;6 建目录库6.1 目录著录根据DA/T18确定档案著录项,并进行著录;6.2 数据格式选择所选定的数据格式通用,应能直接或间接与DBF文件格式或通过XML文档进行数据交换;6.3 目录输入将著录好的目录输入计算机内,建立机读目录数据库;7 批量扫描7.1 扫描方式纸质档案扫描可采用黑白二值图像和连续色调图像两种方式;7.1.1 页面为单色文字的纸质档案,宜采用黑白二值图像扫描;页面为多色文字图像的档案文件,可采用连续色调图像扫描;7.1.2 字迹清晰、不带图片的档案材料,采用黑白二值图像扫描;清晰度较差或带有图片的档案材料,可采用连续色调图像扫描;7.2 分辨率选择7.2.1 单色页面档案文件,扫描分辨率一般建议选择100~200dpi;7.2.2 彩色页面档案文件,扫描分辨率可选择100dpi以上参数值进行;7.2.3 大幅面档案文件,如工程图纸、报纸等尺寸超过A3的,可选用大幅面图像扫描仪如A0、大幅面数码平台、缩微照像后胶片数字转换,也可以采用小幅面扫描后的图像拼接;扫描分辨率应选择1OOdpi以上;7.2.4 需要时可根据原件的清晰度适当调整扫描分辨率;如原件质量较差且尺寸较小,可适当提高分辨率;反之也可相应减少分辨率,增减的多少以扫描后图像按原尺寸显示后是否清晰为准;7.3 特殊页面的扫描7.3.1 粘贴页与表格对于粘贴折页,可用大幅面扫描仪扫描,或先分部扫描后拼接;对部分字体很小、字迹密集的情况,可适当提高扫描分辨率,选择灰度扫描或彩色扫描,采用局部深化技术解决;对字迹与表格颜色深度不同的,采用局部淡化技术解决7.3.2 一般文本流程图采用适当的分辨率扫描及局部深化技术,确保文本流程图清晰;同时采用不同设备满足文本流程图的扫描工作;7.3.3 插图采用高分辨率灰度或彩色扫描技术将插图与文字一起扫描,保证原来的页面布局和插图清晰;7.3. 4照片对于页面中有黑白或彩色照片的文件,采用JPEG格式扫描,确保照片清晰度,同时可避免图像存储空间过大;7.4 文件命名方式7.4.1 建立文件夹扫描时文件夹的建立应按档案实体分级建立,其中的每一份文件也需要单独建立文件夹;7.4.2 文件夹命名方法,以档案实体中的档号命名,一般为3位数,不足3位数的左边补“0”;8 数据处理8.1 图像处理8.1.1 纠偏对扫描过程中出现的偏斜图像进行整体纠正,保证数字图像的偏斜角度小于1度;图像偏斜不超过页面内半个文字;8.1.2 去污去除数字图像中影响可懂度的杂质;档案数字化图像的去污,应遵循在不影响可懂度的前提下展现原貌的原则;8.1.2.1 局部去污,如去除黑边、污点;8.1.2.2 整体去污,可一次性去除页面上的污渍;8.1.3 拼接为保证档案数字化图像的整体性,对幅面分离的数字图像进行拼接;8.1.4 校对8.1.4.1 一次校对,检查扫描完的图像质量情况,对不合格的图像进行标记退回重新扫描;8.1.4.2 纠错处理,根据一次校对中提出的诸如污渍、黑边、偏斜、图像质量等问题,结合数据加工过程处理单见附录A情况,对每份图像进行相应的处理;8.1.4.3 二次校对,对一次校对及数据处理后的数字图像再次进行检查,并标记图像处理过程中不清晰的页面;不合格的退回重新处理;8.2 数据质量检查8.2.1 文字录入质量对录入域清单上所标明的各著录项的文字录入进行正确率控制,保证错误率低于3‰;8.2.2 图像质量对纸质文件扫描后形成的图像文件进行清晰度、污渍、黑边、偏斜等问题的控制,以达到要求的图像质量;保证扫描后的数字图像清晰,便于清楚阅读,适应各种纸张和手写、印刷字的情况;8.3 数据挂接档案条目数据与图像文件的对应准确程度的控制;在生成裸数据光盘之前,根据资料整理信息、扫描前的标引信息及卷内文件页号信息核查图像文件总数是否与实际文件数相等,如不相等则不能生成裸数据光盘,可打印出清单,回退给图像处理人员补扫;8.4 数据检验8.4.1 将裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件;8.4.2 对数据进行检验,给出合格或不合格结论;8.4.3 将数字加工后的数据转换为裸数据光盘格式,拷贝到活动硬盘上;8.4.4 系统应自动记录检验进度;8.5 数据上载档案数字化各工序的数据通过网络及时上载到数据服务器端汇总,其中数字图像自动搜索对应的目录数据,加入对应的电子地址数字图像文件名,建立起一一对应的关系;8.6 数据备份定期对服务器的各类数据进行备份,防止数据丢失;9 信息存储以JPEG数字压缩编码或TIFF国际通用标准格式;采用国际标准的传真文档压缩格式压缩后,分别按页编号后分页存储;数字图像的存储管理应保持原纸质档案的保管模式对应存储;9.1 压缩存储格式档案数字图像格式采用TIFF和JPEG数字压缩编码;9.1.1 黑白二值图像黑白二值扫描图像文件采用TIFFCCITT G3格式二值图像压缩算法,压缩率就绪Cr为15:1;也可采用TIFFCCIFF G4格式二值图像压缩算法,压缩率Cr为3 O:1;9.1.2 连续色调静态图像连续色调静态图像采用JPEG数字压缩编码,平均压缩率cr为15:1;9.2 编码方式应尽是采用实时操作性强的编码方式;失真度编码,用较少的比特率获得较好的图像质量;无失真编码,以低压缩保持信息的不失真;一般情况下宜采用国际通用编解码算法;9.3 存储方式与载体可选用在线和离线、不同载体进行存储;10 检索利用10.1 检索利用方式档案数字图像检索利用可采用单机、局域网和互联网三种方式;局域网中传输利用,应保证数据在内部局域网10Base T带宽下,平均1秒内显示响应完成;互联网中传输利用,互联网56Kbit/s带宽下,平均5秒内显示响应完成;为此要求一般每页档案数字图像的存储容量为50K以内;10.2 检索软件配置检索软件应符合国家档案局制定的档案管理软件功能要求暂行规定的各项要求;检索软件应具备目录检索与档案数字图像方便调阅的基本功能;。

纸质档案数字化规范

纸质档案数字化规范

纸质档案数字化规范
一、总体要求
1、纸质档案数字化必须贯彻落实“以人为本”的方针,尊重用户权益
实现信息共享。

2、纸质档案数字化的内容应充分反映历史价值、文化传承,合理应用
信息技术,实现信息资源的统一集成,确保信息安全与完整性。

二、技术标准
1、采用图像处理技术,对纸质档案进行拍摄和扫描,根据记录需求,
把纸质档案图像、音频、视频数据处理成图像格式、文本格式、文档
格式进行存储。

2、要求文件格式和质量达到标准,采用TIFF带压缩格式保存,便于
存储、检索和调阅,合理利用格式的优势,强化档案的管理、查阅等。

3、利用数据库技术、信息检索技术、图像检索技术等技术,帮助档案
馆实现档案资源的有效管理和识别与应用,优化档案管理能力。

三、管理规范
1、纸质档案数字化时必须完成鉴定,确定档案类别和合法性,保证清晰、完整的档案信息。

2、将原有的档案索引体系迁移至电子文档管理系统,以实现档案的集中、统一、有序管理,保证信息的安全。

3、对档案数字化过程,应记录处理环节,对每一步处理做出核实,并
记录正确性和完整性。

4、定期进行档案数字化管理培训和质量测试,保证档案数字化工作质量。

纸质档案数字化工作流程

纸质档案数字化工作流程

纸质档案数字化工作流程纸质档案数字化工作流程一般包括以下步骤:1. 档案检索和分类:首先,检索需要数字化的纸质档案并进行分类,以确保工作的有序进行。

2. 档案准备:对于需要数字化的纸质档案,进行整理、清洁和修复,以确保数字化的质量。

3. 扫描:使用专业的扫描设备将纸质档案扫描为数字形式。

扫描设备应具备高分辨率和自动化功能,以提高效率和准确性。

4. 图像处理:通过对扫描得到的图像进行调整、剪裁和增强等处理,以提高图像的清晰度和可读性。

5. OCR技术处理:利用OCR(Optical Character Recognition,光学字符识别)技术,将扫描得到的图像中的文字内容转化为可编辑的文本格式。

6. 数据录入和整理:将OCR识别的文本内容进行整理和校对,并按照一定的规则和结构进行归档和存储。

7. 数字存储和备份:将数字化的档案以适当的格式(如PDF、JPEG)存储在电脑、服务器或云存储中,并建立相应的备份措施,以防止数据丢失。

8. 元数据添加:为每个数字档案添加元数据,包括文件名、创建日期、所有者信息等,以便后续的搜索和管理。

9. 数据质量检查:对数字档案进行质量检查,确保数字化的准确性和完整性,并解决可能出现的问题。

10. 档案管理系统整合:将数字化的档案整合到档案管理系统中,以便对档案进行索引、检索和共享。

11. 安全存储和访问控制:为数字档案设置合适的访问权限和安全措施,以保护档案的机密性和完整性。

12. 档案销毁或归档:根据需要,对原始的纸质档案进行销毁或进行归档,以释放空间和维护档案的长期保存。

这些步骤可根据具体的档案数字化需求进行调整和扩展,以满足不同组织和机构的需求。

纸质档案整理及数字化的工作流程

纸质档案整理及数字化的工作流程

纸质档案整理及数字化的工作流程下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。

文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!纸质档案整理及数字化的工作流程一般包括以下步骤:1. 档案收集确定需要整理和数字化的纸质档案范围。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

纸质档案数字化的基本流程及技术要求一、概述档案是人类社会实践活动的真实记录,是党和国家宝贵的历史文化财富。

这些具有查考凭证作用、依据作用和参考作用的档案,是人们从事科研、生产等工作的必要条件和有力工具。

档案也是各企事业单位运作各个环节的真实记录,是极其珍贵的原始资料和重要的信息资源。

准确、系统、完整的档案是单位工作的重要参考资料,是社会的重要财富。

随着计算机技术、扫描技术、OCR技术、数字摄影技术(录音、录像)、数据库技术、多媒体技术、存储技术的发展而产生的一种新型档案信息形态,它把各种载体的档案资源转化为数字化的档案信息,以数字化的形式存储,网络化的形式互相连接,利用计算机系统进行管理,形成一个有序结构的档案信息库,及时提供利用,实现资源共享。

档案数字化是数字档案建设最基础的工作,传统载体的档案经高科技技术加工成数字档案形式,通过局域网、政务网、互联网进行计算机检索、阅读电子档案,为迎接档案信息服务新环境的挑战,提高管理水平、提高效率,增强档案业务部门的服务水平,为档案内部管理及面向客户服务提供高效率的全面服务。

档案作为一种原生信息资源,其重要性正日益凸显出来,逐步掌握信息技术为档案工作服务,为社会主义经济建设服务,为社会主义精神文明建设服务。

二、基本原则纸质档案数字化的基本原则是使档案信息资源准确方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。

属于归档范围且应永久或长期保存的、社会利用价值高的档案可列入数字化加工的范围,并按照《中华人民共和国行业标准(DA/T 31—2005)纸质档案数字化技术规范》对纸质档案进行数字化。

根据档案幅面的大小(如A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪,如工程图纸采用0号图纸扫描仪进行扫描。

纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。

扫描过程中,确保不对档案原件造成破坏,保证档案扫描图像与原件一致、整洁、清晰。

加强对纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。

三、基本流程及技术要求纸质档案数字化的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份、成果管理等。

具体流程如下:(一)、档案整理在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保档案数字化质量。

1、目录数据准备按照《档案著录规则》(DA/T18)等的要求,规范档案中的目录内容。

包括确定档案目录的著录项、字段长度和内容要求。

如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,应进行修改。

(详见附件)2、拆除装订拆除文件中的装订物,拆除装订物时应注意保护档案不受损害;在不去除装订物情况下,影响扫描工作进行的档案。

3、区分扫描件和非扫描件按要求把同一案卷中的扫描件和非扫描件区分开。

普发性文件区分的原则是:无关的重份的文件要剔除,有正或件的文件可以不扫描原稿。

4、页面修整对破损严重、无法直接进行扫描的档案,应先进行技术修复、裱糊;折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等)后再进行扫描。

5、档案整理登记制作并填写纸质档案数字化加工过程交接登记表单,详细记录档案整理后每份文件的起始页号和页数。

(二)、档案扫描1、扫描方式(扫描前必须准备一台专业的高速扫描仪,并带平板)根据档案幅面的大小(A4、A3、AO等)选择相应规格的扫描仪或专业担描仪,如工程图纸可采用0号图纸扫描仪进行扫描。

普通A4纸质文件,采用高速扫描仪的自动进纸方式扫描;纸质过薄、透明的(如信纸、便签纸)采用高速扫描仪的平板扫描;纸质过厚、照片等档案采用高速扫描仪的平板扫描;对文件页面贴有附属小页面、纸张时,将大小页面单独在平板中扫描;2、扫描模式(纸质档案扫描一般采用黑白、灰度和彩色三种模式)页面为黑白两色,字迹清晰的、不带图片的档案材料,采用黑白方式;页面为黑白两色,清晰度较差或者带有图片的档案材料,以及页面多为彩色文字的档案,采用彩色或灰度模式(因情况而定);页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,采用彩色模式扫描。

3、分辨率选择采用黑白、256级灰度模式扫描的文件,其分辨率选择为200DPI;采用24位为彩色模式扫描的文件,其分辨率选择为100DPI;(以上模式分辨率的设定以A4纸张为标准,其他规格纸张酌情调理)扫描的线数、阀值、亮度、灰度、对比度等值可根据所扫描文件材料的清晰度进行适当的调整;需要时可根据原件的清晰度适当调整扫描分辨率。

如原件质量较差且尺寸较小,可适当提高分辨率;反之也可相应减少分辨率,增减的多少以扫描后图像按原尺寸显示后是否清晰为准;粘贴折页与表格,对于粘贴折页,可用大幅面扫描仪扫描,或先部分扫描后拼接;对部分字体很小、字迹密集的情况,可适当提高扫描分辨率,选择灰度扫描或彩色扫描,采用局部深化技术解决;对字迹与表格颜色深度不同的,采用局部淡化技术解决。

(三)、图像深处理将扫描后的文档一一保存,保存为TIFF格式,再针对每份影像页面进行深处理,以获得最好的图像质量,保证图像完整、端正、无扭区、版面无暗影、无干扰信息,主要完成影像深处理包括:去黑边、去污点、纠偏等,处理完的图像保存格式为PDF。

纠偏:对扫描过程中出现的偏斜图像进行整体纠正,包括自校和手校,保证数字图像的偏斜角度小于1度(图像偏斜不超过页面内半个文字);旋转:按方字方向将图片旋转至正确方向,没有文字的图片,判断其方向后进行左旋、右旋、翻转、旋转等工具;去污:对图像页面中出现的影响图像质量的杂质,去除数字图像中影响可懂度的杂质,如去除黑边、多余边、污点,文字中的黑点不用考虑;载边:采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。

删除空白页:将扫描后页面之间的空白页进行删除;断字修补:对部分文字不清楚可进行修补;反白字修正:将部分反白文字可进行描述;分割:将A3幅面的文件分割为两份A4幅面的文件;拼接:对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。

(四)、图像处理质检主要对完成图像深处理的检查,不合要求的返回上一环节重新处理,如以下问题:由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描;对图像偏斜度、清晰度、失真度等进行检查。

发现不符合图像质量要求时,应重新进行图像的处理;图像处理的是否得当,严重的应重扫,处理不当的应重新处理;扫描图像页码顺序是否与原文件一致,有无漏扫、多扫(重复)、纸张倒置等情况;顺序:如果页码不连续,与原文不一致,需对页面进行排序;漏扫:将漏扫的页面重新扫描,并插入到正确的位置;多扫:将多扫页面删除;倒置:不符合要求的需进行调整,保持与原文一致。

(五)、图像存储纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。

多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。

文件的保存格式为TIFF,图片的保存格式为JPG,保存到指定的路径,便于准确挂接入库,与档案管理软件中的目录建立一一对应的关系。

再对数字化后的文档进行批量处理,处理完将保存为PDF格式;最后将所有文档批量转换为可以复制、检索利用的双层PDF格式,然后进行光盘刻录,确保刻录好的光盘能正确地读出,并做好标识标签。

注:禁止用Word文档保存扫描图像。

(六)、目录建库按照《档案著录规则》(DA/T18)的要求进行著录,建立档案目录数据库。

目录建库应选择通用的数据格式。

所选定的数据格式应能直接或间接通过XML文档进行数据交换。

注:采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。

核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。

(七)、数据挂接1、挂接前的数据关联检查以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。

将图像文件存储到相应文件夹时,要认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中该份文件的页数是否一致,图像文件的总数与目录数据库中文件的总数是否相同等。

通过每一份图像文件的文件名与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。

2、汇总挂接档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为"合格"后,通过网络及时加载到数据服务器端汇总。

通过编制程序或借助相应软件,可实现目录数据对相关联的数字图像的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。

(八)、数据验收一个全宗的档案,数字化转换质量抽检的合格率达到95%以上(含95%)时,给予以验收“通过”。

目录数据库与图像文件挂接错误,或目录数据库、图像文件之一出现不完整、不清晰、有错误等质量问题时,抽检标记为"不合格"。

验收"通过"的结论,必须经分管领导审核、签字后方有效。

(九)、双层PDF输出、数据备份1、双层PDF输出对验收合格后的文件进行双层PDF格式输出。

PDF格式具有双层结构,即图层和文字层,可以100%保留原始版面效果,又可以通过下层的文字信息支持选择、复制、全文检索等功能。

2、数据备份经验收合格的完整数据应及时进行备份。

进行一式两份DVD光盘刻录提交到客户单位,著录条目和全文数据向客户单位数据库迁移。

移交前检测光盘读取性能,抽查刻录好的光盘影像质量,主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。

不合格的需重新刻录。

数据备份后应在备份介质上标注好盘内文件内容、类别、存入日期及光盘编号等,以便查找和管理。

对保密的需标明密级。

(十)、数字化成果管理可选用在线和离线方式,配合相应的软件对数字化成果进行管理;应加强对纸质档案数字化成果的管理,确保其安全、完整和长期可用;纸质档案数字化成果提供网上检索利用时,应有制作单位的电子标识,并根据具体情况分别采用可下载或不可下载的数据格式。

(十一)、扫描注意事项扫描前必需对文档进行拆除装订物,并检查文档内是否藏有干扰物(如钉书钉、碎纸等),以免产生卡纸、损坏扫描仪,务必保持文档干净送入扫描仪中;对破损严重、无法进行扫描的原件要先进行修复、裱糊;褶皱不平影响扫描质量的原件应先压平再进行扫描;对纸质过薄、透明的(如信纸、便签纸)、纸质过厚、照片等采用高速扫描仪的平板扫描;对文件页面贴有附属小页面、纸张时,将大小页面单独在平板中扫描;扫描完每一份文件,要对照原文仔细检查扫描是否清晰、完整;按要求使用扫描仪、清洗,并对每次使用完扫描仪进行保洁,检查是否关闭电源。

相关文档
最新文档