档案数字化技术规范
纸质档案数字化技术规范

纸质档案数字化技术规范根据国家档案局2005年4月30日发布的《纸质档案数字化技术规范》,制定本局纸质档案数字化技术规范。
特对图像扫描、图像处理、图像存储作如下说明。
一、图像扫描1、扫描方式a、根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。
大幅面档案可采用专用数码平台进行扫描或者采用图像拼接方式处理。
同一页面有两个以上文件,需分别扫描。
b、纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。
2、扫描色彩模式、分辨率及扫描格式扫描色彩模式、分辨率及扫描格式的选择见下表:彩色档案举例:带红头的文书档案。
对清晰度有较高要求的图纸可适当提高分辨率。
二、图像处理图像处理以无限还原档案原貌为标准,注意图像偏斜度、清晰度、失真度、排列顺序等等。
三、图像存储1、图像存储格式黑白原稿:*.tiff;彩色档案、图纸:*.pdf, jpg文件需通过pdf转换器来转换成pdf文件。
转换器可以网上下载。
2、图像文件的命名命名原则:以纸质档案目录数据库为依据,将每一份图像文件命名为档案目录数据库中该份文件的档号。
通过档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
a、命名格式(一)对立卷改革之前的纸质文书档案进行扫描,其图像文件命名格式由全宗号、目录号、案卷号、顺序号所组成,各字段间用“-”连接,即以xxx-xxx-xxxx-xxxx.tiff(或pdf)表示,数据结构见下表:b、命名格式(二)立卷改革后形成的纸质文书档案的扫描,其图像文件命名由全宗号、年度、保管期限、档案室编件号等四部分组成,各字段间用“-”连接,即以xxx-xxxx-xxxx-xxxx.tiff (或pdf)表示,数据结构见下表:全宗号用三位代码标识,用阿拉伯数字标识某一属类全宗的顺序号。
如“002”表示2号全宗。
年度以四位阿拉伯数字标注公元纪年,如“2002”表示2002年。
河南档案馆纸质档案数字化技术规范

河南省档案馆纸质档案数字化技术规范1 范围本标准规定了河南省档案馆纸质档案数字化的主要技术要求。
本标准适用于河南省档案馆采用扫描设备对纸质档案数字化加工处理及数字化成果的管理,适用于省直向省档案馆移交纸质档案数字化成果的单位。
各市、县级综合档案馆参照执行。
2 规范性引用文件本规范根据中华人民共和国档案行业标准DA/T 31-2017《纸质档案数字化规范》,结合河南省档案馆纸质档案数字化工作实际情况制定。
3 术语和定义GB/T 20530—2006、DA/T 1-2000、DA/T 18-1999界定的以及下列术语和定义适用于本文件。
3.1 数字化 digitization利用计算机技术将模拟信号转换为数字信号的处理过程。
3.2 数字图像 digital image表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
3.3 纸质档案数字化 digitization of paper-based records采用扫描仪等设备对纸质档案进行数字化加工,使其转化为存储在磁带、磁盘、光盘等载体上的数字图像,并按照纸质档案的内在联系,建立起目录数据与数字图像关联关系的处理过程。
3.4 分辨率 resolution单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。
4 总则4.1 河南省档案馆根据档案的珍贵程度、开放程度、利用率、亟待抢救程度、数字化资金情况等因素统筹规划、科学开展纸质档案数字化工作。
制定数字化规划与年度计划,有目标有计划地开展数字化工作。
4.2 纸质档案数字化的基本环节主要包括:档案出库、数字化前处理、目录数据库建立、档案扫描、图像处理、数据挂接、数字化成果验收与移交、档案归还入库,具体流程见附录A。
4.3 应采取有效的管理和技术手段,确保纸质档案数字化成果质量。
纸质档案数字化应遵循档案管理的客观规律,真实反映档案内容,最大程度地展现档案原貌。
纸质档案数字化规范

纸质档案数字化规范纸质档案数字化规范是指将纸质档案通过扫描、录入等技术手段转换成电子形式的一种操作规范。
纸质档案数字化的目的是提高档案管理的效率和便捷性,降低档案的保存成本,并便于档案的检索和共享。
下面是纸质档案数字化的规范要点:1. 核查和整理在数字化过程之前,必须对纸质档案进行核查和整理。
首先,核查档案是否完整,并将缺失或损坏的档案进行补充或修复。
其次,将档案按照分类、时序等原则进行整理,确保顺序和清晰度。
2. 扫描和录入将整理好的纸质档案通过扫描仪或其他相关设备转换为电子文件。
扫描时应保证文件清晰度和色彩准确性。
对于文字类档案,可以通过OCR技术进行文字的自动识别;对于图像、图片类档案,可以进行编辑和修复,以便更好地保留档案的内容和质量。
3. 统一命名和分类对于数字化后的档案文件,应进行统一的命名和分类。
文件名可以采用有意义的命名方式,如档案编号、日期等,以方便检索。
同时,将档案按照不同的类别、主题、格式等进行分类标注,并建立相应的文件夹或目录结构。
4. 元数据录入和索引建立对于数字化后的档案文件,应进行元数据的录入和索引的建立。
元数据包括档案的基本信息,如档案名称、创建日期、创建者、所属机构等;索引是对档案的内容和属性进行关键词标注,以便更方便地进行检索和查找。
5. 存储和备份数字化后的档案文件应按照一定的存储结构进行保存和备份。
可以采用硬盘、服务器、云存储等方式进行存储,并设定访问权限和安全措施,以保护档案的完整性和安全性。
同时,定期进行档案的备份和恢复,以防止文件丢失或损坏。
6. 数据质量和准确性的验证在数字化过程之后,需要对档案的数据质量和准确性进行验证。
首先,对数字化后的档案进行比对和校验,确保数字化结果与原始档案的一致性。
其次,进行数据质量的检测和修复,如修正错别字、调整图像亮度等,以提高档案的可读性和准确性。
7. 档案的检索和共享数字化后的档案应具备便捷的检索和共享功能。
可以通过建立档案管理系统或数据库,进行关键词检索、全文检索等操作,以方便用户查找所需档案。
最新档案数字化规范标准

最新档案数字化规范标准档案数字化是将传统的纸质档案转换为电子形式,以便于存储、检索和利用。
随着信息化时代的到来,档案数字化已成为档案管理工作的重要组成部分。
以下是最新档案数字化规范标准的具体内容:一、档案数字化的目的与意义档案数字化旨在提高档案的保存质量,延长档案的使用寿命,同时提高档案的利用效率和安全性。
通过数字化,档案可以更易于检索、复制和传播,满足现代社会对信息资源的需求。
二、档案数字化的基本原则1. 完整性:确保数字化过程中档案内容的完整性,不得遗漏任何部分。
2. 准确性:数字化后的档案应与原始档案保持一致,无误读或错误。
3. 可读性:数字化后的档案应清晰易读,便于电子设备上的查看和打印。
4. 安全性:在数字化过程中要确保档案信息的安全,防止数据泄露或损坏。
三、档案数字化的流程1. 档案预处理:包括档案的清洁、修复、分类和排序。
2. 扫描:使用高分辨率扫描仪对档案进行扫描,确保图像质量。
3. 图像处理:对扫描后的图像进行去污、去噪、矫正等处理,提高图像质量。
4. 格式转换:将图像转换为通用的电子格式,如PDF或JPEG。
5. 数据录入:将档案的元数据录入数字化管理系统。
6. 质量检查:对数字化后的档案进行质量检查,确保符合标准。
7. 存储与备份:将数字化档案存储在安全的服务器上,并进行定期备份。
四、档案数字化的技术要求1. 扫描分辨率:彩色档案推荐使用300dpi,黑白档案推荐使用600dpi。
2. 色彩管理:确保扫描过程中色彩的准确性和一致性。
3. 文件格式:推荐使用无损压缩的PDF/A格式,以保证档案的长期保存和兼容性。
4. 元数据标准:遵循国际标准,如Dublin Core或EAD,以便于档案的检索和管理。
五、档案数字化的安全管理1. 访问控制:设置用户权限,确保只有授权人员才能访问数字化档案。
2. 数据加密:对存储的档案数据进行加密处理,防止未授权访问。
3. 备份策略:制定定期备份计划,确保档案数据的安全和可恢复性。
纸质档案数字化规范

纸质档案数字化规范
一、总体要求
1、纸质档案数字化必须贯彻落实“以人为本”的方针,尊重用户权益
实现信息共享。
2、纸质档案数字化的内容应充分反映历史价值、文化传承,合理应用
信息技术,实现信息资源的统一集成,确保信息安全与完整性。
二、技术标准
1、采用图像处理技术,对纸质档案进行拍摄和扫描,根据记录需求,
把纸质档案图像、音频、视频数据处理成图像格式、文本格式、文档
格式进行存储。
2、要求文件格式和质量达到标准,采用TIFF带压缩格式保存,便于
存储、检索和调阅,合理利用格式的优势,强化档案的管理、查阅等。
3、利用数据库技术、信息检索技术、图像检索技术等技术,帮助档案
馆实现档案资源的有效管理和识别与应用,优化档案管理能力。
三、管理规范
1、纸质档案数字化时必须完成鉴定,确定档案类别和合法性,保证清晰、完整的档案信息。
2、将原有的档案索引体系迁移至电子文档管理系统,以实现档案的集中、统一、有序管理,保证信息的安全。
3、对档案数字化过程,应记录处理环节,对每一步处理做出核实,并
记录正确性和完整性。
4、定期进行档案数字化管理培训和质量测试,保证档案数字化工作质量。
档案数字化规则说明

档案数字化规则说明随着信息技术的迅猛发展,档案数字化成为了提高档案管理效率和便利性的重要手段。
为了确保档案数字化工作的规范性和规则性,本文将详细介绍档案数字化的规则说明。
一、背景介绍随着信息时代的到来,传统的纸质档案已经无法满足现代化管理需求。
档案数字化作为一种先进的管理方式,具有高效、节省空间和便携性等优势,因此受到了广泛的关注和应用。
二、档案数字化的原则1. 法律合规原则:档案数字化工作必须遵循国家相关法律法规,如《档案法》等,确保数字化过程的合法性和合规性。
2. 完整性原则:档案数字化应当保持档案原件内容的完整性,对于原始纸质档案应按照一一对应的方式进行数字化转换。
3. 可追溯性原则:档案数字化工作应保留数字化过程的操作记录、负责人和时间,确保数字化的过程可追溯。
4. 数据安全原则:档案数字化过程应严格按照信息安全的要求进行,采取有效的措施保护档案信息的安全性。
5. 鉴权和审计原则:对于档案数字化后的电子文件,应进行鉴权和审计,确保档案的真实性和可信度。
三、档案数字化的流程1. 准备工作:包括建立数字化项目组、明确数字化目标、确定数字化技术和设备等。
2. 档案整理与筛选:对纸质档案进行整理和筛选,将不需要数字化的档案进行清理,确保数字化工作的高效进行。
3. 扫描与转换:采用专业的扫描设备将纸质档案转换成数字化图片或文档格式。
在转换的过程中要注意扫描质量的控制和图像的清晰度。
4. 数据处理:对扫描得到的数字化文件进行处理,包括图像处理、文字识别和格式转换等。
5. 数据存储与管理:建立合理的数字档案存储体系,包括备份和灾备机制,确保数字档案的安全性和可靠性。
6. 档案检索与应用:建立方便快捷的数字档案检索系统,可以根据需要查找和应用相关档案信息。
四、档案数字化的要求1. 扫描质量要求:扫描时要确保图像清晰、边角完整,尽量减少扫描偏斜和失真现象。
2. 文字识别要求:对扫描得到的文字进行识别和校正,确保识别准确性和一致性。
国家标准委关于下达干部人事档案数字化技术规范国家标准制定

国家标准委关于下达干部人事档案数字化技术规范国家标准制定随着信息化技术的发展和应用的普及,数字化档案已经成为许多领域的常态。
人事档案作为一种重要的管理工具,也需要与时俱进,实现数字化管理。
为了确保数字化人事档案的有效性和标准化,国家标准委制定了干部人事档案数字化技术规范国家标准。
一、背景介绍人事档案是组织机构管理干部工作的关键信息资源,具有重要的管理意义和保障作用。
而传统的纸质档案存在着信息获取困难、存储空间大、管理维护成本高等问题。
数字化技术的引入,为人事档案的管理提供了新的解决方案。
二、数字化档案的定义与重要性数字化档案是指将纸质档案通过技术手段进行数字化转化,并通过计算机和网络实现存储、管理和利用的一种新型档案形式。
数字化档案的重要性体现在以下几个方面:1. 提高档案的存储效率:数字化档案采用电子存储方式,节省了大量的纸张和存储空间。
同时,数字化档案可以实现在线存储和多地备份,确保档案的安全性和可靠性。
2. 便于信息检索和利用:数字化档案通过全文检索和分类标签等功能,大幅提高了档案信息的检索效率。
同时,数字化档案可以迅速获取需要的信息,为决策提供有力支持。
3. 优化档案管理流程:数字化档案通过计算机和网络实现了档案的信息化管理,提高了管理流程的规范化和自动化。
档案的录入、整理、归档等环节得到了有效优化,提升了工作效率。
4. 加强档案信息安全:数字化档案采用密码保护和权限管理等措施,可以有效防止档案信息的泄露和丢失。
同时,数字化档案还可以进行定期备份和恢复,保障档案信息的完整性。
三、制定数字化档案技术规范的必要性为了确保数字化档案的统一性和互通性,国家标准委认识到制定数字化档案技术规范的迫切性。
这些标准规范了数字化档案的技术要求、格式规范、存储与传输方式等,以确保数字化档案的质量和可持续发展。
制定数字化档案技术规范有以下几个方面的必要性:1. 统一数字化档案的规范:制定数字化档案技术规范可以规范数字化档案的标准化建设,统一档案数字化的要求和标准,避免各地区和单位因为技术的不同而导致档案格式不统一。
档案数字化技术规范

智能分类与检索
利用人工智能技术对档案数据进行智能分类和 检索,提高检索效率和准确性。
智能识别与处理
通过人工智能技术实现档案数据的自动识别和 处理,提高数字化质量和效率。
智能分析与预测
利用人工智能技术对档案数据进行分析和预测,为决策提供支持。
无损压缩
保留原始数据的完整性和真实性,适用于对数据 质量要求较高的档案。
压缩格式
选择合适的压缩格式,如JPEG、PNG、ZIP等, 以满足不同类型档案的存储和传输需求。
存储技术
01
02
03
存储介质
选择稳定、可靠、长寿命 的存储介质,如硬盘、光 盘、磁带等。
存储格式
确定统一的存储格式,以 便于数据的迁移、备份和 长期保存。
案例名称
南京大学档案数字化项目
数字化内容
对学校历史档案、教职工档案、学生档案等进行数字化处理,建立数 字档案数据库。
技术应用
采用高分辨率扫描仪、OCR文字识别技术、数据加密技术等,确保数 字化质量和数据安全。
成果与影响
实现档案信息快速检索、远程查询和数据共享,提高档案管理效率, 为学校各项工作的开展提供有力支持。
数据压缩与存储
数据压缩
采用压缩算法对数字化后的档案进行 压缩,以减小存储空间占用和提高传 输效率。
数据存储
将数字化后的档案存储在适当的存储 介质上,如硬盘、光盘等,并确保数 据的安全性和可靠性。
数据备份与迁移
数据备份
定期对数字化后的档案进行备份,以 防数据丢失或损坏。
数据迁移
当存储介质或存储设备需要更新或更 换时,将数字化后的档案迁移到新的 存储介质或设备上。
云计算技术在档案数字化中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
档案数字化技术规范1 适用范围为统一集团公司纸质、照片、音频、视频档案数字化的主要技术要求,推动档案现代化和数字档案馆的建设,特制定本规范。
本规范适用于各单位档案的数字化处理及数字化成果的管理。
2 总则2.1 基本原则2.1.1 同步检查档案实体质量,确保数字化成果的真实、完整。
2.1.2 采用先进的数字技术,确保数字化成果的长期有效、数据兼容和安全迁移。
2.1.3 采取有效的保护措施,确保档案实体及数字化成果的安全。
2.1.4 确保档案实体与数字化成果间的有机联系。
2.2 过程管理要求2.2.1制定档案数字化的总体方案、技术路线与工作方法,确保档案数字化工作标准化、规范化和流程化。
2.2.2档案数字化的基本环节主要包括:档案整理、档案扫描(转换)、数据处理、数据存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。
2.2.3建立档案数字化各环节的安全保密机制和工作制度,确保档案数字化工作的安全与高效。
2.2.4档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。
2.3 数据挂接2.3.1档案数字化转换过程中形成的图像、音频、视频数据,经质量验收合格后,加载到档案数据库服务器。
通过编制的程序或借助相应的软件,实现档案数据库条目与相关联的数字图像、音频、视频批量的快速挂接。
2.3.2认真填写档案数字化挂接检查情况登记表单,记录数据关联后的页(张、盘)数,核对每一份文件关联后的页(张、盘)数与档案整理、扫描(转换)时填写的页(张、盘)数是否一致,不一致时应注明具体原因和处理办法。
2.4 数据验收2.4.1 图像、音频、视频数据验收以一个全宗或多个目录为单位,随机抽查5%的档案条目数据对应的图像、音频、视频数据。
图像、音频、视频应符合本规范中所规定的分辨率、采样频率、数码率、文件格式及色彩模式。
图像、音频、视频文件的命名必须与条目数据题名相一致。
图像、音频、视频的转换完整性要求达到100%,图像偏斜度、清晰度、整洁度,音频、视频的清晰度等技术指标,要求抽检合格率达到95%以上(含95%)。
合格率=抽检合格文件数/抽检文件总数×100%。
2.4.2 验收审核验收“通过”的结论,必须经分管领导审核、签字后方有效。
2.4.3 验收登记认真填写数字化验收登记表单。
2.5 数据备份2.5.1 备份范围经验收合格的完整数据应及时进行备份。
2.5.2 备份方式为保证数据的安全,除将数据上传至集团公司档案管理系统服务器外,还应采用在线(磁盘)、离线(DVD刻录盘)相结合的方式实现多套备份,并注意异地保存。
2.5.3 数据检验检验内容包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。
2.5.4 备份标签数据备份后应在相应的备份介质上做好标签,以便查找和管理。
2.5.5 备份登记填写纸质档案数字化备份管理登记表单。
2.6 数字化成果管理2.6.1应加强对数字化成果的管理,确保其安全、完整和长期可用。
2.6.2数字化成果提供网上检索利用时,应有制作单位的电子标识(水印),并根据具体情况决定是否采用微软DRM保护的文件格式。
3 纸质档案数字化操作规程3.1 术语解释3.1.1 数字化用计算机技术将模拟信号转换为数字信号的处理过程。
3.1.2 纸质档案数字化采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
3.1.3 数字图像表示实物图像的整数阵列。
一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。
3.1.4 黑白二值图像只有黑白两级灰度的数字图像。
它对应于黑白两种状态的文字稿、线条图等。
3.1.5 连续色调静态图像以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。
3.1.6 分辨率单位长度内图像包含的点数或像素数,一般用每英寸点数(DPI)表示。
3.1.7 失真度对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面的偏离程度。
3.1.8 可懂度数字图像向人或机器提供信息的能力。
3.1.9 图像压缩消除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。
纸质档案数字化过程中,较常见的有TIFF(G4)、TIFF(LZW)、JPEG等压缩格式。
3.1.10 DRMDRM是Digital Rights Management的简称,即数字版权保护或数字版权管理。
微软的DRM分为两类,一类是多媒体保护,加密电影、音乐、音视频、流媒体文件,如WMV,WMA,ASF,WMS等格式文件。
另外一类是加密文档,如DOC、XLS、PPT、XPS、JPG、TIF、BMP等格式文件。
其他格式文件,比如:RM、RMVB、AVI、WAV、MP3、MPG、PDF等均可以转换成微软DRM支持的格式后进行加密保护。
3.1.11 PDFPDF是Portable Document Format的简称,它是Adobe公司开发的电子文件格式,其优点在于跨平台、能保留文件原有格式、开放标准。
3.1.12 双层PDF一种具有多层结构的PDF格式文件,其每一页都包含两层,下层是从纸质文件扫描出来的原始图像,上层是用OCR软件对扫描图像进行识别后产生的文字结果,但字体效果设置成透明。
这样用户在阅读PDF文件时看到的是扫描图像,可以100%保留原始版面效果,在需要的时候,又可以通过透明的文字信息支持选择、复制、检索等功能。
3.1.13 XPSXPS 是 XML Paper Specification 的简称,它是微软公司开发的一种文档保存与查看的规范。
使用者不需拥有制造该文件的软件就可以浏览或打印该文件。
作为微软DRM支持的格式,可以提供版权保护。
3.2 档案整理3.2.1 前期整理合理确定档案数字化的范围,区分扫描件与非扫描件。
对档案进行适当整理,并视需要做出标识。
根据拟数字化档案的数量情况,估算数字化后所需要的存储空间。
3.2.2 目录建库已经建立档案数据库,并且使用条形码设备和软件的单位,可以在档案实体上粘贴条形码,使条形码能够正确反映档案数据条目与实体的对应关系,确保档案数字化、数据挂接时的质量和效率。
没有建立档案数据库的单位,可以按照集团公司档案管理著录规则的要求,确定档案著录项并进行著录。
所选定的数据格式,应能直接或间接地通过DBF 文件格式或XML文档,与集团公司档案管理系统进行数据交换。
3.2.3 拆除装订物去除影响扫描工作的装订物,保证扫描的顺序,确保数字化后正确归卷并不损坏档案。
3.2.4 档案修复破损严重、无法直接进行扫描的档案,应先进行技术修复。
折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。
3.2.5 建立作业单制作并填写数字化加工作业单,全程监控扫描过程,并记录整理数字化过程中各种相关情况。
3.2.6 装订图像质检完成后,拆除过装订物的档案应该按档案原貌及保管的要求重新装订,做到安全、准确、无遗漏。
3.3 技术要求3.3.1 档案扫描3.3.1.1 扫描方式根据档案幅面的大小(A4、A3、A0等)和纸张质量选择相应规格的扫描仪进行扫描。
数量较少的大幅面档案,可采用小幅面扫描后的图像拼接方式处理;如果数量较多则使用宽幅工程扫描仪进行扫描。
纸张状况较差,以及过薄、过软或超厚的档案,或者不宜拆装的档案,应采用平板扫描方式。
纸张状况好并且可以拆装的档案,可采用高速扫描方式以提高工作效率。
3.3.1.2 扫描色彩模式扫描色彩模式一般有黑白二值、灰度、彩色等,通常采用黑白二值。
页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可以采用灰度模式扫描。
页面中插有黑白照片、彩色照片、彩色插图、印章等带色彩标志的档案,可视需要采用彩色模式进行扫描。
底图可视需要采用灰度或彩色模式进行扫描。
如需要进行OCR识别的,应采用黑白二值扫描。
3.3.1.3 扫描分辨率采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率应≥200DPI。
特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。
如需要进行OCR识别的,扫描分辨率应≥300DPI。
3.3.1.4 扫描登记认真填写档案扫描情况登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。
3.3.2 图像处理3.3.2.1 对扫描图像偏斜度、清晰度、失真度、完整情况等进行检查,发现问题及时处理或重新扫描。
3.3.2.2 发现文件漏扫、扫描图像排列顺序有误时,应及时补扫并正确插入图像,调整排列顺序。
3.3.2.3 对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。
对方向不正确的图像应进行旋转还原,以符合阅读习惯。
3.3.2.4 对扫描图像中影响图像质量的杂质(黑点、黑线)、多余边框等,进行去污和裁边处理。
处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。
3.3.2.5对大幅面档案分区扫描形成的多幅图像,进行拼接处理,合并为一个完整的图像。
3.3.2.6认真填写图像处理情况表单,记录质检结果和处理意见。
3.3.3 图像存储3.3.3.1 长期保存格式采用黑白二值模式扫描的图像文件,使用TIFF(G4)格式存储。
采用灰度模式和彩色模式扫描的文件,使用JPEG格式存储。
如需要进行OCR识别的,识别后可存储为双层PDF格式。
3.3.3.2 网络利用格式不需要进行DRM保护的扫描图像,可直接以TIFF、JPEG、PDF格式在网上提供利用。
需要进行DRM保护的扫描图像,可由集团公司档案管理系统批量转换为XPS 格式后再行发布。
3.3.3.3 存储方式和命名规则按“档号”建立文件夹方式存储。
以档案数据库中每份文件的档号,命名该份文件的图像存储文件夹;以每份文件的题名,命名该图像存储文件夹下所保存的扫描图像文件。
通过档号的一致性和唯一性,建立起档案数据库条目与图像存储文件夹一一对应的关联关系,从而确保扫描图像文件挂接的正确。
4 照片档案数字化技术规范4.1 照片整理参照纸质档案数字化操作规程。
4.2 照片扫描4.2.1 扫描要求扫描照片、底片能够按原件1:1比例还原,并能忠实反映照片、底片原貌(清晰度、色彩、黑白对比度等)。
4.2.2 扫描色彩模式采用灰度和彩色两种模式扫描。
黑白照片采用灰度模式扫描,彩色照片采用彩色模式扫描。
4.2.3 扫描分辨率对于所扫描的照片,以常见5英寸照片大小(3.5×5英寸)为参照,扫描分辨率≥300DPI;对于所扫描底片以还原5英寸照片为参照,扫描分辨率≥1500DPI;对于其他太大或太小的照片,扫描分辨率可作相应的调整,照片幅面≥10英寸时,可以适当降低分辨率但不能低于200DPI;对于一些涉及重要历史事件和人物的照片,其扫描分辨率可在此基础上适当增加。