档案数字化项目投标技术方案设计
档案数字化服务投标技术方案(纯方案,128页)

档案数字化服务投标技术方案目录1. 项目背景 (8)1.1. 项目背景及意义 (8)1.2. 档案数字化建设现状 (9)1.3. 档案数字化管理主要内容 (11)2. 档案数字化解决方案 (11)2.1. 档案数字化 (11)2.2. 档案数字化工作 (12)2.3. 档案数字化服务 (14)2.4. 档案数字化标准 (16)2.5. 档案数字化加工标准 (17)2.6. 档案数字化流程 (19)3. 档案数字化服务方案 (22)3.1. 服务概述 (22)3.2. 单位数字化建设现状 (23)3.3. 系统建设目标 (23)3.4. 系统建设方案 (24)3.4.1. 基础设施建设 (24)3.4.2. 档案信息数据库建设 (25)3.4.3. 数字档案信息综合管理系统 (26)3.4.4. 数字档案馆理论、标准及操作规程建设 (27)3.4.5. 数据安全建设 (28)3.4.6. 人才队伍建设 (28)3.5. 数字档案系统关键技术解决方案 (29)3.5.1. 数据库选择 (29)3.5.2. 服务器选择 (29)3.5.3. 全文数据信息存储服务器选择 (29)3.5.4. 扫描设备选择 (29)3.5.5. 文档在线利用 (30)3.6. 项目实施步骤 (30)3.6.1. 数字化建设需求分析 (31)3.6.2. 确定数字化建设方案 (32)3.6.3. 软硬件设备选购、人员配置 (32)3.6.4. 建设数字化建设标准和规范 (33)3.6.5. 建立数字化加工中心 (33)3.6.6. 建立数字化加工制度和操作规范 (35)3.6.7. 人员培训和试运行 (35)3.6.8. 项目稳定运行 (35)3.6.9. 项目验收 (35)3.6.10. 项目总结 (36)4. 档案数字化加工方案 (36)4.1. 需求分析与总结 (36)4.2. 参考的国家标准及技术规范 (36)4.3. 数字化加工实施细则 (37)4.3.1. 本项的扫描加工流程 (37)4.3.2. 生产流程步骤组成 (37)4.3.3. 档案整理 (38)4.3.4. 著录标引 (39)4.3.5. 纸件扫描 (40)4.3.6. 图像处理 (41)4.3.7. 档案还原装订 (42)4.3.8. 档案电子数据与XXXXXX烟草档案系统的无缝挂接 (44)4.3.9. 确保完美无缝挂接 (44)4.3.10. 项目所采用的OCR处理技术介绍 (44)4.4. XXXXXX档案数字化服务特点 (46)4.4.1. 自动化程度高 (46)4.4.2. 标准化程度高 (46)4.4.3. 严格的质量控制 (47)4.4.4. 文档安全性高 (47)4.4.5. 标准的格式 (47)4.4.6. 方便存储与管理 (47)5. 馆藏档案扫描、数字化加工整体解决方案 (47)5.1. 数字化加工作业前期准备 (47)5.1.1. 数字化工作人员准备 (47)5.1.2. 数字化工作软、硬件准备 (49)5.1.3. 确定数字化内容、数量及用户需求 (50)5.2. 数字化加工流程及主要技术方案 (51)5.2.1. 入库提卷、拆卷 (51)5.2.2. 标引著录 (52)5.2.3. 档案扫描 (53)5.2.4. 图像处理 (55)5.2.5. 全文识别(OCR)及生成双层pdf、版式还原及格式转换 (55)5.2.6. 总质检 (56)5.2.7. 批量挂接 (57)5.2.8. 还卷及数据备份提交 (57)5.3. 质量控制方案和保证措施 (58)5.3.1. 加工质量保障措施 (58)5.3.2. 多环节,多层次的质量检查体系 (58)5.3.3. 阶段性验收与终验相结合的严格验收程序是质量控制的终极保障595.4. 安全保密控制 (61)5.5. 售后服务 (61)6. 档案数字化的组织与实施 (62)6.1. 项目工作组织结构 (62)6.1.1. 工作领导小组 (62)6.1.2. 工作施工小组 (62)6.2. 数字化工作人员准备 (62)6.2.1. 中心人员 (62)6.2.2. 我方人员 (63)6.3. 数字化扫描加工的软、硬件准备 (64)6.3.1. 软件系统的准备 (64)6.3.2. 硬件的准备 (64)6.4. 确定数字化内容、数量及用户需求 (65)6.4.1. 数据范围 (65)6.4.2. 数量评估 (65)6.4.3. 质量评估 (65)6.5. 制定服务周期与计划 (66)6.6. 确定扫描工作流程 (68)6.6.1. 档案出库 (68)6.6.2. 档案整理 (69)6.6.3. 档案扫描 (69)6.6.4. 档案还原 (71)6.6.5. 档案还库 (71)6.6.6. 安装插件 (71)6.6.7. 测试插件 (72)6.6.8. 支取档案扫描流程 (73)6.6.9. 贷款档案扫描流程 (75)7. 档案数字化管理系统的设计与实现 (78)7.1. 相关技术介绍 (78)7.1.1. J2EE体系概述 (78)7.1.2. B/S体系结构 (78)7.1.3. MVC架构体系 (80)7.1.4. 面向对象程序设计 (81)7.2. 需求分析 (85)7.2.1. 系统可行性分析 (85)7.2.2. 系统总体需求分析 (86)7.2.3. 系统功能性需求分析 (87)7.2.4. 系统非功能性需求分析 (91)7.3. 系统设计 (93)7.3.1. 系统的总体设计目标 (93)7.3.2. 系统架构设计 (94)7.3.3. 系统功能模块划分 (96)7.3.4. 用户管理模块 (97)7.3.5. 档案管理模块 (99)7.3.6. 档案统计管理模块 (105)7.3.7. 后台数据库链接 (107)7.3.8. 系统安全管理模块 (109)7.3.9. 数据库的设计 (112)7.4. 系统的实现与测试 (117)7.4.1. 系统运行环境 (117)7.4.2. 界面设计原则 (117)7.4.3. 系统登录主界面 (118)7.4.4. 系统用户管理模块的实现 (119)7.4.5. 系统档案管理功能模块的实现 (121)7.4.6. 系统档案统计管理模块的实现 (123)7.4.7. 系统测试 (124)随着全国文化信息资源共享工程与中国数字图书馆工程的起动,信息化已成为国际潮流,信息资源建设成为当务之急。
档案数字化项目投标技术方案

一、项目实施方案(一)项目实施的依据1、《中华人民共和国档案法》2、《机关文件材料归档范围和文书档案保管期限规定》(国家档案局第8 号令)3、国家档案局《CAD 电子文件光盘存储、归档与档案管理要求》GB/T17678.1—19994、《归档文件整理规则》》(DA/T 22—2022)5、《档案著录规则》(DA/T18-1999)。
6、《纸制档案数字化技术规范》(DAT-31-2022)7、《电子文件归档与管理规范》GB/T18894—2002(二)项目实施前准备1、人员准备(1)甲方人员职务:现场交接管理人员职责:①负责与乙方的档案提卷和还卷等交接工作,协同甲方人员作好交接清单记录并签字。
②负责监督乙方规范化加工。
③随时把握乙方加工进度并进行协调。
④及时关注并抽查乙方加工质量。
⑤代表甲方与乙方进行及时的沟通及问题协调,确保项目顺利完工。
(2)乙方人员2.1 管理人员:主要为熟悉现场加工管理,熟悉数字化整体作业流程,具有较强组织能力和现场管理及沟通能力的乙方负责人。
2.2 工程技术人员:主要为熟悉计算机软、硬件技术,了解档案数据库标准和系统开辟。
了解档案管理等相关专业知识的乙方技术支持工程师。
2.3 数据采集作业员:主要为了解档案数据库数据标准和计算机软件应用等相关知识的乙方数字化制作工作人员序号职务职责1、负责人员,资源的调配工作。
2、负责施工组织设计、管理。
人员备注1 项目负责人3、负责施工条件的保障及与甲乙双方关于项目发展状态的汇报和协调工作。
1、负责与乙方的档案提卷和还卷等交接工作。
12、负责现场的人员管理和加工管负责项目现场总2 现场主管理。
3、负责数据的终验和挂接。
4 、配合项目负责人做好与乙方的沟通协调工作。
负责将档案卷内目录及其它索引信1 体质量、进度、协调等工作。
3 著录人员息进行手工录入为电子数据信息并校对。
12 、项目设备设施准备(1) 主要加工设备及其技术参数主要技术参数1.需支持全文检索使用功能。
档案数字化投标书范本

档案数字化投标书范本近年来,随着信息技术的发展,各行各业都逐渐走向数字化。
档案行业也不例外,档案数字化已经成为不可逆转的趋势。
在数字化的进程中,投标书是一个不可或缺的环节,因为它会直接影响到整个项目的实施和成果。
在招投标中,一份合格的投标书可以极大地提高企业的竞争力。
本文将为大家介绍一份档案数字化投标书范本,以供参考。
一、项目概述这一部分应该简要概述该投标书所针对的项目的基本情况。
其中包括项目的名称、地点、规模以及投标文件的要求等。
这里特别需要注意的是要将自己的理解与对方的要求相匹配,避免产生歧义。
二、技术方案这是整个投标书中最关键的部分,因为它是评估投标企业能力的基础。
具体的技术方案取决于实际情况,但它应该能够回答以下几个方面的问题:1. 数字化过程:投标企业应该详细说明其数字化过程的全过程。
这包括采集、整理、扫描、建设数据库、保密管理等。
投标企业需要说明所有这些过程中使用的技术和设备,并强调其在关键环节上所采用的先进技术。
2. 数据处理:投标企业应该阐述其在数据处理方面所采用的方法和技术,并明确其在数据去重、重构、补全以及文件格式转换等方面所表现出的实力。
3. 数字成果:最终的数字化成果将成为本次投标的最终目标。
因此,投标企业需要明确自己能够提供何种样的数字成果,包括数据样本、成果样本、文件查询、检索等。
三、项目管理这一章节表达投标企业的项目管理方面的实力。
它不仅涉及到数字化过程、数据处理等方面,还包括项目的实施、管理和运营等诸多方面。
具体来说,它需要回答以下几个问题。
1. 项目实施方案:投标企业应该概述其计划的实施方案,包括项目管理体系、项目组织架构以及项目计划等方面。
并强调其在这方面的实力。
2. 项目执行能力:投标企业应该要详细描绘其在项目状态跟踪、资源管理、计划控制、成本控制、风险管理等方面所表现出的能力。
3. 服务水平保证:在数字化过程中,服务水平保障是一个十分重要的方面。
投标企业应该明确其在数据保密、数据备份、数据恢复等方面所造就的能力,以及在数据产品上线时服务水平保障的规定。
档案数字化系统升级项目投标书技术方案

档案数字化系统升级项目投标书技术方案尊敬的评审委员会:感谢贵方拨冗审阅本公司的档案数字化系统升级项目投标书。
为了保证贵方的档案管理工作更加高效、安全、便捷,本公司特制定如下技术方案,以期达成合作共识。
一、项目背景随着信息技术的飞速发展,档案数字化已成为提高档案管理工作效率、确保档案安全、方便档案检索和利用的必然趋势。
为了满足这一需求,本公司提出对贵方的档案数字化系统进行升级,以提高系统性能、扩展功能模块、优化用户体验,并提供全方位的技术支持与服务。
二、项目目标1. 提高档案管理效率:通过系统升级,实现档案的快速归档、检索、利用,提高档案管理工作效率。
2. 确保档案安全:加强档案安全管理,防止档案丢失、损坏、篡改等情况发生。
3. 优化用户体验:改进系统界面及操作流程,提升用户使用体验。
4. 提供全方位技术支持与服务:在项目实施过程中及项目完成后,为贵方提供持续的技术支持与服务。
三、技术方案3.1 系统架构本项目采用分层架构,包括表示层、业务逻辑层和数据访问层。
- 表示层:采用B/S架构,支持多种浏览器访问。
- 业务逻辑层:处理档案管理的各项业务逻辑,如档案归档、检索、利用等。
- 数据访问层:采用数据库管理系统(如MySQL、Oracle等)进行数据存储与访问。
3.2 功能模块本项目包含以下主要功能模块:1. 档案录入与归档:实现档案的在线录入、修改、归档等功能。
2. 档案检索:支持按关键词、分类、时间等条件进行档案检索。
4. 档案安全管理:实现档案的权限管理、加密、备份等功能,确保档案安全。
5. 统计分析:对档案数据进行统计分析,为领导决策提供数据支持。
3.3 技术选型2. 后端技术:采用Java、Python等后端开发语言,实现业务逻辑处理。
3. 数据库技术:选用成熟稳定的数据库管理系统,如MySQL、Oracle等。
4. 安全技术:采用SSL加密、用户权限控制等技术,确保系统安全。
3.4 系统部署本项目支持多种部署方式,包括云部署、本地部署等。
档案数字化平台搭建项目投标书技术方案

档案数字化平台搭建项目投标书技术方案一、项目背景与目标随着信息技术的不断发展,档案数字化已成为推动社会管理现代化、提高档案利用效率的重要手段。
本次项目旨在通过搭建档案数字化平台,实现对各类档案的高效管理、快速检索和便捷利用,为我国档案管理工作提供有力支持。
二、技术方案概述2.1 平台架构本次项目将采用B/S架构,使用Java、Python等主流开发语言,结合前端技术Vue.js、React等,实现档案数字化平台的开发。
平台将包括以下几个模块:- 档案采集与导入模块:实现各类档案的采集、整理、导入等功能。
- 档案存储与管理模块:对档案进行存储、分类、权限管理,确保档案安全。
- 档案检索与展示模块:提供多维度、智能化的档案检索功能,实现档案的快速查找与展示。
- 系统管理与维护模块:实现平台运行监控、用户管理、日志分析等功能,确保平台稳定可靠运行。
2.2 技术选型- 数据库:使用MySQL、Oracle等关系型数据库,存储档案元数据及全文数据。
- 文件存储:采用分布式文件存储系统,如Hadoop HDFS、Ceph等,存储大量档案数据。
- 搜索引擎:集成Elasticsearch等搜索引擎,实现高效、准确的档案检索。
- 压缩与加密技术:采用主流的压缩与加密算法,如ZIP、GZIP、AES等,保证档案数据的安全性。
2.3 平台功能1. 档案采集与导入:支持多种档案格式(如PDF、Word、Excel等),提供批量导入、手动上传等功能。
2. 档案存储与管理:对档案进行分类、标签化管理,实现权限控制,确保档案安全。
3. 档案检索与展示:提供关键字、全文检索,支持多维度筛选,实现档案的快速查找与展示。
5. 系统管理与维护:实现平台运行监控、用户管理、日志分析等功能,确保平台稳定可靠运行。
三、项目实施与进度安排3.1 项目实施阶段1. 需求分析:深入了解用户需求,明确平台功能、性能、稳定性等要求。
2. 系统设计:根据需求分析,进行平台架构、模块划分、技术选型等设计工作。
档案数字化加工整理项目投标书技术方案(124页)

档案数字化加工整理项目投标书技术方案(124页)档案数字化加工整理项目投标书技术方案(124 页)一、项目需求理解程度、难点分析及解决方案1.对本项目需求的理解1.1 对项目概述的理解(一)项目预算理解本项目财政预算金额为元(人民币)。
(二)项目概况理解1.项目背景:档案管理工作是中心各项工作的基础。
中心在日常公积金业务审批活动中,形成了大量的公积金业务档案,包括公积金归集、提取和贷款三大类业务的档案。
根据档案管理的有关要求,为实现档案的规范化和数字化管理,需对日常工作中产生的各类档案进行同步整理、扫描,形成数字档案提供查询利用,提高档案服务能力和水平。
2.项目整体情况:中心目前保存的这些公积金业务档案资料中,大部分均已由前台柜员打上页号;已打印文件材料清单(相当于卷内目录)。
前台柜员在办理业务时,已将该纸制档案高清拍照并保存在业务系统中;但大多数电子影像需图像处理。
公积金业务档案类别及数量详情如下表:档案类别预计数量(卷/份)预计每卷档案页数公积金业务档案(包括:归集类、提取类、贷款类档案)不少于 450 万卷3-15 页整理、扫描场地由中标方提供,且场地的相关安保设施等需符合档案局的检查要求;档案整理工作中的所有设备、工具、维修与耗材费用(包括卷皮、档案盒、不锈钢装订夹、复印件等)等均由中标方承担。
(三)项目目的及目标理解完成存量的公积金业务档案约 450 万卷(份)的整理、补录、补扫描及电子影像的图像处理与复核工作。
档案数字化加工整理项目投标书技术方案(124 页)(四)项目依据及参考标准理解1.《中华人民共和国档案法》。
2.《归档文件整理规则》(DA/T22-2000)。
3.《档案著录规则》(DA/T18-1999)。
4.《深圳经济特区档案与文件收集利用条例》。
5.《纸制档案数字化技术规范》(DA/T31-2005)。
6.《深圳市住房公积金管理中心业务档案整理规范》。
按以上规范进行整理、著录、扫描后的档案要达到深圳市档案馆进馆质量要求。
档案数字化加工整理项目投标书技术方案(124P)

一、项目需求理解程度、难点分析及解决方案1.对本项目需求的理解1.1 对项目概述的理解(一)项目预算理解本项目财政预算金额为元(人民币)。
(二)项目概况理解1.项目背景:档案管理工作是中心各项工作的基础。
中心在日常公积金业务审批活动中,形成了大量的公积金业务档案,包括公积金归集、提取和贷款三大类业务的档案。
根据档案管理的有关要求,为实现档案的规范化和数字化管理,需对日常工作中产生的各类档案进行同步整理、扫描,形成数字档案提供查询利用,提高档案服务能力和水平。
2.项目整体情况:中心目前保存的这些公积金业务档案资料中,大部分均已由前台柜员打上页号;已打印文件材料清单(相当于卷内目录)。
前台柜员在办理业务时,已将该纸制档案高清拍照并保存在业务系统中;但大多数电子影像需图像处理。
公积金业务档案类别及数量详情如下表:整理、扫描场地由中标方提供,且场地的相关安保设施等需符合档案局的检查要求;档案整理工作中的所有设备、工具、维修与耗材费用(包括卷皮、档案盒、不锈钢装订夹、复印件等)等均由中标方承担。
(三)项目目的及目标理解完成存量的公积金业务档案约450万卷(份)的整理、补录、补扫描及电子影像的图像处理与复核工作。
(四)项目依据及参考标准理解1.《中华人民共和国档案法》。
2.《归档文件整理规则》(DA/T22-2000)。
3.《档案著录规则》(DA/T18-1999)。
4.《深圳经济特区档案与文件收集利用条例》。
5.《纸制档案数字化技术规范》(DA/T31-2005)。
6.《深圳市住房公积金管理中心业务档案整理规范》。
按以上规范进行整理、著录、扫描后的档案要达到深圳市档案馆进馆质量要求。
(五)项目采购范围理解中标方通过人员、设备、技术、管理等,对接收的实体档案进行专业化的归档、整理、著录、扫描等加工,形成规范的入库档案和规范的档案电子数据库。
(六)项目完成期限理解本项目完成期限为自合同签订之日起18个月。
(七)付款方式理解按财政委员会相关规定进行。
技术方案投标:数字化档案整理项目

技术方案投标:数字化档案整理项目1. 项目背景随着信息技术的快速发展,越来越多的企业和机构开始重视数字化档案的管理。
数字化档案整理项目旨在将纸质档案转化为电子档案,实现档案的电子化、数字化管理,提高档案检索效率,确保档案的安全性和稳定性。
2. 项目目标本项目的主要目标是实现以下几点:- 将纸质档案转化为电子档案,实现档案的电子化、数字化管理;- 构建一个高效、易用的档案检索系统,提高档案检索效率;- 确保档案的安全性和稳定性,防止档案的丢失和损坏;- 提供完善的售后服务和技术支持。
3. 技术方案为了实现项目目标,我们提出以下技术方案:- 使用扫描仪和高精度的摄像头对纸质档案进行扫描,将纸质档案转化为电子图像;- 使用OCR(Optical Character Recognition,光学字符识别)技术对电子图像进行文字识别,将文字信息从图像中提取出来;- 使用电子文档管理系统(EDMS)对电子档案进行管理,实现档案的电子化、数字化管理;- 构建一个基于Web的档案检索系统,使用户能够通过浏览器访问和检索档案;- 使用数据库和数据仓库技术对档案数据进行存储和分析,为用户提供高效、易用的档案检索功能;- 采用云计算和大数据技术,实现档案数据的安全备份和分布式存储,确保档案的安全性和稳定性;- 提供完善的售后服务和技术支持,包括系统安装、使用培训、故障排查和升级维护等。
4. 项目实施流程本项目将按照以下流程进行实施:- 需求分析:与客户充分沟通,了解客户的需求和期望,制定项目计划和时间表;- 设备采购和部署:购买扫描仪、摄像头、服务器等设备,并进行安装和调试;- 数据采集和处理:使用扫描仪和摄像头对纸质档案进行扫描,使用OCR技术对电子图像进行文字识别;- 系统开发和测试:开发电子文档管理系统和档案检索系统,进行系统测试和优化;- 系统部署和培训:将系统部署到客户现场,对客户人员进行使用培训;- 售后服务和技术支持:提供系统维护、故障排查和升级等服务,确保系统的稳定运行。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、项目实施案(一)项目实施的依据1、《人民国档案法》2、《机关文件材料归档围和文书档案保管期限规定》(档案局第8号令)3、档案局《CAD电子文件光盘存储、归档与档案管理要求》GB/T17678.1—19994、《归档文件整理规则》》(DA/T 22—2015)5、《档案著录规则》(DA/T18-1999)。
6、《纸制档案数字化技术规》(DAT-31-2017)7、《电子文件归档与管理规》GB/T18894—2002(二)项目实施前准备1、人员准备(1)甲人员职务:现场交接管理人员职责:①负责与乙的档案提卷和还卷等交接工作,协同甲人员作好交接清单记录并签字。
②负责监督乙规化加工。
③随时把握乙加工进度并进行协调。
④及时关注并抽查乙加工质量。
⑤代表甲与乙进行及时的沟通及问题协调,确保项目顺利完工。
(2)乙人员2.1 管理人员:主要为熟悉现场加工管理,熟悉数字化整体作业流程,具有较强组织能力和现场管理及沟通能力的乙负责人。
2.2 工程技术人员:主要为熟悉计算机软、硬件技术,了解档案数据库标准和系统开发。
了解档案管理等相关专业知识的乙技术支持工程师。
2.3 数据采集作业员:主要为了解档案数据库数据标准和计算机软件应用等相关知识的乙数字化制作工作人员2、项目设备设施准备(1)主要加工设备及其技术参数数字化加工过程中使用的数字化加工管理软件,是档案数字化加工的主要应用工具,也是确保档案数字化加工工作效率和成果质量的关键技术。
档案数字化加工软件必须具有扫描、图像处理、著录、校对、质检、自动挂接、查询检索、数据转换、数据上传、数据统计、打印传输等功能,能够满足档案数字化加工全流程各业务环节的需要,以及对加工数据进行质量检查和验收的需要。
(3)其他辅助加工设备除上述主要加工设备外,在档案数字化加工现场,还需要配备以下辅助设备:办公桌椅、档案存储柜、储物柜、装订机、电熨斗、切纸机、抽湿机、碎纸机以及纸、档案卷皮、档案盒、装订线、胶水等消耗材料。
具体参照招标文件要求或合同约定配置。
3、场地部署准备(1)各单位应配备专用的数字化加工场地,并进行合理布局,形成档案存放、数字化前处理、档案著录、档案扫描、图像处理、质量检查等工作区域。
一般设在档案部门独立、可封闭的建筑。
(2)数字化加工场地应符合防盗、防火、防尘、防水、防潮、防高温、防日光及紫外线照射、防有害生物、防污染等安全管理要求。
场地应配备可覆盖全部场地的报警、防火等应急设施设备。
(3)数字化加工场地应配备满足安全管理需要的视频监控设备,确保档案暂存处、数字化加工工位、服务器、数据导出端及门窗等无监控死角;视频监控数据自产生之日起保存不少于6个月,涉密档案数字化加工监控录像要保存到项目完工数据移交1个月后;档案部门应定期对视频监控数据进行回放检查,在删除视频监控数据之前,要留存视频回放安全检查记录。
(4)数字化加工场地应配备符合标准并满足工作需要的档案装具,用于分别存放待数字化处理和已数字化处理的档案。
(5)各单位和数字化服务机构应合理规划、配备和管理档案数字化设施设备,确保设施设备安全、先进,能够满足数字化工作的需要。
(6)数字化加工场地须封断所有档案数字化加工设备的无线网络功能以及非必要的各终端接口,各单位和数字化服务机构应定期进行相关检测。
如有必要,应由县档案局构建数字化加工专用局域网和视频监控专用网。
(三)项目加工案档案数字化是指用计算机技术将模拟信号转换为数字信号的处理过程。
纸质档案数字化就是采用专业的扫描仪、高拍仪和数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。
纸质档案数字化的基本原则是使档案信息资源能准确、便、快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会或行业对档案利用的需求。
档案数字化加工主要流程包括:提卷-拆卷-档案著录-扫描-图像处理-OCR-校对-版式还原-转双层PDF-终验-挂接。
1、入库提卷、拆卷(1)从档案室移交档案,格执行原始档案的交接手续,使用双项目负责人确认的档案交接清单(完成清点登记)。
(2)档案整理:编写页码、核对纸质档案页码、对可拆钉的文件做拆钉处理以适应扫描的要求、对需要修复的档案进行归并整理(如果发现破损重,无法直接进行扫描的档案,应先进行技术修复、折皱不平影响扫描质量的原件应先进行相应处理后再进行扫描,发现破损重的档案须立即报知项目相关负责人)制作卷目录,扫描文件抽取。
(3)按照扫描处理量明确交接期和档案交接量(双项目负责人签字,以保在施工过程中档案不损失、不丢失。
)(4)装订案卷应保证装订牢固,案卷整齐,卷材料不松动,脱落,保持与原案卷一致。
图二:2、标引著录按要求将文件所需信息录入到软件数据库里,标引著录按照档案局有关标准结合用户档案著录的具体要求进行。
(1)录入式采用手工录入的式(2)校对式校对以软件校对和打印输出、对比校对相结合,错误率在万分之二以下。
案卷目录和卷目录按照档案的原始数据录入。
卷案目录和卷目录的样式经用户同意可做相应调整。
对档案目录数据修改和补充的数据,须填写更改资料、更改资料放入原案卷,卷目录及其他不全的需补充完整。
3、档案扫描(1)扫描式:根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。
大幅面档案可采用加长式扫描或者图像拼接处理式处理,同一页面有两个以上文件,需分别扫描。
(2)扫描色彩模式:采用彩色模式进行扫描,主要采用平板扫描式。
(3)扫描分辨率:不低于300dpi,对材料中有多色、红头、印章、插有照片图片、清晰度较差等无法辨识清晰的页面,要提高分辨率,要求扫描后的图像清晰,不失真、完整、不影响利用效果。
(4)图像文件的大小:黑扫描图像应与原纸质档案保持一致。
扫描时做到不缺页、不重页、单页图像容完整。
(5)如遇字间距和行间距过密、原件本身是复印件等字迹不清楚的情况,可适当增加扫描的分辨率,但要保证图像清晰的同时,又不影响远程查询和浏览的速度。
(6)清晰度:扫描图像字迹清晰、颜色恰当,不宜过浅或过深,并且不得出现字迹笔画残缺或字迹笔画叠合而影响阅读的情况,即使原档案存在锈斑变质、颜色过浅或深浅不一致,也保证扫描图像可读,扫描留下的墨迹宽度不得超过0.5厘米,并且指印和黑线不能覆盖或影响正文容。
(7)根据档案实体情况,在档案电子文件中相对应目录设置“复制件”、“原件不清”标志。
目录以原有档案目录为准,在实际处理过程中著有未归类的新目录。
可根据情况修改目录,增加或调整标准目录,对档案原目录数据修改或补充的数据,需填写更改资料,更改资料放入原案卷,能实现一条目录对应多个图像和一个图像对应多条目录的编目。
(8)图像容:8.1实时在屏幕上监控扫描全过程,遇有漏扫、重,图像黑边、偏斜、折角、不清晰等情况,则进行重扫或补扫。
8.2检查扫描件是否合乎要求,扫描图像必须与原图页面一一对应,不得出现颠倒、缺页、重页或错页情况,不能有遗漏、重复,扫错的现象8.3扫描的页面容居中显示,不可出现明显偏左或偏右的现象,正文容、页眉、页脚、反面印章、附件、手写注释等信息完整;图像容与书本面完全对应,不得出现书页容残缺或将旁边页面信息扫入本页的现象。
(对图像黑边、偏斜、折角、不清晰等情况进行处理,以达到用户需求)8.4纸较差档案扫描案:由于进行数字化的档案会有部分为历史档案,纸质量比较差,对于这部分纸质量较差的历史档案扫描,我们本着以下原则:8.4.1保证档案安全。
纸较差的档案多为破损档案,对于破损档案更应该在生产流程中加以特殊对待,不能造成二次破坏。
保证档案的安全是第一要务。
因此,在处理纸较差的档案时,不允使用蘸水防滑等有破坏档案可能性的操作法。
8.4.2保证扫描质量。
历史档案之所以进行档案数字化,其中最主要的目的之一就是抢救这部分历史档案,今后在应用这部分档案时,尽量避免人为翻阅历史档案而给档案造成二次伤害,而应使用电子系统,使用扫描件。
这样档案扫描的质量要尽可能的清晰、干净,尽可能的恢复历史原貌,这对扫描质量的要求很高。
8.4.3高效高质的完成任务。
(9)扫描登记:认真填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理法。
4、图像处理(1)逐检查图像质量(包括黑边、折角、图像偏斜度、清晰度、失真度等进行检查,发现不符合图像质量要求时,应重新进行图像处理),档案顺序(页号)是否正确,有无漏扫、重等情况(发现文件漏扫时,应及时补扫并正确插入图像。
发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。
)(2)纠偏:图像整体倾斜不得超过1度,不得出现图像的一部分倾斜或扭曲而影响阅读的现象。
如果档案页面存在部分倾斜的,以页面中标题纠正为准。
(3)去污:所有扫描留下的黑线、指印、阴影或污点都必须清除干净(在放大50%的情况下)由于印刷质量或纸质量等造成的页面上有零星的污点和反面倒映文字污点比较多,如果在页面视图下看不清楚,或该污点嵌在文本行中无法清除,可以不清除,但应尽量保证图像可读。
(4)全文页面及局部文字的加深和变浅的处理:原始档案的清晰度较低时,可提高图像的清晰度,修正原资料中存在的字间距和行间距过密,文字较深或较浅,字迹不清楚的缺陷,确保文字及图像信息清晰可辨。
(5)图像拼接:对大幅面档案进行分区扫描形式的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性和数字化档案的准确可读。
(6)照片页处理:必要时采用专业的图像处理软件进行处理,确保照片的清晰度。
(7)图像存储:采用JPEG格式进行不加密存储。
扫描文件存储命名必须与条目档案号一一对应。
五、全文识别(OCR)及生成双层pdf、版式还原及格式转换将扫描处理完成后的文档利用专业的识别软件进行全文OCR,如甲对识别成功率有格要求的,还需另外进行人工校对,校对结束后将版式还原及转换成双层PDF文件格式。
根据用户对识别率的要求,可选择性进行人工校对。
进行人工校对和不进行校对的优缺点对比: 1.不进行人工校对:其原理是在单层PDF的基础上利用计算机软件进行全文OCR识别后生成双层PDF文件。
从而激活了图片中所反映的文字,而达到提取文字和利用原文所包含的文字进行检索的目的。
但是不进行人工校对和版式还原,识别的准确率取决于原始资源的情况及保存现状。
优点:效率高、成本低、能利用原文检索浏览速度快。
缺点:识别准确率取决于原件的质量,所以准确率不稳定。
适应围:①、原件版面干净及保存完好的资源。
(准确率可达95%以上)②、原文中只含部份核心检索容的资源。
(如学籍档案,检索的重点只是围绕学生的身份信息)2.进行人工校对:其原理是在OCR的基础上,为了确保识别的准确率而增加了人工校对和版式还原的工序。