档案数字化加工方案

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(三)数字化加工部分 (2)

6.1. 需求分析与总结 (2)

6.2. 参考的国家标准及技术规范 (2)

6.3. 数字化加工实施细则 (3)

6.9.1. 本项的扫描加工流程 (3)

6.9.2. 生产流程有以下几个主要的步骤组成: (4)

6.9.3. 档案整理 (5)

6.9.4. 著录标引 (6)

6.9.5. 纸件扫描 (7)

6.9.6. 图像处理 (8)

6.9.7. 质量检验 (10)

6.9.8. 档案还原装订 (10)

6.9.9. 数据存储与备份 (12)

6.9.10. 档案电子数据与XXXXXX 烟草档案系统的无缝挂接 (12)

64 项目所采用的OCR处理技术介绍 (12)

6.10.1. OC R (光学字符识别)技术 (12)

6.102 所采用的OCR及双层PDF生产流程 (13)

6.10.3. 生产流程逻辑示意图 (14)

6.5. XXXXXXf案数字化服务特点 (15)

6.11.1. 自动化程度高 (15)

6.11.2. 标准化程度高 (15)

6.11.3. 严格的质量控制 (15)

6.11.4. 文档安全性高 (15)

6.11.5. 标准的格式 (15)

6.11.6. 方便存储与管理 (16)

三)数字化加工部分

6.1. 需求分析与总结

此次项目是将中国烟草总公司XXXXX)省公司及所属11个市烟草公司的约

183 万页纸质档案进行数字化加工并将成品数据挂接到档案管理系统中,纸质档案的折分整理、扫描与图像处理、数据的挂接与光盘备份都将严格按照国家档案局相关标准及XXXXXX!档案局相关规定,结合xxxxxXS草档案现状定制加工技术规范与生产加工流程。

。据上述现状,具体人员安排,项目实施周期,采用标准及实施细则如下。

6.2. 参考的国家标准及技术规范

《纸质档案数字化技术规范》 (DA/T 31 —2005) 《连续色调静态图像的数字压缩及编码》 (GB/T 17235.1-1998 ) 《电子文件归档与管理规范》 (GB/T 1 8894-2002) 《中央档案馆接收档案的标准》

《XXXXX省档案接收和收集管理相关规定

《归档文件整理规则》(DA/T22-2000)

《档案著录规则》 (DA/T 1 8-1 999 )

《无酸档案卷皮卷盒用纸及纸板》 (DA/T 24-2000) 《档案修裱技术规范》 (DA/T 25-2000)

《xxxxxxxxxxXX案数字化技术规范》

《XXXXX烟草档案数字化技术规范》

6.3. 数字化加工实施细则

6.9.1. 本项的扫描加工流程

桂对页号

OO QC

1 rne iL

档霍还原 底棉系统

录入能•检

JU co 刻录机 档耒宜理系轨

医憔打描和魁许

嚴号時測 1

伞面质**检

ilW

6.9.2. 生产流程有以下几个主要的步骤组成:

纸质档案的整理从档案室进行档案提卷,并记录提卷的内容,接着拆卷,并进行去污、平整化,并依据档案纸张的大小和厚薄分类。档案的整理工作主要是为了以后档案的扫描做准备。

6.9.2.1. 扫描及图像处理

根据不同档案纸张的大小和厚薄,选择不同的扫描仪,较为规整的选择快速

扫描仪,较薄、较厚和不规整的用平板扫描仪,这样既能达到保护档案(高速扫描仪会发生卷纸,损坏档案)的目的,也能提高档案数字化加工的速度。

查重查漏

在扫描的过程中,难免会发生重复扫描和漏扫的现象,人工的再次校对能够发现档案数字化过程中出现的情况,并即使纠正。

数据项录入

依据档案著录规范或者依据客户档案的实际著录项,录入标题、责任者、归档时间、档号等各种信息。

6.9.2.2. 质量检测

对扫描图像和著录的标引数据进行检验,图像主要是检验其扫描和净化处理质量,数据项的质量检测主要是检测其录入正确率。

6.9.2.3. 档案还原

完成档案数字化后,要把原先的档案原件还原成原样

6.9.3. 档案整理

6.9.3.1. 档案交接

档案按年度、案卷提档,提档时数字化实施方的提卷人员对每卷的所有页面

进行统一的编号,全卷所有文件页号编写完成后,再依据xxxxxX因草的要求抽出不需要扫描的文件页,然后再次按序编写需要扫描的文件页号,页号编写完成后,按实际文件页数填写详细的纸质档案交按清单,并由双方主管人员签字。

6.9.3.2. 档案拆分

档案拆分前要对档案进行统一的编号,编制总页号后,要从中选中需要扫描的页面。再一次编制所需扫描的页号,两个页号需用铅笔的颜色或位置区分,以确保档案还原时能够清楚区别和核时页数。

6.9.3.3. 目录数据准备

按照《档案著录规则》(DA/T18) 等的要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,应进行修改。

6.9.3.4. 拆除装订

在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。

6.9.3.5. 区分扫描件和非扫描件

按要求把同一案卷中的扫描件和非扫描件区分开。普发性文件区分的原则是:无关和重份的文件要剔除,有正式件的文件可以不扫描原稿。

6.9.3.6. 页面修整

破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。

6.9.3.

7. 档案整理登记

制作并填写纸质档案数字化加工过程交接登记表单,详细记录档案整理后每份文件的起始页号和页数。

6.9.4. 著录标引

6.9.4.1. 标引著录

标引著录为了方便查阅与管理,打印制作档案目录及档案封面,对文字录入的准确性要求较高,但要录的文本域并不是完全统一的在某一页面上,一些文本域要在多个文件中选择,所以录入时需要相关学部专家进行指导,确保文本域录入的准确率。

对所需录入的文本进行标引、或对不同类别的档案录入特征制作相应的《文字录入工作说明书》,供录入员和校对人员参考。

6.9.4.2. 录入方式

由于文本类型不一,有印刷体、手写体、有表格内的也有表格外的文本信息,所以采用手工录入和OCR(光学字符识别)软件相结合的方式录入。即手写体或不清晰的印刷体采用手工录入,较规整的印刷体采用OCF技术的录入方式。

6.9.4.3. 校对方式

校对以软件校对和打印输出对比校对相结合的方式,即对手工录入和OCR 自动录入的文本打印输出进行对比校对的一校、二校、抽查校对,确保索引信息

达到出版质量万分之一以下

相关文档
最新文档