档案数字化标准

档案数字化标准
档案数字化标准

纸质档案数字化技术规范pdf_档案数字化标准

1.档案数字化标准

本规范依据以纸质档案[按文书、科技工程图纸]、专门档案[照片、声音、影像、实物等分类]为主的档案载体分类的行业标准;其中纸制档案数字化标准中详细约定了档案数字化规范标准过程,专门档案的数字化标准过程类同,但是在格式标准上有专门的要求,整个规约参照国标[DA/T31—2005]等有关档案数字化的标准规范以下内容:

1.1纸质档案档案数字化标准

1.1.1文书、科技档案数字化标准

文书档案和科技档案的数字化通常是以纸介质作为专门的档案载体,其数字化的过程是指通过扫描仪将纸制档案采集为数字化数据并加以处理和存储的过程。其档案数字化必须保证其真实性、有效性、完整性。在使用时必须保证数字化数据能从存储介质中正确读取,并还原成电子文件以备查询利用。纸质档案数字化的基本环节主要包括:档案整理、目录建库、档案扫描、图像处理、图像存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。应加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。

1.1.1.1档案整理

在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要做出标识,确保档案数字化质量。

目录数据准备

按照《档案著录规则》(DA/T18)等的要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。如有错误

或不规范的案卷题名、文件名、贾任者、起止页号和页数等,应进行修改。

拆除装订

在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。

页面修整

破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等)后再进行扫描。

档案整理登记

制作并填写纸质档案数字化加工过程交接登记表单,详细记录档案整理后每份文件的起始页号和页数。

装订

扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持档案的排列顺序不变,做到安全、准确、无遗漏。

1.1.1.2档案扫描

扫描方式

根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业担描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。

纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。

扫描色彩模式

扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值。

页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。

页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,或插有黑白照片、彩色照片、彩色插图的档案(页面中有红头、印章的因安全原因应扫描成黑白二值),可视需

要采用彩色模式进行扫描。

原档案为影印件或非常不清晰的可视需要采用彩色模式进行扫描。

扫描分辨率

扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。

采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建

议选择≥300dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。

需要进行OCR汉字识别的档案,扫描分辨率建议选择≥300dpi。

扫描登记

认真填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是

否一致,不一致时应注明具体原因和处理方法。

1.1.1.3图像处理

图像数据质量检验

对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要求时,应重新进行图像的处理。由于操作不当,造成扫描的图

像文件不完整或无法清晰识别时,应重新扫描。发现文件漏扫时,

应及时补扫并正确插入图像。发现扫描图像的排列顺序与档案原件

不一致时,应及时进行调整。认真填写相关表单,记录质检结果和处理意见。

纠偏

对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。

去污

对图像页面中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。

图像拼接

对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。

裁边处理

采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。

1.1.1.4图像存储

存储格式

采用黑白二值模式扫描的图像文件,一般采用TIFF(G4)格式存储。存储时的

压缩率的选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。

提供网络查询的扫描图像,也可存储为PDF或其他格式。

图像文件的命名

纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。

多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。

1.1.1.5目录建库

数据格式选择

目录建库应选择通用的数据格式。所选定的数据格式应能直接或间接通过XML文档进行数据交换。

档案著录

按照《档案著录规则》(DA/T18)的要求进行著录,建立档案目录数据库。目录数据质量检查

采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。核对著录项目是否完整、著录内容是否规范、准确,发

现不合格的数据应要求进行修改或重录。

1.1.1.6数据挂接

汇总挂接

档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认为"合格"后,通过网络及时加载到数据服务器端汇总。

通过编制程序或借助相应软件,可实现目录数据对相关联的数字图

像的自动搜索、加入对应的电子地址信息等,实现批量、快速挂接。

数据关联

以纸质档案目录数据库为依据,将每一份纸质档案文件扫描所得的一个或多个图像存储为一份图像文件。将图像文件存储到相应文

件夹时,耍认真核查每一份图像文件的名称与档案目录数据库中该

份文件的档号是否相同,图像文件的页数与档案目录数据库中该份

文件的页数是否一致,图像文件的总数与目录数据库中文件的总数

是否相同等。通过每一份图像文件的文件名与档案目录数据库中该

份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。

认真填写纸质档案数字化转换过程交接登记表单,记录数据关联后的页数,核对每一份文件关联后的页数与档案整理、扫描时填写的页数是否一致,不一致时应注明具体原因和处理办法。

1.1.1.7数据验收

数据抽检

以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。一个全宗的档案,数据验收时抽检的比率不得低于5%。

验收指标

目录数据库与图像文件挂接错误,或目录数据库、图像文件之一出现不完整、不清晰、有错误等质量问题时,抽检标记为“不合格”。一个全宗的档案,数字化转换质量抽检的合格率达到95%以上(含95%)时,给予以验收“通过”。

合格率=抽检合格的文件数/抽检文件总数×95%

验收审核

验收"通过"的结论,必须经分管领导审核、签字后方有效。

验收登记

认真填写纸质档案数字化验收登记表单。

1.1.1.8数据备份

备份范围

经验收合格的完整数据应及时进行备份。

备份方式

为保证数据安全,备份载体的选择应多样化,可采用在线、离线相结合的方式实现多套备份,并注意异地保存。

数据检验

备份数据也应进行检验。备份数据的检验的内容主要包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。

备份标签

数据备份后应在相应的备份介质上做好标签,以便查找和管理。

备份登记

填写纸质档案数字化备份管理登记表单。

1.1.1.9数字化成果管理

应加强对纸质档案数字化成果的管理,确保其安全、完整和长期可用。纸质档案数字化成果提供网上检索利用时,应有制作单位的

电子标识,并根据具体情况分别采用可下载或不可下载的数据格式。

1.2专门档案数字化标准

1.2.1照片档案数字化标准

照片档案数字化是指通过扫描仪将照片档案转为数字化数据并加以存储的过程。照片档案数字化必须保证其真实性、有效性、完整性。在使用时必须保证数字化数据能从存储介质中正确读取,并还原

成图片信号输出。同时作为通用的图片格式能在网络中正常浏览。

1.2.1.1基本概念

光学分辨率指扫描仪光电转换器件的物理精度。例如一台扫描仪的光学分辨率为300dpi,也就是说每一英寸可以扫描出300个象素点。

差值分辨率也称为最大分辨率,指扫描仪最高可以达到的线数。差值分辨率是由光学分辨率差值运算得来的,因此它并不能代表扫

描仪的本质精度。

1.2.1.2技术标准

前提条件:所有要进行数字化的档案必须先进行著录,编制好页号。扫描方式:照片按全彩方式扫描。

分辨率:所使用扫描仪的光学分辨率必须大于或等于200dpi。

扫描办法:对于所扫的照片,以常见5寸照片大小

(12.5cm×8.5cm)为

参照,统一采用200dpi分辨率,(主要考虑在网络浏览时其尺

寸为最佳的观看效果,不须放大或缩小)对于其它大于或小于5寸

的照片,其扫描线数可作相应的调整,但不得低于150dpi。例如:

7寸以上的大照片,可选用150dpi;5寸以下的一寸照片,必须选

用600dpi,若是2—3寸的黑白照片,必须选用300dpi或350dpi。

文件存储类型:扫描后的照片以TIF格式存储,保存时必须选用图像选

项中的品质为最佳值的(12)大文件,存入到统一的照片数据库。

文件存储方式:档案照片存储时按全宗、目录、相册分级建立文件夹保

存,照片名字以照片的档案号命名。

照片命名方法:每一张照片必须定义完全。包括此张照片的档案号、拍

摄时间、组说明或照片的定义内容。以上注明需在文件名中全部打出。

1.2.1.3补充说明

无论彩色照片还是黑白照片都采用全彩格式扫描。

扫描仪有光学分辨率和差值分辨率两个常用技术参数,其中光学分辨率反映的是硬件系统确实可以达到的清晰程度,是扫描仪自身

性能的反映。

所扫描的照片必须经过图像处理软件进行图片的亮度、色度调整,对扫描的边框进行裁切。

1.2.2声音档案数字化标准

声音档案数字化是指通过硬件设备将声音档案转为数字化数据并加以存储的过程。声音档案数字化必须保证其真实性、有效性、完

整性。在使用时必须保证数字化数据能从存储介质中正确读取,并还

原成声音信号输出。同时作为输出的流媒体信号能正常在网络中播

放查阅。

1.2.2.1基本概念

采样频率和样本大小采样频率和样本大小是反映数字化声音档案的精确度高低的两个最基本的参数。采样频率即每秒钟采集多少个

声音样本,用Hz或kHz来表示。样本大小一般指声音卡的二进制位数,有8位、12位、16位等。采样频率越高,声音波形就表达得越

精确,而需要的存储空间就越大。

奈奎斯特理论奈奎斯特理论指出,采样频率不应低于声音信号最

高频率的两倍,这样就能把数字表达的声音还原成原来的声音。采样

频率的高低是根据奈奎斯特理论以及声音信号本身的最高频率决定的。

声道数是声音处理的重要参数。一般情况都采用两个声道的规格,现在的杜比AC-3采用5+1个声音通道,即左、中、右3个声道,左后、右后两个环场声道以及一个次低音声道,另外,还有7+1声音通道等

技术。

模数转换(ADC)模数转换是将输入的模拟音频信号转换成数值,数字化后的

音频信号是数值,是离散的数,并非像音频信号一样为连续的波形。

数模转换(DAC)数模转换完成将数字化的声音数据转换成模拟音

频信号输出,它是模数转换的逆过程。其主要的指标与模数转换相同。

1.2.2.2硬件要求

放音设备放音设备必须能正确地将声音源输出。放音设备应根据原载

体型号进行选择,如盒式录入机,开盘式放音机等等。

计算机配置应选用性能稳定配置较高的计算机作为数字化设备。本标

存储设备声音信号除存储在硬盘中随机使用,应备份至服务器中

或刻

录成CD光盘中脱机使用,如有必要,应再备一份归库保存。

声音卡声音卡(声卡)是声音数字化和数字化声音转换为可听到的模拟

信号的部件。声音卡必须符合声音档案数字化要求的技术指标和功能。声音卡的采样频率至少应支持11.025kHz、22.05kHz、

44.1kHz,最好支持48kHz。声音卡必须是16位以上声音卡。声音卡

的声道必须是双声道以上。

声音卡应能够支持多种声源输入,如CDAudio、MIDI、话筒、线

性输入等。

1.2.2.3技术标准

存储标准:声音档案数字化时要选用标准和通用的格式。本标准

规定使用的声音文件存储标准为:WAV或MP3。

采样频率:声音档案数字化选用44.1kHz作为声音采样标准。对

于DVD中的声音选用48kHz补充说明。

1.2.2.4补充说明

声音档案数字化时必须远离强磁场等外部干扰。

数字化过程中应检查声音档案载体质量,确保声音档案的真实性、完整性。

1.2.3影像档案数字化标准

影像档案数字化是指通过硬件设备将影像档案转为数字化数据并加以存储的过程。影像档案数字化必须保证其真实性、有效性、完

整性。在使用时必须保证数字化数据能从存储介质中正确读取,并还

原成影像信号输出。同时作为输出

的流媒体信号能正常在网络中播放浏览。

1.2.3.1基本概念

视频制式视频制式标准主要有PAL制式、NTSC制式和SECAM制式。中国及欧洲大多数地区使用PAL制式,规定为每秒25帧,每帧

尺寸为720×576像素。隔行扫描方式,场频为50Hz,行频为625Hz。

视频数据压缩根据解码后的数据与原始数据是否安全一致,数据压缩方法一般被划分为可逆编码方法和不可逆编码方法两类。

用可逆编码方法压缩的图像,其解码图像与原始图像严格相同,即压缩是完全可恢复的或没有偏差的。

用不可逆编码方法压缩的图像,其还原图像较之原始图像存在一定的误差,但视觉效果一般是可被接受的。

1.2.3.2硬件要求

放像设备放像设备必须能正确、清晰、稳定地将影像信息源输出。放像设备应根据原载体型号进行选择,如S-VHS放像机、3/4放像机、Hi8放像机、Betacam放像机、DVCPRO/DVCAM及DV的数码放像机。

计算机配置应选用性能稳定配置较高的计算机作为数字化处理设备。本标准规定的计算机配置为:CPU为奔腾系列的P4-2.6G以上,

硬盘为120G以上,内存256M以上,最好是双CPU。机器系统硬盘与

视频素材硬盘分开。系统硬盘配置为80G以上,转数为7200转/分,视频硬盘最好为SCSI总线结构,容量为120G以上,转数为10000

转/分以上。操作系统为WIN98/WIN2000。为确保稳定性及驱动程序

的兼容性,最好选用WIN2000PRO系统。安装有视频压缩卡,并有实

时回放功能。

存储设备影像信号除存储在硬盘中随机使用外,应备份至服务器中或刻录在DVD光盘中脱机使用,如有必要,应再备一份归库保存。

视频采集压缩卡视频采集压缩卡是影像档案数字化的关键部件。它的指标决定了影像数字档案的质量高低,因此必须符合影像档案

数字化要求的技术指标和功能。压缩卡应支持采集MPEG1和MPEG2。压缩卡的码流最高值至少应为10MB。压缩卡应能够支持多种影像输入,如复合信号、分离信号(即S-VIDEO)、数字信号(DV接口即1394接口)。

1.2.3.3技术标准

存储标准:影像档案数字化存储有两种标准。第一作为可再利用的图像格式选用MPEG2格式。第二作为可在网络上浏览查阅的图像

格式选用MPEG4格式(常见文件名为ASF格式和RM格式)。

数据传输率:作为DVD备份保存的影像档案数据传输率应在于

6-8Mb/S。

1.2.3.4补充说明

影像档案数字化时必须远离强磁场等外部干扰。

数字化过程中应检查载体质量,确保影像档案的真实性、完整性。

1.3国标有关归档电子文件数字化标准

1.3.1范围

本标准规定了在公务活动中产生的,具有保存价值的电子文件的形成、积累、归档、保管、利用、统计的一般方法。

本标准适用于党政机关产生的电子文件的归档与管理,其他社会组织的电子文件管理可参照本标准。

1.3.2规范性引用文件

DA/T18档案著录规则

DA/T22归档文件整理规则

1.3.3术语和定义

下列术语和定义适用于本标准。

电子文件electronicrecords

指在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上

传送的文件。

归档电子文件archivalelectronicrecords

指具有参考和利用价值并作为档案保存的电子文件(3.1)。

背景信息context

指描述生成电子文件(3.1)的职能活动、电子文件的作用、办理过程、结果、上下文关系以及对其产生影响的历史环境等信息。

元数据metadata

指描述电子文件(3.1)数据属性的数据,包括文件的格式、编排结构、硬件和软件环境、文件处理软件、字处理和图形工具软件、

字符集等数据。

逻辑归档logicalfiling

指在计算机网络上进行,不改变原存储方式和位置而实现的将电子文件(3.1)的管理权限向档案部门移交的过程。

物理归档physicalfiling

指把电子文件(3.1)集中下载到可脱机保存的载体上,向档案部门移交的过程。

真实性authenticity

指对电子文件(3.1)的内容、结构和背景信息(3.3)进行鉴定后,确认其与形成时的原始状况一致。

完整性integrity

指电子文件(3.1)的内容、结构、背景信息(3.3)和元数据(3.4)等无缺损。有效性utility

指电子文件(3.1)应具备的可理解性和可被利用性,包括信息的可识别性、存储系统的可靠性、载体的完好性和兼容性等。

捕获capture

指对电子文件(3.1)进行实时收集和存储的方法与过程。

迁移migration

指将源系统中的电子文件(3.1)向目的系统进行转移存储的方法与过程。

1.3.4总则

电子文件自形成时应有严格的管理制度和技术措施,确保其真实性、完

整性和有效性。

应对电子文件的形成、收集、积累、鉴定、归档等实行全过程管理与监

控,保证管理工作的连续性。

应明确规定电子文件归档的时间、范围、技术环境、相关软件、版本、

数据类型、格式、被操作数据、检测数据等要求,保证归档电子文件的质量。

归档电子文件同时存在相应的纸质或其他载体形式的文件时,应在内容、

相关说明及描述上保持一致。

具有永久保存价值的文本或图形形式的电子文件,如没有纸质等拷贝件,

必须制成纸质文件或缩微品等。归档时,应同时保存文件的电子版本、纸质版本或缩微品。

应保证电子文件的凭证作用,对只有电子签章的电子文件,归档时应附

加有法律效力的非电子签章。

1.3.5电子文件的真实性、完整性和有效性保证

应建立规范的制度和工作程序并结合相应的技术措施,从电子文件形成

开始不问断地对有关处理操作进行管理登记,保证电子文件的产生、处理过程符合规范。

登记处理过程中相互衔接的各类责任者(如起草者、修改者、审核者、签

发者等)。

登记处理过程中的各类操作者(打字者、发文者、收文者、存储管理者等)。登记处理过程中产生的责任凭证信息(批示、签名、印章、代码等)。登记电子文件传递、交接过程中的其他标识。

应采取可靠的安全防护技术措施,保证电子文件的真实性。

建立对电子文件的操作者可靠的身份识别与权限控制。

设置符合安全要求的操作日志,随时自动记录实施操作的人员、时间、

设备、项目、内容等。

对电子文件采用防错漏和防调换的标记。

对电子印章、数字签署等采取防止非法使用的措施。

应建立电子文件完整性管理制度并采取相应的技术措施采集背景信息和

元数据。

应建立电子文件有效性管理制度并采取相应的技术保证措施。

电子文件的处理和保存应符合国家的安全保密规定,针对自然灾害、非

法访问、非法操作、病毒侵害等采取与系统安全和保密等级要求相符的防范对策,主要有:网络设备安全保证;数据安全保证;操

作安全保证;身份识别方法等。

1.3.6电子文件的收集与积累

收集积累要求

1记录了重要文件的主要修改过程和办理情况,有查考价值的电

子文件及其电子版本的定稿均应被保留。正式文件是纸质的,如果

保管部门已开始进行向计算机全文的转换工作,则与正式文件定稿

内容相同的电子文件应当保留,否则可根据实际条件或需要,确定

是否保留。

2当公务或其他事务处理过程只产生电子文件时,应采取严格的

安全措施,保证电子文件不被非正常改动。同时应随时对电子文件

进行备份,存储于能够脱机保存的载体上。

3对在网络系统中处于流转状态,暂时无法确定其保管责任的电

子文件,应采取捕获措施,集中存储在符合安全要求的电子文件暂

存存储器中,以防散失。

4对用文字处理技术形成的文本电子文件,收集时应注明文件存

储格式、文字处理工具等,必要时同时保留文字处理工具软件。文

字型电子文件以XML、RTF、TXT为通用格式。

5对用扫描仪等设备获得的采用非通用文件格式的图像电子文件,收集时应将其转换成通用格式,如无法转换,则应将相关软件一并

收集。扫描型电子文件以JPEG、TIFF为通用格式。

6对用计算机辅助设计或绘图等设备获得的图形电子文件,收集

时应注明其软硬件环境和相关数据。

7对用视频或多媒体设备获得的文件以及用超媒体链结技术制作

的文件,应同时收集其非通用格式的压缩算法和相关软件。视频和

多媒体电子文件以MPEG、AVI为通用格式。

8对用音频设备获得的声音文件,应同时收集其属性标识、参数

和非通用格

式的相关软件。音频电子文件以WAV、MP3为通用格式。

11对套用统一模板的电子文件,在保证能恢复原形态的情况下,其内容信息可脱离套用模板进行存储,被套用模板作为电子文件的

元数据保存。

12定期制作电子文件的备份。

电子文件的登记

1每份电子文件均应在《电子文件登记表》中登记。

2电子文件登记表应与电子文件同时保存。

3电子文件登记表如果制成电子表格,应与电子文件一同保存,

永久保存的电子表格应附有纸质等拷贝件并与相应的电子文件拷贝

一起保存。

4电子文件稿本代码:M——草稿性电子文件;U-——非正式电

子文件;F—正式电子文件。

5电子文件类别代码:T——文本文件;I——图像文件:G——

图形文件;V——影像文件;A——声音文件;O——超媒体链结文件;P——程序文件;D--数据文件。

1.3.7电子文件的归档

归档要求

文件形成部门或信息管理部门应定期把经过鉴定符合归档条件的电子文件向档案部门移交,并按档案管理要求的格式将其存储到符

合保管期限要求的脱机载体上。

鉴定

1电子文件的鉴定工作,应包括对电子文件的真实性、完整性、

有效性的鉴定及确定密级、归档范围和划定保管期限。

有效性进行检验,并由负责人签署审核意见,检验和审核结果填入《归档电子文件移交、接收检验登记表》(见附录A的表A.3)。

如果文件形成单位采用了某些技术方法保证电子文件的真实性、完

整性和有效性,则应把其技术方法和相关软件一同移交给接收单位。

3电子文件的归档范围参照国家关于纸质文件材料归档的有关规

定执行,并应包括相应的背景信息和元数据。

4电子文件保管期限和密级的划分工作,参照国家关于纸质文件

材料密级和保管期限的有关规定执行。电子文件的背景信息和元数

据的保管期限应当与内容信息的保管期限一致。应在电子文件的机

读目录上逐件标注保管期限的标识。

归档时间

逻辑归档可实时进行,物理归档应按照纸质文件的规定定期完成。

检测

在进行电子文件归档工作时,应对归档电子文件的基本技术条件进行检测,检测内容包括:硬件环境的有效性,软件环境的有效性

及其信息记录格式、有无病毒感染等。

归档

电子文件的归档,按照鉴定标识进行。电子文件的归档可分两步进行,对实时进行的归档先做逻辑归档,然后定期完成物理归档。

归档时,应充分考虑电子文件的技术环境、相关软件、版本、数据

类型、格式、被操作数据、检测数据等技术因素。

1逻辑归档

将电子文件的管理权从网络上转移至档案部门,在归档工作中,存储格式和位置暂时保持不变。

2物理归档

2.1凡在网络中予以逻辑归档的电子文件,均应定期完成物理

归档。

2.2把带有归档标识的电子文件集中,拷贝至耐久性好的载体上,一式3套,一套封存保管,一套供查阅使用,一套异地保存。对于加密电子文件,则应在解密后再制作拷贝。

磁带、可擦写光盘、硬磁盘等。不允许用软磁盘作为归档电子文件长期保存的载体。

2.4存储电子文件的载体或装具上应贴有标签,标签上应注明载体序号、全宗号、类别号、密级、保管期限、存入日期等,归档后的电子文件的载体应设置成禁止写操作的状态。

2.5特殊格式的电子文件,应在存储载体中同时存有相应的查看软件。

2.6将相应的电子文件机读目录、相关软件、其他说明等一同归档,并附《归档电子文件登记表》

归档电子文件应以盘为单位填写《归档电子文件登记表》首页,以件为单位填写续页。

2.7对需要长期保存的电子文件,应在每一个电子文件的载体中同时存有相应的机读目录。

2.8归档完毕,电子文件形成部门应将存有归档前电子文件的载体保存至少1年。

1.3.8归档电子文件的整理

1.归档电子文件的整理按DA/T22规定的要求进行。

2.归档电子文件以件为单位整理。

3.同一全宗内的电子文件按照年度一保管期限一机构(问题)或保管期限一年度一机构(问题)等分类方案进行分类。

4.按电子文件类别代码相对集中组织存储载体。

5.电子文件的著录应参照DA/T18进行著录,同时按照保证其真实性、完整性和有效性的要求补充电子文件特有的著录项目和其他标识。

6.将著录结果制成机读目录和纸质目录。

1.3.9归档电子文件的移交、接收与保管

1.移交、接收与保管要求对归档电子文件,应按有关规定进行认真检验。在检验合格后将其如期移交至档案馆等档案保管部门,进行集中保管。在已联网的情况下,归档电子文件的移交和接收工作可在网络上进行,但仍需履行相应的

手续。

2.移交、接收检验

2.1文件形成单位在移交电子文件之前,档案保管部门在接收电子文件之前,均应对归档的每套载体及其技术环境进行检验,合格率达到100%时方可进行交接。

2.2检验项目如下:

——载体有无划痕,是否清洁;

——有无病毒;

检验结果分别由移交单位、接收单位填入《归档电子文件移交、接收检验登记表》的相应栏目。档案保管部门应按照要求及检验项目对归档电子文件逐一验收。对检验不合格者,应退回形成单位重新制作,并再次对其进行检验。

2.3移交手续

档案保管部门验收合格,完成《归档电子文件移交、接收检验登记表》(见附录A的表A.3)的填写、签字、盖章环节。登记表一式2份,一份交电子文件形成单位,一份由档案保管部门自存。

2.4保管要求

归档电子文件的保管除应符合纸质档案的要求外,还应符合下列条件:a)归档载体应作防写处理。避免擦、划、触摸记录涂层。

b)单片载体应装盒,竖立存放,且避免挤压。

纸质档案数字化的基本流程及技术要求

纸质档案数字化的基本流程及技术要求 一、概述 档案是人类社会实践活动的真实记录,是党和国家宝贵的历史文化财富。这些具有查考凭证作用、依据作用和参考作用的档案,是人们从事科研、生产等工作的必要条件和有力工具。档案也是各企事业单位运作各个环节的真实记录,是极其珍贵的原始资料和重要的信息资源。准确、系统、完整的档案是单位工作的重要参考资料,是社会的重要财富。 随着计算机技术、扫描技术、OCR技术、数字摄影技术(录音、录像)、数据库技术、多媒体技术、存储技术的发展而产生的一种新型档案信息形态,它把各种载体的档案资源转化为数字化的档案信息,以数字化的形式存储,网络化的形式互相连接,利用计算机系统进行管理,形成一个有序结构的档案信息库,及时提供利用,实现资源共享。档案数字化是数字档案建设最基础的工作,传统载体的档案经高科技技术加工成数字档案形式,通过局域网、政务网、互联网进行计算机检索、阅读电子档案,为迎接档案信息服务新环境的挑战,提高管理水平、提高效率,增强档案业务部门的服务水平,为档案内部管理及面向客户服务提供高效率的全面服务。档案作为一种原生信息资源,其重要性正日益凸显出来,逐步掌握信息技术为档案工作服务,为社会主义经济建设服务,为社会主义精神文明建设服务。 二、基本原则 纸质档案数字化的基本原则是使档案信息资源准确方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。属于归档范围且应永久或长期保存的、社会利用价值高的档案可列入数字化加工的范围,并按照《中华人民共和国行业标准(DA/T 31—2005)纸质档案数字化技术规范》对纸质档案进行数字化。根据档案幅面的大小(如A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪,如工程图纸采用0号图纸扫描仪进行扫描。纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。扫描过程中,确保不对档案原件造成破坏,保证档案扫描图像与原件一致、整洁、清晰。加强对纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。 三、基本流程及技术要求 纸质档案数字化的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、

DA/T32005纸质档案数字化技术规范标准

纸质档案数字化技术规范DA/T31-2005 1 范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于用扫描仪对各种纸质档案的数字化加工处理。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 17235.1 连续色调静态图像的数字压缩编码 GB/T 17235.2 连续色调静态图像的数字压缩编码 GB/T 18894?2002 电子文件归档与管理规范 ITU(CCITT)G3 二值图像压缩算法 ITU(CCITT)G4 二值图像压缩算法 DA/T18?1999 档案著录规则 档案管理软件功能要求暂行规定国家档案局档发[2001]6号 3 术语和定义 下列术语和定义适用于本标准。 3.1 数字化 Digitization 用计算机技术将模拟图像转换为数字图像的处理过程。 3.2 纸质档案数字化Digitization of Paper?Based Records 对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。

3.3 数字图像 Digital Image 表示景物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。 3.4 黑白二值图像 Binary Image 只有黑白两级灰度的数字图像。它对应于黑和白的两种状态文字稿、线条图、指纹图等。 3.5 连续色调静态图像 Continuous?tone Still Image 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字 图像。 3.6 失真度 Distortion Measure 对档案原件进行数字化转换后,在同等测试环境下,数字图像与档案原 件色彩、几何、压缩算法等差值。 3.7 可懂度 intelligibility 表示数字图像向人或机器提供信息的能力。 3.8 清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表现。 3. 9 分辨率Resolution

纸质档案数字化技术标准

纸质档案数字化技术标准 1范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。 2规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 17235 .1-1998信息技术连续色调静态图像的数字压缩及编码第1部分:要求和指南 GB/T 17235.2-1998信息技术连续色调静态图像的数字压缩及编码第2部分:一致性测试 GB/T 18894 - 2002电子文件归档与管理规范 3术语和定义 下列术语和定义适用于本标准。 3.1数字化 用计算机技术将模拟信号转换为数字信号的处理过程 3.2纸质档案数字化 采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数

字图像或数字文本的处理过程。 3.3数字图像 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵 列。 3.4黑白二值图像 只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。 3.5连续色调静态图像 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。 3.6分辨率 单位长度内图像包含的点数或像素数,一般用每英寸点数( dpi)表示。 3.7失真度 对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面的偏离程度。 3.8可懂度 数字图像向人或机器提供信息的能力。 3.9图像压缩 清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。纸质档案数字化过程中,较常见的有TIFF (G4)、

《纸质档案数字化技术规范》(DAT 31-2005)

《纸质档案数字化技术规范》(DAT 31-2005)《纸质档案数字化技术规范》(DA/T 31-2005) (2008-05-07 12:48:46) (中华人民共和国档案行业标准 DA/T 31-2005,中华人民共和国国家档案局2005年4月30日发布,2005年9月1日起实施) 1 范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于用扫描仪对各种纸质档案的数字化加工处理。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB,T 17235.1 连续色调静态图像的数字压缩编码 T 17235.2 连续色调静态图像的数字压缩编码 GB, GB,T 18894—2002 电子文件归档与管理规范 ITU(CCITT)G3 二值图像压缩算法 ITU(CCITT)G4 二值图像压缩算法 DA,T18—1999 档案著录规则 档案管理软件功能要求暂行规定国家档案局档发[2001]6号 3 术语和定义 下列术语和定义适用于本标准。 3.1数字化 Digitization

用计算机技术将模拟图像转换为数字图像的处理过程。 3.2纸质档案数字化Digitization of Paper—Based Records 对普通(黑色字迹清晰)的油印、铅印、胶印等印刷件或复印件纸质档案进行数字化及应用的过程。 3(3数字图像 Digital Image 表示景物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样一连续函数,并在采样点上将值最小化后的阵列。 3(4黑白二值图像 Binary Image 只有黑白两级灰度的数字图像。它对应于黑和白的两种状态文字稿、线条图、指纹图等。 3(5连续色调静态图像 Continuous—tone Still Image 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。 3(6失真度 Distortion Measure 对档案原件进行数字化转换后,在同等测试环境下,数字图像与档案原件色彩、几何、压缩算法等差值。 3(7 可懂度 intelligibility 表示数字图像向人或机器提供信息的能力。 3(8清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表现。 3. 9分辨率 Resolution 指单位长度内图像包含的点数或像素数。 3.10 TIFF Tagged Tmage File Format 标记图像文件格式。一种基于标记的无损(不丢失信息)压缩格式,用于在应用程序之间和计算机平台之间交换文件。因为它存储图像细微层次的信息非常多,图像的质量也得以提高,故而非常有利于原件为黑 白档案的复制储存。 JPEG Joint photographic Experts Group 3.11

档案数字化加工流程及规范V1

档案数字化加工流程及规范 文档属性 文档目录 一、操作流程 (2) 二、档案调卷 (2) 三、整理及著录 (2) 四、拆卷 (3) 五、档案扫描 (4) 六、影像处理 (4) 七、数据质检 (5) 八、档案装卷 (5) 九、完整归还 (5) 十、数据备份 (6) 八、数据挂接 (6)

一、操作流程 档案数字化加工业务总体流程包括:档案调卷、整理及著录、拆卷、档案扫描、影像处理、数据质检、档案装卷、完整归还、数据备份、数据挂接。 先后顺序为:调卷 > 著录 > 拆卷 > 扫描 > 处理 > 质检 >装卷 > 归还 > 备份 > 挂接。没有特殊要求的情况下,务必安此流程进行操作,以便从总体任务中提高工作效率。 二、档案调卷 这个过程我方要指定一个专门的负责人与客户(档案馆库房管理员)共同完成,将待加工的档案从库房搬运到加工现场,对档案要逐份清点,并办理档案交接登记,与客户做好交接记录,确定无误后方可进行拆卷环节的工作。要求:1,我方指定专人负责。 2,填写《档案交接登记表》(附件一)。 3,在交接登记表上要有双方的签字。 三、整理及著录 档案目录的整理是数字化加工工作的前提条件,如果没有正确的档案目录,会给后序工作带来很大麻烦,所以在数字化加工之前必须有完整且正确的档案目录。 对于待加工的档案,要制作电子目录。制作途径有两种: (一),使用数字化加工软件的数据录入功能,进行目录制作。 (二),使用Excel表格方式制作,目录模板使用《档案目录模板》文档(文档号为JS121006002)。 如果用户提供的有纸质目录或电子目录,我方要认真核对有无错漏现象,找出错误并修正。并修改成与《档案目录模板》类似的字段标准。对于错误或疏漏的修正,具体细则如下: 1,如果用户提供的目录和纸质档案不对照的,应该以纸质档案原文内容为标准进行录入,并删除错误信息。 2,著录项相关内容录入要完整,如有不明确或不完整的著录项需记录并及时反应给组长,如果目录中要增加或减少相关著录字段,要与客户协商,并及时向公司技术部反馈。以下著录项必不可少,且与纸质档案要一一对照:以“卷”为管理单位的年度、期限、卷号、题名、卷内文件序号、卷内文件题名、卷内文件页号等。

实物档案数字化规范

ICS 01.140.20 A 14 备案号:DA 中华人民共和国档案行业标准 DA/T XX—XXXX 实物档案数字化规范 Specification for digitization of physical records (征求意见稿) XXXX - XX - XX发布 XXXX - XX - XX实施 国家档案局发布

目次 前言 (1) 引言 (2) 1 范围 (3) 2 规范性引用文件 (3) 3 术语和定义 (3) 4 总则 (4) 5 组织与管理 (4) 5.1 机构及人员 (4) 5.2 基础设施 (5) 5.3 工作方案 (5) 5.4 管理制度 (5) 5.5 工作流程控制 (5) 5.6 工作文件管理 (6) 5.7 档案数字化外包 (6) 6 档案出库 (6) 7 数字化前处理 (6) 7.1 确定实物档案数字化对象 (6) 7.2 档案检查 (6) 7.3 目录数据准备 (7) 8 目录数据库建立 (7) 9 数字化采集 (7) 9.1 基本要求 (7) 9.2 平面扫描 (8) 9.3 三维扫描 (8) 9.4 数码拍照 (8) 9.5 环物摄影 (9) 9.6 文件命名 (9) 10 影像处理 (9) 10.1 旋转及纠偏 (9) 10.2 去污 (10) 10.3 影像拼接 (10) 10.4 裁剪处理 (10) 10.5 降噪 (10) 10.6 数据平滑 (10) 10.7 影像质量检查 (10) 11 数据挂接 (10) 12 数字化成果验收与移交 (10) 12.1 验收方式 (10) 12.2 验收内容 (10) 12.3 验收指标 (11)

缩微胶片档案数字化技术规范

缩微胶片档案数字化技术规X (征求意见稿) 1 X围 本标准规定了缩微胶片档案数字化的主要技术要求。 本标准适用于缩微胶片档案进行数字化及数字化成果的管理。 2 规X性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 DA/T18-1999 档案著录规则 GB/T 18894-2002 电子文件归档与管理规X DA/T 31—2005 纸质档案数字化技术规X 3 术语和定义 下列术语和定义适用于本标准。 3.1 数字化digitization 用计算机技术将模拟信号转换为数字信号的处理过程。 3.2 缩微胶片档案 microfilm records 记录了档案缩微影像的微粒高解像力的胶片。 3.3 缩微胶片档案数字化digitization of microfilm records 采用缩微胶片扫描仪等设备将缩微胶片上的影像转换为存储在磁盘、磁带、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。 3.4 密度density 在缩微摄影技术中衡量感光材料曝光和显影后变黑程度的物理量,也可用透射密度(D т)来表示,定义为不透明度的基10对数。即: Dт = log10 (1 / て)= log10( Ii / It ) Dт——透射密度

て——透射率,て =( It / Ii ) Ii ——光能 It ——透射光 3.5 解像力 resolution 衡量胶片影像细部能力的物理量,解像力的高低通常以在每毫米胶片上所能分辨的最大线条对数来表示。 3.6 对比度contrast 表示影像中明暗区域相互关系,是影像中最亮与最暗的色调之间差异X围的指数。高对比度可以使数字图像在黑白之间具有较少的灰色层次并且显示出较少的细节,低对比度具有更多的灰度层次及细节。 3.7 曝光亮度 exposure brightness 是决定数字图像明暗强度的指数。高曝光亮度可以使数字图像的色度加深并显示出较多的细节,可以突出浅色信息的痕迹,同时黑白之间出现的底灰加大。 4 基本要求 4.1 基本原则 保护档案原件,减少数字化工作环节,提高工作效率,使档案信息资源方便快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。 4.2 数字化对象的确定原则 4.2.1应确认档案的内容可以进行数字化。 4.2.2 应确认缩微胶片影像质量符合本规X5。 4.2.3 应选择第二代或第三代缩微胶片进行数字化。 4.3 基本环节 缩微胶片档案数字化的基本环节主要包括:缩微胶片检查、缩微胶片档案整理、缩微胶片档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份、成果管理等。 4.4 过程管理 4.4.1 应加强对缩微胶片档案数字化各环节的安全XX管理措施,确保档案的安全。 4.4.2应对缩微胶片档案数字化各个环节的工作状况进行记录,并及时将记录的文字、表格等整理、汇总、装订成册。在缩微胶片档案数字化的同时建立起完整、详细的工作记录,便于查询、数据管理和数据移交。 5 缩微胶片检查

档案数字化加工流程

档案数字化加工流程 档案数字化加工业务总体流程包括:档案调卷、整理及著录、免拆卷、档案扫描、影像处理、数据质检、完整归还、数据备份、数据挂接。 先后顺序为:调卷> 著录 > 扫描> 处理> 质检 > 归还> 备份> 挂接。在之前的档案管理数字化就是需要拆卷的,但就是现在有专业的非接触式扫描设备(比如book2net与iscan系列的产品)可以免拆卷,这就省去了很多的人力物力。下面介绍详细的步骤: 档案调卷 这个过程我方要指定一个专门的负责人与客户(档案馆库房管理员)共同完成,将待加工的档案从库房搬运到加工现场,对档案要逐份清点,并办理档案交接登记,与客户做好交接记录,确定无误后方可进行拆卷环节的工作。 整理及著录 档案目录的整理就是数字化加工工作的前提条件,如果没有正确的档案目录,会给后序工作带来很大麻烦,所以在数字化加工之前必须有完整且正确的档案目录。 对于待加工的档案,要制作电子目录。制作途径有两种: (一),使用数字化加工软件的数据录入功能,进行目录制作。 (二),使用Excel表格方式制作,目录模板使用《检察机关档案目录模板》文档(文档号为JS121006002)。 如果用户提供的有纸质目录或电子目录,我方要认真核对有无错漏现象,找出错误并修正。并修改成与《检察机关档案目录模板》类似的字段标准。对于错误或疏漏的修正,具体细则如下: 1,如果用户提供的目录与纸质档案不对照的,应该以纸质档案原文内容为标准进行录入,并删除错误信息。

2,著录项相关内容录入要完整,如有不明确或不完整的著录项需记录并及时反应给组长,如果目录中要增加或减少相关著录字段,要与客户协商,并及时向公司技术部反馈。以下著录项必不可少,且与纸质档案要一一对照: 以“卷”为管理单位的年度、期限、卷号、题名、卷内文件序号、卷内文件题名、卷内文件页号等。 以“件”为管理单位的年度、期限、件号、页数、题名等。 3,如果目录内容有错(如主题内容,文号等),以纸质档案信息为准,并及时反应给组长,由组长与客户协商解决。 4,如遇到较少见的繁体字或不清晰的字体,需向组长反应,不允许擅自解决,所有的繁体字在录入时应录入为简体字。 5, 如遇到无题名的档案,及时记录下来,反应给客户协商解决。 6,关于顺页;整理著录的同时,检查案卷的完整性,就是否有缺页、漏页、错编现象,正、副卷标注就是否正确,有问题及时反馈。没有问题时,用2B铅笔对纸质档案内容进行标注页码,正面标注在右上方,背面标注在左上方,页码字体工整、大小适中。 7,关于分卷问题;档号保持不变,卷号采用“卷号-卷次”格式,如0025-1、0025-2、0025-3……0025-12、0025-13;如果纸质档案分多卷,但就是客户没有分卷次的,我们要重新编卷次,增加一条案卷目录,每个分卷都要对应一条案卷目录(不能两个分卷对应一个目录)。 8,关于补卷问题;漏归档的档案作为补卷插入时,卷号要以实际的纸质档案的卷号为准。如0025-1、0025-A、0025-补、0025A等,我们做目录时当保持不变。 9,档号、卷号、件号、页号中不能出现正反斜杠(\ ,/),如果发现要改成中划线(-)(注意:中划线录入时,要使用英文输入法下的半脚录入),日期格式统一采用8位数字,如20120206,不足8位时补0。 档案扫描

纸质档案数字化技术规范

纸质档案数字化技术规范 Specification for Digitization of Paper-Based Records 1 范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 GB/T 17235.1 连续色调静态图像的数字压缩编码第一部分:要求和指南 GB/T 17235.2 连续色调静态图像的数字压缩编码第二部分:一致性测试 GB/T 18894 电子文件归档与管理规范 3 术语和定义 下列术语和定义适用于本标准。 3.1 数字化digitization 用计算机技术将模拟信号转换为数字信号的处理过程。 3.2 纸质档案数字化digitization of paper-based records 采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。 3.3 数字图像digital image 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。 3.4 黑白二值图像binary image 只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。

(完整)2019-2020年整理档案数字化加工方案汇编,推荐文档.docx

档案室、档案馆 馆藏档案扫描、数字化加 工整体解决方案

目录 第一数字化加工作前期准?????????1 一、数字化工作人准???????????1 二、数字化工作件、硬件准????????4 三、确定数字化内容、数量及用需求?????5 第二数字化加工流程及主要技方案???????6 一、入提卷、拆卷?????????????6 二、引著????????????????7 三、档案描????????????????8 四、像理????????????????11 五、全文 OCR、生成双 pdf、板式原及格式? 12 六、?????????????????14 七、批量挂接????????????????15 八、卷及数据份提交???????????15 第三量控制方案和保措施??????????17 一、加工量保障措施???????????17 二、多,多次的量体系?????17 三、段性收与相合的格收程序是量控制的 保障????????????????19 第四安全保密控制??????????????? 21

保密????????????????? 22 第五售后服?????????????????24 项目背景 —————————————————— 随着全国文化信息源共享工程与中国数字工程的起,信息化已成国潮流,信息源建成当之急。信息源建的重点是子文献、各数据、网源、子档案、子等新型数字化信息源的建。 在数字化信息源建中,很大的一个需求是将有的介印刷品数字化, 使之成能用算机、理解、、索的子文件,最将其用于 数据存,或通CD-ROM、Internet网行出版,或上数字档案供用 使用。 以体的保存方式,占据了大量的空,需要特殊的境,而且不方便,随 着的推移,面着腐、老化等。而将介文件信息行子化理,保存到光上,具 有存、管理、共享等功能,可以减少文件房占地,省保管和人方面开支,又方 便和行程。 因此,将档案、期刊、文件等料通描,描成像文件,再通理成子文档, 建立目和索引,制作成子文件,已是当之急。

DAT 31-2005 纸质档案数字化技术规范

纸质档案数字化技术规范 DA/T 32-2005 (2005年4月30日发布2005年9月1日实施) 一、概述 国家标准《纸质档案数字化技术规范》DA/T 31—2005是由中国国家档案局颁布的,其批准时间为2005年4月30日,实施时间为2005年9月1日。 该标准共分为十三章。其中包括范围,规范性引用文件,术语和定义,纸质档案数字化基本要求,档案整理,档案扫描,图像处理,图像存储,目录建库,数据挂接,数据验收,数据备份,数字化成果管理等。 该技术规范的出台结束了我国纸质档案数字化的初探阶段,标志着我国各级档案馆馆藏数字化技术的成熟。 二、主要条款简介 第一章范围

本标准规定了纸质档案数字化的主要技术要求。本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。 第二章规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件其最新版本适用于本标准。 GB/T 17235.1-1998 信息技术连续色调静态图像的数字压缩及编码第一部分:要求和指南。 GB/T 17235.2-1998 信息技术连续色调静态图像的数字压缩及编码第二部分:一致性测试GB/T 18894-2002 电子文件归档与管理规范。 第三章术语和定义 下列术语和定义适用于该标准。 (1)数字化digitization 用计算机技术将模拟信号转换为数字信号的处理过程。

(2)纸质档案数字化digitization of paper-based records 采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。(3)数字图像digital image 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。 (4)黑白二值图像binary image 只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。 (5)连续色调静图像continuous-tone still image 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。在纸质档案数字化过程中,通常表现为灰度扫描利彩色扫描两种模式。 (6)分辨率resolution 单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。

档案数字化项目投标技术方案设计

一、项目实施方案 (一)项目实施的依据 1、《中华人民共和国档案法》 2、《机关文件材料归档范围和文书档案保管期限规定》(国家档案局第8号令) 3、国家档案局《CAD电子文件光盘存储、归档与档案管理要求》GB/T17678.1—1999 4、《归档文件整理规则》》(DA/T 22—2015) 5、《档案著录规则》(DA/T18-1999)。 6、《纸制档案数字化技术规范》(DAT-31-2017) 7、《电子文件归档与管理规范》GB/T18894—2002 (二)项目实施前准备 1、人员准备 (1)甲方人员 职务:现场交接管理人员 职责:①负责与乙方的档案提卷和还卷等交接工作,协同甲方人员作好交接清单记录并签字。②负责监督乙方规范化加工。③随时把握乙方加工进度并进行协调。④及时关注并抽查乙方加工质量。⑤代表甲方与乙方进行及时的沟通及问题协调,确保项目顺利完工。(2)乙方人员 2.1 管理人员:主要为熟悉现场加工管理,熟悉数字化整体作业流程,具有较强组织能力和现场管理及沟通能力的乙方负责人。 2.2 工程技术人员:主要为熟悉计算机软、硬件技术,了解档案数据库标准和系统开发。了解档案管理等相关专业知识的乙方技术支持工程师。 2.3 数据采集作业员:主要为了解档案数据库数据标准和计算机软件应用等相关知识的乙方数字化制作工作人员

2、项目设备设施准备 (1)主要加工设备及其技术参数

数字化加工过程中使用的数字化加工管理软件,是档案数字化加工的主要应用工具,也是确保档案数字化加工工作效率和成果质量的关键技术。档案数字化加工软件必须具有扫描、图像处理、著录、校对、质检、自动挂接、查询检索、数据转换、数据上传、数据统计、打印传输等功能,能够满足档案数字化加工全流程各业务环节的需要,以及对加工数据进行质量检查和验收的需要。 (3)其他辅助加工设备 除上述主要加工设备外,在档案数字化加工现场,还需要配备以下辅助设备:办公桌椅、档案存储柜、储物柜、装订机、电熨斗、切纸机、抽湿机、碎纸机以及纸张、档案卷皮、档案盒、装订线、胶水等消耗材料。具体参照招标文件要求或合同约定配置。 3、场地部署准备 (1)各单位应配备专用的数字化加工场地,并进行合理布局,形成档案存放、数字化前处理、档案著录、档案扫描、图像处理、质量检查等工作区域。一般设在档案部门独立、可封闭的建筑内。 (2)数字化加工场地应符合防盗、防火、防尘、防水、防潮、防高温、防日光及紫外线照射、防有害生物、防污染等安全管理要求。场地内应配备可覆盖全部场地的报警、防火等应急设施设备。 (3)数字化加工场地应配备满足安全管理需要的视频监控设备,确保档案暂存处、数字化加工工位、服务器、数据导出端及门窗等无监控死角;视频监控数据自产生之日起保存不少于6个月,涉密档案数字化加工监控录像要保存到项目完工数据移交1个月后;档案部门应定期对视频监控数据进行回放检查,在删除视频监控数据之前,要留存视频回放安全检查记录。 (4)数字化加工场地应配备符合国家标准并满足工作需要的档案装具,用于分别存放待数字化处理和已数字化处理的档案。 (5)各单位和数字化服务机构应合理规划、配备和管理档案数字化设施设备,确保设施设备安全、先进,能够满足数字化工作的需要。 (6)数字化加工场地须封断所有档案数字化加工设备的无线网络功能以及非必要的各终端接口,各单位和数字化服务机构应定期进行相关检测。如有必要,应由县档案局构建数字化加工专用局域网和视频监控专用网。

湖北纸质档案数字化操作规程

湖北省纸质档案数字化操作规程 1适用范围 本规程规定了纸质档案(含文书档案、科技档案、会计档案等)数字化加工的主要技术指标。 本规程适用于湖北省各级综合档案馆。机关、团体、企业事业单位、社会组织参照执行。 2引用文件 DA/T18-1999档案著录规则; DA/T22-2000归档文件整理规则; DA/T31-2005纸质档案数字化技术规范; 湖北省文书档案目录数据库结构与著录细则(鄂档[2004]46号); 湖北省国家综合档案馆电子档案数据容灾管理试行办法(鄂档〔2010〕41号); 关于进一步加强档案信息安全保密工作的通知(鄂档办〔2014〕19号)。 3实施主体 3.1纸质档案数字化加工的责任主体为实施档案数字化的各级国家综合档案馆及机关、团体、企业事业单位、社会组织(以下简称 -1-

“数字化实施单位”)。 3.2纸质档案数字化加工可由数字化实施单位自行组织人员开展,也可以由数字化实施单位采取业务外包的方式委托给具有相关 资质和能力的档案数字化服务机构(以下简称“数字化服务机构”)完成。 4基本原则 4.1统筹规划,分步实施 根据纸质档案重要程度、破损状况、利用需求等,进行统筹规划,分步实施。国家重点档案、重要全宗档案和涉及民生的专业档案应 优先列入数字化加工对象。 数字化应保持原有档案全宗或目录的完整性。 4.2加强管理,保障安全 遵守保密安全要求,对数字化对象进行划控、鉴定。涉及国家秘密的档案,不得以外包方式委托进行数字化加工。加强档案数字化 各个环节的管理工作,确保档案原件和数字化成果的安全。 4.3完善细节,规范流程 对因涉密不宜以外包方式委托进行数字化加工的对象,应用文 字做出说明,并由数字化实施单位组织工作人员集中进行数字化加工。应加强数字化加工流程管理,界定各个环节的职责任务,堵塞漏 洞和缺憾。 4.4分工协作,夯实基础 加强内设机构的分工协作,把夯实档案基础业务工作与档案数 -2-

纸质档案数字化技术规范 pdf_档案数字化标准

档案数字化标准 本规范依据以纸质档案[按文书、科技工程图纸]、专门档案[照片、声音、影像、实物等分类] 为主的档案载体分类的行业标准;其中纸制档案数字化标准中详细约定了档案数字化规范标准过程,专门档案的数字化标准过程类同,但是在格式标准上有专门的要求,整个规约参照国标[DA/T31—2005]等有关档案数字化的标准规范以下内容 1纸质档案档案数字化标准 1文书、科技档案数字化标准 文书档案和科技档案的数字化通常是以纸介质作为专门的档案载体,其数字化的过程是指通过扫描仪将纸制档案采集为数字化数据并加以处理和存储的过程。其档案数字化必须保证其真实性、有效性、完整性。在使用时必须保证数字化数据能从存储介质中正确读取, 并还原成电子文件以备查询利用。纸质档案数字化的基本环节主要包括档案整理、目录建库、档案扫描、图像处理、图像存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。应加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数字化档案信息的安全。纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。

1档案整理 在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要做出标识,确保档案数字化质量。 目录数据准备 按照《档案著录规则》(DA/T18)等的要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。如有错误或不规范的案卷题名、文件名、贾任者、起止页号和页数等,应进行修改。 拆除装订 在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。 页面修整 破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等) 后再进行扫描。 档案整理登记

档案数字化流程及规范

档案数字化管理服务流程及规范要求(试运行版) 一、档案领取及项目经理职责: 由公司委派相关负责人和业主方(甲方)进行档案领取及档案交接并办好相关手续。 职务:项目负责人及项目经理 职责范围:负责与甲方的档案提卷和还卷等交接工作,协同甲方人员作好交接清单记录并签字。负责监督公司技术人员规范化加工并培训新来员工。随时把握公司加工进度并进行协调。及时关注并抽查加工质量,代表甲方与技术人员进行及时的沟通及问题协调,确保提卷项目顺利完工。每天监督各岗位操作员的《档案管理计件考勤表》制度的完成。 二、档案调卷分类整理: 待加工的档案从库房搬运到甲方提供的加工现场,项目经理要对档案逐份清点并分类,并办理档案交接登记,与甲方做好交接记录,确定无误后方可进行拆卷环节的工作。要求: 2.1由甲方指定专人负责与公司项目经理对接。 2.2填写《档案交接登记表》(附件一)。 2.3在交接登记表上要有双方的签字。 三、整理及著录 档案目录的整理是数字化加工工作的前提条件,如果没有正确的档案目录,会给后序工作带来很大麻烦,所以在数字化加工之前必须有完整且正确的档案目录。对于待加工的档案,首先要进行人工打码目录。如果用户提供的档案已经有纸质目录或电子目录,操作员要认真核对有无错漏现象,找出错误并修正。对于错误或疏漏的修正,具体细则如下: 1、如果用户提供的目录和纸质档案不对照的,应该以纸质档案原文内容为标准进行录入,并删除错误信息。 2、著录项相关内容录入要完整,如有不明确或不完整的著录项需记录并及时反应给项目经理,如果目录中要增加或减少相关著录字段,要与甲方协商,并及时向公司技术部反馈。以下著录项必不可少,且与纸质档案要一一对照: 以“卷”为管理单位的年度、期限、卷号、题名、卷内文件序号、卷内文件题名、卷内文件页号等。以“件”为管理单位的年度、期限、件号、页数、题名等。 3、如果目录内容有错(如主题内容,文号等),以纸质档案信息为准,并及时反应给项目经理,由项目经理与甲方协商解决。 4、如遇到较少见的繁体字或不清晰的字体,需向项目经理反应,不允许擅自解决,所有的繁体字在录入时应录入为简体字。 5、如遇到无题名的档案,及时记录下来,反应给甲方协商解决。

档案数字化技术规范

档案数字化技术规范 1 适用范围 为统一集团公司纸质、照片、音频、视频档案数字化的主要技术要求,推动档案现代化和数字档案馆的建设,特制定本规范。 本规范适用于各单位档案的数字化处理及数字化成果的管理。 2 总则 2.1 基本原则 2.1.1 同步检查档案实体质量,确保数字化成果的真实、完整。 2.1.2 采用先进的数字技术,确保数字化成果的长期有效、数据兼容和安全迁移。 2.1.3 采取有效的保护措施,确保档案实体及数字化成果的安全。 2.1.4 确保档案实体与数字化成果间的有机联系。 2.2 过程管理要求 2.2.1制定档案数字化的总体方案、技术路线与工作方法,确保档案数字化工作标准化、规范化和流程化。 2.2.2档案数字化的基本环节主要包括:档案整理、档案扫描(转换)、数据处理、数据存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。 2.2.3建立档案数字化各环节的安全保密机制和工作制度,确保档案数字化工作的安全与高效。 2.2.4档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。 2.3 数据挂接 2.3.1档案数字化转换过程中形成的图像、音频、视频数据,经质量验收合格后,加载到档案数据库服务器。通过编制的程序或借助相应的软件,实现档案数据库条目与相关联的数字图像、音频、视频批量的快速挂接。 2.3.2认真填写档案数字化挂接检查情况登记表单,记录数据关联后的页(张、盘)数,核对每一份文件关联后的页(张、盘)数与档案整理、扫描(转换)时填写的页(张、盘)数是否一致,不一致时应注明具体原因和处理办法。 2.4 数据验收

(技术规范标准)纸质档案数字化技术规范

纸质档案数字化技术规范 范围 本标准规定了纸质档案数字化的主要技术要求。 本标准适用于采用各种设备对纸质档案的数字化加工处理及数字化成果的管理。 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡足不注日期的引用文件,其最新版本适用于本标准。 GB/T 17235.1-1998信息技术连续色调静态图像的数字压缩编码第一部分:要求和指南 GB/T l7235.2-1998信息技术还续色调静态图像的数字压缩编码第二部分:一致性测试 GB/T l8894-2004 电子文件归档与管理规范 3 术语和定义 下列术语利定义适用于本标准。 3.1 数字化digitization 用计算机技术将模拟信号转换为数字信号的处理过程。 3.2 纸质档案数字化digitization of paper-based records 采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。 3.3 数字图像digital image 表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样——连续函数,并在采样点上将值最小化后的阵列。 3.4 黑白二值图像binary image 只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。 3.5 连续色调静态图像continuous-tone still image 以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。在纸质档案数字化过程中,通常表现为灰度扫描利彩色扫描两种模式。 3.6分辨率resolution 单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。 3.7 失真度distortion measure 对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面的偏离程度。

纸质档案数字化工作技术标准

纸质档案数字化工作技术标准 1、档案前处理要求: 1)应对拟数字化的档案进行涉密性、完整性、有序性及档案实体与目录的一致性检查。档案实体破损、残缺的要进行登记,征求同意后对破损、残缺档案进行裱糊抢救,目录错误的要予以修正,无数字化目录的要予以著录。如果该档案为涉密档案,则不进行全文扫描,并予以标记。 2)扫描前,对档案进行拆卷并整理,对不平整的档案进行平整处理,对错误、漏编的页号进行修正或补编页号。扫描结束,档案需进行恢复性、规范性整理装订。拆卷和装订不能损害档案原件。拆卷时不允许裁切档案纸张,装订时应尽量按原有顺序原孔装订,案卷不掉页,右边和底边整齐,左侧不及装订线的要加装订边。 2、档案整理要求 具体整理方法参照《机关档案业务建设规范》、《归档文件整理规范》。档案整理的归档范围和保管期限参照国家档案局第8号令《机关文件材料归档范围和文书档案保管期限规定》。具体任务包括:区分归档年度、鉴定保管期限、剔除重份文件、组卷、编写页码、打印目录、打印封面、打印备考表、盖归档章、填写档号项、装订、装盒、填写背脊、入库、上架等,具体以业务性标准规范标为准。 3、档案著录要求 (1)、需符合国家档案局发布的《纸质档案数字化技术规范》、《档案著录规则》和安徽省档案局发布的《文书档案文件级目录数据库结构与著录细则》在数字化加工方面的相关规定,并按太和县档案局要求,将档案数据著录进太和县档案局档案管理软件系统中。著录的档案信息要求准确无错别字、符号正确、题名完整通顺、无缺项,对传统方法整理的档案案卷题名、会议记录类档案、无明确题名的通知等需总结完整通顺,符合著录规则,对不完整的题名需要按照要求自拟题名。 (2)、卷内目录需与案卷目录对应,按要求进行录入,并进行校对,确保准确,著录完成后按太和县档案局要求打印相应目录。 (3)、著录时,在文件、会议记录或其他档案材料中如遇到有人员职务任免、离退休、工资福利、关系调动、奖励处罚等的人名需要全部著录到人名项中。 4、扫描和图像处理要求: 1)扫描时应根据纸质档案的材质选择相应的扫描设备和扫描方式,避免纸张褶皱、撕裂、破损等情况的发生,保证档案不受损。 2)对纸张脆化、较古老、超薄的和不可拆卷的档案需要采用专业不拆卷非接触冷光源扫描仪进行扫描。 3)档案扫描图像色彩模式采用24位真彩式,采用TIFF格式存储,按照统一标准对图像文件命名,以目录数据库内该文件档号对扫描图像进行分文件夹命名,标准以太和县档案馆提供的技术标准为准。A4纸张大小档案扫描的原始图像文件和修图后的图像文件,必须是TIFF格式,采取适当比例压缩,图像文件容量大小控制在500KB至1MB,A3纸张大小的图像文件控制在500KB至2MB。特殊情况最大不超过5M。压缩后的图像文件应清晰、完整,颜色无异常,放大100%比例时图像不失真、无锯齿点。

相关文档
最新文档