纸质档案电子化加工技术规范

发布时间:2011-11-17 00:40:52

贵州电网公司

纸质档案电子化加工技术规范

1 范围

本规范规定了纸质档案电子化加工的主要技术要求,以保证贵州电网公司档案电子化加工质量。本规范适用于对各种纸质档案(包括文书档案、科技档案、照片档案等)的扫描电子化加工处理。

2 电子化加工要求

2.1 总则

贵州电网公司数字档案馆系统对纸质档案数字化的关键要求是:

对于300dpi200dpi的分辨率不作硬性规定,在分辨率标准为大于200dpi的前提下,保证图像的清晰和OCR识别,其中“手写体文档、地形图纸文档、照片档案”不作OCR识别。

根据贵州电网公司的实际,采用以件(文件)为单位的多页tif的存储格式,tif格式的压缩算法黑白采用CCITT GP4、灰度和彩色采用LZW

保证电子化影像的完整性和顺序的正确性。

文书档案要求把加工的文件内容区分为:收文办文单++附件为一个文件,正式红头文件+附件+发文稿为一件,底稿不作扫描处理,以便对文书档案原文信息检索利用的权限进行有效的控制。

密级文件一律不扫描,有目录的要建索引,但不挂电子原文。

2.2 数字化最终成果的技术规范

2.2.1 扫描方式

文本材料、黑白照片采用黑白二值图像,对于300dpi200dpi的分辨率不作硬性规定,在分辨率标准为大于200dpi,存储格式为单页tiff格式,采用CCITT group4压缩算法;

彩色照片档案宜采用真彩色(24位)图像,分辨率为200dpi,存储格式为单页tiff格式,采用JPEG压缩算法;

彩色和带灰度的图纸材料采用8位灰度或真彩色(24位)图像,分辨率为200dpi,存储格式为单页tiff格式,采用LZW压缩算法;

保证图像的清晰和OCR识别,其中“手写体文档、图纸文档、照片”不作OCR识别;

2.2.2 图像质量要求

●图像页面清楚,要求去除数字图像中的杂点、黑边等。

●数字图像的文字水平偏斜角度小于 1 度,图像水平偏不超过页面内半个文字。(视原件的倾斜程度)

2.2.3 图像命名方式及存储结构

对加工合格的成果文件进行批量挂接上传,存储结构为:

加工的多页TIF文件存放于光盘根目录的image文件夹下,相应的档案著录信息数据库文件在光盘根目录下,名为archive.mdb

多页TIF文件命名:

案卷形式:以案卷档号+卷内序号命名多页TIF文件,如:1001-8201-1-1.tif

件盒形式:以文件档号命名多页TIF文件。如:2005-102-1.tif

2.2.4 数据库(archive.mdb)的结构:

科技档案结构

案卷目录

目录代号

分类号

分类名称

案卷号

档号

案卷题名

保管期限

立卷单位

保管单位

立卷人

检查人

文字页数

图纸页数

总页数

件数

起始日期

终止日期

案卷年度

密级

归档日期

检查日期

归档份数

库位号

互见号

责任部门

检索号

备注

工程类型

电压等级

项目名称

卷盒规格

卷内目录

目录代号

分类号

分类名称

档号

顺序号

题名

编制日期

年度

编制单位

文件编号

保管期限

文字页数

图纸页数

文件页数

页次

密级

载体类型

责任部门

互见号

文字

备注

kword

文书档案结构

案卷目录(传统文书)

目录代号

年度

档号

案卷号

保管期限

机构代码

案卷题名

案卷年度

起始日期

终止日期

互见号

文件件数

总登记号

室编起始件号

室编终止件号

总页数

分类号

分类名称

密级

库位号

立卷人

立卷日期

检查人

检查日期

卷内文件情况说明

备注

卷内目录(传统文书)

目录代号

年度

序号

保管期限

机构代码

题名

文号

责任者

密级

页数

页次

成文日期

互见号

库位号

案卷号

分类号

分类名称

归档份数

载体类型

文种

紧急程度

文字

纸张规格

来文分类号

备注

kword

盒目录(文件管理)

年度

保管期限

分类号

分类名称

盒号

总页数

主办部门

检查日期

室编起始件号

室编终止件号

整理人

检查人

整理日期

卷盒规格

盒内文件情况说明

密级

库位号

备注

文件目录(文件管理)

年度

件号

分类号

分类名称

档号

题名

成文日期

文号

来文分类号

责任者

页数

主办部门

保管期限

密级

紧急程度

文字

载体类型

纸张规格

文种

互见号

归档份数

归档日期

收发文类型

备注

kword



3 档案扫描加工流程

3.1 文件加工流程图



步骤

要求及标准

1

提卷

提卷人与档案全宗单位专职人员清点资料出库、入库数量,填写提卷/还卷单,双方签字确认交接。

2

前期处理

按《贵州电网公司文书档案管理办法》、《贵州电网公司档案业务工作规范》进行规范处理。

3

拆钉

起钉、拆线。

4

整理

文书

1、每个年度(目录号)以档号从小到大的顺序排列;卷内封面、卷内目录、卷内备考表、不扫描,重复资料只要一份;

2、编写页号:统一编写在正面的右上角,反面的左上角;大小为1~2平方厘米。对原页号编制不规范的进行修正。卷内封面、卷内目录、卷内备考表。

3、对案卷级档案的加工,在每份起始页号旁打三角符号,便于索引;

4、如有漏编、错编、重编,均应修正重编。重号的文件,要剔出,放到最后一个档号。要保持编号的顺序和连惯性不能断号、缺号。

科技:

1、每个项目以档号从小到大的顺序排列;“案卷封面”、“卷内目录”、“卷内备考表”、“图纸目录”不编页号、不扫描;页号编写在右下角大小为1~2平方厘米;在每份起始页号旁打三角符号,便于索引;

2、原件有破损的,要用A4幅面的纸进行托裱。

3、对小于A4幅面的文件材料要用A4规格的纸托裱。对大于A4幅面的文件材料要拆叠成A4幅面。

4、对按标准整理完成的档案,用铅笔在文件上填写档号。

5、如有漏编、错编、重编,均应修正重编。档号、序号重号的要剔出,放到最后。要保持编号的顺序和连惯性不能断号、缺号。

步骤

要求及标准

5

扫描

1.整页图像有效内容要求扫描清晰、不变形、扫描完整(视原件);

2扫描时必须逐页核对页号是否正确

3.不能有漏扫、重扫、错扫,以及顺序错误。

6

优化

1、数字图像的文字水平偏斜角度小于1度,图像水平偏斜不超过页面内半个文字。(视原件的倾斜程度);

2、不能优掉有效信息及页码,优化范围为图纸全版面;

3、图像四周不能存在大量黑边、黑点、黑线。

7

核查补

将扫描完成的资料,逐一检查,对漏处理的黑边、纠斜、脏点进行处理并进行记录,形成合格成品。

8

分份

在加工系统中进行文件标记分隔, 以便建立扫描影像和目录索引对应关系。

9

索引

以电子化加工图像文件为依据,按照数字档案馆系统著录字段和信息建索引。盒文件目录有的条目,但无文件实体或未扫描的文件,要建目录索引并保持原有档号。

10

校对

索引目录和实物档案要一一校对,发现问题记录并统一修改。

11

质检

对加工好的影像数据库进行检查,对超过规定值的不合格产品返回车间,合乎标准的进入下一流程。

12

抽查

准成品按照5%的量抽查,有一件不合格,全部返回车间。

13

刻盘

合格产品刻录光盘。

14

装订

1、已装订的案卷经拆除扫描后,要恢复原状;

3、对准备装订的资料逐页核查顺序、方向、整齐程度;

3、装订采用1-10 页的用不锈钢订书针,10页以上采用“三孔一线”,左下对齐方式装订,有卷内封面装订的案卷,卷内目录及备考表均一并装订在卷内封面内,不能装订到有效信息;

4、孔至底边的距离为7.0CM,每个孔之间间距为7.5CM,孔与资料背脊间距1.0CM

15

检查

检查档案的还原质量。加工成品中我漏扫、错扫的一律补扫。

16

还卷

将加工完成的档案归还、入库,双方负责人清点交接, 在提卷/还卷单上签字确认。

4 电子化加工成果与数字档案馆接口

在进行电子化加工的同时,按照数字档案馆系统的著录字段和信息,进行著录加工,并将加工和著录成果导入数字档案馆系统。

系统的接口如下图所示:

纸质档案电子化加工技术规范

相关推荐