纸质档案电子化加工技术规范
发布时间:2011-11-17 00:40:52
发布时间:2011-11-17 00:40:52
贵州电网公司
纸质档案电子化加工技术规范
1 范围
本规范规定了纸质档案电子化加工的主要技术要求,以保证贵州电网公司档案电子化加工质量。本规范适用于对各种纸质档案(包括文书档案、科技档案、照片档案等)的扫描电子化加工处理。
2 电子化加工要求
2.1 总则
贵州电网公司数字档案馆系统对纸质档案数字化的关键要求是:
●对于300dpi和200dpi的分辨率不作硬性规定,在分辨率标准为大于200dpi的前提下,保证图像的清晰和OCR识别,其中“手写体文档、地形图纸文档、照片档案”不作OCR识别。
●根据贵州电网公司的实际,采用以件(文件)为单位的多页tif的存储格式,tif格式的压缩算法黑白采用CCITT GP4、灰度和彩色采用LZW。
●保证电子化影像的完整性和顺序的正确性。
●文书档案要求把加工的文件内容区分为:收文办文单+正文+附件为一个文件,正式红头文件+附件+发文稿为一件,底稿不作扫描处理,以便对文书档案原文信息检索利用的权限进行有效的控制。
●密级文件一律不扫描,有目录的要建索引,但不挂电子原文。
2.2 数字化最终成果的技术规范
2.2.1 扫描方式
●文本材料、黑白照片采用黑白二值图像,对于300dpi和200dpi的分辨率不作硬性规定,在分辨率标准为大于200dpi,存储格式为单页tiff格式,采用CCITT group4压缩算法;
●彩色照片档案宜采用真彩色(24位)图像,分辨率为200dpi,存储格式为单页tiff格式,采用JPEG压缩算法;
●彩色和带灰度的图纸材料采用8位灰度或真彩色(24位)图像,分辨率为200dpi,存储格式为单页tiff格式,采用LZW压缩算法;
●保证图像的清晰和OCR识别,其中“手写体文档、图纸文档、照片”不作OCR识别;
2.2.2 图像质量要求
●图像页面清楚,要求去除数字图像中的杂点、黑边等。
●数字图像的文字水平偏斜角度小于 1 度,图像水平偏斜不超过页面内半个文字。(视原件的倾斜程度)
2.2.3 图像命名方式及存储结构:
对加工合格的成果文件进行批量挂接上传,存储结构为:
●加工的多页TIF文件存放于光盘根目录的image文件夹下,相应的档案著录信息数据库文件在光盘根目录下,名为archive.mdb。
●多页TIF文件命名:
案卷形式:以案卷档号+卷内序号命名多页TIF文件,如:1001-8201-1-1.tif。
件盒形式:以文件档号命名多页TIF文件。如:2005-102-1.tif
2.2.4 数据库(archive.mdb)的结构:
●科技档案结构
案卷目录
目录代号 | 分类号 | 分类名称 | 案卷号 | 档号 |
案卷题名 | 保管期限 | 立卷单位 | 保管单位 | 立卷人 |
检查人 | 文字页数 | 图纸页数 | 总页数 | 件数 |
起始日期 | 终止日期 | 案卷年度 | 密级 | 归档日期 |
检查日期 | 归档份数 | 库位号 | 互见号 | 责任部门 |
检索号 | 备注 | 工程类型 | 电压等级 | 项目名称 |
卷盒规格 | ||||
卷内目录
目录代号 | 分类号 | 分类名称 | 档号 | 顺序号 |
题名 | 编制日期 | 年度 | 编制单位 | 文件编号 |
保管期限 | 文字页数 | 图纸页数 | 文件页数 | 页次 |
密级 | 载体类型 | 责任部门 | 互见号 | 文字 |
备注 | kword | |||
●文书档案结构
案卷目录(传统文书)
目录代号 | 年度 | 档号 | 案卷号 | 保管期限 |
机构代码 | 案卷题名 | 案卷年度 | 起始日期 | 终止日期 |
互见号 | 文件件数 | 总登记号 | 室编起始件号 | 室编终止件号 |
总页数 | 分类号 | 分类名称 | 密级 | 库位号 |
立卷人 | 立卷日期 | 检查人 | 检查日期 | 卷内文件情况说明 |
备注 | ||||
卷内目录(传统文书)
目录代号 | 年度 | 序号 | 保管期限 | 机构代码 |
题名 | 文号 | 责任者 | 密级 | 页数 |
页次 | 成文日期 | 互见号 | 库位号 | 案卷号 |
分类号 | 分类名称 | 归档份数 | 载体类型 | 文种 |
紧急程度 | 文字 | 纸张规格 | 来文分类号 | 备注 |
kword | ||||
盒目录(文件管理)
年度 | 保管期限 | 分类号 | 分类名称 | 盒号 |
总页数 | 主办部门 | 检查日期 | 室编起始件号 | 室编终止件号 |
整理人 | 检查人 | 整理日期 | 卷盒规格 | 盒内文件情况说明 |
密级 | 库位号 | 备注 | ||
文件目录(文件管理)
年度 | 件号 | 分类号 | 分类名称 | 档号 |
题名 | 成文日期 | 文号 | 来文分类号 | 责任者 |
页数 | 主办部门 | 保管期限 | 密级 | 紧急程度 |
文字 | 载体类型 | 纸张规格 | 文种 | 互见号 |
归档份数 | 归档日期 | 收发文类型 | 备注 | kword |
3 档案扫描加工流程
3.1 文件加工流程图
序号 | 步骤 | 要求及标准 |
1 | 提卷 | 提卷人与档案全宗单位专职人员清点资料出库、入库数量,填写提卷/还卷单,双方签字确认交接。 |
2 | 前期处理 | 按《贵州电网公司文书档案管理办法》、《贵州电网公司档案业务工作规范》进行规范处理。 |
3 | 拆钉 | 起钉、拆线。 |
4 | 整理 | 文书: 1、每个年度(目录号)以档号从小到大的顺序排列;卷内封面、卷内目录、卷内备考表、不扫描,重复资料只要一份; 2、编写页号:统一编写在正面的右上角,反面的左上角;大小为1~2平方厘米。对原页号编制不规范的进行修正。卷内封面、卷内目录、卷内备考表。 3、对案卷级档案的加工,在每份起始页号旁打三角符号,便于索引; 4、如有漏编、错编、重编,均应修正重编。重号的文件,要剔出,放到最后一个档号。要保持编号的顺序和连惯性不能断号、缺号。 科技: 1、每个项目以档号从小到大的顺序排列;“案卷封面”、“卷内目录”、“卷内备考表”、“图纸目录”不编页号、不扫描;页号编写在右下角,大小为1~2平方厘米;在每份起始页号旁打三角符号,便于索引; 2、原件有破损的,要用A4幅面的纸进行托裱。 3、对小于A4幅面的文件材料要用A4规格的纸托裱。对大于A4幅面的文件材料要拆叠成A4幅面。 4、对按标准整理完成的档案,用铅笔在文件上填写档号。 5、如有漏编、错编、重编,均应修正重编。档号、序号重号的要剔出,放到最后。要保持编号的顺序和连惯性不能断号、缺号。 |
序号 | 步骤 | 要求及标准 |
5 | 扫描 | 1.整页图像有效内容要求扫描清晰、不变形、扫描完整(视原件); 2.扫描时必须逐页核对页号是否正确; 3.不能有漏扫、重扫、错扫,以及顺序错误。 |
6 | 优化 | 1、数字图像的文字水平偏斜角度小于1度,图像水平偏斜不超过页面内半个文字。(视原件的倾斜程度); 2、不能优掉有效信息及页码,优化范围为图纸全版面; 3、图像四周不能存在大量黑边、黑点、黑线。 |
7 | 核查补 扫 | 将扫描完成的资料,逐一检查,对漏处理的黑边、纠斜、脏点进行处理并进行记录,形成合格成品。 |
8 | 分份 | 在加工系统中进行文件标记分隔, 以便建立扫描影像和目录索引对应关系。 |
9 | 索引 | 以电子化加工图像文件为依据,按照数字档案馆系统著录字段和信息建索引。盒文件目录有的条目,但无文件实体或未扫描的文件,要建目录索引并保持原有档号。 |
10 | 校对 | 索引目录和实物档案要一一校对,发现问题记录并统一修改。 |
11 | 质检 | 对加工好的影像数据库进行检查,对超过规定值的不合格产品返回车间,合乎标准的进入下一流程。 |
12 | 抽查 | 准成品按照5%的量抽查,有一件不合格,全部返回车间。 |
13 | 刻盘 | 合格产品刻录光盘。 |
14 | 装订 | 1、已装订的案卷经拆除扫描后,要恢复原状; 3、对准备装订的资料逐页核查顺序、方向、整齐程度; 3、装订采用1-10 页的用不锈钢订书针,10页以上采用“三孔一线”,左下对齐方式装订,有卷内封面装订的案卷,卷内目录及备考表均一并装订在卷内封面内,不能装订到有效信息; 4、孔至底边的距离为7.0CM,每个孔之间间距为7.5CM,孔与资料背脊间距1.0CM。 |
15 | 检查 | 检查档案的还原质量。加工成品中我漏扫、错扫的一律补扫。 |
16 | 还卷 | 将加工完成的档案归还、入库,双方负责人清点交接, 在提卷/还卷单上签字确认。 |
4 电子化加工成果与数字档案馆接口
在进行电子化加工的同时,按照数字档案馆系统的著录字段和信息,进行著录加工,并将加工和著录成果导入数字档案馆系统。
系统的接口如下图所示: