关闭→
当前位置:笔墨馆>实用文写作>实用范文>论文>浅谈纸质标准文献的数字化过程及其管理措施论文

浅谈纸质标准文献的数字化过程及其管理措施论文

笔墨馆 人气:1.15W

前言

浅谈纸质标准文献的数字化过程及其管理措施论文

在信息化社会,如何利用先进的计算机网络技术有效地管理纸质标准文献,开发和利用纸质标准资源,提高纸质标准文献的综合利用和服务水平,已成为数字化标准馆建设和发展所面临的一个重要课题。纸质标准文献的数字化管理作为开发和利用标准信息资源的基础和前提,作为数字化标准馆建设的一项重要的、基础性的工作,已被提上了重要日程。

1对纸质标准文献的数字化与数字化管理的理解

1.1数字与数字化

数字的特点是最简单、最客观、速度快、国际化。所谓数字化,是指用计算机技术将模拟信号转换为数字信号的处理过程。

1.2纸质标准文献的数字化的含义

所谓纸质标准文献的数字化,是指采用扫描仪或数码相机等数码设备对纸质标准文献进行数字化加工,转换成数字信号或数字编码,将其存储在磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。

1.3纸质标准文献的数字化管理的含义

纸质标准文献的数字化管理是指利用计算机、通信、网络等技术,通过数字信号或数字编码来操纵管理对象、控制管理行为,实现标准文献的采集、整理、加工、存储、备份、利用、服务等的管理活动和方法。随着管理过程信息化程度的提高,采用标准文献的数字化管理系统,实现数字信息系统来辅助质量管理并与实现跨时空、同步性的信息化沟通。

2纸质标准文献的数字化

2.1软硬兼施是前提

纸质标准文献的数字化要实现文本在不同载体之间自由转换,涉及扫描技术、OCR技术、数据压缩技术、数据库技术、多媒体技术、存储技术等多种技术,才能完成数字化的标准文献目录信息、数字化的标准文献全文信息和数字化的标准文献数据库信息。这些数字化技术和工作,依赖于必要的设备设施。因此要大力加强数字化工作的硬献、软献建设,为实现纸质标准文献的数字化提供物质保障。如,软献方面,要准备数据库SQL SERVER、标准文献的数字化管理软献,实现功能模块的管理,能够对不同定义的标准文献信息进行查询、管理。硬献方面,要添置高速扫描仪、平板扫描仪、刻录机、光盘等。

2.2要分类实施

纸质标准文献的数字化,不能一蹦而就。笔者认为,一是要实行“存量数字化”,大力推进已有的纸质标准文献的数字化,实现存量的纸质标准文献100%数字化二是要实行“增量电子化”,全面开展新增的新标准文献的数字化工作。

2.3纸质标准文献的数字化流程

纸质标准文献的数字化,主要流程一般包括纸质标准文献的整理、扫描、图像处理、图像存储、数据处理、数据验收、信息存储、目录建库、数据挂接、数据备份等工序。

2.3.1纸质标准文献的整理

纸质标准文献在扫描之前,要根据情况,按步骤进行适当整理,并视需要作出标识,确保数字化质量。一是做好目录数据准备。主要是规范目录内容,包括确定目录的著录项、字段长度和内容要求。如标准文献的中英文标准名称、标准编号、发布者、发布时间、实施时间、起止页号和页数、附献等。二是拆除装订。在不去除装订物(如钉书针等)情况下,影响扫描工作进行的标准文献,应拆除装订物。拆除装订物时应注意保护标准原献不受损害。三是整理登记。制作并填写纸质标准文献数字化加工过程交接登记表单,详细记录标准文献整理后每份文献的起始页号和页数。四是还原装订。扫描工作完成后,拆除过装订物的标准文献应重新装订。恢复装订时,要注意保持标准文献的排列顺序不变,做到安全、准确、无遗漏。

2.3.2纸质标准文献的扫描

主要是选择扫描方式、扫描色彩模式、扫描分辨率和标准文献扫描,包括根据标准文献幅面的大小(A4, A3等)选择相应规格的扫描仪进行扫描,选择黑白二值、灰度、彩色等扫描色彩模式,选择扫描分辨率(需要进行OCR汉字识别的标准文献,扫描分辨率宜选择大于或等于200dpi),核对每份文献的实际扫描页数与标准文献整理时填写的`文献页数是否一致。

2.3.3图像处理

主要是检查图像偏斜度、清晰度、失真度等图像数据质量、是否漏扫、是否需要纠偏、去污、分区扫描形成的多幅图像的拼接、裁边处理去除多余的白边等。

2.3.4图像存储

包括存储格式和图像文献的命名。采用黑白二值模式扫描的图像文献,一般采用TIFF (G4)格式存储。采用灰度模式和彩色模式扫描的文献,一般采用JPEG格式存储。存储时的压缩率的选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。提供网络查询的扫描图像,也可存储为CEB, PDF或其他格式。纸质标准文献目录数据库中的每一份文献,都有一个与之相对应的唯一编号,以该编号为这份文献扫描后的图像文献命名。多页标准文献可采用该编号建立相应文献夹,按页码顺序对图像文献命名。

2.3.5目录建库

包括数据格式选择、建立目录数据库和目录数据质量检查。目录建库应选择通用的数据格式。所选定的数据格式应能直接或间接通过XML文档进行数据交换。建立标准文献目录数据库,并以人工校对或软献自动校对的方式,对目录数据库的建库质量进行检查。核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。

2.3.6图文转换

将扫描的以TIFF (G4) , JPEG, CEB, PDF或其他格式的图像文献通过OCR文字识别软献或PDF转换器转换成WORD文档。并按标准原献的格式式样排版好。

2.3.7数据挂接

主要包括汇总挂接和数据关联。标准文献数字化转换过程中形成的目录数据库与图像数据库 (或转换好的WORD文档库),检查无误后,通过网络及时加载到数据服务器端汇总。通过每一份图像文献(或转换好的WORD文档)的文献名与标准文献目录数据库中该份文献的编号的一致性和唯一性,建立起一一对应的关联关系,以实现标准文献目录数据库与图像文献(或转换好的WORD文档)的批量挂接。

2.3.8数据验收

以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文献、转换好的WORD文档及数据挂接的总体质量并经分管领导审核、签字。

2.3.9数据备份

经验收合格的完整数据应及时进行备份。为保证数据安全,备份载体的选择应多样化,可采用在线、离线相结合的方式实现多套备份,并实行异地保存。备份数据也应进行检验。备份数据的检验内容主要包括备份数据能否打开、数据信息是否完整、文献数量是否准确等。数据备份后应在相应的备份介质上做好标签,以便查找和管理。

3纸质标准文献的数字化管理

3.1纸质标准文献的数字化管理的优点

纸质标准文献的数字化管理与传统纸质标准文献的管理具有无法替代性和优越性:

3.1.1效益大大提高

纸质标准文献的数字化管理是对以增加人力和办公费用为主的粗放型管理模式的变革。它解决了人力资源增加和管理成本上涨的难题,并且使纸质标准文献的信息对象转化为机读标准文献信息,既节约了保管费用,又节省了保管空间,更为有利的是查阅起来极为方便、快捷,也避免了反复复印标准文献而造成的人力成本的增加和纸张的浪费。

3.1.2效率大大提升

纸质标准文献的数字化管理使标准文献能及时归档,并方便、快捷、及时提供利用。纸质标准文献的数字化管理可远程提供详细、即时的数据信息提供服务。纸质标准文献的数字化管理使查询标准文献变得非常简单,真正做到足不出户。基于标准信息的超时空、远程化传送,数字化的标准文献就成了“无墙界的纸质标准文献”,数字标准文献的标准库也从纸质标准实体的保管变成了提供利用方便、快捷的数字化标准信息中心。而且标准是否更改、是否废止、是否是最新的可一次性族性检索出来,效率大大提升。

3.1.3有力地保护了纸质标准文献的原献

将纸制纸质标准文献转变为数字化电子标准文献后,纸质标准文献的使用更加安全。另外,通过纸质标准文献的数字化处理后,防止了部分纸质标准文献的篡改的行为。

3.2纸质标准文献的数字化管理措施

3.2.1“服务为先”,实施标准文献管理平台的建设

要牢固树立服务理念,坚持服务为先,在服务中实现管理,在管理中体现服务,进一步在标准文献检索利用平台、载体、机制和手段创新上下功夫,建立服务主体多元、资源优化配置、供需对接的服务供应方式,建立“标准文献管理系统”,集标准文献采集、标准文献管理、标准文献利用于一体的综合管理软献,实现对标准文献的收集、鉴别、整理、保管、转递、统计、检索、查阅利用、打印等日常工作的数字化管理。

3.2.2“保障有力”,建设标准文献管理网络

一是建立梯次的人员管理网络,设置管理员管理权限,明确管理员管理职责;二是服务器和服务终端建设,建设一套系统连通局域网络,实现服务器与客户端数据的双向透明传输。

3.2.3“安全第一”,建设标准文献管理防火

标准文献管理安全保障要覆盖事前、事中、事后,覆盖标准文献应用安全、维护安全、使用安全和存储安全。除了前面已提到的数据备份保安全之外,还要重点确保数据库安全。数据库安全包含两层含义:第一层是指标准文献管理系统运行安全。系统运行安全通常受到的威胁如下,一些网络不法分子通过网络,局域网等途径通过入侵电脑使系统无法正常启动;第二层是指标准文献管理系统信息安全。骇客对数据库入侵,并盗取想要的资料。数据库系统的安全特性主要是针对数据而言的,包括数据独立性、数据安全性、数据完整性、并发控制、故障恢复等几个方面。我们加强对纸质标准文献数字化成果的管理,确保其安全、完整和长期可用。

结语

纸质标准文献的数字化及其管理是一项长期的、复杂的、细致的、系统性的工作,必须贯彻“统一规划、分步实施、逐步完善”的工作思路,采取得力措施,扎扎实实地进行,才能取得满意的成效。

TAG标签:#数字化 #纸质 #浅谈 #文献 #论文 #