[摘要]本文首先对图书馆自动化系统及其发展进行阐述,介绍“传统馆藏提供”的发展方向---“电子信息资源存取”服务,分析数字化建设需要的基本条件,进而对数字保存的政策保障、数字化内容选择及信息资源数字化项目实施标准框架的作用进行梳理和描述。
[关键词自动化集成系统; 数字保存; 标准框架
[中图分类号]G250.7
[文献标识码]A
计算机技术、微电子技术和电信技术的迅速发展和广泛应用,极大地提高了人类对文献信息的处理和管理能力,提高了图书情报中心对文献流的自动化控制程度,有效促进了图书馆自动化、网络化和数字化建设。[1]
随着信息技术的迅猛发展,数字资源以其新颖性、时效性和前瞻性等优势,逐渐成为图书馆馆藏的主体和备受用户青睐的信息资源,数字资源建设也随之成为图书馆信息资源建设的重点。本文试图解析数字化建设的技术手段、政策措施、数字化内容选择原则和项目实施标准框架,为后续研究提供参考。
1 图书馆自动化系统
1.1 图书馆自动化系统内涵、国内外发展现状及趋势
图书馆自动化是图书馆数字化建设中一个综合的、整体性的概念,是为了提高图书馆工作效率,应用现代化设备,通过软件来处理图书馆的各项业务工作,以满足图书馆管理及用户信息需求的系统。传统的图书馆自动化系统和图书馆集成管理系统一词等同,专指用于馆藏纸质图书及其管理活动的自动化。[2]
引发图书馆数字化的外部直接动因有两个,即:信息载体的数字化和信息传播的网络化。[3]近些年,随着信息技术的迅猛发展及互联网的普及,图书馆数字化建设如雨后春笋,高潮迭起。现代图书文献突破了纸书载体的传统模式,采用多种形式记录知识、传播信息,电子报纸、电子期刊、电子图书、各种类型光盘数据库、多媒体等电子文献迅速增加。这类载体的馆藏文献,由于适应现代科学文化发展的需要,在生产、保存、检索、流通领域,以小型、轻量、高密度化取胜于纸质文献,具有更加普及的社会发展趋势。那么数字资源能否完全取代纸质文献?问题的关键在于,技术的发展还远不足以取代人们固有的阅读习惯。纸质文献由于十分普及,阅读传递简单方便,对照参考运用自如,不受空间和设备条件的限制,不仅不会被取代而且会更加高速优质地向前发展。[4]因此,纸质文献和数字资源将长期并存。
我国图书馆自动化自20世纪90年代开始,逐步进入实用化阶段,目前国内已有较为成熟的图书馆自动化集成管理系统,深圳图书馆推出的ILAS图书馆自动化集成系统为数据的标准化和资源共享打下了基础。目前我国数字图书馆发展较快,但数字图书馆还没有形成规范化的运行模式,国外的相关研究较多,一些自动化系统已经增加了相应功能。因此,不能把图书馆数字化建设与图书馆自动化割裂开来。在图书馆自动化集成系统的开发中,必须从图书馆整体信息化、数字化建设加以考虑,从而最终实现图书馆的自动化和现代化。
美国是图书馆自动化发展最早的国家,据美国图书馆协会(ALA)最新统计,美国现有各类型图书馆117 859个,其中学术、大学图书馆3 527个,学校图书馆93 861个,图书馆一般都实现了自动化系统管理,美国高校图书馆属于研究型图书馆,对自动化水平要求较高,这种需求正形成一种新的市场增长点,即对数字资源的管理;同时系统开发商竭力开发附加产品,通过新的产品和服务来提高收入。
这些年,美国的学校图书馆越来越倾向于在同一学区内建立集中型基于Web的多用户系统,美国的企业图书馆也有类似情况,集中型系统正在取代单机系统。据美国图书馆技术专家Marshall Breeding估计,美国图书馆自动化系统市场经济效益良好,在未来几年内将稳步发展。[5]
随着信息技术的高速发展,尤其是Web2.0技术、数字化技术、云计算技术、Web3.0语义网等技术的发展和应用,图书馆自动化系统发生了非常多的变化,其未来发展趋势主要有以下4个方面:①系统架构由C/S向混合架构、多层架构、云架构转变。C/S体系架构以局域网为中心,是图书馆自动化最经典的系统架构,它将整个自动化系统分为客户端和服务器端两个部分,服务器端负责数据管理,客户端完成与用户的交互任务。由于图书馆自动化系统目前面向馆员的应用环境主要还是在局域网内,因此C/S仍旧是目前绝大多数自动化系统采用的架构模式。②管理内容由纸质图书为主向数字资源为主的复合馆藏转变。③支持的重点由内部业务为主向资源发现为主的模式转变,这将主要借助于OPAC实现。④元数据格式逐渐多元化,MARC作用逐渐弱化。
1.2 数字资源整合
在信息技术和网络背景下,如何将图书馆大量异构系统的资源进行重组和整合,是近几年图书馆自动化研究的一个重要问题。从国内外来看,数字资源整合的概念是以整合对象的不断扩充以及整合方法的不断丰富而展开的,其中包括着力于支持用户利用信息提炼知识、解决问题,构建符合用户需要的服务机制。
不同类型的数字整合问题需要不同的整合技术,一般来说,数字整合可以分为数据整合(data integration)和功能整合(function integration)两种基本类型:数据整合要解决的问题是通过统一的界面和集成的模式(schema)对异构的外部数据源进行访问,使得这些异构数据看起来就像由一个数据管理系统进行管理的;功能整合要解决的问题是用同构功能来处理不同应用系统所封装的数据。
此外还有其他类型的整合。针对数字资源整合的复杂性和多样性,相应的整合技术方案也综合了数据描述、知识组织、计算机技术等多种手段,目前实际应用的主要有跨库(联邦)检索、资源链接、资源描述等技术方案。
1.3 图书馆数字化建设及其基本物质条件
国内图书馆数字化建设大致分为三个阶段:
第一阶段:将传统文献转化为数字文献,建立起数字图书馆独立系统的初级阶段。
第二阶段:将第一阶段中所建立的各种系统联系起来,建立集成分布式的数字图书馆的中级阶段。
第三阶段:核心与重点已从数字资源及计算系统转移到数字图书馆的用户上来,致力于建设以用户为中心的数字图书馆系统,这也是目前图书馆数字化建设发展的高级阶段。
高等学校图书馆数字资源计量指南(2007年)将数字资源定义为图书馆引进(包括购买、租用和受赠)或自建(包括扫描、转换和录入)的,拥有磁、光介质或网络使用权的数字形态的文献资源,并划分为四种类型:电子图书;电子期刊;二次文献数据库(包括题录、文摘、索引等);其他数据库。数字资源建设是图书馆数字化建设的灵魂与核心。[6]
目前,馆藏文献数字化的方法主要有两种:①将馆藏文献转换为全文数据库;②生产馆藏二次文献数据库。[7]
图书馆的数字化建设是一项复杂的系统工程,它需要相应的基本物质条件,这些条件包括:
①国家信息基础设施的建立和完善。
②关键技术的突破。数字图书馆的核心技术包括信息资源的数字化技术、组织存储技术和检索技术,此外还涉及接口技术、推送技术及信息安全技术等,核心、关键技术的突破是图书馆数字化建设的技术保障。目前对各种类型信息资源进行数字化主要有键盘方式、图像扫描、音频录制、数字视频捕获等四种常用方式,我国目前的一些数字图书馆建设项目基本采用“图书馆自动化+多媒体信息资源存储”模式,应该说这只是数字图书馆的初级形式。
③必要的资金保证。图书馆的文献信息资源数字化建设是一项成本很高的工作,其成本有两个方面:一是数字化过程工作量巨大并需要大量设备损耗,二是数字化信息的压缩、存储、传递需要硬盘空间和网络带宽资源,关键问题是如何得到初始建设资金、如何使资金一开始就纳入信息市场机制之中,进入良性循环。
④政府及有关机构作用的发挥。从国外经验看政府发挥的主要作用有:承担有关规范和标准的制定工作,确立数字图书馆社会文化设施的地位,提供一定的试验环境,通过政策、法规引导、组织、规范、协调、促进数字化建设并予以投资。[8]
2 用户服务的创新—从“传统馆藏提供”向“电子信息资源存取” 发展
现代信息技术在图书馆应用的快速发展及图书馆用户需求的个性化、差异化愈加明显等趋势,使图书馆的管理手段、业务流程等发生了巨大变化,传统图书馆正在逐渐演变为一个集印刷型文献与电子资源于一体的现代化图书馆。[9]
传统馆藏以印刷型文献资料为主体,电子信息资源是指“所有以电子数据的形式把文字、声音、图像等多种形式的信息存贮在光、磁等非印刷介质的载体中,并通过网络通信、计算机或终端等方式再现出来的信息资源”。
随着大批联机数据库的问世、电子出版物的出版和图书馆传统印本馆藏的数字化转换,电子信息资源将成为未来图书馆信息资源的主体,图书馆用户服务的内容也将逐步从传统印本馆藏的提供向电子信息资源存取方向发展,图书馆可以更加便捷地为读者提供多种类型服务,如可以通过计算机终端或工作站方便用户访问图书馆;可以通过CD-ROM局域网向用户提供书目、索引、文摘等检索工具和参考咨询服务;可以通过连接INTERNET、DIALOG等联机检索系统和OCLC(Online Computer Library Center, Inc.联机计算机图书馆中心)、RLIN(RLG Union Catalog)等书目服务机构以及网上各种不同类型的数据库,为用户提供更加广泛的外部电子资源信息服务。[10]
3 数字保存
3.1 数字保存的政策保障[11]
数字保存是信息资源数字化项目的核心组成,图书馆高层管理对数字保存重视的一个标志是数字保存方针的制定与实施,其目的是确保数字资源的长期有效存取。康乃尔大学图书馆根据2005年的调查结果,总结出目前对图书馆数字资源长期保存构成最大威胁的5个因素以及他们的威胁程度,不幸的是,方针与规划的缺乏被列为第1位(见表1)。
表1 目前对图书馆数字资源长期保存构成最大威胁的5个因素
缺乏数字资源长期保存方针或规划 用于长期保存的资源不足 图书馆高层管理支持不充分 技术过时 缺乏所需
的专家
威胁程度 63% 57% 47% 35% 19%
在数字保存领域,欧美是领航者,相比之下,国内图书馆的数字保存刚刚起步。欧美国家积累的知识和经验的确是一本很好的教科书,很值得我们认真学习和研究,图书馆的决策者们应冷静思考,统筹规划,以确保数字资源的长期存取。
众多学者认为,数字资源长期保存过程中涉及到诸如管理问题、法律问题、成本问题、权益问题及合作共享问题等多方面的非技术问题。[12]目前,许多国家通过对图书馆经费的重新分配,将数字资源长期保存费用从项目经费支持转到图书馆的正常经费使用,目的是使保存工作真正长期地维持。[13]
3.2 数字化准备
数字化准备包括数字化工作环境的布置和软硬件系统的安装调试。许多珍贵资源和易碎载体资源在数字化过程中对环境都有一定的要求,因此设置数字化环境要咨询专家的意见,确保原始资源搬移的安全以及数字化环境的适宜,诸如数字化操作所需要的光亮度、湿度、震动等,工作场所不易随便更换以免导致原始资源的损伤、丢失和其他负面影响以及时间的浪费。
硬件安装包括数字化过程所需的扫描仪、数码相机等有关设备,以及连接这些硬件设备的计算机网络基础设施。软件系统包括图像生成软件、过程处理软件、元数据析出软件和质量控制软件等。
3.3图书馆怎样使用DPR(The Digital Preservation Repository)仓库[14](见图1)
图1 图书馆怎样使用DPR(The Digital Preservation Repository)仓库
4 数字化内容选择及项目实施标准框架
4.1 数字化内容选择的概念
信息资源数字化内容选择是依据确定的标准进行相符性判断,将符合条件的原始资源遴选出来,继而进行数字化加工的一个过程。其原因是多方面的,概括起来主要有:①解决数字化生产高成本和图书馆经费有限性之间的矛盾,因为几乎没有图书馆有充足的资源来对整个馆藏进行数字化,内容选择不可避免。②数字资源管理的需要。技术的快速发展使数字化项目所生成的数字资源的生命周期越来越短,投入巨资进行数字迁移是延长数字资源生命的一个重要途径,维护成本的昂贵促使人们不得不考虑数字化内容的选择。③图书馆信誉的需要。图书馆作为责任机构,要对其所发布的数字化信息资源的可靠性和准确性负责。
数字化内容选择的基本原则应该是原始文献的永久价值,美国伯克利数字图书馆提出数字文献收藏的四个级别:永久保存级、服务级、镜像级与链接级。除永久保存级的文献类别不可变化外,其它三个级别的文献收集范围均随图书馆馆藏政策的变化而变更。
4.2 数字化标准的内涵
信息资源数字化是一种耗资巨大的项目,不同图书馆实施这类项目的目的可能不尽一致,但目标一致,即寻求投资效益(包括经济效益和社会效益)最大化,追求数字产品应用的范围最广泛化、时间最持久化,这就要求数字产品及其生产机制规范化,采用一套行之有效的标准确保数字化生产、数字资源管理和传播的一致性和兼容性。标准的作用在于:①互操作,用户可以跨越数字化项目实现对数字资源的无缝访问;②开放存取,采用开放标准和通用格式,数字资源将被广泛访问并方便多语言用户和残疾人使用;③保存,可确保数字资源能够长期使用以使其投资效益最大化;④安全,保护数字资源知识产权和用户个人隐私,确保数字资源的完整性和准确性。
相反,一个缺乏标准的数字化项目,其实施结果将会对用户、投资机构和信息资源的创作者产生消极影响。通常情况下,项目标准采用必备标准和指导原则(非强制性标准)两大类型。
4.3 项目实施标准框架
一般来说,项目标准框架包含5个方面的内容:
① 项目准备标准框架,如硬件选择、软件选择、环境设置、原始信息资源载体处理和人员培训等。
② 数字主文档保存与管理标准框架,如文档格式、存储介质选择和保存策略等。
③ 元数据描述标准框架 元数据从字面上可以理解为“关于数据的数据”,但是它通常被认为是根据资源而建立的能够有助于对资源进行一系列操作的结构化数据,不同的元数据可以支持不同的操作功能。这里所说的资源可以是数字化的,也可以是非数字化的,对资源的操作可以是开发、管理(包括权限管理)和长期保存。这里所说的元数据包括描述性元数据、管理元数据、保存性元数据、结构性元数据和数字资源集合的元数据。
④ 数字资源发布标准框架,包括传输过程和Web站点访问.
⑤ 资源共享标准框架,包括RDF(Resource Description Framework)框架与Web本体、分布搜索和元数据收割。
5结语
我校图书馆采编、流通、阅览等主要业务部门已完全实现计算机管理,图书馆购置国内外大型全文数据库34种,电子图书105万册,电子资源年均访问量超过30万人次,荣获CNKI数据库“河南省最佳应用单位”称号;院系资料室与图书馆联网,实施统一平台管理,用户全部实行“校园一卡通”借书,文献传递服务、定题服务、电子文献检索和网络信息服务等深受师生欢迎,数字化建设初具规模,为学校教学和科研起到了良好的支撑和保障作用,为其成为豫西地区图书信息中心打下了坚实的基础。
[参考文献]
[1] 马费成, 李纲, 查先进. 信息资源管理[M]. 武汉:武汉大学出版社,2001
[2] 李书宁, 王涛. 图书馆自动化系统发展热点与趋势研究[J]. 图书与情报, 2011(6):66-69, 75
[3] 杨向明. 迈向21世纪的复合图书馆[M]. 北京:大众文艺出版社,2003
[4] 沈继武. 藏书建设与读者工作[M]. 武汉:武汉大学出版社,1987
|