资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,数字资源长期保存问题,河北大学管理学院 宛玲,11/26/2024,1,汇报内容:,一、为什么要保存数字资源,二、目前发展状况如何,三、如何开展保存活动,四、典型案例介绍,五、面临哪些主要问题,11/26/2024,2,数字资源长期保存是指为保证数字比特流可长期维护和其内容可长期获取的必要管理活动,有两层含意,一是长期存储(storage),一是长期可获取(access)。,11/26/2024,3,一、为什么要保存,信息技术是双刃剑,1、人们对数字资源的依赖日益增强,CNNIC的统计报告,0.94,1.03,1.23,1.37,1.62,2.10,1.11,0.0,0.5,1.0,1.5,2.0,2.5,2004.12,2005.06,2005.12,2006.06,2006.12,2007.06,2007.12,网民人数,亿人,11/26/2024,4,图3.1 中国IPv4地址数量增长情况,11/26/2024,5,图3.3 中国网站数量增长情况,11/26/2024,6,图3.4 中国网页数量增长情况,11/26/2024,7,图4. 2 不同上网地点的网民规模增长情况,11/26/2024,8,2、图书馆拥有的数字资源,采购的,期刊国内的如清华同方;国外的如WSN,NSTL购买的,图书方正,超星,其他,自建的,研究生论文库,特色数据库(如河北大学文库),机构网站信息.,其他,免费获取的,一、为什么要保存,本地镜像,国内镜像,远程访问,11/26/2024,9,3、数字资源非常脆弱,从物理存储方面,数字资源及其所依赖的网络、存储媒体非常不稳定;,信息技术变化太快,硬件和软件都在不可预测地老化。,从使用方面,多数情况下信息机构仅购买了数字资源的使用权;,由于多种原因,数据库商或其委托的镜像服务商有可能终止经营或者停止向用户提供服务。,数字资源一旦无法使用会带来很多问题,一、为什么要保存,11/26/2024,10,一、为什么要保存,4、图书馆的责任,保存数字资源的责任,长久持续地提供数字资源的责任,11/26/2024,11,二、目前发展状况如何,1、国外的进展,图书馆界的行动,澳大利亚国家图书馆启动PANDORA 项目,美国国会图书馆开展的“美国记忆”,英国几所大学联合开展了CEDARS项目,世界各国很多高校图书馆开展了机构库,更多的研究型项目:英国的DCC,德国的,NESTOR,欧洲的,ERPANET等,出版届的行动,美国地球物理学联合会AUG,11/26/2024,12,图书馆与出版商合作的行动,欧洲七个国家图书馆及三个主要出版社以合作项目形式启动了基于网络的欧洲存储图书馆NEDLIB,美国斯坦福大学图书馆牵头开展了由图书馆和出版商共同参加的LOCKSS项目,荷兰国家图书馆与出版商合作开展了保存电子出版物的国家保存行动等.,政府的行动,呈缴制度的建立,美国国会批准实施国家数字信息基础结构和保存规划NDIIPP 项目等,民间的行动,有收费的也有免费的,11/26/2024,13,2、国内的进展,国家图书馆的网络信息资源保存试验项目,CALIS开展了教参和博士论文文摘保存计划,开展对采购的数据库的保存活动,中国科学院国家科学图书馆开展了多种保存活动,北京大学开展了中国WEB博物馆,二、目前发展状况如何,11/26/2024,14,总体来讲:,各国政府越来越重视,参与的行业越来越多,国家间的合作成为趋势,涌现出许多技术方案,教育培训工作被加强,11/26/2024,15,三、如何开展保存活动,1、保存系统框架,OAIS功能模型,数据管理,存档,保存计划,采集,系统管理,获取,用,户,资,源,提,供,者,行政管理,11/26/2024,16,三、如何开展保存活动,2、保存什么,保存什么资源,资源本身的当前和长期使用价值,资源本身的长期战略意义,资源的不可替代性,资源使用渠道的不可替代性,资源保存的合法保障程度,11/26/2024,17,三、如何开展保存活动,保存什么元素,保存数字比特流-即只保存纯粹的数据,保存数据内容-如文档类文件的文本保存,保存数字格式与处理信息(元数据),保存数字信息处理环境,保存数字信息的内容校验、身份认证、版本演变、知识产权管理机制,部分或者全部保存数字信息的知识组织体系信息、组织利用环境。,11/26/2024,18,三、如何开展保存活动,3、,谁来保存,呈缴制度:自愿性强制性,国家保存与出版商授权结合,联合建立并做为出版商委托的第三方保存机构,图书馆之间形成保存联盟,基于集团采购的合作保存形式,商业性质的保存机构(Portico ,OCLC),民间网络信息资源的保存(,Internet Archive,),11/26/2024,19,三、如何开展保存活动,4、用什么技术,复制: 从现有存储媒体上将数据拷贝到同类型或不同类型的新存储媒体上,迁移: 将数字资源迁移到不同的软件或硬件环境下,从而保证数字资源可以在发展的环境中被识别、使用和检索。,仿真: 通过详细描述数字信息利用的各种技术参数和环境条件,使未来计算机系统可以模仿原始系统环境来读取和使用数字信息内容。,11/26/2024,20,三、如何开展保存活动,5、有什么保存策略,按需迁移策略,风干保存策略,技术保存策略,格式管理策略,11/26/2024,21,三、如何保存,6、对保存者的要求(保存系统的认证), 遵从 OAIS Model, 可承担起行政管理责任, 组织机构具有生存能力, 具有持续的财政支持, 拥有合适的技术和程序, 系统具有安全性, 通过程序承担了责任,11/26/2024,22,三、如何保存,7、具体一个图书馆如何做,针对集团采购的数据库:,选择实力强的,经费分担,针对自己单独采购的数据库:,永久使用权,本地镜像保存:必要的数据和技术参数,必要的授权,针对自建数字资源,网页保存:,Internet Archive,,我国国家图书馆等,数据库:文件格式最好采用PDF 或开放格式,保存数据为主,无论保存什么,最好能参加至少一个保存联盟,同时要注意首先要自我先做好保存前期工作。,11/26/2024,23,四、典型案例介绍,1、荷兰国家图书馆的国家保存,1999年荷兰国家图书馆与出版协会签订了“电子出版物自愿呈缴协议”。,自2002年以后荷兰国家图书馆与ELSEVIER等公司签订了国家保存协议:,市场失效前的限制性保存使用,市场失效后的国家保存使用,11/26/2024,24,四、典型案例介绍,2、澳大利亚网络信息资源保存,PANDORA,主要收集本国出版或记录本国事件的出版物。包括网上免费开放资源,也包括商业型电子出版物。以文本文件和图像文件为主。由于技术上的原因,没有收录数据库。,11/26/2024,25,四、典型案例介绍,3、,LOCKSS集中合作保存项目,采用同一个软件实现相互间备份数据,通过技术可以控制图书馆只能备份曾经保存的数据,出版商也可以利用该系统实现保存自己数据的目的,一旦出版商停止提供服务,图书馆能够利用本地保存的数字资源在原有合同范围内提供服务,保留了出版商的标志,11/26/2024,26,四、典型案例介绍,4、,美国Portico的解决方案(商业型的),作为非营利机构,Portico尝试了一种新的保存模式。,Portico 将自己定位于第三方电子期刊保存实体,需要同时获取电子期刊出版商的保存授权和参与机构(主要是指图书馆)的保存授权。,Portico平时的传递服务权利和约束,Portico在触发事件发生情况下的服务权利与约束,与Portico签约并支付相应费用的图书馆和其他组织机构为参与机构。参与机构享有的权利,一是可以享受“永久使用”的权利和服务;一是可以在触发条件下享用Portico电子出版物存档版本的使用。,11/26/2024,27,四、典型案例介绍,5、因特网归档项目(,Internet Archive,),http:/,是由非图书馆的非营利机构实施保存,在缺乏严密的授权机制下,自行收集和存档全球的公开网页,目前也在积极和各方合作研究授权问题。,11/26/2024,28,http:/,11/26/2024,29,11/26/2024,30,11/26/2024,31,11/26/2024,32,11/26/2024,33,四、典型案例介绍,6、中国科学院国家科学图书馆,数字资源持久保存国际合作试验项目LOCKSS,构建长期保存系统(,由NSTL和NSL联合资助,),保存对象:电子出版物,Nature (60), Springer(1250) ,维普(7953),11/26/2024,34,四、典型案例介绍,7、中国国家图书馆的保存活动,争取国家政策上的支持和公众意识的提高,数字报纸数据库,2119种报纸,1800个报纸网站,80个网站上的PDF文件,网络信息资源保存项目WICP http:/,11/26/2024,35,四、典型案例介绍,8、中国WEB信息博物馆,“中国Web信息博物馆”是在国家 973和985项目支持下,北京大学网络实验室开发建设的中国网页历史信息存储与展示系统。目前已经维护有30亿以中文为主的网页,并以平均每月四千五百万网页的速度扩大规模。,11/26/2024,36,http:/,11/26/2024,37,11/26/2024,38,11/26/2024,39,五、面临的主要问题,1、经济问题,需要巨额投资,需要可持续的投资,需要多少投资不清楚,因此:,国家统筹规划和建设,合作保存,选择性保存,在保存前减小保存负担:如利用开放数据格式,11/26/2024,40,五、面临的主要问题,2、知识产权问题,永久使用权,保存权利,呼吁国家相关法律和政策的制定,授权,责任体系,呼吁国家出台相应政策,要求出版商在放弃保存前,数据移交给图书馆,呼吁建立相应机制,当民间或机构放弃保存责任前,移交数据和保存权利给其他机构,或国家指定机构。,11/26/2024,41,五、面临的主要问题,3、技术问题,选择哪种技术方法,选择哪种技术策略,保存时机的选择,11/26/2024,42,谢谢大家,请指正,2008年6月,11/26/2024,43,
展开阅读全文