元数据与信息资源组织大纲课件

上传人:29 文档编号:241733719 上传时间:2024-07-19 格式:PPT 页数:43 大小:1.34MB
返回 下载 相关 举报
元数据与信息资源组织大纲课件_第1页
第1页 / 共43页
元数据与信息资源组织大纲课件_第2页
第2页 / 共43页
元数据与信息资源组织大纲课件_第3页
第3页 / 共43页
点击查看更多>>
资源描述
元数据元数据与信息与信息资源源组织刘炜www.kevenlw.name元数据应用理论与实务研修班 2008.5 杭州元数据与信息资源组织刘炜元数据应用理论与实务研修班 2008元数据应用理论与实务研修班 2008.5 杭州参考资料张晓林元数据研究与应用北京:北京图书馆出版社,2002-05 肖珑,赵亮.中文元数据概论与实例.北京:北京图书馆出版社,2007-04刘嘉著元数据导论北京:华艺出版社,2002-01吴建中等DC元数据上海:上海科学技术文献出版社,2000-10 William Y.Arms著,施伯乐等译数字图书馆概论Digital Libraries(美)北京:电子工业出版社,2001-01国防科技工业数字图书馆元数据加工手册.北京:航空工业出版社,2006-08参考资料张晓林元数据研究与应用北京:北京图书馆出版社,元数据应用理论与实务研修班 2008.5 杭州主旨利用元数据进行信息资源组织的基本概念和分析与设计方法信息资源组织的基本模型、管理模式和主要元数据形式作为数字图书馆内容基础的数字文献的元数据管理方法、流程和工具元数据网络应用(语义万维网、语义网格)的基本介绍本体与元数据的关系及其应用主旨利用元数据进行信息资源组织的基本概念和分析与设计方法元数据应用理论与实务研修班 2008.5 杭州1.元数据与信息资源的组织概述n元数据基本概念;信息资源组织的历史;数字信息资源的组织与管理;数字图书馆与元数据2.信息资源组织模型n图书馆信息资源的描述与组织及其沿革;信息系统生命周期;数字图书馆信息资源的描述与组织;几种数字图书馆信息资源组织模型;关系型数据库与异构信息系统;Z39.50与OAI等3.元数据功能需求n元数据的作用以及元数据如何在信息系统中发挥作用;元数据的类型;元数据的语义、语法及结构;元数据标准与标准体系;元数据应用实例;中外元数据研究内容元数据与信息资源的组织概述内容元数据应用理论与实务研修班 2008.5 杭州4.元数据格式及其应用领域nDC/MARCXML/MODS/METS/EAD/IEEE-LOM5.元数据编码(置标)赵亮n形式化编码语言介绍(XHTML/XML/XMLS/RDF/RDFS/OWL等);元数据编码的作用;编码举例;编码实习6.元数据抽象模型和应用纲要赵亮n元数据框架体系(信息系统的语义结构);元数据方法论;元数据抽象模型;元数据应用纲要欧洲标准;元数据内容管理在信息系统中的实现流程;元数据工具内容(续)元数据格式及其应用领域内容(续)元数据应用理论与实务研修班 2008.5 杭州7.元数据应用实例及问题讨论nOAI元数据集成协议;各国著名/大型应用案例;国内元数据方案及应用案例;上图元数据方案及其名人手稿馆应用;搜索引擎用不用元数据?8.元数据展望n知识本体与元数据;语义万维网中的元数据功能与实现;未来的数字图书馆资源描述/组织模式;数字目录学展望。内容(续)元数据应用实例及问题讨论内容(续)元数据应用理论与实务研修班 2008.5 杭州元数据一般概念定义来源作用分类模型思考:思考:1.1.元数据概念早已有之,为什么现在会非常热门?元数据概念早已有之,为什么现在会非常热门?2.2.固然固然MARCMARC是一种元数据格式,但是它与是一种元数据格式,但是它与“现代现代”元数据究竟又什么大元数据究竟又什么大的区别?的区别?元数据一般概念定义思考:元数据应用理论与实务研修班 2008.5 杭州元数据定义“meta”来自古希腊语,意思是更高层次或更基本的概念关于数据的数据(data about data)关于数据的结构化数据(structured data about data)用于描述数据的内容(what)、覆盖范围(where,when)、质量、管理方式、数据的所有者(who)、数据的提供方式(how)等信息的数据,是数据与数据用户之间的桥梁资源的信息(Information about a resource)编目信息(Cataloguing information)管理、控制信息(Administrative information)是一组独立的关于资源的说明(metadata is a set of independent assertions about a resource)定义和描述其它数据的数据(data that defines and describes other data(ISO/IEC 11179-3:2003(E))Metadata在台湾被译作“元资料”、“诠释资料”、“后设资料”、“文后资料”、“超资料”等多种名称。元数据定义“meta”来自古希腊语,意思是更高层次或更基本的元数据应用理论与实务研修班 2008.5 杭州来源计算机/数据库领域网络信息标注/检索进一步发展:机器对于语义的理解和处理(语义万维网)来源计算机/数据库领域元数据应用理论与实务研修班 2008.5 杭州元数据的作用l元数据的主要功能是定位(location)、寻找或发掘(discovery)、存档(documentation)、评价(evaluation)与选择(selection)等五大功能*;l其他作用:链接与交互关系的体现(linkage and interactive relationship management)、整合XML、RDF与Z39.50不同协议的应用等;l描述、检索、选择、定位、管理、评估与交互等功能*。*来自于欧洲DESIRE(Development of a European Service for Information on Research and Education)计划的元数据分析报告*北大数字图书馆研究所的研究报告元数据的作用元数据的主要功能是定位(location)、寻找元数据应用理论与实务研修班 2008.5 杭州不要迷信元数据任何“元数据”都代替不了数据本身 一个元数据的记录总是一个一个元数据的记录总是一个“信息容器信息容器”的附属品的附属品 不管这个信息容器的内容在结构上被分解为多小,多深不管这个信息容器的内容在结构上被分解为多小,多深 不管有多少个主题特征被放到一条数据上不管有多少个主题特征被放到一条数据上在当前的元数据标准中,有关主题内容的元数据元素总是十分有限这需要Ontology来补充频度、统计以及其它纯抽象数学因子作为元数据有时可能取得非常好的查询效果不要迷信元数据任何“元数据”都代替不了数据本身元数据的分类元数据元数据元数据元数据类类型型型型定定定定义义描述型描述型元数据元数据内容描述内容描述描述资源对象内容或外观信息。描述资源对象内容或外观信息。结构描述结构描述描述资源对象各组件的结构信息。描述资源对象各组件的结构信息。管理型管理型元数据元数据技术技术描述资源对象的技术要求的元数据信息。描述资源对象的技术要求的元数据信息。权限权限描述资源对象的权限管理与合法取用的元数据描述资源对象的权限管理与合法取用的元数据信息。信息。来源来源描述资源对象的产生、发展与环境等方面的元描述资源对象的产生、发展与环境等方面的元数据信息。数据信息。一般管理一般管理用来管理信息资源的元数据信息。用来管理信息资源的元数据信息。根据元数据中的元素所描述、揭示的语义来划分的:元数据的分类元数据类型定义描述型内容描述描述资源对象内容或外元数据应用理论与实务研修班 2008.5 杭州元数据加工与应用技术研讨班 2004 上海元数据分类元数据加工与应用技术研讨班 2004 上海元数据分类描述性元数据的分类描述性元数据的分类描述能力描述能力低高描述性元数据的分类描述能力低高元数据应用理论与实务研修班 2008.5 杭州元数据模型RDF数据模型(及Warwick框架)(赵亮21日下午介绍)OAIS参考模型(王松林21日上午介绍)FRBR功能/生命周期模型DCMI抽象模型(DCMI元数据方案抽象模型)(22日下午介绍)数字图书馆体系结构模型元数据模型RDF数据模型(及Warwick框架)(赵亮21日元数据应用理论与实务研修班 2008.5 杭州元数据模型:三位一体在语义、结构和句法三方面分别达成一致在语义、结构和句法三方面分别达成一致在语义、结构和句法三方面分别达成一致在语义、结构和句法三方面分别达成一致语义语义通过属性元素(部分通过编码通过属性元素(部分通过编码/置标方式)表达置标方式)表达结构结构语义的抽象载体,通过框架语义的抽象载体,通过框架/容器来表达,要求做容器来表达,要求做到人类与机器均可读到人类与机器均可读句法句法/语法语法具体的置标具体的置标/编码方案(如编码方案(如XML/METS/MODS/RDF/XMLS/RDFS/OWL等),传达语义等),传达语义和结构和结构元数据模型:三位一体在语义、结构和句法三方面分别达成一致元数据应用理论与实务研修班 2008.5 杭州FRBR模型Functional Requirements for Bibliographic RecordsFRBR模型Functional Requirements 元数据应用理论与实务研修班 2008.5 杭州元数据生命周期元数据生命周期数字图书馆体系结构模型资源创建者资源创建者数字对象数字对象数据数据句柄句柄仓储仓储RAP(仓储存取协议仓储存取协议)句柄服务器句柄服务器创建包含由句柄系统创建包含在被存取句柄注册于数字图书馆体系结构模型资源创建者数字对象数据句柄仓储RAP(元数据应用理论与实务研修班 2008.5 杭州元数据与数字图书馆元数据决定了数字图书馆的体系结构,主要解决元数据决定了数字图书馆的体系结构,主要解决两个问题:两个问题:定义数字图书馆中数字对象的信息结构定义数字图书馆中数字对象的信息结构定义由数字对象构成的资源库的组织结构定义由数字对象构成的资源库的组织结构数字对象是数字图书馆中存储信息的基本逻辑单数字对象是数字图书馆中存储信息的基本逻辑单位,它进一步决定着的信息组织处理和利用方式、位,它进一步决定着的信息组织处理和利用方式、资源库的组织结构,提供了统一的互操作。资源库的组织结构,提供了统一的互操作。元数据方案是数字图书馆建设的重要组成部分,元数据方案是数字图书馆建设的重要组成部分,体现在数字图书馆开发的各个环节中体现在数字图书馆开发的各个环节中存储存储检索检索发布发布管理管理元数据与数字图书馆元数据决定了数字图书馆的体系结构,主要解决元数据应用理论与实务研修班 2008.5 杭州国外情况概况项目情况标准化情况研究与应用特点值得借鉴之处国外情况概况元数据应用理论与实务研修班 2008.5 杭州元数据标准举例按元数据应用的学科领域,则可以进行如下划分:传统图书期刊,如:MARC等。网络资源,如Dublin Core、IAFA/WHOIS+Templates、LDIF(LDAP Data Interchange Format)、SOIF(Summary Object Interchange Format)、URCs(Uniform Resource Characteristics/Citations)等。政府信息,如:GILS(Government Information Locator Service,政府信息定位服务)、DC-Gov(DC-Government Application Profile,DC政府应用纲要)等。科技文献,如:ibTEX、EELS(The Engineering Electronic Library,工程电子图书馆元数据)、EEVL(The Edinburgh Engineering Virtual Library,爱丁堡虚拟电子图书馆元数据)、RFC1807等28。人文及社会科学资源,如:TEI Header、ICPSR SGML Codebook Initiative等29。教育资源:IEEE LOM(Learn Object Medle,学习对象模型)、GEM(GEM Element List,GEM元数据)、DC-Ed(DC-Education元数据)等。博物馆藏品或特藏,如:CDWA(Categories for the Description of Works of Art,艺术作品描述目录)、CIMI(Computer Interchange of Museum Information)CIMI、VRA Core(Visual Resources Association Core,可视资源核心类目)、REACH元素集等。保存型元数据方案:CEDARS、NLA、NEDLIB地理空间资源,如:FGDC/CSDGM等 手稿档案保存类,如:EAD等网络多媒体及版权管理:INDECS元数据标准举例按元数据应用的学科领域,则可以进行如下划分:简介1.DC(都柏林核心元数据)2.CDWA(艺术作品描述目录)3.VAR Core(可视资源委员会核心元数据)4.CDF(频道定义格式)5.ROADS元数据(主题信息服务的资源组织和发现)6.IEEE LOM(IEEE学习对象元数据)7.BibTex(科技文献书目资源格式)8.GEM(教育资源网关)9.CIMI(博物馆信息计算机交换标准框架)10.REACH元数据格式11.EAD(编码文档描述)12.ONIX(在线信息交换)13.EELS(工程电子化图书馆)14.EEVL(爱丁堡工程虚拟图书馆)15.FGDC(联邦地理数据委员会)16.GILS(政府信息定位服务)17.MARC(机读目录格式)18.MOA2(美国的创建II)19.MCF(元内容框架)20.PICA+(荷兰图书馆自动化中心)21.PICS(网络内容选择平台)22.TEI Header(文本编码先导计划)23.SOIF(概略对象交换格式)24.IAFA/WHIOS+Templates(因特网匿名FTP文件库版式)25.ICPSR SGML Codebook(政治和社会研究方面的校际联盟)26.LDAP DIF(轻便型目录获取协议)27.RFC 1807(书目记录格式)28.URCs(统一资源特征)29.SGML(通用标准标记语言)30.Warwick Framework(Warwick框架)31.Web Collections(网站集合)32.XML(可扩展标记语言)33.RDF(资源描述框架)简介1.DC(都柏林核心元数据)18.MOA2(美国的创元数据应用理论与实务研修班 2008.5 杭州IFLA推荐方案应包含的核心元素 主题 Subject 日期 Date 使用条件 Conditions of use 出版者 Publisher 资源名 Name assigned to the resource 语种/表达方式 Language/mode of expression 资源标识符 Resource identifier 资源类型 Resource type(i.e.,what the resource is,rather than what it is about)作者/创建者 Author/creator 版本 Version见:Guidance on the Structure,Content,and Application of Metadata Records for Digital Resources and Collections:Report of the IFLA Cataloguing Section Working Group on the Use of Metadata Schemas(2003 Oct 27)IFLA推荐方案应包含的核心元素见:Guidance on 元数据应用理论与实务研修班 2008.5 杭州国内情况概况历史项目与研究应用情况趋势与展望值得关注的课题图书馆员的角色国内情况概况元数据应用理论与实务研修班 2008.5 杭州国内元数据研究与应用概况国内的研究与应用:数字化项目的需要,例如国家图书馆、中山图书馆等;数字图书馆开发与建设的需要,如有关数字图书馆项目、国家863项目等;国外元数据跟踪研究和应用的成果近来新呈现的特点注重体系化的研究,通过对系统架构的研究,建立信息系统模型(生命周期模型、数据流模型、应用相关模型等)。注重具体应用环境和实现的研究。注重标准体系的建立(一整套标准规范和可操作的文档)。国内元数据研究与应用概况国内的研究与应用:元数据应用理论与实务研修班 2008.5 杭州历史1997年“试验型数字图书馆”项目OCLC的引介、推动国图及中山图书馆元数据方案北大元数据方法论上海图书馆“第一届国际元数据研讨会”上图的元数据跟踪及应用历史1997年“试验型数字图书馆”项目元数据应用理论与实务研修班 2008.5 杭州国内元数据项目与应用研究情况国家图书馆国家图书馆中文元数据方案中文元数据方案北京大学图书馆(拓片和敦煌古卷)北京大学图书馆(拓片和敦煌古卷)清华大学(建筑)清华大学(建筑)中科院文献情报中心中科院文献情报中心我国数字图书馆标准与规范建设我国数字图书馆标准与规范建设项目项目(CDLS)(CDLS)中山图书馆中山图书馆“数字式中文全文文献通用格式数字式中文全文文献通用格式”中国可持续发展信息共享示范系统中国可持续发展信息共享示范系统*教育信息源数据标准教育信息源数据标准*上海图书馆应用研究情况上海图书馆应用研究情况*参见:http:/ 2008.5 杭州国家图书馆国家图书馆(NLCN)于1991年3月成立了文献数字化中心,主要从事国家图书馆内部文献的加工生产,2000年10月划入中国数字图书馆有限责任公司范围,承担中国数字图书馆工程中的资源建设任务,现已经为中国数字图书馆提供中文图书20万册,7000万页、缩微胶片200万拍、金石拓片6000张等数字资源。另有:甲骨影像及拓片资源库;西夏文献数字资源库;中文拓片资源库;国际敦煌项目(敦煌及其他遗址出的十万余件写卷,可以在互联网上免费获得高清晰度的数码图像,与之相联的有书目,地图,照片,遗址图等其他有关历史,现状等信息,使学者,学生,平常老百姓能由此深入了解公元一千年丝绸之路上的社会生活状况)。2002年12月,“国家图书馆二期工程暨国家数字图书馆工程”项目立项申请书通过国务院批准,程总投资123,500万元;基于OAIS参考模型的保存性元数据方案“中文元数据方案”国家图书馆国家图书馆(NLCN)于1991年3月成立了文献数中文元数据方案1名称Title2主题Subject3版本Edition4内容摘要Abstract5内容类型Content Type6语种Language7内容覆盖范围Coverage8内容创建者Creator9其它责任者Contributor10内容创建日期Date of Creation11出版Publisher12版权所有者Copyright Holder13资源标识符Identifier14关联资源Related Objects15数字资源制作者Digital Publisher Name16数字资源制日期Digital Publisher Date17数字资源制作地Digital Publisher Place18权限声明Rights Warning19公开对象Actors20操作许可Actions21原始技术环境Original Technical Environments22加工处理历史Ingest Process History23维护历史Administration History24认证指示符Authentication Indicator25基本抽象格式描述UAF-Description中文元数据方案1名称Title2主题Subject3版本Ed元数据应用理论与实务研修班 2008.5 杭州中国高校系统:以北京大学为代表基于专门数字对象的元数据标准古籍元数据标准(第4版)拓片元数据标准(第6版)舆图元数据标准(第1版)学位论文元数据标准(第2版)人物元数据标准(第1版)电子图书元数据标准(教学参考书)(第1版)网络资源元数据标准(第1版)其它中国高校系统:以北京大学为代表基于专门数字对象的元数据标准元数据应用理论与实务研修班 2008.5 杭州元数据与信息资源组织大纲课件元数据应用理论与实务研修班 2008.5 杭州中国科学院文献情报中心国家科学数字图书馆预研项目国家科学数字图书馆预研项目后续项目:“科技基础性工作专项资金重科技基础性工作专项资金重点项目点项目我国数字图书馆标准规范建设我国数字图书馆标准规范建设”中国科学院文献情报中心国家科学数字图书馆预研项目元数据应用理论与实务研修班 2008.5 杭州完整的框架体系Works/ObjectsCollections of Works/ObjectsDatabases of discriptionsDigital ObjectsCollections ofDigital ObjectsIdentification/NamingMetadata DescriptionsRetrieval MechanismsLocation ResolutionStorage and ArchivingFormattingOrganizing Mechanisms格式化格式化识别与命名识别与命名元数据描述元数据描述组织机制组织机制检索机制检索机制地址解析地址解析长期保存长期保存注:本页内容来自张晓林教授有关元数据的演示稿完整的框架体系Works/Collections of Da元数据应用理论与实务研修班 2008.5 杭州基于生命周期的元数据开发应用框架基于生命周期的元数据开发应用框架互操作机制检索机制长期保存应用领域应用目标内容结构句法结构语义结构编码语言制作机制组织与存储基于生命周期的元数据开发应用框架互操作机制检索机制长期保存应元数据应用理论与实务研修班 2008.5 杭州中国可持续发展信息共享示范系统中国可持续发展信息共享示范系统中国可持续发展信息共享示范系统元数据应用理论与实务研修班 2008.5 杭州基础教育教学资源元数据规范编入教育信息化技术标准CELTS-42;与IEEE LOM和IMS相一致;与DC联系密切(以DC为核心)体系完整,元数据方面已包括三个规范:CELTS-3.1(CD1.6)学习对象元数据2002-09-05CELTS-3.3(CD1.6)学习对象元数据实践指南2003-01-07CELTS-3.4(WD1.0)学习对象元数据测试规范2003-01-07建立了运作机制和认证体系参见示例基础教育教学资源元数据规范编入教育信息化技术标准CELT元数据应用理论与实务研修班 2008.5 杭州上海图书馆上海图书馆于1997年启动了古籍数字化项目(数字化数量共计3223种一、二级藏品130万页)。,1998年开始进行历史文献和特色馆藏的抢救性整理和数字化工作。1999年是上海图书馆进行大规模数字化的一年,这一年一共进行了7个数字化项目。上海数字图书馆是一个综合了七个资源库的网上图书馆,拥有数据近200GB,主要是扫描的影像数据。系统采用IBM Digital Library version 2.4作为主要开发工具应用平台。元数据方案采用以DCMES作为核心集、多种元数据方案并存的“元数据应用纲要”形式,以基于XML的RDF为基础的编码方式封装在一起,保证了原始素材内容管理中元数据的完整性与互操作能力。目前正在修改完善一整套元数据规范、方案和方法。上图德元数据规范和方法正在应用于上海图书馆正在建设的古籍数字图书馆、拓片资源的数字化、家谱数字图书馆、名人手稿数字图书馆等。上海图书馆上海图书馆于1997年启动了古籍数字化项目(数字化元数据应用理论与实务研修班 2008.5 杭州上图元数据方案设计流程建立模型建立模型详细列出相关实体,标明其相互之间的关系。资源分析资源分析分析应用领域资源特点和文献利用方式属性提取属性提取内容专家从资源利用的角度提出属性要求文献调研文献调研元数据专家从现有标准和相关项目中获得参考元素精炼元素精炼分析应用领域资源特点和文献利用方式限定规则限定规则规定属性限定原则(子字段,修饰词和编码)规范控制规范控制考察需要进行规范控制的属性,制定办法著录规则著录规则制定详细的著录规则,指导数据加工置标方案置标方案通常选择XML/RDF或单纯XML置标检索要求检索要求提出元素对应属性字段的具体检索要求系统需求系统需求元数据需求作为应用系统需求的一个部分验收要求验收要求元数据部分在系统中所要达到的功能未来扩展未来扩展预留未来发展的可能性,即可扩展性图1:名人手稿馆元数据方案设计流程图示上图元数据方案设计流程建立模型详细列出相关实体,标明其相互之元数据应用理论与实务研修班 2008.5 杭州趋势展望趋势:作为计算机语义处理(语义Web)的基础;脱离图书情报的元数据;图书情报在哪些方面可以有所贡献国内:学习与借鉴;现有问题的解决;作为数字图书馆解决方案的构建趋势展望趋势:元数据应用理论与实务研修班 2008.5 杭州值得关注的课题方法论模型(如前所述)几个重点和趋势:元数据注册体系应用方案(AP)的概念和形式化保存性元数据权限管理元数据值得关注的课题方法论元数据应用理论与实务研修班 2008.5 杭州图书馆员的角色领域内容专家/信息组织专家/计算机专家三位一体;技术与应用的桥梁;完善知识体系结构构建元数据方案和知识本体图书馆员的角色领域内容专家/信息组织专家/计算机专家三位一体元数据应用理论与实务研修班 2008.5 杭州参考资料Introduction to Metadata:Pathways to Digital Information:http:/www.getty.edu/research/conducting_research/standards/intrometadata/IFLA Metadata Resources:http:/www.ifla.org/II/metadata.htm W3C Semantic Web:http:/w3.org/2001/sw/DCMI:http:/dublincore.org/参考资料Introduction to Metadata:
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!