资源描述
OIM体系结构介绍,1,1、什么是元数据。,1.元数据的概念 按照传统的定义,元数据(Metadata)是关于数据的数据。可将其按用途的不同分为两类:技术元数据(Technical Metadata)和业务元数据(Business Metadata)。 技术元数据是存储关于数据仓库系统技术细节的数据, 业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。,2,2、元数据的作用,2.元数据的作用 在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:()描述哪些数据在数据仓库中;()定义要进入数据仓库中的数据和从数据仓库中产生的数据;()记录根据业务事件发生而随之进行的数据抽取工作时间安排;()记录并检测系统数据一致性的要求和执行情况;()衡量数据质量。,3,3、元数据相关的工具,3.元数据相关工具大致可分为四类: 1. 数据抽取工具:把业务系统中的数据抽取、转换、集成到数据仓库中,如Ardent的DataStage、CA(原Platinum)的Decision Base和ETI的Extract等。 2. 前端展现工具:包括OLAP分析、报表和商业智能工具等,如MicroStrategy的DSS Agent、Cognos的PowerPlay、Business Objects的BO,以及Brio等。 3. 建模工具:为非技术人员准备的业务建模工具,这些工具可以提供更高层的与特定业务相关的语义。如CA的ERwin、Sysbase的PowerDesigner以及Rational的Rose等。 4. 元数据存储工具:元数据通常存储在专用的数据库中,该数据库就如同一个“黑盒子”,外部无法知道这些工具所用到和产生的元数据是如何存储的。,4,元数据管理的标准化,4. 元数据管理的标准化 没有规矩不成方圆。元数据管理之所以困难,一个很重要的原因就是缺乏统一的标准。在这种情况下,各公司的元数据管理解决方案各不相同。近几年,随着元数据联盟MDC(Meta Data Coalition)的开放信息模型OIM(Open Information Model)和OMG组织的公共仓库模型CWM(Common Warehouse Model)标准的逐渐完善,以及MDC和OMG组织的合并,为数据仓库厂商提供了统一的标准,从而为元数据管理铺平了道路。,5,一、什么是OIM,开放信息模型(Open Information Model,OIM)是一组开放的、符合行业标准的模型,可以在来自多个软件厂商的软件开发和数据仓库工具间共享。 开放信息模型(OIM) 是一组元数据规范,它可以使不同工具和系统间的共享和复用变得更加便利。OIM 由超过200 种的类型和100多种关系组成,这些关系和类型都是用UML(统一建模语言,Unified Modeling Language)描述的,而且组织在易用和易于扩展的主题领域中。这些领域包括: 分析和设计 组件描述和规范 数据库和数据仓库 商业引擎 知识管理,6,二、谁建立了OIM,元数据联盟MDC(Meta Data Coalition) MDC成立于1995年,是一个致力于建立与厂商无关的、不依赖于具体技术的企业元数据管理标准的非赢利技术联盟,该联盟有150多个会员,其中包括微软和IBM等著名软件厂商。1999年7月MDC接受了微软的建议,将OIM作为元数据标准。,7,三、OIM的目的,OIM的目的是通过公共的元数据信息来支持不同工具和系统之间数据的共享和重用。它涉及了信息系统(从设计到发布)的各个阶段,通过对元数据类型的标准描述来达到工具和知识库之间的数据共享。OIM所声明的元数据类型都采用统一建模语言UML(Universal Modeling Language)进行描述,并被组织成易于使用、易于扩展的多个主题范围(Subject Areas)。,8,四、OIM的内容(主题范围),主题范围: 分析与设计(Analysis and Design):主要用于软件分析、设计和建模。该主题范围又进一步划分为:UML包(Package)、UML扩展包、通用元素(Generic Elements)包、公共数据类型(Common Data Types)包和实体关系建模(Entity Relationship Modeling)包等。 对象与组件(Object and Component):涉及面向对象开发技术的方方面面。该主题范围只包含组件描述建模(Component Description Modeling)包。,9,数据库与数据仓库(Database and Warehousing):为数据库模式管理、复用和建立数据仓库提供元数据概念支持。该主题范围进一步划分为:关系数据库模式(Relational Database Schema)包、OLAP模式(OLAP Schema)包、数据转换(Data Transformations)包、面向记录的数据库模式(Record-Oriented Database Schema)包、XML模式(XML Schema)包和报表定义(Report Definitions)包等。,10,业务工程(Business Engineering):为企业运作提供一个蓝图。该主题范围进一步划分为:业务目标(Business Goal)包、组织元素(Organizational Elements)包、业务规则(Business Rules)包、商业流程(Business Processes)包等。 知识管理(Knowledge Management):涉及企业的信息结构。该主题范围进一步划分为:知识描述(Knowledge Descriptions)包和语义定义(Semantic Definitions)包。,11,五、CWM与OIM的主要区别,CWM实际上是专门为数据仓库元数据而制定的一套标准,而OIM并不是针对数据仓库元数据的。 OIM所关注的元数据的范围比CWM要广,CWM只限定于数据仓库领域,而OIM模型包括有:分析与设计模型、对象与组件、数据库与数据仓库、商业工程、知识管理等五个领域。 OIM与CWM在建模语言的选择(都选择UML当做自己的描述语言)、数据库模型的支持、OLAP分析模型的支持、数据转换模型的支持方面都比较一致;但是OIM并不是基于元对象设施(MOF)的,这意味着用OIM所描述的元数据需要通过其它的接口才能访问,而CWM所描述的元数据可以通过CORBA IDL来访问;在数据交换方面,OIM必须通过特定的转换形成XML文件来交换元数据,而CWM可以用XMI来进行交换。,12,六、OIM的未来与发展,2000年9月,考虑到业界对CWM建设的支持,MDC成员投票赞成终止了他们在OIM上的工作,从而使业界最终拥有了被厂商广泛支持的、单一的和开放的元数据集成标准CWM。 今后所有的工具都将遵循统一的CWM标准,CWM也将与OIM相互兼容以保护厂商已有的投资。,13,
展开阅读全文