元数据治理与数据质量平台

上传人:suij****uang 文档编号:163829819 上传时间:2022-10-23 格式:DOCX 页数:22 大小:148.36KB
返回 下载 相关 举报
元数据治理与数据质量平台_第1页
第1页 / 共22页
元数据治理与数据质量平台_第2页
第2页 / 共22页
元数据治理与数据质量平台_第3页
第3页 / 共22页
点击查看更多>>
资源描述
1.1.1 数据质量治理架构数据质量问题一直是困扰数据仓库发挥踊跃作用的重要因素,在数据仓库建设之初就应当从战略角度对数据质量体系进行计划。1.1.1.1 数据质量基础概念1.1.1.1.1 完整性数据的完整性:为实现业务目的而设计组织的数据模型是不是完全,是不是 覆盖方方面面。例如:对一个业务,一个客户,一个产品,一个营销活动,一个 客户的性质等进行缺失考察。例如,客户名称有姓无名等,客户档案是不是齐全 是不是客户所有业务都包括在内等。完整性破缺要紧发生在实体或对象的属性上和整个数据缺失两种情形。完整性列表:数据完整性,例如属性数据是否残缺,数值类型数据是否有空数据业务完整性,例如是否有些业务没有包含在内,是否涵盖所有生产系统和必要的外 部数据(例如竞争数据,保监会数据),是否覆盖所有客户(例如是否覆盖全部客户) 设计完备性,设计是否完善模型的完备性数据字典完备性 映射关系完备性业务规则是否完备元数据完备性加工层次完整性,加工过程中重要的中间数据是否保存,例如,有月统计数据, 考察日数据是否存在?粒度完整性,重要经营指标各个粒度数据应该完善指数据包括了一个有效的数据格式或值1.1.1.1.3 致性数据的一致性是一个长期的困难。成立数据仓库的核心目的之一也是争取解决 那个问题。一致性概念为各个系统数据的统一,概念为数据仓库系统内数据概念 的统一。一致性还表此刻概念和口径的一致性。数据库一致性,设计上是否有多种存储并存,各类统计口径是否统一 冗余和星型模型以及非第三范式一致性保证措施和源数据一致性1.1.1.1.4 唯一性唯一性概念为系统数据概念的唯一性。由于数据仓库技术不必然受第三范式 约束,可能具有相当的冗余,但数据冗余不能违背概念的唯一性原那么。关于哪 些既存在于关系数据库又在多维数据库中表现的数据和指标要专门注意,因为极 容易由于生成的时刻差造成不一致。唯一性至少应当向系统的用户说明最终的数 据评判标准,数据的冗余和评判应当是元数据治理的重要内容。1.1.1.1.5正确性数据正确是决策的关键,数据不正确,数据仓库项目就等于失败。但数据的正确性难以通过 自身检查。应该对重要数据和重要统计设立正确性检查。要紧方式是:数据自身统计查验纵向对照查验数据间按逻辑交叉查验横向对照校验要紧检查的内容:ETL过程正确性 加工过程正确性 数据整合正确性 模型正确性 展现正确性 查询正确性 核对过程是否充分1.1.1.1.6 准确性数据的正确性基础上才成心义讨论准确性。准确性包括精度和近似规那么。精度:系统概念的数据必需知足的精准性要求。例如,客户生日,能够精准 到年,或月,或日;全局收入统计或许到万元即可,或许到角分。1.1.1.1.7 可用性数据的可用性不是一个简单数据质量问题,而是系统质量问题,所有质量因 素都可能阻碍到可用性。数据的可用性要紧体此刻利用的效率上1.1.1.1.8 时效性1.1.1.1.9 清楚性数据的清楚性考验系统元数据的精度。元数据必需清楚概念每一个数据的前 因后果。必需没有歧义。1.1.1.1.10 充沛性数据的充沛性概念在保证数据正确性和准确性基础上是不是能对要紧业务专 题提供足够的数据进行足够精度的分析需求。例如,进行时刻序列分析通常需要 至少 36 个持续时刻单位的数据,是不是能够提供那个时刻序列。数据积累是否足够广泛,例如设计上虽然包含了足够宽广的业务领域,但每项业务的数据是否真的收集到了足够多,数据积累是否足够时间,充足性的特殊情况,是否收集了足够时间长度的 数据元数据和字典数据的充足性,描述性是否足够1112数据质量保证框架过程架掏验证领导从战略层面的宣视是 解扶叛据质量可题阿重妾 保远重视业务和系统运咋的辻 程的肯理増进部1、项目组Z间在 数据需求、数据规划、数 据交换井享和元数据方即 的沟通配合増君对运作过程名业嗖 和拒术环节的蠟据菅理。 芥苣理和有效刊闭元数塢以绩效考核来促讲频据 菅理的执行系统瀬构和技久的实现 提供垂夏的基础环境保 障建宜数据管理纟且织架 构,有敷管理企业数 据,并进行数据需求管 理和实現建立類据验证和稽核机 制,及时发现歎据有在 的底量问趣1.1.1.2.1 战略战略-从企业战略方向主动的考虑数据质量状况。战略的意义:提供了战略上的、可操作的数据质量保障方向识别企业数据的关键因素指明数据质量的范围战略的范围:策略:包括以下方面的内容,任务概念与业务的关系切入点约束条件可行性关键方式:包括以下方面,方向使标准化保障策略被顺利执行的手腕变更治理:为了适应企业变更而采取相应的数据质量治理变更机制1.1.1.2.2 组织组织-为了达到企业的数据质量目标,从企业行政治理和职能设置上进行考 虑。组织指的是如何组织相应的人员、设立相应的数据质量机构对数据质量进行治 理,包括以下方面:组织机构计划人员及其职责设计制定考核制度1.1.1.2.3 治理治理-关于企业中元数据和业务规那么的保护上予以治理治理包括以下范围:概念完整的元数据集概念无二义性、易于明白得的业务规那么成立一个健壮的、高可扩展的数据模型1.1.1.2.4 架构架构-从整体上(数据、应用程序、技术架构)对改良数据质量予以考虑架构的成立应从以下方面进行考虑:数据架构应用程序架构基础架构1.1.1.2.5 进程进程-进程的改良进程关注的是数据质量治理的进程,应从以下方面进行考虑:数据质量治理的实施进程进程操纵点和操纵线路(错误或异样的)补救方法1.1.1.2.6 验证验证-概念数据质量的评测标准并按所制定的标准对其进行验证,只有确立相应标准,数据质量的操纵才具有现实意义。验证包括以下内容:111261数据的重要程度,能够从以下方面进行判定:对日常操作的阻碍对一样业务的阻碍对财务上的阻碍对客户效劳的阻碍对决策的阻碍111262数据质量维度数据质量问题域汇总序号数据质量问题细目1完备性是否涵盖所有生产系统和必要的外部数据是否涵盖所有业务是否覆盖所有客户是否覆盖所有产品系统设计完备性数据字典完备性 映射关系完备性 业务规则是否完备 元数据完备性完整性数据完整性 业务完整性 数据模型完整性 加工层次完整性 粒度完整性充足性数据积累是否足够广泛数据积累是否足够时间元数据和字典数据的充足性对问题域的解决方案是否有足够的数据作为分析基础正确性ETL过程正确性 加工过程正确性 数据整合正确性 模型正确性 展现正确性 查询正确性 核对过程是否充分5准确性数据精度是否足够近似模型是什么6一致性数据库一致性冗余和星型模型以及非第三范式一致性保证措施和源数据一致性7逻辑性逻辑严密性数据逻辑关系表内表间关系8职业道德和法律结果不可修改特性9数据质量保证体系10分析质量报表质量查询质量接口数据质量非生产数据质量主键,外键完整性是否有严密的逻辑约束数据出错处理和防范预案例如市场竞争数据1.1.1.2.7 沟通沟通-关注利用数据信息的相关责任者之间的沟通,要充分关注数据质质量组织机构中的员工、不同的集体和单位之间的彼此沟通。1.1.1.2.8 执行执行-指组织中的每一个成员都应改遵守数据质量治理所制定的要求、决1.1.1.3数据质量持续改良进程发起定貫项目范聞mt定义焦点区域定畑目里程腺制定工Will盍定义定XffcS?康最标 推Jl了昭当前数邸WK讽刖已知的毀溜评估J井祈导致错踽 很本原因相应風睦讦怙并制定相应僦措施冋題发起-依照制定的标准获取相应的项目资源、支撑工具和制定工作打算。 概念-概念详细的进程、数据、组织的划分和质量元素、标准及测算方式。 评估-对现存数据及业务环境进行评估,以便识别项目对数据、进程、系统 和组织架构所造成的阻碍。清洗/改良/评测-改良现有数据的数据质量,并采取方法修改业务环境,幸 免类似错误继续发生。强调循环改良112元数据治理架构国有资产治理支持系统数据仓库数据源普遍,数据消费者群体跨度也很广,各 类指标、维度、统计口径等元数据有关的问题必然是项目面临的庞大挑战之一。1.1.2.1元数据大体概念元数据(MetaData)是关于数据的数据。当人们描述现实世界的现象时,就 会产生抽象信息,这些抽象信息即能够看做是元数据;元数据要紧用来描述数据的 上下文信息。通俗的来讲,假假设图书馆的每本书中的内容是数据的话,那么找 到每本书的索引那么是元数据。元数据之因此有其它方式无法比拟的优势,就在于它能够帮忙人们更好的明 白得数据,发觉和描述数据的前因后果,专门是那些即将要从 OLTP 系统上升到 DW/BI体系建设的企业,元数据能够帮他们形成清楚直观的数据流图。元数据的概念尽管在国内方才被人们熟悉起来,但在国外他已经历了较长的 进展历史。从 上世纪60年代,人们熟悉到元数据的需要,到数据字典、CASE工 具的应用,和上世纪90年代数据仓库体系中元数据存储库的显现,直到现时期国 外企业以元数据为驱动的IT系统建设的方式论流行。企业关于元数据的价值愈 来愈有深刻的体会。元数据按其描述对象的不同能够分三大类:技术元数据、业务元数据和治理元 数据。技 术元数据要紧用是用来描述数据实体和数据处置进程中的技术细节和处 置规那么。比如咱们所熟知的表结构、ETL映射关系等,这种元数据主若是系统建 设的技术人员利用。业务元数据主若是对IT系统的数据实体和数据处置的业务 化描述,包括业务规那么、业务术语、统计口径、信息分类等。咱们常常提及的 KPI概念和报表统计规那么等就属于此类元数据。业务元数据要紧的利用者是业 务人员和公司决策人员。治理类元数据主若是对项目治理、IT运维、IT资源设备 等相关信息的描 述。这种元数据主若是企业IT部门的治理人员利用。利用此类 元数据能够进行工作分派、网络资源等方面的治理。元数据的治理方式有三种:集中式、散布式和混合式。集中式的治理方式是把 原有系统中的元数据抽掏出来,用一个独立的系统来集中治理。此类治理方式优 势是:可高效存取信息、独立于被集成的系统和具有存储附加元数据的能力;缺点 是:由于额外的执行和保护降低了 ROI和实时性。散布式治理方式是不具有独立的元数据存储库,系统实时的连接到原有的系 统。这种方式的优势是:适时性比较好和能保证元数据的质量;缺点是:过度依托于 集成系统和不能存储附加元数据。混合式元数据治理既有独立的元数据存储库又可实时的连接到原有的系统。 混合式治理方 式克服了集中式和散布式治理的各自缺点,同时集成了前两种治理 方式的优势,既能适时的捕捉和反映原有系统元数据的情形,又能让用户扩展和 概念附加的元数 据。元数据治理目前遵循的标准为CWM (Common Warehouse Model)。该标准是由 OMG组织制定的,此标准目的是能在不同的系统当中能够自由、便利的互换元数据。 CWM 核心的技术有三个:UML (United Modeling Language)、M0F(Metadata Object Facility)和 XMI (XML Metadata Interchange)。UML 要紧用来概念元模型;M0F 用来提供操作元数据接口;XMI用来概念互换元数据的机制。1.1.2.2元数据治理的五种状态第一级:随机状态(Ad-hoc)行为特点 在这一级上,对元数据的治理是随机的。元数据由某个人或某一组 人员在局部产生或获取,并在局部利用。在大多数时刻里,元数据是隐匿在信息 中,比如存储于诸 如Word、Excel等形式的办公函档,这些文档利用的术语仅局 部的用户能明白其确切含义。人们通过与“责任人”直接通信或通过信息会话来 获取这些知 识。在局部环境工作数月或数年后,人们使这些元数据和对它的明白 得内在化,使对这种信息有适应性的明白得。在这一时期,元数据通过组织机构缓慢的传播或全然不传播,这取决于局部 小组与其他小组间的通信量的大小,这些元数据可能永久“待”在该局部小组或 某个人那儿。若是如此的小组或个人调离,那么这种元数据信息可能永久丢失。人 元数据知识保留在人的大脑中。在这种环境中,明白(或不明白)与谁交 谈关于明白得元数据成为一件十分重要的事。处置 元数据要通过与“责任人”的交谈才能共享。新来者需要通过他们的日 常工作来学习元数据。外部人员难以明白得元数据,他们必需与“责任人”交谈 才能取得他们想要的东西。因为元数据在局部产生或抓取并在局部利用,因此通 常也只能在局部修改,这种修改通常也可不能通知公司里其他的组织。技术 能够用各类不同的工具来生成元数据。绝大部份是面向个人电脑的应用 软件。例如,ERWin可用于数据库建模,Rational用于为对象建模、Excel用于生 成商品列表等。这些工具都没有设计成能够互换信息,因此,只能在本地的文件 系统中保留所生成的元数据。第二级:可发觉行为特点在元数据治理的这一级上,能够发此刻不同企业之间的元数据。像 第一级的情形一样,元数据仍然在局部产生和抓取,但是,它处于可发觉状态, 如此的元数据在企业一级显露,使得每一个对它有爱好的人都能随时了解“什么 已经存在”。元数据仍然能够在局部级上保护,然后更新中央知识库,但它们仍 然利用不同的命名法。结果,相同的名字被用于表示意义不同的情形,而同一件 情形那么利用了几个不同的名字。尽管如此,相较之下,从不同来源来的数据和数据的含义已经具有了更多的 透明度。关于商业用户,若是他们需要,现存的技术可为他们提供有关数据的来 源和如何对数据进行计算的信息。人 人们开始感知到共享元数据信息的重要性。业务分析员、数据拥有者和应 用开发者此刻自觉地将元数据信息加载到中央知识库中。处置 元数据知识经由中央数据库进行共享。凭借对中央知识库地明白得,人 们能够发此刻其他应用系统中的数据。但是,由于利用术语的不同,人们相互之 间需要交流,以便弄清某些元数据的含义。而且,由于元数据的更新不受任何方 式的操纵,使得这种更新没有通告或贴切的分析。技术 有一些元数据治理工具可用于共享来自数据源的元数据,并能把来自不 同建模工具的逻辑元数据导入到元数据知识库中AG Rochade、Unicon、MetaMatrix 是该类产品的一些例子。但是,除以商业含义来概念数据表格的栏目名之外,这 些工具没有一个能专门好地 抓取元数据。第三级:治理操纵行为特点 这一级对元数据的修改良行集中治理。局部业务单元或开发小组如 不通知其他的元数据保管者和用户,就再也不能依照自己的方式对元数据进行修 改。在一个地址发起的元数据的修改将传播给其他地址。有各类工具和方式可用 于不同业务单元之间互换元数据。为了整合不同数据源中的数据,仍然必需用手 工进行数据的映射,以解 决不同数据源的数据整合。可是,这种映射在一个中央 知识库上进行保护和治理。人数据拥有者、应用开发人员、用户和其他的数据保留者此刻比以往任何时 候更清楚元数据治理的重要性。人们遵循有关元数据治理的“监督”处置操作规 程。在对元数据进行修改前,他们就分析这种修改将会产生的阻碍。他们熟悉到 元数据的共享将使组织的运作更有效,并使他们的生活更轻松。处置成立了监督体系结构(谁是数据和应用的拥有者),监督资产(数据仓库、 数据集市、命名标准)和流程(何时开始更新、如何更新)。技术有几个工具常常被用于元数据的监督处置。SchemaLogic是一种新兴的 工具,通常被用于帮忙监督处置发觉业务的辞汇及其分类。还有一些软件提供商 正在彼此竞争,以填补这一空间,但尚未一家能提供商用的产品。第四级:优化行为特点 在对元数据实施集中存储并通过监督体制对元数据进行治理后,企 业会发觉,通过标准化和整合能够实施成心义的优化。为了优化各业务单元之间 的各类冲突和各个副本,人们开发了一个企业数据模型和辞汇表。人们能够将这 些标准模型和辞汇表用于各类新的应用。机会成熟时,能够把各类老的应用迁移 到这些模型上。人 在这一级,人们坚持不懈地探讨优化的途径。人们协同工作,通过在数据 的入口点确认数据的有效性来提高数据的质量。通过确信各业务实体的权威数据 源,使数据的映射达到最小化。数据开始从一个业务单元滑腻地流到另一个业务 单元,而不用担忧昂贵的数据集成本钱。处置 第一,生成企业数据模型,并在中央知识库进行保护。第二,对数据模 型中概念的每一个实体确信权威数据源或企业应用的主参照数据,然后将业务的 上下文信息和含义与这些数据源进行关联。在整个组织中对业务的辞汇表进行标 准化。鼓舞应用开发小组利用这些标准化的术语,来生成、传播和表示信息。技术目前,仅有少数几个能帮忙企业实施优化的工具。而且,每一个工具只 能完成其中一到两个任务,尚未哪个工具能做企业优化所需的所有情形。第五级:自动化行为特点在这一级,元数据治理是自动进行的。当在逻辑层次发生元数据更 新时,它们将被传播到物理层次。反之,当在物理层次发生更新时,逻辑层次将 被更新,以反映这种更新。在元数据中的任何转变也将触发业务工作流,以处置 其他各个业务系统所需的相对应的任何修改。由于各个应用系统遵循相同的辞汇 表,它们之间的关系可以通过知识本体进行推断,因此,各应用系统之间数据格 式的映射自动产生。人 人们把元数据治理作为常规业务的组成部份。就像电信网对业务的支持一 样,元数据成为组织运作中一种关键的、普遍存在的、无形的资产。元数据治理 变成业务处 理的一个要紧组成部份,而且,整个业务运作都要依托于它。事实上, 若是元数据治理实施得专门好,人们能够无需关切它在何处。在自动化级,元数 据治理成为一种使能器,而不被视为一种障碍。处置 在这一级,元数据治理的处置较为理想。绝大多数处置是自动完成的。人们从手工和程序处置进程中解放出来。他们在元数据判定上能够工作得更有效。 当业务转变时,由知识工人对企业数据模型、辞汇表和知识本体进行保护。如此 一种改变当即会在各个应用中反映出来。例如,假设一个新产品被引进,把它加 到企业辞汇表和知识本体中,这一情形将自动地被传播给金融系统、制造业系统 和营销系统。使得每一个应用系统无需花费昂贵的代价,去完成相应的修改。技术 各个应用必需利用企业数据模型、辞汇表和知识本体来获取、传播和表 示数据。人们开发了各类代理,将数据从一种格式翻译成另一种格式。为了实现 这些功能,当前正在展开知识库表示和知识集成方面的许多研究。1.1.2.3元数据治理工具大体功能元数据治理典型的应用有:ETL映射分析、血统分析/阻碍分析和不同分析等。 这些 应用关于整个企业、技术人员、业务人员和 IT 治理人员都的挥着相当重要 的作用。关于整个企业而言,元数据治理能够协助企业进行数据资产治理;帮忙解 决数据 孤岛的现象,形成统一企业信息地图;实现集中阅读散布在企业内部的所 有电子文档;同时协助企业成立企业级视图的指标库。随着企业信息化建设的不断深切和积存,元数据治理平台能够发挥企业知识 传承的平台。通过元数据的 “ETL 映射分析 ”功能,从企业级视图去查看“Transformer那个转换的具体细节。帮忙技术人员更好的明白得数据内部的前 因后果。关于那些已经建设有 BI/DW 系统的企业而言,企业内部份散着数十种系统的 情形是很 普遍的现象。这些企业的业务人员和决策层所关注的一些统计报表和指 标,往往是通过许多业务系统和假设干数据处置环节而形成的。当最结尾的数据 发生异样时,在 没有元数据治理系统的情形下,需要许多单位和部门(包括软件 集成商)的人一起参与,利用手工的方式去逐级查找数据犯错的缘故。这种方式 不仅无益于问题的及 时发觉,而且一旦显现问题,很难短时刻内定位问题,乃至 全然不可能定位问题的所在。而利用元数据治理系统的血统分析等功能,能够很容易的定位问题,再配合 监控规那么的设置,使问题发觉的及时性大大提高。利用元数据治理系统,企业能够成立数据元(标准)的统一视图。通过统一 数据口径、 完善指标体系、成立统一数据视图,可确保数据的完整性、准确性、 一致性,从而有效的在各个业务系统内进行数据的转换和整理工作。目前,许多 企业常常会面临 同一个指标在不同部门或不同系统中概念不一致的情形,以至于 最终的统计数据显现误差,为决策者提供了错误的决策依据。如某企业某月 A 省分公司和 B 省分公司都给总公司上报了“产品销售量”的 指标,A省 分公司的产品销售量为500万件,B省分公司的产品销售量为300万 件。按常识判定 A 省分公司的销售量应该远远小于 B 省分公司的销售量,但报表 的数据却与 常识相差甚远,究竟是什么缘故造成这种与常识的不一致性呢?在没 有元数据治理系统时,咱们很难发觉其中的缘故,但有了元数据治理系统的指标 不同分析等功 能,通过元数据的不同分析很容易说明这些现象。如图 5 所示:之 因此显现统计的异样是由于A、B两省分公司对同一指标“产品销售量”的概念不 一致而造成的。另外,元数据治理系统可在统一数据视图上进行全行业内的指标一致性分析, 可对关键 业务的监控规那么进行设置和治理。随着数据量的不断积存,数据质量 问题的日趋突出,元数据治理平台可承担起全企业的数据质量治理的基础平台。 同时,利用需求 类元数据和流程类元数据,来协助 IT 治理人员进行项目和流程 的治理,从而减少企业人员流动关于项目造成的阻碍。在那个“惟一不变的确实是转变本身”的时期,在那个数据和知识爆炸的时 期,如何有效的进行企业IT系统建设的扬弃和传承?如何高效的利用企业数据资 产?这些问题犹如“格尔迪奥斯绳结”摆在咱们的眼前,而元数据正是解开那个 “结”的关键 所在。关于企业 IT 系统建设而言,咱们仍然信奉“元数据不是全 能的,但没有元数据是万万不能的”这句经典诠释。专门是关于那些组织结构复 杂、IT系统众多的企业,那个组织和支撑它的IT系统要想有效运转起来,必然 少不了元数据这种“润滑剂”。1.1.2.4目前主流的元数据治理工具总起来看,目前国内的元数据治理工具可能有三类。一是像 IBM、CA 等公司 都提供的 专门工具,比如 IBM 收购 Ascential 取得的 Metastage , CA 的 DecisionBase都是如此;二是像DAG的Metacenter,它不依托于某项BI产品, 是一种第三方的元数据治理工具 ,三是国内部门开发商在某些具体的项目中也在 开发自己的元数据治理工具。各类元数据治理工具有很多。理论上讲,用户能够用其中一种治理其他系统 中的数据,比如选择数据仓库系统厂商提供的元数据治理工具来治理其他层面的 元数据。但实际应用中的治理成效如何呢?一样情形是,这些专门工具治理自己 本系统的元数据尚可,一旦跨系统治理,成效就不尽如人意了。从国内的实际应用来看,DAG的Metacenter这一工具利用最多,目前所看到 的在电信、金融领域建设的元数据治理项目大体上都是应用了这一产品。至于像 CA等公司的工具,在国内大体上没有成功案例。1125国有资产治理支持系统元数据治理架构1.1.2.5.1 现状尽管元数据治理已经好久被业界所关注,可是大多数企业的元数据治理事实 上仍是处在一个混乱的状态中,元数据没有被有效的纪录下来,大量的元数据嵌入 在软件应用编码中,乃至更多的存在于员工的“部落知识”中,某个员工的离职 都可能对企业造成极为糟糕的阻碍。正如咱们在元数据治理的五种状态的第一级 状态所描述:人 元数据知识保留在人的大脑中。在这种环境中,明白(或不明白)与 谁交谈关于明白得元数据成为一件十分重要的事。处置元数据要通过与“责任人”的交谈才能共享。新来者需要通过他们 的日常工作来学习元数据。外部人员难以明白得元数据,他们必需与“责 任人”交谈才能取得他们想要的东西。因为元数据在局部产生或抓取并 在局部利用,因此通常也只能在局部修改,这种修改通常也可不能通知公 司里其他的组织。技术 能够用各类不同的工具来生成元数据。绝大部份是面向个人电脑的 应用软件。例如,ERWin可用于数据库建模,Rational用于为对象建模、 Excel用于生成商品列表等。这些工具都没有设计成能够互换信息,因此, 只能在本地的文件系统中保留所生成的元数据。1.1.2.5.2要紧的障碍元数据治理问题是业界头痛已久的一个问题,目前看似尚未专门好的解决方 案,国内已知的元数据治理工具和已知的元数据治理项目都能够说是成效一样。 其关键的难点在于:一方面工具本身的缺点,目前已知的工具几乎都只能支持与几种有限的工具 平台交互,不能将企业环境中的所有的元数据集成治理,事实上往往形成了新的 元数据问题。另一个方面,更大的困难在于人的因素,很多关于元数据的知识存在于员工 的脑袋里面,极可能他自身都没成心识到,知识的显化不是一个容易的进程,几 乎能够确信是一个长期的进程。1.1.2.5.3解决方案元数据治理问题不是纯粹的技术问题,加倍要紧的是一个治理的问题,因此 咱们有必要将其放在一个企业战略环境中考察。惫19通过眾统的架构和技术的 毗观为疋数抓管艸提供苹 础的坏境保障疋議据管円问題XHW危作过巩各f业舟和技恳 坏节的元泄据曾;氏,笄促诅冇逋 的利円元敌1S定文H执疔完S的兀敖需变史& 理磁.保证元敌据顶址调整組.维架陶抓讥即 宦良岗枪职贵,沟權标 准)保讦元数据管理是改进元数据管理的关犍成功的关键因素元数据治理成功的关键因素是: 战略层支持和涉入 战略执行保障 有效的沟通保证战略有效执行的组织架构 有效的元数据治理有效的进程保证元数据架构体系元数据验证评估体系与评估机制元数据治理技术元数据治理环境战略层支持和涉入企业的高层和领导们必需支持元数据治理。一样重要的是,所有潜在的消费 者必需参与到元数据治理中。没有治理层的支持和近乎全数的投入,用于整个企 业的元数据治理项目通常就会失败。企业的高层和领导们必需完全支持元数据治理和利用。支持包括确保有充沛 的资源,也意味着对实现元数据治理环境的一贯许诺,该环境是企业衡量和决定 支持数据的唯一来源。元数据治理和利用通常需要庞大的“文化”变革。在没有治理许诺的情形下 这可不能发生。治理内部变革,尤其是文化变革,需要三种东西:治理许诺、一 致通过和适当的方法和奖励。治理许诺高层和领导们必需一直许诺让企业进行所要发生的任何情形,包括变革。只 有企业领导人材能保证有可用的、阻碍变革的、必要的资源。一贯许诺意味着变 革会变成企业领导持续、明显地支持的企业的战略和目标。领导支持是变革取得 一致批准的要紧因素。一致通过只有当相关人员批准变革时,变革才能够成功。他们必需了解变革的需要, 同意变革是正确的,而且相信变革对企业和他们自己都是有益处的。Peter Senge 在他的书“第五项修炼”里描述了为了实施系统变革而需要做出的一致通过,他 说,“人们想改变,而不想被改变。”方法和奖励让每一个人都希望变革是很难的。需要必然水平和程度的沟通和合作,而这 在大部份企业里这种情形并非常见。维持一致通过乃至更难。确保恰本地准确地 衡量变革的过 程和结果,并在全企业沟通,这是取得并维持一致通过的最好方式。 必需得奖励好的功效和变革行为,同时,那些未改变的行为和坏的结果不该该受 到奖励。若是员工坚持旧的操作方式,可是仍然受到奖励的话,他们就可不能改 变了。所有元数据的潜在消费者,包括高层和那些来自于每一个组织单元和级别的人们必然要主动参与到元数据治应当中。元数据消费者对元数据的同意有最大的 阻碍,因此超级有必要论述他们的需要。他们也是操作数据的“所有者”和“治 理员”,因此他们是主题专家意见的最好来源。业务需求不第一判定战略业务的需求就开发元数据治理环境是必然会失败的。这些需 求的最好来源是企业战略计划和计划中确信的执行方法,这些是元数据治理结构 体系和环境 设计的基础(其他成功的关键因素会在本文的后脸部份讲到)。没有 第一决定战略业务和信息需求,一个企业就不该该成立元数据治理。战略计划战略打算概述了一个企业的使命和目的、目标、战略和执行方法(业务需求)。若是正确利用战略打算,它确实是那些领导们用来有效地引导他们的组织、确保 企业成功的工具。一个企业的战略打算不单单提供了有效治理的指导,也提供了内部变革的导 向力,为响应外部变革提供指导方针。企业通过战略计划进程,概念并记录企业 用意、目的和目标和实现它们所采取的战略。其中也包括对外部机缘和要挟的评 估,和对内部好坏势的评估。最有效的战略打算是多维的,它整合了企业的整体计划,包括了每一个企业 要素的附属打算,包括每一个关键功效的衡量方法。执行方法制定正确的执行方法是成功企业治理的所在。一个企业必需能够分辨进程是 不是按关键目标制定,是不是符合股东期望。最有效和有效的执行方法是跨职能 的、同适当的战略、目标和执行标准相联系的。治理的目标和方法的极限常常成 立在外部基准的基础上,形成了一个企业的绩效衡量系统结构。执行衡量文件应该包括不单单报告和查询的内容,还要记录从来源到最终信 息接收的数据途径。所有执行衡量的全数报告结合在一路组成了数据仓库的基础 和知足企业要求的真正特制的战略信息系统。高层和领导们利用从数据仓库产生的信息来提高踊跃性、奖励好的行为和改 变战略。员工用它们来调整操作,对战略需求做出反映。连接特定目标的及时精 准的方法开始使企业治理变得更像是一门科学,而不是一门艺术。所有企业业务规那么和执行要素都是各类各样的企业元数据。正是这些重要 的元数据常常没被治理起来。元数据结构体系元数据治理取得成功的关键在于企业的元数据结构体系,它能反映一个企业 的执行衡量和业务需求情形。它的数据模型和元数据结构应该都成立在战略和战 术信息需求的基础上-而不是某些特定的技术的基础上。企业数据模型一个企业数据模型记录了一些数据要素,他们的值在任何点上任何时刻对告 知数据消费者企业的执行效能来讲是必需的。数据模型对每一个关键数据实体都 作了清楚、明确的概念,描述了每一个利用方式,并概念了推导公式、聚合种类 和刷新时刻距离。和企业信息结构体系连接在一路的数据模型不单单成为需求文 件,也成为将企业元数据同它的消费者和开发者之间沟通的来源。数据模型必需要说明的问题包括要利用什么样的元数据来源来填充元数据环 境、元数据应该如何从继承环境里转移出来、和如何集成或变换元数据要素以保 证元数据的质量和完整性。任何一个企业元数据治理环境里最重要的两个问题是 元数据的质量和访问。元数据结构元数据治理环境可能会有很多结构中的其中一种,实施特定的元数据结构时 必需要论述的要紧问题涉及到元数据的分派和复制。这些问题包括:有多少元数据和多久?从哪里来?单向仍是双向更新?谁需要它?他们需要什么格式的数据?何时需要?LIt兀数据质量元数据治理成功的单一的、最要紧的因素是企业元数据的质量。很显然,企 业元数据必需有尽可能高的质量,必需精准、关联度高、完整、精练,必需及时、 通用,可以用清楚、能够被明白得的方式表达。一个包括可信企业元数据的元数 据环境变成一个很有价值的企业资源,为所有组织级别的决策者们提供资源。若 是消费者发觉元数据不行,那元数据治理确实是失败的。更糟糕的是,若是元数 据不行,而消费者又从来都发觉不了,仍然以糟糕的元数据为基础来做决定,那么整个企业就有可能失败。元数据治理技术只有在元数据结构体系被概念以后,一个企业才能开始选择并执行它的元数 据治理技术。不然,技术不支持企业需求的可能性就超级高。另外,若是企业元 数据方案是为某个特定技术设计的,当需要依照需求的转变和技术的进步和成熟 来革新技术时,即便是可能的,也将会很困难。一个企业的元数据治理环境只能够用一种企业级的、工业级的元数据治理技 术来支持。该技术应该有以下特点:高性能、高容量可升级、适应性强可延伸平安能基于网络跨平台的能够从许多来源里导入/导出能够依照需要导入/导出定制的用户界面元数据治理环境最容易被轻忽的成功的关键因素是阻碍最大的那个因素。为了一直维持高质 量的元数据,企业必需拥有利用最好的操作和技术的环境。该环境的要素包括项 目、方式论、工具、技术和知识。项目组。除了一贯的治理许诺、支持和数据仓库消费者涉入之外,还有一个 关键的因素:企业文化因素。实际治理企业元数据的项目组必需有必然的特点。 他们必需明白得战略信 息和元数据的重要性,必需能够分析并用商业语言记录业 务需求,必需致力于元数据治理,有充沛的资源,实行有效的项目治理。每一个 项目组成员都必需有相应的技巧、知识和体会(看下文),超级熟悉企业进展方 式论,而且能够有效地利用企业元数据治理工具包。方式论。一贯严格开发高质量信息系统的企业利用的是完整生命周期进展方 式论。该方式论以相关的步骤的前后顺序为特点,这些步骤从决定业务需求开始, 并据此进行系统的设计、开发和实施。成立了工业标准的软件开发能力成熟型模型(SW-CMM)的软件工程研究所(SEI)声明,为了进展成为有效的软件开发商,绝对需要一个方式论。利用战略 驱动、以客户为导向、以信息为中心、基于模型的、专业的、严格的、可重复的 方式论关于成功的元数据治理也是必需的。工具。企业元数据太复杂,数量庞大,无法用手工方式开发。有许多对元数 据治理有效的工具,包括建模工具、知识库和第 4代或第 5 代编程语言。把这些 工具结合起来利用对快速有效地开发和保护元数据治理环境来讲是必要的。一个 企业利用的专用的工具包将取决于元数据治理的需求。但是,不管利用的是哪一 种工具,让这些工具一起工作,而且把他们用在企业所选的技术环境里是很重要 的。技术和知识。要高效地治理企业元数据需要一套专业的技术和知识,她们包 括利用建模工具和系统集成的体会,很强的技术背景-强调操作系统、数据库、决 策支持工具、消费者界面和客户端/效劳器,数据建模理论的高层次上明白得,很 强的沟通交流(口头和书面)技术,和和组织里从办公室工作人员到CEO (首席执 行官)的每一个人的互动能力。这些必要的技术和知识能够通过雇佣体会丰硕的 顾问或培训企业内部员工来取得。对顾问来讲,最有效的方式是在帮忙内部员工 把握熟练的技术的同时开始开发,如此企业最终会自给自足。元数据治理和其他 IT 功能不同,它的范围更广、可视性更强、消费群体更大、也更易失败。 在开始一个元数据治理项目之前,企业应该评估是不是已经对本文描述的成功的关键因素做 了充分的论述。
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!