国家级石油数据中心建设与POSC系列标准.doc

上传人:丁** 文档编号:1607985 上传时间:2019-10-30 格式:DOC 页数:17 大小:350KB
返回 下载 相关 举报
国家级石油数据中心建设与POSC系列标准.doc_第1页
第1页 / 共17页
国家级石油数据中心建设与POSC系列标准.doc_第2页
第2页 / 共17页
国家级石油数据中心建设与POSC系列标准.doc_第3页
第3页 / 共17页
点击查看更多>>
资源描述
国家级石油数据中心建设与POSC系列标准袁 满yuanman263.net(黑龙江省大庆市 大庆石油学院计算机学院)1引言信息技术的应用已经深入到石油工业应用中的各个环节。而且随着石油工业的发展,积累的信息呈爆炸式增长。存储与维护这些信息的费用也越来越高,尤其是随着石油市场竞争日趋激烈,迅速而准确地从现有的信息中抽取出有用的决策信息是现代石油生产、销售与管理等迫切需求的。而以往只是面向应用的数据模式的应用已经满足不了这种需求。随之而来的一种面向主题的联机分析与决策应用便应运而生。正是在这种应用需求的驱动下产生出了适合这种应用需求的数据仓库技术。进入90年代,世界上一些国家的油公司、石油协会、石油相关的组织、一些大学及研究机构联合先后建立了自己的数据仓库,这些国家从这些数据仓库中得到了相当的效益,为油田的勘探、开发等提供了可靠的、科学的决策依据。自90年代初至今,世界许多著名的油公司与相关组织联合发起并成立了POSC,旨在为世界油田勘探与开发制定一套集数据集成、软件集成等于一体的标准,而且这些标准已经越来越被各国的油公司所认可。这些标准必将成为世界共同的财富,必定会促进油公司信息系统建设,并为其建设提供可参考与可实施的标准。本文主要讨论了三个主要的问题:一个是讨论了数据仓库及相关技术;接着讨论了POSC的系列标准;最后给出了世界上数据仓库成功的案例美国国家地球科学数据仓库系统(NGDRS)。通过本文的讨论,旨在说明数据仓库建设在石油生产、管理等各个领域的应用潜力;提到数据中心建设就必然会涉及到标准问题,而POSC系列标准正是为这一目的而制定的。POSC系列标准经过10多年的发展与完善已经越来越得到世界的认可,尤其POSC组织目前正在进行的基于电子商务的石油数据交换规范更加细致与实用,这些为我们的信息建设提供了可参考的标准。并全通过一些大组织在信息建设中对POSC系列标准的采用的实践已经证明了POSC系列标准的先进性。2数据仓库体系结构及相关技术2.1 数据仓库的概念及特点近年来,数据仓库技术已经成为计算机领域中的热门话题。这主要是因为:首先,从计算机的应用需求上讲,由于全球范围内的经济、贸易以及军事、科技等领域竟争的激烈,给传统的信息产业提出了新的问题和挑战,使得传统的信息技术在处理某些复杂问题上显得力不从心;另一方面,从现实的技术发展角度上来看,目前计算机科学以及相关领域的技术实现了突飞猛进的发展,使得它们之间的相互协同成为可能,并达到使数据仓库技术走向实用的程度。数据仓库的概念最早是由W.H. Inmon和RichardHackathorn在他们的著作中提出来的。他们对数据仓库是这样定义的:数据仓库是信息技术构架的新焦点,它提供集成化的和历史化的数据,它集成种类不同的应用系统,数据仓库从发展和历史的角度来组织和存储数据,以供分析与处理使用。这里的的集成化数据是指数据在结构上具有综合性而且在语义上是异构的;历史化的数据表明数据仓库中包含的数据是一段历史性的数据,它既包括某一点上的瞬间信息,同时也包含一个区段上的信息;集成种类不同的应用系统说明数据仓库不仅仅是数据的仓库,同时也是软件的仓库。其中的数据一般按应用主题进行组织与存储。也有人将数据仓库抽象地定义为:数据仓库是决策支持技术的集合,其目的是利用所存储的知识做出更好、更快的决策。数据仓库体系结构见图1。也有人将数据仓库定义为:面向主题的、集成的、随时间变化的、用来支持组织决策的稳定数据的集合。不管哪种定义,它们均有共同的特点:数据仓库需要为决策提供综合信息,因此,它是以企业业务的主题内容来组织数据。这样的组织形式使得提供的信息具有全方位的可用性。数据仓库中所保存的数据,虽然来自于日常的运行,但是它是经过加工、重组的数据。因此它所存储的数据是源数据的增值和统一,并不是简单的拷贝。数据仓库不仅仅是“数据的仓库”,而且也是“软件的仓库”,至少它应该包含对数据的变换功能。数据仓库还需要处理历史数据。任何的数据都带有时间标记,这将为实现预测奠定基础。数据仓库应当能够通过信息以及服务来反映企业的业务模型,实现数据的逻辑模型。对于行业的数据仓库必须定义统一数据标准。2.2 组成数据仓库的部件从图1可以看出,数据仓库的组成结构。它包括各种各样的工具:这些工具负责从若干个运行着的外数据库及外部数据源中抽取数据,并负责对这些数据的清洗、变换与集成,同时还负责向数据仓库中加载数据;这些工具还要周期地对数据仓库进行更新,并负责对数据仓库中一些归档数据的净化。除了主数据仓库之外,可能还会存在一些部门级的数据集市。存储在数据仓库或数据市场中的数据可能被一个或若干个数据仓库服务器负责管理,这样对不同的前端工具会呈现出各种丰富的数据视图以满足不同决策与应用的需求,这些前端工具可能包括:查询工具、报告生成器工具、分析工具以及数据挖掘工具。此外,还包括一个用来存储和管理元数据的仓库和一些用来管理与监测数据仓库的工具等。2.2.1 数据仓库的后端工具下面对其中的几个有代表性的工具进行简单介绍,数据仓库系统利用数据提取、清冼、加载与更新工具对数据仓库中的数据进行整理。从“外部”源中提取数据通常是通过一些网关和标准接口(例如Information Builder的EDA/SQL、ODBC、Oracle的开放互连、Sybase的企业互连以及Informix的企业网关等)。数据仓库的后端工具的功能如下:数据清冼工具(Cleading):由于数据仓库被设计成用来决策的,所以保障数据仓库中数据的正确性是相当重要的。数据仓库中的数据来自于多个数据源,而且数据量是相当之大,所以造成数据不一致与异常的概率是相当高。因此,对这些数据异常的检测与校正要付出相当的代价。这一工具可能会根据需要被划分为几个子工具:数据变换工具(允许对工具指定一些简单的变换规则)、数据净化工具(根据域的指定范围来对数据净化)以及数据审计工具等。加载工具(Load):当数据被抽取、清冼以及变换之后,数据就必须被加载到数据仓库中。数据加载工具除了对数据进行加载之外,它还允许系统管理员来监测系统的状态,取消、挂起以及重新开始加载操作。数据仓库中数据加载的量要比运行数据库中数据的加载大得多。数据的连续加载可能会持续很长时间,例如,加载万亿字节的数据可能会花费几周甚至几个月的时间。 更新工具:更新过程主要是更新由数据源向相应的要更新的数据库以及存储在数据仓库中的导出数据的传播。在更新中主要考虑两个问题:何时对数据更新以用如何来更新。通常情况下,数据仓库是被周期更新,一般情况下,数据更新策略是由系统管理员根据用户的需求与流量以及对不同数据源进行不同的设置。2.2.2 数据仓库的前端工具以及数据仓库服务器电子表格是典型的用于联机数据分析与图形显示的工具。为提高对数据仓库的查询与访问效率,数据仓库服务器要考虑高效的选择,可以采用索引交集的形式来实现多重条件的选择操作。在数据仓库服务器上会采用许许多多先进技术以保证决策对速度的需求。2.2.3 元数据与数据仓库管理由于数据仓库反映了企业的业务模型,在数据仓库体系结构中一个最基本也是最重要的要素就是对元数据的管理。所谓的元数据是关于数据的数据,用于建立、维护、管理及使用数据仓库,在数据仓库中需要管理不同种类的元数据,具体包括:元数据描述 变换描述:运行数据库到仓库映射方法以及用于转换、增强数据的转换算法。数据仓库对象和数据结构定义。数据仓库运行信息。元数据包括了关于建立与使用数据仓库的所有必需信息:源数据库描述、后端与前端工具描述;数据仓库模式定义描述、导出数据描述、维与分层描述、预定义的查询与报告描述;数据集场位置与内容描述;数据分区的物理组织描述;数据抽取、清冼、以及变换规则描述;数据更新与净化策略描述;用户配置、授权与访问控制描述。通常情况下,一个元数据仓库用来存储与管理所有的与数据仓库相关的元数据。元数据在整个数据管理中占有相当重要的地位,所以在进行企业数据仓库建设中必须对元数据进行规范化或标准化定义,这样为整个数据仓库的数据管理、数据交换等奠定基础。目前有许多组织与研究机构在对如何进行元数据的定义与管理进行研究,力求一种完美的方法解决这一难题,而POSC组织针对石油中心数据模型Epicentre定义了一个完整的元模型。通过上面的讨论,可以清楚地看出,如果要进行国家级数据仓库建设,必须考虑所建数据中心中各组件所涉及技术的规范化与标准化定义问题,否则会增加将来的维护与使用的费用,不能与其它外部系统的互操作等。3开放的石油软件集成技术标准POSC相关技术POSC技术通过十多年的努力已逐步发展为一个成熟而日臻完美的一套适合于石油勘探与开发以及管理等软件集成的标准,尤其是它的数据规范经过初期的1.0、2.0、2.1、2.2直到今天的3.0模型标准,经过多年的完善、补充与删减使这套标准日趋走向成熟。具体来讲,整个POSC规范从基本的数据模型规范、数据存取与交换规范以及用户的界面风格规范均有体现,它是一套完整的用于指导勘探与开发应用软件集成与建设的指南与可参考的系列标准。3.1 POSC规范综述从整体来讲,POSC组织定义了七个标准,这些标准覆盖了整个石油勘探与开发应用软件开发、集成、数据存取与交换等的各个环节,它是一个指导石油勘探与开发应用软件开发、集成的一套完全标准,具体包括:基础计算机标准:为应用程序定义了一个软件环境,使应用程序独立于计算机硬件,对操作系统、系统调用、图形用户界面及绘图语言、图形元文件、网络以及编程语言等应用标准进行了全面地定义。Epicentre数据模型规范:采用面向对象技术,定义了E&P工业中的逻辑数据模型,该模型与底层的物理存储无关。数据存取与交换规范:定义了应用程序所使用的一套API与数据结构。数据交换格式规范:用于在异构的计算机环境间进行数据交换,或用于对计算机系统进行数据备份。POSC的数据交换格式(PEF)以美国石油学会建立的RP66格式为基础。 EP用户界面风格指南:这一规范向应用的开发者提出了向用户提供统一的界面标准,它遵循OSF/MOTIF,POSC对图形外观、图符、窗口等进行了定义,同时还定义了各种岩石、气体、石油、水等物质的图形与颜色。 应用程序间的通信(IAC):以消息为单位,定义了一套应用程序之间进行通信的接口规范,使得在相同或不同的机器上同时运行的应用程序之间可以交换数据。它是软件集成的一个有力工具。 石油工业计算机图形元文件规范:用于石油工业应用软件间的图形交换,涉及全矢量图形或矢量与光柵混合的二维图形。在此基出上,扩充定义了地震与测井部分图形规范。POSC定义的软件集成平台体系结构见2。图2给出了采用POSC规范实现应用程序、数据及各部件通信的集成平台。所以POSC不仅是一个数据集成平台,同时它也是一个软件集成平台。在下面的各节中,我们对这七个标准进行讨论。3.1.1 基础计算机标准软件集成平台是应用程序和操作环境的中件软件层,其目的是简化应用程序的可移植性和互操作性,为此POSC定义了计算机环境所应遵循的标准。其基础规范见图3。在这一规范中定义了一系列系统调用、数据存取、数据交换、用户界面等相当全面的开发规范,而且这些规范全部是基于已有标准定义的,所以依据这些标准进行软件的开发,必然会实现不同程序间的互操作性、增强其移动性与可扩充性。3.1.2 石油勘探与开发中心数据模型规范EpicentreEpicentre数据模型是一个逻辑意义上的数据模型,它的先进之处是全球20几家公司向POSC组织提供了30多个模型供POSC参考,在制定模型标准时,这些世界知名大公直接参与,另外一个先进之处是采用了当今先进的面向对象建模技术来构建这一中心数据模型。从专业应用的角度来看这一中心数据模型覆盖了油田整个生命周期中各阶段涉及的活动所涉及的对象及特性。这一模型在石油勘探与开发各个领域均有体现,见图4。石油勘探与开发中心数据模型具有如下的特点:(1) 对象的组织观点:将各种对象进行分类,并抽取各类对象的共同特性,将这些对象从高层的角度抽象为技术对象与业务对象,认为其它对象均是这些对象的子类;(2) 以活动为中心的观点:将油田中发生的各种事件抽象为活动,以活动为中心组织相关对象,在这些对象间或活动间以及对象与活动间可能会建立起一些临时关系,这个临时关系由关联关系描述;(3) 信息重用性:无论是对象、活动、还是关联关系,均是按照层次组织的,这就为信息重用奠定了基础,对于重复的信息不必在子类中进行定义,而采用继承机制直接从父类中直接继承;(4) 可扩充性:在这里,我们所说的可扩充性包含两个方面的含义:一个是指模型本身结构的可扩充性、另一个是模型中对象实例的可扩充性。由于POSC数据模型采用面向对象机制组织,所以它的扩充性是层次模型本身所固有的性质。在实际中,可以根据具体的需要来定义一个新的对象。Epicentre 3.0加强了对模型实例的扩充性,例如,为了描述对象或活动的某些特殊特性,在模型中没有显示定义的情况下,可以利用实例的扩充性原理来扩充一些新特性;(5) 特性的一次定义多次引用:在POSC数据模型中,对同一特性只定义一次,具体描述什么对象,就看该特性与什么对象捆绑在一起,与哪一对象捆绑在一起就表示什么样的含义,这样消除了由于同一特性的重复定义而造成特性的二义性问题;(6) 相关对象空间信息的描述:在POSC数据模型中,业务对象中有一类对象被称为拓扑对象,POSC可对这些对象的空间拓扑结构及位置进行完整描述;(7) 定义了丰富的标准参考值:POSC在取得各大油公司一致的情况下,定义了许多有价值的标准参考值;(8) 数据模型中定义了能够满足于EP应用的各种丰富的数据类型;(9) POSC为实现异构数据源间的数据存取,定义了数据交换标准。3.1.3 数据存取与交换规范数据存取与交换应用程序接口(DAEAPI)是为应用程序对Epicentre数据模型进行存取而定义的的一套标准函数级调用接口。在这里定义了对POSC数据仓进行存取的各类丰富的函数、数据类型以及数据结构等。通过这一标准接口能够实现对POSC的Epicentre的存取操作。3.1.4 数据交换格式规范POSC定义了用来实现异构环境下,不同应用程序间进行数据交换所遵循的标准格式。这一标准交换格式主要以美国石油学会的RP66格式为基础。3.1.5 EP用户界面风格指南该规范遵循OSF/Motif规范。这一规范基于计算机工业标准和POSC软件集成平台规范。这一标准的基本目的是促进石油勘探与开发工业应用软件之间一致性的实现。石油勘探与开发工业已逐步认识到,高质量的人机界面用户界面,对于促进日益复杂的应用软件在生产中的广泛应用是非常重要的。运行在不同平台上的不同类型的应用程序,也需要对观和功能上一致的人机界面。只有这样,用户才能更快地学习和掌握新的应用软件。3.1.6 应用程序间的通信(IAC)应用程序间的通信(InterApplication Communication-IAC)是POSC软件集成平台中的一个重要组成部分。它定义了勘探与开发工业应用程序通信时所应遵循的条件标准。该标准为应用程序提供了标准的应用程序接口和消息模型,并对通信中的有关术语和数据类型进行了定义。它是为了解决应用进程间实时地、有效地交换数据和实现应用进程间及时的控制信息交换而定义的,从而为实现应用间的互操作奠定基础。图2给出了各个不同的应用之间的IAC交互。在这里定义了以下五种消息传递模式: 广播模式:这种模式是实现“一对多”应用的一种模式,它是单一应用发送消息,而同时可由若干个进程接收到; 点到点模式:这种模式要求有两个进程,消息只在这两个应用间传递; 客户/服务器模式:在这种模式下,由服务器集中提供各种功能给客户。 出版/订购模式:只是将消息发送给订购了该消息的用户。 数据网络模式:应用程序在网络中协同执行一些逻辑相关的专门任务和任务子集。如地震处理流程就属于这种模式,即各个应用相互连接,组成处理流程,完成地震资料的处理任务与显示任务。从某种意义上来讲,消息传递模式与应用模式互不相关,虽然有些应用可以使用几乎所有的消息传递模式,不过在许多情况下,某种特定的应用只能采用特定的消息传递模式。这些消息传递模式基本可以满足勘探与开发工业的需要。3.1.7 石油工业计算机图形元文件规范CGM*PIP该标准规定了当采用计算机图形元文件(CGM)格式时,石油勘探开发领域及相关应用之间二维图形数据交换应满足的条件标准。图形数据为向量或混合向量和光栅型。内容包括PIP/I和PIP/II标准,即CGM版本1元文件标准元素标准、地震道扩展和连续绘制扩展,还包括PIP/III,即基本测井记录扩展。这些规范为实现EP中的图形显示及图形数据交换定义了可遵循的标准。3.2 POSC目前正在进行的工作POSC在定义了这七个标准之后,其中的基础计算机标准、数据存取与交换规范标准、EP用户界面风格指南标准、应用程序间的通信(IAC)标准以及石油工业计算机图形元文件规范自定义之初基本没有变化。变化最大的是E&P中心数据模型标准,Epicentre模型标准已由90年的1.0版本发展到目前的3.0版本,目前这一模型已较为完善,能够满足各种类型应用的需求。元模型与数据交换是POSC目前重点进行的工作,它已经由当初比较粗的规范向基本XML标准的数据交换的定义与细化,例如,目前对井信息模型的数据交换、测井信息模型数据交换标准进行了细化定义,这些标准为实现井信息与测井信息的E-Business服务提供了技术保证;而且与许多的油公司合作开展一些项目的研制与开发工作。例如,CAESAR、IPP、SAVE、RESCUE、WIME、DISKOS、CDA等工业性的实践,这些项目均是基本POSC标准的。3.3 小结通过上面的讨论可知,可以说POSC技术规范是一个全集,它包罗了石油勘探与开发软件的各个环境,从数据模型到数据存取与交换、从用户界面风格规范到图形绘制规范、从底层通信协议到高层应用程序间的通信等均进行了详细的定义。这些技术为开发与集成勘探与开发工业中的应用软件定义了一整套详细的可实施的技术规范。这些为建立国家级的数据仓库提供了具有相当价值与可参考的标准。4 国外石油公司数据仓库建设状况4.1 国际上石油公司数据仓库建设状况进入90年代以来,国外的许多公司,其中包括石油公司兴起了一股建立国家级数据中心的潮流,它代表了对企业应用信息的衡量指标。有些人甚至将用它来判断一个企业兴衰的标准。在METAGroup的研究报告称,在其所调查的2000多家企业中,90%的企业已经或计划在两到三年内建自己的数据中心。有了数据中心,可以根据需要对现有的信息实现深层次的加工与处理,依据这些信息进行决策、预测及分析等。国家数据仓库的建设相对来说是一个比较新的现象,但是经过10年的发展,相关的技术已经趋于成熟并应用于实际的数据仓库建设中。建设国家级数据中心的目的是为了减少不必要的开资、解决发现数据难以及相关标准问题。石油界在世界范围内召开了三次关于数据仓库建设的国际性会议:第一届是在London举行、第二次是NPD组织在挪威的Stavanger召开、第三次是1996年在Calgary举行。会议的宗旨是加强国际各石油公司间的合作、共同探讨数据仓库建设中技术的共享与合作,讨论石油工业数据仓库建设中的相关技术。到目前为止,下列一些石油公司在勘探与开发领域开展了数据仓库的建设,其中一部分是由油公司自己独立开发的或由国家政府部门直接参予开发的数据仓库系统: 澳大利亚皇家矿产能源部联合CSIRO公司与PECC公司建立太平洋资源信息中心。其主要目的是将矿产开发源数据的磁带所包含的信息、有些已经处理的信息以及测井日志作为开发数据中心的事务处理。为皇家矿产能源部门对生产的控制和决策服务。该数据仓库系统的功能包括地震信息的获取与处理、测井信息、信息的硬拷贝、电子文档以及地理位置等信息。 在印度,国家石油天然气部的碳水化合物部门决定建立和实现一个集成的石油勘探开发及成果数据仓库。经过多年的努力,印度已经拥有大量的关于石油天然气勘探开发的历史数据,通过利用这些信息将加强印度的政府部门对石油天然气开发的有力指导与科学的决策。除此之外,系统还包括对石油天然气经营活动的相关信息,这些信息为给国际上的有关公司的投资策略制定提供了有效依据。 挪威提出了DISKOS工程,它的主要目的是用来管理天然勘探开发数据库。该工程自94年开始建设,其中19941995年为系统建设的第一阶段,这一阶段主要完成导航器的构造、地震信息处理、测井数据处理、管理数据处理以及与商业有关的数据的处理,数据量达到6TB。自1996年至今处理了地震信息、产品信息以及国际石油的有关信息,数据量已达到150TB。 在秘鲁,国家石油公司组织了Schlumberer和GeoQuest两大公司,拟在GeoQuest公司建立一个国家级的数据仓库,用来优化他们的勘探开发数据。秘鲁国家石油公司负责管理国家的石油与天然气资源,包括一万口井的相关数据。整个系统的建设重点放在地震与测井数据的组织、有效性成果与智能化处理等。 SIEP(Shell International Exploration & Production)公司正建立一个名为EPCD(EP Corporate Database)的数据库以实现整个公司范围内信息共享,降低用户的检查时间,同时有效地集成数据增加信息的可用性。 在俄罗斯,国家燃料与能源部将用五年的时间建立一个联邦石油数据仓库,它将与莫斯科和其它油田建立分布式石油数据库系统,在整个石油工业中建立联合的信息框架,允许石油公司和政府部门进行快速有效的数据检索。包括地震数据、测井数据以及遥感数据等,并建立了Internet门户网站,其中的的编目、元数据及参考数据页面超过了11000个。到2002年已经向数据仓库中加载了120000Km的地震测量数据140Gb、1350口井的测井曲线数据、2Tb遥感数据、30Gb的油气田数据、200Gb的海洋地质与地球物理数据等,下一步准备将设备信息也作为仓库的一部分进行管理。 在英国,CDA(Common Data Access)公司在Amerada Hess、AGIP/Amoco等多个油田的资助下,建立一个全英的勘探开发数据库。其目的是为了减少近海石油地质技术信息数据的管理费用,提供信息的可有性与可访问性。通过使用高级的数据管理系统实现远程设质量的数据传输。在美国,由美国能源部、美国天然气研究院、Mobile公司等部门发起,由美国地质研究院、地质经济税物局、POSC以及信息中心等单位参与,建立了国家地质科技数据全库系统(National Geoscience Data Repository Sysyem)。系统的主要任务是保存和访问需要几亿美金才能获得的地质数据,以改善由于受到郊区环境的限制使得无法及时更新某些数据的状况而提出的。系统的建设分成三个阶段:第一阶段:确定哪些公司的哪些地质信息将要参与进来,这部分工作已在1994年之前完成。第二阶段:这部分工作始于1995年春,确立了NGDRS系统的组织和管理机构。并建立了地质数据仓库的目录,完成了围绕着井的有关数据的传输与访问的总体框架。这部分工作已于1996年底完成了。第三阶段:这一成果见下一节。4.2 美国国家地球科学数据中心建设典型实例美国地质学院在国家的支持下建设了国家地球科学数据仓库系统(National Geoscience Data Repository System)简称为NGDRS。美国的NGDRS是POSC规范应用的典型实例,他们在建设美国国家地球科学数据仓库系统中遵循了POSC的相关规范。该系统见图5。该数据仓库系统的目标是: 保存国家地球科学数据; 将已建成的数据仓库实现连网支持勘探与决策分析; 提高用户对数据访问的质量; 降低对数据管理的费用; 减少数据冗余。NGDRS成功的关键: 美国国家地质勘察部的支持:为数据仓库建设提供各种数据; 美国国家能源部的支持,为支持系统建设,投资并成立了数据票据交换场所; 石油工业为为数据仓库建设提供数据与专门的技术并投资; 美国国家科学基金委为数据仓库提供了大量的理论研究数据; 采用一些国际标准也是NGDRS成功的重要因素之一:在该系统中采用了POSC的核心数据模型Epicentre、基于XML的数据交换策略以及数据质量评价标准等。所有这些为NGDRS的成功奠定了基础。到1995年NGDRS中保存数据情况: 仓库中已经存储了英尺线长的岩芯与岩石切片; 地震数据已经达到英里; 测井曲线达到log;NGDRS下一步工作: 将目前的数据仓库系统提升为一个全分布的数据库模式,以方便对系统的访问; 允许数据仓库实现外购式的联机数据管理; 尽量采用一些国际标准来实现系统的功能; 解决互操作性问题应尽量将任务集中在对数据的编目上,而不是数据提供商处; 应尽量采用一些开放的源代码,以实现对长期费用的控制; 美国国家能源部、国家科学基金委、国家地质勘探局以及其它机构继续支持该系统的建设; 为增进国际间的交流与协作:美国地质学院与相关的部门发起并举办的关于NDR会议不久将在美国华盛顿召开。采用POSC系列标准建设国家级数据中心成功应用的实例很多,这里就不再一一列举。5 总结本文首先讨论了数据仓库建设中涉及到的相关技术,包括数据仓库的体系结构、体系结构中的各组件及功能以及元数据管理问题,从理论上对数据仓库进行行总体综述。通过对数据仓库体系结构模型的讨论可知,除了与数据仓库建设直接相关技术外,其中的标准化问题在数据仓库建设中显得尤为重要。通过一些国家数据仓建设功成的案例也可以清楚地看到这一点,所以各国在数据仓库建设中成功的重要一点都强调标准的采用问题。由于POSC系列标准就是为石油勘探与开发工业的软件与数据集成定义的专门标准,所以这些系列标准覆盖了整个石油勘探与开发各个领域。这些标准为石油勘探与开发应用软件的开发与集成提供了具有相当价值的可参考的标准。多年来,在总公司的支持与领导下,我们一直坚持对POSC技术的跟踪研究,我们认为如果要建设我国自己的石油数据中心应首选POSC系列标准作为中心建设的指导标准。参 考 文 献1 美国国家地质学院:http:/www.agi.org2 POSC系列规范:http:/www.posc.org3 石油软件集成技术规范系列(标准),中国石油天然气集团公司科技发展部,1998.12。4 王秀明,石油开放软件(POSC)集成技术及其在CNPC的应用,石油开放软件集成平台技术系列培训参考资料,中国石油天然气集团公司科技发展部,1998.6。5 Surajit Chaudhuri et, An overview of Data Warehousing and OLAP Technology,2001.6 Elainine L. Appleton, Use Your Data Warehouse to Compete, DataMation May 15,1996.7 How to Integrate Your Data Warehouse, DataMation May 15,1996.8 Support Decision Makers with a Data Warehouse, DataMation May 1996.9 http:/www.datamation.com
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文书 > 各类标准


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!