劳动与社会保障数据交换平台建议方案

上传人:美景 文档编号:25398 上传时间:2017-01-10 格式:DOC 页数:31 大小:3.22MB
返回 下载 相关 举报
劳动与社会保障数据交换平台建议方案_第1页
第1页 / 共31页
劳动与社会保障数据交换平台建议方案_第2页
第2页 / 共31页
劳动与社会保障数据交换平台建议方案_第3页
第3页 / 共31页
点击查看更多>>
资源描述
利用信息集成技术 构建劳动与社会保障数据交换平台 术建议方案 2 一、 概述 以现有信息网络为依托,以现有业务信息为枢纽,为劳动与社保客户建立统一的数据交换平台。在建立集中统一的数据交换平台,实现提取生产区的实际业务数据,并进行数据的过滤、检测。统一数据标准。形成统一的交换资源数据库,为统计分析提供基础数据。完成全国联网数据上报工作。同时实现业务资源数据库的远程备份。 1. 现状 现在的劳动与社保数据库有近十个,其中数据库容量平均是 50G,而且数据源为异构数据源,包括 数据库; 2. 系统主要建设目标: 建立 数据中心业务 资源库的数据采集平台 , 用以实现 对垂直的下级 业务系统数据向 上级中心业务 资源库的 及时 更新 以及数据转换。 数据中心资源库数据采集平台包括数据采集和数据转换两个主要部分。 数据采集平台起到隔离基层业务系统和相关资源库应用的作用,使得未来任何的业务系统的变化(系统更新、升级、数据格式改变甚至数据库系统变更等 )都不会影响整个资源库系统的运行。 数据转换平台起到 数据质量管理 的作用 ,对数据的属性、逻辑正确性、完整性、一致性等进行验证 查核 工作。 保障 信息资源库 取 得的数据是真实、一致和完整的。 数据采集和数据转换相结合,将形成一个长期稳定的数据采集平台。 支持 数据分析和综合决策。在资源库基础上,进行数据 信息的 综合利用,实现 信息 分析 、数据挖掘 和决策 支持 。同时资源库的建设将为数据仓库及应用的建设打下基础。 建立对外的统一数据交换区, 实现业务资源数据与交换资源数据的数据交换、上报的功能, 将数据及时地通过统一的数据交换平台,实现向部 3 里及横向与其它平级单位间的数据交换。 实现业务资源数据库到交换资源库的数据交换,实现向部上报数据的功能。建立统一的交换数据区。 基于交换平台,实 现对业务数据的检测、过滤、筛选、抽取等功能。实现业务资源数据的数据检测、过滤、筛选、抽取。 数据交换平台是建设劳动与社保数据分析区及数据交换区的核心系统,其主要的作用为: 为地市级社保信息向上级提供安全、高效的信息传递、采集通道; 保证社保分析数据信息交互的数据实时性和数据一致性; 在社保内部形成统一的数据视图,方便管理; 提供向部里进行数据交换的统一平台; 屏蔽当前劳动与社保内的 I T 环境的复杂性,方便应用开发和管理; 屏蔽当前劳动与社保管理机构内的 I T 环境的分布式特性(省级、地市级管理),方便应用 开发和管理; 在此,我们建议利用 新的信息整合的技术和解决方案构建一个统一的公共数据交换平台方案。下面我们对这样的一个解决方案进行详细说明。 二、 劳动与社会保障行业数据交换平台方案 1. 本解决方案的设计出发点: 快速实现对多种异构数据源的集成 保证劳动与社保分析区数据采集、交换区数据的实时性、一致性; 建立一套安全可靠的信息交换通道,实现数据在上、下级管理系统之间的数据交换、数据同步; 建立统一数据视图,支持真正意义上的劳动与社保信息分析区及交换区的建立,提供复杂、分布式环境下的可读写操作环境,并支持今后建 立跨业务系统条块的新的业务流程; 4 简化应用编程的难度,缩短开发和实施的周期,降低日常维护难度; 能够很好地将当前业务系统与新的综合业务系统的用户管理、认证及授权机制结合,建立方便、清晰、易管理的用户安全认证管理机制; 在分布式的环境下实现全局优化,保证分析应用及数据交换的整体性能表现; 适应未来扩展性要求,方便应用范畴的扩展; 2. 建议通过 息集成( 术 方式 实现公共数据交换平台 信息整合方式也称为数据整合方式。信息整合就是将业务系统的数据进行有机的整合集成,从而实现对信息数据共享、交换的过程。 息集成 核心在于业务数据的采集,并不关心原有业务数据的流程。 因此, 核心是数据的集成。它采用数据包装器作为连接件,将现有客户的异种数据库( 等连接在一起。 以采用 式或者关系型格式对数据进行标准定义,平台工具内嵌数据采集监测功能。应用的开发支持 准,保障了数据使用的通用性。并且可以保证系统的有效性、性能和易开发性。 在 有效性 方面, 数据采集机制,对源数据增量识别的问题采用了侦听同步或者数据复制的方式, 可以有效地解决数据采集同步的问题。而 数据包装器运行在资源库系统中心,无需异地开发。 跨本地和异地网提取数据,也能在源业务系统屏蔽访问时,由源业务系统传递 据包,对 据文件进行信息分解和提取,能够满足不同的源业务系统的特点。 在 性能 方面,实际的测试表明, 数据复制能够达到 时的数据提取量,而 快速数据导入功能更能达到 30时,而该测试结果还是在一台资源紧张的服务器运行出来的。由于 平台设计的目的就是为了解决数据整合的问题,因此能够得到这样比较理想的测试结果 ,而无需依赖于特殊的开发和编程手段。 基于上述理由,我们推荐使用信息集成平台来完成资源库的数据采集功能,以建立长期稳定的综合资源数据库平台,满足中心业务数据库交换和数据复用的 5 需求。 通过 据整合平台,建立劳动与社会保障业务数据中心及数据分析区和交换区 我们利用 据整合平台建立一个信息集成访问接口,建立起社保信息数据交换平台,同时在分级上下系统间业务数据的数据采集平台,并在分析数据区、交换数据区间建立一个可读写的双向访问接口,实现不同数据分区间的数据交换。 在所提供的统一访问接口的支持下,就可以在 一个整体数据库的逻辑视图下(这一视图跨越地市级劳动与社保信息管理系统),经过相应的数据转换,来实现中心业务数据,和面向劳动与社保信息分析及交换的数据流程和业务流程,实现整个劳动与社保分析系统和数据交换系统快速开发和部署。 在分级纵向信息整合建立起数据中心的过程中,建议分阶段实现,第一阶段旨在利用数据映射层,实现统一查询访问,使全省数据可共享。第二阶段,结合数据整合层的各项功能,进行分极系统的数据标准的规范化,提高共享的质量和数据复用,并为数据交换做准备。这两个阶段是信息整合所不可或缺的必要环节。第三阶段,将 部分被频繁访问、且实时性要求有限的数据物理集中,提高数据查询的质量,便于决策分析等业务应用。第四阶段,在第二阶段数据标准规范化的基础上,实现统一的数据交换。这两个阶段可根据实际业务需求取舍,也可更换先后次序。 数据交换平台的架构图如下: 6 数据整合平台负责从市级业务数据库及外部数据源中获取资源库所需的数据,实现中心不同数据分区间的交换。数据整合平台位于业务数据库和数据转换平台之间,屏蔽了后续数据处理与数据来源间的直接关系。整合平台主要实现两个方面的功能: 业务数据中心的 数据采集和转换 不同数据分区(业务数据区、分析区、交换区)间的数据交换 为保证对数据整合平台的统一控制和管理,我们采用集中式的数据整合平台设计思路,即在中心部署一个大的平台上完成对主要业务数据的采集,及不同数据分区间的数据交换。数据整合平台设计的基本原则是在业务系统部署软件,和编写专用接口,所有的软件部署也都在此平台上实施。 现数据交换 在本方案中,根据与已有系统连接的要求,需要支持实现与 个数据库系统之间的数据复制,这就面临着一个异构数据库之间双 向复制的技术要求,这在数据库领域一直是一个很难解决的问题。而恰在解决一个企业级异构数据集成同时,很好地解决了这一棘手的问题。 7 能够支持用户在一个广泛的异构数据环境内,定义各个异构数据源之间的复制关系和复制机制, 向的、指定时间点的复制,能够提供接近实时的,事务一致的数据复制 机制的定义和实现。 使用 , 可以作为复制源或复制目标; 用户可以配置一个多样性的拓扑环境 复制服务器支持分布式(从一个数据库到多个数据库的数据迁移)和集中式(从多个数据库到一个数据库的数据迁移) 数据迁移可以同时使用标准的 达式或存储过程 数据迁移可以定时的自动执行,或在一定的时间间隔执行,或连续执行,或者由事件触发执行 数据复制定义关 系如下图所示: 8 从上图可以看出,使用 ,可以非常方便地实现跨业务平台、跨数据平台、跨地域的业务数据汇总、统计分析等工作的开展。而从前,我们要实现这样一个应用,就需要花费大量的精力,进行数据采集汇总的工作,从各个地域、各个业务系统、各个数据库平台上进行数据迁移,工作量大,而且准确率和实时性都很差。而在本方案中,这一切难题都会迎刃而解。 现数据采集 通过数据整合平台,实现中心对 垂直业务数据的采集,我们可以提供三种数据采集的途径,分别说明如下: 数数 据据 运运 输输 表表 NY 市级管理系统统 县级管理系统 据复制引擎 外部应用 管理系统 数据库系统 9 批量数据抽取 对于比较规范的业务系统,如果通过理解其数据库表结构能够识别增量数据,则建议采用批量数据抽取的方式。 批量数据抽取的方式一般为非实时模式,在业务系统空闲时进行运行。对于网络条件较好的数据源,该方式可直接通过信息采集平台向业务数据库发送数据抽取的 句,增量信息通过 件传入,采集的数据直接保存在信息整合平台。 对于网络状况不理想的业务系统,该方式可分两步进行。首先在业务系统数据源将增量信息卸载 为文件,然后再将文件传送到信息采集平台。这种模式要求在数据源部署卸载及数据传输程序,管理维护成本较大,建议尽量采用第一种方式。 数据复制 数据采集平台提供对各类主流数据库的各主要版本数据复制的能力。在复制 10 的过程中,系统自动抽取数据的变化,通过中间的传输,最后加载到目的地。在大多数情况下,复制应该不干预现有的应用,对系统的影响应该降到最低,复制过程有必要进行管理和监控。 复制可分为两个步骤 于获取数据源数据的增量。对 据源,通过 制实现。 责将变 更的数据送到数据目标。 供对纯增量的复制能力,在目标端自动附加操作类型、时间戳等信息,以用于后续数据转换的处理。 提供的数据复制方式提供多种调度手段,支持分钟级数据的同步。对大多数据业务系统而言,数据复制对系统有一定影响,但影响有限。建议应用在难以提供增量信息,而业务负荷又有一定扩展性的系统。 数据侦听同步 数据侦听同步的模式与数据复制有一定类似,但可大大降低对业务系统正常工作时间的影响。 对于部分不能提供增量信息,而当前业务系统负荷又较重的系统,可采用数据侦听的模式。数据侦听与数据复制最大 的不同是在变更数据捕获方面。数据侦听只捕获变更数据的主键信息,占整个记录的信息量很小。因而对业务系统的工作时间的影响很小。 11 数据侦听同步分两个步骤完成数据的采集。首先通过数据侦听获取变更数据的主键及操作类型信息,并同步到数据采集平台。然后在业务系统的空闲时间,通过侦听得到的变更信息,重新通过数据采集平台访问数据源,批量将其他数据内容信息抽取到数据采集平台。 数据同步中可能的意外情况由系统自动管理。 数据采集平台通过提供批量数据抽取、数据复制和数据侦听同步的方式,针对省厅的多种不同情况的源业务系统,均提出了有 效的采集方案,对建立系统打下了坚实的基础。 3. 我们建议选用 据整合平台 为数据交换平台的核心技术。将市社保的各类数据源通过联邦的方式映射到一个数据采集平台的逻辑数据库中。对所有业务数据的访问都通过 I 完成,数据存储的异构性和不同数据库操作的异构性由 I 屏蔽。 信息整合平台基础架构如下所示: 12 基于联邦数据映射能力,在数据整合平台可直接获取业务数据库的数据。在此基础上, 提供异构数据复制技术及数据侦听技术,实现对增量信息的识别和同步。 其实现原理如下图所示: 图中:联邦服务器( 过称为包装器( 软件模块与数据源进行通信。对于上述各类数据源, I 提供专用的个 现异构数据源的 理,支持异构数据库间数据类型的转换和函数的转换。对关系型数据库数据源而言,包装器通过安装在信息整合平台的该数据库的客户端与其进行交互 。对非关系型数据源,包装器直接进行数据访问。包装器从信息整合服务器接受数据访问指令,进行转换为数据源所支持的 过数据源的客户端提交执行。然后将结果返回给信息整合服务器处理。 除包装器外,信息整合服务器还有三个核心的部分。信息整合服务器维护一个全局的数据字典,其中保存需在信息整合平台被访问的数据的相关描述,包括数据源的配置信息,数据源表的结构,字段数据类型,相应的索引及数据量数据分布的统计信息。(注:该类信息无需用户自行输入,在定义过程中,系统可从源数据库系统的数据字典中自动获取)。另外全局数据字典还 记录数据源的 络, I/O 等系统资源情况。 13 现对 息集成关键技术进行说明 1)联邦技术 采用联邦技术,可通过简单的配置,快速实现数据共享。其主要特点为: 透明性。所有信息源看起来就像是一个信息源。 异构性。从不同数据源整合数据。 双向 问。基于标准的通用访问方式,且双向可读写。 可扩展性和工具化。可以访问任何数据源,配置方便。 避免对现有数据源和应用程序进行更改。 其性能可以满足实际应用程序和可能应用程序的需要,包括高级查询优化技术、本地数据访问以及透明缓存支持。 可以充分利用标准的分析、 报告和开发工具等高级功能。 包括对后端数据源中缺失能力的补偿。 2) 制 在多种数据源的环境中,主要采用 制技术。 制技术能够 支持网络上同构或异构数据库之间的数据的有效传输和冗余性复制, 能够实现 多 种复制 模式 (如: 准 实时复制、定时复制、双向复制、 复制转发 等 ,复制范围可整表复制或表中部分行复制或修改单元复制) 。 复制运行时包括三个组成部分: 中 取 结果,并根据复制映射关系进行转换,按照一定的时间规划,作用于目标数据; 控复制过程,并给出监控信息。 制实现机制能够解决以下三个主要问题: 增量复制 支持对数据的变化增量识别、提取和复制,与全量数据复制相比,可避免全量数据传输的巨大负载对各个系统的影响。 14 对 族的复制数据源而言,通过读取数据库日志信息获取数据增量,可避免对数据库运行性能的影响。对于复制数据源为非 数据库,其获取数据增量的 式由数据源的 制实现 (注:这些 复制机制自动维护 )。 图 制机制 源数据与目标数据间的复制转换 源数据与目标数据之间 ,往往存在着数据类型、格式、逻辑等不一致。为了使目标数据源能够读懂、接受复制数据源的数据,就必须进行复制转换。在复制过程中的常用转换方法有如下两种: 复制映射和添加计算列 : 复制映射主要指复制源和目标之间的列映射,可以用如下图所示的配置工具实现。鼠标拖拽产生的箭头指示源与目标列的对应关系。 “添加计算列”可以使用 复制源的某 列进行运算,产生一个计算列,该列的定义记录在复制控制表中,不影响源表。如下图紫色方框标注的两列:右侧的是目标列,其定义长度为 30 个字符;左侧的是对源表某列作 符串截取生成的计算列,截取前 30 个字符。此外常用的 有 数、 15 图:复制映射和添加计算列 两阶段复制:一致更改数据 作中间表 两阶段复制的优势在于能够获取数据增量及其类别,并结合多种数据转换方法。 两阶段复制中,首先由源表复制到一致更改数据 ,后者能够记录在源表上所有的更改操作的类型(插入、更新 及删除)和结果,从而捕获源表中所有的增量信息。第二阶段,开发者可以编写存储过程、或应用程序处理 中的数据,再采用复制方法使数据作用到最终目标表。 可配置、可管理的数据分发 数据分发主要指 过程,即将复制数据源的增量应用到复制目标。数据分发过程中的配置和管理,对复制的可靠性和可管理十分重要。 数据分发提供的配置选择包括:启动 /停止数据应用到目标表;选择连续复制方式或设置复制时间间隔等;提供自动数据分组、出错自动回滚等功能,处理传输过程中的异常处理,用户可配置发生网络或系统故障时的传输重试间隔 。 3)双层认证授权机制 I 的双层认证授权机制,充分保证异地数据访问下的数据安全。 16 户对数据的操作权限,取决于各个应用系统数据库向它开放的用户的授权,是且仅可能是后者的子集。通过开放不同权限的用户给限制通过 用户访问的数据内容和数据库操作(如插入、修改和删除),这样就保证了业务数据的安全性,不会出现超越业务授权的所谓超级用户,消除数据安全隐患。 三、 息集成技术的特点 局统 一的数据视图 按照 预想,信息集成基础构架必须为应用层提供对其所需访问数据的全局统一的数据视图,使应用对数据的访问不受数据格式、数据位置和访问接口差异的限制。对数据管理系统的发展不仅是要实现对单一数据库中存储的信息进行管理,而且还要能够提供对所有形式数据的增值性集成、对数据安排实施动态管理以满足可用性、实时性同时满足性能要求以及提供可继续减轻 员管理复杂数据体系结构负担的自主特色功能。为此, 订了一项代号为 计划,旨在应对客户对集成结构化、半结构化和非结构化数据 的需求。依靠在研究上的不断投资及在关系数据、 容管理、联邦、搜索和复制等领域所拥有的可靠的数据管理技术, 着手开发集成式基础构架(如下图所示)。 17 础构架凭借一系列程序设计模型、一套丰富的集成特色功能及与 整个业务集成框架的互操作性提供了灵活的访问方式。 活的访问方式 设想是通过行业标准接口提供对信息集成基础构架的灵活访问。客户应用访问信息可通过 络服务、本地客户机或异步客户机接口来实现。无论数据是 分布在何种数据库 ,文件或消息队列中 ,应用对数据的访问都如同是在对一个逻辑的数据库进行 . 它所支持的查询语言将包括: 结构化查询语言 (业界最成熟、功能最强大的查询语言,市场应用广泛; 关 据访问的新兴标准,万维网协会 (目前正在进行其标准化工作 是面向对象的应用程序编程接口,它支持内容管理生命周期,包括富文本和图像查询。 无论采用何种客户访问方式和查询语言,应用程序都应能够访问通过集成服务 18 器连接的所有数据。这种客 户访问和查询语言灵活性的组合使现有开发和分析工具能够通过集成服务器访问更广泛的数据 ,并直接利用集成服务器所提供的信息集成功能。它还使基础构架能够通过 应以服务为导向的体系结构,还可提供与工作流异步集成或轻松调度长耗时的查询任务,并能保护您在现有和新应用程序基础构架上的投资。 富的特色功能 利用 息集成基础构架可实现对各种分散于各处的实时数据的集成,就好像它们来自同一数据源。该基础构架具有联邦、搜索、高速缓存、转换和复制异构数据等重要的功能: 联邦 : 供业界领先的对相异数据源的联邦功能。联邦的概念是:用户可以像对待一个数据源那样对多个数据源实施查询和处理,同时保持数据源各自的独立性和完整性。视实施的具体情况,这些数据源可能是同构或异构数据源,也可能是集中或分散的数据源。 联邦引擎提供了下述功能: 透明度 :它具有屏蔽作用,可协助使用户在访问数据时 ,无法察觉底层数据源的差异、特质和实现方式,并使一组联邦数据源看上去就像是一个系统。 19 异构性 : 一如其名它具有联邦异构类型数据的功能,这些数据类型包括结构化数据(例如,关系 数据库)、半结构化数据(例如, 档)、非结构化数据(例如,自由格式文本)。 可扩展性 : 一种可将联邦能力扩展到几乎任何数据源的功能。可扩展性专为这一目的而设计,即最大程度降低集成新数据源的工作量,同时灵活地为优化查询访问提供必要的信息。 丰富的函数功能 : 包括通过支持的查询语言提供的函数、对后端数据源中所缺函数的补偿以及将数据源专用功能无缝嵌入到查询语言中的功能。 数据源自主性 : 即可将数据源联邦在一起,而对现有应用程序或系统没有或几乎没有影响。 性能优化 : 使联邦查询成为一种现实备选方案的性能特性 。凭借超过 25 年的研究和开发经验及专利的优化技术, 以事实证明,联邦是一个能够满足性能要求的可行方案。 搜索 : 基础构架将提供高级搜索和查询功能,包括网络爬行、文档索引建立、多搜索引擎搜索结果联邦、以实现智能访问为目标的文本文档分类和摘要信息建立以及语义理解。 2002 年, 建了“ 索和文本分析研究院”,以通过集成式体系结构统一并加速 高级搜索和挖掘功能上的研究和部署。研究成果将可为 息集成平台以及其它 案提供动力。 高速缓冲存储器 : 信息集成基础构架将支持在数据层级中的多个点放置和管理数据,以改善性能。这绝非是简单的高速缓存功能,而是基于策略的数据安排和管理。需要由一系列高速缓存策略才能向发出请求的应用程序提供足够的性能、实时性和可用性特性。 转换 : 基础构架必须提供丰富的转换特色功能,以便进行分析、交换和呈现。转换功能完成不同类型数据库 句的动态转换 (如数据类型及函数的匹配 )如存储过程和用户自定义函数 )的嵌入。 复制 : 作为信息集成基础构架的一个基本特征,复制功能不可 或缺。它是分布 20 式访问特色功能的有益补充,实现了对集中式数据存储器的管理,并为高效管理数据高速缓冲存储器提供了必需的基础构架。信息集成可实现异构关系型数据源之间的相互复制 . 支持多点对一点的数据集中模式和一点对多点的数据分发模式 . 包括初始的数据同步和增量的鉴别和同步 . 并提供对复制过程的监控 . 简化全面业务集成 : 如前所提及,信息集成只是整个业务集成基础构架的一部分。为支持业务的改良需求,此基础构架补充了强健的数据和内容存储器及附加集成技术,并采用了行业标准。 数据存储: 今提供业内领先的关系数据库 管理系统和内容管理系统,并在提供集成 持方面引领着行业的发展。除现有功能(基于关系数据库模型)外, 存还必须完整地包含和充分利用 据模型。 存设计有一个内置 册表,可以轻松管理大量 件。这些工件包括随 据数量和种类的增加而可能产生的 档、文档类型定义 (和 明文档等。 利用互补的集成技术: 开发企业集成基础构架的关键在于能否自如地组合利用或单独利用适用的集成技术。 续专注于信息集 成对“ 件集团”全线产品,特别是 务集成系列产品的集成,以提供一套全面的业务集成基础构架。 件平台为数据库及联邦数据库应用程序提供了一个开放、集成式的 术开发环境。同时, 在投入力量使其能够与 畅协作并实现集成。简言之, 集成式解决方案是业内覆盖领域最广、最完整的集成式解决方案。 支持行业标准: 续处于开发和采用行业标准的最前沿,为在不同开发商工具间实现广泛的互操作性提供 便利。 21 四、 息整合解决方案的优势 我们建议的 社保信息数据交换平台 解决方案具备以下几个关键的技术优势: 4 1 建立、地市级管理系统之间的信息交互 、地市级管理系统的信息交互,实际包含两方面的含义: 数据交换:实现、地市级级系统之间的数据交换,实现数据的物理迁移,数据由某个数据源传递到某个目标数据库中; 数据共享:为跨越社保管理现有的业务系统、各个合作机构的业务系统中所有相关数据,进行综合查询和分析提供数据集成访问支持; 4 2 利用异构数据透明访问技术实现数据共享 决方案的核心产品是 其中核心技术之一为联邦数据访问技术。如下图所示,通过采用 将数据交换平台各级业务管理系统中的各类数据源,通过联邦的方式映射到一个逻辑的数据库中。对所有数据的访问都通过 成,数据存储的异构性和不同数据库操作的异构性由 蔽。基于 实现异构平台的表级数据库的通用 作。 4 3 统一编程接口,简化应用编程 由于对所有数据的访问都通过 成,数据存储的异构性和不同数据库操作的异构性由 蔽。因此对于新的省级社保信息综合业务系统(如数据实时交换、综合查询、数据迁移等)的开发者来说,不必了解现有各种业务系统的数据库访问接口及编程方法,而只需熟练掌握 提供的一套编程访问接口就可以实现所有的应用开发工作。整个编程开发将非常简 便。 22 4 4 提供全局优化技术,保证系统整体性能 领先的基于成本的优化器 : 业界最早实现了基于成本的优化技术,优化器能够模拟采用不同方式从磁盘中查询数据所付出的代价,从而选用最佳查询方案。它在优化时考虑了度、磁盘 I/O 率、表格尺寸、有效访问路径,并且如果可能的话可以重写查询,以得到更高的性能。 优化器充分考虑了并行、大量并发用户、复杂查询等各种可能遇到的情况,使其能够运行于各种计算环境。通过调节相应参数,数据库管理员还可以根据数据库应用的具体类型方便地选择是否让优化器为此种应用做专门 的优化。 独特的查询重写技术 : 用户的每一个 句的处理过程于其它数据库有所不同:在经过语法分析和语义检查之后,先对用户的 句进行查询重写,再将重写后的查询 句送交优化器优化。 由于经过查询重写的 句可以最有效的被优化器优化,程序员可以专心于业务逻辑的实现,而不必过多地将精力放在了解数据库优化器工作原理以及关注 句的写法上,减少了应用程序不能正确实现业务逻辑的可能性。另一方面,查询重写技术还有助于消除经常见到的由于项目组中不同开发人员的水平差异导致的程序执行效率不同,或图 形界面动态生成 句繁琐、低效的现象。 在异构环境下优化技术同样适用: 使用 建一个异构分布式数据库环境后, 进的基于成本优化器仍然可以通过 挥作用,也就是说, 以将一个跨越多个业务系统的 句根据各个业务系统的实际状况进行成本估算、查询重写、最优查询路径模拟及确定。实现一个跨业务系统的全局优化。从而保证了整个系统的整体性能。 供一 个本地的数据存储支持,联邦服务引擎实现 分解和访问路径的优化,其主要原则为将对数据的操作尽量分发到分布式的数据源,在 邦服务引擎中统一考虑处理的成本,选择成本最低的路径。成本 23 优化依据保存在 的各类数据源的统计信息。 4 5 先进的 术,保证系统性能 置了先进的 术,可以支持用户建立物化查询表( 这个物化查询表可以跨越各个业务系统建立一个针对经常查询内容的预计算、预处理的结果集,使用 术存放起来,来提高使用到这些结果集的运算或查询操作的速度。 4 6 对 术的完美支持 我们知道 为数据交换的一个载体,将在未来的应用中占据越来越重要的位置,因此,在 对 强大的支持,以适应当前和未来的应用需要。 供了专用的 通过 持对 容基于 访问支持。即用户可以使用 接操作 本,将存放在各个业务系统中的数据组成一个 本输出,或者将一个 本依照 4 7 简化 术实现 为 构的倡导者和领导者,在自身的全部产品线中,都提供了全面的 持, 不例外,如下图所示,基于统一 数据服务平台,可大大简化复杂异构环境的 24 4 8 对 直接支持 在消息传输中间件市场的冠军产品,在很多涉及数据传输和数据交换平台建设中, Q 产品系列得到了广泛的应用,因此作为综合业务系统整合的数据管理产品,一定要具备与 直接访问和支持的能力。而在本建议方案中,供了对 MQ 直接访问能力。可将 Q 的队列,也可用 接访问 列,对应 用的整合提供了更好的灵活性。 4 9 结合各业务系统用户管理机制,支持建立跨业务应用的用户管 理机制 使用 以实现一个原有系统的用户及其权限对户权限的一个映射定义。即 的一个用户,也就是省级数据交换平台系统中的一个用户可以映射到下属各个业务系统中的某个或某几个用户上,由各个业务系统管理访问自身业务数据的所有用户及其授权,而省级数据交换平台的用户仅是这些数据的一个使用者, 其对数据的操作权限不能超越自身系统的授权机制,这样就保证了业务数据的安全性。不会出现超越业务授权的所谓超级用户,消除数据安全隐患。 25 4 10 开放性,支持多种主流平台 一个开放的系统,能够支持主流的 T 000 26 五、 置方案 方案中,我们通过先进的数据整合技术,实现一个逻辑集中、物理 分布与物理集中相配合的中心业务信息库,从而构建起一个数据交换平台,解决了数据的读写双向访问技术难点,在此之上可以定义跨越社保管理条块的业务流程和数据流程。是一个先进、合理、可实施的方案。 在方案中,数据中心部署 据整合平台,建立数据中心的业务数据中心,形成一个全局范围内的业务数据全集,首先可以满足对劳动与社保业务的分析要求,而且,在一定程度上满足了数据层面中心对市级单位数据的冗余,备份。 系统配置如下图所示: 27 根据各地的实际情况, 以考虑配置在 者 务器上,支撑整个信息集成的应用。如果在该级数据中心需要建立一个本地数据库系统来支撑类似统一单位库、统一人员库等标准化的数据存储,同时还考虑开展决策分析系统,那么可以使用 置的企业级数据库存储引擎支持建立一个本地的数据库系统。根据数据量的大小,配置合适的磁盘 阵列。同时我们建议购置磁带库及相应的企业级备份管理软件,配合 现数据的备份 /恢复工作。以保证整个系统运行的安全、可靠。 建议软件配置: 蒙古劳动厅数据中心 磁盘 阵列 I 据中心管理员 企业级数据备份系统 磁带库 社保信息系统主干网 市级社保业务应用 + 部里社保分析应用 28 29 附件 品简介 由于当前信息技术的飞速发展,各企业的业务环境日益复杂,各种业务数据不断的增加,使得企业中各种数据类型繁多,数据源也十分分散。用户越来越希望能够对整个企业不同数据源及数据类型的数据进行统一的相关联的管理。但是目前很多企业受各方面因素的约束,分散的且不同厂商的数据源很难复制或集中到单一的数据库上。因此,这就使用户越来越渴望能够获得一个可以整合企业中各个分布式的数据源以方便访问多样化数据的解决方案。在这种需求之下, 列产品,能够在整个企业范围内访问关系型、结构化和非结构化数据。它能提供 战略 上的 数据集成架构,以帮助用户去访问、处理以及整合异构的、分布式的实时数据。 括联邦数据服务器( 复制服务器( 用于整合异构的实时数据。联邦数据服务器( 用 工具(整合的开发环境、报表、分析工具)访问、整合及处理分布式的和异构的数据。该产 品主要适用于数据源为各类关系型数据库及其他如内容数据源。 心内容包括: 30 联邦数据服务器( 综述 联邦数据服务器是一种特殊类型的分布式数据库管理系统。一个联邦数据服务器包括一个作为服务器的 例,另外还可以有一个或多个不同的数据源对应不同厂商的关系型数据库,以及访问数据库和数据源的客户端(用户和应用)。利用联邦数据服务器,用户可以在一个 句中向不同的数据源发送分布式请求,从而实现 集成异构数据库的功能。 邦数据服务器的强大性在于: 联合本地表和远程数据源,就象所有的数据都在本地一样操作。 利用数据源的处理功能,向数据源发送分布式请求。 在一个联邦数据服务器上处理分布式请求的各个部分,弥补数据源上的 联邦数据服务器支持的数据源包括: 关系型数据库: 以及 据源。 非关系型数据源: Q 件, 档, 录,和 够访问的数据源。 供访问多个数据存储,包括 比如 关系型数据库 ( 超过 18 个搜索网站。 一个开发工具箱,提供开发访问其它的数据源。 应用程序能够查询或检索整合后的数据源就象它们在单一的数据库上 31 查询操作使用标准 联邦数据服务器使用基于成本的分布式查询优化器选择最佳的访问路径以获取更好的查询性能。 用户可以在联邦数据服务器上定义数据缓存以提高查询效率。 应用程序能够访问传统数据库或 用客户端 针对异构关系型 数据库的复制服务器( I 客户可以在异构关系型数据资源之间复制数据 是可以作为复制源或复制目标; 以作为复制目标。 用户可以配置一个多样性的拓扑环境 复制服务器支持分布式(从一个数据库到多个数据库的数据迁移)和集中式(从多个数据库到一个数据库的数据迁移) 数据迁移可以同时使用标准的 达式或存储过程 数据迁移可以定时的自动执行,或在一定的时间间隔执行, 或连续执行,或者由事件触发执行 持的平台有 T 000
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 财经资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!