省级电子政务云平台数据交换共享平台方案

上传人:机械****计 文档编号:583200 上传时间:2019-06-21 格式:DOCX 页数:75 大小:3.16MB
返回 下载 相关 举报
省级电子政务云平台数据交换共享平台方案_第1页
第1页 / 共75页
省级电子政务云平台数据交换共享平台方案_第2页
第2页 / 共75页
省级电子政务云平台数据交换共享平台方案_第3页
第3页 / 共75页
点击查看更多>>
资源描述
省级电子政务云平台数据交换共享平台方案目录第 1 章 政务云项目背景及需求分析 11.1 建设目标 .11.2 建设范围 .11.3 建设任务 .2第 2 章 政务数据交换和共享平台建设方案 42.1 概述 42.2 总体架构设计 52.3 设计原则 .52.3.1 大数据融合扩展设计考量 .52.3.2 云平台环境适配支持 82.3.3 多层次备份能力 .92.3.4 可扩展能力 .92.3.5 负载均衡能力 .92.3.6 模块灵活配置 .102.3.7 运行监控 102.3.8 数据处理与安全高效传输 .102.3.9 不存在单点故障 .102.4 政务资源管理平台设计方案 112.4.1 概述 .112.4.2 政务资源管理平台需求分析 .112.4.3 政务资源管理平台结构设计 .132.4.4 政务资源管理平台系统设计 .142.5 政务信息资源交换平台设计方案 .262.5.1 概述 .262.5.2 政务信息资源交换平台需求分析 272.5.3 政务信息资源交换平台结构设计 282.5.4 政务信息资源交换平台系统设计 352.6 政务数据交换共享平台实施内容设计 472.6.1 基础信息资源库完善建设 .472.6.2 主题信息资源库建设 522.7 安全设计 .592.8 后期扩展设计 602.9 政务数据交换共享平台实施部署方案 662.10 平台部署方案 662.10.1 系统硬件环境 .662.10.2 系统软件架构 .682.10.3 软硬件配置建议 .691第 1 章 政务云项目背景及需求分析1.1 建设目标以国务院办公厅关于促进电子政务协调发展的指导意见为指导,统筹推进湖南省电子政务基础设施提升、电子政务业务系统协同发展、信息资源共享共用和数据开放利用;按照湘府阅201553 号文件要求,以资源整合、集约建设、稳步推进为原则,建成安全可靠、统一高效、国内领先的云计算平台并开展示范应用,为全省各级部门提供弹性的云计算和云存储能力、政务外网承载服务与应用能力,基本满足省直部门“十三五”期间非涉密业务的统一网络、计算资源、存储资源、数据库服务、备份服务、安全服务等需求,提升政府效能,促进政府管理创新,达到简政、兴业、惠民的目标。1.2 建设范围省级电子政务外网主要满足各级政府部门社会管理、公共服务等方 面的需求,为各省直部门的非涉密电子政务业务提供承载服务。本次建设省级电子政务外网统一云平台,总体框架为“1+2+N” , 即“1 网、2 中心、N 多应用云” ,省本级政务大数据中心,初步形成 “8+3+5”的基本框架。具体业务目标主要包括:“一个网络”优化升级电子政务外网平台,满足省直部门间以及省 到市、市到县网络传输和承载的需求;“两个中心”建设云计算中心、大数据中心,满足省直部门十三五期间非涉密业务需求,为政府领导提供科学、合理的决策支持。“N 朵应用云”建设基于云平台的 N 个全省性应用系统,包括政务 服务、政务管理、政务行业、政务决策和政务办公等领域。“8 大基础数据库、主题数据库”完成人口、法人、宏观、地理空间、2政务服务信息、工商企业、信用信息、电子证照等 8 大基础数据库、主题数据库的建设、迁移、备份共享;“3 大平台”完成大数据智能分析平台、数据交换和共享平台、数据开放平台 3 大平台;“5 大示范工程”完成全省旅游大数据分析、12345 服务平台、区域经济脸谱大数据分析、湖南省互联网产业发展状况分析、湖南省政府网站群智能监测分析 5 大示范工程;建设建设统一的安全体系;建设统一运维管理机制;设计迁移策略,完成部分系统的迁移;明确云平台建设、管理、运营模式,节约投资,提升服务质量。1.3 建设任务充分考虑省级电子政务外网统一云平台计算、存储资源需求的阶段性和应用系统建设的复杂性,为了保证投资的有效使用,采用分期建设的原则。(一) 第一期2016 年1完成湖南省电子政务外网的升级改造;2建设 40%的计算、存储资源;3启动大数据中心建设;4启动 N 朵云建设。(二) 第二期2017 年1建设 60%的计算、存储资源;2完成灾备中心建设;3完成大数据中心建设;4完成 N 朵应用云的部分建设。(三) 第三期2018 年-2020 年1全面完成 N 应用朵云建设。其中,本期云平台基础设施部分的建设任务具体包括以下:3完成湖南省电子政务外网升级改造(含安全平台) ;建设主数据中心、同城双活数据中心 40%的计算、存储资源,数据交换和共享平台;建设政府协同办公平台、政务安全邮箱;提供省政府门户网站群五年的运维服务;提供统一的运维管理服务(五年) ,确保本期建设的政务外网、安全体系、云计算中心安全稳定运行。4第 2 章 政务数据交换和共享平台建设方案2.1 概述本项目建设的政务数据交换和共享平台是湖南省政务电子政务,基于分布式消息管道与分布式服务调用技术进行建设,能够使湖南省公共服务平台实现深度的数据共享、广泛的业务协同及敏捷的业务提供,可以提高各部门之间的数据交换共享的运行效率,通过数据的采集桥接、交换传输、落地转换、资源归集等服务完成数据跨部门跨区域之间的交换共享与公共基础数据集的归集整理,从而改善公共服务、加强社会管理、强化综合监管、完善宏观调控、建设服务型政府。52.2 总体架构设计基 础 资 源业 务 应 用 系 统网 络 资 源 硬 件 资 源 操 作 系 统 业 务 数 据 库XXX资 源 门 户 XXX政 府 网 站 XXX应 用 系 统 XXX服 务 系 统政务数据资源共享平台统 一 资 源 管 理运 行 中 心 统 一 标 准 规 范体 系安 全 体 系资 源 分 类 与 管 理 (ARC)资 源 交 换 与 共 享 (ADXP)资 源 接 入 与 处 理 (AETL)业 务 桥 接 清 洗 转 换 数 据 标 准 化数 据 交 换 数 据 共 享 监 控 管 理数 据 分 类 数 据 管 理 数 据 服 务 统 一 监 控安 全 审 计安 全 认 证容 灾 备 份通 道 安 全提供服务企 业 团 体 公 众 政 府 机 构 行 业2.3 设计原则2.3.1 大数据融合扩展设计考量金蝶天燕数据系列产品支持与大数据的融合。可视乎客户需要与数据规模可以支持传统关系型数据库,也支持以大数据存储归集数据以降低存储成本,提高归集数据资源的检索统计速度。6大数据存储需要涵盖的数据类型主要有三类:结构化数据、非结构化数据和半结构化数据。结构化数据是指有数据结构描述信息的数据,结构化数据通常情况是先有数据结构、再有数据填充,典型的结构化数据包括各类表格数据。非结构化数据是不方便用固定结构来表现的数据,非结构化数据一般只有数据填充而没有数据结构,典型的非结构化数据包括各种图形、图像、音频、视频信息。半结构化数据是指那些结构隐含或无规则、不严谨的自我描述型数据,介于严格结构化数据(如关系数据库和对象数据库中的数据)和完全无结构的数据(如声音、图像文件) 之间,典型的半结构化数据包括 XML 文档,它一般是自描述的,数据的结构和内容混在一起。数据库是存储结构化数据通常采用的软件系统,从技术上数据库可以分为关系型数据库和非关系型数据库两类,在解决大数据存储问题时“非关系型”数据库技术是必不可少的,但是关系型数据库也是不可或缺的。数据存储包括关系型数据存储及非关系型数据存储,关系型数据存储采用传统关系型数据库,非关系型数据存储采用 MongoDB,根据采集到数据的类型,由数据库引擎统一处理。对于政务数据交换管理平台配置信息、权限数据、交换流程业务信息等基本信息数据,更新操作可能会较为频繁,且数据量不大,采用传统关系型数据库进行存储。对于归集公共基础数据资源如自然人库等因为数据量庞大,具有一次写入多次读取特点,我们也可支持采用非关系型数据库技术进行存储。对于资源运行时信息,数据量较为庞大,具有一次写入多次读取的特点,宜采用 NoSQL 存储。1各类型 NoSQL 数据库比较:类型 键值数据库 图存数据库 列存数据库 文档数据库相关产品Tokyo、Cabinet/Tyrant、Redis、Voldemort、Berkeley DBNeo4J、InfoGrid、Infinite GraphCassandra、HBase、RiakCouchDB、MongoDB数据 一系列键值对。 图结构。 以列簇式存储, 一系列键值对。7模型 将同一列数据存在一起。典型应用内容缓存,适合混合工作负载并扩展大的数据集。社交网络,推荐系统等。专注于构建关系图谱。分布式的文件系统。Web 应用。优势快速查询。 利用图结构相关算法。查找速度快,可扩展性强,更容易进行分布式扩展。数据结构要求不严格。劣势存储的数据缺少结构化。需要对整个图做计算才能得出结果,不容易做分布式的集群方案。功能相对局限。 查询性能不高,而且缺乏统一的查询语法。键值数据库存储的数据缺少结构化,图存数据库不用考虑。如果是列存数据库,则选用 HBase,其属于 Hadoop 子项目,基于 HDFS,方便与 Hadoop 集成。如果是文档数据库,则选用 MongoDB,因其查询比较灵活,而 CouchDB不支持动态查询,必须为每一个查询模式建立相应的 view,并在此 view 的基础上进行查询。2HBase 与 MongoDB 比较名称 HBase MongoDB类型 列存数据库 文档数据库存储位置 每个列族保存在单独的 hdfs文件。 整个数据都存在磁盘中。存放顺序 基于字典序。 按插入顺序。二级索引 不支持。 支持。集合查找只三种查找:通过单个 row key 访问,通过 row key 的range,全表扫描。正则查找,范围查找,支持skip 和 limit 等等,是最像mysql 的 nosql 数据库。更新方式 另一版本保存下来。默认历史数量为 3。 原地更新。删除方式 先标记,insert 新数据时分配合适的已删除记录空间。 先标记,读取时再删除。MapReduce基于 Hadoop,强大。 不够强大,如不使用 MongoDB分片,则实际不是并行执行。可通过 Mongo-Hadoop 的数据中间件与 Hadoop 集成。8读写效率 默认适合写多读少,可配置。 读效率比写高。从索引、查找功能来说,HBase 比较单一,由于不支持二级索引,某些特殊查询需要全表扫描,效率会很慢。从 MapReduce 方面来说,HBase 可以与 Hadoop 完美配合,较 MongoDB方便很多。从应用场景来看,HBase 比较适合于拥有超大规模数据的企业,一般企业的大数据应用只需要 MongoDB 即可。综上所述,本平台建设可考虑采用 MongDB 做为非关系型数据的存储数据库。MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似 json 的 bson 格式,因此可以存储比较复杂的数据类型。MongoDB 最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。2.3.2 云平台环境适配支持1、云平台内的信息资源交换湖南省各部门系统统一迁移到云平台后,由于处于统一云平台环境且处于统一网络环境下,不存在跨网络和跨节点层级的情况。所以各应用间的数据交换与共享应可采用 ETL 的方式直接桥接,也可按原部门分别(逻辑隔离)建立前置机,先统一到部门前置机,再到中央节点,反之亦然。ETL 工具应具备如下技术要求: 应具备复杂数据的转换与清洗能力。 应支持与多种类型的数据源及数据格式对接的能力。 应具备图形化界面的能力,具备丰富的数据计算和处理的组件。 应具备字段级、行级数据的处理能力。 应具备从流程开发到项目运维的各种功能。92、云平台外的信息资源交换统一云平台外的系统与数据交换平台可采用前置机的方式进行对接和实施。要求各部门的应用系统将交换共享的数据统一推送到前置机的数据库中。同时在部门前置机上部署交换平台节点端,在省云平台中部署交换平台的中心端 。由前置机的交换平台抽取数据并与云平台中的交换平台完成整个数据的交换。交换平台的技术要求如下: 应具备多种数据抽取模式 应具备可视化管理界面,管理端应采用 B/S 模式。 应具备一定的数据转换能力。 应具备与主流数据库对接能力。 应具备安全可靠的数据传输能力。2.3.3 多层次备份能力交换共享平台具备组件、服务、系统等多层次备份和恢复能力,实现对平台中各个模块和应用软硬件环境的统一管理;对中央节点、政务资源管理平台(ARC)均可提供负载均衡机制;对前置机节点也可进行热备支持。2.3.4 可扩展能力根据平台所接入应用、服务、数据的变化,平台具备扩展能力,并且所提供的扩展方式不影响平台工作效率。 平台应提供中央节点的水平扩展能力,也可提供前置节点的扩展能力以支撑部门调整或区域调整所需,此外当面临业务扩展和业务量的增加,平台均可支撑节点的扩展能力并且节点数量不受限制。平台提供多种接口能力,能够与第三方系统或平台进行对接,实现业务或平台的对外扩展。平台提供数据处理组件的扩展能力,能够根据业务的变化和数据处理的复杂程度,对数据处理组件进行定制扩展,同时并不影响平台的正常使用。102.3.5 负载均衡能力根据平台中各模块的负载程度,平台能够自动进行负载均衡管理。同时平台提供接口,能够与第三方负载均衡设备进行对接,完成平台的负载均衡部署。2.3.6 模块灵活配置 平台中的各个模块可运行在不同环境中,通过配置能够使平台适应不同部门对平台的需求。 根据业务模式,平台之间能够实现元数据、目录、应用各类信息的互联互通。 平台的配置可动态改变。 平台具备多种数据处理组件,能够具备数据交换的常用组件,并且以图形化拖拽形式进行配置,不需要人工编码。2.3.7 运行监控平台提供运行监控的人机界面,对服务组件进行远程管理和监控。 提供多种监控手段,能够对平台的节点进行监控和管理,能够监控交换平台的服务器运行指标情况。同时具备多维度的数据统计管理,如按照交换流程维度、按照节点维度等进行统计,同时具备图表和列表展示的能力。2.3.8 数据处理与安全高效传输平台具备多种数据抽取能力,常规的功能包括触发器模式数据抽取、时间戳模式的数据抽取、全量模式的数据抽取、标识位模式的数据抽取等。平台应提供多种数据处理组件,能够支持对数据进行处理和计算。支持以图形化拖拽方式进行流程的配置,无需人工编码,简化流程配置步骤,提高效率。平台提供安全可靠的数据传输能力且支持国密算法,具备安全的传输通道与加密通道。保障数据在传输过程中的安全、稳定、可靠。平台提供高效的数据传输能力,平台采用优化的分布式消息机制与优化的11加密压缩算法进行数据传输高效保障。2.3.9 不存在单点故障平台由多台服务器共同支撑,同时用于复合的业务流程中,因此需要对单点故障进行管理,实现故障切换,金蝶数据资源交换共享平台既支持中央节点高可用集群配置,以确保平台的高可靠性运行及交换传输过程数据不丢。2.4 政务资源管理平台设计方案2.4.1 概述随着政府信息化建设的数字化、网络化信息的生产速度不断加快,信息资源总量的急剧膨胀,面对大量且分散的信息资源,建设基于网络的、以跨部门的信息整合为特征的、可供管委会领导和各处室工作人员等快速定位、检索和获取的信息系统,使各级信息的使用者在各自的权限内获取全面、准确的信息,是深化发展的重要内容。而信息资源目录是实现该项目的必要基础支撑。信息资源目录作为统一数据底库和全局共享数据库的信息资源的管理和服务中心,按照统一的标准规范和树状结构实现对信息资源的采集、分类、描述、处理、展现、应用和管理,为信息资源的共享和交换提供基础性支撑,实现对信息资源的识别、导航和定位服务,从而更加有效管理、利用和合理开发信息资源,提高工作效率、提升服务水平提供科学的工具。2.4.2 政务资源管理平台需求分析政务资源管理平台包括信息库系统和目录内容服务系统。信息库系统由政务部门的共享信息库、目录内容信息库和目录服务中心的目录内容管理信息库、服务信息库组成。目录内容服务系统由共享信息服务系统、编目系统、目录传输系统、目录管理系统、目录服务系统组成。需满足以下要求:目录管理子系统实现对政务资源管理平台的全部操作,主要用来管理信息资源目录,信息资源目录对信息资源进行编目形成核心元数据,注册到整合资源数据库中,生成数据资源目录。使用者可通过目录服务对数据信息资源进行12目录查询。目录管理子系统包括:信息资源元数据管理,元数据编目、注册、发布;目录管理,目录分类、管理维护;目录服务,目录导航、检索、展现等。遵照国家政务信息资源目录体系 ,采用成熟的软件产品和工具,在国家政务外网目录体系框架要求下建设湖南政务信息资源目录体系技术框架。(1)遵循的关键性标准目录体系框架所遵循的关键性标准包括以下:元数据编辑器按照政务信息资源目录体系第 3 部分:核心元数据 、 政务信息资源目录体系第 4 部分:政务信息资源分类 、 政务信息资源目录体系第 5 部分:标识符编码方案的标准规定实现政务信息资源元数据的编目,并对所采集的元数据的标准符合性进行形式化检查,未通过标准符合性检查的元数据不能向目录服务中心的元数据库或者本地的元数据库进行注册。元数据服务器、元数据网关按照政务信息资源目录体系第 2 部分:技术要求中对数据资源目录接口和交换服务目录接口的规定进行实现,并对外界系统用户提供系统查询服务。查询系统按照政务信息资源目录体系第 4 部分:政务信息资源分类进行网页系统的开发。(2)建设思路本次建设将视具体情况选择特定部门的信息资源为基础,建设信息资源目录体系的技术框架,实现相关政务信息资源的编目,目录内容的注册、管理、发布、查询等功能,以提供各部门间资源共享为目标,形成“资源逻辑集中,物理分散”的共享格局,建立政务信息资源的共享和开发利用的基本服务模式。(3)基本功能依据国家政务信息目录体系标准,目录体系框架的基本功能包括元数据编目、注册、发布、查询和维护等主要功能。1)政务信息资源编目:目录体系框架要遵循国家电子政务核心元数据标准和信息资源分类标准,实现对各个部门的政务信息资源进行编目,采集出元数据信息。132)元数据注册和目录服务注册:元数据注册是指各部门共享发布的元数据或元数据服务在目录中心登记。3)元数据发布:存储和审核待发布的元数据、发布元数据。4)目录查询:在湖南外网目录服务中心,建立基于 Web 的目录查询系统,方便使用者通过该人机交互界面查询目录内容,发现和定位节点的共享政务信息资源。5)目录维护:在湖南外网目录服务中心,提供针对元数据、目录树的基本的管理、维护操作。包含必须具有的基本功能要求和选择实现的可选功能要求。(4)安全要求:目录体系框架中的政务信息资源元数据,都是面向国家电子政务外网用户完全公开的,因此,各种政务信息资源目录也是公开的,外网用户都可以访问目录。政务信息资源元数据的注册、审核、管理的用户管理功能,需要使用国家电子政务外网统一的用户认证与授权管理系统。(5)元数据建库标准:政务信息资源核心元数据库基于关系数据库系统建设,可以选择 Oracle、SQLServer 等主流关系型数据库管理系统,并利用标准的 SQL 进行连接。(6)政务信息资源目录应用系统:目录体系框架需要有统一的查询界面,向用户提供相应的政务信息资源目录,并提供政务信息资源目录的管理。目录应用系统在综合门户网站设有专门的栏目,并且风格和整个网站保持一致。目录应用子系统基于元数据网关,使用 B/S 结构,向外网用户提供基于元数据的目录查询服务,并提供针对目录框架的管理功能。对当用户在查询系统中选择相应的目录或输入查询关键词时,元数据应用系统访问元数据网关,元数据网关检索节点的元数据,最终返回查询结果,查询系统将查询结果显示在相应的结果页面上。2.4.3 政务资源管理平台结构设计金蝶通过对目录体系国家标准的研究分析,提出目录体系的实现架构模型,该模型按照国家标准的要求,依托电子政务网络,建立的政务信息资源目录体14系技术支撑环境即金蝶 APUSIC 资源目录管理系统,由信息库系统和目录内容服务系统组成。信息库系统由部门共享信息库、部门目录内容信息库、目录中心目录内容管理信息库和服务信息库等组成。目录内容服务系统由编目子系统、报送子系统、管理子系统、服务子系统、查询子系统等组成。通过目录体系技术支撑环境,形成目录内容的提供与服务链;通过目录内容服务,依托电子政务网络实现信息的发现、定位和共享。2.4.3.1 目录编目子系统编目子系统是对共享信息资源元数据进行赋值、标准符合性检查、分类和输出的元数据操作工具。编目子系统采集共享信息库的内容,包括数据集和各类电子文件,并按照元数据标准、分类标准和赋码标准对信息资源进行著录、分类和赋码,形成信息资源元数据;存储元数据到目录内容信息库;将著录完成的元数据发送到目录中心。2.4.3.2 目录报送子系统传送子系统实现目录内容在目录内容库与目录中心目录管理信息库之间的传送,包括数据包生成、消息总线、传输状态监控和目录内容存储等功能。2.4.3.3 目录传输子系统目录传输子系统实现部门信息资源目录向省级目录中心目录汇总,以定期、不定期和自动/人工等方式进行传输。2.4.3.4 目录管理子系统目录管理子系统完成对元数据的审核以及目录信息库的管理。应提供元数据审核、信息资源标识符码段管理与生成、分类信息管理功能,应提供对目录管理信息库和目录服务信息库的基本维护和管理功能。2.4.3.5 目录服务子系统目录服务子系统实现信息资源元数据的发布和检索。提供目录服务接口和15信息检索功能,实现对查询请求信息的解析、元数据的快速查询和查询结果的提交。查询系统实现基于网络的目录内容查询系统,使用者通过人机交互界面查询目录内容,发现和定位共享政务信息资源。查询系统应提供多种方式实现对目录内容的查询和展现。按照目录服务接口要求形成并提交查询请求,以及信息查询和信息查询结构展现界面。2.4.4 政务资源管理平台系统设计2.4.4.1 信息资源目录子系统信息资源目录子系统的建设,按照统一的标准规范,将分散在各子平台的信息资源进行整合和组织,形成逻辑上集中、物理上分散、可统一管理和服务的信息资源目录,实现资源的共享,是公共基础平台实现数据资源共享的有效手段。使用目录体系可以以更灵活的方式实现更多应用,更多资源的接入与共享。2.4.4.1.1 信息资源目录体系框架本项目建设涉及的各类信息资源纷繁复杂,信息资源来源多样且信息资源互相之前存在复杂的相互联系。因此在信息资源目录体系建设过程中需对规范数据格式、数据内容的各类标准进行统一规划一保证信息资源目录体系的建设的合理性、科学性和可扩充性。信息资源目录体系建设的总体思路和流程如下图所示:16信息资源分析指标和编码体系 信息资源目录体系资 产 管 理 人 事 管 理 运 营 管 理 企 业 监 管 政 策 法 规 其 它 资 料产 权管 理 资 产统 计管 理 财 务管 理 绩 效考 核管 理 干 部人 员管 理 经 济运 行管 理 重 组与 规划 投资 管理 纪 检监 察信 息 法 律法 规 会 议文 献 世 界50强 企业 信息 民 用航 空企 业补 充指 标企 业 基 本 情况 数 据 库 企 业 绩 效 评价 数 据 库 企 业 人 员 管理 数 据 库企 业 财 务 数据 库 其 它 业 务 数据 库企 业 重 组 与 规划 投 资 数 据 库 纪 检 监 察 数据 库 政 策 法 规 文件 数 据 库国 有 产 权 数据 库 资 产 统 计 数据 库. .国 资 监 管 信 息 资 源 目 录 体 系元数据规划信息资源分类和编码体系XX.分 类 码 流 水 码X前 段 码 +/后 段 码 ZDC0国 资 监 管 资 源 分 类 规 划 中 的 后 段 码若 干 位 国 资 监 管 资 源 分 类 扩 展 码分 隔 符 “/”4位 阿 拉 伯 数 字 流 水 码描述描述描述1 0 大基础数据库. . .数 据 采 集 和交 换其 它 非 结构 化 资 源国 资 委现 有 资 源地 方 国 资委 资 源中 央 企 业信 息 资 源数据交换标准描述 1 2 大主题数据库元数据库多 维 分 析报 表 分 析规划阶段实施阶段信息资源目录体系框架如上图所示,信息资源目录体系建设流程如下:1对信息资源进行总体分析,从信息资源的来源、形态和内在的业务含义对本工程信息资源进行整体分析,从而确定信息指标代码体系、信息资源分类和编码体系以及确定元数据规划框架。2在信息资源综合分析的基础上确定指标体系和指标编码体系,以确定从那些数据来源中采集哪些数据以及数据的格式和内容等以确保数据采集的规范性和一致性,同时在指标体系的基础上制定数据交换标准,确定数据采集后进行交换时的封装格式,保障数据能被中心识别。3在信息资源综合分析的基础上确定数据的业务主题分类并制定编码规范,保证数据在通过资源目录体系进行浏览时的唯一性。然后再分类标准的基础上结合应用系统建设情况,对信息资源分类进行进一步的细化,对信息资源的目录体系进行整体规划。4在信息资源各类规划过程中,始终贯彻着元数据规划,使用元数据对系统中的各类数据元、指标、信息资源目录、使用的技术等进行描述,最终指导数据中心元数据库的建设。172.4.4.1.2 信息资源目录体系建设任务信息资源目录体系中涉及的角色主要包括:信息资源目录的使用者、信息资源目录的子管理员、信息资源目录的系统管理员。信息资源目录服务主要面向应用于业务人员信息查询、信息发布与外部系统的交互。相应的用户作为信息资源目录的使用者,可以结合自身的业务需求查找和定位相应的数据信息。因此要求目录服务系统提供相应的查找、浏览、操作、建立个性化的目录关联功能。信息资源目录的子管理员,主要则从业务管理的角度出发,对信息资源目录作集中统一的管理维护工作包括:统一管理其业务范围内的信息资源目录使用者,结合不同业务人员的需求对进行目录权限的分配,对目录资源进行发布管理。信息资源目录的系统管理员负责目录服务系统的各种功能维护与技术支持。2.4.4.1.3 信息资源目录分类设计根据信息资源分类要求,顶层通过以下四个面来分类分类采用从顶层通过以下四个面来分类,如下图所示:18元数据服 务 分 类行 业 分 类主 题 分 类资 源 形 态 分 类内 容特 征外 部特 征用 户实 施人 员资源分类图对于信息资源分类,顶层通过以下四个面来分类:(1)基础面。信息资源本身具有特定的含义,根据含义主题的不同,对政务信息资源进行分类。(2)行业面。信息资源的生产具有特定的部门或行业背景,根据部门或行业的不同,对政务信息资源进行分类。(3)服务面。信息资源可以为使用者提供特定的服务。根据提供服务的不同,因此可以根据政务信息的表现形态,对信息资源进行分类。根据以上四个面对信息资源进行分类,相应地产生了主题分类、行业分类、服务分类和资源形态分类四种分类。其中,主题分类是核心,是信息资源的基础性分类。行业分类、服务分类和资源形态分类为辅助性分类。信息资源的主题分类体现了其内容的属性或特征;信息资源的行业分类体现了政务部门职能的特点;信息资源的服务分类体现了政务信息资源面向用户提供的功能服务的划分;信息资源形态分类体现了信息的存在形式。192.4.4.2 信息资源编目管理子系统信息资源编目管理子系统作为公共基础平台信息资源目录体系的载体,采用一种非落地的信息共享模式,是对交换共享模式的补充,在目录式共享中,各子平台对各自共享的资源有完整的控制权,可有效地解决交换模式中各子平台因担心违反相关规定不愿意批量提供数据的问题。2.4.4.2.1 设计思路信息资源目录建设包括以下几个部分:1、首先需要制定数据编码体系以及编码体系的管理和维护规则,即编码管理办法;2、在数据编码体系基础上形成信息资源目录;3、在这个过程中,通过目录管理服务对数据标准体系进行管理维护,提供以下工具用于维护编码数据标准体系:(1)编码体系管理维护工具;(2)基础指标维护管理工具;(3)数据目录管理维护工具;2.4.4.2.2 编码体系和管理办法2.4.4.2.2.1 基础编码体系通过构建基础编码(包括统计指标)管理体系,实现基础编码和统计指标的规范管理,形成对行业应用和数据交换的支撑,为系统集成、资源整合、信息共享提供基础。整个编码字典可以支持多级管理体系,能够统一制定编码字典模版,建立行业统一编码,管理编码的标准,确定各类基础编码、指标的编码,对需要统一管理的编码进行维护及发布更新。同时,能够按照一个编码对应唯一含义的原则,编码字典只许增加,不许删除。对于长期作废的编码可以通过激活方式确定编码是否可用。202.4.4.2.2.2 编码组织规则基础编码信息包含以下内容:1、行业级编码对应工业和信息化部电信研究院制定的各类编码。2、简码是为了在录入和选择时更方便的操作而设定的编码,作为提高工作效率的码,由各应用系统的用户各自维护。3、内部码为“信息资源目录”编码管理系统内部使用的编码, 内部编码必须具有唯一性。编码规则采取线分类法,将分类对象(即被划分的事物或概念)按所选定的若干个属性或特征逐次地分成相应的若干个层级的类目,并排成一个有层次的,逐渐展开的分类体系。在这个分类体系中,被划分的类目称为上位类,划分出的类目称为下位类,由一个类目直接划分出来的下一级各类目,彼此称为同位类。同位类类目之间存在着并列关系,下位类与上位类类目之间存在着隶属关系。4、中文名称:对编码的中文描述。5、中文全拼:对编码的中文拼音描述。6、英文名称:对编码的英文描述。7、树叶判别:是系统内部的一个识别码,前面说过编码字典采用的是树状结构,树支和树叶就是通过树叶判别来实现的。8、级次名称:通过级次名称可以更快的确定一个编码相对应的级别。9、显示序号:是一个排列顺序。用来在树中显示某个编码的显示顺序,但是内在编码顺序不会改变的。10、是否激活标志:确认编码是否激活,在统计、查询中是否作为可用指标的标志。2.4.4.2.2.3 编码中心建立建立编码中心,实现行业基础编码的统一管理,并通过基础编码的统一,形成对各应用系统的数据交换的支撑,为系统集成、资源整合、信息共享提供基础。212.4.4.2.2.4 编码管理规则1、多级编码维护对编码进行多级管理。由工业和信息化部电信研究院统一制定编码规则、维护权限和编码管理流程,并对行业公用的编码和指标进行维护;下级单位在统一的编码规则下,对本地编码进行维护。2、管理流程在多级编码体系下,工业和信息化部电信研究院通过权限控制实现对全系统的编码进行管理,只有工业和信息化部电信研究院为下级单位分配了可操作权限,下级单位才能对编码进行维护,否则只能读取和使用编码。 获得操作权限的下级单位,可以维护权限范围内的编码。没有获得操作权限的下级单位,只能查询和使用编码,不能维护。如果没有维护权限,或者由上级维护的编码不存在,需要增加时,可以向上级药监组织提出编码申请,经上级审核同意后进行添加,并下发给下级组织,下级组织才可以使用。2.4.4.2.3 元数据设计2.4.4.2.3.1 元数据分类元数据是描述数据库内数据的结构和建立方法的数据,重要的元数据包括数据源结构、目标数据库结构、数据转换规则等。共享数据库建设中,可将其按用途的不同分为三类,技术元数据、业务元数据和操作元数据。技术元数据是数据库的设计和管理人员用于开发和日常管理数据库使用的数据。包括:1、数据 源信息:如名称、类型、含义、单位等;2、对象和数据结构的定义(相当于数据字典):包括表和视图的个数以及名称;表或者视图中列的个数以及每一列的名称、数据类型、长度、精度、描述等;表上定义的约束;表上定义的索引以及主键/外键的信息。3、数据备份历史记录。 4、信息发布历史记录等。业务元数据从共享信息资源建设的业务应用的角度描述了共享数据库中的数据。主要包括数据集描述、指标信息、代码信息、映射规则等。操作元数据描述数据库的维护及数据更新策略,包括数据库数据刷新频度、22用户访问权限、备份和恢复的规则、存储管理规则、数据导入导出的历史记录、数据库状态管理和数据库审计。2.4.4.2.3.2 业务元数据应根据行业信息总体元数据标准进行元数据提取和著录,形成各共享数据集的元数据应用方案。经过整理,相关的数据集元数据如下表:名称/角色名称(中文)名称/角色名称(英文) 定义 约束/条件 最大出现次数数据类型数据集名称 title 已知的引用数据集名称M 1 字符串数据集出版日期date of publication 数据集的出版日期 M 1 日期型数据集摘要 abstract 数据集内容的简单说明M 1 字符串数据集负责方 pointOfContact 负责数据集的人或单位的名称和地址信息M N 复合型数据格式信息 Data Format Info 数据格式的基本信息O N 复合型数据格式名称 name 数据传送格式名称 M 1 字符串数据格式版本 version 数据格式版本(日期、版本号等)M 1 字符串关键字说明 descripriveKeywords 关键字种类、类型和参考资料M N 复合型关键字 keyword 用于描述主题的通用词、形式化词或短语M N 字符串词典名称 thesaurusName 正式注册的词典名,或类似的权威关键字资料名称O 1 字符串空间范围 spatial domain 数据集涉及的空间范围O 1 字符串时间范围 time period 数据集内容跨越的时间段O 1 起始时间 beginning date 数据集内容跨越的时间段的起始时间M 1 日期型结束时间 ending date 数据集内容跨越的时间段的结束时间M 1 日期型23数据集使用限制useConstraints 为保护隐私权或知识产权,对使用数据集施加的限制和约束O 1 字符串数据集安全限制分级classification 对数据集处理的限制的名称M 1 字符串数据集语种 language 数据集采用的语言 M N 字符串数据集字符集 charactreSet 数据集使用的字符编码标准全称O N 字符串数据集分类 topicCategory 数据集的分类信息 M N 复合型类目名称 categoryName 用于描述主题的通用词、形式化词或短语M 1 字符串类目编码 categoryCode 类目名称对应的编码M 1 字符串分类标准 categroyStandard 分类标准名称 M 1 字符串数据志说明 statement 数据生产者有关数据集数据志、来源、处理等信息的一般说明O 1 字符串在线资源链接地址online 可以获取资源的在线资源信息,一般指向具体的数据资源应用O N 字符串资源类型 type 资源的表现分类 O 1 字符串数据集标识符 resourceID 在特定范围内给予数据集的唯一标识符M 1 字符串元数据标识符 metadataIdentifier 元数据的唯一标识符M 1 字符串元数据语种 language 元数据使用的语言 M 1 字符串元数据联系方 metadataContact 对元数据信息负责的单位或个人O N 复合型元数据创建日期metadatadateStamp 创建元数据的日期 M 1 日期型负责单位 organisationName 负责单位名 M 1 字符串负责方地址 address 与元数据或数据集联系人或联系单位联系的物理地址O 1 字符串242.4.4.2.3.3 技术元数据为技术元数据设计的表主要包括:数据字典表:记录实体表的表名、字段名、类型、中文名称。系统管理日志表:重要系统管理功能(如数据加载、代码表维护等)记录日志。其他数据库管理表。技术元数据一般由数据库管理系统提供的功能进行维护。2.4.4.2.3.4 操作元数据为操作元数据设计的表主要包括:数据库状态表:数据库的运行状态和审计数据。用户管理表:用户名称、密码、角色等。角色权限表:系统角色对不同业务的权限定义。管理日志表: 记录用户的访问信息以及对数据库的重要操作。操作元数据表由系统管理与维护系统进行维护。2.4.4.2.4 信息资源编目2.4.4.2.4.1 信息资源编目体系结构信息资源目录体系结构如下图所示:25信 息 资 源 目 录 使 用 者信 息 资 源 目 录 服 务 系 统公 共 资 源 目 录 交 换 服 务 目 录支 撑 环 境 ( 软 件 、 硬 件 和 网 络 )公 共 资 源 核 心 元 数 据交 换 服 务 核 心 元 数 据标准与管理安全保障信息资源目录体系如上图所示,信息资源目录体系主要由信息资源目录服务系统组成,以及标准与管理规范建设和安全保障。1、信息资源目录使用者信息资源目录使用者通过信息资源目录提供的服务使用目录服务。2、目录信息与服务信息资源目录信息与服务包括三个层次:目录信息层、功能服务层和服务表现层。(1)目录信息层:由公共资源核心元数据库和交换服务核心元数据库组成。(2)功能服务层:主要由公共资源目录和交换服务目录组成。(3)服务表现层:主要由信息资源目录服务系统组成,向信息资源使用者提供信息资源的发现和定位服务,为便于信息资源使用者使用查询定位功能而进行目录的展现。3、支撑与保障(1)标准与管理规范:规范信息资源目录体系的相关标准与管理规范。26(2)安全保障:遵循国家关于信息安全保障的相关标准。(3)支撑环境:包括系统的软件、硬件和网络。信息资源建设是信息共享的前提,通过元数据描述和检索机制,实现信息资源的定位和发现,为资源的整合和系统间的交互提供基础方法。信息资源的共享通过信息资源的目录体系来实现。而目录体系建立在信息资源的核心元数据和信息资源的分类与标识基础上。数据资源规划将以上述的信息资源目录体系为基础,通过梳理业务流程、指标代码、元数据和基础数据建设实现。2.4.4.2.4.2 信息资源编目管理信息资源目录服务系统的基本功能包括目录内容编目、注册、发布、查询、维护。编目提供公共资源核心元数据和交换服务资源核心元数据的编辑功能;注册是指信息资源目录提供者向信息资源目录管理者注册公共资源核心元数据和交换服务信息资源核心元数据;发布是指管理者通过目录服务器,把资源核心元数据库的内容发布到一站式系统中;查询是指为应用系统提供标准的调用接口,支持公共资源核心元数据和交换服务资源核心元数据的查询。1注册管理信息资源目录提供者向信息资源目录管理者提供注册资源库元数据信息。同时,进行资源库元数据审核、验证、归档,实现多个元数据库的数据整合及数据库的数据传输与同步。(1)提交进行注册侯的的信息资源目录,可通过管理者和提供者之间的信息资源元数据汇交平台,实现信息资源元数据的提交。(2)分类能够按照信息资源类别进行分分类管理,支持信息资源关键词的自动提取,提供自动建议分类。(3)审核信息资源目录相应的管理员对提供者提交的信息资源元数据进行审核,符合标准要求的给予审核通过,未通过审核的元数据应返回给提供者修改。对于提供者已经对信息资源唯一标识符赋码的情况,管理者对信息资源的27唯一标识符进行审核,检查提供者所提交的唯一标识符是否符合要求。如果不符合,管理者则对该标识符进行修订,并将对该标识符的赋码返回给提供者。对于提供者未对信息资源唯一标识符赋码的情况,由管理者对信息资源的唯一标识符进行赋码。支持审批流程自定义,支持完整的权限管理、多级审批等功能;(4)入库对于通过审核的元数据,实现元数据的入库管理,形成正式的目录。(5)信息资源目录编码管理信息资源目录提取各类信息的特征信息,编目成公开信息资源核心元数据,支持资源库元数据的编辑功能,支持资源库元数据的分类功能。根据公编目操作员提供的信息资源文本类原文,实现关键词的自动抽取,支持将信息资源的文本类原文提交给主题词提取模块,主题词提取模块进行主题词提取,并将提取结果返回给资源目录注册模块。对公共资源核心元数据和交换服务资源核心元数据的编辑,主要包括提取信息相关特征信息,形成公共资源核心元数据;提取交换服务资源的相关特征信息,形成交换服务核心元数据;对信息资源核心元数据中的分类信息进行赋值;提供者可在编目时对信息资源进行唯一标识符的赋码等内容。2数据管理多个信息资源目录系统数据交换的协同管理,实现不同业务应用系统之间信息资源目录的部署,支持系统信息资源目录交换过程中多个数据源的协同管理。3发布管理信息目录管理者通过目录体系服务器将元数据库的内容发布到信息资源目录服务系统中,支持公开元数据库数据的发布管理,支持多种元数据发布格式。同时,对信息资源目录可进行浏览、查询、上报等基本服务。信息资源管理员发布目录内容,实现一站式系统服务。发布具备的基本功能包括:(1)发布服务管理
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸设计 > 毕设全套


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!