资源描述
XXXX云数据中心技术方案Copyright ? 2012杭州华三通信技术有限公司 版权所有,保留一切权利。非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部, 并不得以任何形式传播。本文档中的信息可能变动,恕不另行通知。1需求分析11.1现状分析 12云计算技术的优势 32.1 传统IT面临的困境 S 32.2 云计算概述42.2.1 什么是云计算 42.2.2 云计算的特征 52.2.3 云计算的价值 62.3 H3Cloud 云计算解决方案特色 72.3.1 H3Cloud 云计算解决方案组件 82.3.2 H3Cloud 云计算解决方案亮点 113 整体方案设计 153.1 设计原则153.2 建设思路163.3 整体解决方案拓扑 173.4 云计算平台的搭建 183.4.1 计算资源池设计 183.4.2 基础网络平台设计 243.4.3 虚拟机交换网络 303.4.4 安全设计 343.4.5 存储设计 383.5 云计算业务部署 463.5.1 虚拟机部署 463.5.2 虚拟桌面部署 503.5.3 HA功能部署 523.5.4 动态资源调整 533.5.5 虚拟机备份 543.5.6 云业务工作流设计 553.6 应用系统迁移 563.6.1 应用迁移规划 563.6.2 物理机虚拟化迁移 (P2V) 564设备配置与选型 571 需求分析(具体内容,根据实际项目修改)1.1 现状分析安庆石化数据中心在基础设施和应用系统建设方面取得了很大的成绩,但是在其建设当中,办公网和生产网的资源部署方式仍然是按照应用进行物理的划分,这种部署方式可能存在以下风险和挑战:? 资源利用率低由于应用与资源绑定,每个应用都需要按照其峰值业务量进行资源的配置,这导致在大部分时间许多资源都处于闲置状态,不仅造成服务器的资源利用率较低,而且对资源的共享、数据的共享造成了天然的障碍。? 运维成本高随着安庆石化企业内部生产网和办公网业务的增加,服务器、网络和存储的设备数量也会出现迅速的膨胀,在传统的数据中心建设模式下,会造成占地空间、电力供应、散热制冷和维护成本的急剧上升,为企业长远的 IT 投入和运维带来挑战。? 业务部署缓慢在传统的模式下,企业的各个部门如果要部署新的业务,那么在提交变更请求与进行运营变更之间存在较大延迟,每一次的业务部署都要经历硬件选型、采购、上架安装、操作系统和应用程序安装以及网络配置等操作,使得业务的部署极为缓慢。? 管理策略分散当前的生产网和办公网的运维管理缺乏统计的集中化 IT 构建策略, 无法对企业内网的基础设施进行监控、管理、报告和远程访问, IT 管理策略分散。安庆石化的云数据中心建设作为企业运行关键业务运行平台和进一步发展的基石,必须拥有更强的IT 服务能力,保持高效稳定的运行,数据中心的升级建设势在必行。另外,随着安庆石化企业IT 建设的迅速开展,云数据中心承载着企业内部的关键业务、核心应用,对于信息数据的完整性、业务运行的可靠性、网络系统的可用性的要求越来越重要。目前 IT 信息技术已经延伸到企业的各个层面, 从企业角度看, 云计算有利于整合信息资源, 实现信 息共享,促进企业信息化的发展。从用户角度看,利用云计算可以独立实现或享受某一项具体的业务和服务。因此云计算将在企业的IT政策和战略中正扮演越来越重要的角色。安庆石化云数据中心的建设,未来的核心业务涵盖如下范围:? 以“统规、统建、统维”思想为指导,以丰富的云基础设施,云存储,云安全和各类云服务共同构建安庆石化云数据中心,服务于各部门的生产网和办公网。?数据处理:海量数据的处理和分析。?为安庆石化各部门集中提供基础的信息处理能力,承接企业各部门的应用系统迁移和部署,实现相关云数据中心的资源整合、集中部署与统一管理。项目建设应从安庆石化云数据中心信息化发展方向以及发展现状出发,加强综合协调和统筹规划,借助现代、前沿的信息化技术,形成集成能力强、运作效率高和具有可持续发展能力的云数据中心多业务应用平台,真正为安庆石化提供找得着、用得好、有保证的信息化服务。 具体建设思路如下:?统筹规划,分步建设?资源共享、协同服务?因地制宜,突出重点?基于云计算,创新服务模式本方案将云数据中心 “IT基础设施”的“按需使用”以及“自动化管理和调度”作为云计算的实践,形成可落地实施的、可持续发展的云计算平台,即IaaS云计算平台。安庆石化云数据中心的建设目标建议如下:?统一管理通过最新的云计算核心技术之一虚拟化技术,整合现有所有应用,整合内容包括 WEB、MAIL、FTP、域控管理、OA系统、后台数据库等应用,将整个业务系统作统一的规划和部署,统一数据备份,从而形成自上向下的有效IT管理架构。强调整体方案的可扩展性、高可用性、易用性和易管理性采用最新的2路多核服务器,保证整个硬件系统的可靠性和可用性,为用户的应用提供可靠的硬件保障;建设云计算平台,发挥云计算平台的优越性,为用户提供HA功能,保证用户业务系统的连续性和高可用性,让用户的业务实现零宕机风险;提供专业的管理软件,保证硬件系统和软件系统 的可管理性,为用户节省管理投资成本。2云计算技术的优势2.1 传统IT面临的困境自从上世纪90年代开始,IT行业在全球范围内得到了迅猛的发展,IT平台的规模和复杂程度出现了大幅度的提升,与此同时,很多企业的IT机构却因为这种提升而面临着一种新的困境:高昂的硬件成本和管理运营成本、缓慢的业务部署速度以及缺乏统一管理的基础架构。高期的成本支出图1传统IT面临的困境?高昂的成本支出随着IT规模的不断膨胀,数据中心内的服务器数量、网络复杂程度以及存储容量急剧增长,随之带来的是高昂的硬件成本支出以及运营成本支出(电力、制冷、占地空间、管理人员等)。基础结构成本:托管、冷却、连接服务器以及为服务器提供电源都会随着服务器数量的增长而导致成本大量增加。仅服务器电力需求一项就占总成本一大块,估计数据中心的1000台服务器的电力成本每年都在45,000美元以上。硬件成本:每年服务器在容量和计算能力上都呈增长趋势。随着服务器变得越来越强大,最大化的利用这些超强资源也变得愈加困难。IT组织和应用服务用户习惯为每个应用服务部署一台独立服务器以确保完全控制该应用服务。几乎在所有情况下,部署这些功能强大台独立服务器以确保完全控制该应用服务。几乎在所有情况下,部署这些功能强大的服务器将会使服务器过剩 50-500% 。软件成本:通常服务器需要从操作系统或应用软件厂商那里获取许可证与支持。管理成本:迄今为止,管理成本是服务器成本中最大的一个部分,分析专家估计管理成本占服务器总拥有成本的 50-70% 。 IT 技术 人员不得不对软硬件进行升级、打补丁、备份以及修复,部署新的服务器及应用,维护用户账户并执行许多其他任务。随着服务器数量的增长, IT 部门发现他们面临着满足相关服务器管理需求的挑战。? 缓慢的业务部署速度新的服务器、存储设备和网络设备的部署周期较长,整个过程包括硬件选型、采购、上架安装、操作系统安装、应用软件安装、网络配置等。一般情况下,这个过程需要的工作量在2040小时,交付周期为46周。? 分散的管理策略数据中心内的 IT 基础设施处于分散的管理状态,具体表现为:机房管理员遵循“根据最坏情况下的工作负载来确定所有服务器的配置”这一策略导致服务器的配置普遍过高。容易出现大量“只安装一个应用程序”而未得到充分利用的 x86 服务器。提交变更请求与进行运营变更之间存在较长的延迟。缺少统一的集中化 IT 构建策略,无法对数据中心内的基础设施进行监控、管理、报告和远程访问。2.2 云计算概述2.2.1 什么是云计算云计算是一种基于网络的计算服务供给方式,它以跨越异构、动态流转的资源池为基础提供给客户可自治的服务,实现资源的按需分配、按量计费。云计算导致资源规模化、集中化,促进IT 产业的进一步分工, 让 IT 系统的建设和运维统一集中到云计算运营商处, 普通用户都更加关注于自己的业务,从而提高了信息化建设的效率和弹性,促进社会和国家生产生活的集约化水平。云计算主要包含两个层次的含义:一是从被服务的客户端看:在云计算环境下,用户无需自建基础系统,可以更加专注于自己的业务。用户可按需获取网络上的资源,并按使用量付费。如同打开电灯用电,打开水龙头用水一样, 而无需考虑是电从哪里来, 水是哪家水厂的。二是从云计算后台看:云计算实现资源的集中化、规模化。能够实现对各类异构软硬件基础资源的兼容,如电网支持水电 厂、火电厂、风电厂、核电厂等异构电厂并网;还能够实现资源的动态流转,如西电东送,西气东 输、南水北调等。支持异构资源和实现资源的动态流转,可以更好的利用资源,降低基础资源供应 商的成本。2.2.2 云计算的特征于网姐 I克纳舞构m吩配I蜀触第通K指计修itw芟道湎定格海动电扩腰_ J 他意处避支持导构一7I多业翁体I W察图2云计算的特征?基于网络云计算是从互联网演变而来,云计算本质通过网络将计算力进行集中,并且通过网络进行服务,如 果没有网络,计算力集中规模、服务的种类和可获得性就会受到极大的限制,如集群计算虽然也是 基于网络的计算模式,但是不能提供基于网络的服务,还不能称之为云计算。?支持异构基础资源云计算可以构建在不同的基础平台之上,即可以有效兼容各种不同种类的硬件和软件基础资源。硬件基础资源,主要包括网络环境下的三大类设备,即:计算(服务器)、存储(存储设备)和网络(交换机、路由器等设备);软件基础资源,则包括单机操作系统、中间件、数据库等。从横向维度考虑,支持异构资源,意味着在同一时期内,可以采购不同厂商的软硬件。对云计算平台的构建者而言,这种形式更为灵活;而从纵向维度考虑,意味着云计算平台既可以兼容当下采购的新设备, 也可以兼容以前的老设备,既可以兼容当前的新软件系统,也可以兼容以前遗留的老软件系统。支 持异构的基础资源这一特性,在有效利用老资源的同时,也保证了新老资源的平滑过渡。? 支持资源动态扩展支持资源动态伸缩,实现基础资源的网络冗余,意味着添加、删除、修改云计算环境的任一资源节点,亦或任一资源节点异常宕机,都不会导致云环境中的各类业务的中断,也不会导致用户数据的丢失。这里的资源节点可以是计算节点、存储节点和网络节点。而资源动态流转,则意味着在云计算平台下实现资源调度机制,资源可以流转到需要的地方。如在系统业务整体升高情况下,可以启动闲置资源,纳入系统中,提高整个云平台的承载能力。而在整个系统业务负载低的情况下,则可以将业务集中起来,而将其他闲置的资源转入节能模式,从而在提高部分资源利用率的情况下,达到其他资源绿色、低碳的应用效果。? 支持异构多业务体系在云计算平台上,可以同时运行多个不同类型的业务。异构,表示该业务不是同一的,不是已有的或事先定义好的,而应该是用户可以自己创建并定义的服务。这也是云计算与网格计算的一个重要差异。? 支持海量信息处理云计算,在底层,需要面对各类众多的基础软硬件资源;在上层,需要能够同时支持各类众多的异构的业务;而具体到某一业务,往往也需要面对大量的用户。由此,云计算必然需要面对海量信息交互,需要有高效、稳定的海量数据通信/存储系统作支撑。? 按需分配,按量计费按需分配,是云计算平台支持资源动态流转的外部特征表现。云计算平台通过虚拟分拆技术,可以实现计算资源的同构化和可度量化,可以提供小到一台计算机,多到千台计算机的计算能力。按量计费起源于效用计算,在云计算平台实现按需分配后,按量计费也成为云计算平台向外提供服务时的有效收费形式。2.2.3 云计算的价值云计算是能够提供动态资源池、虚拟化和高可用性的下一代计算模式。如果把一个计算的资源,比如一台服务器,看成一个小水滴,当很多资源汇聚在一起的时候,它就形成了计算的云,正如我们不关心水滴是怎么产生的,用户也不需要关心计算资源位于哪台物理的服务器上。用户关心的是需要什么样的计算能力,需要什么时刻拥有这些计算能力。云计算管理平台可以为用户提供“按需计算”服务。? 从资源共享方面在整合贵单位信息中心现有软硬件资源基础上建设云计算平台。充分发挥云计算平台虚拟化计算、按需使用、动态扩展的特性,为 贵单位 各个部门提供计算、存储和信息资源服务,实现软硬件集中部署、统建共用、信息共享,避免重复投资。基于云计算技术建设公共的云服务平台来运行企业正常运行所需要的业务,可以将企业运维中共性的业务部分进行提炼和归纳, 并实现, 可以保证共性业务实现的规范性、 安全性、 全面性和稳定性,也避免了公共功能模块的多次开发实现所造成的冗余浪费乃至系统不兼容错误。更重要的是公共的云服务平台可以提供一系列支撑服务,业务应用子系统在这些支撑服务的基础之上进行开发,大大降低了开发难度和成本,使各部门可以更加专注于其本身综合的、深层次的、相关联的业务需求,而不是基础设施的建设,把精力用在企业高效运行和企业创新的关键点业务需求上,比传统的建设模式更好的把握业务需求,将会大大提高企业信息化的建设效益。? 从管理工作方面IT 部门工作的本质就是服务。如果各部门的业务应用子系统都是按照“云数据中心”的统一标准进行开发实施、注册部署,可以方便的对企业各类业务工作进行标准化管理,从统一管理的的角度对系统进行规范管理,而不是各扫门前雪,在大大降低管理成本的同时,也大量的节约系统的运行成本。? 从技术实现方面基于云计算的企业公共服务平台可以按照 SOA 的松耦合方式来建设,模块间通过标准协议实现相互调用和消息传递,这种技术架构较为成熟,具有较好的扩展性,可以确保信息系统技术层面可持续发展,更有助于企业不同服务业务之间的信息共享,提高企业各部门业务之间的协同。? 从标准化实现方面基于云计算的企业公共服务平台可以提供一种标准化的建设模式,可以统一制定共性办公业务标准、管理工作实现标准、技术安全标准、保密安全标准、软硬件技术实现标准等,这对云数据中心建设标准的实施和推广具有重要意义。2.3 H3Cloud 云计算解决方案特色H3C 公司依托强大的研发实力、广泛的市场应用和技术理解,以客户需求为导向,为企业新一代云计算数据中心基础架构提供一体化的云计算平台解决方案,帮助用户实现快速、可靠的虚拟化数据中心和云业务应用部署。 H3Cloud 云计算解决方案包含统一的计算资源池、统一的网络资源池、统一的存储资源池,并提供了一体化的监控和部署工具进行统一的虚拟化与云业务管理,通过简洁的不仅能提高管理员的管控能力、管理界面,轻松地统一管理数据中心内所有的物理资源和虚拟资源,简化日常例行工作,更可降低IT环境的复杂度和管理成本。2.3.1 H3Cloud云计算解决方案组件H3Cloud云计算解决方案面向于私有云IaaS (基础设施即服务),主要包含以下几个部分:云计算平台现有的企业计算环境通常是x86平台,H3Cloud可以通过服务器的虚拟化进行计算资源的整合与灵活利用,进行服务器计算资源的整合、动态调整、迁移。H3C FlexServer服务器系列定义了下一代2U双插槽机架式服务器的标准。借助可维护性方面的改进、无与伦比的性能、强大的配置灵活性和受用户启发的设计模式,H3C FlexServer所提供的完美解决方案能满足当今不断扩展的数据中心所需的动态计算机要求。H3C FlexServer服务器支持iLO管理引擎,这是一套全面的嵌入式管理特性,可支持服务器的完整生命周期(从初始部署到运行管理、再到服务警报和远程支持)。? 云存储平台实现IaaS的一个重要组成部分是云存储,一个云计算的基础设施要服务于很多个不同的业务系统或者应用,每个业务系统或应用都会有不同的存储需求,H3Cloud可以通过存储虚拟化管理,进行存储需求的整合,灵活的容量控制。H3Cloud云计算解决方案中的存储组件提供了经济实惠的企业功能,并具有全面的功能集,简化了 对所有位置的集中管理,是具有各种虚拟服务器、客户端虚拟化、数据库、电子邮件和业务应用程 序的环境的理想选择。存储组件中集成了各种出色的应用程序可用性和灾难恢复功能,在任何情况下都可进行自动故障转 移/故障恢复,并针对虚拟化环境进行了优化,并为用户和应用程序提供了即时满足需求的连续数据可用性。虚拟化网络基础平台随着云计算环境下虚拟化技术的大规模部署,传统的网络架构将面临着很多新的挑战,包括规格与性能、虚拟机接入与控制、大二层网络部署、流量突发与拥塞等等,如下图所示:H3c虚拟网络方案通过数据中心级设备、网络虚拟化及虚拟机网络接入新标准( EVB )等产品与技 术的创新,可以实现网络基础平台对云计算虚拟化环境的良好支撑,同时大大简化网络的运维管理。? CAS云计算管理平台服务器虚拟化、存储虚拟化和网络虚拟化只是构成云计算基础设施的硬件资源池,在云计算环境中,最重要的一点是实现资源池的自动化,避免人力对于基础设施的过多干预。H3C CAS (CloudAutomation System )通过自动化的管理平台和手段,帮助用户实现对云硬件资源和业务流程的快 速部署与自动化维护和管理。H3C CAS云计算管理平台由三个组件构成:CVK : Cloud Virtualization Kernel ,虚拟化内核平台运行在基础设施层和上层客户操作系统之间的虚拟化内核软件。针对上层客户操作系统对底层硬件资源的访问,CVK用于屏蔽底层异构硬件之间的差异性,消除上层客户操作系统对硬件设备以及驱动的依赖,同时增强了虚拟化运行环境中的硬件兼容性、高可靠性、高可用性、可扩展性、性能优化等功能。CVM : Cloud Virtualization Manager ,虚拟化管理系统主要实现对数据中心内的计算、网络和存储等硬件资源的软件虚拟化管理,对上层应用提供自动化服务。其业务范围包括:虚拟计算、虚拟网络、虚拟存储、高可用性( HA)、动态资源调度(DRS )、虚拟机容灾与备份、虚拟机模板管理、集群文件系统、虚拟交换机 策略等。CIC : Cloud Intelligence Center ,云业务管理中心组织/虚拟数据中心自助服务门户云业务工作流由一系列云基础业务模块组成,通过将基础架构资源(包括计算、存储和网络)及其相关 策略整合成虚拟数据中心资源池,并允许用户按需消费这些资源,从而构建安全的多租户 混合云。其业务范围包括:组织(虚拟数据中心)、多租户数据和业务安全、云业务工作 流、自助式服务门户、兼容 OpenStack的REST API接口等。C管理层虚拟机生命周期管理li 镜像文件管理多租户安全管理策略配置管理M”V自动化服务层弹性计算服务容灾备份服务弹性负载均衡服务虚拟机模板服务虚拟化层KC虚拟计算资源池虚拟存储资源池虚拟网络资源池硬件基础设施层计算存储网络从逻辑架构上,H3c CAS云计算管理平台包括虚拟化层、自动化服务层、管理层、业务编排层、API 层:虚拟化层利用CVK提供的底层虚拟化能力和上层 CVM提供的管理能力,屏蔽底层物理硬件基础设施的异构性和复杂度,对外以虚拟资源池的形式呈现。自动化服务层强调业务运行的高可用性和可扩展性,并未业务提供自动的容灾备份与资源调度能力。管理层AM llnu,丸I -10fHM : *WJ(HKM/J IMXiJoVU Q 。= u*JR 0耳闻J W M EBH帕 * J*wwir ItEltfi 野 J.r : : Ll 注三:对虚拟化资源及云运营要素进行管理,如虚拟机生命周期的管理、虚拟机镜像文件和配置 文件的管理、多租户的安全隔离、网络策略配置的管理等。业务编排层对云计算资源进行可运营性管理,包括对虚拟资源池的编排、最终用户的自助服务门户、业务的申请、审批与开通、用户帐务的管理与报表输出等。API层为第三方云运营管理平台提供RESTful的API接口。2.3.2 H3Cloud云计算解决方案亮点1.直观的配置与管理?完全基于B/S架构的管理控制台,不仅让数据中心轻松组织和快速部署整个IT环境,而且还能对包括CPU、内存、磁盘I/O、网络I/O等重要资源在内的关键元件进行全面的性能监测,为管理员实施合理的资源规划提供详尽的数据资料。3. 支持 IEEE 802.1Qbg 标准草案? 支持 IEEE 802.1Qbg (VEPA) 协议标准草案, 与 H3C S5820V2/S5830V2 交换机及 iMC VCM 网管组件配合,能够实现对虚拟机流量的全面监控。4. 快速业务部署能力? 支持虚拟机的快速克隆功能, 所有链接到主镜像文件的虚拟桌面都可以通过更新主镜像文件来修补或更新, 而不会影响用户的设置、 数据或应用程序, 大幅简化了桌面的管理, 同时极大地减少存储空间的浪费和缩短了部署虚拟桌面的时间。? 支持虚拟机系统的增量备份功能,仅备份上一次完全/ 增量备份后发生变化的文件,极大地减少了每次备份文件的数量和备份的时间,提高了备份效率。5. 自助式云业务电子流自助式服务管理为用户提供了一个安全的、 多租户的、 可自助服务的 IaaS , 是一种全新的基础架构交付和使用模式。通过H3Cloud 云计算软件提供的虚拟化资源池功能,使IT 部门能够将计算、存储和网络等物理资源抽象成按需提供的弹性虚拟资源池,以消费单元(即组织或虚拟数据中心)的形式对外提供服务, IT 部门能够通过完全自动化的自助服务访问,为用户提供这些消费单元以及其它包括虚拟机和操作系统镜像等在内的基础架构和应用服务模板。这种自助式的服务真正实现了云计算的敏捷性、可控性和高效性,并极大程度地提高了业务的响应能力。云资源云服务云用户系统管理员组织管理员最终用户6.多租户业务安全通过用户数据安全隔离与网络安全策略模板,确保虚拟化、多租户环境下的用户隐私信息及数据的安全。虚拟化资源位置信息的唯一标识,避免了虚拟化技术引起的物理边界模糊可能导致的司法取证问题。通过用户权限的精细化控制、管理帐号的分级管理以及详细的操作访问日志,避免权限滥用问题。系统管理员最终用户云服务系统管理用户自助服务门户虚拟机模板虚拟网络云资源用户组管理权限管理日志管理系统配置管理物理资源虚拟资源计算资源存储资源网络资源虚拟机虚拟机模板License 管理7 .为高性能、高效率和轻松访问而构建的云计算服务器?符合能源之星标准的 H3c FlexServer服务器配置充分体现了 H3c 一贯的帮助客户节省能源、降低成本的宗旨。?借助通用免工具的新型滑轨,可以快速安装H3C FlexServer,快速释放杆可实现快速服务器访问。非常灵巧的电缆管理支架选项,可实现灵活布线和出色的布线管理,让您可以快速访问该服务器。?率先推出的3D阵列温度传感器可精确控制服务器风扇直接散热,从而避免了不必要的风扇功耗。8 .存储组件确保出色的应用可用性和灾难恢复能力? H3Cloud云计算解决方案中的存储组件可跨存储节点集群分割和保护多份数据副本,并消除SAN中的单点故障。应用程序在发生电源、网络、磁盘、控制器、存储节点或站点故障的情况下,具有连续的数据可用性。H3Cloud云计算解决方案中的存储组件高可用性架构的优点是,一个单一的存储集群可托管不同网络RAID级别的卷,每个卷的可用性和/或性能水平依应用的需求而异。? H3Cloud 云计算解决方案中的存储组件具备集成复制功能,通过自动化和透明的故障转移与故障恢复简化管理。 如果有一个存储节点脱机,它就会从脱机时间开始跟踪数据变化;当节点重新联机时,变更的数据块就会恢复到当前水平。9 . 经济实惠的企业级存储功能和全面的特性集? 横向扩展存储集群允许将多个存储节点整合到共享存储池中。 汇聚所有可用的容量和性能,用于集群中的每个卷。 随着存储需求的增长,存储组件可在线横向扩展性能和容量。? 网络 RAID 可跨存储节点集群分割和保护多份数据副本, 从而消除存储组件中的任何单点故障。应用程序在发生电源、网络、磁盘、控制器、存储节点或站点故障的情况下,具有连续的数据可用性。? 多站点 SAN 可用性使存储组件能够将集群中的存储节点分配到不同的地点(机架、机房、建筑和城市) ,并提供无缝的应用高可用性,跨不同地点自动实现故障转移/故障恢复。? 无须预留快照, 实现精简配置, 只分配写入数据所需的空间, 无需预分配存储容量, 从而提高 存储组件的整体利用率和效率。3 整体方案设计3.1 设计原则? 兼容与互通当前阶段云计算整个产业化还不够成熟,相关标准还不完善。为保证多厂商的良好兼容性,避免厂商技术锁定, 方案的设计充分保证与第三方厂商设备保持良好的对接。 此外, 为保证方案的前瞻性,设备的选型应充分考虑对已有的云计算相关标准(如 EVB/802.1Qbg 等)的扩展支持能力,保证良好的先进性,以适应未来的技术发展。? 业务高可用云计算平台作为承载未来企业应用的重要IT 基础设施, 承担着稳定运行和业务创新的重任。 伴随着数据与业务的集中,云计算平台的建设及运维给信息部门带来了巨大的压力,因此平台的建设从基础资源池(计算、存储、网络) 、虚拟化平台、云平台等多个层面充分考虑业务的高可用,基础单元出现故障后业务应用能够迅速进行切换与迁移,用户无感知,保证业务的连续性。? 统一管理与自动化云计算的最终目标是要实现系统的按需运营,多种服务的开通,而这依赖于对计算、存储、网络资源的调度和分配,同时提供用户管理、组织管理、工作流管理、自助 Portal 界面等。从用户资源的申请、 审批到分配部署的智能化。 管理系统不仅要实现对传统的物理资源和新的虚拟资源进行管理,还要从全局而非割裂地管理资源,因此统一管理与自动化将成为必然趋势。? 开放接口传统的管理系统与上层系统对接,注重故障的上报和信息的查询。而云计算的管理系统更关注如何实现自动化的部署,在接口方面更关注资源调度和分配,这就需要管理系统在业务调度方面实现开放。为保证服务器、存储、网络等资源能够被云计算运营平台良好的调度与管理,要求系统提供开放的 API 接口,云计算运营管理平台能够通过API 接口、命令行脚本实现对设备的配置与策略下发联动。同时云平台也提供开放的 API 接口,未来可以在这些接口的基础上进行二次定制开放,实现面向云计算的数据中心管理平台。3.2 建设思路? 初期小规模试点,逐步迁移考虑到企业内部应用的重要性,以及各部门数据交互的复杂性,本次云计算项目建设的初期重在搭建基础平台,业务应用只针对安庆石化办公网内的部分应用,后续会逐步完成整合与业务的迁移。基础云平台的搭建中,网络作为最基础的支撑,对后续业务的扩展与整合影响最大,而且对网络核心的改造将会影响到整个数据中心的业务运行。因此本次建设需要明确网络整体架构,同时确定核心设备的选型, 避免后续业务迁移和扩容时更换核心设备, 将迁移和扩容的工作量及风险降到最低。对于云平台中的服务器、存储资源池构建,本次方案采用最小建设的思路,即满足35 个业务应用的最小配置要求来选择设备,重点倾向于虚拟化平台、云平台的建设。后续逐步通过现有服务器上业务应用的 P2V 迁移, 对现有服务器进行利旧与整合, 逐步将现有服务器、 存储设备整合到资源池中,保证最佳的 TCO (总体拥有成本) 。? 以基础设施即服务( IaaS )为基础,逐步完善PaaS 和 SaaS 建设云计算 IaaS , 通常是基于虚拟化技术 (特别是硬件级虚拟化技术) 实现了物理资源和应用系统的松耦合,从而体现物理资源池的理念。然而基于虚拟化技术仅仅是形成一个资源池,为了给上层应用系统提供弹性的按需分配的物理资源,对于这个资源池我们仍需要进行统一的调度与管理,从而为这个资源池赋予更多的智能以满足业务的需求。近两年来,IaaS 一直国内云计算服务发展的基础,该服务模式与上层应用耦合度最低,部署相对自由、灵活,相应的解决方案产品比较成熟,无需针对业务进行复杂的二次定制开发,部署和运维成本都较低,而且IaaS的部署对最终用户来说是透明的,不改变最终用户的使用习惯。本次方案的建设中,考虑到 安庆石化 云数据中心建设的实际情况,我们建议初期以提供IaaS服务为基础,包括虚拟主机、虚拟存储、虚拟桌面等服务,保证对现有应用系统和用户影响最低的前提下,逐步完成向应用向云中的迁移。对于PaaS和SaaS的建设,待IaaS平台日益完善,数据格式、中间件、数据库形成标准、统一之后再逐步进行建设。3.3 整体解决方案拓扑H3CCVK打先光圻魂电II根据本期工程的需求和建设目标云计算平台总体逻辑拓扑结构如上图所示。整个平台由网络资源池、计算资源池、存储资源池、管理中心以及利旧服务器区五部分组成。? 网络资源池(根据实际配置撰写)采用业界主流的“核心 +接入扁平化组网,核心交换机采用2台H3c S12508设备,部署IRF2虚拟化技术,并在机框内部署负载均衡( LB)和防火墙(FW)插卡,实现业务的流量监控和负载 均衡;计算资源池的接入交换机采用2台H3C S5830V2设备,部署IRF2虚拟化技术;利旧服务器区采用2台S5120设备,部署IRF2虚拟化技术;H3C管理产品通过 S5120设备管理各类网络 资源以及计算资源池。计算资源池(根据实际配置撰写)采用 H3Cloud 云计算操作系统软件,将多台 H3C FlexServer R390 机架服务器组建 HA 集群,在虚拟机上部署企业业务应用,并配合HA 和动态负载均衡等高级功能,实现业务的连续性,减少计划内宕机时间,提高资源利用率。? 存储资源池根据实际需求采用多台 H3C FlexStorage P4500 iSCSI 存储阵列, 统一存放虚拟机镜像文件和业务系统数据,这样做不会在运行虚拟机的云计算计算节点主机上引起任何额外的负载。? 管理中心采用 2 台 H3C FlexServer R390 机架服务器,分别部署 H3C iMC DCM 数据中心管理套件和H3Cloud 软件套件(含 CVK 、 CVM 和 CIC ) ,实现对云计算资源池的统一管理及调度。3.4 云计算平台的搭建3.4.1 计算资源池设计服务器是云计算平台的核心,其承担着云计算平台的“计算”功能。对于云计算平台上的服务器,通常都是将相同或者相似类型的服务器组合在一起, 作为资源分配的母体, 即所谓的服务器资源池。在这个服务器资源池上,再通过安装虚拟化软件,使得其计算资源能以一种虚拟服务器的方式被不同的应用使用。这里所提到的虚拟服务器,是一种逻辑概念。对不同处理器架构的服务器以及不同的虚拟化平台软件,其实现的具体方式不同。在x86 系列的芯片上,其主要是以常规意义上的VMware 虚拟机或者 H3Cloud 虚拟机的形式存在。H3CCVK机架照务黑刀片服务器1.资源池分类设计在搭建服务器资源池之前,首先应该确定资源池的数量和种类,并对服务器进行归类。归类的标 准通常是根据服务器的 CPU类型、型号、配置、物理位置来决定。对云计算平台而言,属于同一 个资源池的服务器,通常就会将其视为一组可互相替代的资源。所以,一般都是将相同处理器、相 近型号系列并且配置与物理位置接近的服务器一一比如相近型号、物理距离不远的机架式服务器或 者刀片服务器。在做资源池规划的时候,也需要考虑其规模和功用。如果单个资源池的规模越大, 可以给云计算平台提供更大的灵活性和容错性:更多的应用可以部署在上面,并且单个物理服务器 的宕机对整个资源池的影响会更小些。但是同时,太大的规模也会给出口网络吞吐带来更大的压力,各个不同应用之间的干扰也会更大。如果有条件的话,通常推荐先审视一下企业自身的业务应用。可以考虑将应用分级,将某些级别高的应用尽可能地放在某些独立而规模较小的资源池内,辅以较 高级别的存储设备,并配备高级别的运维值守。而那些级别比较低的应用,则可以被放在那些规模 较大的公用资源池(群)中。初期的资源池规划应该涵盖所有可能被纳管到云计算平台的所有服务器资源,包括那些为搭建云计 算平台新购置的服务器、企业内部那些目前闲置着的服务器以及那些现有的并正在运行着业务应用 的服务器。在云计算平台搭建的初期,那些目前正在为业务系统服务的服务器并不会直接被纳入云 计算平台的管辖。但是随着云计算平台的上线和业务系统的逐渐迁移,这些服务器也将逐渐地被并 入云计算平台的资源池中。对于x86系列的服务器,除了用于生产系统的资源池以外,还需要专门搭建一个测试用资源池,以便云计算平台项目实施过程以及平台上线以后运维过程中使用。在云计算平台搭建完毕以后,企业的服务器资源池可以如下图所示:在云计算平台上线以后,原有非云计算平台上的应用会逐步向云计算平台迁移,空出的服务器资源生立用池也会逐渐并入云计算平台的资源池中。其状态可以用下图所示:生产JP资源范犷产用资力驰新建生产诲源地新建生产施源也史,系统CVM虚拟化管理平台体系将 IT数据中心的物理服务器资源以树形结构进行组织管理,统一称之为云资源。云资源是H3Cloud云计算软件分层管理模型的核心节点之一,用来统一管理数据中心内所有的、复杂的硬件基础设施,不仅包括基本的IT基础设施(如硬件服务器系统),还包括其它与之配套的设备(如网络和存储系统)。默认情况下,H3Cloud云计算管理平台出厂配置中已经添加了一个名为“云资源”的根节点,准备使用H3Cloud云计算软件进行管理的所有物理资源都需要手工逐一添加到该节点下进行统一的管理。云资源中的被管理对象之间的关系可以用下图描述:虎用机主机;.机通抠工成黑口痕帆 +丁机右机未加人集群Jfeff + E.tHA口1座损机克隆地H版加成.燃的线使W2 .主机池设计在H3Cloud云计算软件体系架构中,主机池是一系列主机和集群的集合体,主机有可能已加入到集群中,也可能没有。没有加入集群的主机全部在主机池中进行管理。在H3Cloud云计算管理平台主界面导航菜单窗口中点击“云资源”,在快捷工具栏中选择增加主 机池 按钮。中心ffE呕*褊好电H(或者右键单击“云资源”,在弹出的上下文菜单中选择增加主机池 子菜单。在弹出的增加主机池对话框中,输入主机池名称后,单击确定按钮完成主机池的添加。3 .集群设计集群是H3Cloud云计算软件中的一个新概念,其目的是使用户可以像管理单个实体一样轻松地管理 多个主机和虚拟机,从而降低管理的复杂度,同时,通过定时对集群内的主机和虚拟机状态进行监测,如果一台服务器主机出现故障,运行于这台主机上的所有虚拟机都可以在集群中的其它主机上重新启动,保证了数据中心业务的连续性。在H3Cloud云计算管理平台主界面导航菜单窗口中点击需要增加集群的主机池,在快捷工具栏中选择增加集群 按钮。主II讪 *l1唔M不 *电将省电三机.访I;可I聒H小王N *或者右键单击需要增加集群的主机池,在弹出的上下文菜单中选择增加集群 子菜单。在H3Cloud云计算管理平台中,向主机池中增加集群操作以向导的方式一步一步完成。4 .主机设计集群创建成功之后,没有任何主机或虚拟机包含于其中,为了基于将主机和虚拟机基于集群进行管理,首先需要将主机添加到集群。在H3Cloud云计算管理平台主界面导航菜单窗口中点击需要增加主机的集群,在快捷工具栏中选择增加主机 按钮。增加主机 子菜单。三词:TIT砌口十|+*力 丁 曲目 三国鬼号 匚荒赤旗g*或者右键单击需要增加主机的集群,在弹出的上下文菜单中选择在弹出的增加主机对话框中,输入需要被添加到集群的主机的IP地址、通过SSH协议访问主机的用户帐号及密码后,单击确定按钮完成主机池的添加。5.虚拟机设计虚拟机与物理服务器类似,它们主要的区别在于虚拟机并不是由电子元器件件组成的,而是由一组文件构成的。每台虚拟机都是一个完整的系统,它具有CPU、内存、网络设备、存储设备和BIOS,因此操作系统和应用程序在虚拟机中的运行方式与它们在物理服务器上的运行方式没有任何区别。与物理服务器相比,虚拟机具有如下优势:? 在标准的x86物理服务器上运行。?可访问物理服务器的所有资源(如 CPU、内存、磁盘、网络设备和外围设备),任何应用程序都可以在虚拟机中运行。?默认情况,虚拟机之间完全隔离,从而实现安全的数据处理、网络连接和数据存储。?可与其它虚拟机共存于同一台物理服务器,从而达到充分利用硬件资源的目的。?虚拟机镜像文件与应用程序都封装于文件之中,通过简单的文件复制便可实现虚拟机的部署、备份以及还原。?具有可移动的灵巧特点,可以便捷地将整个虚拟机系统(包括虚拟硬件、操作系统和配置好的甚至还可以在虚拟机正在运行的情况下进行迁应用程序)在不同的物理服务器之间进行迁移, 移。?可将分布式资源管理与高可用性结合到一起,从而为应用程序提供比静态物理基础架构更高的服务优先级别。? 可作为即插即用的虚拟工具(包含整套虚拟硬件、操作系统和配置好的应用程序) 进行构建和 分发,从而实现快速部署。在H3Cloud云计算管理平台主界面导航菜单窗口中点击需要增加虚拟机的主机,在快捷工具栏中选择增加虚拟机 按钮。r* &r端堆】富 6*除工税#歼萧匚利用元由Fl疝口工吊好口由孤仇-根矶 工亍州用TMM ,卡片叫忖增 百卡17M或者右键单击需要增加虚拟机的主机,在弹出的上下文菜单中选择增加虚拟机 子菜单。在H3Cloud云计算管理平台中,增加虚拟机的操作以向导的方式一步一步完成。3.4.2基础网络平台设计1 .网络设计要点云计算数据中心基础网络是云业务数据的传输通道,将数据的计算和数据存储有机的结合在一起。为保证云业务的高可用、易扩展、易管理,云计算数据中心网络架构设计关注重点如下:?高可用性网络的高可用是业务高可用的基本保证,在网络整体设计和设备配置上均是按照双备份要求设计的。在网络连接上消除单点故障,提供关键设备的故障切换。关键网络设备之间的物理链路采用双路冗余连接,按照负载均衡方式或active-active方式工作。关键主机可采用双路网卡来增加可靠性。全冗余的方式使系统达到 99.999%的电信级可靠性。基础网络从核心层到接入层均部署H3c的IRF2技术,可以实现数据中心级交换机的虚拟化,不仅网络容量可以平滑扩展,更可以简化网络拓扑结构,大大提高整网的可靠性,使得整网的保护倒换时间从原来的510秒缩短到50ms以内,达到电信级的可靠性要求。作为未来网络的核心,要求核心交换区设备具有高可靠性,优先选用采用交换引擎与路由引擎物理分离设计的设备,从而在硬件的体系结构上达到数据中心级的高可靠性。本次项目核心设备采用H3C S12500数据中心级核心交换机、接入设备采用 H3C S5830V2数据中心级接入交换机,设备组件层面充分保证高可靠。如下图所示:王由板配置卜7快机宿身风口-也与樟块最零觉告6块最多配置版可源出风口一风扇框最多配置唯风扇爬控制平面与我发平面物理分碑,主控板与交操同板物旌分品电源进注阴快 机宿出风口?大二层网络部署云计算数据中心内服务器虚拟化已是一种趋势,而虚拟机的迁移则是一种必然,目前业内的几种虚拟化软件要做到热迁移时都是均需要二层网络的支撑,随着未来计算资源池的不断扩展,二层网络的范围也将同步扩大,甚至需要跨数据中心部署大二层网络。大规模部暑二层网络则带来一个必然的问题就是二层环路问题,而传统解决二层网络环路问题的STP协议无法满足云计算数据中心所要求的快收敛,同时会带来协议部署及运维管理的复杂度增加。本次方案中通过部署 H3C IRF2虚拟化技术实现两台或多台同一层物理交换机虚拟成一台逻辑设备, 通过跨设备链路捆绑实现核心和接入的点对点互联,消除二层网络的环路,这样就直接避免了在网 络中部暑STP,同时对于核心的两台设备虚拟化为一台逻辑设备之后,网关也将变成一个,无需部署传统的VRRP协议。在管理层面,通IRF2多虚一之后,管理的设备数量减少一半以上,对于本项目,管理点只有核心和接入两台设备,网络管理大幅度简化。如下图所示:恃统组网部署IRF2后网络安全融合云计算将所有资源进行虚拟化,从物理上存在多个用户访问同一个物理资源的问题,那么如何保证 用户访问以及后台物理资源的安全隔离就成为了一个必须考虑的问题。另一方面由于网络变成了一 个大的二层网络;以前的各个业务系统分而治之,各个业务系统都是在硬件方面进行了隔离,在每 个系统之间做安全的防护可以保证安全的访问。所以在云计算环境下,所有的业务和用户的资源在 物理上是融合的,这样就需要通过在网关层部署防火墙的设备,同时开启虚拟防火墙的功能,为每 个业务进行安全的隔离和策略的部署。在传统的数据中心网络安全部署时,往往是网络与安全各自为战,在网络边界或关键节点串接安全 设备(如FW、IPS、LB等)。随着数据中心部署的安全设备的种类和数量也越来越多,这将导致数 据中心机房布线、空间、能耗、运维管理等成本越来越高。本次方案中采用了H3c SecBlade安全插卡可直接插在 H3C交换机的业务槽位,通过交换机背板互连实现流量转发,共用交换机电源、 风扇等基础部件。融合部署除了简化机房布线、节省机架空间、简化管理之外,还具备以下优点:互连带宽高。SecBlade系列安全插卡采用背板总线与交换机进行互连,背板总线带宽一般可超过40Gbps ,相比传统的独立安全设备采用普通千兆以太网接口进行互连,在互连带 宽上有了很大的提升,而且无需增加布线、光纤和光模块成本。业务接口灵活。SecBlade系列安全插卡上不对外提供业务接口(仅提供配置管理接口),当交换机上插有 SecBlade安全插卡时,交换机上原有的所有业务接口均可配置为安全业务接口。此时再也无需担心安全业务接口不够而带来网络安全部署的局限性。性能平滑扩展。当一台交换机上的一块SecBlade安全插卡的性能不够时,可以再插入一块或多块SecBlade插卡实现性能的平滑叠加。而且所有SecBlade插卡均支持热插拔,在进行扩展时无需停机中断现有的业务。流量清洗防火墙入侵防御 负载均衡一无16靠 me流量清洗防火墙 入侵防御 负载均衡2 .基础网络整体设计本次项目基础网络采用“扁平化”设计,核心层直接下联接入层,省去了中间汇聚层。随着网络交换技术的不断发展,交换机的端口接入密度也越来越高,“扁平化”组网的扩展性和密度已经能够很好的满足安庆石化云数据中心服务器接入的要求。同时在服务器虚拟化技术应用越来越广泛的趋势下,扁平化二层架构更容易实现VLAN的大二层互通,满足虚拟机的部署和迁移。相比传统三层架构,扁平化二层架构可以大大简化网络的运维与管理。基础网络平台组织结构如下图所示:管理|厂计算、,存储中心资源池 资源池网络的二、三层边界在核心层,安全部署在核心层;?核心与接入层之间采用二层进行互联,实现大二层组网,在接入层构建计算和存储资源池,满足资源池内虚拟机可在任意位置的物理服务器上迁移与集群。实际组网拓扑如下图所示:(本部分根据项目实际情况)IMCDCM售件割旧服务器新建账号揩H3C FlexSer/er RM90采用2台S12508构建核心层,分别通过10GE链路与接入层、管理网交换机、出口路由器互连,未来此核心层将逐步演变成整网大核心,两台核心交换机部署IRF虚拟化。接入层采用2台S5830V2-24S ,每台接入交换机与核心交换机采用10GE链路交叉互连,两台接入交换机部署IRF虚拟化,与核心交换机实现跨设备链路捆绑,消除二层环路,并实现链路负载分担。?利旧服务器区接入层采用 2台S5120-52C-EI ,每台接入交换机与核心交换机采用10GE链路交叉互连,两台接入交换机部署IRF虚拟化,与核心交换机实现跨设备链路捆绑,消除二层环路,并实现链路负载分担。同时分别连接H3C FlexServer R390 服务器的iLO接口实现服务器的带外管理,并与 iMC网管服务器、云平台管理服务器互连。分层分区设计思路:根据业务进行分区,分成计算区、存储区和管理区。计算、存储区域内二层互通,区域间VLAN隔离;根据每层工作特点分为核心层和接入层,网关部署在核心层。3 .核心层设计核心层由两台H3C S12508构建,负责整个云计算平台上应用业务数据的高速交换。两台核心交换机S12508分别与两台服务器接入区交换机间呈“三角形”型连接,与现网出口区路由器呈“口” 字型连接,一台管理区接入交换机双上行分别与两台核心交换机连接。核心交换机间及与服务器接 入交换机、管理区接入交换机、现网核心路由器间均采用万兆接口捆绑互联。核心交换机上部署防 火墙插卡和网流分析插卡,实现云计算业务的安全防护与流量分析。两台S12508部署IRF2虚拟化技术,简化路由协议运行状态与运维管理,同时大大缩短设备及链路出现故障快速切换,避免网络震荡。IRF2互联链路采用2*10
展开阅读全文