计算机安全保密XXXX-03可靠性

上传人:仙*** 文档编号:240910269 上传时间:2024-05-17 格式:PPTX 页数:161 大小:13.16MB
返回 下载 相关 举报
计算机安全保密XXXX-03可靠性_第1页
第1页 / 共161页
计算机安全保密XXXX-03可靠性_第2页
第2页 / 共161页
计算机安全保密XXXX-03可靠性_第3页
第3页 / 共161页
点击查看更多>>
资源描述
5/17/20241第三章计算机系统的可靠性3.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性3.2 3.2 容错系统的概念容错系统的概念3.3 3.3 硬件冗余硬件冗余3.4 3.4 软件冗余软件冗余3.5 3.5 磁盘阵列的编码容错方案磁盘阵列的编码容错方案5/17/202423.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性n可靠性:系统在规定的条件下,完成规定的功可靠性:系统在规定的条件下,完成规定的功能的能力。能的能力。n可靠性用可用度来度量。可靠性用可用度来度量。n可用度:系统在可用度:系统在t t时刻处于正常状态的概率。时刻处于正常状态的概率。n可用度计算:可用度计算:A(t)=A(t)=平均无故障时间平均无故障时间/(平均无故障时间平均无故障时间+平均修复时间平均修复时间)n平均无故障时间:平均无故障时间:MTBFMTBFn平均修复时间:平均修复时间:MTRF MTRF5/17/202433.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性可用性的定量表现:可用性的定量表现:n可靠性的测度方法:抗毁性,生存性,可靠性的测度方法:抗毁性,生存性,有效性。有效性。n可靠性表现为硬件可靠性,软件可靠性,可靠性表现为硬件可靠性,软件可靠性,人员可靠性,环境可靠性等。人员可靠性,环境可靠性等。n可维护性:平均修复时间:可维护性:平均修复时间:MTRFMTRFn维修保障:后勤支援能力维修保障:后勤支援能力5/17/202443.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性n浴盆曲线浴盆曲线5/17/202453.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性n电子元器件的质量等级;电子元器件的质量等级;n电子元器件的选用:电子元器件的选用:n对元器件性能的掌握;对元器件性能的掌握;n降额使用;降额使用;n热设计;热设计;n抗辐射设计;抗辐射设计;n防静电损伤;防静电损伤;n防操作过程中的损伤;防操作过程中的损伤;n储存与保管问题。储存与保管问题。5/17/202463.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性热设计技术热设计技术n热交换途径,热环境影响因素热交换途径,热环境影响因素(电能、机械能电能、机械能转换为热量转换为热量);n冷却方法:自然冷却、强迫风冷、冷板式冷却;冷却方法:自然冷却、强迫风冷、冷板式冷却;n“软件冷却软件冷却”n风道风道n水冷,液氮冷却水冷,液氮冷却n热管,导热热管,导热5/17/202473.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性n1963年发明并制造出热管,是高效传热元件。年发明并制造出热管,是高效传热元件。80年代前,热管用于卫星等高端系统。年代前,热管用于卫星等高端系统。n导管内填充了液态导热介质。热管两端产生温导管内填充了液态导热介质。热管两端产生温差的时候,蒸发端的液体就会迅速气化,将热差的时候,蒸发端的液体就会迅速气化,将热量带向冷凝端,速度非常快。液体在冷凝端凝量带向冷凝端,速度非常快。液体在冷凝端凝结液化以后,通过毛细作用,流回蒸发端。结液化以后,通过毛细作用,流回蒸发端。n水水-气之间的相变反应,使热管的热传导效率气之间的相变反应,使热管的热传导效率比普通的纯铜高许多倍。比普通的纯铜高许多倍。n 热管传热效果好,噪音低,使用寿命长。热管传热效果好,噪音低,使用寿命长。5/17/202483.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性5/17/202493.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性5/17/2024103.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性5/17/2024113.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性5/17/2024125/17/2024135/17/2024145/17/2024155/17/2024165/17/2024175/17/2024185/17/2024195/17/2024205/17/2024215/17/2024225/17/2024233.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性元器件布局元器件布局n发热元件分散安装发热元件分散安装n使热敏感元件处于低温区使热敏感元件处于低温区n采用短通路,减少传导热阻采用短通路,减少传导热阻n较少接触面热阻较少接触面热阻n印刷板热设计印刷板热设计n机箱热设计机箱热设计5/17/2024243.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性热分析手段热分析手段n热传导、热对流、热辐射热传导、热对流、热辐射n美美 BETAsoft软件,可实现器件级、电路板级、软件,可实现器件级、电路板级、系统级电子产品热分析和热设计。系统级电子产品热分析和热设计。5/17/2024253.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性5/17/2024265/17/2024275/17/2024283.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性故障、失效和错误的概念故障、失效和错误的概念 n失效是指硬件物理特性异变。失效是指硬件物理特性异变。n故障是指硬件或软件的错误状态,是失效在逻故障是指硬件或软件的错误状态,是失效在逻辑上的等效。一个故障可以用种类、值、影响辑上的等效。一个故障可以用种类、值、影响范围和发生时间来描述。范围和发生时间来描述。n错误是指程序或数据结构中的故障表现形式,错误是指程序或数据结构中的故障表现形式,是故障和失效所造成的后果。是故障和失效所造成的后果。5/17/2024293.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性故障的分类故障的分类 n故障可分为逻辑故障和非逻辑故障两种。故障可分为逻辑故障和非逻辑故障两种。n按时间划分,故障可分为以下三种:按时间划分,故障可分为以下三种:1.1.永久故障是指永远持续下去直至修复为止的故永久故障是指永远持续下去直至修复为止的故障。硬件的永久性故障意味着不可逆的物理变障。硬件的永久性故障意味着不可逆的物理变异。软件的永久性故障也是一个不可自动恢复异。软件的永久性故障也是一个不可自动恢复的错误状态。的错误状态。2.2.间歇性故障是短暂的、断续,它具有偶然性、间歇性故障是短暂的、断续,它具有偶然性、不定期的重复性。如一个处于临界状态的电路不定期的重复性。如一个处于临界状态的电路输出时好时坏,虚焊点也会引起这样的故障。输出时好时坏,虚焊点也会引起这样的故障。5/17/2024303.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性3.3.偶然性故障的出现是暂时的,且可能是非重复偶然性故障的出现是暂时的,且可能是非重复性的。常因环境的变化、电源干扰、元器件性性的。常因环境的变化、电源干扰、元器件性能的波动、软件的随机变化、电磁干扰等因素能的波动、软件的随机变化、电磁干扰等因素而引起。而引起。n统计表明,间歇性故障和偶然性故障占整个故统计表明,间歇性故障和偶然性故障占整个故障的很大比例,成为系统出错的主要根源。早障的很大比例,成为系统出错的主要根源。早期美国空军的一项研究报告指出,这类故障占期美国空军的一项研究报告指出,这类故障占所有故障的所有故障的80%80%。IBMIBM公司的一项报告指出:这公司的一项报告指出:这类故障占所有现场失效的类故障占所有现场失效的90%90%。5/17/2024313.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性n错误的根源:错误是失效和故障所引起的后果,错误的根源:错误是失效和故障所引起的后果,其根源可以归纳为下图。其根源可以归纳为下图。5/17/2024323.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性n容容错错技技术术能能达达到到对对故故障障的的“容容忍忍”,但但并并非非是是“无视无视”故障的存在。故障的存在。n它它首首先先能能自自动动地地适适时时地地检检测测并并诊诊断断出出系系统统的的故故障,然后采取对故障的控制或处理的策略。障,然后采取对故障的控制或处理的策略。n根根据据错错误误的的不不同同情情况况,一一个个容容错错系系统统可可能能分分1010个阶段个阶段:(1)(1)故故障障限限制制(2)(2)故故障障检检测测 (3)(3)故故障障屏屏蔽蔽 (4)(4)重重试试 (5)(5)诊诊断断 (6)(6)重重组组 (7)(7)恢恢复复 (8)(8)重重启启动动 (9)(9)修修复复(10)(10)重构重构5/17/2024333.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性n按按照照系系统统的的这这些些失失效效响响应应方方式式,容容错错技技术术可可分分成成三三种种:故故障障检检测测、静静态态冗冗余余、动动态态冗余。冗余。n静态冗余能容忍故障,但不给出故障警告。静态冗余能容忍故障,但不给出故障警告。n动动态态冗冗余余用用于于纠纠错错码码存存储储器器或或具具有有固固定定配配置置(即即线线路路器器件件之之间间的的逻逻辑辑连连接接保保持持不不变变)的多数表决冗余计算机之类的系统中。的多数表决冗余计算机之类的系统中。5/17/2024343.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性5/17/2024353.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性n提高系统可靠性的方法:提高系统可靠性的方法:n避错:提高软硬件质量,抵御故障。避错:提高软硬件质量,抵御故障。n容错:故障发生时系统仍能继续运行,容错:故障发生时系统仍能继续运行,提供服务与资源。提供服务与资源。n美国容错计算机有限公司美国容错计算机有限公司:Stratus:Stratusn天腾公司天腾公司TandenTanden Computers Computers,19741974年年成立。成立。5/17/2024363.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性Stratus容错服务器采用容错设计容错服务器采用容错设计n2004年年3月月29日日美美国国容容错错技技术术有有限限公公司司与与微微软软在在北北京京宣宣布布,Stratus生生产产的的基基于于Windows Server2000操作系统的容错服务器操作系统的容错服务器Ft Server。nFt Server是是基基于于Intel IA架架构构,使使用用可可互互相相替替换换的的冗冗余余硬硬件件。各各个个冗冗余余部部件件工工作作在在时时钟钟同同步步锁锁定定模模式式下下,以以单单一一的的操操作作系系统统映映像像,同同时时执执行相同的应用和交易。行相同的应用和交易。5/17/2024373.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性HP NonStop HP nNonStop是是HP工工业业标标准准服服务务器器系系列列产产品品中中的的高端产品,是一个开放的专用平台。高端产品,是一个开放的专用平台。nNonStop服服务务器器的的专专用用性性表表现现在在它它的的核核心心容容错错结结构构,可可进进行行全全面面的的故故障障检检测测和和隔隔离离,并并保保护护数数据据的的完完整整性性,整整个个系系统统无无任任何何单单点点故故障障,其其可可用用性性达达到到99.999%,足足以以让让最最关关键键和和复复杂杂的应用得到满足。的应用得到满足。5/17/2024383.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性n NonStop服服务务器器的的处处理理性性能能通通过过松松散散耦耦合合的的非非共共享享体体系系结结构构得得以以线线性性方方式式进进行行扩扩展展,支支持持2到到4080个个处处理理器器,并并对对用用户透明。户透明。nNonStop服务器正全面转向安腾平台。服务器正全面转向安腾平台。5/17/2024395/17/2024403.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性容错技术的发展与应用展望容错技术的发展与应用展望1.1.容错技术的应用是网络时代的客观需求容错技术的应用是网络时代的客观需求 2.2.软件容错技术将有较大进展软件容错技术将有较大进展 3.3.硬件容错、操作系统容错相结合的容错硬件容错、操作系统容错相结合的容错设计方法将备受重视设计方法将备受重视4.VLSI4.VLSI的容错设计技术将发挥巨大作用的容错设计技术将发挥巨大作用5.5.系统容错设计的应用目标明确系统容错设计的应用目标明确 5/17/2024413.1 3.1 什么是计算机系统的可靠性什么是计算机系统的可靠性容错技术的发展与应用展望容错技术的发展与应用展望6.6.容错技术应用向容错技术应用向PCPC发展发展 7.7.容错技术向智能化发展容错技术向智能化发展 8.8.容错技术应用和应用服务技术相结合容错技术应用和应用服务技术相结合 9.9.容错技术将走向开放化、标准化容错技术将走向开放化、标准化 5/17/2024423.2 3.2 容错系统的概念容错系统的概念n容错:系统资源冗余。容错:系统资源冗余。n硬件容错硬件容错n软件容错软件容错n时间容错:校验、纠错时间容错:校验、纠错n信息容错信息容错5/17/2024433.2 3.2 容错系统的概念容错系统的概念n元器件级容错元器件级容错n部件级容错部件级容错n分系统级容错分系统级容错n系统级容错系统级容错n容错:平衡可靠性与资源消耗的关系。容错:平衡可靠性与资源消耗的关系。5/17/2024443.2 3.2 容错系统的概念容错系统的概念容错系统工作过程容错系统工作过程n自动侦测自动侦测n自动切换自动切换n自动恢复自动恢复5/17/2024453.3 3.3 硬件冗余硬件冗余1.1.增加线路、设备、部件,形成备份增加线路、设备、部件,形成备份5/17/2024463.3 3.3 硬件冗余硬件冗余2.2.数据备份数据备份n数据备份的目的数据备份的目的n为为了了有有效效地地利利用用和和保保护护数数据据,存存储储备备份份是必不可少的措施。是必不可少的措施。n存储备份的主要目的有两个:存储备份的主要目的有两个:(1)(1)数据共享;数据共享;(2)(2)用于系统灾难恢复。用于系统灾难恢复。5/17/2024473.3 3.3 硬件冗余硬件冗余n信信息息存存储储系系统统的的可可靠靠性性和和可可用用性性、数数据据备备份份和和灾灾难难恢恢复复能能力力往往往往是是企企业业用用户户首首先先要要考虑的问题。考虑的问题。n为为防防止止灾灾难难事事件件对对数数据据的的毁毁坏坏,关关键键数数据据还要考虑还要考虑异地备份和容灾异地备份和容灾问题。问题。n数数据据的的灾灾难难恢恢复复是是保保证证系系统统安安全全可可靠靠的的基基础。础。5/17/2024483.3 3.3 硬件冗余硬件冗余n存储管理和维护自动化存储管理和维护自动化n由由于于存存储储系系统统越越来来越越复复杂杂,管管理理维维护护人人员员的的出出差差错错的的可可能能性性也也越越来来越越大大,稍稍不不注注意意就会丢失数据。就会丢失数据。n现现代代存存储储系系统统要要求求具具有有智智能能化化的的自自动动管管理理和维护功能。和维护功能。5/17/2024493.3 3.3 硬件冗余硬件冗余n备份策略备份策略:n备份策略是所要采用的备份方式备份策略是所要采用的备份方式,要根据要根据自己的实际情况来制定。自己的实际情况来制定。n基本的备份策略有三种。基本的备份策略有三种。5/17/2024503.3 3.3 硬件冗余硬件冗余n1.1.完全备份策略完全备份策略n每次都对自己的系统进行完全备份。每次都对自己的系统进行完全备份。123455/17/2024513.3 3.3 硬件冗余硬件冗余n2.2.增量备份策略增量备份策略n每次仅对增加或变更的数据进行备份。每次仅对增加或变更的数据进行备份。435215/17/2024523.3 3.3 硬件冗余硬件冗余n3.3.差分备份策略入差分备份策略入123455/17/2024533.3 3.3 硬件冗余硬件冗余n按备份介质存放位分为本地备份和异地按备份介质存放位分为本地备份和异地备份;备份;n按备份后数据是否可改变分为活备份与按备份后数据是否可改变分为活备份与死备份;死备份;n按选择的备份软件的功能可分为动态备按选择的备份软件的功能可分为动态备份和静态备份。份和静态备份。5/17/2024543.3 3.3 硬件冗余硬件冗余3.3.双机容错系统双机容错系统4.4.双机热备份双机热备份5.5.三机表决系统三机表决系统6.6.集群系统集群系统5/17/2024553.3 3.3 硬件冗余硬件冗余集群集群(Cluster)(Cluster)n集群技术可如下定义:一组相互独立的集群技术可如下定义:一组相互独立的服务器在网络中表现为单一的系统,并服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。此单一系以单一系统的模式加以管理。此单一系统为客户工作站提供高可靠性的服务。统为客户工作站提供高可靠性的服务。n大多数模式下,集群中所有的计算机拥大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上有一个共同的名称,集群内任一系统上运行的服务可被所有的网络客户所使用。运行的服务可被所有的网络客户所使用。5/17/2024563.3 3.3 硬件冗余硬件冗余集群集群(Cluster)(Cluster)n集群必须可以协调管理各分离的组件的集群必须可以协调管理各分离的组件的错误和失败,并可透明地向集群中加入错误和失败,并可透明地向集群中加入组件。组件。n一个集群包含多台一个集群包含多台(至少二台至少二台)拥有共享拥有共享数据存储空间的服务器。任何一台服务数据存储空间的服务器。任何一台服务器运行一个应用时,应用数据被存储在器运行一个应用时,应用数据被存储在共享的数据空间内。共享的数据空间内。5/17/2024573.3 3.3 硬件冗余硬件冗余集群集群(Cluster)(Cluster)n每台服务器的操作系统和应用程序文件存储在每台服务器的操作系统和应用程序文件存储在其各自的本地储存空间上。集群内各节点服务其各自的本地储存空间上。集群内各节点服务器通过一内部局域网相互通讯。当一台节点服器通过一内部局域网相互通讯。当一台节点服务器发生故障时,这台服务器上所运行的应用务器发生故障时,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。当一程序将在另一节点服务器上被自动接管。当一个应用服务发生故障时,应用服务将被重新启个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管。动或被另一台服务器接管。n当以上的任一故障发生时,客户都将能很快连当以上的任一故障发生时,客户都将能很快连接到新的应用服务上。接到新的应用服务上。5/17/2024583.3 3.3 硬件冗余硬件冗余集群集群(Cluster)(Cluster)n集群技术的出发点是提供高可靠性、可集群技术的出发点是提供高可靠性、可扩充性和抗灾难性。集群包含多台拥有扩充性和抗灾难性。集群包含多台拥有共享数据存储空间的服务器,各服务器共享数据存储空间的服务器,各服务器通过内部局域相互通信。通过内部局域相互通信。n当某一服务器故障时,它所运行的应用当某一服务器故障时,它所运行的应用程序将由其它服务器自动接管。程序将由其它服务器自动接管。5/17/2024593.3 3.3 硬件冗余硬件冗余n集群集群(Cluster)(Cluster)n群集群集n网格网格(grid)(grid)5/17/2024603.3 3.3 硬件冗余硬件冗余n服服务务器器群群集集:群群集集由由通通过过输输入入输输出出系系统统互互联联的的若若干干服服务务器器构构成成。这这些些服服务务器器连连接接到到存存储储介介质质中,由分布资源管理软件中,由分布资源管理软件DRMDRM进行管理。进行管理。n群群集集组组成成部部分分处处在在不不断断的的改改进进之之中中:刀刀片片式式服服务务器器,快快速速InfiniBand InfiniBand I/OI/O技技术术和和更更为为复复杂杂的的DRMDRM软件,这些部分组合在一起构成群集。软件,这些部分组合在一起构成群集。n群群集集是是由由一一组组独独立立的的计计算算机机组组成成,这这些些计计算算机机一一起起工工作作以以运运行行一一系系列列共共同同的的应应用用程程序序,为为客客户和应用提供单一的系统映射。户和应用提供单一的系统映射。5/17/2024613.3 3.3 硬件冗余硬件冗余n群集内的计算机物理上通过电缆连接,群集内的计算机物理上通过电缆连接,程序上则通过群集软件连接。程序上则通过群集软件连接。n群集允许计算机使用群集允许计算机使用故障应急故障应急与负载均与负载均衡功能。衡功能。5/17/2024623.3 3.3 硬件冗余硬件冗余Windows2000Windows2000群集技术:群集技术:n高度的可用性,可伸缩性,易管理性;高度的可用性,可伸缩性,易管理性;n在在 Windows2000 Windows2000 Advanced Advanced ServerServer和和Windows Windows 2000 2000 Data Data Center Center ServerServer操操作作系统支持群集技术。系统支持群集技术。5/17/2024633.3 3.3 硬件冗余硬件冗余Windows2000Windows2000群集技术:群集技术:n群群集集服服务务:这这种种服服务务起起初初是是针针对对为为数数据据库库、消消息息系系统统和和文文件件/打打印印服服务务等等应应用用提提供供故故障障应应急急支支持持的的要要求求而而开开发发的的。支支持持双双节节点点故故障障应应急急群群集集和和四节点群集。四节点群集。n网网络络负负载载均均衡衡(NLB):(NLB):该该项项服服务务可可在在3232个个节节点点的的群群集内平衡引入的集内平衡引入的IPIP通信量。通信量。n网网络络负负载载均均衡衡技技术术还还将将充充当当一一个个理理想想的的负负载载均均衡衡结结构构体体系系,在在分分布布式式的的WebWeb区区环环境境下下与与MSMS即即将将发发布的应用中心布的应用中心(AppCenter)(AppCenter)服务器共同使用。服务器共同使用。5/17/2024643.3 3.3 硬件冗余硬件冗余双机容错系统的结构双机容错系统的结构n(1)(1)双机并联结构双机并联结构n双双机机并并联联系系统统除除了了两两套套硬硬件件及及软软件件系系统统外外,还还需需要要配配置置专专用用切切换换软软件件和和管管理理软软件。件。n为为了了确确保保系系统统正正常常运运行行,必必须须不不断断地地进进行行两两种种检检查查:联联机机相相互互健健康康检检查查及及检检查查点检查。点检查。5/17/2024653.3 3.3 硬件冗余硬件冗余n双机并联系统结构图双机并联系统结构图5/17/2024663.3 3.3 硬件冗余硬件冗余n(2)(2)部件级容错系统部件级容错系统n这种部件级容错计算机系统只要单机配这种部件级容错计算机系统只要单机配置,没有切换软件,用户开发管理非常置,没有切换软件,用户开发管理非常方便,并且容错对用户透明,从而使系方便,并且容错对用户透明,从而使系统的应用开发费用大大降低。统的应用开发费用大大降低。5/17/2024673.3 3.3 硬件冗余硬件冗余n故障检测故障检测n为了检测错误,每块电路板上都有两组相同逻为了检测错误,每块电路板上都有两组相同逻辑,板内设计有比较自检测逻辑。辑,板内设计有比较自检测逻辑。n在发生故障时,为了实现容错,每种电路板和在发生故障时,为了实现容错,每种电路板和外围设备都是双重冗余的。外围设备都是双重冗余的。n故障处理故障处理n当一块电路板或相连接的外围设备故障时,它当一块电路板或相连接的外围设备故障时,它自己立即退出服务,并向操作系统发出一个中自己立即退出服务,并向操作系统发出一个中断信号,操作系统的维护软件判明这次出错是断信号,操作系统的维护软件判明这次出错是瞬时性的还是持久性的。瞬时性的还是持久性的。5/17/2024683.3 3.3 硬件冗余硬件冗余n部件级容错系统部件级容错系统5/17/2024693.4 3.4 软件冗余软件冗余n向前恢复向前恢复n向后恢复向后恢复1.1.恢复块方法恢复块方法n19751975,动态屏蔽技术,动态屏蔽技术恢恢复块方法,是复块方法,是一种向后恢复策略。一种向后恢复策略。5/17/2024705/17/2024713.4 3.4 软件冗余软件冗余2.N-2.N-版本程序设计版本程序设计n19771977,N-N-版本程序设计,是一种静态屏版本程序设计,是一种静态屏蔽技术蔽技术,采用向前恢复策略。采用向前恢复策略。5/17/2024725/17/2024733.4 3.4 软件冗余软件冗余3.3.防卫式程序设计防卫式程序设计n程序中包含错误检查代码和错误恢复代码;程序中包含错误检查代码和错误恢复代码;n发发生生错错误误时时,程程序序能能撤撤销销错错误误状状态态,恢恢复复到到一个已知的正常状态。一个已知的正常状态。5/17/2024743.5 3.5 磁盘阵列存储器的编码容错方案磁盘阵列存储器的编码容错方案nRAID(Redundant RAID(Redundant Array Array of of Inexpensive Inexpensive DriveDrive。nRAIDRAID的优点在于可用性、容量、性能。的优点在于可用性、容量、性能。n19881988年年加加利利福福尼尼亚亚大大学学伯伯克克莱莱分分校校的的PattersonPatterson教教授授等等人人提提出出了了廉廉价价磁磁盘盘冗冗余余阵列阵列RAIDRAID的概念。的概念。5/17/2024753.5 3.5 磁盘阵列存储器的编码容错方案磁盘阵列存储器的编码容错方案nRAIDRAID技术主要优点有:技术主要优点有:n把把多多个个磁磁盘盘组组织织在在一一起起作作为为一一个个逻逻辑辑卷,提供磁盘跨越功能。卷,提供磁盘跨越功能。n通通过过把把数数据据分分成成多多个个数数据据块块,并并行行写写/读多个磁盘以提高访问磁盘的速度。读多个磁盘以提高访问磁盘的速度。n通过镜像或校验操作提供容错能力。通过镜像或校验操作提供容错能力。5/17/2024763.5 3.5 磁盘阵列存储器的编码容错方案磁盘阵列存储器的编码容错方案n常用的常用的RAIDRAID级别有以下几种:级别有以下几种:nRAID0RAID0,RAID1RAID1,RAID0+1RAID0+1,RAID3RAID3,RAID5RAID5等。等。n为提高可靠性和性能,常使用为提高可靠性和性能,常使用RAID5RAID5和和RAIDRAID(0+10+1)。)。5/17/2024775/17/2024785/17/2024795/17/2024805/17/2024815/17/2024825/17/202483支持4个Serial ATA串行硬盘以及RAIDRAID 0,0,RAIDRAID 1,1,RAIDRAID 0+1 0+1。5/17/2024845/17/202485RAID0RAID05/17/202486RAID1RAID15/17/202487RAID0+1RAID0+15/17/2024883.5 3.5 磁盘阵列存储器的编码容错方案磁盘阵列存储器的编码容错方案nRAID 3RAID 3在安全方面以奇偶校验做错误校正及检在安全方面以奇偶校验做错误校正及检测,只需要一个额外的校检磁盘。测,只需要一个额外的校检磁盘。n奇偶校验值的计算是以各个磁盘的相对应位作奇偶校验值的计算是以各个磁盘的相对应位作XORXOR的逻辑运算,然后将结果写入奇偶校验磁的逻辑运算,然后将结果写入奇偶校验磁盘,任何数据的修改都要做奇偶校验计算。盘,任何数据的修改都要做奇偶校验计算。n如某一磁盘故障,换上新的磁盘后,整个磁盘如某一磁盘故障,换上新的磁盘后,整个磁盘阵列需重新计算一次,将故障磁盘的数据恢复阵列需重新计算一次,将故障磁盘的数据恢复并写入新磁盘中,如奇偶校验磁盘故障,则重并写入新磁盘中,如奇偶校验磁盘故障,则重新计算奇偶新计算奇偶 校验值,以达容错的要求。校验值,以达容错的要求。5/17/202489RAID 3RAID 35/17/2024903.5 3.5 磁盘阵列存储器的编码容错方案磁盘阵列存储器的编码容错方案nRAID 5RAID 5也是一种具容错能力的也是一种具容错能力的RAID RAID 操作方式,操作方式,但与但与RAID 3RAID 3不一样的是不一样的是RAID 5RAID 5的容错方式不应的容错方式不应用专用容错硬盘,容错信息是平均的分布到所用专用容错硬盘,容错信息是平均的分布到所有硬盘上。有硬盘上。n当阵列中有一个硬盘失效,磁盘阵列可以从其当阵列中有一个硬盘失效,磁盘阵列可以从其他的几个硬盘的对应数据中算出已掉失的数据。他的几个硬盘的对应数据中算出已掉失的数据。n由于我们需要保证失去的信息可以从另外的几由于我们需要保证失去的信息可以从另外的几个硬盘中算出来,我们就需要在一定容量的基个硬盘中算出来,我们就需要在一定容量的基础上多用一个硬盘以保证其他的成员硬盘可以础上多用一个硬盘以保证其他的成员硬盘可以无误地重组失去的数据。无误地重组失去的数据。5/17/2024913.5 3.5 磁盘阵列存储器的编码容错方案磁盘阵列存储器的编码容错方案n其总容量为其总容量为(N-1)x(N-1)x最低容量硬盘的容量。最低容量硬盘的容量。从容量效率来讲,从容量效率来讲,RAID 5RAID 5同样地消耗了同样地消耗了一个硬盘的容量,当有一个硬盘失效时,一个硬盘的容量,当有一个硬盘失效时,失效硬盘的数据可以从其他硬盘的容错失效硬盘的数据可以从其他硬盘的容错信息中重建出来,但如果有两个硬盘同信息中重建出来,但如果有两个硬盘同时失效的话,所有数据将尽失。时失效的话,所有数据将尽失。5/17/202492RAID 5RAID 55/17/2024933.5 3.5 磁盘阵列存储器的编码容错方案磁盘阵列存储器的编码容错方案nRAID 7RAID 7级是新一代级是新一代RAIDRAID标准。标准。nRAID 7RAID 7是存储计算机。是存储计算机。nRAID RAID 7 7自自身身带带有有智智能能化化实实时时操操作作系系统统和和用用于于存存储储管管理理的的软软件件工工具具,可可完完全全独独立立于主机运行,不占用主机于主机运行,不占用主机CPUCPU资源。资源。nRAID RAID 7 7具具有有更更高高的的性性能能和和卓卓越越的的存存储储管管理理能能力力,集集多多种种RAIDRAID优优点点于于一一身身,RAID RAID 7 7系统整体性能极佳。系统整体性能极佳。5/17/2024943.5 3.5 磁盘阵列存储器的编码容错方案磁盘阵列存储器的编码容错方案nRAID RAID 7 7存存储储计计算算机机操操作作系系统统是是一一套套实实时时事事件件驱驱动动操操作作系系统统。主主要要用用来来进进行行系系统统初初始始化化和和安安排排RAID RAID 7 7磁磁盘盘阵阵列列的的所所有有数数据据传传输输,并并把把它它们们转转换换到到相相应应的的物物理理存存储驱动器上。储驱动器上。n存存储储计计算算机机操操作作系系统统可可使使主主机机I/OI/O传传输输性性能达到最佳。能达到最佳。n如如果果一一个个磁磁盘盘出出现现故故障障,可可自自动动执执行行恢恢复操作,并可管理备份磁盘的重建过程。复操作,并可管理备份磁盘的重建过程。5/17/2024953.5 3.5 磁盘阵列存储器的编码容错方案磁盘阵列存储器的编码容错方案nRAID RAID 7 7采采用用了了非非同同步步访访问问方方式式,极极大大地地减轻了写数据的瓶颈,提高了减轻了写数据的瓶颈,提高了I/OI/O速度。速度。n非非同同步步访访问问:即即RAID RAID 7 7的的每每个个I/OI/O接接口口都都有有一一条条专专用用的的高高速速通通道道,作作为为数数据据或或控控制制信信息息的的流流通通路路径径,可可独独立立地地控控制制自自身身系统中每个磁盘的数据存取。系统中每个磁盘的数据存取。5/17/202496RAIDRAID5/17/202497RAIDRAID名称实质特点RAID 0数据分块将数据分布在多个盘上,无冗余信息(严格地说,它不属于RAID系列)。RAID 1镜像盘系统可靠性高,但效率低。RAID 2位交叉海明编译阵列原理上比较优越,但冗余信息的开销太大,未被广泛应用。RAID 3单盘容错并行传输阵列数据以位的形式存于各盘,冗余的奇偶校验信息存在一台专用盘上。RAID 4专用奇偶校验独立存取的阵列数据以块(块大小可变)交叉的方式存于各盘,冗余的校验信息存于一台专用盘上。RAID 5旋转奇偶校验独立存取的阵列数据以块交叉的方式于各盘,但无专用的校验盘,而是把冗余的奇偶校验信息均匀地分布在所有磁盘上。RAID 6二维奇偶校验独立存取的阵列数据以块的交叉方式存于各盘,冗余的检、纠错信息均匀分布于所有磁盘上。每次写入数据都要访问一个数据盘和两个校验盘,可容许双盘出错。RAID 7采用Cache和异步技术的RAID 6使响应速度和传输速率有较大的提高。5/17/202498JBODnJBOD(Justa Bunch Of Disks,磁盘簇,磁盘簇)nJBOD通常又称为通常又称为Span。nSpan是是在在逻逻辑辑上上把把几几个个物物理理磁磁盘盘一一个个接接一一个个串串联联到到一一起起,从从而而提提供供一一个个大大的的逻逻辑辑磁磁盘盘。Span上上的的数数据据简简单单地地从从第第一一个个磁磁盘盘开开始始存存储储,当当第第一一个个磁磁盘盘的的存存储储空空间间用完后,再依次从后面的磁盘开始存储数据。用完后,再依次从后面的磁盘开始存储数据。nSpan不不提提供供数数据据安安全全保保障障。它它只只是是简简单单地地提提供供一一种种利利用用磁磁盘盘空空间间的的方方法法,Span的的存存储储容容量量等等于于组组成成Span的所有磁盘的容量的总和。的所有磁盘的容量的总和。5/17/202499JBOD优缺点明显优缺点明显 nJBOD与与RAID阵阵列列相相比比较较的的优优势势在在于于它它的的低低成成本本,可可以将多个磁盘合并到共享电源和风扇的盒子里。以将多个磁盘合并到共享电源和风扇的盒子里。nJBOD最最主主要要的的问问题题是是在在单单独独的的磁磁盘盘出出现现故故障障时时缺缺少少恢恢复能力。复能力。nJBOD中中的的磁磁盘盘阵阵列列有有着着严严格格的的制制冷冷系系统统和和电电源源设设施施,理理论论上上,JBOD解解决决方方案案应应该该在在管管理理状状态态通通过过向向预预警警软软件发送标准信息来告知管理人员目前数据的问题。件发送标准信息来告知管理人员目前数据的问题。n其其中中的的一一个个解解决决办办法法是是软软件件RAID。从从主主机机端端来来看看,采采用用软软件件RAID和和JBOD的的结结合合与与硬硬件件RAID在在逻逻辑辑上上没没有任何区别。有任何区别。n对对于于共共享享存存储储,改改进进JBOD的的另另一一个个方方法法是是使使用用存存储储虚虚拟化设备,它们位于主机系统和拟化设备,它们位于主机系统和JBOD目标之间。目标之间。5/17/2024100Matrix RAIDn915/925芯片组中,芯片组中,Intel提出提出Matrix RAID技术。技术。nICH6南桥芯片除了支持传统的南桥芯片除了支持传统的RAID 0和和RAID 1外,还支持外,还支持Matrix RAID。nMatrix RAID技术将技术将RAID 0+1技术带技术带入低端应用。入低端应用。nMatrix RAID技术在技术在2块硬盘上实现块硬盘上实现RAID 01的功能。的功能。5/17/2024101Matrix RAID5/17/2024102Matrix RAIDn图图中中红红色色区区域域是是物物理理硬硬盘盘,蓝蓝色色区区域域是是系系统统中中形成的磁盘阵列。形成的磁盘阵列。n这这种种方方法法将将两两块块硬硬盘盘的的前前一一部部分分组组成成阵阵列列以以提提高高速速度度,而而在在后后面面部部分分使使用用镜镜像像模模式式提提供供对对重重要数据的保护。要数据的保护。n两两块块80GB的的硬硬盘盘可可获获得得80GB的的RAID 0和和40GB的的RIAD 1,总容量是原先的,总容量是原先的3/4。n这这是是一一个个折折中中方方案案,用用户户可可将将读读取取频频繁繁的的数数据据放在放在RAID 0上,将重要数据放在上,将重要数据放在RAID 1上。上。5/17/2024103Matrix RAIDn如如仅仅利利用用两两个个SATA通通道道来来创创建建Matrix RAID模模式式,可可利利用用余余下下的的两两个个SATA通通道道来来实实现现自自动重建和热备盘两个功能。动重建和热备盘两个功能。n自自动动重重建建是是针针对对RAID 0的的,当当系系统统通通过过S.M.A.R.T等等功功能能侦侦测测到到其其中中一一块块硬硬盘盘发发生生故故障障,有有损损坏坏可可能能的的时时候候,会会在在屏屏幕幕上上显显示示报报警警信信息息,提提醒醒用用户户插插入入一一块块完完好好的的硬硬盘盘,将将故故障障硬盘上的数据导入该硬盘后替换掉。硬盘上的数据导入该硬盘后替换掉。5/17/2024104Matrix RAIDn热热备备盘盘则则用用于于RAID 1,即即系系统统中中平平时时就就留留有有一一块块完完好好的的空空硬硬盘盘,当当组组成成RAID 1的的2块块硬硬盘盘中有中有1块损坏时,自动地接替它的工作。块损坏时,自动地接替它的工作。n由由于于Matrix RAID在在工工作作环环境境下下只只需需要要两两个个物物理理硬硬盘盘,因因此此用用户户可可以以配配备备第第三三个个SATA硬硬盘盘来来作作为为“热热备备用用”硬硬盘盘。如如果果出出现现硬硬盘盘崩崩溃溃,可可使使用用Matrix RAID的的第第三三个个“热热备备用用”硬硬盘盘对对RAID 1分区进行数据恢复和系统重建。分区进行数据恢复和系统重建。5/17/2024105Matrix RAIDn由由于于ICH6-R南南桥桥可可以以支支持持4个个SATA/150接接口口,因因此此可可以以利利用用四四块块硬硬盘盘来来组组建建双双Matrix RAID运运行行模模式式,而而这这两两个个Matrix RAID阵阵列列之间是相互独立的。之间是相互独立的。nMatrix RAID是是Intel的的独独门门技技术术,需需硬硬件件层层和和软软件件层层同同时时支支持持。目目前前Intel Application Acclerator软软件件和和Windows操操作作系系统统均均对对软软件层提供了支持。件层提供了支持。5/17/2024106实现磁盘容错功能的关键技术实现磁盘容错功能的关键技术1 1、自动检验技术、自动检验技术 n系系统统必必须须要要有有能能力力来来及及时时发发现现这这些些引引起起错错误误和和损坏的原因,提供完整的自动检验技术的支持。损坏的原因,提供完整的自动检验技术的支持。n自自校校验验装装置置不不仅仅能能及及时时检检查查出出系系统统模模块块的的差差错错,还能够检测出自身的差错。还能够检测出自身的差错。n自自动动检检验验技技术术可可以以大大大大提提高高系系统统对对差差错错的的反反应应能能力力,使使差差错错的的潜潜伏伏期期缩缩短短,能能有有效效地地放放置置错错误的进一步蔓延。误的进一步蔓延。5/17/2024107实现磁盘容错功能的关键技术实现磁盘容错功能的关键技术2 2、热定位技术、热定位技术 n热热定定位位技技术术对对写写入入磁磁盘盘的的数数据据进进行行一一些些检检查查比比较较工工作作,从从而而确确定定刚刚刚刚读读入入的的数数据据是是否否正正确确或或者是否有其他方面的问题。者是否有其他方面的问题。n进进行行检检修修比比较较工工作作时时,该该技技术术可可以以自自动动从从硬硬盘盘中中把把刚刚写写入入的的数数据据读读出出来来与与内内存存中中的的原原始始数数据据进行比较。进行比较。n如如出出现现错错误误,则则利利用用在在硬硬盘盘内内开开设设的的一一个个被被称称为为“热热定定位位重重定定区区”的的区区,将将硬硬盘盘坏坏区区记记录录下下来来,并并将将已已确确定定的的在在坏坏区区中中的的数数据据用用原原始始数数据据写入热定位重定区上。写入热定位重定区上。5/17/2024108实现磁盘容错功能的关键技术实现磁盘容错功能的关键技术3 3、全自动备份技术、全自动备份技术 4 4、故障的在线修复技术、故障的在线修复技术 5 5、文件分配表和目录表技术、文件分配表和目录表技术 6 6、事务跟踪技术、事务跟踪技术7 7、自动重启技术、自动重启技术 5/17/2024109磁带存储技术磁带存储技术n1.1.数据记录方式数据记录方式n(1)(1)线性记录方式线性记录方式n磁带机利用宽阔的磁带记录面获得更大面积的存磁带机利用宽阔的磁带记录面获得更大面积的存储空间,通过增加记录磁轨数量的方式提升数据储空间,通过增加记录磁轨数量的方式提升数据传输率。传输率。n线性记录磁带机机械构造简单、精度高,磁带介线性记录磁带机机械构造简单、精度高,磁带介质的磨损被降低到最低,可以更好地保护磁带中质的磨损被降低到最低,可以更好地保护磁带中的数据。的数据。5/17/2024110磁带存储技术磁带存储技术n1.1.数据记录方式数据记录方式n(2)(2)线性记录方式线性记录方式5/17/20241115/17/20241125/17/20241135/17/2024114HP SureStore DLT 80磁带机磁带机磁带存储技术磁带存储技术5/17/2024115昆腾SDLT220磁带机磁带存储技术磁带存储技术5/17/2024116盒式磁带盒式磁带5/17/2024117单键恢复单键恢复5/17/2024118HPLTOUltrium230磁带机磁带存储技术磁带存储技术5/17/2024119索尼AIT磁带机磁带存储技术磁带存储技术5/17/2024120磁带存储技术磁带存储技术n6.6.单键灾难恢复单键灾难恢复nHPHP单键灾难恢复最简捷的灾难恢复方案单键灾难恢复最简捷的灾难恢复方案n使用这种磁带机和最新的备份磁带,就可以在使用这种磁带机和最新的备份磁带,就可以在发生了硬盘故障、数据崩溃、病毒破坏及硬件发生了硬盘故障、数据崩溃、病毒破坏及硬件以旧换新后快速地进行数据恢复。以旧换新后快速地进行数据恢复。n很好的灾难恢复解决方案,使用极其简便。很好的灾难恢复解决方案,使用极其简便。5/17/2024121STKL700磁带库磁带存储技术磁带存储技术5/17/2024122ADICScalar10K磁带库磁带存储技术磁带存储技术5/17/2024123SAN&NASSAN&NASnDASDAS直连方式存储直连方式存储nSANSAN存储局域网络存储局域网络nNASNAS网络附加存储网络附加存储5/17/2024124SAN&NASSAN&NASnDASDAS方式中存储设备通过电缆直接到服务方式中存储设备通过电缆直接到服务器。器。nI/OI/O请求直接发送到存储设备。请求直接发送到存储设备。nDASDAS也称服务器附加存储也称服务器附加存储SASSAS。5/17/2024125SAN&NASSAN&NASSANSAN存储局域网络存储局域网络NASNAS网络附加存储网络附加存储nSANSAN以以数数据据存存储储为为中中心心,采采用用可可伸伸缩缩的的网网络络拓拓扑扑结结构构,通通过过高高速速光光通通道道连连接接,提提供供SANSAN内内部部任任意意节节点点之之间间的的多多路路可可选选择择的的数数据据交交换换,并并将将数据存储管理集中在相对独立的存储区域网内。数据存储管理集中在相对独立的存储区域网内。nSANSAN技技术术的的存存储储设设备备是是用用专专用用网网络络相相连连的的,目目前这个网络是基于光纤通道协议。前这个网络是基于光纤通道协议。nSANSAN实实现现在在多多种种操操作作系系统统下下,最最大大限限度度的的数数据据共享和数据优化管理,以及系统的无缝扩充。共享和数据优化管理,以及系统的无缝扩充。5/17/20241265/17/2024127SAN&NASSAN&NASnNASNAS是是专专业业的的网网络络文文件件存存储储及及文文件件备备份份设设备备,或称为网络直联存储设备、网络磁盘阵列。或称为网络直联存储设备、网络磁盘阵列。nNASNAS包括核心处理器、文件服务管理工具等。包括核心处理器、文件服务管理工具等。nNASNAS可以应用在任何的网络环境当中。可以应用在任何的网络环境当中。n主主服服务务器器和和客客户户端端可可以以非非常常方方便便地地在在NASNAS上上存存取任意格式的文件。取任意格式的文件。nNASNAS根根据据服服务务器器或或者者客客户户端端计计算算机机发发出出的的指指令令完成对内在文件的管理。完成对内在文件的管理。nNASNAS独立于操作平台。独立于操作平台。5/17/20241285/17/2024129SAN&NASSAN&NAS差别在原理上差别在原理上 nNAS以以文文件件传传输输协协议议为为基基础础,使使用用网网络络传传输输技技术实现;术实现;nSAN以以块块为为传传输输协协议议为为基基础础,通通过过光光纤纤通通道道传传输的技术。输的技术。nNAS是是专专门门为为文文件件服服务务的的设设备备,采采用用TCP/IP进进行行文文件件的的访访问问和和存存储储。采采用用专专用用操操作作系系统统进进行行文文件件的的处处理理,这这些些操操作作系系统统支支持持标标准准的的网网络络协议。协议。nSAN占占据据的的大大型型应应用用领领域域,NAS集集中中于于中中小小型型的应用,但也正在进入主流行业。的应用,但也正在进入主流行业。5/17/2024130存储虚拟化存储由配角变为主角存储由配角变为主角 n存存储储正正在在从从服服务务器器体体系系中中独独立立出出来来,成成为一个独立的资源。为一个独立的资源。n网络存储被推到了网络存储被推到了IP网络的中央。网络的中央。n数数据据以以存存储储为为中中心心不不仅仅仅仅是是计计算算机机业业的的重重大大技技术术革革新新,而而且且是是人人们们思思维维的的一一次次重重大大转转变变,制制造造商商和和提提供供商商以以数数据据为为驱驱动,客户以数据为中心布置业务。动,客户以数据为中心布置业务。5/17/2024131存储虚拟化存储需求催生虚拟存储存储需求催生虚拟存储 n互联网的发展和壮大,产生了许多以数互联网的发展和壮大,产生了许多以数据密集为主要特点的应用。据密集为主要特点的应用。n异构操作环境。异构操作环境。n高可用性高可用性n存储管理自动化与智能化的需求存储管理自动化与智能化的需求5/17/2024132存储虚拟化虚拟化存储并不虚幻虚拟化存储并不虚幻 n通过存储虚拟化的技术方法,将系统中通过存储虚拟化的技术方法,将系统中各种异构的存储设备映射为一个单一的各种异构的存储设备映射为一个单一的存储资源,对用户完全透明,达到互操存储资源,对用户完全透明,达到互操作性的目的。作性的目的。n典型的网络存储技术有典型的网络存储技术有NAS和和SAN两种。两种。5/17/2024133存储虚拟化分级存储分级存储整合多种存储设备整合多种存储设备 n分级存储是根据不同数据对存储服务不分级存储是根据不同数据对存储服务不同的需求,利用不同存储系统提供不同同的需求,利用不同存储系统提供不同的服务,整合了多种存储技术的优势,的服务,整合了多种存储技术的优势,消除了单一存储系统的不足。消除了单一存储系统的不足。5/17/2024134存储虚拟化n分级存储系统采用的主要技术包括以下一些:分级存储系统采用的主要技术包括以下一些:1.分分级级存存储储管管理理:按按照照系系统统管管理理员员预预设设的的各各种种指指令
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!