超大彩信业务平台应急预案

上传人:d**** 文档编号:56845541 上传时间:2022-02-22 格式:DOC 页数:45 大小:215.50KB
返回 下载 相关 举报
超大彩信业务平台应急预案_第1页
第1页 / 共45页
超大彩信业务平台应急预案_第2页
第2页 / 共45页
超大彩信业务平台应急预案_第3页
第3页 / 共45页
亲,该文档总共45页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
超大彩信业务平台应急指导书中国电信系统集成有限责任公司内蒙古分公司2010年 08月目录第1章目的第2章使用对象第3章适用场合第4章应急处理流程说明 紧急情况界定 应急措施及应急流程 第5章常见故障及应急处理篇 硬件故障篇电源故障防火墙、交换机故障 路由器故障 超级彩信平台服务器硬件故障 软件故障篇超级彩信平台程序软件故障 超级彩信平台数据库软件故障 第6章预警处理篇CPU过负荷预警处理内存预警处理磁盘空间预警处理 超级彩信平台程序故障预警处理 超级彩信平台数据库故障预警处理 第7章应急资源配备第 1章 目的为保证公司业务的正常运行,避免和减少公司各服务器出现严重问题,在出现问题时能根据本方案及以前的备份资料迅速及时恢复系统的正常运行;保 证公司数据的完整性,并可随时恢复;减少故障对公司的损失。为了规范项目, 便于维护人员在紧急情况下对硬件及软件的常见问题做出及时的 判断和分析,特编写业务平台的应急预案书。第 2章 使用对象项目维护人员第3章 适用场合网络安全漏洞造成数据被恶意攻击破坏,未采用容灾方案,数据在外界灾害中被破坏,用户硬件故障造成的数据损失,电力实效。第4章 应急处理流程说明4.1 紧急情况界定发生电力故障时第一时间保证重要服务器、路由器及交换机的电源,关掉业务不是很重要的服务器,这样可以在断电时保证网络的基本运行,确保各分公司正常连接办公网、相关业务系统基本不受影响。并询问人事部故障处理时间,如果断电时间超出 UPS使用时间,可通知各部 UPS电源可待机时间在UPS电源只够支撑半个小时的时候,电话通知各部做好文档保存工作,一 线营业部门做好手工记帐准备,服务将在15分钟后中断。确定各部做好保存工作后将各组服务器关机,等待电力恢复。电力恢复后,将各服务器和网 络设备幵机,检查各组服务器和网络运行情况,发现故障及时跟进处理,确 认运行正常后,电话各部通知服务已恢复正常运行。恢复后将结果报知部门经 理 并 做 好 相 关 记 录4.2 应急措施及应急流程硬件故障应急流程:当发生硬件故障时第一时间分析故障原因 , 用排除法找到故障原因 . 如果是 内存、硬盘、电源故障可及时使用备用零件替换 如果是CPU主板可用备用 服务器顶替,以确保服务不中断。如果当值人员无法排除故障,可向本部同 事请求技术支持并向本部经理汇报情况,由经理统一协调。发生故障同时电 话通知相关业务部门,告知故障原因、处理时间,故障处理结束后电话通知 使用部门和部门经理告知处理结果。并将处理结果在服务器重大事件处理 登记表做好记录。软件故障应急流程:当发生软件故障时第一时间分析故障原因 , 当系统出现崩溃时,可通过系统GHOS备份还原系统。(系统GHOST在本机与文件服务器都做了备份)。当系 统中病毒时,可进入安全模式查杀病毒和木马 , 安全模式无法进入的话可将 硬盘外挂到另一台电脑进行查杀。当服务器数据库损坏后,可及时通过SQL恢复本机的备份数据。 (数据库在本机与磁带机都有备份) 。如果当值人员无 法排除故障,可向本部同事请求技术支持并向本部经理汇报情况,由经理统 一协调。发生故障同时电话通知相关业务部门,告知故障原因、处理时间, 故障处理结束后电话通知使用部门和部门经理告知处理结果。并将处理结果 在服务器重大事件处理登记表做好记录。人为及自然损坏应急方案:当发生人为及自然损坏时,第一时间通知部门经理由经理统一协调,发生服务器被盗和暴力破坏服务器时,可选择报警,追究破坏者刑事责任,从其它公司部门借调服务器,重新恢复相关数据。当发生数据被盗时,查看监控录 像或服务器日志。报警追究刑事责任。发生不可抗力服务器自然损坏时 , 从 其它公司部门借调服务器,重新恢复相关数据。并将处理结果在服务器重 大事件处理登记表做好记录。第 5章 常见故障及应急处理篇本篇主要介绍在日常维护及应急处理中的一些常见硬件及软件故障, 指导相 关超大彩信平台维护人员掌握日常应急处理方法及流程。5.1 硬件故障篇本篇主要介绍在日常维护及应急处理中的一些常见硬件故障,指导相关超大 彩信平台维护人员掌握日常应急处理方法及流程。5.1.1 电源故障 电源指示灯报警,正常状态为绿色,报警状态为红色,建议联系供应商更换 电源。5.1.2 防火墙、交换机故障 防火墙、交换机故障会导致与各个外部实体网源连接中断,同时,也会导致超大彩信平台数据库与业务进程之间的通讯中断,导致程序异常,业务全阻5.1.3 路由器故障5.1.4 超大彩信平台服务器硬件故障服务器故障常见问题安全第一 为您和您的系统着想小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品 文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单 的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。 请阅读并按照产品附带的安全说明进行操作。系统启动失败故障排除在启动过程中,如果系统在出现视频图像或 LCD 消息之前停机,尤其是在安装 操作系统或重新配置系统硬件之后发生这种故障,请检查下列情况。在 UEFI 引导模式下安装操作系统之后,如果采用 BIOS 引导模式引导系统,系 统便会挂起。反之亦然。您必须引导至您在安装操作系统时所采用的引导模式。 请参阅 使用系统设置程序和 UEFI 引导管理器 。无效的内存配置可能导致系统启动时停机,并且无任何视频输出。请参阅 系统 内存。有关其它所有启动问题,请留意 LCD 面板消息和屏幕上显示的任何系统消息。有关详情,请参阅 LCD 状态信息 和系统信息 。外部连接故障排除 对任何外部设备进行故障排除之前, 请确保所有外部电缆均已牢固地连接至系统 上的外部连接器。有关系统上的前面板连接器和背面板连接器的信息,请参阅图1-2 和图 1-5 。视频子系统故障排除检查显示器与系统和电源的连接。 检查系统到显示器之间的视频接口连线。 如果系统连接了两台显示器,请断开其中一台的连接。系统仅支持将一台显示器 连接到前面板或背面板视频连接器。请尝试使用已知可正常工作的显示器。运行相应的联机诊断检测程序。请参阅 使用 Dell? PowerEdge? Diagnostics 如果检测程序运行成功,则问题与视频硬件无关。 如果检测程序运行失败,请参阅 获得帮助 。USB 设备故障排除请转使用下列步骤对 USB 键盘和 / 或鼠标进行故障排除。对于其它 USB 设备, 至步骤 2 。从系统中暂时拆除键盘和鼠标电缆,然后再重新连接。 将键盘/鼠标连接至系统另一面的 USB 端口。 如果问题得以解决,请重新启动系统,进入系统设置程序,检查是否已启用不工 作的 USB 端口。将此键盘 / 鼠标更换为其它可正常工作的键盘 / 鼠标 如果问题得以解决,请更换有故障的键盘 / 鼠标。 如果问题仍然存在,请继续执行下一步骤,开始对与系统相连的其它 USB 设备 进行故障排除。关闭所有连接的 USB 设备,断开它们与系统的连接。 重新启动系统,如果键盘正常工作,则进入系统设置程序。验证是否启用了所有USB 端口。请参阅 Integrated Devices (集成设备)屏幕 。 如果键盘不能正常工作,还可以使用远程访问。 重新连接,每次打开一个 USB 设备的电源。 如果某一设备造成同一问题,请关闭该设备的电源,更换 USB 电缆,然后再打 开该设备的电源。如果问题仍然存在,请更换此设备。 如果所有故障排除均失败,请参阅 获得帮助 。 串行 I/O 设备故障排除 关闭系统和所有连接的外围设备,并断开系统与电源插座的连接。 将串行接口电缆更换为另一条可正常工作的电缆,并打开系统和串行设备。 如果问题得以解决,则请更换接口电缆。关闭系统和串行设备,将该设备更换为同类设备。 打开系统和串行设备。如果问题得以解决,请更换串行设备 如果问题仍然存在,请参阅 获得帮助 。NIC 故障排除运行相应的联机诊断检测程序。请参阅 使用 Dell? PowerEdge? Diagnostics 。 重新启动系统,并检查与 NIC 控制器相关的任何系统信息。查看 NIC 连接器上的相应指示灯。请参阅 NIC 指示灯代码 。 如果链路指示灯不亮,请检查所有电缆的连接。 如果活动指示灯不亮,则网络驱动程序文件可能已损坏或丢失。 使用交换机或集线器上的另一个连接器。如果使用的是 NIC 卡而非嵌入式 NIC ,请参阅 NIC 卡的说明文件。 确保安装了相应的驱动程序并捆绑了协议。请参阅 NIC 的说明文件。 进入系统设置程序,并确认已启用 NIC 端口。请参阅 Integrated Devices (集 成设备)屏幕 。确保将网络上的 NIC 、集线器和交换机设置为相同数据传输速率和双工。请参阅 每个网络设备的说明文件。确保所有网络电缆的类型无误,并且未超出最大长度限制。 如果所有故障排除均失败,请参阅 获得帮助 。受潮系统故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内请阅读并按照产品附带的安全说明进行操作。关闭系统和连接的外围设备,并断开系统与电源插座的连接 打开系统护盖。请参阅 打开系统 。 拆除系统上的组件。请参阅 安装系统组件 。 冷却导流罩 硬盘驱动器SD 卡USB 存储钥匙NIC 硬件卡锁内部 SD 模块 扩充卡和两个扩充卡提升板 集成存储控制器 iDRAC6 Enterprise 卡 电源设备 处理器和散热器 内存模块 风扇支架使系统彻底干燥至少 24 小时。重新安装处理器和散热器、内存模块、电源设备、冷却导流罩和风扇支架。合上系统护盖。请参阅 合上系统 。将系统重新连接至电源插座,然后开机。如果系统未正常启动,请参阅 获得帮助 。如果系统正常启动,请关闭系统,然后重新安装步骤 3 中拆下的其余组件。请 参阅 安装扩充卡 。运行相应的联机诊断检测程序。请参阅 使用 Dell? PowerEdge? Diagnostics如果检测程序运行失败,请参阅 获得帮助 。受损系统故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品 文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单 的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。 请阅读并按照产品附带的安全说明进行操作。关闭系统和连接的外围设备,并断开系统与电源插座的连接。打开系统护盖。请参阅 打开系统 。确保已正确安装以下组件:扩充卡和两个扩充卡提升板 电源设备 风扇和冷却导流罩 处理器和散热器内存模块硬盘驱动器托盘确保所有电缆均已正确连接。合上系统护盖。请参阅 合上系统 。运行系统诊断程序中的系统板检测程序。请参阅 运行系统诊断程序 。如果检测程序运行失败,请参阅 获得帮助 。 系统电池故障排除通过系统设置程序重新输入时间和日期。请参阅 使用系统设置程序和 UEFI 引导管理器 。关闭系统并断开系统与电源插座的连接,然后至少等待一小时。 将系统重新连接至电源插座,并打开系统。进入系统设置程序。如果系统设置程序中的日期和时间不正确,请更换电池。请参阅 系统电池 。小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品 文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单 的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。请阅读并按照产品附带的安全说明进行操作 如果更换电池仍不能解决问题,请参阅 获得帮助 。对电源设备进行故障排除小心: 要使系统运行,必须至少安装一个电源设备。仅使用安装的一个电源设 备长时间运行系统,而且 PS2 电源设备托架中并没有安装电源设备挡片,则可 能导致系统过热。通过电源设备状态指示灯来标识有故障的电源设备。请参阅 电源指示灯代码 。小心: 如果对电源设备不匹配错误进行故障排除,请仅更换指示灯闪烁的电源 设备。如果更换另一电源设备来形成匹配电源对,则可能导致故障状态和系统 意外关机。要从 高输出 配置更改为 能量智能 配置或进行反向更改,则必须 关闭系统电源。通过拆卸和重新安装的方法来重置电源设备。请参阅 卸下电源设备 和装回电源设备。注: 安装完电源设备后,请等待几秒钟,以便系统识别电源设备并确定其是否 可以正常工作。状态指示灯呈绿色亮起,表示电源设备可以正常工作。如果问题仍然存在,请用相同类型的电源设备更换故障电源设备。如果问题仍然存在,请参阅 获得帮助 。系统冷却问题故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单 的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内 请阅读并按照产品附带的安全说明进行操作。确保不存在以下情况: 卸下了系统护盖、冷却导流罩、驱动器挡片、电源设备挡片(在单电源设备配置 中)或前后填充面板。在单处理器配置中卸下了 FAN5 挡片或散热器挡片。 未遵照扩充卡安装原则。请参阅 扩充卡安装原则 。 环境温度太高。关于系统的工作温度要求,请参阅使用入门指南 。 外部通风受阻。系统内部电缆妨碍了通风。 某个冷却风扇被卸下或出现故障。请参阅 风扇故障排除 。 风扇故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品 文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单 的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内 请阅读并按照产品附带的安全说明进行操作。小心: 所有冷却风扇均可热插拔。要在系统运行时保持正常的冷却效果,请每 次仅更换一个风扇。根据 LCD 面板或诊断软件的指示找到出现故障的风扇。重置风扇。请参阅 卸下冷却风扇 和 装回冷却风扇 。注: 等待至少 30 秒钟,以便系统识别风扇并确定风扇是否正常工作。如果问题仍未解决,请安装新的风扇。如果更换的风扇仍不能正常运行,请参阅 获得帮助 。系统内存故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。 您只应按照产品 文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单 的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。 请阅读并按照产品附带的安全说明进行操作。注: 无效的内存配置可能导致系统启动时停机,并且无视频输出。请参阅 内 存模块一般安装原则 ,并验证您的内存配置是否符合所有适用的原则。如果系统可以运行,请运行相应的联机诊断检测程序。请参阅 使用 Dell? PowerEdge? Diagnostics 。如果诊断程序指示出现故障,请按照诊断程序提供的更正措施进行操作。请视需要对内14 。II。等待至少 10 秒钟,然后将系统重新连接至电源。打开系统及连接的外围设备,并留意屏幕或 LCD 面板上的消息。 如果系统显示特定内存模块出现故障的错误信息,请转至步骤 14 进入系统设置程序并检查系统内存设置。请参阅 内存设置屏幕 。 存设置进行更改。如果内存设置符合所安装的内存,但仍指示存在问题,请转至步骤 关闭系统和连接的外围设备,并断开系统与电源插座的连接。 打开系统护盖。请参阅 打开系统 。卸下冷却导流罩。请参阅 卸下冷却导流罩 。 检查内存通道,确保内存插装无误。请参阅 内存模块一般安装原则 在各自插槽中重置内存模块。请参阅 安装内存模块 。装回冷却导流罩。请参阅 安装冷却导流罩 。 合上系统护盖。请参阅 合上系统 。 将系统重新连接至电源插座,并打开系统和连接的外围设备。 进入系统设置程序并检查系统内存设置。请参阅 内存设置屏幕 。 如果问题未解决,请继续执行下一步。 关闭系统和连接的外围设备,并断开系统与电源的连接。 打开系统护盖。请参阅 打开系统 。卸下冷却导流罩。请参阅 卸下冷却导流罩 如果诊断检测程序或错误信息指示特定内存模块出现故障,请更换该模块。 要对未指定的故障内存模块进行故障排除, 请用相同类型和容量的内存模块更换 第一个 DIMM 插槽中的模块。请参阅 安装内存模块 。 装回冷却导流罩。请参阅 安装冷却导流罩 。 合上系统护盖。请参阅 合上系统 。 将系统重新连接至电源插座,并打开系统和连接的外围设备。 在系统进行引导时,注意观察屏幕上或系统正面 LCD 面板上显示的所有错误信 息。如果仍然指示存在内存问题,则对安装的每个内存模块重复执行步骤 14 至步骤 22。如果检查所有内存模块后,问题仍然存在,请参阅获得帮助 。内部 SD 卡故障排除小心:许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单 的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。 请阅读并按照产品附带的安全说明进行操作。进入系统设置程序,确保已启用内部 SD 卡端口。请参阅 Integrated Devices(集成设备)屏幕 。打开系统护盖。请参阅 打开系统 。重置内部 SD 模块电缆。请参阅 安装内部 SD 模块。找到 SD 卡并予以重置。请参阅 卸下内部 SD 闪存卡和安装内部 SD 闪存卡II。合上系统护盖。请参阅 合上系统 。打开系统和连接的外围设备,并检查 SD 卡是否运行正常。如果问题仍未解决,则重复步骤 2 和步骤 3 。插入已知可正常工作的其它 SD 卡。合上系统护盖。请参阅 合上系统 。打开系统和连接的外围设备,并检查 SD 卡是否运行正常。如果问题仍未解决,请参阅 获得帮助 。内部 USB 存储钥匙故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品 文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单 的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。 请阅读并按照产品附带的安全说明进行操作。进入系统设置程序,并确保已启用内部 USB 钥匙端口。请参阅 Integrated Devices (集成设备)屏幕 。打开系统护盖。请参阅 打开系统 。找到内部 USB 钥匙并予以重置。请参阅 内部 USB 存储钥匙 。合上系统护盖。请参阅 合上系统 。打开系统和连接的外围设备,并检查 USB 钥匙是否运行正常。如果问题仍未解决,则重复步骤 2 和步骤 3 。插入已知能正常工作的其它 USB 钥匙。合上系统护盖。请参阅 合上系统 。打开系统和连接的外围设备,并检查 USB 钥匙是否运行正常。如果问题仍未解决,请参阅 获得帮助 。光盘驱动器故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品 文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单 的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。 请阅读并按照产品附带的安全说明进行操作。请卸下挡板(如果有) 。请参阅 卸下前挡板 。尝试使用其它 DVD。确保已正确安装和配置光盘驱动器的设备驱动程序。进入系统设置程序并确保已启用驱动器的控制器。请参阅 使用系统设置程序和UEFI 引导管理器 。运行相应的联机诊断检测程序。请参阅 使用 Dell? PowerEdge? Diagnostics关闭系统和连接的外围设备,并断开系统与电源插座的连接。 打开系统护盖。请参阅 打开系统 。 确保接口电缆已稳固地连接至光盘驱动器和系统板。请参阅 光盘驱动器 确保电源电缆已正确地连接至驱动器和系统板。合上系统护盖。请参阅 合上系统 。 将系统重新连接至电源插座,并打开系统和连接的外围设备。 如果问题仍未解决,请参阅 获得帮助 。磁带备份装置故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品 文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单 的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内 请阅读并按照产品附带的安全说明进行操作。尝试使用其它盒式磁带。 确保已正确安装和配置磁带驱动器的设备驱动程序。请参阅磁带备份装置说明文 件,了解有关设备驱动程序的详细信息。按照磁带备份软件说明文件中的说明重新安装磁带备份软件。 对于外部磁带备份装置,请确保接口电缆完全连接至磁带设备和控制器卡上的外 部端口对于 SCSI 磁带备份装置,请验证是否为磁带设备配置了唯一的 SCSI ID 号, 以及接口电缆是否已正确终止。 请参阅磁带备份装置的说明文件,了解有关如何选择SCSI ID 号以及如何终止SCSI 电缆的说明。运行相应的联机诊断检测程序。请参阅 使用 Dell? PowerEdge? Diagnostics 关闭系统和连接的外围设备,并断开系统与电源插座的连接。打开系统护盖。请参阅 打开系统 。 检查内部电缆和控制器连接。对于 SCSI 磁带设备,请重置扩充卡插槽中的 SCSI 控制器卡,并确保接口电缆 牢固地连接至 SCSI 连接器。对于 SATA 磁带设备,请重置与系统板 SATA 连接器相连的接口电缆。 确保电源电缆已正确地连接至驱动器和系统板。合上系统护盖。请参阅 合上系统 。 将系统重新连接至电源插座,并打开系统和连接的外围设备。 如果问题仍未解决,请参阅磁带驱动器说明文件以获得其它故障排除指导。 如果无法解决此问题,请参阅 获得帮助 。硬盘驱动器故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内请阅读并按照产品附带的安全说明进行操作。小心: 此故障排除步骤可能会破坏硬盘驱动器上存储的数据。进行故障排除之 前,请备份硬盘驱动器上存储的所有文件。运行相应的联机诊断检测程序。请参阅 使用 Dell? PowerEdge? Diagnostics 根据诊断检测程序的结果,按需要继续执行以下步骤。卸下挡板。请参阅 卸下前挡板 。如果已在 RAID 阵列中配置硬盘驱动器,请执行以下步骤。 重新启动系统,并进入主机适配器配置公用程序,对于 PERC 控制器,请按 ,对于 SAS 控制器,则按 。有关配置公用程序的信息,请参阅主机适配器附带的说明文件。确保已正确配置 RAID 阵列的硬盘驱动器。 使硬盘驱动器处于脱机状态,然后重置硬盘驱动器。请参阅 卸下热插拔硬盘驱动器。退出配置公用程序并允许系统引导至操作系统。 确保已正确安装和配置控制器卡所需的设备驱动程序。有关详情,请参阅操作系 统说明文件。重新启动系统,进入系统设置程序,并验证控制器是否已启用,以及驱动器是否 在系统设置程序中出现。请参阅 使用系统设置程序和 UEFI 引导管理器 。存储控制器故障排除注: 对 SAS 或 PERC 控制器进行故障排除时,另请参阅操作系统和控制器的 说明文件。运行相应的联机诊断检测程序。请参阅 使用 Dell? PowerEdge? Diagnostics 进入系统设置程序并确保已启用 SAS 或 PERC 控制器。 请参阅 使用系统设置程 序和 UEFI 引导管理器 。重新启动系统并按住相应的按键组合进入配置公用程序: 组合键,用于 SAS 控制器 组合键,用于 PERC 控制器有关配置设置的信息,请参阅控制器的说明文件。检查配置设置,进行必要的更正,然后重新启动系统。小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品 文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单 的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。 请阅读并按照产品附带的安全说明进行操作。关闭系统和连接的外围设备,并断开系统与电源插座的连接。如果使用电池缓存 PERC 控制器, 请确保 RAID 电池已正确连接且 PERC 卡上的 内存模块已正确就位(如果可用) 。验证 SAS 背板和集成存储控制器之间的电缆连接是否正确。请参阅 安装集成存 储控制器卡 和图 6-3。确保电缆已牢固地连接至存储控制器和 SAS 背板。合上系统护盖。请参阅 合上系统 。将系统重新连接至电源插座,并打开系统和连接的外围设备。如果问题仍然存在,请参阅 获得帮助 。扩充卡故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。 您只应按照产品 文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单 的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。 请阅读并按照产品附带的安全说明进行操作。注: 进行扩充卡故障排除时,请参阅操作系统和扩充卡的说明文件。运行相应的联机诊断检测程序。请参阅 使用 Dell? PowerEdge? Diagnostics关闭系统和连接的外围设备,并断开系统与电源插座的连接。重置连接器中未牢固就位的扩充卡。请参阅 安装扩充卡 。 合上系统护盖。请参阅 合上系统 。 将系统重新连接至电源插座,并打开系统和连接的外围设备。 如果问题仍未解决,请继续执行步骤 8 。 关闭系统和连接的外围设备,并断开系统与电源插座的连接。 打开系统护盖。请参阅 打开系统 。 卸下系统中安装的所有扩充卡。请参阅 卸下扩充卡 。 将扩充卡提升板重置到系统板上。请参阅 扩充卡和扩充卡提升板 合上系统护盖。请参阅 合上系统 。 将系统重新连接至电源插座,并打开系统和连接的外围设备。 运行相应的联机诊断检测程序。 如果检测程序运行失败,请参阅 获得帮助 。对于在步骤 10 中卸下的每个扩充卡,执行以下步骤: 关闭系统和连接的外围设备,并断开系统与电源插座的连接。 打开系统护盖。请参阅 打开系统 。重新安装其中一个扩充卡。合上系统护盖。请参阅 合上系统 。 运行相应的诊断检测程序。如果检测程序运行失败,请参阅 获得帮助 。处理器故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品 文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单 的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。 请阅读并按照产品附带的安全说明进行操作。运行相应的联机诊断检测程序。请参阅 使用 Dell? PowerEdge? Diagnostics 关闭系统和连接的外围设备,并断开系统与电源插座的连接。打开系统护盖。请参阅 打开系统 。 卸下冷却导流罩。请参阅 卸下冷却导流罩 。 确保已正确安装了所有处理器和散热器。请参阅 安装处理器 。 装回冷却导流罩。请参阅 安装冷却导流罩 。合上系统护盖。请参阅 合上系统 。 将系统重新连接至电源插座,并打开系统和连接的外围设备。 运行相应的联机诊断检测程序。 如果您的系统只有一个处理器,但仍然显示有问题,请参阅获得帮助 。对于有多个处理器的系统,关闭系统和连接的外围设备,并断开系统和电源插座 的连接。卸下冷却导流罩。请参阅 卸下冷却导流罩 。小心: 卸下处理器时,请注意不要碰弯 ZIF 插槽上的任何插针。碰弯插针会 对系统板造成永久损坏。卸下处理器 2 。请参阅 卸下处理器 。 装回冷却导流罩。请参阅 安装冷却导流罩 。 合上系统护盖。请参阅 合上系统 。将系统重新连接至电源插座,并打开系统和连接的外围设备。 运行相应的联机诊断检测程序。 如果检测程序运行失败,则说明该处理器出现故障。请参阅 获得帮助 。关闭系统和连接的外围设备,并断开系统与电源插座的连接。 打开系统护盖。请参阅 打开系统 。卸下冷却导流罩。请参阅 卸下冷却导流罩 。 将处理器更换为步骤 13 中卸下的处理器。请参阅 安装处理器 。 装回冷却导流罩。请参阅 安装冷却导流罩 。重复执行步骤 17 至步骤 15 。MD3000 存储故障常见问题5.2安全第一一为您和您的存储设备着想要执行本说明文件中的某些步骤,必须拆装存储设备内部组件。拆装存储设备内部组件 时,请勿尝试执行维修操作,除非本指南和说明文件中有所说明。警告:只有经过培训的维修技术人员才能卸下存储设备护盖并拆装存储设备的任何内部组件。执行任何步骤之前,请参阅产品信息指南,以获取有关安全预防措施、拆装存储设备内部组件和防止静电损害的详细信息。5.3启动例行程序在存储设备启动例行程序期间,请观察和倾听 表?5-1中说明的现象。有关前面板指示 灯和背面板指示灯的说明,请参阅 关于系统。表5-1.?启动例行程序期间的现象?观察/倾听:操作警报信息。请参阅存储管理说明文件。访冋物理磁盘时听到的异常、持续刮擦声或摩擦声。请参阅获得帮助。注:存储设备中必须至少安装两个物理磁盘5.4排除外部连接故障问题的原因很可能是电缆松动或连接不正确以及插针弯曲。 确保所有外部电缆都稳固地 连接至系统上的外部连接器并且所有连接器都没有损坏。有关存储设备上的背面板连接 器,请参阅背面板指示灯和部件。5.5排除受潮存储设备的故障问题液体洒落在存储设备上。湿度过大。操作警告:只有经过培训的维修技术人员才能卸下存储设备护盖并拆装存储设备的任何内部组件。执行任何步骤之前,请参阅产品信息指南,以获取有关安全预防措施、拆装存储设备内部组件和防止静电损害的详细信息。1. 关闭存储设备电源并断幵所有电源连接。2. 从存储设备中卸下所有的物理磁盘。请参阅卸下和安装物理磁盘o3. 从存储设备中卸下 RAID控制器模块。请参阅 卸下和安装RAID控制器模 块。4. 从存储设备中卸下电源设备/冷却风扇模块。请参阅 卸下和安装电源设备/ 冷却风扇模块。5. 卸下存储设备中间板。请参阅 卸下和安装中间板。6. 使存储设备彻底干燥至少 24小时。7. 重新安装前面步骤中卸下的所有组件8. 将存储设备重新连接至电源插座,然后打幵存储设备电源。如果存储设备未正常启动,请参阅获得帮助。5.6排除受损存储设备的故障问题存储设备跌落或损坏。操作警告:只有经过培训的维修技术人员才能卸下存储设备护盖并拆装存储设备的任何内部组件。执行任何步骤之前,请参阅产品信息指南,以获取有关安全预防措施、拆装存储设备内部组件和防止静电损害的详细信息。1. 确保已正确安装以下组件:所有物理磁盘(位于各自托盘中并连接至存储设备中间板)电源设备/冷却风扇模块RAID控制器模块存储设备中间板确保所有电缆均已正确连接并且连接器中没有弯曲的插针如果遇到问题,请参阅 获得帮助5.7排除电源设备故障问题存储设备状态指示灯指示设备存在问题。电源设备故障指示灯亮起。操作警告:只有经过培训的维修技术人员才能卸下存储设备护盖并拆装存储设备的 任何内部组件。执行任何步骤之前,请参阅产品信息指南,以获取有关安全预防措施、拆装存储设备内部组件和防止静电损害的详细信息。1. 检查存储设备中是否至少有两个物理磁盘。至少应安装两个物理磁盘。如 果未安装两个物理磁盘,请安装两个物理磁盘。如果问题仍然存在,请转 至步骤2 o2. 关闭存储设备和连接的外围设备的电源,然后断幵存储设备与电源插座的 连接。3. 找到故障电源设备。如果电源设备故障指示灯亮起,请参阅 电源设备和冷却风扇部件。注意:电源设备/冷却风扇模块支持热插拔。存储设备可以靠一个工作的电源设备运行;但是,两个模块都必须安装,以确保正常冷却。如果一个电源设备/冷却风扇模块工作正常,则可以将另一个模块从存储设备中卸下,但时间不能超过5分钟。5分钟之后,存储设备将会过热并可能导致自动导热关闭。4. 卸下电源设备然后重新安装,从而确保其已正确安装。请参阅 卸下和安装 电源设备/冷却风扇模块。注:安装完电源设备后,请等待几秒钟,以便存储设备识别电源设备并确定其 是否可以正常工作。5. 如果问题得以解决,跳过此过程的其余部分。如果问题仍然存在,请卸下出现故障的电源设备。请参阅 卸下和安装电源设备/冷却风 扇模块。6. 安装新电源设备。请参阅 卸下和安装电源设备/冷却风扇模块。如果问题仍然存在,请参阅获得帮助。5.8排除存储设备冷却故障问题系统管理软件发出与风扇有关的错误信息。操作确保不存在以下情况:环境温度太高。外部通风受阻。电源设备/冷却风扇模块出现故障。请参阅 排除风扇故障。排除风扇故障问题存储设备状态指示灯呈琥珀色。系统管理软件发出与风扇有关的错误信息。风扇状态指示灯表明风扇出现故障。操作警告:只有经过培训的维修技术人员才能卸下存储设备护盖并拆装存储设备的任何内部组件。执行任何步骤之前,请参阅产品信息指南,以获取有关安全预防措施、拆装存储设备内部组件和防止静电损害的详细信息。警告:冷却风扇均可热插拔。要在系统运行时保持正常的冷却效果,请每次仅更换一个风扇。1. 找到故障风扇2. 确保出现故障的电源设备/冷却风扇模块已正确连接至存储设备中间板3. 如果问题仍未解决,请安装新的电源设备/冷却风扇模块。请参阅卸下和安 装电源设备/冷却风扇模块。如果更换的风扇仍不能正常运行,请参阅 获得帮助。5.9排除SAS物理磁盘故障警告:只有经过培训的维修技术人员才能卸下存储设备护盖并拆装存储设备的任何内部组件。执行任何步骤之前,请参阅产品信息指南,以获取有关安全预防措施、拆装存储设备内部组件和防止静电损害的详细信息。注意:此过程可能会破坏物理磁盘上存储的数据。继续进行之前,请备份磁盘 上的所有文件。问题MD Storage Manager中找不到某个物理磁盘。操作1. 从存储设备中卸下该物理磁盘。请参阅 卸下和安装物理磁盘02. 检查物理磁盘和中间板连接器是否有明显损坏。3. 将物理磁盘重新安装到原来的托架中。请参阅卸下和安装物理磁盘。如果问题仍然存在,请参阅获得帮助。问题物理磁盘状态LED呈琥珀色闪烁。操作1. 查看MD Storage Manager 以找到可能的恢复措施。注:如果系统正在重建物理磁盘,请等待重建完成。2. 从存储设备中卸下该物理磁盘。请参阅 卸下和安装物理磁盘o3. 检查磁盘和中间板连接器是否有明显损坏。4. 将磁盘重新安装到原来的托架中。请参阅卸下和安装物理磁盘。如果问题仍然存在,请参阅获得帮助。问题MD Storage Manager中找不到多个物理磁盘。操作1. 确保所有电缆均已按照选择的存储设备模式正确连接。有关存储设备模式 的详细信息,请参阅 连接RAID存储设备。2. 验证每个连接至电缆的端口的 SAS端口链路状态LED是否呈绿色稳定亮 起。如果不是,请参阅背面板指示灯和部件。3. 如果重置了电缆,请重新引导主机服务器。如果问题仍然存在,请参阅获得帮助。5.10排除存储设备连接故障问题连接的主机控制器找不到存储设备。操作检查RAID控制器模块电缆是否存在连接问题,例如电缆受损或未连接以及连接不牢固。有关详细的布线说明,请参阅 连接RAID存储设备。5.11硬控制器故障和锁定条件某些事件会导致RAID控制器模块出现故障和/或关闭。不可恢复的ECC内存错误或 PCI错误或严重的物理条件会导致锁定。 如果RAID存储阵列配置为用于冗余访问和高 速缓存镜像,则未出现故障的控制器可以正常恢复而不会丢失数据或关闭。以下各节详细介绍了典型的硬控制器故障。无效的存储设备仅Dell支持的存储设备支持RAID控制器模块。在存储设备中安装时,控制器将执行 一组验证检查。RAID控制器模块完成这些初始检测且控制器正常工作后,存储设备状 态LED将呈蓝色稳定亮起。如果 RAID控制器模块检测到非Dell支持的存储设备, 则控制器将放弃启动。如果存在无效的存储设备,RAID控制器模块不会生成任何事件来向您发出警报,但是存储设备状态 LED将呈琥珀色闪烁以表明故障状态。有关LED及其解释的详细信息,请参阅 背面板指示灯和部件。5.11.2 ECC错误无论RAID控制器模块处于冗余配置还是非冗余配置,RAID控制器固件均可以检测到 ECC错误,并可以从单位ECC错误中恢复。由于同级 RAID控制器模块可以接管(如 果有必要),因此配有冗余控制器的存储阵列也可以从多位 ECC错误中恢复。如果RAID控制器模块遇到最多10个单位错误或最多三个多位错误,它将会进行故障 时转移。5.11.3 PCI 错误当RAID控制器模块配置为用于冗余时,存储设备固件可以检测到并仅从 PCI错误中 恢复。如果虚拟磁盘使用高速缓存镜像,则该虚拟磁盘将故障时转移至同级RAID控制器模块,这表示对恶劣高速缓存进行的刷新。严重条件如果RAID控制器模块检测到可能导致存储设备立即出现故障和/或数据丢失的严重情况,则存储阵列将生成严重事件。如果出现以下情况之一,则存储阵列处于严重情况:多个风扇出现故障任意背板温度传感器均处于临界范围背板/电源设备出现故障两个或多个温度传感器不可读没有检测到或不能与双工配置中的同级进行通信注:如果两个RAID控制器模块同时出现故障,存储设备将无法发出关于任何存储设备组件的严重事件警报或非严重事件警报。存储设备处于严重情况下时,它的存储设备状态LED将呈琥珀色闪烁。非严重条件非严重情况是不会导致立即出现故障但必须进行更正以确保存储阵列持续可靠性的事 件或状态。非严重事件示例包括:一个电源设备出现故障一个冷却风扇出现故障冗余配置中的一个 RAID控制器模块出现故障一块电池出现故障或被卸下冗余虚拟磁盘中的一个物理磁盘出现故障存储设备处于非严重情况下时,它的存储设备状态LED将呈琥珀色稳定亮起。5.12软件故障篇本篇主要介绍在日常维护及应急处理中的一些常见软件故障,指导相关超大 彩信平台维护人员掌握日常应急处理方法及流程。超大彩信平台程序软件故障wi ndows 2008 sever常见问题处理办法我们采用的是双机方案,其中任何一台服务器操作系统宕机,另一台服务器 会做为备机启用,同时联系供应商重新安装操作系统。超大彩信平台数据库软件故障问题1:使用2005自带的SQL-Express连接不上。1.网络防火墙阻止数据库连接;2. 默认 SQL-Express 没有启动 Sa账户 下载一个 management studio express 界面工具管理 SQL-Express3. 无线网络会出现根据机器名找不到SQL服务器的情况,直接用IP连接4. 服务端通过开始菜单打开- 配置工具-SQL Server外围应用配置器- 服务和连接的外围应用配置器- 远程连接 右边选择“本地连接和远程连接同时使用TCP/IP和named pipes.问题2:在Win-XP上安装开发版提示“对性能监视器计数器注册表执行系统配置检查失败”解决方法:注册表定位至U /local_machine/software/microsoft/windowsnt/currentversion/perflib 下,两个值 last counter 和last help 的值改成和004 (英文系统为009)目录中相关键值的最大值一样。键表、新建表等会出现以下错误:第 6章 预警处理篇6.1 CPU过负荷预警处理与供应商联系,增加一颗 E5530CPU6.2 内存预警处理与供应商联系,增加内存。6.3 磁盘空间预警处理与供应商联系,增加盘柜,集连盘柜6.4 超大彩信平台程序故障预警处理 与供应商联系,并重启故障服务器。6.5 超大彩信平台数据库故障预警处理 与供应商联系。第 7章 应急资源配备建议平时建立故障应急方案,主要包括:2)当前业务版本备份;3)当前操作系统、数据库、支持软件(如 Tomcat、JDK等)的备份;4 )工具软件的备齐: FTP、 CRT、 Xmanager、 Dameware、 Ethereal 、 UE、 PcAnyWhere 等;5) 硬件设备:插座、螺丝起、串口线、网线、测试手机(卡)、交通车辆、 通讯工具等;6)远程支持环境:包括联系人员、远程登陆方式、第三方厂家联系等;
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 活动策划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!