IBMP750小型机日常维护手册

上传人:仙*** 文档编号:69564720 上传时间:2022-04-05 格式:DOC 页数:21 大小:727KB
返回 下载 相关 举报
IBMP750小型机日常维护手册_第1页
第1页 / 共21页
IBMP750小型机日常维护手册_第2页
第2页 / 共21页
IBMP750小型机日常维护手册_第3页
第3页 / 共21页
点击查看更多>>
资源描述
IBM P750小型机日常维护手册服务器硬件运行状态检查1. 当服务器处于启动和正常工作状态时,其前面板上的状态灯(与电源灯并排)和各硬盘的状态灯(一排 小灯,与各硬盘位置一一对应)应显示为绿色。2. 当服务器的状态灯出现 橙黄色时,说明有硬件告警,此时要检查服务器的电源、接线、硬盘等。如果有 硬件故障则需要立即进行更换和更正,如果查不出具体问题,则需要联系相关专家进一步诊断。3. 当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮,如该硬盘有读写操作,则绿灯会不规则闪烁,当硬盘损坏时,则硬盘状态灯将熄灭,或者呈闪烁状态:以13秒的频率有规律地、不停地闪烁。如果发现有服务器硬件状态灯不正常的情况,请及时联系我公司工程师,以便及时进行诊断并解决故障。HMC (硬件管理平台)管理与操作HMC的两种访问途径:1、在机房直接通过显示器和键盘进行管理维护等相关操作2、通过web远程访问,登录 HMCweb管理界面,访问地址为:https:/1、登录HMC1.1浏览器访问连接 HMC后,首页界面如下图所示。1.2点击下图所示链接,进入HMC验证登录界面。1.3输入用户名与口令,登录HMC 。用户名:hscroot口令:Hie Edit View History Bookmarks Split Tools HllpL Hardware Management Console V7R310.0) Logon iiPlease enter a userid and password below and dick Logon,Userid: |hscroat|Password:Loyori | Canoe I Hedp |1.4成功登录到HMC管理界面如下图所示。2、注销HMC在HMC con sole右上角有(hscroot|help|log off )链接,单击log off,会出现如下图所示注销界面:Choose to Logoff or DisconnectWould you like to log off the console, or disconnect from It? If you log offT your session is ended. If you disconnect, your session fs preserved nd your continue to run. You can reconnect to th session at a later time and continum working. Log offODiswnnert选择Log off,系统返回到 HMC初始登录界面状态。3、重启HMC左边导航栏中选择HMC Managementshut down or Restart ,如下图所示,对 HMC进行正常重启及关机操作。请谨慎对HMC进行关机和重启操作!亡 WdcwneOperalionK日!41 Syetefna Han日gfimfirn1*7. HUC Even-Vbw the c-i cni fogi af H u C 0 scriinr s 胪m 朝力y3 llj馆ShuiDt. #11 xu 射 ui down m retaii the Hfc-Cfl 占 CJBlDfTiGrtilKZaOper超口gJ ScftedM w ccftd qpeFbza ifc-r the: hit Cnan*Forr*il- DW,o-r USfi rii iwmc* devEt.三up HMC rijiin-Bflct 帕 HMC rmairi ruDW to 薊 rancclu rrmiMr st*-旦 HMC MLiNMyvfriHillHvmrt HMC RRncri crccalG on口列惘 ucor9d Deia-Stinup y 张加W W HMC 悔8 Mb音 V DVDX* 3trvlic*ha ge NchvarL SehgJ Vew 匚inrnt ncjvork r-nmicn emd cnrgr! s*ttnj*Updateslei* rietw ort: Cfrun ecrw 柑* r/law neccKaBgroalE inftrneUor a:Dul Fhb iBt.vcrc 3ro:cM2 lt ff s HWCVhS哥N*:曲屮岭*VfeTf and 匸g r 兄汨 Chin he HhiC nt吠兀飞:汕l耳 yTfci of 1K* Days DllpflV W W J1F3IM CCnfrDtoVW Ucsil赵“ Ririd Ihv ICvfliH WMhvUCC聊 恥汕 It 后11nWrrac CutM lifFRt 1 聲ppB*.ur r sf ihr HMC tfwr hl*二 ha-产 Uisef Inter fa ze jetirgs.p CuHcm营屯鹫 BpmeurB fltbC: HMC 町七r fiFnFtc斗? ha- 9产 Oflte nr 1 Trrs QiM MH CMITO lorlhfl HMCGuic农 %IUS #在御B Stop hre jgin i icn g up 的“ Hwcpvwarcte. r 岂和苗h 乍临少“吋 clc wr r 汕您ngi of pre Dl#rv4、状态栏功能状态栏位于HMC左下角位置,如下图所示,负责监控并反映管理系统资源状态和HMC状态。B 0 ZL 0单击每个图标状态可以列出详细状态,你可以查到更详细的帮助信息:3 :非法操作,如果任何被管理的主机执行了非法操作,这个图标将会变亮。:黄灯警告,如果任何被管理的主机有错误并有黄灯被点亮,这个图标也将会变亮报错日志:日志中有报错信息,这个图标将会变亮,此项与摘要,摘要中会将有用信息做统计并显示在工作栏中。5、Service Management导航栏中Service Management 强大的管理功能给用户日常维护提供了更简单直观的界面,如下图所示,但日平时最常用的子项是 Manage Serviceable Events ,如下图步骤可以对 HMC所管理的设备进行日常错误及时直观的观察,以确保IBM小型机能正常工作,下图就是基本的操作方法图示:Service Man ageme ntMan age Serviceable Eve nts Done頁 Bernet回田2 https :/9.3.5.228 - js21a1: Manaoc Serviceable Events - Serviceable Event Overview Miemsoft Internet ExplorerMsnoge Serviceable Events Serviceable Event OverviewSelected This list shows al serviceable events that match your selection criteria Each event is grouped with all errors that are associated with that event Use the menu bar above to perform actions on the serviceable event& Compact table viewFull table viewI ”0 再 | - Select Action -Select 八 Problem # 八 PMH # 八 Reference code | Status 八 Last reported time 八 Failing MTMS 八厂5E3D4310AOpe nMay 16r 2007 6:26:17 PM7310-C03/104EBCAr4E3J5OO46OpenMay 16, 2007 6:31:33 PM7310-C03/104EBCAr3#25C3902OpenMay 16r 2007 3:31:34 PM9133-55A/10D1FAGr2B3100500OpenMay 16, 2007 6:37:53 PM7310-C03/104EBCAr1355095$OpenMay 14r 2007 5:59:17 PM7310-C03/104EBCATotal: 5 Filtered: 5 Selected: 0View Search Cnteria I Cancel I Help |Selected*View DetailsRepairCall Homele events that match your selection criteria. Each event is grouped with all errors that are Use the menu bnabove to perform action會 on the serviceable event10匠爭戸戸*|- selectAction 一 二|Select几Problem * PMH #木 Reference code* status *Last reported time丹Failing MIMS亠F|5E3D4310AOpe nMay 16r 2007 6:26:17 PM731O-CO3/1O4EBCAn4E35004右OpenMay 16r 2007 6:31:33 PM731O-CO3/1O4EBCAn呂#25C3902OpenMay 16, 2007 3:31:34 PM9133-55flyl.ODlFAG厂2B3100500OpenMay 16r 2007 6:37:53 PM7310-C03/104EBCAniE3550956Ope仃May 14. 2007 5:59:17 PM7310-C03/104EBCAFull table viewView Search CnteriaManage Problem MtaClose EventTotal: 5 iFfltered: 5 Selected: 1匸 jancielHleHp |室Short cd to ia vascripi mnu kemLaunch tokxnO:6、Service Plans-分区管理与操作6.1如何查看小型机资源配置:,在下拉菜单中选如上图红色标注所示,选中所需查看主机(备注:请不要同时选中多台主机及多个分区)中Properties ,打开参数窗口,通过Properties ”可以查看主机运行状态,CPU,内存,I/O等重要硬件系统参数,如下图所示。Proces &orsMemoryI/OPower-OnF a ra metersCapabilitiesAdvancedGeneral轨 rver-9117-MMA-SN06HSerial number:9117-MMApertinq Off 00050000False80Type/Model;State;Attenticn LED;Service processor version:ManLfactLjring default 匚onfiQurmtion:Maximum number of partitions:Service partition:口 Power off the system after all the logical partitions are powered trft两CancelH匕【p同理,在分区区域中先中每分区后的Properties选项,便可以直观方便的掌握分区状态和资源配置信息。6.2如何开关机及激活分区:关机。sy Minns.laracsrrPM srvrsIQ怡亨| f 肆|靠伞百Avfiilaalis-一-bI.-息Tl amaAAA-DCMfi. . A 严皿AUPfenc丁-:TT了iIME.25B &rvrViOiraaUjiiiSjFnwM on175I Sew占 丄至 h c MHCcidbcnw旳凶er MinBgnnri1.7SCflRi*eclkjasLtJ latLgt-arJAsre hrcrriai1)二rhcpL 孟L-pcsresLajnnneed Syttarr l.laia jemBn: iA$1.CLtiiziitQnDatflC-apacfty Qti Dmacd! iCoO)Abu.MChfinjeFfiEawsfd开机。ssiems wanaa&rneni * severs s erver-911rnA- n iT日7皓丹包*Med Marre尺ID匚5册匕宫A.4AClh亡*FoficE-rvirenrreat八Rerenerce ” CodeK| 轴PnfEsrtestvatsc0*d台估Lunyi#AX Or LinuxOO&MOOl厂凤U o&70(ur1Ckaw Letadl PrafilB二429,5pS70toar1 prole AKorliiuxipaTZ_r2TiiE aac- LinuxCcnfigurfitbiDpwatiar-gli il -?SZ3pjr2Ccniclt Vifi ndoujScrrhtcflisiitjfj-;actLd:t tteito _E匚HErdwar-sintomstor弋才门卩FTfllnr3涮0Operation项中主要包含小型机及分区开关机,及消除报警灯这两项功能,如虽要对小型机下电操作,请先将图15中的分区Deactivate (建议:最好在操作系统中按照正常流程将操作系统shutdown ),最后再将主机 power off。注意:非特殊情况,无专业人员指导,严禁进行开关机操作!6.3手动消除黄灯警告如下两图所示,Operations中LED status,及Deactivate Attention LED两项中所指,针对不同分区或主机所报出的警告黄灯,进行特定的消除黄灯操作。El0 T.l_ F d.?Sek:. 、MamsJ1 &erwer-? 117-riA - ? r.jI Sstvet- 117 M WA- Sh- CH St-.cr-Fp 17-h,lf;A-Sha/Eisrrs ysrag-errsM 打#各乍匸皿、详仕1=只GfiriFgurBbcnCornecttois!- d rd c re h fcrraib iSLaLis0.(* sabers 5ver-9l 1 T-MrnA-5NibHlaaka*riaireStiiLiSAYoihh Ptscesi.-宀UntoA-aidLlc片H訓WLa jo i s前g Sysie r Ma -i hiAS Mith?Trr n 矿HRmijidLhanjeRassworiaVewa*、AC:F.ft P-ofibzi b-irsnnentC.2E1.75K| 伽厂凤U D&TOpjrl| n国 11 iS7!pjr2PrjpiErtestvstscfauOroife3 X DLinuxReTenerce 亠CockoOQWOOUCr angig Lfaut ProfileCcnfiguratbiDadh ate Atfa iLan: _E匚HEnlwar5:ntonn3.tnr42S.5 p5?Ofpar1_Grafite APC or Linux!S9paranie ax cr liplk0|FTfltnnaCcncl WnJcvjJterhccasih6.4如何打开控制终端(Terminal Window)在HMC上对分区操作系统进行操作,可以通过分区下拉菜单Con sole Win dow-Ope n Termi nal Win dow对选中分区进行操作,如图所示,操作界面如同tel net 界面。在HMC中同一分区只允许打开一个Terminal Window ,如试图打开第二个窗口,系统提示如图17所示界面。A tctniLnal 石。邑吕ion is alreacj open for btiis partition, Rjil / Qii npen session is a Icved Fnr a par r.L Linn. fxitJUg.三、AIX系统日常维护1、查看系统的错误记录很重要,应该定期查看,如发现有硬件(H)类型的报错,应该及时关注。在系统运行时,一些系统错误会记录在 errlog中,其中有些错误还会在终端上显示。检查错误日志可用以下命令:#errpt|more查看系统所有的记录IDENTIFIER TIMESTAM PT C RESOURCE_NAMEDESCRIPTIONE85C5C4C0426104399P S CFGLFTSOFTWARE PROGRAM ERROR2BFA76F60426104099TSSYSPROCSYSTEM SHUTDOWN BY USER9D4CF6E70426104399TOerrdemonERROR LOGGING TURNED ON1E2AC07E0426103999TOerrdemonERROR LOGGING TURNED OFF1E5EER4T0423132999TOclstrmgrOPERATOR NOTIFICATION其中IDENTIFIER 为错误编号,当需要检查详细信息时常会用到。TIME STAMP 为时间标签,它记录的是出错时间,其格式:月月日日时时分分年年T 为 Type , 它记录的是错误类型P :为永久错误,需引起注意T :为临时错误。C 为 Class, 它记录的是错误种类,如H : HardwareS : SoftwareO : Errloger command messagesU : undeterminedRESOURCE_NAME 为错误来源DESCRIPTION为错误描述#errpt -aj查看系统详细记录内容其中 IDENTIFIER 为错误编号,如#errpt -aj 0426104399#errpt -dH查看系统所有的硬件出错记录2、日常检查服务器状态的项目及其相关命令Available。2.1运行Isdev命令配以各种参数,所列各种设备状态都应为#lsdev -C -H -S a列出系统中可用设备。#lsdev -Cc processor列出系统中的所有 CPU。#lsdev -Cc memory列出系统中的所有内存。#lsdev -Cc disk列出系统中的所有硬盘。#lsdev -Cc adapter | grep ent列出系统中的所有网卡#lsdev -Cc adapter | grep scsi列出系统中的所有 SCSI卡。#lsdev -Cc adapter | grep ssa列出系统中的所有 SSA卡。2.2 Ispv 命令#Ispv显示系统中可用的 PV 。#Ispvhdiskn显示 hdiskn 的具体信息。#Isdev -Cc pdisk显示磁盘阵列的硬盘的具体信息。2.3 Isattr 命令# Isattr -E -memO 列出系统中内存 memO的大小,本项目中内存有4GB 。2.4 Isvg 命令#Isvg列出系统中所有的 vg。#Isvgrootvg列出 rootvg 的详细信息。#Isvg -o列出激活的 vg2.5 osleve 命令#osIeveI 显示操作系统版本信息。2.6 netstat 命令#netstat -in 显示系统中各网卡的配置。可查看网卡的 IP 配置好了没有。2.7 diag 命令通过运行# diag命令运行硬件诊断程序检测主机内所有硬件,检测结果为“ No trouble found”显示各部分工作正常。2.8lsps查看页面空间Isps -a查看PAGING SPACE 的使用情况,如果使用率超过70%,就需要采取措施。2.9查看LV (卷)状态lsvg -o | lsvg - | grep -stale查看有无stale的lv,如果输入该命令之后有输出结果,就需要采取措施2.10 查看 mail#mail,查看有否发给root用户的错误报告(mail)。3、检查文件系统查看有没有“满”的文件系统。文件系统满可导致系统不能正常工作,尤其是AIX的基本文件系统。如/ (根文件系统)满则会导致用户不能登录。# df -k (查看AIX的基本文件系统)/dev/hd424576145295%259922% /dev/hd26144002806896%2296715% /usr/dev/hd9var8192454045%64932% /var/dev/hd31679361579686%891% /tmp/dev/hd116384533268%140235% /homeFilesystem1024-blocksFree %Usedlused %Iused Moun ted on除/usr文件系统,其他文件系统都不应太满,一般不超过80%。4、性能监控与调优4.1通过topas来观察topas能够将系统的全局信息,包括CPU、内存、磁盘、网络、文件系统、事件队列、文件等信息,排列在一个统一的界面上进行展示。bash-4.3# topasTopas Mon itor for host:localhostWed Feb 22 10:42:00 2017In terval:2EVENTS/QUEUESCswitchReadchFILE/TTYSyscallWritechCPU User% Kern% Wait% Idle%ReadsWritesRawinTtyoutIgetsForksNetwork BPS I-Pkts O-Pkts B-In B-Out ExecsRunqueueDirblkWaitqueueDisk Busy%BPSTPSB-ReadB-WritPAGINGFaultsFileSystemBPSTPSB-ReadB-Writ StealsPgspIn% ClientPgspOutNamePID CPU%PgSp OwnerPageInPageOutSize,MBSios% UsedNFS (calls/sec)SerV2CliV2SerV3CliV3NameiMEMORYReal,MB% Comp% NoncompPAGING SPACE% FreeWPAR ActivWPAR TotalPress: h-helpq-quitSerV44.2 通过命令 vmstat 1 来观察 .kthr memory page faults cpur b avmfre re pi pofrsr cy in sycs us sy id wa命令解析: vmstat 命令的输出可以反映系统整体运行状况,包括cpu 、内存、虚拟页面、系统进程和系统调用情况。检查 CPU 是否为瓶颈 ,分别检查 CPU 的四项数值和 kthr 的两项数值 .检查 MEM 是否为瓶颈 ,分别检查 Memory 的两项数值和 Page 的六项数值 .4.3通过命令sar -mu -P ALL来观察。命令解析: sar 可以用来收集反映系统运行状况, 在这里主要是查看 CPU 的运行状况, CPU 是否负载均衡是否存在分配不均的情况。4.4通过命令psgv | more来观察。PID TTY STAT TIME PGIN SIZE RSS LIM TSIZ TRS %CPU %MEM COMMAND0- A4:20 7 12 14516xx0 14504 0.0 5.0 swapper1:33 103 78952 79044 327682536 0.0 29.0 /etc/init命令解析: ps 可以用来查看进程的当前状态。在这里通过参数的配搭,可以观察目前正在运行的进程所耗的时间 ,CPU 和 memory 量 .其中, %CPU 表示进程所占用的 CPU 资源情况, %MEM 表示进程所占用的内 存情况。主要检查是否有标示为 的僵尸进程耗用系统资源,以及 informix 数据库的 oninit 进程的 系统消耗情况。4.5通过命令iostat 1 -d hdiskX观察磁盘在机器上用dd命令进行磁盘阵列的写操作校验,与此同时用iostat 1 -d hdiskX观察磁盘。Disks:% tm_act KbpstpsKb_readKb_wrtn命令解析 : iostat 可以用来查看系统的 I/O 的输入输出情况,在这里主要查看阵列上的硬盘的每秒读写量, 同时估算磁盘阵列读写速度。4.6 通过命令 netstat-a 进行查看。Active Internet connections (including servers)检查参Proto Recv-Q Send-Q Local AddressForeign Address(state)命令解析 : netstat 可以用来查看系统的网络情况, 在这里主要是查看网络客户端连接的情况和开销,数为 state ,如有死连接, state 状态为 fin_wait, 这样耗用系统网络资源, 从而导致网络性能下降构成瓶颈。以上所有命令及参数的相关含义和详细信息,请参考AIX 命令大全。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!