IBM-小型机日常管理和故障处理.ppt

上传人:xt****7 文档编号:1850349 上传时间:2019-11-08 格式:PPT 页数:47 大小:1.63MB
返回 下载 相关 举报
IBM-小型机日常管理和故障处理.ppt_第1页
第1页 / 共47页
IBM-小型机日常管理和故障处理.ppt_第2页
第2页 / 共47页
IBM-小型机日常管理和故障处理.ppt_第3页
第3页 / 共47页
点击查看更多>>
资源描述
IBM 小型机 日常管理与故障处理,内容提要,系统健康检查 HMC的使用 ASMI 的使用 常用操作 故障的处理 IBM 服务热线,系统健康检查,系统健康检查,巡检用户:xunjian(普通权限)。 至/tmp/xunjian/ 目录下执行common_check.sh脚本。 查看输出的日志:more pxxx20160920.log,进行系统的状态查看。,系统健康检查,检查文件系统 查看有没有“满”的文件系统。文件系统满可导致系统不能正常工作,尤其是AIX的基本文件系统。如/ (根文件系统)满则会导致用户不能登录。,# df -k (查看AIX的基本文件系统) Filesystem 1024-blocks Free %Used Iused %Iused Mounted on /dev/hd4 24576 1452 95% 2599 22% / /dev/hd2 614400 28068 96% 22967 15% /usr /dev/hd9var 8192 4540 45% 649 32% /var /dev/hd3 167936 157968 6% 89 1% /tmp /dev/hd1 16384 5332 68% 1402 35% /home,系统健康检查,查看卷组信息 lsvg -l vg_name 有没有“stale“状态的逻辑卷。 用syncvg 命令修复。# smitty syncvg,LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINT hd5 boot 1 2 2 closed/syncd N/A hd6 paging 48 96 2 open/syncd N/A paging00 paging 32 64 2 open/syncd N/A hd8 jfslog 1 2 2 open/syncd N/A hd4 jfs 1 2 2 open/stale / hd2 jfs 32 64 2 open/syncd /usr hd9var jfs 5 10 2 open/syncd /var hd3 jfs 4 8 2 open/syncd /tmp hd1 jfs 1 2 2 open/syncd /home,系统健康检查,网络检查 netstat -i 查看网卡状态 Ierrs/Ipkts 和 Oerrs/Opkts是否1% ping host_name /IP Address 查看是否通和是否有丢包。 路由表 #netstat -rn 查看路由表是否正确,ping 各路由器是否通。 核 对 主 机 名 #hostname,系统健康检查,#ifconfig -a,en0: flags=4e080863 inet 172.40.10.31 netmask 0xffff0000 broadcast 172.40.255.255 lo0: flags=e08084b inet 127.0.0.1 netmask 0xff000000 broadcast 127.255.255.255 inet6 :1/0,系统健康检查,#lsattr El inet0,authm 65536 Authentication Methods True hostname qtsms Host Name True gateway Gateway True route net,0,172.40.10.1 Route True bootup_option no Serial Optical Network Interface True rout6 FDDI Network Interface True route属性是否有相应的路由信息。格式为:net,0,172.16.23.81 如果没有缺省路由,执行命令: #chdev l inet0 a route=0,172.16.23.81 其中172.16.23.81为网关 如果缺省路由不正确,则先删除路由,再增加缺省路由: #chdev l inet0 a delroute= net,0,133.16.23.81 #chdev l inet0 a route=0,172.16.23.81,系统健康检查,系统故障记录(errorlog) errdemon 进程在系统启动时自动运行 记录包括硬件、软件及其他操作信息 故障记录文件为/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析 errpt 命令的使用(普通用户权限也可使用),系统健康检查,系统健康检查,系统健康检查,HMC的使用,Hardware Management Console 进行P系列小型机的硬件管理、维护,以及逻辑分区的划分等 必须配置HMC对其进行管理 如果需要划分逻辑分区,则必须配置HMC HMC通过TCP/IP与需要管理的主机进行连接,HMC 使用,HMC 使用 操作界面,HMC 使用 操作界面,HMC 使用 操作界面,HMC 使用 操作界面,HMC 使用 操作界面,HMC 使用 操作界面,HMC 使用 操作界面,点击关闭事件,HMC 使用 操作界面,点击机器前面板黄灯,ASMI的使用,ASMI的使用,Advanced System Management Interface 硬件故障信息 硬件设备信息 硬件状态信息 CUoD 可以在任何时候访问(机器在Power Off状态,或者Operating 状态),ASMI的使用 连接方式,HMC GUI 使用硬件管理终端访问 网页模式 使用PC或笔记本,用网线连接到负责HMC和FSP通信的交换机、或者HUB上 通过浏览器,输入FSP的IP地址即可访问ASMI 串口模式 使用串口线链接到串口,可访问字符界面ASMI,ASMI的使用 连接方式,ASMI的使用 访问界面(Web),ASMI的使用 访问界面(Web),常用操作,常用操作-HACMP的操作,HACMP的操作 启动:smitty clstart 停止:smitty clstop 启动/停止过程可以查看/tmp/hacmp.out文件:#tail f /tmp/hacmp.out 检查Cluster是否运行正常 Cluster进程是否运行:#lssrc g cluster,至少两个进程,且为active。 IP地址是否获取:#netstat i,看boot IP是否变为service ip。 VG是否varyon:#lsvg o 文件系统是否mount:#mount 应用进程是否启动:#ps ef | grep app_name,常用操作-HACMP的操作,HACMP相关日志 /usr/adm/cluster.log; 以事件为单位的纪录 /tmp/hacmp.out; 详细记录 /usr/sbin/cluster/history/cluster.mmdd; 历史纪录,常用操作-HACMP的操作,使用clstat -o 命令查看hacmp的状态,常用操作-HACMP的资源切换,smitty hacmp- System Management (C-SPOC)- Resource Group and Applications- Move Resource Groups to Another Node,常用操作-HACMP的资源切换,Administration Guide Concepts and Facilities Guide HACMP Troubleshooting Guide Planning and Installation Guide 以上文档可以在随机所带的光盘上找到,常用操作-HACMP参考文档,故障处理,故障处理-故障的定义,弄清楚系统发生了什么问题 系统现在能做什么?不能做什么? 故障什么时候发生的? 有没有做平时不同的操作? 故障有没有规律?定时还是不定时?发生的频率有多高? 是一台机器出现故障还是多台机器故障?故障现象是否相同? 最近有没有做改动?如安装了新的硬件、软件,改变了系统的一些设置(如 HACMP配置)等 。,故障处理-故障信息的收集,收集故障信息对于判断、诊断故障原因,修复系统非常重要。 系统故障记录(errorlog) errdemon 进程在系统启动时自动运行 记录包括硬件、软件及其他操作信息 故障记录文件为/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析 errpt 命令的使用(普通用户权限也可使用),故障处理-故障信息的收集,HMC Service focal point 记录了连接在此台HMC上的所有P系列主机的硬件报错信息。 选择“Service focal point“,选择“Manage Serviceable Events“。 可以根据主机、机柜序列号进行查询 #mail 系统会向root用户发mail报告出错信息。通常系统出现故障后没有进行检查修复,系统会定时提醒root,故障处理-故障信息的收集,其他用于收集系统信息的命令 lsdev -C 系统设备信息 #lsdev -Cc disk hdisk0 Available 00-06-00-2,0 4.5 GB 16 Bit SCSI Disk Drive hdisk1 Available 00-06-00-1,0 4.5 GB 16 Bit SCSI Disk Drive hdisk2 Defined 00-06-00-4,0 16 Bit SCSI Disk Drive lspv 查看物理卷信息 #lspv hdisk0 0007821160af3d76 rootvg hdisk1 000782117f571294 rootvg hdisk2 0000000045c45bde datavg lsvg 查看卷组信息,故障处理-故障信息的收集,故障处理-故障信息的收集,故障处理-故障信息的收集,故障处理-收集系统信息,# snap -a -c 把/tmp/ibmsupt目录做成一个压缩文件 snap.tar.Z如果/tmp文件系统空间不够,可用-d directory 参数指定别的目录代替/tmp/ibmsupt,IBM 服务热线,座机拨打:800-810-1818 报机器系列号,客户名称 24小时在线 支持人员非24小时 硬件配件需要调配 理论上不超4个小时到场解决故障,Q&A,thans a lot,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!