资源描述
,性能分析与故障诊断, 1,系统性能分析,1.1,一般性能分析过程,1.2,性能分析工具, 2,系统故障诊断,2.1,故障诊断工具,性能分析与故障诊断,掌握基本的性能调试工具,掌握基本的故障诊断工具,性能分析与故障诊断,(2),1.1,一般性能分析过程,CPU,瓶颈?,内存瓶颈?,I/O,瓶颈?,网络瓶颈?,vmstat,ps,lsps,svmon,vmstat,sar,nice,ps,iostat,lslv,filemon,fileplace,More test,netstat,nfsstat,nfso,no,ifconfig,netpmon,Y,Y,Y,Y,N,N,N,N,1.2,性能分析工具,iostat,vmstat,sar,topas,svmon,iostat,查看系统,I/O,状态信息,用途:报告,CPU,统计信息和整个系统、适配器、,tty,设备、磁盘和,CD-ROM,的输入,/,输出统计信息,iostat(2),TTY,的,I/O,状态,tin,每秒从,tty,那里读取的字符数,tout,每秒写到,tty,那里的字符数,(,其中,tty,设备包括真实,(real),和虚拟,(pseudo),的,tty),iostat(3),CPU,的使用状态,% user,,表示平均用户占用时间,% sys,,表示系统花费,CPU,时间,% idle,,表示,CPU,空闲时间,% iowait,,表示,CPU,等待,I/O,所花费时间,iostat(4),分析:,如果,%idle,数值都很高而且,%iowait,数值也很高,大于,25,,这个说明系统存在,I/O,或 则硬盘瓶颈,内存不够而引起频繁的,swap,空间的数据交换,导致数据存取存在交换空间的,I/O,瓶颈,硬盘上面数据不合理的分布,数据的,fragment,不合理,高数值的,%iowait,有可能下面几个原因:,iostat(5),硬盘使用状态,% tm_act,表示某个硬盘处于,active,状态的百分比,tps,表示每秒某个硬盘有多少个数据传输次数,Kb_read Kb_wrtn,分别显示从开机到运行,iostat,这个命令这段时间内对,硬盘的,read,和,write,的总数据 量,单位,kb,vmstat,查看系统虚拟内存状态信息,vmstat(2),CPU,空闲时间百分比,= id % + wa %,算,CPU,平均一分钟空闲多少时间,(99,92,95,86,+7,96)100560,56.16(,秒,),vmstat(3),kthr,参数,r,等待,CPU,运行的队列个数,若,r,数值偏大,表明,CPU,太忙,b,等待,I/O,操作的阻塞队列个数,若,b,数值偏大,表明系统,I/O,出现瓶颈,CPU,瓶颈,如果,sy,和,us,参数的数值加起来接近,100,,表示系统,CPU,使用率太高,同时也会看到,r,的数值也大于,1,内存瓶颈,内存不足,换页将变得频繁,这时,pi(page-in ),和,po(page-out ),参数将不是,0,,同时,avm,和,fre,数值的比值悬殊很大,,fre,数值很小,.,vmstat(4),sar,查看系统活动状态信息,查看系统所有活动状态信息,topas,哪个进程使用,CPU,最多,svmon,svmon,命令用来查看系统当前的内存的具体使用,通过不同的选项参数,可以查看某个命令、进程、用户等使用内存的具体状态,2.1,系统诊断工具,errpt,diag,errpt,命令,每个管理员例行查错命令,errpt,常用选项,列出错误日志的详细信息,# errpt a,显示具体某个错误项的详细信息,# errpt -a -j E18E984F,diag,命令,diag,命令,(2),强大功能的用来检测硬件问题,简捷的菜单界面,Telnet,问题诊断,如果网络上的客户端可以,ping,通服务器,但是,telnet,不成功,显示拒绝连接的消息,有可能原因是:,inetd,进程没有启动;用,startsrc s inetd,命令启动,换页空间不足;用,chps -s,命令添加空间,如果,telnet,时候要等很久才有响应,可能原因是,/,、,/tmp,或,/var,文件系统空间不够,用,df,命令查看,
展开阅读全文