资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Chapter14 网络故障排除,ISSUE 1.2,学习目标,描述故障排除的基本方法和步骤,掌握故障排除常用工具软件的使用,分析处理基本的网络故障问题,学习完本课程,您应该能够:,2,课程内容,网络故障排除模型,故障排除工具,典型故障排除案例,小结,3,网 络 现 状,接入层,地市2,骨干网,汇聚,层,NE16E,S5516,S8016,MPLS VPN,NE16E,NE16E,NE16E,NE80,NE80,S8016,S8016,S5516,S5516,S3026,R36/2600,R36/2600,支持包括数据、音频和视频集成传输的综合应用,新技术不断出现,现代网络与传统网络的共存,4,对网络管理人员的要求,目前互联网络技术、拓扑和应用的复杂性决定了网络管理人员必须:,确保网络尽量稳定运行,掌握故障排除方法,熟悉各种协议可能故障点,迅速定位排除故障,5,网络故障的一般分类,连通性问题,硬件、媒介、电源故障,软件配置错误,兼容性问题,性能问题,网络拥塞,供电不足,路由环路,6,一般故障的解决步骤,故障现象观察,故障相关信息收集,各种可能原因列表,故障排除过程文档化,对每一原因实施排错方案,经验判断和理论分析,恢复实施方案前的网络状态,故障排除?,Y,N,循环1,循环2,7,分层故障排除法,1,物 理 层,2,数据链路层,4,高 层,3,网 络 层,主要关注:电缆、连接 头、信号电平、编码、时钟和组帧,负责介质的连接,8,分层故障排除法,1,物 理 层,2,数据链路层,4,高 层,3,网 络 层,主要关注:端口的状态,协议是为,UP,,则为链路层工作正常。同时和利用率也有关。,封装的不一致,9,分层故障排除法,1,物 理 层,2,数据链路层,4,高 层,3,网 络 层,主要关注:地址和子网掩码是否正确,路由协议配置是否正确。排除时沿着源到目的地的路径查看路由表。同时检查接口的,IP,地址。,分段打包和重组及差错报告,10,分层故障排除法,1,物 理 层,2,数据链路层,4,高 层,3,网 络 层,主要关注:网络终端的高层协议,以及终端设备软硬件运行良好。,负责端到端的数据,11,分块故障排除法,配置文件可分为以下几块:,管理部分(路由器名称、口令、服务、日志等),端口部分(位址、封装、cost、认证等),路由协议部分(静态路由、RIP、OSPF、BGP、路由引入等),策略部分(路由策略、策略路由、安全配置等),接入部分(主控制台、Telnet登录或哑终端、拨号等),其他应用部分(语言配置、VPN配置、Qos配置等,可以把故障归入上述一类或几类,12,分段故障排除法,把网络分段,逐段排除故障,主机到路由器LAN接口的这一段,路由器到CSU/DSU界面的这一段,CSU/DSU到电信部门界面的这一段,WAN电路,CSU/DSU本身问题,路由器本身问题,13,替换法,替换法是检查硬件问题最常用的方法,当怀疑是网线问题时,更换一根确定是好的网线试一试;当怀疑是接口模块有问题时,更换一个其它接口模块试一试,在实际网络故障排错时,可以先采用分段法确定故障点,再通过分层或其它方法排除故障,14,课程内容,网络故障排除模型,故障排除工具,典型故障排除案例,小结,15,常用故障诊断命令,华为网络设备故障诊断主要有以下命令:,ping命令,tracert命令,display命令,reset命令,debugging命令,16,Ping命令,Ping命令简介,VRP平台的ping命令,Windows平台的ping命令,案例:使用大包ping对端进行MTU不一致的故障排除,e0:3.3.3.3/8,s0:1.1.1.1/8,s0:1.1.1.2/8,e0:2.2.2.2/8,RouterA,RouterB,17,Tracert命令,Tracert命令简介,VRP平台的tracert命令,Windows平台的tracert命令,案例:使用tracert命令定位不当的网络配置点,18,故障排除常用display命令,display version,display current-configuration,display saved-configuration,display interface,19,display version,Quidway,display version,Huawei Versatile Routing Platform Software,VRP(tm)Software,Version 3.10,Copyright(c)2000-2002 HUAWEI TECH CO.,LTD.,Quidway S3526 3526-002,Quidway S3526 uptime is 0 weeks,0 days,0 hours,21 minutes,Quidway S3526 with 1 MPC 8240 Processor,64M bytes DRAM,8192K bytes Flash Memory,Config Register points to FLASH,Hardware Version is REV.0,CPLD Version is CPLD 002,Bootrom Version is 360,Subslot 0 24 FE Hardware Version is REV.0,20,display current-configuration,显示当前设备配置文件信息,把启动配置文件存放到路由器以外的其他设备上,使维护人员能够迅速配置一个替代的路由器,将该配置文件通过E-mail形式发给华为技术支持人员以帮助定位配置问题,21,display interfaces,Quidway,display interfaces serial 0,Serial0 is up,line protocol is up,physical layer is synchronous,baudrate is 64000 bps,interface is DCE,clock is DCECLK,cable type is RS232,Maximum Transmission Unit is 1500,Link-protocol is PPP,LCP opened,IPCP initial,IPXCP initial,CCP initial,BRIDGECP initial,5 minutes input rate 0.00 bytes/sec,0.00 packets/sec,5 minutes output rate 0.00 bytes/sec,0.00 packets/sec,Input queue:(size/max/drops)0/50/0,FIFO queueing:FIFO,Output queue:(size/max/drops),FIFO:0/75/0,input packets:8,bytes:108,no buffers:0,output packets:8,bytes:108,no buffers:0,input errors:0,CRC:0,frame errors:0,overrunners:0,aborted sequences:0,input no buffers:0,DCD=UP DTR=UP DSR=UP RTS=UP CTS=UP,22,reset,reset:清空当前的统计信息,reset counters interface,reset ip counters,23,debugging命令,debugging命令概述,获得路由器中交换的报文和帧的细节信息,用于调试信息,debugging命令使用注意事项,不使用debug命令监控正常的网络运行,在网络使用的低峰期使用,不要轻易使用类似debugging all之类的命令,使用debugging命令后,应立即以“undo debugging”命令终止debugging命令的执行。,display和debugging命令配合使用,24,华为Quidview故障管理功能,告警实时监视,提供告警声光提示,支持外接告警箱,支持告警转到Email,手机短信,支持告警过滤,让用户关注重要的告警,查询结果可生成报表,支持告警基极别重新定义,支持告警转存,保证系统的运行效率和稳定性,支持告警拓扑定位,将显示的焦点定位到产生选定告警的拓扑对象。,支持告警相关性分析,包括屏蔽重复告警、屏蔽闪断告警、屏蔽root-cause告警等。,25,课程内容,网络故障排除模型,故障排除工具,典型故障排除案例,小结,26,案例:广播流量引起的FTP业务问题,为一个用户网段;为一个日志服务器;是一个集中了很多应用服务器的网段。,用户反映,:日志服务器与网段的备份服务器间备份发生问题!,27,案例:广播流量引起的FTP业务问题,故障现象描述,如何描述故障现象,这个问题是连续出现,还是间断出现的?,是完全不能备份,还是备份的速度慢(即性能下降)?,哪个或哪些局域网服务器受到影响,地址是什么?,正确故障描述,在网络的高峰期,日志服务器到集中备份服务器之间进行备份时,FTP传输速度很慢,大约是0.6Mbps。,28,案例:广播流量引起的FTP业务问题,故障相关信息收集,:,信息收集途径,向受影响的用户、网络人员或其他关键人员提出问题;,根据故障描述性质,使用各种工具搜集情况,如网络管理系统、协议分析仪、相关,show,和,debug,命令等;,测试性能与网络基线进行比较。,收集到以下信息,最近网段的客户机不断在增加;,网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps,与日志服务器间进行FTP传输时速度慢,只有0.6Mbps;,在非高峰期日志服务器和备份服务器间FTP传输速度正常,大约为6Mbps。,29,案例:广播流量引起的FTP业务问题,经验判断和理论分析,各种可能原因列表,日志服务器A的性能问题;,网络的网关性能问题;,网络本身的性能问题;,网云性能问题。,30,案例:广播流量引起的FTP业务问题,对每一原因实施排错方案,观察故障排除结果,循环进行故障排除过程:,当针对某一可能原因的排错方案没有达到预期目的,循环进入下一可能原因制定排错方案并实施;,当所有可能原因列表的排错方案均没有达到排错目的,重现进行故障相关信息收集以分析新的可能原因。,案例可能故障循环分析,定位故障:最近大量用户加入导致网段上广播包过多;,排除故障:把日志服务器移到网段。,31,案例:广播流量引起的FTP业务问题,故障排除过程文档化,故障现象描述及收集的相关信息;,网络拓扑图绘制;,网络中使用的设备清单和介质清单;,网络中使用的协议清单和应用清单;,故障发生的可能原因;,对每一可能原因制定的方案和实施结果;,本次排错的心得体会;,其他:如排错中使用的参考资料列表等。,32,小结,网络故障排除是一项重要的工作,网络排错方法有分层故障排除法、分段故障排除法、分块故障排除法和替换法等,熟悉使用故障排除常见工具,包括网络设备自带的软件诊断工具,以及华为的网络管理工具等,通过案例分析和实验,初步掌握网络设备常见故障现象的排除方法。,33,华为,3Com,技术有限公司,华为3Com公司网址,:,华为3Com技术论坛网址,:,34,
展开阅读全文