资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,网络故障诊断及布局,网络故障诊断及布局,第,3,讲:数据链路层故障诊断与排除,第,4,讲:故障实例及排除方法,第,1,讲:网络故障和网络诊断测试工具,第,2,讲:物理层故障诊断与排除,第,5,讲:网络布局,第3讲:数据链路层故障诊断与排除第4讲:故障实例及排除方法第,重点介绍以下内容:,1.,网络故障概述;,2.,常用的网络故障测试命令;,3.,网络故障管理系统;,4.,网络故障诊断;,5.,网络诊断工具;,第,1,讲:网络故障和网络诊断测试工具,重点介绍以下内容:第1讲:网络故障和网络诊断测试工具,1.1,网络故障概述,在信息化社会里,各企事业单位对网络的依赖程度越来越高,网络随时都可能发生故障,影响正常工作。所以,必须掌握相应的技术及时排除故障。网络一旦发生故障,若不能及时排除,会产生很大的损失。,1.1 网络故障概述 在信息化社会里,各企事业,从网络故障本身来说,经常会遇到的故障有:,物理层故障;,数据链路层故障;,网络层故障;,以太网络故障;,广域网络故障;,TCP/IP,故障;,服务器故障,其他业务故障等。,从网络故障本身来说,经常会遇到的故障有:,那么,网络发生故障的原因是什么呢?根据有关资料的统计,网络发生故障具体分布为:,应用层占,3%,;,表示层占,7%,;,会话层占,8%,;,传输层占,10%,;,网络层占,12%,;,数据链路层占,25%,;,物理层占,35%,。,那么,网络发生故障的原因是什么呢?根据有关资料的,(1),逻辑故障,逻辑故障中最常见的情况有,2,类,:,一类是配置错误,是因为网络设备的配置原因而导致的网络异常或故障。另一类是一些重要进程或端口被关闭,主要是系统的负载过高,路由器的负载过高。,(2),配置故障,配置故障主要表现在不能实现网络所提供的各种服务,如不能接入,Internet,,不能访问某种代理服务器等。网络链路测试正常,却无法连接到网络,;,只能与某些计算机,而不是全部计算机进行通信。,引起网络故障的原因还有以下几种:,(1) 逻辑故障 引起网络故障的原因还有以下几种:,(3),网络故障,网络故障的原因是多方面的,一般分为物理故障和逻辑故障。物理故障,又称硬件故障,包括线路、线缆、连接器件、端口、网卡、网桥、集线器、交换机或路由器的模块出现故障。,(4),计算机硬件故障,大约有,25%,的故障是由计算机硬件引起的,如显示器、键盘、鼠标、,CPU,、,RAM,、硬盘驱动器、网卡、交换机和路由器等。,(5),软件问题,表现为:软件有缺陷,造成系统故障;网络操作系统缺陷造成系统失效。,(3) 网络故障,(6),协议故障,计算机和网络设备之间的通信是靠协议来实现的,协议在网络中扮演着非常重要的角色。,计算机无法登录至服务器,;,计算机在网上邻居中既看不到自己,也看不到,其他计算机或查找到其他计算机,;,计算机在网上邻居中能看到自己和其他计算机,,但无法在局域网络中浏览,Web,、收发,E-mail;,计算机无法通过局域网接入,Internet,。,与网络中其他计算机的名称重复,或者与其他计,算机使用的,IP,地址相同。,(6)协议故障,(7),网络管理员差错,网络管理员差错主要发生在网络层和传输层,是由于安装没有完全遵守操作指南,或者网络管理员对某个处理过程没有给予足够的重视造成的。,(8),使用者发生的差错,使用者没有遵守网络赋予的权限。例如:,超权访问系统和服务;,侵入其他系统;,操作其他用户的数据资料;,共享账号。,(7) 网络管理员差错,既然有网络故障产生,那么就有网络管理。,网络故障管理一般包括,5,点:,对网络进行监测,提前预知故障;,发生故障后,找到故障发生的位置;,解决故障;,记录故障产生的原因,找到解决方法;,故障分析预测。,1.2,常用的网络故障测试命令,常用的网络故障测试命令有,ipconfig,、,ping,、,tracert,、,netstat,和,nslookup,等。下面简单说明它们的基本用法。,1.2 常用的网络故障测试命令 常用的网络故障测试,ipconfig命令,ipconfig,命令采用,Windows,窗口的形式来显示,IP,协议的具体配置信息。如果,ipconfig,命令后面不跟任何参数直接运行,程序将会在窗口中显示网络适配器的物理地址、主机的,IP,地址、子网掩码以及默认网关等。还可以通过此程序查看主机的相关信息如:主机名、,DNS,服务器、节点类型等。其中网络适配器的物理地址在检测网络错误时非常有用。在命令提示符下键入,ipconfig,?可获得,ipconfig,的使用帮助,键入,ipconfig,all,可获得,IP,配置的所有属性。,ipconfig命令 ipconf,ipconfig,命令语法格式:, “ ”:,不带任何参数选项,那么它为每个已经配置了的接口显示,IP,地址、子网掩码和缺省网关值。,? :,进行参数查询,;, all :,显示本机,TCP/IP,配置的详细信息;,release : DHCP,客户端手工释放,IP,地址;,renew: DHCP,客户端手工向服务器刷新请求;,flushdns :,清除本地,DNS,缓存内容;,displaydns:,显示本地,DNS,内容;,registerdns: DNS,客户端手工向服务器进行注册;,showclassid:,显示网络适配器的,DHCP,类别信息;,setclassid:,设置网络适配器的,DHCP,类别。,ipconfig命令语法格式: “ ”: 不带任何参数,单击“程序”“运行”,输入,CMD,进入,DOS,命令行窗口,在,DOS,命令行窗口中输入,ipconfig /all,,会显示出如图所示画面,。,单击“程序”“运行”,输入CMD进入DOS命令行窗,ping 命令,ping,命令主要是用来检查路由是否能够到达某站点。由于该命令的包长小,所以在网上传递的速度非常快,可以快速检测您要去的站点是否可达。如果执行,Ping,不成功,则可以预测故障出现在以下几个方面:, 网线是否连通,;,网络适配器配置是否正确,;, IP,地址是否可用等。,如果执行,Ping,成功而网络仍无法使用,问题很可能出在网络系统的软件配置方面,,Ping,成功只能保证当前主机与目的主机间存在一条连通的物理路径。,ping 命令 ping命令主要是用,在,DOS,命令窗口中输入,ping /?,C:Documents and SettingsAdministratorping /?,Usage: ping -t -a -n count -l size -f -i TTL -v TOS,-r count -s count -j host-list | -k host-list,-w timeout destination-list,Options:,-t Ping the specified host until stopped,To see statistics and continue - type Control-Br,To stop - type Control-C,-a Resolve addresses to hostnames,-n count Number of echo requests to send,-l size Send buffer size,-f Set Dont Fragment flag in packet,-i TTL Time To Live,-v TOS Type Of Service,-r count Record route for count hops,-s count Timestamp for count hops,-j host-list Loose source route along host-list,-k host-list Strict source route along host-list,-w timeout Timeout in milliseconds to wait for each reply,在DOS命令窗口中输入ping /?,1) ping,命令参数介绍,-t ping,指定用户所在的主机向目标主机发送数据,直到中断。,-a,以,IP,地址格式来显示目标主机的网络地址,将地址解析为计算机名。,C:Documents and SettingsAdministratorping -a 159.254.188.86,Pinging lily 159.254.188.86 with 32 bytes of data:,通过运行,ping -a 159.254.188.86,可以知道,IP,为,159.254.188.86,的计算机名是,lily,。,1) ping 命令参数介绍,-n count,发送,count,指定的,echo,数据包数。默认值为,4,。,-l size,发送包含由,size,指定的数据量的,echo,数据包。默认值为,32,字节,最大值是,65 527,。,-f,在数据包中发送“不要分段”标志,数据包就不会被路由上的网关分段。,-i TTL,将“生存时间”字段设置为,TTL,指定的值。,-v TOS,将“服务类型”字段设置为,TOS,指定的值。,-r count,在“记录路由”字段中记录传出和返回数据包的路由。,count,可以指定最少,1,台,最多,9,台计算机。,-n count 发送 count 指定的 echo 数据,-s count,指定,count,指定的跃点数的时间戳。,-j host-list,利用,host-list,指定的计算机列表路由数据包。连续计算机可以被中间网关分隔,(,路由稀疏源,),,,IP,允许的最大数量为,9,。,-k host-list,利用,host-list,指定的计算机列表路由数据包。连续计算机不能被中间网关分隔,(,路由严格源,),,,IP,允许的最大数量为,9,。,-w timeout,指定超时间隔,单位为毫秒。,-s count 指定count指定的跃点数的时间戳。,2),使用,ping,命令测试故障的步骤,现在有一台计算机不能访问,Internet,上的,Web,服务器,我们可以使用,ping,命令找出故障的位置。操作步骤如下:,(1) ping 159.0.0.1,。,如果,ping,不通,则说明本机,TCP/IP,没有装好。,(2) ping,本机的,IP,地址。,如果,ping,不通,则说明网卡没有装好,或网卡驱动有问题。,(3) ping,本网段的其他设备,IP,地址。,如果,ping,不通,则说明连接本机的线路有问题,或者是交换机的端口有问题,也有可能是交换机本身出了问题。,(4) ping,本网段的网关。,如果,ping,不通,则无法上网,因为没有设备能把数据包转发出去。原因可能是路由器没有配置好或代理服务器出了问题。,(5) ping DNS,服务器。,如果,ping,不通,则说明,DNS,服务器出了问题,或本机的,DNS,服务器设置不正确。,2) 使用ping命令测试故障的步骤,tracert 命令,Tracert,命令用来检验数据包是通过什么路径到达目的地的。通过执行,tracert,命令,可以清楚地看到数据走的路径,判定数据包到达目的主机所经过的路径、显示数据包经过的中继节点清单和到达时间。当,ping,一个较远的主机出现错误时,用,tracert,命令可以方便地查出数据包是在哪里出错的。如果信息包一个路由器也不能穿越,则有可能是计算机的网关设置错了。那么,可以用,ipconfig,命令来查看。,tracert 命令 Tracert命令用来检验数据包是,Tracert,命令语法格式:,tracert -d -h maximum_hops -j host_list - w timeout, -d,不解析目标主机的名称,;, -h maximum hops,指定搜索到目标地址的最大跳跃数,;, -j host list,按照主机列表中的地址释放源路由,;, -w timeout,指定超时时间间隔,程序默认的时间单位是毫秒。,Tracert命令语法格式:tracert -d,winipcfg命令,winipcfg,命令的功能与,ipconfig,的基本相同,只是,winipcfg,在操作上更加方便,同时能够以,Windows,的图形界面方式显示。当需要查看任何一台机器上,TCP/IP,协议的配置情况时,选择“开始”“运行”,在出现的对话框中输入,winipcfg,,即可出现测试结果。,winipcfg命令winipcfg命令的功能与ipco,winipcfg,命令语法格式,其中主要参数有:,/all,显示所有的有关,IP,地址的配置信息;,/batch file,将命令结果写入指定文件;,/renew_ all,重试所有网络适配器;,/release_all,释放所有网络适配器;,/renew N,复位网络适配器,N,;,/release N,释放网络适配器,N,。,winipcfg命令语法格式,netstat命令,利用该命令可以显示有关统计信息和当前,TCP/IP,网络连接的情况。,netstat,命令的语法格式是,netstat -r -s -n -a,-a:,显示所有与该主机建立连接的端口信息。,-n:,以数字格式显示地址和端口信息。,-e:,显示以太网的统计信息,该参数一般与,S,参数共同使用。所显示的内容中,,Discards,表示不能处理而被废弃的信息包数,,Errors,表示坏掉的信息包数。这些数值大时,很可能是集线器、电缆和网卡等硬件发生了故障。另外,网络太拥挤也可能导致这些数值的增大。,-s:,显示每个协议的统计情况。如果想要统计当前局域网中的详细信息,可通过输入,netstat -e -s,来查看。,netstat命令 利用该命令可以,nslookup命令,nslookup,命令一般是用来确认,DNS,服务器动作的。,nslookup,有多个选择功能,在命令行输入“,nslookup ”,并执行,即可显示出目标服务器的主机名和对应的,IP,地址,称之为正向解析。若失败了,可能是执行,nslookup,命令的计算机的,DNS,设置错了,也有可能是所查询的,DNS,服务器停止或工作异常。还有一种情况,虽然返回了应答,但一和该服务器通信就失败。这多数是目标服务器停止工作,但也有可能,DNS,服务器保存了错误的信息。在,DNS,服务器出现问题时,有时可能只能进行正向解析,无法进行逆向解析。此时,只需执行,nslookup,命令,看是否输出目标主机名即可。,nslookup,命令语法格式:,nslookup -SubCommand . ComputerToFind| -Server,使用方法:,在,DOS,命令行下输入,nslookup,,敲击回车,此时标识符变为,,然后键入制定网站的域名,再敲击回车就可以显示该域名的相对应的,IP,地址。,nslookup命令 nslookup命令一般是用,arp命令,arp,命令可以显示和设置,Internet,到以太网的地址转换表内容。这个表一般由,ARP,来维护。当仅使用一个主机名作为参数时,,arp,命令显示这个主机的当前,ARP,表条目内容。如果这个主机不在当前,ARP,表中那么,ARP,就会显示一条说明信息。,arp,命令语法格式:,arp -a -d host -s host address -f file, -a,列出当前,ARP,表中的所有条目 ;,-d host,从,ARP,表中删除某个主机的对应条目 ;,-s host address,使用以太网地址在,ARP,表中为指定的,temppubtrail,主机创建一个条目。如果包含关键字,temp,,创建的条目就是临时的;否则这个条目就是永久的。,pub,关键字标识这个,ARP,条目将被公布。使用,trail,关键字表示将使用报尾封装;,-f file,读一个给定名字的文件,根据文件中的主机名创建,ARP,表的条目。,arp命令 arp命令可以显示和设置Interne,1.3,网络故障管理系统,使用,ping,的方法只能针对小型网络,在一些大型网络中一般使用网络故障管理软件,一个网络的故障管理系统不但能反应网络平常运行时的故障情况,更应该能在发生重大网络故障时,快速准确地报告、定位和排除故障。,网络故障管理系统包括:,Navis NFM,故障管理系统;,Netcool,故障管理系统。,Navis NFM(Network Fault Management),是朗讯科技网络运行系列软件中最著名的产品。其功能强大,能够提供实时故障监测和相关处理,快速定位故障,关联故障,并可提供多厂家、多技术和多业务区的集中管理。另外,“现成的方案”可以快速进行工程实施,并提供本地化的客户和技术支持。,1.3 网络故障管理系统 使用pin,Navis NFM,核心功能包括:,告警信息采集、浏览、过滤、分类等。,支持信息压缩,可根据信息发生的次数、数值、时间和分组进行压缩。,告警门限设置和级别升级,( Critical,、,Major,、,Minor,、,Other,、,Cleared ),。,自动的告警通知和告警处理功能,(,寻呼、发送电子邮件、生成工单、网元重新启动等,),。,多种颜色的故障信息显示和图形化的网络地图显示。,支持开放的接口和,API(ASCII,、,SNMP v1-v3,、,CORBA,、,X.25,、,TL1),。,远端登录到网元和网元管理系统。,NFM,可以根据用户的级别,实现分权和分级管理。系统管理员可以为不同的用户设置不同的权限,只定义该用户关心的网元的故障信息的浏览、查找、操作和远程登录等功能。每个用户用自己的账户登录系统后,只能看到权限之内的信息,以及执行被允许的各种操作。同时,,NFM,还备有用户使用记录,从而实现对人员使用情况的管理,加强对整个系统的安全保障。,NFM,提供强大的告警抑制功能,可以对非告警类报告提供过滤;根据各种门限进行告警抑制;告警恢复后,,NFM,可以自动清除原告警,并将其转入已清除告警中;对告警进行域内、域间的相关性处理等,从而大幅度地减少告警的数量,并有效地减少了分析故障根源所花费的时间。,用户还可以将客户信息和服务相关数据集成到,Navis NFM,数据库,,NFM,可实时地显示与故障相关的客户和服务数据信息,产生针对特定客户和服务的故障报告,并在故障影响客户之前对其进行评估。,Navis NFM核心功能包括:,1.4,网络故障诊断,网络故障诊断是管好、用好网络,使网络发挥最大作用的重要技术工作。,网络故障诊断是从故障现象出发,以网络诊断工具为手段获取诊断信息,确定网络故障点,查找问题的根源,排除故障,恢复网络的正常运行。,1.4 网络故障诊断 网络故障诊断是管好、用好,网络故障通常有以下几种可能:,物理层中物理设备相互连接失败或者硬件和线路本身的问题;,数据链路层的网络设备的接口配置问题;,网络层网络协议配置或操作错误;,传输层的设备性能或通信拥塞问题;,网络应用程序错误。,诊断网络故障的过程应该沿着,OSI 7,层模型从物理层开始向上进行。首先检查物理层,然后检查数据链路层,以此类推,确定故障点。,网络故障通常有以下几种可能:,1.4.1,故障诊断步骤,故障诊断应该实现三方面的目的:, 确定网络的故障点,排除故障,恢复网络的正常运行;, 发现网络中故障点的原因,改善优化网络的性能;, 观察网络的运行状况,及时预测网络通信质量。,1.4.1 故障诊断步骤 故障诊断应该实现三方面的目,故障诊断的步骤如下:,(1),确定故障的具体现象,分析造成这种故障现象的原因。例如,主机不响应客户请求服务。可能的故障原因是主机配置问题、接口卡故障或路由器配置命令丢失等。,(2),收集需要的用于帮助隔离可能故障原因的信息。从网络管理系统、协议分析跟踪、路由器诊断命令的输出报告或软件说明书中收集有用的信息。,(3),根据收集到的情况考虑可能的故障原因,排除某些故障原因。例如,根据某些资料可以排除硬件故障,把注意力放在软件原因上。,故障诊断的步骤如下:,(4),根据最后的可能故障原因,建立一个诊断计划。开始仅用一个最可能的故障原因进行诊断活动,这样可以容易恢复到故障的原始状态。如果一次同时考虑多个故障原因,试图返回故障原始状态就困难多了。,(5),执行诊断计划,认真做好每一步的测试和观察,每改变一个参数都要确认其结果。分析结果确定问题是否解决,如果没有解决,继续下去,直到故障现象消失。,(4) 根据最后的可能故障原因,建立一个诊断计划。开始仅用一,1.4.2,故障排除过程,在开始动手排除故障之前,在记事本上将故障现象认真仔细记录下来,观察和记录时一定要注意细节,因为有时正是一些最小的细节使整个问题变得明朗化。,1.4.2 故障排除过程 在开始动手排除故障之前,1.,识别收集故障现象,作为管理员,在排除故障之前,必须确切地知道网络上到底出了什么毛病。知道出了什么问题并能够及时识别,是成功排除故障最重要的步骤。为了与故障现象进行对比,必须知道系统在正常情况下是怎样工作的,反之,是不好对问题和故障进行定位的。,识别收集故障现象时,应该向操作者询问以下几个问题:,(1),当被记录的故障现象发生时,正在运行什么进程,(,即操作者正在对计算机进行什么操作,),?,(2),这个进程以前运行过吗?,(3),以前这个进程的运行是否成功?,(4),这个进程最后一次成功运行是什么时候?,(5),从那时起哪些发生了改变?,带着这些疑问来了解并分析问题才能对症下药来排除故障。,1. 识别收集故障现象 作为管理员,在,2.,对故障现象详细描述,当处理由操作员报告的问题时,对故障现象的详细描述显得尤为重要。如果仅凭他们的一面之词,有时还很难下结论,这时就需要网管员亲自操作出错的程序,并注意出错信息。例如,在使用,Web,浏览时,无论输入哪个网站都返回“该页无法显示”之类的信息。使用,ping,命令时,无论,ping,哪个,IP,地址都显示超时连接信息等。诸如此类的出错消息会为缩小问题范围提供许多有价值的信息。对此在排除故障前,可以按以下步骤执行:,(1),收集有关故障现象的信息。,(2),对问题和故障现象进行详细的描述。,(3),注意细节。,(4),把所有的问题都记下来。,(5),不要匆忙下结论。,2. 对故障现象详细描述 当处理由操,3,.,对计算机设备本身的运行状况进行检查,作为网络管理员,应对计算机设备本身的运行状况进行检查。,(1),检查操作系统的运行、网络协议、网络地址的设置、网络接口设备驱动程序和设备收发网络数据包的情况。,(2),检查网络接口设备与网络接入设备的连接情况。,(3),检查服务器到网络接口设备的连接状况。,(4),检查网络连接设备运行状况。,(5),检查网络主干设备流量状况,检查端口数据流量的大小,检查重发包、错包和丢包的比例,检查设备上数据包发生碰撞的比例,检查流量情况的日志文件内容,注意拥塞控制的报警阙值设置。,3. 对计算机设备本身的运行状况进行检查 作为网络,4.,列举可能导致错误的原因,作为网络管理员,则应考虑导致无法查看信息的原因可能有哪些,如网卡硬件故障、网络连接故障、网络设备,(Hub),故障、,TCP/IP,协议设置不当等。这里需要注意的是:不要着急下结论,可以根据出错的可能性把这些原因按优先级别进行排序,一个个先后排除。,4. 列举可能导致错误的原因 作为网络管理员,则应考虑,5.,缩小搜索范围,对所有列出的可能导致错误的原因逐一进行测试,而且不要根据一次测试,就断定某一区域的网络是运行正常或是不正常。另外,也不要在自己认为已经确定了的第一个错误上停下来,应直到测试完为止。,除了测试之外,网络管理员还要注意:千万不要忘记去看一看网卡、,Hub,、,Modem,、路由器面板上的,LED,指示灯。通常情况下,LED,指示灯:,绿灯表示连接正常,(Modem,需要几个绿灯和红灯都要亮,),;,红灯表示连接故障;,不亮表示无连接或线路不通;,长亮表示广播风暴;,指示灯有规律地闪烁才是网络正常运行的标志。,同时不要忘记记录所有观察、测试的手段和结果。,5. 缩小搜索范围 对所有列出的可能导致错误的原因,6,.,隔离错误,经过一翻检查后,基本上知道了故障的部位。对于计算机的错误,可以开始检查:,该计算机网卡是否安装好;,TCP/IP,协议是否安装并设置正确;,Web,浏览器的连接设置是否得当等一切与已知故障现象有关的内容。处理完问题后,作为网络管理员,还必须搞清楚故障是如何发生的,是什么原因导致了故障的发生,以后如何避免类似故障的发生,拟定相应的对策,采取必要的措施,制定严格的规章制度。,6. 隔离错误 经过一翻检查后,基本上知道了故障的部位,1.4.3,故障原因,虽然故障原因多种多样,但总的来讲不外乎就是硬件问题和软件问题。说得再确切一些,这些问题就是网络连接性问题、配置文件选项问题和网络协议问题。,1.4.3 故障原因 虽然故障原因多种多样,但总,1.,网络连接性,网络连接性是故障发生后首先应当考虑的原因。连通性的问题通常涉及到网卡、跳线、信息插座、网线、,Hub,、交换机、,Modem,等设备和通信介质。连通性通常可以采用软件和硬件工具进行测试验证。如某一台计算机不能浏览,Web,时,网络管理员应当考虑:,网络连通吗?,看得到网上邻居吗?,可以收发电子邮件吗?,ping,得到网络内的其他计算机吗?,只要其中一项回答为,yes,,那就可以断定本机到,Hub,的连通性没有问题。再在那台计算机上重复上述操作,只要有一项回答为,yes,,则肯定本机到“数据源”的连通性没有问题。当然,即使都回答,No,,也不就表明连通性肯定有问题,也有可能是其他问题,如计算机的网络协议的配置出现了问题也会导致上述现象的发生。当然,还要看一看网卡和,Hub,、交换机接口上的指示灯是否正常。,如果排除了由于计算机网络协议配置不当而导致故障的可能,接下来要做的事情就复杂了。查看网卡和,Hub,、交换机的指示灯是否正常,测量网线是否畅通。,1. 网络连接性,2.,配置文件和选项,服务器、计算机都有配置选项,配置文件和配置选项设置不当,同样会导致网络故障。如服务器权限的设置不当,会导致资源无法共享的故障;计算机网卡配置不当,会导致无法连接的故障。当网络内所有的服务都无法实现时,应当检查,Hub,、交换机。,2. 配置文件和选项,3.,使用诊断工具,ping,无疑是网络中使用最频繁的小工具,它主要用于确定网络的连通性问题。,ping,程序使用,ICMP(,网际消息控制协议,),协议来简单地发送一个网络数据包并请求应答,接收到请求的目的主机再次使用,ICMP,发回相同的数据,于是,ping,便可对每个包的发送和接收时间进行报告,并报告无影响包的百分比,这在确定网络是否正确连接,以及网络连接的状况,(,包丢失率,),时十分有用。,3. 使用诊断工具,(4) Timed out(,超时,),即与中心的连接超时,数据包全丢。故障原因可能是到路由器的连接问题或路由器不能通过,也可能是中心主机已经关机或死机。此时,屏幕提示:,C:windowsping 10.11.1.1,Ping 10.11.1.1with 32 bytes of data:,Request timed out.,Request timed out,Request timed out,Request timed out,Ping statistics for 10.11.1.1:,Packets: sent=4,received=0,lost=4(100% lost),Approximate round trip in milli-seconds:,Minimum=0ms,Maximum=0ms,Average=0ms,(4) Timed out(超时),1.4.4,网络故障的内容和故障排除的,5,个步骤,网络故障的排除是计算机专业人员面临的最困难的任务之一。问题往往出现在工作过程中,或者在任务有期限要求的时候,要快速修复出现的问题,困难就会很大。,网络发生故障后,首先是要诊断,协议故障,?,连通性故障,?,配置、设备故障,? DDOS,攻击,?,找到问题的来源,然后进行故障排除。,1.4.4 网络故障的内容和故障排除的5个步骤,网络故障排除的过程大致可分为,5,个步骤。,(1),定义问题,这一步非常重要,却经常被人们忽视。如果对整个问题没有进行全面的了解,就有可能将大量的时间花在对症状的研究上,而不是对问题的原因进行探讨。这个阶段所需的工具仅仅是纸、笔和良好的接受能力。,听取客户或者网络用户的意见是最好的信息来源。记住,尽管您可能知道网络是如何工作的,并且可以发现故障的技术原因,但那些每天都使用网络的人在问题出现之前或者之后都在网络上工作,并且可能会回想起导致故障的事件。通过从他们的意见中汲取信息,可以从纷繁复杂的各种可能的故障原因中理出头绪。列出故障发生之前的时间发生顺序将有助于了解问题。您可能希望能建立一张表格系统地向用户提出以下一些问题,(,具体问题将由具体的情况而定,),:,网络故障排除的过程大致可分为5个步骤。,您是在何时注意到问题或者错误的?,计算机最近是否进行了移动?,最近是否在软件或者硬件上有所更改?,工作进行了变化吗?是否有某些东西砸在电脑上面?咖啡或者苏打水是否曾经洒在键盘上?,问题发生的确切时间是什么时候?是在启动的过程中吗?在午餐后?仅仅在星期一的商务活动中?在发送电子邮件之后?,您可以使问题或者错误在线吗?如果可以,怎样产生错误?,问题或者错误的症状怎样?,描述计算机的任何变化,(,如噪声、屏幕更改和磁盘工作情况等,),您是在何时注意到问题或者错误的?,用户,(,甚至那些没有技术背景的人,),在收集信息的过程中都可能非常有帮助,只要您有效地对他们提出一些问题。例如,您可以问他们当网络出现何种表现时让他们感觉到出现了问题。用户的观察可能会构成解决网络问题的基础。这些问题包括:,“网络真慢”;,“我不能连接到服务器”;,“我曾见连接到服务器上,但是后来又掉线了”;,“我的一个应用程序不能运行”;,“我不能打印”。,当您继续提问的时候,就可以逐步缩小范围。,用户(甚至那些没有技术背景的人)在收集信息,(2),找出原因,首先排除明显的问题,然后再排除复杂的、隐晦的问题,目标是将重点缩小为一个或者两个分类之内。如果可能的话,让某些人为您演示一下发生错误的情况。如果这是一个操作人员引起的问题,那么很重要的一点是观察问题是如何发生的,以及问题造成的后果。,最难以隔离的问题是间断性发生的问题,并且,它们似乎从来不在您在场的时候发生。解决这类问题的唯一办法是重新创建产生问题的环境。有时,使用排除法是最好的方式。这个过程需要时间和耐心。用户也应该对问题出现之前和期间的所作所为进行记录。这可以有助于告知用户在计算机出现问题的时候不要对它进行任何操作,并且及时通知您,这种方式可以保证现场不被破坏。,尽管收集的信息为隔离问题提供了基础,但管理员也应该参考记录的基准信息,并与当前的网络操作进行比较。在与创建基准条件相同的环境下重新进行测试,然后比较两个结果。两者之间的任何变化都可能指示出问题的原因。,信息的收集包括对网络进行扫描,以及寻找问题的明显原因。快速扫描包括对网络的历史记录进行查询,以确定问题以前是否发生过,如果是的话,是否存在记录在案的解决办法。,(2) 找出原因,(3),计划修复,在缩小了研究的范围之后,就可以开始下一过程的:排除。,根据目前已经掌握的情况制订一个隔离问题的方法。首先尝试使用最显而易见的或者最简单的方法来进行排除,然后再采用更复杂和麻烦的方法。必须对过程中的每个步骤都进行记录,以及每个操作和该操作的结果。,在制订好计划后,必须严格遵循计划的步骤。随意的行为可能会导致问题的出现。如果第一个计划没有成功,(,非常有可能,),,那么,根据您在先前计划的基础上重新制订一个计划。一定要对前一个计划中所做的任何假设进行参考、重新检查和重新评估。,在确定了问题后,或者对缺陷进行修复,或者替换有缺陷的部件。如果问题是与软件有关的,那么一定要对前后的变化进行记录。,(3) 计划修复,(4),证实结果,在进行修复之后,如果没有证实结果如何,就不能下结论说已经成功地完成了任务。您应该确保问题不复存在了。请用户对问题的解决进行测试和验证。您也应该确保修复没有带来新的问题。不仅要证实您已经修复了问题,而且要确保您的操作没有对网络的其他任何部分带来负面的影响。,(4) 证实结果,(5),对输出进行记录,最后,对问题和修复进行记录。记录故障排除过程的收获非常有益。没有任何东西可以取代您排除故障的经验,并且,每个新问题都为您提供了一个丰富经验的机会。在您的技术资料库中保留了一个修复过程的备份。这样,当问题,(,或类似的问题,),再次出现的时候就非常有用了。对排除故障的过程进行记录是建立、保持和共享经验的一种方式。,要记住,您所做的任何更改都可能会影响基准条件。您可能需要对网络的基准进行更新,以备未来出现问题时使用。,如果对网络统计数字和症状进行初步了解之后,还不能提出一个明显的问题,那么,排除故障的下一步就是把整个网络分为较小的部分,以帮助隔离出问题产生的地方。,(5) 对输出进行记录,1.5,网络诊断工具,1.,网络测试仪,网络测试仪具有如下优点:,测量速度快;,测量精度高;,故障定位准;,节省了用户查找故障的时间。,1.5 网络诊断工具 1. 网络测试仪,2.,数字电压表,数字电压表,(,电压欧姆表,),是多用途的电子测量工具。使用电压表可以确定:,电缆是否连接,(,是否有断路,),;,电缆是否可以运载网络通信量;,同一电缆的两个部分是否暴露和接触,(,因而造成短路,),;,电缆的暴露部分是否触及了另一个导体,如金属表面。,网络管理员要检查网络设备的电源。长时间在低电压下工作可能会导致电子设备出现问题。低电压通常会导致间断性的错误。可能出现的另一个极端是,过高的电压导致设备立即遭到破坏。,因此,在新的地点或新的建筑物中,必须在连接任何电子设备之前对输出电压进行检查,以确保它们在可以接受的范围内。,2. 数字电压表,3.,其他硬件工具,(1),交叉电缆:绕过网络,直接对计算机的通行能力进行隔离和测试。,(2),硬件回送设备:这是一个串口连接器,利用它,您不必将一台计算机的串口连接到另一台计算机或外设,就可以对计算机的通信能力进行测试。在利用回送的情况下,数据被传送到一条线路,然后再作为接收数据被返回。如果传送的数据没有返回,那么硬件回送就检测出硬件中存在问题。,(3),高级电缆检测器:高级电缆测试器在数据链路层、网络层,甚至在物理层工作,这已经超越了,OSI,参考模型的物理层次。它也可以显示有关物理电缆的状态信息。,(4),示波器:示波器是一种以时间为单位测量信号电压值的电子装置,它在一个显示器上显示结果。当与,TDR,一起使用的时候,示波器可以显示:,短路;,电缆中突然的弯曲和卷曲;,开路,(,电缆中的断路,),;,衰减,(,信号电源的损失,),等。,3. 其他硬件工具,本章重点介绍以下内容:,1.,介绍物理层概述;,2.,物理层主要问题;,3.,双绞线故障诊断与排除;,4.,光缆故障诊断与排除;,5.,集线器故障诊断与排除;,6.,调制解调器故障诊断与排除;,第,2,讲:物理层故障诊断与排除,本章重点介绍以下内容:第2讲:物理层故障诊断与排除,2.1,物理层概述,物理层是,OSI,分层结构体系中最基础的一层,它建立在通信媒体的基础上,实现系统和通信媒体的物理接口,为数据链路实体之间进行透明传输,为建立、保持和拆除计算机与网络之间的物理连接提供服务。,物理层在,OSI,参考模型,(OSI/RM),中的位置如图,2-1,所示。,2.1 物理层概述 物理层是OSI分层结,1.,物理层的主要作用,实现相邻节点之间比特数据流的透明传送,尽可能屏蔽具体传输介质和物理设备的差异,利用物理传输介质为数据链路层提供物理连接,(,物理信道,),,为数据链路层提供比特流服务。,物理层是所有网络的基础,主要关心的问题有:,用多少伏特电压表示,1,,多少伏特电压表示,0,,一个比特持续多少微秒;,是单工、半双工还是全双工;,最初的连接如何建立和完成,通信后连接如何终止;,网络接插件有多少针和各针的用途;,信道的最大带宽;,传输介质,(,例如,是有导线的还是无导线的,),;,传输方式:是基带传输还是频带传输,或者二者均可;,多路复用技术,如,FDM,、,TDM,和,WDM(Wave-length Division Multiplexing,,波分多路复用,),等。,1. 物理层的主要作用 实现相邻节点之间比特数据流的,2.,物理层的主要功能,物理连接的建立,维持和拆除;,实体之间信息的按比特传输;,实现四大特性,(,机械特性、电气特性、功能特性、规程特性,),的匹配。,2. 物理层的主要功能物理连接的建立,维持和拆除;,3.,物理层标准,物理层标准的主要任务就是规定,DCE,设备和,DTE,设备的接口,包括接口的机械特性、电气特性、功能特性和规程特性。,DTE,是数据终端设备,,DCE,是数据电路端接设备。,DCE,的作用就是在,DTE,和传输线路之间提供信号变换和编码的功能,并且负责建立、保持和释放数据链路的连接。,DTE,通过,DCE,与通信传输线路相连,是美国电子工业协会,EIA,制定的著名物理层标准。,物理或机械特性:规定了,DTE,和,DCE,之间的连接器形式,包括连接器形状、几何尺寸、引线数目和排列方式等。,电气特性:规定了,DTE,和,DCE,之间多条信号线的连接方式、发送器和接收器的电气参数,以及其他有关电路的特征。电气特性决定了传送速率和传输距离。,功能特性:对接口各信号线的功能给出了确切的定义,说明某些连线上出现的某一电平的电压表示的意义。,规程特性:规定了,DTE,和,DCE,之间各接口信号线实现数据传输的操作过程,(,顺序,),。,EIA RS-232C/V.24,接口标准是物理层标准之一。,其中,,RS,是,Recommended Standard,的缩写,即推荐标准;,RS-232C,接口标准与国际电报电话咨询委员会,CCITT,的,V.24,标准兼容,是一种非常实用的异步串行通信接口。,RS-232C,建议使用,25,针的,D,型连接器,DB-25,,但是在计算机的,RS-232C,串行端口上,大多使用,9,针连接器,DB-9,。,3. 物理层标准 物理层标准的主要任务就是规定,2.2,物理层主要问题,物理层产生网络故障主要存在,3,大问题。,1.,信号衰减,解决的方法:,(1),信号衰减限制了信号的传输距离。,(2),信号衰减还常常会同时伴随着信号的变形。,(3),采用信号放大和整形的方法来解决信号衰减及其变形问题。,2.,噪声干扰,噪声可能导致信号传输错误,即接收端难以从混杂了较大噪声的信号中提取出正确的数据。,解决的方法:减少噪声的措施,如抵消与屏蔽、良好的端接和接地技术等。,3.,常见物理组件,RJ-45,插座;,RJ-45,头;,DB-25,到,DB-9,的转换器。,解决的方法:按标准规范的要求进行端接,。,2.2 物理层主要问题 物理层产生网络故障主要存在3大问题,2.3,双绞线故障诊断与排除,双绞线故障可能产生的问题有近端串扰未通过、衰减未通过、接线图未通过、长度未通过。现分别介绍如下。,2.3 双绞线故障诊断与排除 双绞线故障可能产,2.3.1,近端串扰未通过,原因可能有:,近端连接点有问题;,远端连接点短路;,串对;,外部噪声;,链路线缆和接插件性能问题或不是同一类产品;,线缆的端接质量问题。,2.3.1 近端串扰未通过原因可能有:,2.3.2,衰减未通过,原因可能有:,长度过长;,温度过高;,连接点问题;,链路线缆和接插件性能问题或不是同一类产品;,线缆的端接质量问题。,2.3.2 衰减未通过原因可能有:,2.3.3,接线图未通过,2.3.3 接线图未通过,2.3.4,长度未通过,原因可能有:,NVP,设置不正确,可用已知的好线确定并重新校准,NVP,;,实际长度过长;,开路或短路;,设备连线和跨接线的总长度过长。,2.3.4 长度未通过原因可能有:,2.3.5,铜导线接头的故障,1.,故障现象,1,:,RJ45,导线接头的故障,故障原因:, 双绞线的头没顶到,RJ45,接头顶端,;,绞线未按照标准脚位压入接头,;,接头规格不符或者是内部的绞线断了,;,镀金层的厚度太薄,(RJ45,仿冒,),。,2.,故障现象,2,:,RJ45,导线接头是符合规范的,但网络无连接,故障原因:,RJ-45,接头的金属片是否已刺入双绞线中,需再对,RJ-45,接头重新压按一次;,双绞线接触不良,需再对,RJ-45,接头重新压按一次;,使用剥线工具时切断了绞线,(,绞线 内铜导线已断,但皮未断,),。,2.3.5 铜导线接头的故障1. 故障现象1:RJ45导线接,2.4,光缆故障诊断与排除,用光缆作传输介质的主干网络常见的故障如下。,故障现象,1,:光纤头,(,尾纤,),是符合规范的,但网络无,连接,故障原因:,光纤弯曲的曲率半径过小而引起光线折断,光纤的弯曲曲率半径是光缆直径的,1520,倍。,购买的光缆有质量问题,可能是运输过程中,碰撞导致光纤折断,这就要求购买光缆时要进行现场测试。测试方法是将光纤两端分别剥去,在一端点燃打火机,在另一端用肉眼观察光纤有没有亮点,如果有,则说明它是好的,否则光纤已折断。,2.4 光缆故障诊断与排除用光缆作传输介质的主干网络常见的,故障现象,2,:无连接或出现间歇性的连接故障,故障原因:,可能是熔接头不合格。,可能是光纤链路端接光纤连接器过多,引起链路衰减过大。,可能是连接器污染,有灰尘、指纹或湿气。,光纤熔接头要规范操作,不要让灰尘落到光纤头上;整个链路衰减值要符合要求。,故障现象2:无连接或出现间歇性的连接故障,故障现象,3,:光纤收发器无连接,故障原因:,(1),首先看光纤收发器或光模块的指示灯是否已亮?,如收发器的光口(,FX,)指示灯不亮,请确定光纤链路是否交叉链接?光纤跳线一头是平行方式连接;另一头是交叉方式连接。,如,A,收发器的光纤口(,FX,)指示灯亮、,B,收发器的光纤口(,FX,)指示灯不亮,则故障在,A,收发器端,一种可能是:,A,收发器(,TX,)光纤发送口已坏,因为,B,收发器的光纤口 (,RX,)接收不到光信号; 另一种可能是:,A,收发器(,TX,)光纤发送口的这条光纤链路有问题(光纤或光线跳线可能断了)。,(2),光缆、光纤跳线是否已断?,光缆通断检测:用手电对着光纤接头或偶合器的一头照光;在另一头 看是否有可见光?如有可见光则表明光纤没有断。,光纤连线通断检测:用激光手电、太阳光等对着光纤跳线的一头照光;在另一头 看是否有可见光? 如有可见光则表明光纤跳线没有断。,故障现象3:光纤收发器无连接,2.5,集线器故障诊断与排除,2.5.1,集线器概述,集线器是中继器的一种形式,区别在于集线器能够提供多端口服务,也称为多口中继器。集线器在,OSI/RM,中的位置如图,2-9,所示。,2.5 集线器故障诊断与排除 2.5.1 集线器概,2.5.2,故障诊断与排除,集线器是在中继器的基础上研发的,有人称其为多口中继器。集线器常见的故障如下。,1.,故障现象,1,:集线器不能工作,故障原因:,检查是否接通电源,可能是没有接通电源的原因。,检查指示灯是否亮,若有电但指示灯不亮,则中继器已损坏。,若有电且指示灯正常,则检查线路接口是否安装牢固,避免接触不良。,2.,故障现象,2,:帧间距过短造成的数据信号丢失,故障原因:,帧间距过短主要是由于某些接口在冲突发生后,立即传送数据而没有遵守,9.6s,间距规则。,数据包碎片有时会产生帧间距过短。,针对上述现象,对集线器进行专业检修,。,2.5.2 故障诊断与排除 集线器是在中继器的基础上,3.,故障现象,3,:集线器的接地问题,故障原因:如果接地的集线器和接地终端电阻之间经由电缆形成一个电流环路,且两地存在电压差,就会产生干扰电流,进而发生干扰信号,导致冲突率上升,甚至网络中断。,4.,故障现象,4,:传输路径上集线器过多,故障原因:传输路径上,集线器最多不能超过,4,个。否则,其后果是增大了信息传输的延时,造成网络效率低下,冲突也就越频繁。,5.,故障现象,5,:在“网上邻居”或“资源管理器”中只能找到本机的机器名。,故障原因:网络通信错误,一般是网线断路,;,集线器可能有问题或者网卡的接触不良。,3. 故障现象3:集线器的接地问题,2.6,调制解调器故障诊断与排除,2.6.1,调制解调器概述,调制解调器是计算机联网中的一个非常重要的设备。它是一种计算机硬件,能把计算机产生出来的信息翻译成可沿普通电话线传送的模拟信号。而这些模拟信号又可由线路另一端的另一调制解调器接收,并译成接收计算机可懂的语言。调制解调器在,OSI/RM,中的位置如图,2-10,所示。本节着重介绍调制解调器能做什么,如何选择适合于自己的调制解调器,以及怎样将它安装在计算机上。,2.6 调制解调器故障诊断与排除 2.6.1 调制解调器,本章重点介绍以下内容:,1.,数据链路层概述;,2.,网卡故障诊断与排除;,3.,网桥故障诊断与排除;,4.,交换机故障诊断与排除;,5.,数据链路层故障排除实例。,6. VLAN,第,3,讲:数据链路层故障诊断与排除,本章重点介绍以下内容:第3讲:数据链路层故障诊断与排除,数据链路层概述,数据链路层利用物理层提供的服务,与对等层进行以信元为信息单位的通信,它们对其上一层网络提供服务。,数据链路层的功能为:在物理层提供比特流传输服务的基础上,在通信的实体之间建立数据链路连接,传,送以帧为单位的数据,通过差错控制,,流量控制方法,使有差错的物理线,路变成无差错的数据链路。数据链路,层在,OSI,模型中的位置如图,3-1,所示。,数据链路层概述数据链路层利用物理层提供的服务,与对等层进行,3.2,网卡故障诊断与排除,3.2 网卡故障诊断与排除,网卡是,LAN,的接入设备,是单机与网络间架设的桥梁。,它主要完成如下功能:,读入由其他网络设备,(,路由器、交换机、集线器或
展开阅读全文