资源描述
HUAWEI TECHNOLOGIES CO.,LTD.,Page,*,单击此处编辑母版标题样式,Huawei Confidential,英文标题,:32-35pt,颜色,:R153 G0 B0,内部使用字体,:,FrutigerNext LT Medium,外部使用字体,:Arial,中文标题,:30-32pt,颜色,:R153 G0 B0,字体,:,黑体,英文正文,:20-22pt,子目录,(2-5,级,):18pt,颜色,:,黑色,内部使用字体,:,FrutigerNext LT Regular,外部使用字体,:Arial,中文正文,:18-20pt,子目录,(2-5,级,):18pt,颜色,:,黑色,字体,:,细黑体,配色参考方案:,建议同一页面内不超过四种颜色,以下是,13,组配色方案,同一页面内只选择一组使用。(仅供参考),客户或者合作伙伴的标志放在右上角,.,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,HUAWEI TECHNOLOGIES CO.,LTD.,Huawei Confidential,Security Level:,英文标题,:40-47pt,副标题,:26-30pt,字体颜色,:,反白,内部使用字体,:,FrutigerNext LT Medium,外部使用字体,:Arial,中文标题,:35-47pt,字体,:,黑体,副标题,:24-28pt,字体颜色,:,反白,字体,:,细黑体,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,英文目录标题,:35-40pt,颜色,:R153 G0 B0,内部使用字体,:,FrutigerNext LT Medium,外部使用字体,:Arial,中文目录标题,:35-40pt,颜色,:R153 G0 B0,字体,:,黑体,英文目录正文,:28-30pt,子目录,(2-5,级,):20-30pt,颜色,:,黑色,内部使用字体,:,FrutigerNext LT Regular,外部使用字体,:Arial,中文目录正文,:28-30pt,子目录,(2-5,级,):20-30pt,颜色,:,黑色,字体,:,细黑体,Thank you,Page,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Copyright 2008 Huawei Technologies Co.,Ltd.All rights reserved.,Page,*,Copyright 2008 Huawei Technologies Co.,Ltd.All rights reserved.,Internal Use Only,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Page,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Copyright 2008 Huawei Technologies Co.,Ltd.All rights reserved.,Page,*,Copyright 2008 Huawei Technologies Co.,Ltd.All rights reserved.,Internal Use Only,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2024/11/30,PTN,常见开局故障处理,PTN,产品组,LITOlab,Page,2,培训目标,学完本课程后,您应该能:,了解,PTN,产品故障处理基本步骤,掌握,PTN,产品常见故障处理方法,参考资料,Opti,X,PTN,故障处理手册,Opti,X,PTN,告警和性能手册,目录,PTN,故障定位方法,PTN,常见故障处理,Page,4,PTN,故障定位方法,告警法,PTN,在各种物理端口、逻辑端口、业务、,PW,等都有相关的告警。当发生故障时,查询当前设备的相关告警。通过分析告警,可以迅速的找到问题发生在什么层面。在定位业务故障的时候,通常建议首先关注传输层和物理层的告警,性能法,PTN,在各种物理端口、逻辑端口(如,IMA,组、,MP,组等)、业务、,PW,都支持性能统计计数。当业务中断后,通过读取业务的相关性能,可以确认数据报文在哪台网元,在什么层面丢了。比如,如果发现端口上有误码计数,就可以直接判定是中间链路问题,环回法(,CES,业务常见方法),PTN,在各种物理端口、逻辑端口(如,IMA,组)都支持环回功能。在某些物理端口的故障发生后,通过环回的方法,可以确认问题所在的设备(或链路),业务,oam,法(重点了解和掌握),ATM,业务与,ETH,业务都支持,OAM,功能,通过,OAM,可以准确的定位到故障所在的网元和处理板,进而可以快速的对业务进行恢复,Page,5,环回法定位,CES,业务故障,现象描述,:,在下面的组网图中,用误码仪测出,BSC,与,BTS,之间的,CES,业务中存在大量误码,处理步骤,步骤,1,:,在网元,NE01,上连接仪表做误码测试。将,NE04,的,L75,单板上的,2M,端口设置为“内环回”,仪表显示有大量误码。,步骤,2,:,在,NE03,配置静态,ARP,表项,,MAC,地址选择,NE03,的出端口,,IP,地址选择,NE04,。在,NE03,和,NE04,之间创建入标签和出标签相同的,Tunnel,步骤,3,:,将,NE04,的网络侧端口设置为“外环回”,连接,NE01,的仪表仍然显示有误码,将,NE03,上连接,NE04,的网络侧端口设置为“内环回”,仍然有误码。,步骤,4,:,将,NE03,上连接,NE02,的网络侧端口设置为“外环回”,误码消失。,据此判定问题出在,NE03,网元。,步骤,5,:,更换,NE03,网元上对,NE02,对接的,10GE,线路板,EX2,,误码消失,Page,6,PTN OAM,知识,-MPLS OAM,MPLS,支持多种三层和二层协议,提供一个完全不依赖于任何上层或下层的,OAM,机制,MPLS OAM,使用,CV/FFD,、,Ping,等方式检测,LSP,的连通性,CV,(,Connectivity Verification,),/FFD,(,Fast Failure Detection,)单向连通检测,1,.Ingress,节点发送,CV/FFD,检测报文,,Transit,节点透传报文,报文通过被检测的,LSP,到达,Egress,节点;,2.,Egress,节点把接收到的报文类型、频率、,TTSI,等信息字段与本地记录的应该收到的对应值相比较来判断报文的正误,并统计检测周期内收到的正确报文与错误报文的数量,从而实现对,LSP,的连通性的实时监,3,.,当,Egress,节点检测到,LSP,缺陷后,分析出缺陷类型,通过反向通道将携带缺陷信息的,BDI,报文发送给,Ingress,节点,从而使,Ingress,节点及时获知缺陷状态,MPLS Ping,单向连通检测,1.MPLS Ping,使用,MPLS Echo Request,和,MPLS Echo Reply,检测,LSP,的可用性。,Echo Request,中携带需要检测的,FEC,信息,和其他属于此,FEC,的报文一样沿,LSP,发送,从而实现对,LSP,的检测,2.Echo Request,消息应该达到,Tunnel,的,Egress,节点,由,Egress,节点的控制平面确认本节点是否是该,FEC,的出口。通过,MPLS Ping,可以检测,LSP,是否建立成功,Page,7,PTN OAM,知识,-PW OAM,PTN,设备将业务报文进行,PW,封装后送到,Tunnel,中进行承载。网络中存在,Tunnel,和,PW,两个层次,,MPLS Tunnel,可以通过,MPLS OAM,维护和管理,而,PW,层则需要通过,PWOAM,来进行维护和管理,PW OAM,的主要检测方式是,PW Ping,,,Ping,报文在,Ingress,节点封装进,PW,中,沿虚电路发送,从而实现对,PW,的检测,如图,所示,,NE1,和,NE2,之间存在一条由,PW,承载的,CES,业务,在,NE1,发起,PW Ping,测试,可以查看,Ping,测试的结果,检测,PW,的运行状态,Page,8,PTN OAM,知识,-,以太业务,OAM,以太网业务,OAM,是一种基于,MAC,层的协议,它通过发送,OAM,报文来检测以太网链路,以太网业务,OAM,包括,CC,、,LB,和,LT,三种检测手段,1.,环回检测(,LB,),源端,MEP,将构造并发送,LBM,帧,同时启动定时器开始计时。如果目的,MEP,收到该,LBM,,将构造,LBR,帧发送回源端,MEP,,环回成功。如果源端,MEP,定时器超时,环回失败,2.,单向连通性检测(,CC,),,源端,MEP,将周期性的发送,CC,帧,目的,MEP,收到源端发送的,CC,帧后,启动,CC,检测功能。如果目的,MEP,在一定时间之内没有收到源端的,CC,报文,则自动上报,ETH_CFM_LOC,告警。,3.,链路追踪检测(,LT,),,源端,MEP,发送,LTM,帧,同时启动定时器开始计时。链路上所有的,MIP,都会转发,LTM,帧,所有收到,LTM,帧的,MEP,和,MIP,都会回送,LTR,帧响应,根据这些,LTR,帧可以判断出源,MEP,到目的,MEP,所经过的所有,MIP,。如果源端,MEP,定时器超时,,LT,失败,Page,9,PTN,故障定位流程,掌握,PTN OAM,使用是快速定位链路和业务故障的关键,目录,PTN,故障定位方法,PTN,常见故障处理,DCN,故障处理,MPLS Tunnel,故障处理,PW,故障处理,CES,业务故障处理,以太网业务故障处理,时钟故障处理,Page,11,DCN,故障处理流程,DCN,故障现象,网管与网元通信中断,网管上网元图标变灰色,网元脱管;,网管操作命令没有响应。若响应中断时间持续超过,2,分钟,网管与网元通信中断,网管查询信息部分丢失,故障可能原因,原因,1,:全网内的网元,ID,、网元,IP,或者子网掩码存在冲突。,原因,2,:故障网元的带内,DCN,端口未使能,或对接端口参数配置不一致。,原因,3,:故障网元与网管之间的物理连接中断。,原因,4,:接收信号丢失或接收光功率过低,无法提取,DCN,报文。,原因,5,:单板故障。,原因,6,:,DCN,穿越的第三方网络不健康,引入,DCN,风暴或,DCN,中断。,原因,7,:带内,DCN,通道带宽配置过低。,原因,8,:故障网元主控板正在复位或发生了主备倒换,带内,DCN,报文得不到响应。,Page,12,DCN,故障处理方法,故障原因,检查点,处理方式,全网内的网元,ID,、网元,IP,或者子网掩码存在冲突,对照网元规划表,检查新网元的网元,ID,、网元,IP,、子网掩码的配置是否正确,正确配置新网元的参数,故障网元的带内,DCN,端口未使能,或对接端口参数配置不一致,检查链路两端的端口是否已使能,DCN,检查两端端口的参数配置是否一致,使能端口的带内,DCN,修改端口参数,故障网元与网管之间的物理连接中断,检查故障网元的网线或光纤是否从端口中脱落,插上光纤和网线,接收信号丢失或接收光功率过低,无法提取,DCN,报文,检查网元的历史告警中是否存在,R_LOS,、,ETH_LOS,或,IN_PWR_ABN,等告警,处理导致告警问题,单板故障,查询单板的历史告警中是否存在,HARD_BAD,或,TEMP_OVER,告警,更换单板,DCN,穿越的第三方网络不健康,引入,DCN,风暴或,DCN,中断,需要检查第三方网络中是否存在端口环回、物理通道中断等故障,排除第三方网络故障,带内,DCN,通道带宽配置过低,当端口配置的业务数量超过某一
展开阅读全文