PTN简单故障维护-20080709-A

上传人:t****d 文档编号:242973402 上传时间:2024-09-13 格式:PPT 页数:39 大小:1.09MB
返回 下载 相关 举报
PTN简单故障维护-20080709-A_第1页
第1页 / 共39页
PTN简单故障维护-20080709-A_第2页
第2页 / 共39页
PTN简单故障维护-20080709-A_第3页
第3页 / 共39页
点击查看更多>>
资源描述
HUAWEI TECHNOLOGIES CO., LTD.,Page *,*,单击此处编辑母版标题样式,Huawei Confidential,英文标题:32-35pt,颜色: R153 G0 B0,内部使用字体 :,FrutigerNext LT Medium,外部使用字体 : Arial,中文标题:30-32pt,颜色: R153 G0 B0,字体:黑体,英文正文:20-22pt,子目录 (2-5级) :18pt,颜色:黑色,内部使用字体 :,FrutigerNext LT Regular,外部使用字体 : Arial,中文正文:18-20pt,子目录(2-5级):18pt,颜色:黑色,字体:细黑体,配色参考方案:,建议同一页面内不超过四种颜色,以下是组配色方案,同一页面内只选择一组使用。,(仅供参考),客户或者合作伙伴的标志放在右上角.,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,英文目录标题:35-40pt,颜色: R153 G0 B0,内部使用字体 :,FrutigerNext LT Medium,外部使用字体 : Arial,中文目录标题:35-40pt,颜色: R153 G0 B0,字体:黑体,英文目录正文:28-30pt,子目录 (2-5级) :20-30pt,颜色:黑色,内部使用字体 :,FrutigerNext LT Regular,外部使用字体 : Arial,中文目录正文:28-30pt,子目录(2-5级):20-30pt,颜色:黑色,字体:细黑体,Thank You,PTN,简单故障维护,2024/9/13,NB 1,IMA/ATM,CES,NB2,PTN,PTN,层次化故障维护结构,ETH,NB3,PTN,SDH,or ETH,PTN,PTN,SDH,or ETH,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,物理层:单板,/ ETH,端口,/ SDH,端口,/ E1,口,链路层:,MLPPP / STM / LAG,隧道层:,Tunnel / PW / MPLS APS,业务层:,ETH / CES / IMA / ATM,MLPPP,Page 2,目录,链路层故障维护,2,物理层故障维护,1,隧道层故障维护,3,业务层故障维护,4,数据采集,5,Page 3,单板指示灯,含义,名称,属性,状态,规范建议,工作状态指示,STAT,红,|,绿,|,黄,亮(绿色),表示单板正常工作,亮(红色),表示单板硬件故障,灭,表示单板没有开工或单板没有被创建或单板没有上电状态,业务状态指示,SRV,红,|,绿,|,黄,亮(绿色),表示业务工作正常,没有任何业务告警产生,亮(红色),表示业务有危急或主要告警,亮(黄色),表示业务有次要和远端告警,灭,表示业务没有配置,激活状态指示,ACT/ACTX/ACTC,绿,亮(绿色),业务处于激活状态,单板工作,灭,正常情况,表示业务处于非激活态,100ms,间隔闪烁(绿),保护系统中,表示系统数据库批量备份,时钟同步指示,SYNC,红,|,绿,亮(绿色),时钟工作正常,亮(红色),时钟源丢失或时钟源倒换,程序状态指示,PROG,红,|,绿,亮(绿色),表示上层软件初始化;(上电,/,复位过程中),或软件正常运行,亮(红色),表示内存自检失败;或上层软件加载不成功;或文件丢失;,灭,无,100,毫秒亮,100,毫秒灭(绿色),表示正在进行写,FLASH,操作或软件加载;(上电,/,复位过程中,),300,毫秒亮,300,毫秒灭(绿色),表示正处在,BIOS,引导阶段(上电,/,复位过程中),循环,100,毫秒亮,100,毫秒灭(红色),表示,BOOTROM,自检失败(上电,/,复位过程中),Page 4,NB 1,IMA/ATM,CES,NB2,PTN,PTN,硬件故障相关的告警,ETH,NB3,PTN,SDH,or ETH,PTN,PTN,SDH,or ETH,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,TEMP_OVER,工作温度过限,故障原因:,(1),环境温度过高;,(2),制冷设备故障;,(3),防尘网被堵;,(4),单板故障,HARD_BAD,硬件故障,故障原因:,单板内器件有故障;,故障原因:,(,1,)数据库操作失效; (,2,)数据库数据损坏; (,3,)单板故障,DBMS_ERROR,数据库错误,COMMUN_FAIL,单板通信失败,故障原因:,(1),通信芯片或器件故障;(,2,)出现倒针或拉死;(,3,)背板总线故障,BD_STATUS,单板不在线,故障原因:,(1),单板未插;,(2),单板插座已松动;,(3),板间通讯故障;(,4,)子卡没有插;(,5,)子卡插座已松动;,Page 5,NB 1,IMA/ATM,CES,NB2,PTN,PTN,GE/FE,端口故障,ETH,NB3,PTN,SDH,or ETH,PTN,PTN,SDH,or ETH,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,ETH_LOS,光信号丢失,故障原因:,(1),光纤断;,(2),光模块坏;,(3),光衰减过大;,ETH_LINK_DOWN,网口连接故障,故障原因:,两端工作模式不一致,造成协商失败;电缆、光纤连接或者对端设备故障。,MAC_FCS_EXC,误码越限,故障原因:,MAC,层检测到误码越限;线路信号劣化;光纤性能劣化;光口不洁净,ETHDROP,丢包事件,故障原因:,由于缺乏资源而导致丢包的事件数,ETHCRCALI,错包计数,故障原因:,有,FCS,(帧校验序列)错误或者对齐错误(非整数字节)的包总数。,Page 6,NB 1,IMA/ATM,CES,NB2,PTN,PTN,SDH,端口故障,ETH,NB3,PTN,SDH,or ETH,PTN,PTN,SDH,or ETH,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,R_LOS,光信号丢失,故障原因:,(,1,)断纤; (,2,)线路衰耗过大; (,3,)对端站发送部分故障,线路发送失效;,R_LOC,时钟丢失,故障原因:,(1),接收到的信号失效;,(2),时钟提取模块故障;,R_LOF,帧丢失,故障原因:,(,1,)接收信号衰减过大; (,2,)对端站发送信号无帧结构; (,3,)本板接收方向故障,J0_MM,追踪识别符失配,故障原因:,对端应发,J0,字节与本端应收,J0,字节不一致,RSBBE,再生段误码,故障原因:,B1,字节监测得知存在误码;,AUPJCHIGH,AU,指针正调整,故障原因:,SDH,网中各网元的时钟不同步;,Page 7,NB 1,IMA/ATM,CES,NB2,PTN,PTN,E1,端口故障,ETH,NB3,PTN,SDH,or ETH,PTN,PTN,SDH,or ETH,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,T_ALOS,信号丢失,故障原因:,(,1,),E1/T1,业务未接入; (,2,),DDF,架侧,E1/T1,接口输出端口脱落或松动; (,3,)本站,E1/T1,接口输入端口脱落或松动; (,4,)单板故障; (,5,)电缆故障,ALM_E1RAI,远端告警指示,故障原因:,对端有告警;,E1_DELAY,时延告警,故障原因:,IMA,链路发送时延超过链路时延门限;,E1_LCV_SDH,编码错误计数,故障原因:,E1,业务线路侧编码错误检测记数;,Page 8,TPS,故障,CXP,CXP,MD1,MD1,MD1,MD1,L75,L75,TPS,TPS,TPS_ALM,TPS,倒换告警,产生原因:,工作板有硬件故障,发生,TPS,自动倒换。,下发,TPS,倒换命令。,处理措施:,如果是下发,TPS,倒换命令引起的,则是正常现象,不需要处理。,如果是硬件坏触发的,TPS,自动倒换,则说明工作子卡发生了离线、变坏等情况,需进一步查询该子卡的告警,及时进行更换。,Page 9,TPS,故障,CXP,CXP,MD1,MD1,MD1,MD1,L75,L75,TPS,TPS,TPS_FAIL,TPS,倒换失败,产生原因:,保护板有硬件故障,造成,TPS,倒换失败。,处理措施:,如果是在工作板好的情况下,下发,TPS,倒换命令引起的,则暂时不会影响业务,要及时更换备板。,如果是工作和保护板都坏的情况下,,TPS,自动倒换失败引起的,则当前业务已中断,需及时更换工作和保护板。,Page 10,目录,链路层故障维护,2,物理层故障维护,1,隧道层故障维护,3,业务层故障维护,4,数据采集,5,Page 11,NB 1,IMA/ATM,CES,NB2,PTN,PTN,MLPPP,故障,ETH,NB3,PTN,SDH,or ETH,PTN,PTN,SDH,or ETH,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,MP_DOWN,MLPPP,组失效,故障原因:,MLPPP,组中有效激活的成员数小于预先配置值;,单主控复位,造成,PPP,协议无法协商;,MP_DELAY,组成员延时告警,故障原因:,组成员的延迟大于配置值时产生告警;,Page 12,NB 1,IMA/ATM,CES,NB2,PTN,PTN,LAG,故障,ETH,NB3,PTN,SDH,or ETH,PTN,PTN,SDH,or ETH,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,LAG,MLPPP,LAG_MEMBER_DOWN,成员端口不可用告警,故障原因:,1.,端口,link down/disable,2.,端口未收到,LACP,报文,3.,端口半双工,4.,端口自环,LAG_DOWN,LAG,组无效,故障原因:,聚合组中激活状态的成员数为,0,Page 13,NB 1,IMA/ATM,CES,NB2,PTN,PTN,LMSP,故障,ETH,NB3,PTN,SDH,or ETH,PTN,PTN,SDH,or ETH,PTN,RNC,CoreNetwrok,PTN,RNC,LMSP,GE/FE,STM-1,GE,MLPPP,LPS_UNI_BI_M,单双端模式失配,故障原因:,复用段两端模式配置错误,一边为单端模式、另一边为双端模式;,K2_M,1+1/1:1,方式失配,故障原因:,复用段两端,1+1/1:1,方式配置错误,一边为,1+1,方式、另一边为,1:1,方式;,K1_K2_M,倒换失败,故障原因:,发送的,K,字节和接收的,K,字节指示的通道号不一致。,说明倒换失败,两端走的工作,/,保护路径选择不一致。,Page 14,定位手段之,EFM,功能,ETH Link Layer OAM,实现了以太网链路,(FE,、,GE),的故障发现和故障定位,,PTN1900&3900,基于,802.3ah,实现的功能包括,:,链路发现,链路监视,远端故障指示,远端环回,Page 15,定位手段之,EFM,功能,OAM,功能,作用,告警和动作,应用场景,发现(,Discovery,),检测对方设备是否支持,802.3ah OAM,功能,如果协商失败,上报告警说明失败的具体原因,故障检测,故障定位,链路监视(,Link monitoring,),检测链路性能情况并通知对端,使能端口,OAM,功能后自动检测链路性能事件并上报告警,包括,:,Errored Symbol Period Event,Errored Frame Event,Errored Frame Period Event,Errored Frame Seconds Summary Event,故障检测,关键链路事件指示(,Critical link events,),检测关键链路事件并通知对端,使能端口,OAM,功能后自动检测并上报告警,包括,:,Link fault,故障检测,远端环回(,Remote loopback,),链路双向连通性检测,将远端端口的数据报文全部环回,手动发起,远端上报环回状态告警,故障定位,Page 16,定位手段之,BFD,功能,应用场景:,连通性检测,基于端口创建,BFD,会话,可以创建,BFD,会话的端口为,VLAN,子接口和三层,ETH,端口,目前只支持单跳、异步的检测方式,检测周期为,3,秒,当探测倍数时间内没有接收到,BFD,报文,则上报,BFD_DOWN,告警,Page 17,目录,链路层故障维护,2,物理层故障维护,1,隧道层故障维护,3,业务层故障维护,4,数据采集,5,Page 18,NB 1,IMA/ATM,CES,NB2,PTN,PTN,MPLS OAM连通性检测,ETH,NB3,PTN,MPLS,PTN,PTN,MPLS,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,MPLS_TUNNEL_LOCV,Page 19,NB 1,IMA/ATM,CES,NB2,PTN,PTN,MPLS OAM转发错误(MISMATCH),ETH,NB3,PTN,MPLS,PTN,PTN,MPLS,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,MPLS_TUNNEL_MISMATCH,MPLS_TUNNEL_LOCV,Page 20,NB 1,IMA/ATM,CES,NB2,PTN,PTN,MPLS OAM转发错误(MISMERGE),ETH,NB3,PTN,MPLS,PTN,PTN,MPLS,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,MPLS_TUNNEL_MISMERGE,MPLS_TUNNEL_LOCV,Page 21,NB 1,IMA/ATM,CES,NB2,PTN,PTN,MPLS OAM故障指示(BDI),ETH,NB3,PTN,MPLS,PTN,PTN,MPLS,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,MPLS_TUNNEL_LOCV,绑定反向隧道,绑定反向隧道,MPLS_TUNNEL_BDI,Page 22,NB 1,IMA/ATM,CES,NB2,PTN,PTN,MPLS OAM故障指示(FDI),ETH,NB3,PTN,MPLS,PTN,PTN,MPLS,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,MPLS_TUNNEL_FDI,Page 23,NB 1,IMA/ATM,CES,NB2,PTN,PTN,LSP Ping,ETH,NB3,PTN,MPLS,PTN,PTN,MPLS,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,Page 24,NB 1,IMA/ATM,CES,NB2,PTN,PTN,LSP TraceRoute,ETH,NB3,PTN,MPLS,PTN,PTN,MPLS,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,Page 25,NB 1,IMA/ATM,CES,NB2,PTN,PTN,PW VCCV,ETH,NB3,PTN,MPLS,PTN,PTN,MPLS,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,Page 26,MPLS APS,ETH_APS_TYPE_MISMATCH,保护类型信息不一致,1,、两端配置的,1+1,或,1:1,模式不一致;,2,、两端配置的单端或双端倒换的模式不一致;,3,、两端配置的恢复式或非恢复式的模式不一致;,ETH_APS_PATH_MISMATCH,APS,工作、保护路径不一致,1,、保护组两端设备配置的工作路径、保护路径不一致;,2,、物理链路上存在有错连;,ETH_APS_SWITCH_FAIL,保护倒换失败,1,、倒换失败;,ETH_APS_LOST,APS,帧丢失,1,、对方没有配置保护;,2,、保护通道业务中断;,Page 27,目录,链路层故障维护,2,物理层故障维护,1,隧道层故障维护,3,业务层故障维护,4,数据采集,5,Page 28,ETH业务,ETH,业务的故障维护主要是采用,ETH Service OAM (802.1ag/Y.1731,定义,), OAM,实现的故障管理方式主要包括,:,CC(,Continuity,Check,),用于预设的端到端连通性检查(,proactive continuity check,)。,LB(,Loopback,),,用于命令触发的,(On-demand),连通性检查。,LT(Link,Trace),,命令触发的以太网链路追踪,用于故障的定位。,Ethernet remote defect,indication(RDI,),,远端,故障指示功能。,Page 29,NB 1,IMA/ATM,CES,NB2,PTN,PTN,ETH OAM(CC),ETH,NB3,PTN,ETH,PTN,PTN,MPLS,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,MEP,MD,ETH_CFM_LOC,Page 30,NB 1,IMA/ATM,CES,NB2,PTN,PTN,ETH OAM(LB),ETH,NB3,PTN,ETH,PTN,PTN,MPLS,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,MEP,MD,Page 31,NB 1,IMA/ATM,CES,NB2,PTN,PTN,ETH OAM(LT),ETH,NB3,PTN,ETH,PTN,PTN,MPLS,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,MEP,MD,MIP,Page 32,CES业务,NB 1,IMA/ATM,CES,NB2,PTN,PTN,ETH,NB3,PTN,ETH,PTN,PTN,MPLS,PTN,RNC,CoreNetwrok,PTN,RNC,STM-X,GE/FE,STM-1,GE,MLPPP,CES_JTROVR_EXC,CES_JTRUDR_EXC,CES_LOSPKT_EXC,CES_MALPKT_EXC,CES_MISORDERPKT_EXC,CES_STRAYPKT_EXC,CES业务的故障检测方式是监测相关告警。,Page 33,CES业务,CES_JTROVR_EXC,抖动缓冲上溢次数超过阈值告警,网络侧端口在一段时间(默认为,2.5s,)内接收,CES,报文的延时抖动导致抖动缓冲区上溢的,CESoEth,帧所占百分比持续超过一个定义阈值,CES_JTRUDR_EXC,抖动缓冲下溢次数超过阈值告警,网络侧端口在一段时间(默认为,2.5s,)内接收,CES,报文的延时抖动导致抖动缓冲区下溢的,CESoEth,帧所占百分比持续超过一个定义阈值,CES_LOSPKT_EXC,单位时间内丢包数超过阈值告警,从网络侧端口上报,CES,报文的丢包率在一定时内(默认为,2.5s,)持续超过一个定义阈值,CES_MALPKT_EXC,单位时间内畸帧数超过阈值告警,当畸帧率超过阈值一定时间则上报告警,CES_MISORDERPKT_EXC,单位时间内乱序丢包数超过阈值告警,从网络侧端口检测到乱序,CES,报文,当乱序丢包率在一段时间内一直维持在一个阈值,需要上报错连告警,CES_STRAYPKT_EXC,单位时间内错包数超过阈值告警,从网络侧端口检测到不属于本业务的,CES,报文,当错包率在一段时间内一直维持在一个阈值,需要上报错连告警,Page 34,目录,链路层故障维护,2,物理层故障维护,1,隧道层故障维护,3,业务层故障维护,4,数据采集,5,Page 35,数据采集性能统计,业务相关性能统计,SDH,相关性能,E1,相关性能,ETH,相关性能,(RMON),PW/Tunnel,相关性能,单板相关性能事件,CPU,、内存占用率,单板温度,Page 36,数据采集性能检测,性能检测功能仅用于点到点以太网虚连接或者,Tunnel,的端到端性能测量。目前支持以下性能测量,丢包率,同时支持远端和近段丢包率测量。,时延和时延抖动,提供双向测量方式。,基本原理:在点到点连接的两端互相发送携带报文统计计数或者发送,/,接收时标等性能值的协议报文,接收到协议报文以后通过特定的算法得出丢包率和时延以及时延抖动。,Page 37,数据采集告警信息收集,收集相关告警信息:,Page 38,数据采集日志记录,SCA,、,CXP,单板:,ofs1/log/,和,ofs2/log/,下的全部文件,ofs2/log/ion/,下的全部文件,以及备主控文件,/stdby/ofs1/log/,,,/stdby/ofs2/log/,,,stdby/ofs2/log/ion/,下全部文件,EG16,、,MP1,、,XCS,单板:,ofs1/log/,下的全部文件,PS,:在采集数据前,请用,Navigator,登录到目的网元,下发命令,:,mon-backup-bb:bid,(,bid,:主控或单板板位号)备份黑匣子;,Page 39,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!