资源描述
单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2021/9/30,*,单击此处编辑母版标题样式,MOT GSM,无线设备培训,BSC,告警和告警处理,中国联通有限公司广州分公司,覃道满,2021/9/30,1,学习目标,掌握告警格式与组成,2,3,熟悉告警处理流程,2021/9/30,学习内容,告警格式和组成,告警处理流程,BSC,非正常重启分析,2021/9/30,简述,机房运行维护人员经常会碰到告警,有些告警是操作维护过程中自然产生的,有些告警是瞬时性的,不会影响系统正常运行,但大多数告警是会影响系统性能的,有的甚至会导致,BSS,复位,对移动通信系统造成严重影响。因此对于运维人员来说,了解告警系统,掌握一定的告警分析和处理技能,显得非常重要。,告警系统是为了故障定位,系统性能分析及方便维护而设置的。,告警信息可以在,OMCR,的告警窗口上显示,也可以在本地维护终端(,LMT,)上显示。,BSS,产生的告警信息,以字符的形式发往,OMCR,。,2021/9/30,告警的种类和格式,告警可以分为硬件告警和软件告警两种:,硬件告警是由于,BSS,内的硬件故障所引起的告警。,软件告警是由,GPROC,检测到软件进程运行出错所引起的告警,只有,GPROC,设备(,BSP,,,CSFP,,,DHP,,,BTP,,,pool GPROC,)才会产生软件告警信息。,2021/9/30,告警举例,#0,NEW,*,NONE,*.,CommuncationFailureEvent-,CAGE,-BSS0,1,(BSS0,1,:SITE-0:):0 CAGE 1-30/03/1999 14:23:56.,18,Expansion KSWX Slot 22 Communication Failure-FMIC-Major-/-.,(BSS01:SITE-0:):0 SITE Impacted to Major.,2021/9/30,告警解析,#0,:告警,ID,NEW,:告警状态,NONE,:正在处理此告警的人员,CommuncationFailureEvent,:告警的类型,CAGE,:告警级,BSS0,1,(BSS0,1,:SITE-0:):0 CAGE 1,:,发生告警的位置,30/03/1999 14:23:56,:告警发生时间,18,:告警编号,Expansion KSWX Slot 22,(,见框架配置表,),Communication Failure,:,告警描述,FMIC,:,告警的清除类型,Major,:,告警严重等级,(,主要告警,),(,BSS01:SITE-0:):0 SITE Impacted to Major,:,告警附加信息,2021/9/30,附,:BSC,机框配置图,2021/9/30,告警编号,告警编号对于每种设备都有唯一的一个十进制数表示。每种设备的告警编号从,0,到,254,。,(,见附录,),对于不同的设备告警编号可能重复,但与设备相关的编号是唯一的。有些情况下同样的告警编号表示类似的告警。例如,242,号告警表示设备退出服务,(MMSMTLRSL),。,2021/9/30,告警消除类型,告警的清除类型可分为三类:,Intermittent,Fault Management Initiated Clear,(,FMIC,),Operator Initiated Clear,(,OIC,),Intermittent,表示告警是偶发性的,对系统没有危害。此告警发生后在,OMCR,会自动消除。当此类告警频繁产生时,会增加,OML,链路的负荷。我们可以使用,disp_throttle,命令来查看告警门限设置,还可用,chg_throttle,命令调节其门限值。,FMIC,告警的清除由系统的错误管理进程(,Fault Managerment Process,)自动进行。,FM,进程管理一张现有告警的列表,只有当告警产生的原因消失后,FM,才会产生,clear,消息将此告警从告警列表中删除。,OIC,需要由操作人员手动将告警清除。,FM,进程检测到告警产生并判断为,OIC,类型时,将此告警加入现有告警列表中。此后,FM,不再进行任何处理。当操作人员将告警产生的原因解决后,必须将此告警清除。,2021/9/30,清除告警步骤,在,OMCR,和,BSC,上均能够清除告警。,OMCR,上清除告警按以下步骤进行,:,打开告警窗口,单击鼠标左键选中要清除的告警项,单击鼠标右键弹出快捷菜单,选择快捷菜单的“,Handle”,选择快捷菜单的“,Clear”,确认告警已被清除,在,BSS,上清除告警,先使用,disp_act_alarm,命令查看有哪些,OIC,告警。然后使用,del_act_alarm,命令将告警清除。清除命令如下,:,del_act_alarm ,(,只对,OIC,告警,),2021/9/30,告警的类型,OMCR,将告警分成六种不同的类型,可以在,OMCR,的告警说明中找到,FailureEvents,字段,其为不同类型告警的名称。,2021/9/30,附,:,告警类型表,类型,含义,举例,Communication,数据从一点传到另一点时发生错误而产生的告警,一般当信令丢失或呼叫建立出错时发生此种告警,1,、,mms syn loss,2,、,frame slip daily,3,、,bit error,4,、,dri-ctu activelinkcommunication failure(,critical,),Quality of Service,系统的服务质量下降时产生此告警,一般当消息响应超时或带宽减少时会发生此种告警:多见于时钟失锁,gclk_mcuf phase lock failure,(,major,),Processing,当软件或进程出现错误时产生此告警,一般当进程数据被破坏或系统内存溢出时产生此种告警,dri-CTU channelcoder internal messageerror,intermittent,(,warning,),Equipment,当硬件出错时产生此告警。,一般当出现配置错误,传输、电源等问题时产生此种告警,dri standby link communication failure(,minor,),Environment,当设备所处的环境不利于正常工作时产生告警,一般当出现烟雾,火光被检测到时产生此种告警,Link,当,OMCR,与,BSS,间的,X.25,链路出现问题时产生此告警,2021/9/30,告警的等级,影响,行动,举例,严重,(Critical),已经影响了系统的服务,应该立即采取措施,当系统的某一功能出现此种告警而退出服务,应立即将其恢复。,重大,(Major),已经影响了系统的服务,应该马上采取措施,系统的服务容量降低,此时应采取措施恢复容量。,较轻,(Minor),此错误不会对系统的服务造成影响,应采取措施减少更多的此类告警产生,当此种告警数量不断增加时,系统的容量可能受到影响。,警告,(Waring),潜在产生影响系统服务的告警的可能,如果必要应该进行必要的分析,采取措施避免产生更严重的告警,清除,(Clear),告警已经被清除,无,待定,(Investigate),表明此错误的等级无法确定,需要人工进一步分析,进一步查找原因,2021/9/30,发现告警,第一种方法:,OMCR,桌面图形界面,GUI,上的,ALARM,按钮,在,OMCR,桌面图形界面,GUI,上双击告警按钮,打开告警窗口,可以看到所有网元(,NE,)的告警信息;,第二种方法:,通过,GUI,上的,EVENT MANEGMENT,点击,GUI,上的,EVENT MAMT,按钮,打开,Display Subscription List,窗口,选择窗口中告警中的一项,选择,open,按钮就打开告警窗口;,第三种方法:,打开,MAP,图,然后选中对应的单元节点,从,NETWORK MAP,上查看告警,单击,GUI,上的,NETWORK MAP,按钮,打开,MAP LIST,窗口,选定其中的一个网元,双击鼠标左键打开,MAP,窗口,在,MAP,图上用鼠标左键点击要查看的网络单元节点,选中后接点会变为紫色,单击鼠标右键在快捷菜单内选择,ALARM,项,此时会出现告警窗口显示此节点单元的所有告警。,用,disp_act_alarm,命令行查看告警,.,2021/9/30,告警处理优先级别,我们可以根据告警的严重级别,以及出现告警的网元在系统中的重要性,对不同的告警情况进行相应的处理。在此我们提供一般原则下的优先级别。对于基站来说从,RXCDR,到,BSC,,再到,BTS,;信令链路按照,MTL,、,RSL,、,XBL,的次序;告警严重级别由高到低分别是,Critical,、,Major,、,Minor,、,Warning,、,Investigate,、,Clear,。在相同的告警级别中,,Critical,告警按照以下顺序,All RXCDR-All MTL-All BSC-All RSL-All BTS-All X.25 link-All other Critical alarms,。,Major,告警按照以下顺序,All RXCDR-All BSC-All BTS-All other Major alarms,。其它告警按照,Minor,、,Warning,、,Investigate,、,Clear alarms,的顺序进行处理。,2021/9/30,附,:,告警优先级别图,告警处理优先级别,:,The sites,Remote Transcoder(RXCDR),Base Station Controller(BSC),Base Transceiver Station(BTS),The links,Message Transfer part Link(MTL),Radio Signalling Link(RSL),X.25 link,Critical,告警按照以下顺序:,All RXCDR-Critical alarms,All MTL-Critical alarms,All BSC-Critical alarms,All RSL-Critical alarms,All BTS-Critical alarms,All X.25 link-Critical alarms,All other Critical alarms,2021/9/30,设备之间的从属关系(,parent-child,),当某个设备或链路处于,OOS,等非正常状态时,不仅与起本身相关,而且与其上一级(,parent,)设备有关,对,parent,设备进行进行必要的处理是解决问题的重要手段。如果某个设备处于,OOS,等状态下,此设备下一级(,child,)设备将也不能正常工作。,Device,1,st,parent dev,2,nd,parent dev,3,rd,parent dev,4,th,parent dev,RSL,MMS,MSI,CAGE,CAB SITE BSS,MTL,MMS,MSI,CAGE,CAB SITE BSS,OML,MMS,MSI,TCU,DRI,CAB,SITE BSS,XBL,MMS,MSI,CAGE,CAB SITE BSS,2021/9/30,告警处理的流程,查看告警,分清告警的级别,明确与告警有关的设备,根据告警手册或经验对告警进行处理,解决问题,消除告警,2021/9/30,常见告警及其处理办法,常见告警及其处理方法,.doc,2021/9/30,BSC,非正常重启分析,BSC,在网络中的位置和作用,重启分类,原因分析,实例分析,BSC,日常 维护应注意的事项,BSC,稳定运行的条件,2021/9/30,BSC,在网络中的位置和作用,在,GSM,无线通信系统中,,BSC,作为基站控制器,是,BSS,子系统的关键节点,一套,BSC,管理几十个基
展开阅读全文