TRTS05C11ZXTRRNC系统故障排查设备

上传人:沈*** 文档编号:194240625 上传时间:2023-03-13 格式:PPT 页数:41 大小:695.50KB
返回 下载 相关 举报
TRTS05C11ZXTRRNC系统故障排查设备_第1页
第1页 / 共41页
TRTS05C11ZXTRRNC系统故障排查设备_第2页
第2页 / 共41页
TRTS05C11ZXTRRNC系统故障排查设备_第3页
第3页 / 共41页
点击查看更多>>
资源描述
RNC设备类故障处理设备类故障处理XXX团队团队2学习目标学习目标(必选必选)学习完此课程,您将会:了解导致RNC硬件问题的常见原因。了解RNC常见故障处理手段与方法通过案例学习,掌握故障处理思路3课程内容课程内容常见故障分类常见故障处理排查思路典型故障案例故障分类故障分类时钟类故障:主要包括各类基准时钟丢失、锁相环失锁等等;时钟类故障:主要包括各类基准时钟丢失、锁相环失锁等等;启动类故障:单板无法启动、单板反复重启等等;启动类故障:单板无法启动、单板反复重启等等;传输类故障:告警察看出现链路故障或者链路滑码告警等;传输类故障:告警察看出现链路故障或者链路滑码告警等;前后台同步和版本升级类故障:包括前后台数据的同步不成功以及升级过程中版前后台同步和版本升级类故障:包括前后台数据的同步不成功以及升级过程中版本激活异常等;本激活异常等;其他类故障:这些故障包括由于系统设计不足或者技术人员操作不当导致的故障其他类故障:这些故障包括由于系统设计不足或者技术人员操作不当导致的故障等等。等等。故障分类故障分类各类故障原因简介各类故障原因简介故障分类典型故障现象常见故障原因时钟类故障基准时钟丢失、锁相环失锁输入的时钟基准信号丢失输入的时钟基准信号变差时钟连接线缆接触不良锁相环失锁单板故障启动类故障单板灯常亮,单板反复重启BOOT不对(没有插紧或者没有烧对,插错)逻辑未烧或者错误版本文件错误或者缺少版本版本和数据库中的版本对应不上内存条未插好、损坏或者硬盘等硬件损坏IP地址冲突或者数据设置错误传输类故障链路故障或者链路滑码告警单板与传输介质之间的阻抗不匹配时钟异常传输设备异常数据配置错误前后台同步以及版本升级类故障前后台数据同步失败,版本升级不成功新旧版本的前台数据库结构发生了变化,版本升级时数据表冲突前后台的数据表的更改不同步其它类故障包括误操作以及干扰类故障的排查等等由于前后台配合问题,导致的版本激活不成功由于配置问题问题导致的RSSI升高6课程内容课程内容常见故障分类常见故障处理排查思路典型故障案例时钟类故障处理时钟类故障处理RNC时钟处理机制时钟处理机制 PP2S 2Mbit 2MHz PP2S PP2S 16M 32M8K 32M8K 32M 16M 16M8K 16M8K PP2S GPS 5MHz CLKG UIM(需自己产生T20ms)线路提取 2 套 8k 32M VTC T 网 16M 16M8K T20ms IWFB/MRB/GPPB DTB 16M 16M8K SDTB/SDHB(需 自己产生19.44M 16M 16M8K 各单元框 64M 64M UIM(需自己产生T20ms)16M 16M8K TSNB TSNB TFI TFI GPS PP2S PP2S CLKG 时钟处理机制时钟处理机制三种时钟接入方式:三种时钟接入方式:GPS接入、接入、BITS时钟接入、线路时钟提取时钟接入、线路时钟提取完成时钟同步锁相、时钟分发功能完成时钟同步锁相、时钟分发功能CLKG单板对外提供单板对外提供15套系统时钟(包括:套系统时钟(包括:PP2S、8K、16M)至各资源子系统,采用电)至各资源子系统,采用电缆传送缆传送CLKG单板提供单板提供10套(套(8K、32M、64M)时钟给)时钟给T网的单板使用网的单板使用单板采用二级钟晶振单板采用二级钟晶振在丢失基准后,采取保持(在丢失基准后,采取保持(KEEP)策略,保持时间很长,可到半年以上,在保持中,)策略,保持时间很长,可到半年以上,在保持中,由人工根据基准情况选取合适的时机进行切换由人工根据基准情况选取合适的时机进行切换RNC一般采取一般采取Iu口线路时钟提取方式口线路时钟提取方式时钟类故障处理关键点时钟类故障处理关键点n目前从目前从CN提取时钟的端口可配置,默认为提取时钟的端口可配置,默认为APBE板的板的4号光口(第一个口)号光口(第一个口),可以可以根据实际和根据实际和CN连接的端口进行修改,修改位置在连接的端口进行修改,修改位置在APBE板上点击右键菜单,选择板上点击右键菜单,选择修改,在单板的修改,在单板的“基本信息基本信息”页面里面,有线路时钟基准,数值有页面里面,有线路时钟基准,数值有03,分别对,分别对应应APBE端口端口47。n检查检查RNC时钟线缆连接,看从时钟线缆连接,看从APBE板过来的时钟线连接到板过来的时钟线连接到CLKG后插卡的后插卡的8KIN1还还是是8KIN2,现在默认是,现在默认是8KIN1,后台网管上配置需要和前连线一致。,后台网管上配置需要和前连线一致。n如线缆连接到如线缆连接到8kin1,则将后台,则将后台“配置主用时钟基准配置主用时钟基准”为为8kbase,“所有时钟基准所有时钟基准”只有只有8kbase。如是。如是8kin2,则上述两个配置应该都为,则上述两个配置应该都为8KGPS。n目前目前TDRNC时钟单板并未实现主用时钟基准功能,更没有实现优先级切换功能。时钟单板并未实现主用时钟基准功能,更没有实现优先级切换功能。n“配置的所有时钟基准配置的所有时钟基准”参数只是配置了参数只是配置了OMP上面的时钟管理模块和告警模块,上面的时钟管理模块和告警模块,作用是为了能够检测前台时钟丢失的现象,并不是启用某个时钟基准。作用是为了能够检测前台时钟丢失的现象,并不是启用某个时钟基准。CLKG单单板获取当前时钟基准并不受后台参数的影响。板获取当前时钟基准并不受后台参数的影响。启动类故障处理启动类故障处理BOOT不对(没有插紧或者没有烧对,插错)不对(没有插紧或者没有烧对,插错)逻辑未烧或者错误逻辑未烧或者错误版本文件错误或者缺少版本版本文件错误或者缺少版本版本和数据库中的版本对应不上版本和数据库中的版本对应不上内存条未插好、损坏或者硬盘等硬件损坏内存条未插好、损坏或者硬盘等硬件损坏IP地址冲突或者数据设置错误地址冲突或者数据设置错误机框拨码错误机框拨码错误启动类故障产生原因一般有以下几个因素导致启动类故障产生原因一般有以下几个因素导致:传输类故障处理方法传输类故障处理方法故障排查检查事项故障排查检查事项n检查设备间物理连接的正确性。检查设备间物理连接的正确性。主要是检查所对接的两个设备之间的电缆正确性,防止电缆的漏焊、虚焊、接触不良,特别是要防止主要是检查所对接的两个设备之间的电缆正确性,防止电缆的漏焊、虚焊、接触不良,特别是要防止电缆的混线。电缆混线会在两处设备侧产生一些异常现象,所以一定要首先保证物理连接的正确性。电缆的混线。电缆混线会在两处设备侧产生一些异常现象,所以一定要首先保证物理连接的正确性。n检查双方对接设备的接地和共地情况检查双方对接设备的接地和共地情况如果设备接地不好,将会直接影响对接。接地存在的问题通常为:两个对接的设备未能真正的共地;如果设备接地不好,将会直接影响对接。接地存在的问题通常为:两个对接的设备未能真正的共地;DDF配线架未按要求接地。要检查两个对接设备的共地情况,可测量两设备的接地点之间电阻的大小配线架未按要求接地。要检查两个对接设备的共地情况,可测量两设备的接地点之间电阻的大小或两个接地点之间有无电位差。或两个接地点之间有无电位差。对接不成功时请重点检查两设备是否真正共地。许多对接不成功的的现象,最后的原因都是两个设备对接不成功时请重点检查两设备是否真正共地。许多对接不成功的的现象,最后的原因都是两个设备未能真正的共地。未能真正的共地。n检查同轴端口的屏蔽层接地检查同轴端口的屏蔽层接地75非平衡式同轴端口的外导体(即屏蔽层)常规的接地方法是发端接非平衡式同轴端口的外导体(即屏蔽层)常规的接地方法是发端接PGND(保护地)、收端悬空(保护地)、收端悬空(或接(或接PGND)。可用万用表测试同轴端口的屏蔽层与设备)。可用万用表测试同轴端口的屏蔽层与设备PGND之间的电压,就可以大致判断出同轴之间的电压,就可以大致判断出同轴端口屏蔽层的接地方式。如果屏蔽层接地不好,会由于两个地(端口屏蔽层的接地方式。如果屏蔽层接地不好,会由于两个地(BGND、PGND)之间存在电位差和交)之间存在电位差和交流干扰,从而影响信号对接时的波形,导致对接不成功。对接不好时要检查双方设备的同轴端口屏蔽流干扰,从而影响信号对接时的波形,导致对接不成功。对接不好时要检查双方设备的同轴端口屏蔽层的接地方式是否一致(层的接地方式是否一致(PGND指保护地,指保护地,BGND指工作地)指工作地)传输类告警表现形式以及处理方法传输类告警表现形式以及处理方法后台一直存在且不恢复告警处理方法后台一直存在且不恢复告警处理方法 如有如有LOS(信号丢失)告警:首先检查本端设备(信号丢失)告警:首先检查本端设备E1电缆连接是否正常,收发电缆连接是否正常,收发连接是否正确,连接是否正确,DDF配线架上配线架上E1线连接是否正确。如果这些都正常,请传输线连接是否正确。如果这些都正常,请传输检查发送给本端的信号是否正常。检查发送给本端的信号是否正常。如有如有AIS(告警指示信号)告警:首先确认该条(告警指示信号)告警:首先确认该条E1有没有进行对接,如果没有没有进行对接,如果没有进行对接,请在配线架上自环该条有进行对接,请在配线架上自环该条E1或者取消该子单元的配置。如果有或者取消该子单元的配置。如果有对接局向,请对端局检查跟传输设备的连接情况。对接局向,请对端局检查跟传输设备的连接情况。如果有如果有LOCMF(复帧失步)告警:请确认两端配置的帧格式是否一致。(复帧失步)告警:请确认两端配置的帧格式是否一致。如果有如果有RAI(接收远端告警):检查本端的发送是否正常,请对端看对应的(接收远端告警):检查本端的发送是否正常,请对端看对应的告警信息。如果确认本端发送正常,对端接收有相应告警,请传输配合查告警信息。如果确认本端发送正常,对端接收有相应告警,请传输配合查故障原因。故障原因。不间断频繁上报又马上恢复的告警处理方法不间断频繁上报又马上恢复的告警处理方法l 如有如有LOS(信号丢失)告警:首先检查本端设备(信号丢失)告警:首先检查本端设备E1电缆连接是否正常,收发连接是否电缆连接是否正常,收发连接是否正确,正确,DDF配线架上配线架上E1线连接是否正确,是否接触不好或者有串线。如果这些都正常,线连接是否正确,是否接触不好或者有串线。如果这些都正常,请传输检查发送给本端的信号是否正常。请传输检查发送给本端的信号是否正常。l 如有如有AIS(告警指示信号)告警:这种情况本端设备正常,请对端局检查跟传输设备(告警指示信号)告警:这种情况本端设备正常,请对端局检查跟传输设备的连接情况,传输设备上是否有相应的告警。的连接情况,传输设备上是否有相应的告警。l 如果有如果有LOF(帧失步)、(帧失步)、LOCMF(复帧失步)告警:首先检查本端设备(复帧失步)告警:首先检查本端设备E1电缆连接是电缆连接是否正常,收发连接是否正确,否正常,收发连接是否正确,DDF配线架上配线架上E1线连接是否正确,是否接触不好或者有线连接是否正确,是否接触不好或者有串线,配线架上静电地是否正常。如果这些都正常,请对端也检查这些内容。串线,配线架上静电地是否正常。如果这些都正常,请对端也检查这些内容。l 如果有如果有RAI(接收远端告警):检查本端的发送是否正常,请对端看对应的告警信息。(接收远端告警):检查本端的发送是否正常,请对端看对应的告警信息。如果确认本端发送正常,对端接收有相应告警,请传输配合查故障原因。如果对端没如果确认本端发送正常,对端接收有相应告警,请传输配合查故障原因。如果对端没有相应告警信息或者看不到,进行环回诊断。有相应告警信息或者看不到,进行环回诊断。述方法都不能解决故障,需要逐级进行环回诊断。如果环回诊断查不出原因,需要逐级述方法都不能解决故障,需要逐级进行环回诊断。如果环回诊断查不出原因,需要逐级挂表定位挂表定位传输类告警表现形式以及处理方法传输类告警表现形式以及处理方法某个时间段集中上报并恢复的告警某个时间段集中上报并恢复的告警 需确认该时间段对端局是否有相应操作,中间传输设备是否有相关操作,有什么需确认该时间段对端局是否有相应操作,中间传输设备是否有相关操作,有什么相关告警。只要不是多次出现这种情况,可以确认本端设备没有问题。相关告警。只要不是多次出现这种情况,可以确认本端设备没有问题。随机性零星的告警并恢复随机性零星的告警并恢复l 偶尔出现的告警(概率很低,比如几天或几十天出现一次),没什么规律性,一偶尔出现的告警(概率很低,比如几天或几十天出现一次),没什么规律性,一般是正常情况,标准规范也允许。般是正常情况,标准规范也允许。l 对于比较有规律零星出现告警的情况,只能通过挂表进行定位原因对于比较有规律零星出现告警的情况,只能通过挂表进行定位原因传输类告警表现形式以及处理方法传输类告警表现形式以及处理方法传输故障处理手段传输故障处理手段环回诊断法环回诊断法仪器诊断法仪器诊断法更换单板法更换单板法环回诊断法环回诊断法传输故障处理手段传输故障处理手段传输故障处理手段传输故障处理手段n在在NODEB设备侧的设备侧的DDF架进行故障架进行故障E1自环,如果故障消失,基本上说明故障自环,如果故障消失,基本上说明故障源不在本端,进行下一步诊断。源不在本端,进行下一步诊断。nRNC侧侧ODF架物理环回给架物理环回给NODEB或者软件设置远端环回把信号环回或者软件设置远端环回把信号环回NODEB侧,侧,如果故障消失,基本说明中间传输设备没有问题,故障在两端设备的配合上。如果故障消失,基本说明中间传输设备没有问题,故障在两端设备的配合上。如果故障还在,说明跟对端设备没有关系,故障原因基本上在中间传输设备。如果故障还在,说明跟对端设备没有关系,故障原因基本上在中间传输设备。n当确认故障原因为中间传输设备时,需要传输维护人员协助进行逐级环回诊当确认故障原因为中间传输设备时,需要传输维护人员协助进行逐级环回诊断。断。仪器诊断法仪器诊断法n在本端挂表,测试仪接对端传送过来的在本端挂表,测试仪接对端传送过来的E1信号,检查传输送过来信号是否正常。信号,检查传输送过来信号是否正常。看仪器是否有相应告警或误码,如果有说明故障原因不在本端,而是在对端或传看仪器是否有相应告警或误码,如果有说明故障原因不在本端,而是在对端或传输。输。n本端挂表没问题,可以让对端挂表,请对端进行同样方法检测。本端挂表没问题,可以让对端挂表,请对端进行同样方法检测。n如果最终定位原因在中间传输设备上,需要传输维护人员配合检查诊断。如果最终定位原因在中间传输设备上,需要传输维护人员配合检查诊断。更换单板法更换单板法 故障集中表现在某一块单板上,可以考虑先更换单板,看故障故障集中表现在某一块单板上,可以考虑先更换单板,看故障 能否解决能否解决。传输故障处理手段传输故障处理手段19课程内容课程内容常见故障分类常见故障处理排查思路典型故障案例时钟类典型故障案例时钟类典型故障案例CLKG有有“二级时钟基准丢失告警二级时钟基准丢失告警”,时钟一直处于自由震荡的工作,时钟一直处于自由震荡的工作模式。模式。【故障现象故障现象】韩国韩国SKT项目的项目的CLKG告警无法消除,时钟一直处于自由震荡的工作模式。网管告告警无法消除,时钟一直处于自由震荡的工作模式。网管告警为:警为:(1)Input Clock Abnomal(2)Clock base lost second level【故障分析处理故障分析处理】1、按照指导书配置(从、按照指导书配置(从APBE板过来的时钟线连接到板过来的时钟线连接到CLKG的的8KIN1)检查了)检查了OMCR上上配置的时钟基准,发现配置的配置的时钟基准,发现配置的“设定主用时钟基准为设定主用时钟基准为8kbase”,而,而“配置的所有配置的所有时钟基准时钟基准”为两个为两个“8kbase”和和“8kGPS”。2、两者均改成时钟基准为、两者均改成时钟基准为“8kbase”,但是之后观察告警仍未消除,因为时钟板上,但是之后观察告警仍未消除,因为时钟板上有有“Input Clock Abnormal”告警,因为我们的时钟是从告警,因为我们的时钟是从CN获取,所以联系三星的核获取,所以联系三星的核心网工程师,三星工程师说心网工程师,三星工程师说CN有一块板子没上电。三星工程师处理完毕后,有一块板子没上电。三星工程师处理完毕后,RNC的的CLKG单板仍然有上述告警单板仍然有上述告警时钟类典型故障案例时钟类典型故障案例 3、检查时钟提取光口和网管配置是否一致、检查时钟提取光口和网管配置是否一致 从从CN提取时钟的端口可配置,默认为提取时钟的端口可配置,默认为APBE板的板的4号光口(第一个口)号光口(第一个口),可以根据可以根据实际和实际和CN连接的端口进行修改,在连接的端口进行修改,在APBE板上点击右键菜单,选择修改,在单板板上点击右键菜单,选择修改,在单板的的“基本信息基本信息”页面里面,有线路时钟基准,数值有页面里面,有线路时钟基准,数值有03,分别对应,分别对应APBE端口端口47。时钟类典型故障案例时钟类典型故障案例 4、配置结果可通过探针查看、配置结果可通过探针查看r_unit.info前台生效是哪个端口,此前台生效是哪个端口,此 r_unit.info表显示表显示 提提取线路时钟的光口号(取线路时钟的光口号(03),分别对应),分别对应4,5,6,7光口;检查后发现光口;检查后发现CN连接的是连接的是5号号口,但是网管配置的是从口,但是网管配置的是从4号口提取时钟,导致提取失败。号口提取时钟,导致提取失败。【问题处理问题处理】网管配置中改为从网管配置中改为从5号口提取时钟,告警消失。号口提取时钟,告警消失。时钟配置要求时钟配置要求 如线缆连接到如线缆连接到8kin1,则将后台,则将后台“配置主用时钟基准配置主用时钟基准”为为8kbase,“所有时钟基准所有时钟基准”只有只有8kbase。如是。如是8kin2,则上述两个配置应该都为,则上述两个配置应该都为8KGPS 时钟类典型故障案例时钟类典型故障案例RNC时钟板有时钟基准丢失告警时钟板有时钟基准丢失告警【故障现象故障现象】沈阳浑南机房四个沈阳浑南机房四个RNC时钟板均存在时钟基准丢失告警时钟板均存在时钟基准丢失告警【故障分析处理故障分析处理】1、检查、检查CLK单板指示灯,指示灯显示时钟处于跟踪状态单板指示灯,指示灯显示时钟处于跟踪状态 2、检查时钟连线,发现、检查时钟连线,发现RNC连接连接8KIN1的的APBE板没有和板没有和CN对接,连接对接,连接8KIN2的的APBE板和板和CN连线正常。连线正常。3、检查后台数据配置、检查后台数据配置 时钟类典型故障案例时钟类典型故障案例 4、“设定主用时钟基准类型设定主用时钟基准类型”为为8kBase也就是对应后插卡也就是对应后插卡8kIn1端口为主用时钟基端口为主用时钟基准,准,“配置的所有时钟基准配置的所有时钟基准”为为48也就是对应后插卡也就是对应后插卡8KIN1和和8KIN2端口,从界面端口,从界面上的理解是:启用上的理解是:启用8KIN1和和8KIN2时钟基准,但是以时钟基准,但是以8KIN1为主用时钟。而实际只有为主用时钟。而实际只有8KIN2的输入,造成网管的告警。的输入,造成网管的告警。【故障处理故障处理】修改网管配置,去掉修改网管配置,去掉8KIN1的基准,故障消除。的基准,故障消除。启动类故障排查案例启动类故障排查案例整个机框的单板运行均不正常整个机框的单板运行均不正常【故障现象故障现象】青岛扩容涉及到扩单板和机框,开通时发现青岛扩容涉及到扩单板和机框,开通时发现2架架3框的所有单板运行均不正常,框的所有单板运行均不正常,在后台发现所有的单板都有不在位告警。在后台发现所有的单板都有不在位告警。【故障分析处理故障分析处理】检查检查CHUB的连线经过逐一拔掉查看的连线经过逐一拔掉查看CHUB单板指示灯的状态,发现单板指示灯的状态,发现CHUB的连线的连线正常,检查机框的拨码开关,发现该机框被拨成正常,检查机框的拨码开关,发现该机框被拨成1架架3框;拨成框;拨成2架架3框后正常。框后正常。启动类故障排查案例启动类故障排查案例启动类故障排查案例启动类故障排查案例备用备用OMP不能正常运行不能正常运行 【故障现象故障现象】北京马连道机房北京马连道机房RNC2备用备用OMP(1架架2框框11槽位)不能正常运行,显示的告槽位)不能正常运行,显示的告警信息是:后插卡错误,和前插板不匹配。警信息是:后插卡错误,和前插板不匹配。启动类故障排查案例启动类故障排查案例【故障分析处理故障分析处理】接上超级终端看到如下打印信息接上超级终端看到如下打印信息 Load FPGA VerFile.Check MOMPs PCBNum and fpga version(fpga.ini).!.Fpga verify error!Fpga verify error!.Fpga verify error!Master OMP Fpga Flash boot failed!从中可以看出从中可以看出FPGA版本校验错误。经检查主备版本校验错误。经检查主备OMP的的FPGA版本不同(分别是版本不同(分别是040703和和040704),将),将OMP的的FPGA版本更新一致后备用版本更新一致后备用OMP正常运行。正常运行。启动类故障排查案例启动类故障排查案例RCB不能正常运行不能正常运行 【故障现象故障现象】北京马连道机房北京马连道机房RNC3有有3个个RCB板不能正常运行板不能正常运行 【故障分析处理故障分析处理】在在RCB后面插上后插板后面插上后插板RPMB,连超级终端检查发现如下打印消息:,连超级终端检查发现如下打印消息:Attached TCP/IP interface to fei2.Succeed Set fei2 to 100M|FD.Attaching network interface lo0.done.Booting from network Loading.Error loading file:errno=0 x3c.Cant load boot file!基本可以确认子卡有问题,现场通过更换基本可以确认子卡有问题,现场通过更换flash子卡后,单板正常运行子卡后,单板正常运行 启动类故障排查案例启动类故障排查案例CLKG板状态为板状态为CATCH 【故障现象故障现象】北京马连道机房北京马连道机房RNC6 1架架2框框14槽的槽的CLKG板状态为板状态为CATCH,13槽位的时钟板槽位的时钟板状态正常。状态正常。【故障分析处理故障分析处理】经过对比正常的板子发现故障经过对比正常的板子发现故障CLKG板的跳线少一个(板的跳线少一个(X45),接好后正常),接好后正常 根据硬件手册,根据硬件手册,X45的作用如下:的作用如下:X40X41X44X45BITS时钟第一路 bps、Hz匹配阻抗选择短路1、2脚,表示匹配阻抗为75 短路2、3脚,表示匹配阻抗为120 短路1、2脚启动类故障排查案例启动类故障排查案例GLI单板插光纤后不能启动单板插光纤后不能启动 【故障现象故障现象】厦门厦门RNC2的的2架架4框框3槽位槽位GLI单板启动不成功。观察启动过程发现单板启动不成功。观察启动过程发现GLI在上电复位在上电复位时面板灯时面板灯ACT,ALM,ENUM,RUN等长亮一段时间后熄灭,然后等长亮一段时间后熄灭,然后RUN灯快闪,过段时间灯快闪,过段时间RUN,ACT灯长亮,再然后就单板复位重启。灯长亮,再然后就单板复位重启。【故障分析处理故障分析处理】发现故障现象后,查询单板的异常记录,发现发现故障现象后,查询单板的异常记录,发现CPU的负荷达到的负荷达到100%,然后单板就,然后单板就被复位。准备把单板拔下来时,在拔掉光纤的时候发现单板启动成功,被复位。准备把单板拔下来时,在拔掉光纤的时候发现单板启动成功,RUN灯慢灯慢闪,闪,ACT灯亮,查看后台发现当前无告警。后来再尝试,发现拔掉任一对光纤,灯亮,查看后台发现当前无告警。后来再尝试,发现拔掉任一对光纤,都能启动成功,但如果配置的几对光纤同时都连接好,复位后就不能启动完成。都能启动成功,但如果配置的几对光纤同时都连接好,复位后就不能启动完成。怀疑是板上子卡问题。怀疑是板上子卡问题。【故障解决故障解决】将单板的上下子卡互换位置后单板恢复正常,再将两个子卡恢复成原位后,故障将单板的上下子卡互换位置后单板恢复正常,再将两个子卡恢复成原位后,故障现象没有复现。估计是子卡没有插紧导致现象没有复现。估计是子卡没有插紧导致启动类故障排查案例启动类故障排查案例GIPI无法正常启动无法正常启动 【故障现象故障现象】北京马莲道北京马莲道RNC某某RNC出现出现GIPI单板异常告警,同时单板运行指示灯,告警指示以单板异常告警,同时单板运行指示灯,告警指示以及及PWR指示灯等指示灯长亮一段时间然后熄灭,然后单板复位重启。指示灯等指示灯长亮一段时间然后熄灭,然后单板复位重启。【故障分析处理故障分析处理】从指示灯长亮情况来看,单板上电后无法下载版本,因此原因可能是单板本身从指示灯长亮情况来看,单板上电后无法下载版本,因此原因可能是单板本身启动异常,启动异常,GIPI与与ROMB单板通信异常。因此将单板通信异常。因此将RGIM后插卡插入后插卡插入GIPI的后背板槽位,的后背板槽位,通过串口信息观察通过串口信息观察GIPI单板在启动过程中的打印信息。在单板在启动过程中的打印信息。在GIPI上点过程中有如下上点过程中有如下打印:打印:=IXP23XX BOOT START=boot type=0 x00000002 configuration register 0=0 x8066B02E xsi memory init.done!cpp memory init.启动类故障排查案例启动类故障排查案例 观察打印消息中在做观察打印消息中在做CPP 内存初始化不能正确完成,导致单板复位重启,因此内存初始化不能正确完成,导致单板复位重启,因此怀疑为内存初始化失败或主板故障怀疑为内存初始化失败或主板故障 【故障解决故障解决】将该单板的内存和别的将该单板的内存和别的GIPI单板内存更换,更换内存后启动单板故障现象依旧,单板内存更换,更换内存后启动单板故障现象依旧,因此判断为单板故障,将该单板更换至别的槽位故障复现,更换单板后解决因此判断为单板故障,将该单板更换至别的槽位故障复现,更换单板后解决启动类故障排查案例启动类故障排查案例UIMU每隔每隔1小时主备倒换小时主备倒换 【故障现象故障现象】北京北京RNC15 的一架三框的一架三框UIMU单板每隔单板每隔1小时左右主备切换,历史告警如下小时左右主备切换,历史告警如下SUBNET15,RNC15,1/3/9,CPU1单板和归属模块之间的控制面通讯异常(8393985)2008-09-16 09:08:56SUBNET15,RNC15,1/3/10,CPU1主备单板通信链路断(5122)2008-09-16 09:08:46SUBNET15,RNC15,1/3/10,CPU1单板和归属模块之间的控制面通讯异常(8393985)2008-09-16 08:03:57SUBNET15,RNC15,1/3/9,CPU1主备单板通信链路断(5122)2008-09-16 08:03:47SUBNET15,RNC15,1/3/9,CPU1单板和归属模块之间的控制面通讯异常(8393985)2008-09-16 06:58:59SUBNET15,RNC15,1/3/10,CPU1主备单板通信链路断(5122)2008-09-16 06:58:49启动类故障排查案例启动类故障排查案例【故障分析处理故障分析处理】系统异常日志,系统异常日志,10槽位槽位UIMU的异常日志如下的异常日志如下 Rack:1,Shelf:3,Board:10,Cpu:13GPlat012456789Date:2008-08-27 22:34:22The System need restart,the reason:2208,the last words:Ctrl Link Error.Change over success and reset.9槽位槽位 异常日志异常日志 Rack:1,Shelf:3,Board:9,Cpu:13GPlat012456789Date:2008-08-27 21:29:24The System need restart,the reason:2208,the last words:Ctrl Link Error.Change over success and reset.启动类故障排查案例启动类故障排查案例 从打印上看,从打印上看,UIMU由于检查到控制面控制端口连续错误,从而引起主备单板倒由于检查到控制面控制端口连续错误,从而引起主备单板倒换,每块单板均能正常启动并且本框内大部分单板都能正常启动,说明可以排除换,每块单板均能正常启动并且本框内大部分单板都能正常启动,说明可以排除UIMU单板本身故障。同时备用单板本身故障。同时备用UIMU复位,可以检查和复位,可以检查和CHUN连接的线缆通过插拔连接的线缆通过插拔观察观察CHUB端口指示灯,能够正确显示,排除控制线缆问题。端口指示灯,能够正确显示,排除控制线缆问题。UIMU提供两个提供两个24+2交换式交换式HUB,一个是控制面以太网一个是控制面以太网HUB,对内提供,对内提供20个控制面个控制面FE接口与资源框内部接口与资源框内部单板互联,对外提供单板互联,对外提供4个控制面个控制面FE接口用于资源框之间或资源框与接口用于资源框之间或资源框与CHUB之间互联。之间互联。前面所述排除了与前面所述排除了与CHUB单板互联问题。单板互联问题。由于与内部单板互联,且两个单板都有控制链路错误指示,则可能是与框内其由于与内部单板互联,且两个单板都有控制链路错误指示,则可能是与框内其他单板的内部他单板的内部FE端口异常端口异常 观察本框内的单板状态,发现观察本框内的单板状态,发现15槽位槽位RUB一直处于告警状态不能启动。将一直处于告警状态不能启动。将RUB更更换后观察换后观察UIMU单板运行状态,未再出现主备倒换。单板运行状态,未再出现主备倒换。传输类故障排查案例传输类故障排查案例子单元故障子单元故障 【故障现象故障现象】某局多块某局多块SDTB单板多个子单元随机出现单板多个子单元随机出现“子单元通信断子单元掉电子单元故障子单元通信断子单元掉电子单元故障”【故障分析处理故障分析处理】怀疑可能是怀疑可能是RNC的的SDTB问题,但换上一块全新的单板后上述现象依旧;对局方问题,但换上一块全新的单板后上述现象依旧;对局方传输通道进行检查,未发现异常,且更换了传输通道后上述现象依旧,问题归结传输通道进行检查,未发现异常,且更换了传输通道后上述现象依旧,问题归结于软件配置。于软件配置。现场把排列方式从现场把排列方式从G.707改为支路排列方式后,所有子单元正常,故障消失。改为支路排列方式后,所有子单元正常,故障消失。SDTB的的63条条E1在光路上有两种排列方式:在光路上有两种排列方式:G.707和和Tributary。如果发生排列方式不。如果发生排列方式不一致,会出现:一致,会出现:G.707下的第下的第2条条E1会对应支路方式下的第会对应支路方式下的第22条条E1,但是有些,但是有些E1的的编号可以对应起来,如下:编号可以对应起来,如下:1,4,7,10,13,16,19,23,26,29,32,35,38,41,45,48,51,54,57,60,63。因此对应起来的是通的,所以会出现上面的故障,故障现象里的通的因此对应起来的是通的,所以会出现上面的故障,故障现象里的通的E1也是上面也是上面的这些。的这些。传输类故障排查案例传输类故障排查案例TD外场传输不通典型排查流程外场传输不通典型排查流程 1、数据检查、数据检查l SDTB单板的时隙排列方式是否正确单板的时隙排列方式是否正确 检查方法:首先看和检查方法:首先看和RNC的的SDTB单板连接的传输是哪家的设备,如果是单板连接的传输是哪家的设备,如果是HW传输传输设备,那么在设备,那么在SDTB单板属性中选择第一个排列方式单板属性中选择第一个排列方式“ITUT-G.707排列排列PCM“;如;如果是果是ZTE传输设备,选择第二个排列方式传输设备,选择第二个排列方式”Tributaty排列排列PCM传输类故障排查案例传输类故障排查案例lSDTB单板是否加上了光路参数和支路参数单板是否加上了光路参数和支路参数:光路参数:不用修改什么参数,直接使用默认的就可以光路参数:不用修改什么参数,直接使用默认的就可以传输类故障排查案例传输类故障排查案例l支路参数:注意支路参数的支路编号从支路参数:注意支路参数的支路编号从0开始编号,一直到开始编号,一直到62,每个支路参数的,每个支路参数的低阶通道信号标记(低阶通道信号标记(V5字节)选择字节)选择2(可能不同的传输厂家不一样,目前碰到的中可能不同的传输厂家不一样,目前碰到的中兴和华为的传输设备都是兴和华为的传输设备都是V5字节为字节为2),J2配置模式选择配置模式选择16,这个数据尤其和,这个数据尤其和HW传传输对接是一定要添加上;输对接是一定要添加上;传输类故障排查案例传输类故障排查案例2、如果数据全部没有问题,那么需要和传输机房确定如果数据全部没有问题,那么需要和传输机房确定RNC的的SDTB单板光口是否正单板光口是否正确接在了调单上指明的传输设备的光口,因为可能存在确接在了调单上指明的传输设备的光口,因为可能存在RNC上配置的基站接入光上配置的基站接入光口是正确的,但是施工队连接光纤是接错了。检查方法:可以拔掉口是正确的,但是施工队连接光纤是接错了。检查方法:可以拔掉RNC上的光纤,上的光纤,让传输机房看是否是要用的光口在告警。让传输机房看是否是要用的光口在告警。3、和传输机房对接光口没有问题后,那么就和传输机房对时隙,此时要注意、和传输机房对接光口没有问题后,那么就和传输机房对时隙,此时要注意RNC上上配置的配置的E1时隙是从时隙是从9开始编号,但是大部分传输设备时隙都是从开始编号,但是大部分传输设备时隙都是从1开始编号的;开始编号的;4、如果上述三个检查项目都没有问题,可以通过自环和断掉的方式来检查传输,、如果上述三个检查项目都没有问题,可以通过自环和断掉的方式来检查传输,可以自环的地点有传输机房和基站上的可以自环的地点有传输机房和基站上的DDF,就可以判断哪段出了问题,然后找,就可以判断哪段出了问题,然后找相关人员解决;相关人员解决;
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!