告警关联推广材料--某省移动

上传人:美景 文档编号:24478 上传时间:2017-01-02 格式:PPT 页数:26 大小:6.03MB
返回 下载 相关 举报
告警关联推广材料--某省移动_第1页
第1页 / 共26页
告警关联推广材料--某省移动_第2页
第2页 / 共26页
告警关联推广材料--某省移动_第3页
第3页 / 共26页
点击查看更多>>
资源描述
网络质量是通信企业生命线 告警关联项目推广介绍 广东公司 2009年 11月 - 2 - 各省 在现网部署告警关联程序 各省 选择关联规则在现网中部署 各省 对告警关联功能进行验证,包括规则生成、入库、呈现、派单。 各省 对关联规则验证失败的进行详细分析不优化修改 各省 对已产生关联的关联规则进行关联条件的优化分析 由 业务人员 对告警关联规则进行梳理 由 牵头省 对告警关联规则进行评审幵发布 由 厂家 对告警关联功能进行开发 由 厂家 对关联规则进行配置开发 - 5 - 广东工作时间表 7月 7月底 8月 功能开发 功能部署 关联规则验证分析 网管厂家对告警关联功能进行开发与测试 根据已评审过的关联规则,开发所有规则配置脚本文件,并进行测试 在现网中部署告警关联主程序,配置告警关联规则 从关联规则部署,关联告警生成、呈现、入库、派单进行验证 解决现网运行过程中产生的各类问题,确保功能稳定。 对已有关联告警生成的规则,进行合理性的验证 对在现网环境下无法产生关联告警的规则进行分析,更正并优化关联规则条件 5月 规则梳理 对告警关联梳理表按牵头省进行梳理 告警关联规则梳理表评审 11月 告警关联分析推广 根据试点省前期告警关联功能在现网中部署验证的情况进行经验总结 向全国推广告警关联分析功能 - 6 - ,涵盖了爱立信和华为两个厂家的所有主次和衍生关联规则 厂 家 规 则 类 型 总 数 爱立信 主次关联 15条 衍生关联 9条 华为 主次关联 30条 衍生关联 26条 广东在现网中累计成功验证了 45条告警关联规则,总体验证率为 还未验证成功的关联规则共 37条,其中爱立信 5条,华为30条。 厂家 规则类型 总 数 验证数 验证率 合计 爱立信 主次关联 15 11 衍生关联 9 8 华为 主次关联 30 16 衍生关联 26 10 - 7 - ,里面定义了告警关联名称,告警关联类型,父告警和子告警(以网管告警 警标题唯一识别一条告警),告警关联量值( X:时间窗和 Y:数量基线),告警关联规则条件。衍生告警正文等。 1、告警关联主程序; 2、告警关联规则配置模块; 3、告警关联 各省从告警关联梳理表中选择现网设备相关的关联规则进行部署 各省拿到告警关联程序包后在现网部署功能 1、告警关联正常运作 2、告警关联规则配置模块是否生效 3、告警关联 1、规则配置文件是否与告警多维梳理表的关联规则一致 2、关联告警能否正确生成 验证告警关联规则的正确性 测试告警关联主程序各项功能的可用性和稳定性 - 8 - : 各省在告警关联程序部署的初期,必须密切留意告警关联各功能程序的运行状态以及不其相关的周边功能的状态,确保告警关联程序异常能够及时发现和处理,且丌影响其他功能的正常运作。 告警关联主程序 关联告警能够正常生成 关联告警能够正常呈现入库,能查询历史关联告警 界面上有关联拓扑图功能 衍生告警信息不梳理表一致 告警关联规则配置模块 能够查询告警关联规则配置 能够修改告警关联规则的量值( ),幵生效 能够启用 /禁用告警关联规则,幵生效 告警关联 能够每天生成正确的报表 报表数据无缺数 报表数据无小于 0,百分比超 100的数据逻辑错误 报表数据无算法错误,如“关联成功数”大于“匹配告警数” 客户端程序不告警库验证 界面不配置文件验证 报表程序不数据源验证 - 9 - 举例 1、衍生告警存在告警指纹重复问题 广东发现关联分析主程序生成的衍生告警指纹重复,影响到后续的告警历史库的同步,直接引发告警系统占用主机资源严重而使主机崩溃。 【 解决过程 】 已升级新的关联分析主程序,加上内部程序的唯一码判重,可以保证生成的告警指纹唯一。 【 经验分享 】 要 留意关联告警的入库情况 ,及时发现入库异常。 2、不需关注的告警屏蔽 告警关联程序部署中发现,有丌需要被处理的告警进入了关联,产生了丌需要处理的告警关联。 【 解决过程 】 告警关联功能要处理的告警应为 1 3级告警、非工程告警和非退网网元的告警,在告警关联主程序的入口处应该进行告警过滤,屏蔽了四级告警、工程告警以及退网网元,只保留现网有业务告警。 【 经验分享 】 告警关联功能的入口应是需要被关注和需要被处理的告警,在实施过程中应该予以限制。 - 10 - : 各省在告警关联规则部署中,必须先核查关联规则配置文件,确保不告警关联规则梳理表一致,以免日后验证工作中增添干扰源。 关联规则 配置文件 表征:某告警关联规则无法生成关联,无匹配告警 检查项: 1、网管告警 、告警标题 3、网元类型 4、告警关联类型 5、量值设置 6、告警关联规则条件 一般问题出现在 1、 2点 目标:两者信息完全一致 前提 验证 建议采取在测试环境中,人工生成所有规则的告警,进行要部署规则的测试验证。 目标: 验证率 100,规则中的问题必须在现网部署前全部解决。 - 11 - 举例 1、爱立信主次 【 问题描述 】 该规则一直无法产生关联告警,且仅能匹配一种告警,另外一种无法匹配。 【 解决过程 】 经查看告警关联规则 现其中主告警“ 警标题写成“ 导致该类告警无法进入此关联规则,最终导致无法产生关联告警。更新规则后在现网验证,已有关联告警产生,问题解决。 【 经验总结 】 若关联规则一直无法产生关联,建议先查看告警关联规则源文件,告警匹配规则是否配置错误, 一般来说为网管告警 2、爱立信主次 统计等告警规则 【 问题描述 】 该关联规则一直无法生成关联告警,且能匹配的告警类型丌全,有一种告警一直无法匹配。 【 解决过程 】 经查看关联规则 觉 001经查看告警多维梳理表,发觉有误,应为“ 001更新规则后在现网验证。 【 经验总结 】 若关联规则一直无法产生关联,建议先查看告警关联规则源文件,告警匹配规则是否配置错误,一般来说为网管告警 - 12 - 建议 因告警关联规则配置文件是以 网管告警 告警标题 唯一确定一类告警,存在网管告警 基于爱立信多维梳理表是以告警标题为 警标题已足以唯一确定一类告警,因此广东在部署爱立信告警关联规则上,去掉网管告警 以告警标题作为唯一匹配条件,以免增加丌确定因素。 建议 : 各省也可以参照告警多维梳理表中的 - 13 - ,保证了功能的稳定性和规则的正确性。接着进入了告警关联规则的分析优化工作阶段。 效果分析 参数优化 现网验证 关联规则部署后不断验证,对异常的关联规则和需要优化的关联规则进行标识和统计。 通过各种分析方法与手段,结合各省实际运维情况,对关联规则进行分析和调优。 部署优化后的关联规则,进行现网验证 目标: 1、 告警关联能够有效减少告警呈现量和工单派发量 2、能够有效自动分析故障定位 - 15 - 相关告警是否在现网出现过 是否未匹配导致无网管告警 警关联规则优化方法 问题 1:某些规则无法产生关联 /关联极少 解决方向:查找分析无法生成关联的原因 是否存在关联告警? 关联规则量值是否合理? 相关告警实际情况是否能满足关联规则条件 关联规则条件是否合理? 告警没出现的原因 告警未匹配原因 告警实际不能满足关联规则条件的原因 分析关联规则量值的合理性 制定关联规则修改方案,重新部署关联规则。 异常 注意:要结合实际运维要求合理优化, 存在正常情况的无关联告警产生,不要为了产生关联而搞关联。 继续观察 对未匹配告警进行梳理 - 16 - :某些以压缩告警的关联规则没有很好的压缩告警 解决方向:横向比较优化规则量值 规则 A( x1, 规则 A( x2, 规则 A( x3, 分析这些规则的压缩情况 挑选最优量值 配置多种目标规则条件与量值的关联规则 规则 A( x1, 压缩量,匹配告警数 规则 A( x2, 压缩量,匹配告警数 规则 A( x3, 压缩量,匹配告警数 规则 A( x2, 优化 同一告警会同时匹配到多条关联规则的特性 分析压缩量和匹配告警数两个指标考虑 根据压缩效果目标选定合适的量值 - 17 - :某些以压缩告警的关联规则没有很好的压缩告警 解决方向:横向比较优化规则量值 优化 分析这些规则的压缩情况 规则 A( x1, 压缩量,匹配告警数 规则 A( x2, 压缩量,匹配告警数 规则 A( x3, 压缩量,匹配告警数 分析压缩量和匹配告警数两个指标考虑 要增大压缩率,一般采取增大 更多的告警能够被关联在一起,少衍生告警数量。 通过分析告警压缩量和匹配告警数两个指标,在所匹配的告警数变化丌大的情况下,告警压缩量得到提升,衍生告警数量得到减少为确实能够提升告警压缩效能的体现。 建议:在告警关联规则梳理表中的量值具有一定的指导性意义,量值的调优应该在关联规则原量值基础上作微调,丌应作太大改劢,否则将影响规则本来的关联意义。 建议:请避免单方面考虑告警压缩效能从而导致以下两种丌应该出现的情况: 1、告警匹配数量减少,使得本来应该被关联的告警被排除在外。 2、时间窗设置过大,使得告警关联成为纯粹的告警合幵容器。 - 18 - 举例 异常: 3优化原因: 该关联规则一直无法生成关联告警 。 优化方法:修改该规则的关联条件。 分析过程: 1、从告警库中抽样分析,发现在关联条件范围内产生了该规则的子告警和父告警,但是无法被关联。 2、查看关联规则,发现该规则需要满足父告警的 3、广东现网中 关联条件丌成立。 结论:该规则的关联条件丌符合现网情况,需修订完善关联规则。 异常: 优化原因: 该关联规则一直无法生成关联告警 。 优化方法:增大该规则的 便告警容易产生。 分析过程: 1、查看历史库,发现同一网元产生该规则关联告警的时间间隔均在 5分钟以外; 2、把 0分钟后,再到现网验证; 3、发现能够产生关联关系。 结论:该规则 0,才能有效产生告警关联。 - 19 - 举例 优化:同一网元 规则名 匹配告警 衍生告警 原始告警 爱立信衍生 5 2 1651 18 459 5 3 1651 18 459 5 4 1651 19 461 5 5 1651 17 457 20 2 1651 8 438 30 2 1651 8 438 60 2 1651 8 438 优化原因:该规则衍生告警过多,达丌到告警合幵效果。 优化方法:通过部署丌同 X、 行横向对比。 分析过程: 1、当 生告警数量和原始告警数量变化丌大。 2、当 生告警数量和原始告警数量一致。 3、当 Y 2时, 生告警产生的越少,原始告警量变化丌大。 结论:该规则适当增加 足对告警进行合幵的目的。 - 20 - ,天生缺乏显性化的效能呈现,必须提供相应的显性化呈现和分析依据。 集团制定了 中国移劢告警标准化运维管理指标体系 ,幵部署了告警关联相关报表。 通过对告警关联相关指标进行分析,可以辅劣告警关联的验证和优化工作。 - 22 - 单条规则分析指标报表 ,以规则为粒度统计此规则的告警关联相关指标对于进行规则优化分析工作有很大用途 涉及告警种类 匹配告警数 单条关联规则的关注价值 单条关联规则的压缩量 关联成功数 衍生告警数量 主告警数量 子告警数量 1、如果匹配数为 0,则有可能匹配规则异常。 2、如果匹配数过少 ,则可以分析关联规则和量值的合理性。 压缩量要不关联成功数做参照,若压缩量丌理想,可以优化此规则,增加压缩比 关联成功数要不匹配告警数做参照,若关联成功比丌高,可以优化此规则,增加成功比例 以减少衍生告警产生为目的进行量值优化时,增加时间窗或者加高门槛。 主次告警应该只能进行适当必要性优化 在关联规则原则前提下,可以适当考虑放宽关联限制进行优化,调高 低 - 23 - 应用情况 告警关联压缩量平均为 21365条,总体压缩率平均为 某日共派发告警关联工单 1908张,其中 1254张是衍生告警派单, 654张为主次告警派单,派单量占工单总量 工单量比同期工单量减少约 300张左右。 统计日期 专业 厂家 一到四级告警量 告警压缩量 告警关联规则压缩率 2009音网 华为 455217 20666 009音网 爱立信 1030997 009音网 爱立信 672218 61756 009音网 华为 317330 009音网 华为 161415 27292 009音网 爱立信 353138 24 - 跨专业告警关联尝试 通过接入 数据网 软交换 过 综合资源系统平台 提供设备网元拓扑资源,进行关联呈现。能够快速发现由于 - 25 - ! 感谢聆听! 中国移动广东公司 网络质量是通信企业生命线 - 26 -
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 管理文书 > 工程建筑


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!