资源描述
精选优质文档-倾情为你奉上应用性能监控解决方案专心-专注-专业一、应用监控(APM)介绍如今应用系统已经成为企业的业务支撑核心。企业通过应用系统联系客户、构建产品、自动执行后端业务流程、完成几乎所有对业务至关重要的任务,客户访问页面时的体验,直接影响到企业的声望与收入。传统的监控重点放在基础设施资源够不够(如主机和网络),这是重要的,但忽略了最重要的东西-那是最终用户体验。APM解决方案聚焦管理整个应用程序交付链。应用监控从技术角度,分为以下三种方式:模块名称功能描述模拟交易监测人工交易仿真,定时主动探测。旁路交易监控基于网络旁路技术的应用性能监控,快速判断定位故障域。深度交易监控Java/ .NET/PHP代码分析诊断,深入到代码函数、方法、类、SQL语句、参数级别。1.1 模拟交易监测通过模拟用户的操作行为来达到检测应用系统可用性的目的。应用监控针对不同的应用系统预先录制交易脚本,通过定时调用的方式来执行这些交易脚本,并记录交易结果。应用监控通过分析交易结果,做到主动发现应用系统的异常,定位交易路径上出现故障的环节。模拟交易一般选取用户登录或查询类交易,同时要考虑交易路径的长度,做到有区别的选择。模拟交易的方式适用于B/S 和C/S结构及手机端,适合于没有24小时业务数据,但又被要求7*24小时持续健康运转的系统。1.2 旁路交易监控通过网络旁路的方式来抓取生产系统上真实的交易包,经过分析交易路径上各个环节上的交易处理情况,做到主动发现异常。由于生产系统之间的关联关系复杂,一笔交易往往要通过几个系统的处理才能完成,因此,在交易路径的关键节点上部署旁路交易监控,可以比较准确的定位出现故障的环节,帮助运维人员及时处理异常,避免对业务产生影响或把对业务的影响降到最低。旁路交易监控除了能主动发现应用异常外,还可以将监控到交易量、交易分布等情况进行汇总统计,形成业务运行情况报告,作为运维工作的重要参考依据。通过交换机端口镜像及网络层解码技术,实时分析业务节点的响应时间和报文传输质量,使运维部门能快速分清责任(是网络问题、数据库问题、负载均衡设备问题、报文传输问题,服务器内部处理问题等),实现应用性能诊断的粗定位。1.3 深度交易监控针对应用系统性能较为突出,缺乏合适工具定位问题根源的具体现状,通过在应用中间件服务器上安装探针方式(生产环境系统CPU开销不超过3%),实现中间件及代码执行状况的深入监控并可自动绘制程序访问流图,为运维和开发排查问题提供依据,目前根据使用场景不同有开发测试和生产两个版本可供选择(主要是探针所获取的信息和系统开销有所区别,生产版本做了严格的性能限定),开发测试版用于新程序压力测试,排查代码隐患提升可靠性;生产版本用于生产环节分析排错。系统支持层层钻取功能的展示界面,可帮助应用维护人员和开发人员,快速定位代码故障根源(精确到函数、类、方法、语句、参数层面),并可与Eclipse、Visual studio等IDE开发工具集成,大幅提升代码问题的排查效率,改善消除系统瓶颈,优化代码质量,提升客户的访问体验,适合于想做代码深入定位诊断和有代码质量潜在问题的用户。二、应用监控能解决的问题2.1 企业所面临的现状n 近年来业务的快速发展,需要维护的业务系统越来越多、体系越来越庞大;n 在业务与新技术的融合过程中,企业的IT应用及业务系统的逻辑日益复杂化;n 应用系统常见性能问题:连接池泄露、数据库连接不释放、前台页面响应缓慢,后台中间件服务宕、挂死等;n 随着业务的不断变化,已投入生产的IT系统代码更新或版本升级频率很高,在代码更新或版本升级后也有可能出现影响业务的问题。2.2 运维部门的痛点n 代码执行效率与性能瓶颈诊断定位难;n 通过人工排查问题的手段,时间和人力成本高;n 不能提前预知系统代码与性能的风险点;n 对出现问题的根本原因分析不透彻;n 临时解决的问题,隐患也有可能在将来某个未知的时间点或时间段重新显现;n 应用系统供应商开发的代码质量参差不齐,且缺乏检验和判断的标准;n 现有的手段已无法高效的支撑快速、敏捷的运维需求。2.3 应用监控可解决的问题n 支撑业务系统的开发人员和运维人员快速识别故障、定位问题及故障域,快速准确排查问题、代码纠错,实现高效的故障诊断和问题根源分析;n 可以快速定位故障原因是在运维层面还是代码层面;n 快速全面掌握IT系统问题对业务的影响,进而分析影响度产生分级处理方案;n 通过快速响应、快速定位问题,通过有效的故障分析诊断工具,提高研发、测试、运维的工作效率;n 能客观评价应用系统供应商的代码开发质量与执行效率,并为评价提供证据;n 通过实时分析视图和历史服务趋势视图,分析业务系统性能瓶颈、代码问题与数据库语句问题,反映每笔业务的真实情况;n 后台人员通过系统,可获取到每个用户在前端的行为(使用的浏览器和操作系统版本,浏览的页面、执行的操作、使用的终端类型、每一次访问的效果等);n 通过代码分析诊断功能,建立起研发、测试、运维的循环协作体系,共同改善消除系统瓶颈,优化代码质量,提升客户的访问体验。三、功能点介绍3.1 模拟交易监测 通过机器人技术模拟真实客户交易场景 可724小时自动执行交易探测 简单易用的交易或者协议可用性诊断 分析不同分支地域的网络带宽情况 支持手机端(IOS、Android)的仿真模拟探测3.2 旁路交易监控通过交换机旁路与强大的解码技术,实现网络层的分析诊断,从传输角度实现应用性能问题的定位与粗诊断,并通过网络TTA抓包工具实现问题数据包的离线分析。3.3 深度交易监控与性能分析 通过专利探针技术,自动绘制程序内部访问流图,可钻取到代码执行内部,查看每个代码、SQL语句、参数、方法和类的执行效率、调用次数与报错信息,助您快速分析解决代码问题,产品内嵌解码器可以随时查看程序的源代码,并可与开发环境进行集成,便于开发人员快速定位修改代码。3.4 用户终端交易监控用户终端交易监控是深度交易监控的可选组件,它可获取移动端(支持IOS、Android)、Pad、用户浏览器端的访问信息),使得数据中心人员可快速了解前端每位用户的真实操作与访问感受,自动实现前后端访问信息的自动关联,真正做到前端到后端访问的可视化,系统所获取的数据,可与大数据平台相结合,进行终端用户行为分析,为企业的商业决策提供依据。四、用户收益4.1 性能问题的瓶颈及根源分析能够监测系统访问的性能和可用性,定位系统出现性能问题的瓶颈,找出症结所在,提高运维效率和服务质量,提高应用质量并加强开发效率。4.2 实时全方位业务视图能够进行实时业务视图,并进行数据共享,上至领导下至各部门同事会用共通的数据资料、共同的平台来进行判断,快速发现故障、解决故障,是性能问题还是代码问题,解除IT运维人员工作中百口莫辩的尴尬。4.3 全应用性能生命周期管理 可涵盖企业IT应用从产品开发、测试、上线到后期运营管理的整个生命周期,真正实现全应用性能周期可视化管理。4.4 变被动运维为主动运维让您能从被动响应的运维工作方式转换为主动运维的工作方式,轻松识别、防范应用问题,在问题影响用户体验前定位系统出现性能问题的瓶颈、快速查找定位并报警通知到责任方,解决性能慢等问题,优化用户体验、提高转化率,一招制胜。4.5 建立良好的沟通协作模式能够快速定位捕捉后端的性能问题,建立性能基线,为业务运维提供安全保障, 从各个地点、各种设备对所有用户的用户体验水平进行监测,确保客户满意度和忠诚度,从而全面优化终端用户体验,理顺运维和开发间的关系,建立良好的沟通协作模式。
展开阅读全文