中国移动省分公司数据流量与监控系统

上传人:枕*** 文档编号:124832646 上传时间:2022-07-25 格式:DOCX 页数:5 大小:77.45KB
返回 下载 相关 举报
中国移动省分公司数据流量与监控系统_第1页
第1页 / 共5页
中国移动省分公司数据流量与监控系统_第2页
第2页 / 共5页
中国移动省分公司数据流量与监控系统_第3页
第3页 / 共5页
点击查看更多>>
资源描述
Yonghong大数据案例:中国移动省分公司数据流量与监控系统5月,Yonghong收到一种电话线索,客户需要支持几十亿数据量的实时查询与分析,涉及数据抓取和存储,让我们先出报价。在实时大数据分析领域,Yonghong的产品和服务是很有竞争力的。但是,当客户拿到我们的报价后,还是觉得比她们的预算贵某些,决定自己招聘Hadoop团队,实行该系统半个月后,客户打来第二个电话,明确表达Hadoop未能满足需求,决定接受我们的报价,并乐意预付一半的费用。客户规定我们不仅出产品,还要负责实行于是乎,动工!项目价值CMNET网间流量分析与监控系统(简称流控系统),是中国移动省分公司的一种项目。项目规定能基于时间、地区、运营商、业务、App、IP分组、域名等维度对全省的上网流量进行实时分析和报告。这些分析报告能给客户带来如下好处:1. 实现对接入链路和基站的全程监控。例如,一旦来自某链路或基站的流量很低,可及时对链路和基站进行检修,这将大大减少故障率。2. 由于具有了对链路和基站进行全程监控的能力,客户可以对链路和基站的带宽进行动态调节,基于需求进行合理的资源配备。3. 覆盖全省的全量数据,能提供基于业务/地区/App/行业/域名等维度的数据分析报告,具有100%的可信度和极高的商业价值。 数据流向上网数据从硬件设备中抓取出来,形成压缩的日记文献存储在服务器上,服务器每五分钟生成新的日记文献。该服务器提供FTP访问。Yonghong承当的流控系统,将通过FTP每五分钟访问一次日记文献服务器,将新生成的压缩日记文献抽取出来。这是一种典型的、增量更新的ETL过程,如下:1. Extract: 定期抽取的日记文献并解压缩。2. Transform: 解析出上网信息,同MySQL的维度表进行关联,生成涉及业务/地区/App/行业/域名等维度的宽表。3. Load: 将数据装载入Yonghong 分布式集市。初期验证(POC)中国移动的日记数据分G类和A类,各取几块样本日记文献,验证数据流向的可行性以及性能。我们不久完毕了ETL的整个过程,宽表数据被成功地装载入Yonghong 分布式集市。性能上,我们按照顾客提出的每天数据量5000万条增量,计算出支持100天50亿数据量的分布式集群所需的磁盘空间、内存总量、和CPU总量。由于客户多次强调预算有限,于是配备了6台低配PC server:1cpu x 4core,32G内存,1T硬盘。我们模拟了常用的顾客场景,整个系统的响应能力基本满足需求。系统架构如下:系统架构图正式实行中国移动省分公司的上网数据在内网,一般不提供外网连接,需要严格申请之后才干在一定期间内提供外网连接。因而,我们先把整个系统的ETL工作开发完毕之后,才正式申请了外网连接进行数据装载。从开始进行上网数据的ETL工作,我们就发现数据量与预期严重不符。预期的上网数据是每天不超过5000万条,但事实上每天的上网数据在6亿条以上,100天保存的数据量将会达到惊人的六百亿条。6台低配PC server有点小马拉大车的感觉,完全达不到“海量数据、实时分析”的设计目的。我们赶紧联系客户,拟定上网数据每天6亿条以上,而不是之前预估的每天5000万条左右。怎么办?系统重构通过与客户的具体沟通和理性分析,人们一致决定进行系统重构。上网数据的日记文献是5分钟粒度的。我们将上网数据按照分析需求分为两类:1. 细节数据:保存三天的细节数据(5分钟粒度),共约20亿条。这样,由于保存了细节数据,客户可以对近三天的上网数据进行任意的摸索式BI分析。2. 汇总数据:在认真研究了流控系统的分析报告需求之后,我们将五分钟的细节数据汇总为两小时的汇总数据。这样数据量可以降到约为本来的1/10,100天的数据总量大概60亿条。重构之后的数据流如下:数据流图后期,我们陆续进行了某些系统调优,涉及JVM调优、存储调优、计算调优等等。客户打开一种Dashboard的响应时间基本控制在秒级,最极端的分析报告也能在一分钟之内生成。基本实现了“海量数据、实时分析”:1. 系统定期推送日报、周报和月报。2. 系统支持摸索式BI分析。多数分析祈求达到了秒级响应。案例总结1. 项目的数据量非常大,100天超过600亿条日记;2. 项目的预算非常有限,采购了6台低端PC Server。硬件投入不大,软件性价比也很高; 3. ETL过程难度较高,随着降维的需求加入,BI层难度也相应提高;4. 为达到秒级响应,以支持摸索式BI的交互式分析,对系统进行了多种层面的优化。这个系统的成功实行和上线,完美诠释了Yonghong的大数据之道:大数据,小投入。
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!