资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,1,新一代数据管理和数据分析,解决方案,1新一代数据管理和数据分析,1,关于,Greenplum,公司,Greenplum,是一家数据库软件公司,在,数据处理和,BI/DW,领域,提供,容量最大、速度最快、性价比最好,的,数据库引擎产品和服务,。,Greenplum,总部位于圣马蒂奥,加利福尼亚州,美国,成立于,2003,年,6,月。,Greenplum,中国于,2008,年,12,月正式成立,.,2024/11/19,官方网站:,www.greenplum-,关于Greenplum公司Greenplum是一家数据库软件,2,Greenplum,:简介,Greenplum,数据引擎软件为新一代数据仓库所需的,大规模数据,和,复杂查询,功能所设计,3,推动数据依赖型企业的发展,Greenplum:简介 Greenplum数据引擎软,3,全球各地的一些,Greenplum,客户,4,亚太地区 欧洲、中东、非洲 北美,全球各地的一些Greenplum客户4亚太地区,4,中国的客户,5,金融,交通,互联网,其它,中国的客户5金融 交通 互联网,5,TeradataNetezzaOracle,Greenplum,Neoview,VerticaParaccel,Aster Data,Hadoop,Current Database Vendor Landscape,Proven Enterprise Grade Capabilities,No Enterprise Credibility,Aging,Proprietary Legacy,Scalable,Open,Software-Based,Commodity HW,TeradataNetezzaOracleGreenpl,6,用户人数,安全度,查询、报告、分析的数量,数据的高度多样性,大量定制数据,监管要求,商务智能,/,数据仓库发展趋势,一切都在增长,!,用户人数安全度查询、报告、分析的数量数据的高度多样性大量定制,7,数据仓库工作量:数据膨胀,面临的新难题是如何处理大规模数据,过去的,10,年,现在,HPC,企业,SME,万亿字节,千兆字节,兆字节,千万亿字节,万亿字节,千兆字节,数据仓库工作量:数据膨胀 面临的新难题是如何处理大规模数据,行业商务智能解决方案的实例,政府,电信,金融服务,公民服务,国家安全,电子政务,法规实施和监管,人力资本管理,信息传播,合规性报告,资产组合分析,客户报表,电汇通知,分部记分卡,客户关系管理、收购和盈利率,欺诈检测,欺诈分析,客户流失分析,响应时间,流量分析,产品关联,/,捆绑,零售,存储运营分析,客户忠诚度计划,协作规划和预估,预防亏损,优化供应链,行业商务智能解决方案的实例政府电信金融服务公民服务合规性报告,9,当今的数据仓库方案,基于硬件,专有,昂贵,不可扩展,针对,OLTP,进行了优化,主流,10,当今的数据仓库方案基于硬件专有,昂贵不可扩展主流10,10,数据库行业所面临的挑战,新一代数据库的要求,传统数据库的要求,今天的数据库供应商,网络运算的发展速度已经超过了主流数据库,海量规模,高性价比,高效率,数据库管理系统(,DBMS,)的 规模,/,容量,11,数据库行业所面临的挑战新一代数据库的要求传统数据库的要求今天,11,需要采用一种新的方法,“一切皆可商用”:商业即用型,x86,服务器、存储设备、网络,通过软件很容易将处理能力扩展到,1000s,的内核,/,系统,Greenplum,“黑盒子”,“大铁箱”,大磁盘,过去,Google,曾经用来实现信息搜索功能的技术,现在被,Greenplum,用于数据仓库,现在的解决方案,12,需要采用一种新的方法“一切皆可商用”:商业即用型x86服务器,12,Greenplum,愿景:企业数据集合,13,在企业内创建统一的数据运算平台,企业所有者可以直接控制其数据实例,通过实体整合提供企业级数据访问功能,灵活的扩展和配置降低了投资的平均风险,源文件,源数据,源数据,源文件,数据仓库和分析应用程序,Greenplum,数据架构,商用硬件集群,分析,数据市场,企业数据仓库,Greenplum愿景:企业数据集合13 在企业内创建统一的,13,企业数据集合:主要的优势,实体整合,提高服务器使用率,降低总硬件成本,降低能量成本,可以预估的服务等级,确保关键任务的可靠性,最出色的性能,高度灵活性,逐步扩展计算能力,动态措施,数据访问:,在一个系统中协调所有企业数据的位置,可以通过任何语言(,SQL,、,M/R,等)进行分析,14,企业数据集合:主要的优势 实体整合14,14,强大并且不断扩展的合作伙伴网络,硬件供应商,商务智能工具,15,服务供应商,强大并且不断扩展的合作伙伴网络硬件供应商 商务,15,业内支持和认可,行业奖励,“,Greenplum,能够让企业在两个方面同时达到最满意的效果:供程序员使用的,MapReduce,以及供数据库管理使用的,SQL,。”,Monash Research,的,Curt Monash,分析师褒奖,“,Greenplum,正在通过新式技术来推动并行数据库的发展,从而满足互联网级企业的需求。”,ZDNet,的,Dana Gardner,Magic Quadrant 2007,(”远见者象限”),最佳集群解决方案,Global,250,Fast 50,2008,年亚洲南部地区成就奖,“可能会成为数据仓库和数据库管理系统市场的突破力量”,Gartner,的,Donald Feinberg,业内支持和认可 行业奖励“Greenplum能够让企业在两,16,17,通过,Greenplum,超级数据处理引擎增强竞争优势,17通过Greenplum超级数据处理引擎增强竞争优势,17,Greenplum,数据引擎:内容和方式,价值主张,性价比:性能可达到传统方案(,Oracle,、,Teradata,)的,10,到,100,倍,而成本只是其一小部分,可伸缩性:从较低的万亿字节扩展到千万亿字节,开放式系统:在通用系统和开放源软件的基础上创建,前提条件,硬件:基于开放式标准硬件,软件:,Postgres,和,Greenplum,体系架构:海量并行处理体系,针对商务智能,/,数据仓库进行了优化,解决了所有数据流瓶颈问题,Greenplum数据引擎:内容和方式价值主张,18,Greenplum,数据引擎,全球最强大的分析数据仓库,海量并行查询,可以比以往更快地获取查询结果,在数据增长的同时确保高性能分析,统一的分析处理功能,为数据仓库、市场、,ELT,、文本挖掘、统计运算提供统一的平台,可以使用,SQL,、,MapReduce,、,R,等在所有层次上对任何数据进行并行分析,19,通过经济的方案扩展到千万亿字节规模,不用担心数据增长或者开始的规模太小,在商用硬件上通过线性、经济的方式扩展,Greenplum数据引擎全球最强大的分析数据仓库海量并行查,19,Greenplum,数据引擎体系,主机,网络互连,并行查询规划和调度,区段服务器,(处理和存储),SQL,查询和,MapReduce,程序,MPP,(海量并行处理)“完全不共享”体系,Greenplum数据引擎体系主机网络互连并行查询规划和调度,20,Greenplum,体系:并行数据流,21,通用并行数据流引擎可以通过本地方式执行,SQL,和,MapReduce,采用了针对商用硬件优化的,MPP“,完全不共享”体系,可以在很多,100s,服务器上扩展到,1000s,商用处理内核,将,所有,处理操作尽量移动到数据附近,计算内核,Greenplum,并行数据流引擎,对本地磁盘进行直接的高性能访问,gNet,互连,Greenplum体系:并行数据流21计算内核Greenpl,21,第一个支持互联网级分析技术(由,Google,普及)的产品,采用新的编程模型,在商用硬件上并行处理和执行,可以使客户洞察力和数据货币化程度达到前所未有的高度,MapReduce,第一个支持互联网级分析技术(由Google普及)的产品Map,22,Greenplum MapReduce,的优势,处理在任何地点存储的任何类型的数据,将,SQL,的普遍性与,MapReduce,的灵活编程模式结合起来,针对业务关键分析功能提供企业级集成、支持和发布,为新一代分析处理技术开启了大门,其中包括文本分析、图形分析、数据挖掘、机器学习以及更多内容,Greenplum MapReduce的优势处理在任何地点存,23,客户实例:福克斯互动媒体,(,Fox Interactive Media,),业务问题,改进定位广告,竞争对手,Teradata,Oracle,数据规模,1,万亿行事实数据表,每天增加,3TB,硬件,40,节点的,Sun,数据仓库设备,优势,可以通过控制支持快速膨胀的数据集,“,Greenplum,将成为我们不可或缺的合作伙伴,因为我们需要不断更新数据操作方式,使用户和广告商通过我们的工作网络中获得更好的印象。”,-FIM,受众网络技术和运营部门的产品执行副总裁,Arnie Gullov-Singh,24,净数据规模,(TB),2008,年,9,月,2008,年,12,月,客户实例:福克斯互动媒体(Fox Interactive,24,客户实例:,Reliance Communications,业务问题,CDR,安全合规性和分析,已有方案,Oracle,数据规模,20TB,,每天增长,400GB,优势,将响应时间缩短,90%,“借助运行,Greenplum,数据引擎的,Sun,数据仓库设备,,Reliance,可以在快速发展,用户需求不断增加的数据环境中达到预期的高度响应能力。”,-Reliance,的副总裁和主管(决策支持系统),Raj Joshi,25,响应时间,(,分,),以前的数据库,客户实例:Reliance Communications业务,25,客户实例:,PLDT,业务问题,CDR,分析,竞争对手,Oracle,数据规模,2200,万用户,/7,亿次交易,优势,数据装载时间减少,8,倍,查询速度从,2,小时提高到,15,分钟,“我们业务所面临的一个关键挑战就是要处理很大的数据量。,Greenplum,技术可以帮助我们更好地了解我们的客户及其需求。”,PLDT,的,Alexander Seminiano,Sun DW,Oracle,1,10,15 mins,20X,5 hours,客户实例:PLDT业务问题“我们业务所面临的一个关键挑战就,26,Greenplum现有国内客户案例分析,巨人网络(征途游戏),:,财务分析、游戏在线分析,阿里巴巴:,B2B,、,B2C,、点击、在线分析,上海航空,:,航线结算分析,东方航空,:,航线结算分析,民族证券,:,数据中心,证券投资分析,北京第二外语大学:图书分析,中信银行:信用卡分析,
展开阅读全文