资源描述
按一下以編輯母片標題樣式,按一下以編輯母片文字樣式,第二層,第三層,第四層,第五層,*,*,BIG DATA,-Prepared By xindong,不知道,BIGDATA?,你,out,了,!,前瞻来,看,看,随,着,着互联,网,网对网,民,民的理,解,解,网,民,民对网,络,络的反,作,作用,,互,互联网,将,将变得,越,越来越,智,智能。,它,它在满,足,足你需,求,求的同,时,时,也,在,在创造,新,新的需,求,求。前,者,者的代,表,表是,Google,,后者,的,的典型,则,则是,Facebook,。,谷歌的,盈,盈利在,于,于所有,的,的软件,应,应用都,是,是在线,的,的。用,户,户在免,费,费使用,这,这些产,品,品的同,时,时,把,个,个人的,行,行为、,喜,喜好等,信,信息也,免,免费的,送,送给了,Google,。因此,Google,的产品,线,线越丰,富,富,他,对,对用户,的,的理解,就,就越深,入,入,他,的,的广告,就,就越精,准,准。广,告,告的价,值,值就越,高,高。,这是正,向,向的循,环,环,谷,歌,歌好用,的,的、免,费,费得软,件,件产品,,,,换取,对,对用户,的,的理解,;,;通过,精,精准的,广,广告,,找,找到生,财,财之道,。,。颠覆,了,了微软,卖,卖软件,拷,拷贝赚,钱,钱的模,式,式。成,为,为互联,网,网的巨,擘,擘。,互联网,越,越来越,智,智能,Google,精确掌,握,握用户,行,行为、,获,获取需,求,求,微博为,新,新浪带,来,来巨大,价,价值,马云的,判,判断来,自,自于数,据,据分析,“,2008,年初,阿里巴,巴,巴平台,上,上,整个,买家,询盘数,急,急剧下,滑,滑,,,欧美对,中,中国采,购,购在下,滑,滑。海,关,关是卖,了,了货,出去以,后,后再获,得,得数据,;,而我们,提,提前半,年,年时间,从,从询盘,上,上推断,出,出世界,贸,贸易发,生,生变化,了,了,。”,马云对,未,未来的,预,预测,,是,是建立,在,在对用,户,户行文,分,分析的,基,基础上,。,。,通常而,言,言,买,家,家在采,购,购商品,前,前,会,比,比较多,家,家供应,商,商的产,品,品,反,映,映到阿,里,里巴巴,网,网站统,计,计数据,中,中,就,是,是查询,点,点击的,数,数量和,购,购买点,击,击的数,量,量会保,持,持一个,相,相对的,数,数值,,综,综合各,个,个维度,的,的数据,可,可建立,用,用户行,为,为模型,。,。因为,数,数据样,本,本巨大,,,,保证,用,用户行,为,为模型,的,的准确,性,性。因,此,此在这,个,个案例,中,中,询,盘,盘数据,的,的下降,,,,自然,导,导致买,盘,盘的下,降,降。,腾讯在,天,天津投,资,资建立,亚,亚洲最,大,大的数,据,据中心,;,;百度,也,也在投,资,资建立,大,大数据,处,处理中,心,心;新,浪,浪推出,企,企业微,博,博产品,,,,提供,精,精准的,数,数据分,析,析服务,。,。,Gartner 2011,年技術,成,成熟度,曲,曲線,大數據,處,處於高,速,速發展,期,期,技術演,進,進歷史,揭,揭示未,來,來是大,数,数据驅,動,動的智,慧,慧型經,濟,濟模式,什麼才,是,是大數,據,據,?,指数型,增,增长的,海,海量数,据,据,海量數,據,據就是,大,大數據,嗎,嗎,?,大數據,就,就是雲,計,計算嗎,?,大数据,的,的,4V,特性,体量,Volume,多样性,Variety,价值密度,Value,速度,Velocity,非结构化数据,的超大规模和增长,总数据量的,8090%,比结构化数据增长快,10,倍到,50,倍,是传统数据仓库的,10,倍到,50,倍,大数据的异构和多样性,很多不同形式(文本、图像、视频、机器数据),无模式或者模式不明显,不连贯的语法或句义,大量的不相关信息,对未来趋势与模式的可预测分析,深度复杂分析(机器学习、人工智能,Vs,传统商务智能,(,咨询、报告等),实时分析,而非批量式分析,数据输入、处理与丢弃,立竿见影而非事后见效,Value,價值,挖掘大,数,数据的,价,价值类,似,似沙里,淘,淘金,从海量,数,数据中,挖,挖掘稀,疏,疏但珍,贵,贵的信,息,息,.,价值密,度,度低,是大数,据,据的一,个,个典型,特,特征,.,Variety,多樣性,企业内,部,部的经,营,营交易,信,信息,;,物联网,世,世界中,商,商品,物流信,息,息,;,互联网,世,世界中,人,人与人,交,交互信,息,息,位置信,息,息等是,大,大数据,的,的主要,来,来源,.,能够在,不,不同的,数,数据类,型,型中,进行交,叉,叉分析,的,的技术,是大数,据,据的核,心,心技术,之,之一,.,语义分,析,析技术,图文转,换,换技术,模式识,别,别技术,地理信,息,息技术,等,等,都会在,大,大数据,分,分析时,获,获得应,用,用,.,Velocity,速度,1s,是临界,点,点,.,对于大,数,数据应,用,用而言,必须要,在,在,1,秒钟内,形,形成答,案,案,否则处,理,理结果,就,就是过,时,时和无,效,效的,.,实时处,理,理的要,求,求,是区别,大,大数据,引,引用和,传,传统数,据,据仓库,技,技术,BI,技术的,关,关键差,别,别之一,.,Volume,数据量,PB,是大数,据,据層次,的,的临界,点,点,.,KB,-,MB,-,GB,-,TB,-,PB,-,EB,-,ZB,-,YB,-,NB,-,DB,对大数,据,据的進,一,一步理,解,解,大数据,比,比云计,算,算更为,落,落地,商业模,式,式驱动,应用需,求,求驱动,云计算本身也是大数据的一种业务模式,大数据,不,不仅仅,是,是“大,”,”,多大?,PB,级,比,大,更重要,的,的是,数据的,复,复杂性,,有时,甚,甚至大,数,数据中,的,的小数,据,据如一,条,条微博,就,就具有,颠,颠覆性,的,的价值,软件是,大,大数据,的,的引擎,和数据,中,中心(,Data Center,)一样,,软,软件是,大,大数据,的,的驱动,力,力,.,软件改,变,变世界,!,大数据,生,生态,:,软件是,引,引擎,大数据,的,的应用,不,不仅仅,是,是精准,营,营销,通过用,户,户行为,分,分析实,现,现精准,营,营销是,大,大数据,的,的典型,应,应用,,但,但是大,数,数据在,各,各行各,业,业特别,是,是公共,服,服务领,域,域具有,广,广阔的,应,应用前,景,景,消费行,业,业,金融服,务,务,食品安,全,全,医疗卫,生,生,军事,交通环,保,保,电子商,务,务,气象,管理大,数,数据“,易,易”,理解大,数,数据“,难,难”,目前大,数,数据管,理,理多从,架,架构和,并,并行等,方,方面考,虑,虑,解,决,决高并,发,发数据,存,存取的,性,性能要,求,求及数,据,据存储,的,的横向,扩,扩展,,但,但对非,结,结构化,数,数据的,内,内容理,解,解仍缺,乏,乏实质,性,性的突,破,破和进,展,展,这,是,是实现,大,大数据,资,资源化,、,、知识,化,化、普,适,适化的,核,核心,.,非结构化海,量,量信息的智,能,能化处理:,自,自然语言理,解,解、多媒体,内,内容理解、,机,机器学习等,.,大数据为什,么,么重要?,更高一层数,据,据层面整合,企,企业内外部,更高数据层,面,面整合,利用用户,”,行为指纹,”,创造新商机,用户在线的,每,每一次点击,,,,每一次评,论,论,每一个,视,视频点播,,就,就是大数据,的,的典型来源,。,。互联网企,业,业之所以取,得,得令人瞩目,的,的成绩,其,核,核心的本质,就,就是包括用,户,户网络操作,的,的大数据,,进,进行记录和,分,分析,形成,用,用户“行为,指,指纹”,从,而,而洞悉用户,的,的潜在的、,真,真实的需求,,,,形成预判,。,。,这是传统企,业,业花费重金,都,都难以企及,的,的梦想。所,有,有传统的产,品,品公司都只,能,能沦为这种,新,新型用户平,台,台级公司的,附,附庸。,大数据组成,和,和展現方式,?,?,基于,SQL,语言,:,面对,OLAP,的传统行和,列,列,不基于,SQL,或,map-reduce,的,:,由谷歌率先,发,发起,数据流,:,基于运行商,数,数据直接生,成,成任意图形,新平台技术,数据入口,/,汇聚,数据平台,分析,不同范围的服务,传统交付模,式,式,-,单片或基于,设,设备的解决,方,方案,云,:,能够充分利,用,用物理设施,的,的弹性,以,实,实现处理快,速,速增长数据,的,的能力,“数据库将演变成一个虚拟的,基于云计算,超级可扩展的分布式平台。”,-Forrester analyst Jim Kobielus,新的传输方案,新模式和新,技,技术,展现方式,:大型控制,中,中心、移动,终,终端,在多样性、,体,体量、速度,三,三大主要特,征,征的指引下,,,,大数据将,有,有新型的展,现,现方式:大,型,型控制中心,和,和移动终端,,,,实现数据,的,的实时处理,和,和快速决策,。,。,Thanks,
展开阅读全文