资源描述
据数代时之数据化思维之数据化思维据数代时之数据化思维1从抽象到数字结绳记事甲骨文到汉字今天常用的阿拉伯数字2从抽象到数字结绳记事甲骨文到汉字今天常用的阿拉伯数字2数据=4W?Who?谁?When?什么时间?Where?哪?What?做什么?3数据=4W?Who?When?Where?What?3授人以鱼?排名分类回归、时间序列、聚类、分类模糊预测/神经网络决策树、关联、分组、RFM录入,统计,排序数据可视化联机分析处理(OLAP)自动化高维度非线性关系高预测性 查询,SQL用户驱动-手工低维度低预测性ABC、对比、回归、平衡、结构4授人以鱼?排名分类回归、时间序列、聚类、分类模糊预测/神经网革命?石油电力煤炭能源铁器青铜石器材料 计算机网络技术 太空/生物交互云大数据信息5革命?石油电力煤炭能源铁器青铜石器材料 计算机网络技术 太空数据的数字化与构建数据通过网络被使用数据基本分析的应用数据高级分析的应用第一阶段第二阶段第三阶段第四阶段数据的发展6数据的数数据通过数据基本数据高级第一阶段第二阶段第三阶段第四四四“V V”特点特点Volume体量大非结构化数据的规模超大,比结构化数据的增长快10-50倍。Variety多样性强存在很多不同形式(文本、图像、视频、机器数据),无模式或者模式不明显。Velocity速度快实时分析而非批量式分析,数据输入、处理与丢弃,立竿见影而非事后见效。Value价值密度高大量的不相关信息,对未来趋势与模式的可预测分析,深度复杂分析。(机器学习、人工智能)四“V”特点VolumeVarietyVelocityValNews社交财富管理物联网医疗与健康新闻应用领域电子商务搜索智能8News社交财富管理物联网医疗与健康新闻应用领域电子商务搜大数据公司搜索电商软件社交智能.9大数据公司搜索电商软件社交智能.9大数据成功预测冬季流感2009年,Google通过分析5000万条美国人最频繁检索的词汇,将之和美国疾病中心在2003年到2008年间季节性流感传播时期的数据进行比较,并建立一个特定的数学模型。最终google成功预测了2009冬季流感的传播甚至可以具体到特定的地区和州。10大数据成功预测冬季流感2009年,Google通过分析500大数据与乔布斯癌症治疗乔布斯是世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。他得到的不是样本,而是包括整个基因的数据文档。医生按照所有基因按需下药,最终这种方式帮助乔布斯延长了好几年的生命。11大数据与乔布斯癌症治疗乔布斯是世界上第一个对自身所有DNA和大数据成功预测奥斯卡21项大奖2013年,微软纽约研究院的经济学家大卫罗斯柴尔德(DavidRothschild)利用大数据成功预测24个奥斯卡奖项中的19个,成为人们津津乐道的话题。2014年罗斯柴尔德再接再厉,成功预测第86届奥斯卡金像奖颁奖典礼24个奖项中的21个,继续向人们展示现代科技的神奇魔力。12大数据成功预测奥斯卡21项大奖2013年,微软纽约研究院的经大数据经典,啤酒与纸尿裤沃尔玛研究发现,啤酒和尿不湿多为男人在周末采购,而且购买这两种产品的顾客一般都是年龄在25至35周岁的青年男子,由于孩子尚在哺乳期,多数男人都接到了夫人的“圣旨”,下班后带尿不湿回家,而周末正是美国体育比赛的高峰期,一杯啤酒就着比赛是多么惬意的事!对超市的物品摆放进行了调整,将卖场内原来相隔很远的妇婴用品区与酒类饮料区的空间距离拉近,减少顾客的行走时间,将啤酒与尿不湿摆放在一起,同时将牛肉干等一些简便的下酒食品也摆放在一起,这样全年下来,营业额增加了几百万美元。13大数据经典,啤酒与纸尿裤沃尔玛研究发现,啤酒和尿不湿多为男人360手机卫士识别骚扰,诈骗电话360手机卫士这个案例的具体做法是通过对海量数据的运算和精准匹配下发,将一组大小仅为10KB的数据即1000个骚扰号码同步到用户手机上,打造个性化的骚扰号码数据库,此外,每天更新的骚扰号码库数据,会依据标记趋势调整骚扰号码库中各类数据比例,即每一位360手机卫士用户手机中的1000个骚扰号码都是动态的,随地域、身份以及骚扰趋势的变化而变化。14360手机卫士识别骚扰,诈骗电话360手机卫士这个案例的具体大数据引领万物互联的时代15大数据引领万物互联的时代15数据的金字塔模型信息信息知识知识数据数据模型模型决策决策单纯的数据,采集,记录并整理数据通过各种算法加工成信息合并数据进行分析,单一,多维将信息与目的,经营等问题等所作的假设和研究的分析框架联系在一起,导引出一个行动导向的方案16数据的金字塔模型信息知识数据模型决策单纯的数据,采集,记录并数据可以帮助我们长周期走势人群特征成交排名市场细分天联网手机的搜索趋势是怎样的?任一关键词(如商品,区域等)的排名和成交走势。手机达人上海水瓶座浙江爱摄影北京大屏苹果在天联网购买苹果手机是什么样的人?查看不同商品的消费人群特征。30-35岁男土豪30-35岁的土豪老板买什么手机?通过对人群增加不同标签精准分析不同人群的需求。最近七天最火的搜索词,销售型号和品牌是?基于搜索成交的排名榜,数据清晰呈现。17数据可以帮助我们长周期走势人群特征成交排名市场细分天联网手机大数据应用18趋势分析用户分析河南,郑州,35-40,男,土豪,三星高端机型据数大数据应用18趋势分析河南,郑州,35-40,男,土豪,三星Dataanalysis?是把隐没在一大批看起来杂乱无章的数据中的信息,集中、萃取和提炼出来,以找出所研究对象的内在规律,并应用在投资和决策中的分析方法。什么是数据分析?19Data analysis?是把隐没在一大批看起来杂乱无章的认知我们看到这张图片的第一反应是:5个凸的按钮,1个凹的按钮。现在仅仅将图片上下颠倒一下:立即就变成了:1个凸的按钮,5个凹的按钮。20认知我们看到这张图片的第一反应是:5个凸的按钮,1个凹的按钮认识Jul/13Aug/13Sep/13趋势Jul/13Aug/13Sep/13050,000100,000150,000200,000148,510147,322146,945趋势我们看到这张图的第一反应是:?实际上,由于设置Y轴的最小值不同,实际显示的效果也不同。7,8,9月发展平稳。9月业绩大幅下降。21认识我们看到这张图的第一反应是:?实际上,由于设置Y轴的最小我们的大脑聚思维模型是少量善于逻辑分析的人的思维模型,他们善于先自我发散,再筛选可能,然后聚合成靠谱方向,再具体细化。思维是一个漏斗,最后沉淀下来的想法,是经层层筛选的。而能控制自己从发散中提炼的人,是善于控制思维的人,这种人完全可以不依赖思维可视化,就想清楚很多事情。但是事实是大部分是无法做到发散后合理提炼和归纳的,所以这种情况下,还是依赖于方法来进行思维可视化,可视化之后,就方便归纳、整理、提炼、细化了。下面介绍思维可视化的4类模型1.放射状规则2.层次化规则3.线性化规则4.矩阵式规则22我们的大脑聚思维模型是少量善于逻辑分析的人的思维模型,他们善放射状规则之思维导图思维导图又叫心智图,是一种将放射性思考具体化的方法。我们知道放射性思考是人类大脑的自然思考方式,每一种进入大脑的资料,不论是感觉、记忆或是想法包括文字、数字、符码、香气、食物、线条、颜色、意象、节奏、音符等,都可以成为一个思考中心,并由此中心向外发散出成千上万的关节点,每一个关节点代表与中心主题的一个连结,而每一个连结又可以成为另一个中心主题,再向外发散出成千上万的关节点,呈现出放射性立体结构。23放射状规则之思维导图思维导图又叫心智图,是一种将放射性思考具层次化规则之组织架构图这种层次结构图是用来展示清晰的分组信息,表达清晰的组织结构关系的。24层次化规则之组织架构图这种层次结构图是用来展示清晰的分组信息线性化规则之时间线时间线(Timelines)是用来描述在一个时间段里面,发生的所有里程碑性质的事情的,也可以用来基于时间线制定项目计划。过去放在时间线横轴左边,未来放在时间线右边,所有基于时间结点发声的事情和计划发生的事情要进行特别标注。这种方式很用来做里程碑图或者项目计划。25线性化规则之时间线时间线(Timelines)是用来描述在一矩阵式规则之SWOT分析SWOT分析是一种常用的战略分析工具,SWOT分析代表分析企业优势(strength)、劣势(weakness)、机会(opportunity)和威胁(threats)。因此,SWOT分析实际上是将对企业内外部条件各方面内容进行综合和概括,进而分析组织的优劣势、面临的机会和威胁的一种方法。可以通过分析帮助企业把资源和行动Focus在自己的强项和有最多机会的地方。26矩阵式规则之SWOT分析SWOT分析是一种常用的战略分析工具总结分享是快乐的!做数据我们是认真的!27总结分享是快乐的!27Next/下节课流量的秘密Next/下节课
展开阅读全文