资源描述
学员使用EXCEL的熟练程度学员对数理统计的熟悉程度议程利用EXCEL分析数据常用统计软件数据挖掘常用统计方法:描述统计 假设检验 方差分析 回归分析利用EXCEL分析数据常用图和表:折线图,饼图,面积图,频数表和柱状图,散点图,时间序列 数据透视图常用简单的统计命令:AVERAGE,VAR,STDEV,MODE,MEDIAN,SUM,SUMIF,SUMPRODUCT,COUNT,COUNTIF,MAX,MIN,QUARTILE,PERCENTILE利用EXCEL分析数据-折线图折线图:显示随时间或类别而变化的趋势线折线图类型利用EXCEL分析数据-饼图饼图:显示每一数值相对于总数值的大小,分离饼图强调单个数值的大小饼图类型利用EXCEL分析数据-面积图面积图:显示每一数值所占大小随时间或类别而变化的趋势线面积图类型利用EXCEL分析数据:-柱状图柱状图:比较相交于类别轴上的数值大小;堆积柱状图:比较相交于类别轴上的每一数值相对于总数值的大小柱状图类型条形图类型条形图也可用一种类似的方法显示数据,仅仅是将垂直方向换成水平方法而已。堆积条形图可以在同一个条上连续地显示各种数据,而不像簇状条形图那样把条并列在一起显示数据。频数分析和直方图频数分布表指,在不同的类别里发生了多少次观测值直方图通过图形的方式表达了同样信息。直方图的应用举例来自Shoes.xls利用EXCEL分析数据-散点图散点图:比较成对的数值。散点图类型利用散点图的关系分析 我们经常关心两个变量之间的关系。一个非常有用的显示这个关系的方法是对每一个观测值都在图上作一个点,这个点的坐标代表了两个相关变量的值。结果产生的图就是散点图。通过检查散点的分布,我们可以查看两个变量之间有没有什么关系,如果有,是什么样的关系。来自Actors.xls例5:时间序列制图 时间序列图的本质是散点图,时间序列变量在纵轴,时间变量在横轴。同时为了分布的趋势更加清晰,这些点通常是通过线连接在一起。来自Toys.xls例6:练习:分析某某区近期得业务状况分析指标:总收件票数,日均收件票数,日人均效能要求:各指标逐月变化情况 各指标的相关性 各分部的票数占该区总票数的比例变化数据透视图数据透视图报表是一种具有图表格式的交互式数据汇总报表,是一个Excel功能很强大,而且易于使用的工具。这个工具提供了大量有用的信息,可以让我们可以从不同角度切割,就是可以把数据分成一些子集。数据透视表的创建与常规的 Microsoft Excel 图表不同。在创建数据透视图报表后,您还可以通过拖动其字段和项目来查看不同层次的明细数据或重新组织图表的版式。例7:Accounting Professionals.xls 数据集来自Accounting Professionals.xls创建数据透视图的步骤选择数据范围确定所要创建表格的类型确定字段设置选择报表格式选择读取方式数据透视表的优点在于:如果想要改分析,可以仅仅将带有阴影的变量名拖出透视表,并用其他变量代替,你能轻易地在字段域中增加多个变量来创建不同的数据图。创建数据透视图的优点利用EXCEL分析数据常用图和表:折线图,饼图,面积图,频数表和柱状图,散点图,时间序列 数据透视图常用简单的统计命令:AVERAGE,VAR,STDEV,MODE,MEDIAN,SUM,SUMIF,SUMPRODUCT,COUNT,COUNTIF,MAX,MIN,QUARTILE,PERCENTILE平均值 平均值:是某个变量所有值的平均数。如果数据代表了一个大量数据的样本,我们就叫他样本均值。如果是对象是整体分析,就是整体均值。公式:Excel命令:=AVERAGE()n ni i=1 1 i i=n n四分位数和百分比 Excel命令:QUARTILE(salary,1):返回一组数据的四分位点 PERCENTILE(salary,.05):返回一组数据的K百分比的数值点 最小值、最大值 Excel命令:MAX(number1,number2):返回一组数据的最大值,忽略文本MIN(number1,number2):返回一组数据的最小值,忽略文本方差描述样本数据的离散程度公式:Excel命令:VAR(supplied)STDEV(supplied)2 2=n ni i =1 1(i i )2 2n n计算均值,中位数,众数,方差举例Range namesSupplier1:A4:A14Supplier2:B4:B14来自Otis4.xls相关分析用于反映分析变量间的密切程度相关系数度量的是两个间隔尺度变量之间线性关联关系的程度。正的相关系数表示一个变量的较大值和另一个变量的较大值是联系在一起的。而负的相关系数则表示一个变量的较大值和另一个变量的较小值之间具有的关联关系。相关分析举例来自Expenses.xls相关分析举例 用于运动的支出与用于文化的支出的关系负相关散点图$0$200$400$600$800$1,000$1,200$1,400$1,600$1,800$0$500$1,000$1,500$2,000运动文化来自Expenses.xls来自Expenses.xls相关分析举例 收入与用于文化的支出的关系相关分析举例 相关系数与协方差来自Expenses.xls数据分析的常用软件MINITABSPSSEXCEL-XLSTAT议程利用EXCEL分析数据常用统计软件数据挖掘常用统计方法:描述统计 假设检验 方差分析 回归分析数据挖掘(Data Mining)什么是Data Mining?Data Mining的应用Data Mining 算法包括:预测(Prediction)分类(Classification)联系(Association)回归(Regression)什么是Data Mining?通过采用自动或半自动的手段,从大量数据中提取出可信、新颖、有效并能被人理解的信息的高级处理过程按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法数据挖掘能够帮助你选择正确瞄准潜在目标,向现有的客户提供额外的产品,识别那些准备离开的好客户发现最有价值的客户数据挖掘的作用使组合销售更有效率数据挖掘的作用留住那些最有价值的客户数据挖掘的作用用更小的成本发现欺诈现象数据挖掘的作用数据挖掘应用领域电信:流失银行:聚类(细分),交叉销售百货公司/超市:购物篮分析(关联规则)保险:细分,交叉销售,流失(原因分析)信用卡:欺诈探测,细分电子商务:网站日志分析税务部门:偷漏税行为探测警察机关:犯罪行为分析医学:医疗保健议程利用EXCEL分析数据常用统计软件数据挖掘常用统计方法:描述统计 假设检验 方差分析 回归分析假设检验涉及对总体参数数值有关的两个命题(假设)作推断步骤 提出待检验的假设 选择显著性水平 确定一个作结论的判断准则 收集数据并计算检验统计量 用决策法则检验统计量并得出结论假设检验包括:t 检验和z 检验方差分析(ANOVA)单因素方差分析单因素方差分析:通过简单的方差分析,对两个以上样本平均值进行相等性假设检验(样本取自具有相同平均值的样本总体)。此方法是对双平均值检验(如 t-检验)的扩充。可重复双因素分析可重复双因素分析 :对单因素方差分析的扩展,即每一组数据包含不止一个样本。无重复双因素分析无重复双因素分析:通过双因素方差分析(但每组数据只包含一个样本),对两个以上样本均值进行相等性假设检验(样本取自具有相同平均值的样本总体)。此方法是对双平均值检验(如 t-检验)的扩充。回归分析回归分析是一种用于两个或两个以上变量之间建立关系的统计技术在回归分析里,要在分析所感兴趣的变量-因变量或相应变量与一个或几个字变量或预测变量之间建立关系回归分析的目标,是建立一个回归模型或一个预测方程,使因变量能与那一个或几个自变量联系起来。这样回归模型就可以用来凭借这些自变量描述预测和控制因变量。包括:简单回归模型、多元回归模型讨论讨论9、静夜四无邻,荒居旧业贫。22.8.222.8.2Tuesday,August 02,202210、雨中黄叶树,灯下白头人。17:58:5917:58:5917:588/2/2022 5:58:59 PM11、以我独沈久,愧君相见频。22.8.217:58:5917:58Aug-222-Aug-2212、故人江海别,几度隔山川。17:58:5917:58:5917:58Tuesday,August 02,202213、乍见翻疑梦,相悲各问年。22.8.222.8.217:58:5917:58:59August 2,202214、他乡生白发,旧国见青山。2022年8月2日星期二下午5时58分59秒17:58:5922.8.215、比不了得就不比,得不到的就不要。2022年8月下午5时58分22.8.217:58August 2,202216、行动出成果,工作出财富。2022年8月2日星期二17时58分59秒17:58:592 August 202217、做前,能够环视四周;做时,你只能或者最好沿着以脚为起点的射线向前。下午5时58分59秒下午5时58分17:58:5922.8.29、没有失败,只有暂时停止成功!。22.8.222.8.2Tuesday,August 02,202210、很多事情努力了未必有结果,但是不努力却什么改变也没有。17:58:5917:58:5917:588/2/2022 5:58:59 PM11、成功就是日复一日那一点点小小努力的积累。22.8.217:58:5917:58Aug-222-Aug-2212、世间成事,不求其绝对圆满,留一份不足,可得无限完美。17:58:5917:58:5917:58Tuesday,August 02,202213、不知香积寺,数里入云峰。22.8.222.8.217:58:5917:58:59August 2,202214、意志坚强的人能把世界放在手中像泥块一样任意揉捏。2022年8月2日星期二下午5时58分59秒17:58:5922.8.215、楚塞三湘接,荆门九派通。2022年8月下午5时58分22.8.217:58August 2,202216、少年十五二十时,步行夺得胡马骑。2022年8月2日星期二17时58分59秒17:58:592 August 202217、空山新雨后,天气晚来秋。下午5时58分59秒下午5时58分17:58:5922.8.29、杨柳散和风,青山澹吾虑。22.8.222.8.2Tuesday,August 02,202210、阅读一切好书如同和过去最杰出的人谈话。17:58:5917:58:5917:588/2/2022 5:58:59 PM11、越是没有本领的就越加自命不凡。22.8.217:58:5917:58Aug-222-Aug-2212、越是无能的人,越喜欢挑剔别人的错儿。17:58:5917:58:5917:58Tuesday,August 02,202213、知人者智,自知者明。胜人者有力,自胜者强。22.8.222.8.217:58:5917:58:59August 2,202214、意志坚强的人能把世界放在手中像泥块一样任意揉捏。2022年8月2日星期二下午5时58分59秒17:58:5922.8.215、最具挑战性的挑战莫过于提升自我。2022年8月下午5时58分22.8.217:58August 2,202216、业余生活要有意义,不要越轨。2022年8月2日星期二17时58分59秒17:58:592 August 202217、一个人即使已登上顶峰,也仍要自强不息。下午5时58分59秒下午5时58分17:58:5922.8.2MOMODA POWERPOINTLorem ipsum dolor sit amet,consectetur adipiscing elit.Fusce id urna blandit,eleifend nulla ac,fringilla purus.Nulla iaculis tempor felis ut cursus.感 谢 您 的 下 载 观 看感 谢 您 的 下 载 观 看专家告诉
展开阅读全文