数据分析方法与案例课件

上传人:仙*** 文档编号:241898931 上传时间:2024-08-03 格式:PPT 页数:78 大小:1.29MB
返回 下载 相关 举报
数据分析方法与案例课件_第1页
第1页 / 共78页
数据分析方法与案例课件_第2页
第2页 / 共78页
数据分析方法与案例课件_第3页
第3页 / 共78页
点击查看更多>>
资源描述
数据分析数据分析(方法与案例方法与案例)作者作者 贾俊平贾俊平统计学统计学统统 计计 学学数据分析(方法与案例)作者 贾俊平统计学统 计 2-2统计学统计学STATISTICS(第五版第五版)图并没有说谎,是说谎者在画图。Benjamin Disraeli 统计名言统计名言*图并没有说谎,是说谎者在画图。统计名言*第第 2 章章 用图表展示数据用图表展示数据2.1 用图表展示定性数据用图表展示定性数据 2.2 用图表展示定量数据用图表展示定量数据 2.3 合理使用图表合理使用图表第 2 章 用图表展示数据2.1 用图表展示定性数据2-4统计学统计学STATISTICS(第五版第五版)学习目标学习目标l定性数据的频数分布表定性数据的频数分布表l定性数据的图示方法定性数据的图示方法l定量数据的频数分布表定量数据的频数分布表l定量数据的图示方法定量数据的图示方法l用用Excel和和SPSS作作频数分布表和频数分布表和图图形形l合理使用图表合理使用图表*学习目标定性数据的频数分布表*2-5统计学统计学STATISTICS(第五版第五版)用哪些图形展示奖牌?用哪些图形展示奖牌?20092009年年7 7月月2626日日至至8 8月月3 3日日第第1313届届世世界界游游泳泳锦锦标标赛赛在在意意大大利利罗罗马马举举行行。美美国国的的泳泳坛坛霸霸主主地地位位难难以撼动,中国军团也创造了史上第二的佳绩以撼动,中国军团也创造了史上第二的佳绩在在本本届届游游泳泳世世锦锦赛赛上上,中中国国代代表表团团取取得得金金牌牌数数和和奖奖牌牌与与美美国国并并列列第第一一、奖奖牌牌榜榜排排名名第第二二的的好好成成绩绩,而而且且中中国国男男子子游游泳泳首首次次夺夺得得世世界界性性大大赛赛的的冠冠军军并并一一举举打打破破世世界界纪纪录录。本本届届游游泳泳世世锦锦赛赛共共设设有有奖奖牌牌227227枚枚,其其中中金金牌牌7575枚枚、银银牌牌7575枚枚、铜铜牌牌7777枚枚。下下表表是是本本届届游游泳泳世世锦锦赛赛金金牌牌总总数数取取得前三名的国家所获得奖牌的分布情况得前三名的国家所获得奖牌的分布情况 *用哪些图形展示奖牌?2009年7月26日至8月3日第13届世2-6统计学统计学STATISTICS(第五版第五版)用哪些图形展示奖牌?用哪些图形展示奖牌?根据上面的数据,你认为可以选择哪些图形来展示三个国家所获得的奖牌情况?学完本章的图表展示技术,这样的问题就会迎刃而解*用哪些图形展示奖牌?根据上面的数据,你认为可以选择哪些图形来2-7统计学统计学STATISTICS(第五版第五版)统计应用统计应用把数据画图之后,要用用脑袋把数据画图之后,要用用脑袋沃沃德德(Abraham(Abraham Wald)Wald)和和许许多多统统计计学学家家一一样样,在在第第二二次次世世界界大大战战时时也也处处理理了了战战争争与与相相关关的的问问题题。他他发发明明的的一一些些统统计计方方法法在在战战时时被被视视为为军军事事机机密密。以以下下是是他他提提出出的概念中较简单的一种的概念中较简单的一种沃沃德德被被咨咨询询飞飞机机上上什什么么部部位位应应该该加加强强钢钢板板时时,开开始始研研究究从从战战役役中中返返航航的的军军机机上上受受敌敌军军创创伤伤的的弹弹孔孔位位置置。他他画画了了飞飞机机的的轮轮廓廓,并并且且标标识识出出弹弹孔孔的的位位置置。资资料料累累积积一一段段时时间间后后,几几乎乎把把机机身身各各部部位位都都填填满满了了。于于是是沃沃德德建建议议,把把剩剩下下少少数数几几个个没没有有弹弹孔孔的的部部位位补补强强。因因为为这这些些部部位位被被击中的飞机都没有返航击中的飞机都没有返航资料来源:资料来源:David David S.MrooreS.Mroore*统计应用把数据画图之后,要用用脑袋沃德(Abraham W2.1 用图表展示定性数据用图表展示定性数据 2.1.1 生成频数分布表生成频数分布表 2.1.2 定性数据的图示定性数据的图示第第 2 章章 用图表展示数据用图表展示数据2.1 用图表展示定性数据第 2 章 用图表展示数据2.1.1 生成频数分布表生成频数分布表2.1 用图表展示定性数据用图表展示定性数据2.1.1 生成频数分布表2.1 用图表展示定性数据2-10统计学统计学STATISTICS(第五版第五版)生成频数分布表生成频数分布表(定性数据定性数据)1.列出各类别 2.2.计算各类别的频数3.生成频数分布表分类分类频数频数比例比例百分比百分比比率比率ABCDE*生成频数分布表(定性数据)1.列出各类别2-11统计学统计学STATISTICS(第五版第五版)定性数据的描述统计量定性数据的描述统计量1.频数频数(frequency):落在各类别中的数据个数2.比例比例(proportion):某一类别数据个数占全部数据个数的比值3.百分比百分比(percentage):将对比的基数作为100而计算的比值4.比率比率(ratio):不同类别数值个数的比值*定性数据的描述统计量频数(frequency):落在各类别2-12统计学统计学STATISTICS(第五版第五版)生成频数分布表生成频数分布表(定性数据定性数据)【例例例例2-12-1】为为研研究究人人们们对对不不同同类类型型软软饮饮料料的的偏偏好好情情况况,一一家家调调查查公公司司在在某某超超市市随随机机调调查查了了5050名名消消费费者者。右右表表是是顾顾客客性性别别及及其其所所偏偏好好的的饮饮料料类类型型记记录录。生生成成频频数数分分布布表表,观观察察不不同同性性别别的的消消费费者者及及其其所所偏偏好好的的饮饮料料类类型型的的分分布布状状况况,并进行描述性分析并进行描述性分析 制作频数分布表制作频数分布表制作频数分布表制作频数分布表*生成频数分布表(定性数据)【例2-1】为研究人们对不同类型2-13统计学统计学STATISTICS(第五版第五版)使用使用Excel数据透视表计数数据透视表计数(pivot table)第第第第1 1步:步:步:步:选择选择【数据数据数据数据】菜单中的菜单中的【数据透视表和数据透视图数据透视表和数据透视图数据透视表和数据透视图数据透视表和数据透视图】第第第第2 2步:步:步:步:确定数据源区域确定数据源区域(在操作前将光标放在任意数据单元格在操作前将光标放在任意数据单元格 内,系统会自动选定数据源区域内,系统会自动选定数据源区域)第第第第3 3步:步:步:步:在在【向导向导33步骤之步骤之3 3】中选择数据透视表的输出位中选择数据透视表的输出位 置,然后选择置,然后选择【布局布局】第第第第4 4步步步步:在在【向向导导布布局局】对对话话框框中中,依依次次将将“饮饮料料类类型型”拖拖至左至左 边边的的“行行”(或或列列)区区域域,将将“顾顾客客性性别别”拖拖至至 “列列”(或或 行行)区域,将区域,将“饮料类型饮料类型”拖至拖至“数据数据”区域。区域。第第第第5 5步:步:步:步:单击单击【确定确定】,自动返回,自动返回【向导向导33步骤之步骤之3 3】对话对话 框。单击框。单击【完成完成】用数据透视表生成定性数据的频数分布用数据透视表生成定性数据的频数分布用数据透视表生成定性数据的频数分布用数据透视表生成定性数据的频数分布表表表表*使用Excel数据透视表计数(pivot table)第2-14统计学统计学STATISTICS(第五版第五版)生成频数分布表生成频数分布表(列联表列联表Excel)不同类型饮料和不同性别消费者的频数分布不同类型饮料和不同性别消费者的频数分布不同类型饮料和不同性别消费者的频数分布不同类型饮料和不同性别消费者的频数分布 用数据透视表生成定性数据的频数分布用数据透视表生成定性数据的频数分布用数据透视表生成定性数据的频数分布用数据透视表生成定性数据的频数分布*生成频数分布表(列联表Excel)不同类型饮料和不同性别2-15统计学统计学STATISTICS(第五版第五版)用用SPSS生成定性数据的频数分布表生成定性数据的频数分布表(单变量频数分布表单变量频数分布表)第第第第1 1步:步:步:步:选择选择【分析分析分析分析】【描述统计描述统计描述统计描述统计频率频率频率频率】进入主进入主 对话框对话框第第第第2 2步:步:步:步:将将“饮料类型饮料类型”或或“顾客性别顾客性别”选入选入 【变量变量变量变量】;选中;选中【显示频率表格显示频率表格显示频率表格显示频率表格】第第第第3 3步步步步 (若需要描述统计量或图形若需要描述统计量或图形)主点主点【统计量统计量统计量统计量】或或【图表图表图表图表】,并选择相应的选项。点击,并选择相应的选项。点击 【确定确定确定确定】生成频数分布表生成频数分布表生成频数分布表生成频数分布表*用SPSS生成定性数据的频数分布表(单变量频数分布表)第12-16统计学统计学STATISTICS(第五版第五版)生成频数分布表生成频数分布表(定性数据定性数据SPSS)生成频数分布表生成频数分布表生成频数分布表生成频数分布表*生成频数分布表(定性数据SPSS)生成频数分布表SPSS2-17统计学统计学STATISTICS(第五版第五版)用用SPSS生成定性数据的列联表生成定性数据的列联表(Crosstabulation交叉表交叉表)第第第第1 1步步步步:选选择择【分分分分析析析析】【描描描描述述述述统统统统计计计计-交交交交叉叉叉叉表表表表】进进入入主主对对话话框框第第第第2 2步:步:步:步:将将“饮料类型饮料类型”选入选入【行行行行】,将,将“顾客性别顾客性别”选选 入入【列列列列】(行列可以互换行列可以互换)第第第第3 3步:步:步:步:(若需要对列联表进行描述性分析若需要对列联表进行描述性分析)点击点击 【单元格单元格单元格单元格】,在,在【百分比百分比百分比百分比】下选中需要的统计下选中需要的统计 量,如量,如【行行行行】、【列列列列】、【总计总计总计总计】等;等;(若若 需要图形需要图形)点击点击【复式条形图复式条形图复式条形图复式条形图】。点击点击【确定确定确定确定】生成交叉频数分布表生成交叉频数分布表生成交叉频数分布表生成交叉频数分布表*用SPSS生成定性数据的列联表(Crosstabulat2-18统计学统计学STATISTICS(第五版第五版)列联表的描述性分析列联表的描述性分析(例题分析例题分析SPSS)列列列列联联联联表表表表的的的的统统统统计计计计描描描描述述述述 *列联表的描述性分析(例题分析SPSS)列联表的统计描述 2-19统计学统计学STATISTICS(第五版第五版)列联表的描述性分析列联表的描述性分析(例题分析例题分析SPSS)列联表的统计描述列联表的统计描述列联表的统计描述列联表的统计描述 *列联表的描述性分析(例题分析SPSS)列联表的统计描述 2-20统计学统计学STATISTICS(第五版第五版)数据透视表数据透视表(pivot table)1.可以从复杂的数据中提取有用的信息可以从复杂的数据中提取有用的信息2.可可以以对对数数据据表表的的重重要要信信息息按按使使用用者者的的习习惯惯或或分分析析要求进行汇总和作图要求进行汇总和作图3.形成一个符合需要的交叉表形成一个符合需要的交叉表(列联表列联表)4.在在利利用用数数据据透透视视表表时时,数数据据源源表表中中的的首首行行必必须须有有列标题列标题数据透视表数据透视表数据透视表数据透视表*数据透视表(pivot table)可以从复杂的数据中提取2-21统计学统计学STATISTICS(第五版第五版)生成频数分布表生成频数分布表(列联表列联表Excel)大学生生活费支出的频数分布大学生生活费支出的频数分布大学生生活费支出的频数分布大学生生活费支出的频数分布 *生成频数分布表(列联表Excel)大学生生活费支出的频数2.1.2 定性数据的图示定性数据的图示2.1 用图表展示定性数据用图表展示定性数据2.1.2 定性数据的图示2.1 用图表展示定性数据2-23统计学统计学STATISTICS(第五版第五版)条形图条形图(bar Chart)1.1.用宽度相同的条形的高度或长短来表示各类别数据用宽度相同的条形的高度或长短来表示各类别数据2.2.各各类类别别可可放放在在纵纵轴轴,称称为为条条条条形形形形图图图图,可可以以放放在在横横轴轴,称称为为柱柱柱柱形图形图形图形图(column chart)(column chart)*条形图(bar Chart)用宽度相同的条形的高度或长短来2-24统计学统计学STATISTICS(第五版第五版)复式条形图复式条形图(bar Chart)饮料类型和消费者性别的条形图饮料类型和消费者性别的条形图(SPSS(SPSS的输出的输出)*复式条形图(bar Chart)饮料类型和消费者性别的条形2-25统计学统计学STATISTICS(第五版第五版)帕累托图帕累托图(pareto chart)1.1.按按各各类类别别数数据据出出现现的的频频数数多多少少排排序序后后绘绘制制的的条条形形图图 2.2.用用于于展展示示分分类类数数据据的的分布分布*帕累托图(pareto chart)按各类别数据出现的频数2-26统计学统计学STATISTICS(第五版第五版)简单饼图简单饼图(pie Chart)用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数 据 的 比 例用于研究结构问题*简单饼图(pie Chart)用圆形及圆内扇形的角度来2-27统计学统计学STATISTICS(第五版第五版)环形图环形图(doughnut chart)1.环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示2.与饼图类似,但又有区别n n饼图只能显示一个总体各部分所占的比例n n环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环3.用于结构比较研究*环形图(doughnut chart)环形图中间有一个“空2-28统计学统计学STATISTICS(第五版第五版)环形图环形图(doughnut chart)【例例例例2-22-2】20192019年年北北京京、天天津津、上上海海和和重重庆庆地地区区按按收收入入法法计计算算的的地地区区生生产产总总值值(按按当当年年价价格格计计算算)数数据据。绘制环形图比较四个地区的生产总值构成绘制环形图比较四个地区的生产总值构成 绘制环形图绘制环形图绘制环形图绘制环形图*环形图(doughnut chart)【例2-2】20192-29统计学统计学STATISTICS(第五版第五版)环形图环形图(doughnut chart)北京、天津、上海和重庆地区按收入法计算的地区生产总值北京、天津、上海和重庆地区按收入法计算的地区生产总值北京、天津、上海和重庆地区按收入法计算的地区生产总值北京、天津、上海和重庆地区按收入法计算的地区生产总值*环形图(doughnut chart)北京、天津、上海2.2 用图表展示定量数据用图表展示定量数据 2.2.1 生成频数分布表生成频数分布表 2.2.2 定量数据的图示定量数据的图示第第 2 章章 用图表展示数据用图表展示数据2.2 用图表展示定量数据第 2 章 用图表展示数据2.2.1 生成频数分布表生成频数分布表2.2 用图表展示定量数据用图表展示定量数据2.2.1 生成频数分布表2.2 用图表展示定量数据2-32统计学统计学STATISTICS(第五版第五版)生成频数分布表生成频数分布表(例题分析例题分析)【例例例例2-32-3】某某电电脑脑公公司司120120天天的的销销售售额额数数据据(单单位位:万万元元)。生生成成一一张张频频数数分分布布表表观观察察销销售售额分布的特征额分布的特征*生成频数分布表(例题分析)【例2-3】某电脑公司120天的2-33统计学统计学STATISTICS(第五版第五版)生成频数分布表生成频数分布表(例题分析例题分析)1.1.确确定定组组数数:组组数数的的确确定定应应以以能能够够显显示示数数据据的的分分布布特特征征为为目目的的。一一一一般般般般来来来来说说说说,组组组组数数数数大大大大致致致致等等等等于于于于样样样样本本本本量量量量的的的的平平平平方方方方根根根根比比比比较合适较合适较合适较合适。本例可考虑分为。本例可考虑分为1010组组 2.2.确确定定组组距距:组组距距(Class(Class Width)Width)是是一一个个组组的的上上限限与与下下限限之之差差,可可根根据据全全部部数数据据的的最最大大值值和和最最小小值值及及所所分分的的组组数来确定,即数来确定,即 组距组距组距组距(最大值最大值最大值最大值 -最小值最小值最小值最小值)组数组数组数组数 例例如如,本本例例最最大大值值为为237237,最最小小值值为为141141,组组距距=(237-141)10=(237-141)109.69.6。为为便便于于计计算算,组组距距宜宜取取5 5或或1010的的倍倍数数,且且第第一一组组的的下下限限应应低低于于最最小小变变量量值值,最最后后一一组的上限应高于最大变量值,因此组距可取组的上限应高于最大变量值,因此组距可取10 10 3.3.统统计计出出各各组组的的频频数数。每每个个组组的的数数据据满满足足a a x xb(b(上上限限值不在内值不在内(Excel(Excel的计数规则是的计数规则是aa-输输出出变变量量】,并并在在【输输出出变变量量】【名名称称】中中写写入入输输出出变变量量的的名名称称(如如“分分组组区区间间”),单单击击【更更改改】第第第第三三三三步步步步:单单击击【新新值值和和旧旧值值】。在在【旧旧值值】下下单单击击【范范围围】,并并写写入入分分组组区区间间的的下下限限和和上上限限值值(注注意意,计计数数时时每每个个组组包包含含下下限限和和上上限限值值,即即a a=X X=b=b)。单单击击【输输出出变变量量为为字字符符串串】。在在【新新值值】后后输输入入分分组组的的区区间间,如如140-150140-150等等(注注意意:为为了了和和传传统统的的统统计计分分组组相相适适应应,这这里里不不包包含含上上限限值值。也也可可以以输输入入140-149140-149等等),并并单单击击【增增加加】重重复复上上一一步步骤骤,直直至至将将所所有有分分组组区区间间增增加加完完毕毕。单单击击【继继续续】。单单击击【确确定定】(此此时时“分分组组区区间间”变变量量会会保保存存在在SPSSSPSS的的【数数据视图据视图】窗口中窗口中)第第第第四四四四步步步步:单单击击【分分析析】【描描述述统统计计】【频频率率】。将将分分组组区区间间变变量量选选入入【变变量量】。单单击击【确确定定】(注注:在在【频频率率】中中选选择择【图图表表】可可以绘制条形图,修改条形图的宽度至以绘制条形图,修改条形图的宽度至100%100%即为直方图即为直方图)*用SPSS生成分组数据频数分布表(命令:重新编码为不同变量2-38统计学统计学STATISTICS(第五版第五版)用用SPSS生成频数分布表生成频数分布表(命令:重新编码为不同变量命令:重新编码为不同变量)*用SPSS生成频数分布表(命令:重新编码为不同变量)*2-39统计学统计学STATISTICS(第五版第五版)用用SPSS生成分组数据频数分布表生成分组数据频数分布表(命令:可视离散化命令:可视离散化)第一步:第一步:第一步:第一步:点击点击【转换转换】【可视离散化可视离散化】第二步:第二步:第二步:第二步:将变量选入将变量选入【要离散的变量要离散的变量】,单击单击【继续继续】第第第第三三三三步步步步:在在【离离散散的的变变量量】后后输输入入离离散散后后要要保保存存的的变变量量名名称称,如如“所所属属组组别别”。单单击击【生生成成分分割割点点】,在在【第第一一个个分分割割点点】后后输输入入第第一一组组的的上上限限值值,如如149149(注注意意,隐隐含含为为【包包含含】,计计数数时时每每个个组组包包含含下下限限和和上上限限值值,即即a a=X X=b=b;如如果果输输入入上上限限值值为为150150,则则应应该该选选择择【排排除除】);在在【分分割割点点数数量量】后后输输入入要要分分的的组组数数,如如1010;在在【宽宽度度】后后输输入入分分组组的的组组距距,如如1010。单击。单击【应用应用】返回主对话框,并单击返回主对话框,并单击【生成标签生成标签】。单击。单击【确定确定】(注注:也也可可以以直直接接在在【网网格格】【值值】中中输输入入组组的的上上限限值值,在在【标标签签】中中输入分组的区间。这样比较麻烦,不推荐使用输入分组的区间。这样比较麻烦,不推荐使用)第第第第四四四四步步步步:单单击击【分分析析】【描描述述统统计计】【频频率率】。将将“所所属属组组别别”变变量量选选入入【变变量量】。单单击击【确确定定】(注注:在在【频频率率】中中选选择择【图图表表】可可以以绘绘制制条条形图,修改条形图的宽度至形图,修改条形图的宽度至100%100%即为直方图即为直方图)*用SPSS生成分组数据频数分布表(命令:可视离散化)第一步2-40统计学统计学STATISTICS(第五版第五版)用用SPSS生成频数分布表生成频数分布表(命令:重新编码为不同变量命令:重新编码为不同变量)*用SPSS生成频数分布表(命令:重新编码为不同变量)*2.2.2 定量数据的图示定量数据的图示2.2 用图表展示定量数据用图表展示定量数据Excel2.2.2 定量数据的图示2.2 用图表展示定量数据2-42统计学统计学STATISTICS(第五版第五版)分组数据看分布分组数据看分布直方图直方图(histogram)1.用于展示分组数据分布的一种图形2.用矩形的宽度和高度来表示频数分布n本质上是用矩形的本质上是用矩形的面积面积面积面积来表示频数分布来表示频数分布3.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数或频率就形成了一个矩形,即直方图*分组数据看分布直方图(histogram)用于展示分组数2-43统计学统计学STATISTICS(第五版第五版)分组数据看分布分组数据看分布直方图直方图(SPSS绘制的直方图绘制的直方图)绘制直方图绘制直方图绘制直方图绘制直方图*分组数据看分布直方图(SPSS绘制的直方图)绘制直方2-44统计学统计学STATISTICS(第五版第五版)分组数据看分布分组数据看分布直方图直方图(直方图与条形图的区别直方图与条形图的区别)1.条形图中的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距2.由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列3.条形图主要用于展示定性数据,而直方图则主要用于展示定量数据*分组数据看分布直方图(直方图与条形图的区别)条形图中的每2-45统计学统计学STATISTICS(第五版第五版)未分组数据看分布未分组数据看分布茎叶图茎叶图(stem-and-leaf plot)1.1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.2.由由“茎茎”和和“叶叶”两两部部分分构构成成,其其图图形形是是由由数数字字组组成的成的3.3.以该组数据的高位数值作树茎,低位数字作树叶以该组数据的高位数值作树茎,低位数字作树叶4.4.树叶上只保留最后一位数字树叶上只保留最后一位数字5.5.茎叶图类似于横置的直方图,但又有区别茎叶图类似于横置的直方图,但又有区别 直直方方图图可可观观察察一一组组数数据据的的分分布布状状况况,但但没没有有给给出出具具体体的的数值数值 茎茎叶叶图图既既能能给给出出数数据据的的分分布布状状况况,又又能能给给出出每每一一个个原原始始数值,保留了原始数据的信息数值,保留了原始数据的信息 直方图适用于大批量数据,茎叶图适用于小批量数据直方图适用于大批量数据,茎叶图适用于小批量数据*未分组数据看分布茎叶图(stem-and-leaf pl2-46统计学统计学STATISTICS(第五版第五版)未分组数据看分布未分组数据看分布茎叶图茎叶图(例题分析例题分析)某电脑公司销售额分布的茎叶图某电脑公司销售额分布的茎叶图某电脑公司销售额分布的茎叶图某电脑公司销售额分布的茎叶图*未分组数据看分布茎叶图(例题分析)某电脑公司销售额分布的2-47统计学统计学STATISTICS(第五版第五版)未分组数据看分布未分组数据看分布茎叶图茎叶图(例题分析例题分析)第第一一列列给给出出每每个个茎上叶子的频数茎上叶子的频数 第第二二列列是是“茎茎”,第第三三列列是是“叶叶”下下面面标标出出了了1 1个个极极 端端 值值 237237、茎茎的的宽宽度度1010、每每个个叶叶代代表表一一个个数数据据(案例案例)SPSSSPSS自自 动动 将将 每每个个茎茎重重复复了了一一次次,使使分分布布的的细细节节看看的的更更清清楚楚一一些些。当当然然,在在数数据据较较少少时时茎茎的的数数值值也也可以不重复可以不重复 *未分组数据看分布茎叶图(例题分析)第一列给出每个茎上叶2-48统计学统计学STATISTICS(第五版第五版)未分组数据看分布未分组数据看分布箱线图箱线图(box plot)1.1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.2.箱箱线线图图是是由由一一组组数数据据的的最最大大值值(maximum)(maximum)、最最小小值值(minimum)(minimum)、中中 位位 数数(median)(median)、两两 个个 四四 分分 位位 数数(quartiles)(quartiles)这这5 5个值绘制而成的个值绘制而成的n n中位数是一组数据排序后处于中间位置上的变量值中位数是一组数据排序后处于中间位置上的变量值n n四四分分位位数数是是一一组组数数据据排排序序后后处处在在数数据据25%25%位位置置和和75%75%位位置上的两个分位数值置上的两个分位数值 3.3.绘制方法绘制方法n n首首先先找找出出一一组组数数据据的的5 5个个特特征征值值,即即最最最最大大大大值值值值、最最最最小小小小值值值值、中中中中位数位数位数位数MMe e和两个和两个四分位数四分位数四分位数四分位数(下四分位数下四分位数QQL L和上四分位数和上四分位数QQU U)n n连连接接两两个个四四分分位位数数画画出出箱箱子子,再再将将两两个个最最值值点点与与箱箱子子相相连接连接*未分组数据看分布箱线图(box plot)用于显示未分组2-49统计学统计学STATISTICS(第五版第五版)未分组数据看分布未分组数据看分布箱线图箱线图(箱线图的构成箱线图的构成)*未分组数据看分布箱线图(箱线图的构成)*2-50统计学统计学STATISTICS(第五版第五版)未分组数据看分布未分组数据看分布箱线图箱线图(例题分析例题分析)贾俊平著贾俊平著贾俊平著贾俊平著统计学统计学统计学统计学第五版第五版第五版第五版*未分组数据看分布箱线图(例题分析)贾俊平著统计学第五2-51统计学统计学STATISTICS(第五版第五版)分布的形状与箱线图分布的形状与箱线图*分布的形状与箱线图*2-52统计学统计学STATISTICS(第五版第五版)未分组数据看分布未分组数据看分布多批数据箱线图多批数据箱线图(例题分析例题分析)【例例例例2-42-4】从从某某大大学学经经济济管管理理专专业业二二年年级级学学生生中中随随机机抽抽取取 1111人人,对对 8 8门门主主要要课课程程的的考考试试成成绩绩进进行行调调查查,所所得得结结果果如如表表。试试绘绘制制各各科科考考试试成成绩绩的的比比较较箱箱线线图图,并并分分析析各各科科考考试试成成绩绩的的分布特征分布特征1111名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称学生编号学生编号1234567891011英语英语经济数学经济数学西方经济学西方经济学市场营销学市场营销学财务管理财务管理基础会计学基础会计学统计学统计学计算机应用基础计算机应用基础76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177 绘制箱线图绘制箱线图绘制箱线图绘制箱线图 绘制箱线图绘制箱线图绘制箱线图绘制箱线图*未分组数据看分布多批数据箱线图(例题分析)【例2-4】2-53统计学统计学STATISTICS(第五版第五版)用用SPSS绘制多批数据箱线图绘制多批数据箱线图 第第第第1 1步:步:步:步:选择选择【图形图形图形图形】下拉菜单,并选择下拉菜单,并选择【箱线图箱线图箱线图箱线图】第第第第2 2步:步:步:步:在出现的对话框中选择在出现的对话框中选择【简单简单简单简单】,在,在 【图表中的数据为图表中的数据为图表中的数据为图表中的数据为】中选择中选择【各个变量的摘要各个变量的摘要各个变量的摘要各个变量的摘要】,点击点击【定义定义定义定义】返回主对话框返回主对话框第第第第3 3步:步:步:步:在主对话框将所有变量在主对话框将所有变量(这里是这里是1111个学生个学生)选入选入 【框的表征框的表征框的表征框的表征】,将将“课程名称课程名称”选入选入 【标签个案依据标签个案依据标签个案依据标签个案依据】。点击。点击【确定确定确定确定】绘制箱线图绘制箱线图绘制箱线图绘制箱线图*用SPSS绘制多批数据箱线图 第1步:选择【图形】下拉菜单,2-54统计学统计学STATISTICS(第五版第五版)未分组数据未分组数据多批数据箱线图多批数据箱线图(例题分析例题分析例题分析例题分析Median/Quart./Range)Median/Quart./Range)8 8门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图*未分组数据多批数据箱线图(例题分析Median/Qua2-55统计学统计学STATISTICS(第五版第五版)1111名学生考试成绩的名学生考试成绩的名学生考试成绩的名学生考试成绩的Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图未分组数据未分组数据多批数据箱线图多批数据箱线图(SPSS(SPSS绘制的箱线图绘制的箱线图绘制的箱线图绘制的箱线图)*11名学生考试成绩的Median/Quart./Range箱2-56统计学统计学STATISTICS(第五版第五版)离群点和极值的定义离群点和极值的定义中位数中位数中位数中位数Q75%75%Q25%25%离群点:离群点:某某个个数数据据与与四四分分位位数数(Q25%或或Q75%)的的距距离离(即即差差值值)超超过过1.5倍的四分位差倍的四分位差超过超过1.5倍的四分位差倍的四分位差极值:极值:某某个个数数据据与与四四分分位位数数(Q25%或或Q75%)的的距距离离(即即差差值值)超超过过3倍的四分位差倍的四分位差离群点离群点 X i*离群点和极值的定义中位数Q75%Q25%离群点:超过1.5倍2-57统计学统计学STATISTICS(第五版第五版)1.1.垂线图可用于展示多个变量或多个样本取值的分布状况垂线图可用于展示多个变量或多个样本取值的分布状况2.2.将将属属于于同同一一样样本本或或类类别别的的多多个个取取值值的的散散点点用用一一条条垂垂线线连连接接起起来来,用用垂垂线线的的长长度度及及垂垂线线上上的的各各个个点点来来反反映映某某个个样样本或类别取值的差异及其变动状况本或类别取值的差异及其变动状况 未分组数据未分组数据垂线图垂线图(drop-line)用用SPSS制作垂线图制作垂线图第第1 1步:选择步:选择【图形图形】菜单,并选择菜单,并选择【线图线图】第第2 2步步:在在出出现现的的对对话话框框中中选选择择【垂垂直直线线图图】,在在【图图表表中中的的数数据据为为】中选择中选择【个案值个案值】,点击,点击【定义定义】返回主对话框返回主对话框第第3 3步步:在在主主对对话话框框中中将将所所有有变变量量选选入入【点点的的表表征征】。在在【类类别别标标签签】下选择下选择【个案号个案号】,点击,点击【确定确定】*垂线图可用于展示多个变量或多个样本取值的分布状况未分组数据2-58统计学统计学STATISTICS(第五版第五版)未分组数据未分组数据垂线图垂线图(例题分析例题分析)1111名学生名学生8 8门课程考试成绩的垂线图门课程考试成绩的垂线图*未分组数据垂线图(例题分析)11名学生8门课程考试成绩2-59统计学统计学STATISTICS(第五版第五版)1.1.误误差差图图是是以以均均值值为为中中心心,加加减减一一定定倍倍数数的的标标准准差差(也也可可以以是是加加减减一一定定倍倍数数的的标标准准误误差差)绘绘制制而而成成的的(该该图图也也可可以以绘绘制制均均值值的的一一定置信水平的置信区间定置信水平的置信区间)2.2.用于展示多个样本或分类的不同取值的分布状况和离散状况用于展示多个样本或分类的不同取值的分布状况和离散状况 未分组数据未分组数据误差图误差图(error bar)用用SPSS制作误差图制作误差图第第1 1步:选择步:选择【图形图形】菜单,并选择菜单,并选择【误差条形图误差条形图】。第第2 2步:在出现的对话框中选择步:在出现的对话框中选择【简单简单】,在,在【图表中的数据为图表中的数据为】中选择中选择【各个变量的摘要各个变量的摘要】,点击,点击【定义定义】返回主对话框。返回主对话框。第第3 3步:在主对话框中将所有变量选入步:在主对话框中将所有变量选入【误差条误差条】。在。在【条的表征条的表征】下选择下选择【标准差标准差】,在,在【乘数乘数】框内输入所需的标准差倍框内输入所需的标准差倍数。点击数。点击【确定确定】。*误差图是以均值为中心,加减一定倍数的标准差(也可以是加减一定2-60统计学统计学STATISTICS(第五版第五版)未分组数据未分组数据误差图误差图(例题分析例题分析)1111名学生名学生8 8门课程考试成绩的误差图门课程考试成绩的误差图(均值加减均值加减2 2倍的标准差倍的标准差)*未分组数据误差图(例题分析)11名学生8门课程考试成绩2-61统计学统计学STATISTICS(第五版第五版)两个变量间的关系两个变量间的关系二维散点图二维散点图(2D Scatter plots)1.展示两个变量之间的关系2.用横轴代表变量x,纵轴代表变量y,每组数据(xi,yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的图3.有2维、3维、矩阵等形式*两个变量间的关系二维散点图(2D Scatter plo2-62统计学统计学STATISTICS(第五版第五版)两个变量间的关系两个变量间的关系二维散点图二维散点图(2D Scatter plots)【例例例例2-52-5】我我国国31 31 个个地地 区区 20192019年年的的固固定定资资产产投投资资额额、地地区区生生产产总总值值(GDP)(GDP)和和最最终终消消费费支支出出数数据据。绘绘散散点点图图并并观观察察它它们们之之间间的关系的关系 *两个变量间的关系二维散点图(2D Scatter plo2-63统计学统计学STATISTICS(第五版第五版)用用SPSS绘制重叠散点图绘制重叠散点图(Overlay Scatter)第第第第1 1步:步:步:步:选择选择【图形图形图形图形】菜单,并选择菜单,并选择【散点散点散点散点/点状点状点状点状】第第第第2 2步:步:步:步:如果绘制两个变量的简单散点图,点击如果绘制两个变量的简单散点图,点击【简单分布简单分布】,点,点击击【定义定义】,将两个变量分别选入,将两个变量分别选入【Y Y轴轴】和和【X X轴轴】,点击,点击【确定确定】如果要绘制重叠散点图,点击如果要绘制重叠散点图,点击【重叠分布重叠分布重叠分布重叠分布】,点击,点击【D D定义定义】,将,将所要配对的数据依次选入所要配对的数据依次选入【Y-X Y-X 对对】(本例为本例为“固定资产投资固定资产投资额额-地区生产总值地区生产总值”和和“固定资产投资额固定资产投资额-最终消费支出最终消费支出”),点击点击【确定确定】如果要绘制矩阵散点图,点击如果要绘制矩阵散点图,点击【矩阵分布矩阵分布矩阵分布矩阵分布】,将几个变量,将几个变量(本例为本例为“固定资产投资额固定资产投资额”、“地区生产总值地区生产总值”和和“固定资产投资固定资产投资额额”)同时选入同时选入【矩阵变量矩阵变量】,将区分坐标轴的样本,将区分坐标轴的样本(本例为本例为“地区地区”)选入选入【标注个案标注个案】,点击,点击【确定确定】绘制重叠散点图绘制重叠散点图绘制重叠散点图绘制重叠散点图*用SPSS绘制重叠散点图(Overlay Scatter2-64统计学统计学STATISTICS(第五版第五版)两个变量间的关系两个变量间的关系二维散点图二维散点图(2D Scatter plots)绘制散点图绘制散点图绘制散点图绘制散点图*两个变量间的关系二维散点图(2D Scatter plo2-65统计学统计学STATISTICS(第五版第五版)1.如如果果想想比比较较几几个个变变量量之之间间的的关关系系,也也可可以以把把它它们们的的散散点点图图绘绘制制在在同同一一张张图图里里,绘绘制制成成重重叠叠散散点点图图(Overlay(Overlay Scatter)(Scatter)(注注意意:绘绘制制重重叠叠散散点点图图时时,变变量量值值之之间间的的数数值值差差异异不不能能过过大大,否否则则不不便于比较便于比较)2.比比如如,如如果果想想比比较较固固定定资资产产投投资资额额与与地地区区生生产产总总值值和和最最终终消消费费支支出出的的关关系系,可可以以把把固固定定资资产产投投资资作作为为共共同同的的一一个个坐坐标标轴轴,地地区区生生产产总总值值和和最终消费支出作为另一个坐标轴最终消费支出作为另一个坐标轴3.也可以绘制散点图矩阵也可以绘制散点图矩阵(Matrix Scatter)(Matrix Scatter)两个变量间的关系两个变量间的关系重叠散点图重叠散点图(用用SPSS绘制重叠散点图绘制重叠散点图)*如果想比较几个变量之间的关系,也可以把它们的散点图绘制在同一2-66统计学统计学STATISTICS(第五版第五版)两个变量间的关系两个变量间的关系重叠散点图重叠散点图(Overlay Scatter)*两个变量间的关系重叠散点图(Overlay Scatte2-67统计学统计学STATISTICS(第五版第五版)两个变量间的关系两个变量间的关系矩阵散点图矩阵散点图(Matrix Scatter)*两个变量间的关系矩阵散点图(Matrix Scatter2-68统计学统计学STATISTICS(第五版第五版)比较多个样本的相似性比较多个样本的相似性 雷达图雷达图(radar chart)1.也称为蜘蛛图(spider chart)2.从一个点出发,用每一条射线代表一个变量,多个变量的数据点连接成线,即围成一个区域,多个样本围成多个区域,就是雷达图3.可用于研究多个样本在多个变量上的相似程度*比较多个样本的相似性 雷达图(radar chart)也2-69统计学统计学STATISTICS(第五版第五版)多变量数据多变量数据雷达图雷达图(例题分析例题分析)【例例例例2-62-6】20192019年年我我国国东东部部、中中部部、西西部部及及东东北北地地区区城城镇镇居居民民人人均均消费支出数据消费支出数据 。绘制雷达图,比较不同地区的消费支出构成。绘制雷达图,比较不同地区的消费支出构成 绘制雷达图绘制雷达图绘制雷达图绘制雷达图*多变量数据雷达图(例题分析)【例2-6】2019年我国东2-70统计学统计学STATISTICS(第五版第五版)多变量数据多变量数据雷达图雷达图(例题分析例题分析原始数据原始数据)1.1.四四个个地地区区城城镇镇居居民民消消费费支支出出中中,食食品品支支出出额额都都是是最最多多的的,其其他他支支出出额额则则是最少的是最少的2.2.东东部部地地区区城城镇镇居居民民的的各各项项支支出出额额普普遍遍高高于于其其他他三三个个地地区区,而而中中部部、西西部部和和东东北北地地区区的的各各项项支支出出则则相相差不大差不大3.3.四四个个地地区区各各项项支支出出额额的的结结构构具具有有很很大大的的相相似性似性*多变量数据雷达图(例题分析原始数据)四个地区城镇居民2-71统计学统计学STATISTICS(第五版第五版)1.20世纪90年代初由Inselberg和Dimsdale提出的展示多元数据的图示方法2.将各变量用一系列平行的横坐标轴表示,变量值对应纵轴上的位置3.可用于研究多个样本在多个变量上的相似程度或变量间的相互关系比较多个样本的相似性比较多个样本的相似性 平行坐标图平行坐标图(轮廓廓图)*20世纪90年代初由Inselberg和Dimsdale提出2-72统计学统计学STATISTICS(第五版第五版)多变量数据多变量数据轮廓线图轮廓线图(例题分析例题分析比较样本:地区比较样本:地区)1.1.四四个个地地区区城城镇镇居居民民消消费费支支出出中中,食食品品支支出出额额都都是是最最多多的的,其其他他支支出出额额则则是最少的是最少的2.2.东东部部地地区区城城镇镇居居民民的的各各项项支支出出额额普普遍遍高高于于其其他他三三个个地地区区,而而中中部部、西西部部和和东东北北地地区区的的各各项项支支出出则则相相差不大差不大3.3.四四个个地地区区各各项项支支出出额额的的结结构构具具有有很很大大的的相相似性似性*多变量数据轮廓线图(例题分析比较样本:地区)四个地区2.3 合理使用图表合理使用图表第第 2 章章 用图表展示数据用图表展示数据2.3 合理使用图表第 2 章 用图表展示数据2-74统计学统计学STATISTICS(第五版第五版)1.1.一张好的图表应包括以下基本特征一张好的图表应包括以下基本特征n n显示数据显示数据n n让让读读者者把把注注意意力力集集中中在在图图表表的的内内容容上上,而而不不是是制制作作图图表表的的程序上程序上n n避免歪曲避免歪曲n n强调数据之间的比较强调数据之间的比较n n服务于一个明确的目的服务于一个明确的目的n n有对图表的统计描述和文字说明有对图表的统计描述和文字说明2.2.5 5种鉴别图表优劣的准则:一张好的图表应当种鉴别图表优劣的准则:一张好的图表应当n n精心设计、有助于洞察问题的实质精心设计、有助于洞察问题的实质n n使复杂的观点得到简明、确切、高效的阐述使复杂的观点得到简明、确切、高效的阐述n n能在最短的时间内以最少的笔墨给读者提供最大量的信息能在最短的时间内以最少的笔墨给读者提供最大量的信息n n是多维的是多维的n n表述数据的真实情况表述数据的真实情况鉴别图表优劣的准则鉴别图表优劣的准则*一张好的图表应包括以下基本特征鉴别图表优劣的准则*本本章章图图解解本章图解2-76统计学统计学STATISTICS(第五版第五版)本章小结本章小结l定性数据的频数分布表定性数据的频数分布表l定性数据的图示方法定性数据的图示方法l定量数据的频数分布表定量数据的频数分布表l定量数据的图示方法定量数据的图示方法l用用Excel和和SPSS作作频数分布表和频数分布表和图图形形l合理使用图表合理使用图表*本章小结定性数据的频数分布表*结结 束束结 束THANKS数据分析方法与案例课件78
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!