用图表展示数据剖析课件

上传人:痛*** 文档编号:241602252 上传时间:2024-07-08 格式:PPT 页数:85 大小:2.60MB
返回 下载 相关 举报
用图表展示数据剖析课件_第1页
第1页 / 共85页
用图表展示数据剖析课件_第2页
第2页 / 共85页
用图表展示数据剖析课件_第3页
第3页 / 共85页
点击查看更多>>
资源描述
数据分析数据分析(方法与案例方法与案例)作者作者 贾俊平贾俊平统计学统计学统统 计计 学学2-2统计学统计学STATISTICS(第四版第四版)图并没有说谎,是说谎者在画图。Benjamin Disraeli yyyy-M-yyyy-M-统计名言第2章用图表展示数据2.1用图表展示定性数据2.2用图表展示定量数据2.3合理使用图表2-4统计学统计学STATISTICS(第四版第四版)学习目标l定性数据的频数分布表l定性数据的图示方法l定量数据的频数分布表l定量数据的图示方法l用Excel和SPSS作频数分布表和图形l合理使用图表yyyy-M-yyyy-M-2-5统计学统计学STATISTICS(第四版第四版)用哪些图形展示奖牌?2009年7月26日至8月3日第13届世界游泳锦标赛在意大利罗马举行。美国的泳坛霸主地位难以撼动,中国军团也创造了史上第二的佳绩在本届游泳世锦赛上,中国代表团取得金牌数和奖牌与美国并列第一、奖牌榜排名第二的好成绩,而且中国男子游泳首次夺得世界性大赛的冠军并一举打破世界纪录。本届游泳世锦赛共设有奖牌227枚,其中金牌75枚、银牌75枚、铜牌77枚。下表是本届游泳世锦赛金牌总数取得前三名的国家所获得奖牌的分布情况yyyy-M-yyyy-M-2-6统计学统计学STATISTICS(第四版第四版)用哪些图形展示奖牌?yyyy-M-yyyy-M-根据上面的数据,你认为可以选择哪些图形来展示三个国家所获得的奖牌情况?学完本章的图表展示技术,这样的问题就会迎刃而解2-7统计学统计学STATISTICS(第四版第四版)统计应用把数据画图之后,要用用脑袋沃德(AbrahamWald)和许多统计学家一样,在第二次世界大战时也处理了战争与相关的问题。他发明的一些统计方法在战时被视为军事机密。以下是他提出的概念中较简单的一种沃德被咨询飞机上什么部位应该加强钢板时,开始研究从战役中返航的军机上受敌军创伤的弹孔位置。他画了飞机的轮廓,并且标识出弹孔的位置。资料累积一段时间后,几乎把机身各部位都填满了。于是沃德建议,把剩下少数几个没有弹孔的部位补强。因为这些部位被击中的飞机都没有返航yyyy-M-yyyy-M-资料来源:David S.Mroore2.1 用图表展示定性数据用图表展示定性数据 2.1.1 生成频数分布表生成频数分布表 2.1.2 定性数据的图示定性数据的图示第2章用图表展示数据2.1.1生成频数分布表2.1用图表展示定性数据2-10统计学统计学STATISTICS(第四版第四版)生成频数分布表(定性数据)1.列出各类别yyyy-M-yyyy-M-2.计算各类别的频数3.生成频数分布表分类分类频数频数比例比例百分比百分比比率比率ABCDE2-11统计学统计学STATISTICS(第四版第四版)定性数据的描述统计量1.频数(frequency):落在各类别中的数据个数2.比例(proportion):某一类别数据个数占全部数据个数的比值3.百分比(percentage):将对比的基数作为100而计算的比值4.比率(ratio):不同类别数值个数的比值yyyy-M-yyyy-M-2-12统计学统计学STATISTICS(第四版第四版)生成频数分布表(定性数据)yyyy-M-yyyy-M-【例2-1】为研究人们对不同类型软饮料的偏好情况,一家调查公司在某超市随机调查了50名顾客。右表是顾客性别及其所偏好的饮料类型记录。生成频数分布表,观察不同性别的顾客及其所偏好的饮料类型的分布状况,并进行描述性分析 制作频数分布表制作频数分布表制作频数分布表制作频数分布表绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品2-13统计学统计学STATISTICS(第四版第四版)使用Excel数据透视表计数(pivottable)第第1步:步:选择【数据数据】菜单中的【数据透视表和数据透视图数据透视表和数据透视图】第第2步:步:确定数据源区域(在操作前将光标放在任意数据单元格 内,系统会自动选定数据源区域)第第3步:步:在【向导3步骤之3】中选择数据透视表的输出位 置,然后选择【布局】第第4步:步:在【向导布局】对话框中,依次将“饮料类型”拖至左 边的“行”(或列)区域,将“顾客性别”拖至“列”(或 行)区域,将“饮料类型”拖至“数据”区域。第第5步:步:单击【确定】,自动返回【向导3步骤之3】对话 框。单击【完成】yyyy-M-yyyy-M-用数据透视表生成定性数据的频数分布用数据透视表生成定性数据的频数分布用数据透视表生成定性数据的频数分布用数据透视表生成定性数据的频数分布2-14统计学统计学STATISTICS(第四版第四版)生成频数分布表(列联表Excel)yyyy-M-yyyy-M-不同类型饮料和不同性别顾客的频数分布绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品2-15统计学统计学STATISTICS(第四版第四版)用SPSS生成定性数据的频数分布表(单变量频数分布表)第1步:选择【Analyze】【DescriptiveStatistics-Frequencies】进入主对话框第2步:将“饮料类型”或“顾客性别”选入【Variable(s)】;选中【DisplayFrequencytables】第3步(若需要描述统计量或图形)主点【Statistics】或【Charts】,并选择相应的选项。点击【OK】yyyy-M-yyyy-M-生成频数分布表生成频数分布表生成频数分布表生成频数分布表2-16统计学统计学STATISTICS(第四版第四版)生成频数分布表(定性数据SPSS)yyyy-M-yyyy-M-不同类型饮料的频数分布升序升序升序升序排列排列排列排列 (汉字汉字汉字汉字拼音拼音拼音拼音字母字母字母字母)2-17统计学统计学STATISTICS(第四版第四版)用SPSS生成定性数据的列联表(Crosstabulation交叉表)第1步:选择【Analyze】【DescriptiveStatistics-Crosstabs】进入主对话框第2步:将“饮料类型”选入【Row(s)】,将“顾客性别”选入【Column(s)】(行列可以互换)第3步:(若需要对列联表进行描述性分析)点击【Cells】,在【Percentages】下选中需要的统计量,如【Row】、【Column】、【Total】等;(若需要图形)点击【Displayclusteredbarchart】。点击【OK】yyyy-M-yyyy-M-生成交叉频数分布表生成交叉频数分布表生成交叉频数分布表生成交叉频数分布表2-18统计学统计学STATISTICS(第四版第四版)列联表的描述性分析(例题分析SPSS)yyyy-M-yyyy-M-列列列列联联联联表表表表的的的的统统统统计计计计描描描描述述述述 行行行行百百百百分分分分比比比比 列列百百分分比比 2-19统计学统计学STATISTICS(第四版第四版)列联表的描述性分析(例题分析SPSS)yyyy-M-yyyy-M-列联表的统计描述行百分比行百分比行百分比行百分比 列百分比列百分比列百分比列百分比 2-20统计学统计学STATISTICS(第四版第四版)数据透视表(pivot table)1.可以从复杂的数据中提取有用的信息2.可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图3.形成一个符合需要的交叉表(列联表)4.在利用数据透视表时,数据源表中的首行必须有列标题yyyy-M-yyyy-M-数据透视表数据透视表数据透视表数据透视表2-21统计学统计学STATISTICS(第四版第四版)生成频数分布表(列联表Excel)yyyy-M-yyyy-M-不同类型饮料和顾客性别的频数分布不同类型饮料和顾客性别的频数分布 2.1.2 定性数据的图示2.1 用图表展示定性数据用图表展示定性数据2-23统计学统计学STATISTICS(第四版第四版)条形图(bar Chart)1.用宽度相同的条形的高度或长短来表示各类别数据2.各类别可放在纵轴,称为条形图,可以放在横轴,称为柱形图(columnchart)yyyy-M-yyyy-M-2-24统计学统计学STATISTICS(第四版第四版)复式条形图(bar Chart)饮料类型和顾客性别的条形图(SPSS的输出)yyyy-M-yyyy-M-2-25统计学统计学STATISTICS(第四版第四版)帕累托图(pareto chart)1.按各类别数据出现的频数多少排序后绘制的柱形图2.用于展示分类数据的分布yyyy-M-yyyy-M-2-26统计学统计学STATISTICS(第四版第四版)用SPSS绘制饼图(Pie)第第1步:步:选择【Graphs】【Interactive-Pie-Clustered】,进入主对话框第第2步:步:如果绘制简单饼图,将某个分类变量(如“饮料类型”)选入【Slice】(部分,片);点击【Pies】,选择在饼图中要展示的内容,如【Category】、【Count】、【Percen】等。点击【确定确定】如果要绘制复式饼图,将某个分类变量(如“饮料类型”)选入【Slice】;将另一个分类变量(如“顾客性别”)选入【Cluster】;点击【Pies】,选择在饼图中要展示的内容,如【Category】、【Count】、【Percen】等。点击【确定确定】yyyy-M-yyyy-M-绘制饼图绘制饼图绘制饼图绘制饼图2-27统计学统计学STATISTICS(第四版第四版)简单饼图(pie Chart)yyyy-M-yyyy-M-用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例用于研究结构问题2-28统计学统计学STATISTICS(第四版第四版)复式饼图(pie Chart)yyyy-M-yyyy-M-主要用于展示两个或多个分类变量的构成比较,比如,在男女分类的基础上又增加了饮料类型的分类。2-29统计学统计学STATISTICS(第四版第四版)环形图(doughnut chart)1.环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示2.与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例饼图只能显示一个总体各部分所占的比例环环形形图图则则可可以以同同时时绘绘制制多多个个样样本本或或总总体体的的数数据据系系列列,每每一一个个样样本本或或总总体体的的数数据据系系列列为一个环为一个环3.用于结构比较研究yyyy-M-yyyy-M-2-30统计学统计学STATISTICS(第四版第四版)环形图(doughnut chart)yyyy-M-yyyy-M-【例2-2】2006年北京、上海和天津地区按收入法计算的地区生产总值(按当年价格计算)数据。绘制环形图比较三个地区的生产总值构成2-31统计学统计学STATISTICS(第四版第四版)环形图(doughnut chart)yyyy-M-yyyy-M-北京、上海和天津地区按收入法计算的地区生产总值北京、上海和天津地区按收入法计算的地区生产总值北京、上海和天津地区按收入法计算的地区生产总值北京、上海和天津地区按收入法计算的地区生产总值2-32统计学统计学STATISTICS(第四版第四版)复式条形图yyyy-M-yyyy-M-北京、上海和天津地区按收入法计算的地区生产总值北京、上海和天津地区按收入法计算的地区生产总值北京、上海和天津地区按收入法计算的地区生产总值北京、上海和天津地区按收入法计算的地区生产总值2-33统计学统计学STATISTICS(第四版第四版)环形图(doughnut chart)排名排名国家国家金金银银铜铜总总1 1中国中国中国中国5121281002 2美国美国美国美国3638361103 3俄罗斯俄罗斯俄罗斯俄罗斯23212872yyyy-M-yyyy-M-【例例例例】在第29届北京奥运会上,获得金牌和奖牌前三名的国家及奖牌数如下。绘制环形图比较三个国家的奖牌构成2-34统计学统计学STATISTICS(第四版第四版)环形图(doughnut chart)yyyy-M-yyyy-M-中国、美国、俄罗斯奥运会奖牌构成中国、美国、俄罗斯奥运会奖牌构成2-35统计学统计学STATISTICS(第四版第四版)复式条图yyyy-M-yyyy-M-中国、美国、俄罗斯奥运会奖牌比较中国、美国、俄罗斯奥运会奖牌比较2-36统计学统计学STATISTICS(第四版第四版)复式条图yyyy-M-yyyy-M-中国、美国、俄罗斯奥运会奖牌比较中国、美国、俄罗斯奥运会奖牌比较2.2 用图表展示定量数据用图表展示定量数据 2.2.1 生成频数分布表生成频数分布表 2.2.2 定量数据的图示定量数据的图示第第 2 章章 用图表展示数据用图表展示数据2.2.1 生成频数分布表2.2 用图表展示定量数据用图表展示定量数据2-39统计学统计学STATISTICS(第四版第四版)生成频数分布表(例题分析)yyyy-M-yyyy-M-【例例2-3】某电脑公司120天的销售额数据(单位:万元)。生成一张频数分布表观察销售额分布的特征2-40统计学统计学STATISTICS(第四版第四版)生成频数分布表(例题分析)1.确定组数:组数的确定应以能够显示数据的分布特征为目的。在实际分组时,组数一般为5K15。本例中由于数据较多,可考虑分为10组2.确定组距:组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距(最大值-最小值)组数例如,本例最大值为237,最小值为141,组距=(237-141)109.6。为便于计算,组距宜取5或10的倍数,且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取103.统计出各组的频数。每个组的数据满足axb(上限值不在内)(Excel的计数规则是axb)yyyy-M-yyyy-M-2-41统计学统计学STATISTICS(第四版第四版)分组中的几个概念1.下限(lowerlimit):一个组的最小值2.上限(upperlimit):一个组的最大值3.组距(classwidth):上限与下限之差4.组中值(classmidpoint):下限与上限之间的中点值yyyy-M-yyyy-M-下限值下限值+上限值上限值2 2组中值组中值=制作频数分布制作频数分布2-42统计学统计学STATISTICS(第四版第四版)生成频数分布表(例题分析)某电脑公司销售额的频数分布yyyy-M-yyyy-M-2-43统计学统计学STATISTICS(第四版第四版)使用Excel频数函数(FREQUENCY)Excel的【直方图】工具的缺陷是:频数分布及直方图没有与数据链接,当改变任何一个数据时,频数分布表和直方图不会跟着改变使用统计函数【FREQUENCY】创建频数分布表和直方图可解决这一问题。具体步骤是选择与接受区域相临近的单元格区域,作为频数分布表输出的区域选择统计函数中的【FREQUENCY】函数在对话框【Date-array】后输入数据区域,在【Bins-array】后输入接受区域同时按下“ctrl-shift-Enter”组合键,即得到频数分布yyyy-M-yyyy-M-统计函数FREQUENCY2.2.2 定量数据的图示2.2 用图表展示定量数据用图表展示定量数据Excel2-45统计学统计学STATISTICS(第四版第四版)分组数据看分布直方图(histogram)1.用于展示分组数据分布的一种图形2.用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布3.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图4.直方图下的总面积等于1yyyy-M-yyyy-M-2-46统计学统计学STATISTICS(第四版第四版)用SPSS绘制直方图第第1步:步:选择【Graphs】菜单,并选择 【histogram】选项进入主对话框第第2步:步:在主对话框中将变量选入【Variables】,点击【OK】yyyy-M-yyyy-M-绘制直方图2-47统计学统计学STATISTICS(第四版第四版)分组数据看分布直方图(SPSS绘制的直方图)yyyy-M-yyyy-M-2-48统计学统计学STATISTICS(第四版第四版)分组数据看分布直方图(直方图与条形图的区别)1.条形图中的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距2.由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列3.条形图主要用于展示定性数据,而直方图则主要用于展示定量数据yyyy-M-yyyy-M-2-49统计学统计学STATISTICS(第四版第四版)未分组数据看分布茎叶图(stem-and-leafplot)1.用于显示未分组的原始数据的分布2.由“茎”和“叶”两部分构成,其图形是由数字组成的3.以该组数据的高位数值作树茎,低位数字作树叶4.树叶上只保留最后一位数字5.茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据yyyy-M-yyyy-M-2-50统计学统计学STATISTICS(第四版第四版)用SPSS绘制茎叶图和箱线图(包括直方图)第第1步:步:选择【Analyze】菜单,并选择 【Descriptive statistics-Explore】选项进入主对话框第第2步:步:在主对话框中将变量选入【Variables】,点击【Plots】,在对话框中选择【Stem-and-leaf】(根据需要可选【Histogram】以 给出直方图)。点击【Continue】回到主对 话框。点击【OK】yyyy-M-yyyy-M-绘制茎叶图绘制茎叶图绘制茎叶图绘制茎叶图2-51统计学统计学STATISTICS(第四版第四版)未分组数据看分布茎叶图(例题分析)yyyy-M-yyyy-M-某电脑公司销售额分布的茎叶图某电脑公司销售额分布的茎叶图某电脑公司销售额分布的茎叶图某电脑公司销售额分布的茎叶图2-52统计学统计学STATISTICS(第四版第四版)未分组数据看分布茎叶图(例题分析)第一列给出每个茎上叶子的频数第二列是“茎”,第三列是“叶”下面标出了1个极端值237、茎的宽度10、每个叶代表一个数据(案例)SPSS自动将每个茎重复了一次,使分布的细节看的更清楚一些。当然,在数据较少时茎的数值也可以不重复yyyy-M-yyyy-M-2-53统计学统计学STATISTICS(第四版第四版)未分组数据看分布点图(例题分析)yyyy-M-yyyy-M-某电脑公司销售额分布的点图某电脑公司销售额分布的点图某电脑公司销售额分布的点图某电脑公司销售额分布的点图2-54统计学统计学STATISTICS(第四版第四版)未分组数据看分布箱线图(boxplot)1.用于显示未分组的原始数据的分布2.箱线图是由一组数据的最大值(maximum)、最小值(minimum)、中 位 数(median)、两 个 四 分 位 数(quartiles)这5个值绘制而成的中位数是一组数据排序后处于中间位置上的变量值四分位数是一组数据排序后处在数据25%位置和75%位置上的两个分位数值3.绘制方法首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分位数画出箱子,再将两个极值点与箱子相连接yyyy-M-yyyy-M-2-55统计学统计学STATISTICS(第四版第四版)未分组数据看分布箱线图(箱线图的构成)yyyy-M-yyyy-M-中位数中位数4681012Q75%Q25%XMaxXMinMedian/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图2-56统计学统计学STATISTICS(第四版第四版)未分组数据看分布箱线图(例题分析)yyyy-M-yyyy-M-最小值最小值最小值最小值141141最大值最大值最大值最大值237237中位数中位数中位数中位数18218225%25%四分位数四分位数四分位数四分位数170.25170.2575%75%四分位数四分位数四分位数四分位数197197140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240某电脑公司销售额数据的某电脑公司销售额数据的某电脑公司销售额数据的某电脑公司销售额数据的Median/Quart./RangMedian/Quart./Rang箱线图箱线图箱线图箱线图2-57统计学统计学STATISTICS(第四版第四版)分布的形状与箱线图yyyy-M-yyyy-M-不同分布的箱线图不同分布的箱线图不同分布的箱线图不同分布的箱线图对称分布对称分布对称分布对称分布Bell-shapedBell-shaped distribution distribution distributionLeft-skewed distributionLeft-skewed distribution左偏分布左偏分布左偏分布左偏分布右偏分布右偏分布右偏分布右偏分布Right-skewed distributionRight-skewed distribution2-58统计学统计学STATISTICS(第四版第四版)未分组数据看分布多批数据箱线图(例题分析)yyyy-M-yyyy-M-【例例2-4】从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征1111名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称学生编号学生编号1234567891011英语英语经济数学经济数学西方经济学西方经济学市场营销学市场营销学财务管理财务管理基础会计学基础会计学统计学统计学计算机应用基础计算机应用基础766593746870558590958187757391789751768570926881717488698465739570786690737884709363798060878167869183777690708283829284817069727875789188669480857186746879628181557870756871772-59统计学统计学STATISTICS(第四版第四版)用SPSS绘制多批数据箱线图第第1步:步:选择【Graphs】下拉菜单,并选择【Boxplot】第第2步:步:在出现的对话框中选择【Simple】,在 【Data in Chat Are】中选择【Summaries of separate variables】,点击【Define】返回主对话框第第3步:步:在主对话框将所有变量(这里是11个学生)选入 【Boxes Represent】,将“课程名称”选入 【Label Cases by】。点击【OK】yyyy-M-yyyy-M-绘制箱线图绘制箱线图绘制箱线图绘制箱线图2-60统计学统计学STATISTICS(第四版第四版)未分组数据多批数据箱线图(例题分析Median/Quart./Range)yyyy-M-yyyy-M-8 8门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图2-61统计学统计学STATISTICS(第四版第四版)未分组数据多批数据箱线图(SPSS绘制的箱线图)yyyy-M-yyyy-M-1111名学生考试成绩的名学生考试成绩的名学生考试成绩的名学生考试成绩的Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图2-62统计学统计学STATISTICS(第四版第四版)离群点和极值的定义yyyy-M-yyyy-M-中位数中位数Q75%Q25%离群点:离群点:某某个个数数据据与与四四分分位位数数(Q25%或或Q75%)的的距距离离(即即差差值值)超超过过1.5倍的四分位差倍的四分位差超过超过1.5倍的四分位差倍的四分位差极值:极值:某某个个数数据据与与四四分分位位数数(Q25%或或Q75%)的的距距离离(即即差差值值)超超过过3倍的四分位差倍的四分位差离群点离群点 X i2-63统计学统计学STATISTICS(第四版第四版)未分组数据多批数据箱线图(上证指数K线图)yyyy-M-yyyy-M-2-64统计学统计学STATISTICS(第四版第四版)未分组数据垂线图(drop-line)1.垂线图可用于展示多个变量或多个样本取值的分布状况2.将属于同一样本或类别的多个取值的散点用一条垂线连接起来,用垂线的长度及垂线上的各个点来反映某个样本或类别取值的差异及其变动状况yyyy-M-yyyy-M-用用SPSS制作垂线图制作垂线图第第1 1步:选择步:选择【GraphsGraphs】菜单,并选择菜单,并选择【LineLine】第第2 2步步:在在出出现现的的对对话话框框中中选选择择【Drop-lineDrop-line】,在在【Data Data in in Chart Chart AreAre】中中选选择择【Values Values of of individual individual casescases】,点点击击【DefineDefine】返回主对话框返回主对话框第第3 3步步:在在主主对对话话框框中中将将所所有有变变量量选选入入【Points Points RepresentRepresent】。在在【Category Category LabelsLabels】下下选选择择【VariableVariable】,并并将将相相应应的的类类别别选入框内。点击选入框内。点击【OKOK】绘制垂线图绘制垂线图绘制垂线图绘制垂线图2-65统计学统计学STATISTICS(第四版第四版)未分组数据垂线图(例题分析)yyyy-M-yyyy-M-11名学生8门课程考试成绩的垂线图2-66统计学统计学STATISTICS(第四版第四版)未分组数据误差图(errorbar)1.误差图是以均值为中心,加减一定倍数的标准差(也可以是加减一定倍数的标准误差)绘制而成的(该图也可以绘制均值的一定置信水平的置信区间)2.用于展示多个样本或分类的不同取值的分布状况和离散状况yyyy-M-yyyy-M-用用SPSS制作垂线图制作垂线图第第1 1步:选择步:选择【GraphsGraphs】菜单,并选择菜单,并选择【Error BarError Bar】。第第2 2步:在出现的对话框中选择步:在出现的对话框中选择【SimpleSimple】,在,在【Data in Chart Data in Chart AreAre】中选择中选择【Summaries of separate variablesSummaries of separate variables】,点击,点击【DefineDefine】返回主对话框。返回主对话框。第第3 3步:在主对话框中将所有变量选入步:在主对话框中将所有变量选入【Error BarsError Bars】。在。在【Bars Bars RepresentRepresent】下选择下选择【Standard deviationsStandard deviations】,在,在【MultiplierMultiplier】框内输入所需的标准差倍数。点击框内输入所需的标准差倍数。点击【OKOK】。绘制误差图绘制误差图绘制误差图绘制误差图2-67统计学统计学STATISTICS(第四版第四版)未分组数据误差图(例题分析)yyyy-M-yyyy-M-11名学生名学生8门课程考试成绩的误差图门课程考试成绩的误差图(均值加减均值加减2倍的标准差倍的标准差)2-68统计学统计学STATISTICS(第四版第四版)两个变量间的关系二维散点图(2DScatterplots)1.展示两个变量之间的关系2.用横轴代表变量x,纵轴代表变量y,每组数据(xi,yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的图3.有2维、3维、矩阵等形式yyyy-M-yyyy-M-2-69统计学统计学STATISTICS(第四版第四版)两个变量间的关系二维散点图(2DScatterplots)【例例2-5】表212是我国 31个 地 区2006年的固定资产投资额、地区生产总值(GDP)和最终消费支出数据。绘散点图并观察它们之间的关系yyyy-M-yyyy-M-2-70统计学统计学STATISTICS(第四版第四版)用SPSS绘制重叠散点图(OverlayScatter)第第1步:步:选择【Graphs】菜单,并选择【Scatter/Dot】第第2步:步:如果绘制两个变量的简单散点图,点击【Simple Scatter】,点击【Define】,将两个变量分别选入【Y Pairs】和【X Pairs】,点击【OK】如果要绘制重叠散点图,点击【Overlay Scatter】,点击【Define】,将所要配对的数据依次选入【Y-X Pairs】(本例为“固定资产投资额-地区生产总值”和“固定资产投资额-最终消费支出”),点击【OK】如果要绘制矩阵散点图,点击【Matrix Scatter】,将几个变量(本例为“固定资产投资额”、“地区生产总值”和“固定资产投资额”)同时选入【Matrix Variables】,将区分坐标轴的样本(本例为“地区”)选入【Label Cases by】,点击【KO】yyyy-M-yyyy-M-绘制重叠散点图绘制重叠散点图绘制重叠散点图绘制重叠散点图2-71统计学统计学STATISTICS(第四版第四版)两个变量间的关系二维散点图(2DScatterplots)yyyy-M-yyyy-M-2-72统计学统计学STATISTICS(第四版第四版)两个变量间的关系重叠散点图(用SPSS绘制重叠散点图)1.如果想比较几个变量之间的关系,也可以把它们的散点图绘制在同一张图里,绘制成重叠散点图(OverlayScatter)(注意:绘制重叠散点图时,变量值之间的数值差异不能过大,否则不便于比较)2.比如,如果想比较固定资产投资额与地区生产总值和最终消费支出的关系,可以把固定资产投资作为共同的一个坐标轴,地区生产总值和最终消费支出作为另一个坐标轴3.也可以绘制散点图矩阵(MatrixScatter)yyyy-M-yyyy-M-2-73统计学统计学STATISTICS(第四版第四版)两个变量间的关系重叠散点图(OverlayScatter)yyyy-M-yyyy-M-2-74统计学统计学STATISTICS(第四版第四版)两个变量间的关系矩阵散点图(MatrixScatter)yyyy-M-yyyy-M-2-75统计学统计学STATISTICS(第四版第四版)比较多个样本的相似性雷达图(radarchart)1.也称为蜘蛛图(spiderchart)2.从一个点出发,用每一条射线代表一个变量,多个变量的数据点连接成线,即围成一个区域,多个样本围成多个区域,就是雷达图3.可用于研究多个样本在多个变量上的相似程度4.当多个变量的取值相差较大或量纲不同时,可进行变换处理后再做图。线性变换:对数变换:yyyy-M-yyyy-M-2-76统计学统计学STATISTICS(第四版第四版)多变量数据雷达图(例题分析)yyyy-M-yyyy-M-【例例2-6】20062006年年我我国国东东部部、中中部部、西西部部及及东东北北地地区区城城镇镇居居民民的的生生活活消消费费支支出出数数据据如如表表2828所所示示。绘绘制制雷雷达达图图,比比较较不不同同地地区区的的消消费费支出构成支出构成 2-77统计学统计学STATISTICS(第四版第四版)多变量数据雷达图(例题分析原始数据)yyyy-M-yyyy-M-1.四个地区城镇居民消费支出中,食品支出额都是最多的,杂项商品与服务支出额则是最少的2.东部地区城镇居民的各项支出额普遍高于其他三个地区,而中部、西部和东北地区的各项支出则相差不大3.四个地区各项支出额的结构具有很大的相似性2-78统计学统计学STATISTICS(第四版第四版)多变量数据雷达图(例题分析标准化变换)yyyy-M-yyyy-M-1.更适宜分析多个样本在多个变量上的差异2.东部地区城镇居民的各项支出额普遍高于其他三个地区,而中部、西部和东北地区的各项支出则相差不大3.四个地区各项支出额的结构具有很大的相似性2-79统计学统计学STATISTICS(第四版第四版)比较多个样本的相似性平行坐标图(轮廓图)1.20世纪90年代初由Inselberg和Dimsdale提出的展示多元数据的图示方法2.将各变量用一系列平行的横坐标轴表示,变量值对应纵轴上的位置3.可用于研究多个样本在多个变量上的相似程度或变量间的相互关系yyyy-M-yyyy-M-2-80统计学统计学STATISTICS(第四版第四版)多变量数据轮廓线图(例题分析比较样本:地区)yyyy-M-yyyy-M-1.四个地区城镇居民消费支出中,食品支出额都是最多的,杂项商品与服务支出额则是最少的2.东部地区城镇居民的各项支出额普遍高于其他三个地区,而中部、西部和东北地区的各项支出则相差不大3.四个地区各项支出额的结构具有很大的相似性2-81统计学统计学STATISTICS(第四版第四版)多变量数据轮廓线图(例题分析比较变量:各项支出)yyyy-M-yyyy-M-1.四个地区城镇居民消费支出中,食品支出额都是最多的,杂项商品与服务支出额则是最少的2.东部地区城镇居民的各项支出额普遍高于其他三个地区,而中部、西部和东北地区的各项支出则相差不大3.四个地区各项支出额的结构具有很大的相似性2.3 合理使用图表合理使用图表第第 2 章章 用图表展示数据用图表展示数据2-83统计学统计学STATISTICS(第四版第四版)鉴别图表优劣的准则1.一张好的图表应包括以下基本特征显示数据让读者把注意力集中在图表的内容上,而不是制作图表的程序上避免歪曲强调数据之间的比较服务于一个明确的目的有对图表的统计描述和文字说明2.5种鉴别图表优劣的准则:一张好的图表应当精心设计、有助于洞察问题的实质使复杂的观点得到简明、确切、高效的阐述能在最短的时间内以最少的笔墨给读者提供最大量的信息是多维的表述数据的真实情况yyyy-M-yyyy-M-2-84统计学统计学STATISTICS(第四版第四版)本章小结l定性数据的频数分布表l定性数据的图示方法l定量数据的频数分布表l定量数据的图示方法l用Excel和SPSS作频数分布表和图形l合理使用图表yyyy-M-yyyy-M-结结 束束
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!