统计学--数据的整理及图表展示课件

上传人:29 文档编号:241901702 上传时间:2024-08-04 格式:PPT 页数:65 大小:1.11MB
返回 下载 相关 举报
统计学--数据的整理及图表展示课件_第1页
第1页 / 共65页
统计学--数据的整理及图表展示课件_第2页
第2页 / 共65页
统计学--数据的整理及图表展示课件_第3页
第3页 / 共65页
点击查看更多>>
资源描述
第第3章章 数据的整理与数据的整理与 图表展示图表展示3.1 数据的预处理数据的预处理3.2 品质数据的整理与展示品质数据的整理与展示3.3 数值型数据的整理与展示数值型数据的整理与展示1第第3章章 数据的整理与数据的整理与 图表展示图表展示3.1 数数3.1 数据的预处理数据的预处理1.数据审核数据审核 发现数据中的错误发现数据中的错误2.数据筛选数据筛选 找出符合条件的数据找出符合条件的数据3.数据排序数据排序发现数据的基本特征发现数据的基本特征升序和降序升序和降序23.1 数据的预处理数据的预处理1.数据审核数据审核2 数据筛选数据筛选例例3.1 3.1 表表3-13-1是是8 8名学生名学生4 4门课程的考试成绩门课程的考试成绩数据(单位:分)。试找出数据(单位:分)。试找出(1 1)统计学成绩等于)统计学成绩等于8080分的学生分的学生(2 2)数学成绩最高的前三名学生,英语成绩)数学成绩最高的前三名学生,英语成绩最低的三名学生最低的三名学生(3 3)统计学成绩在)统计学成绩在80-9080-90之间的学生之间的学生(4 4)四门课程成绩都大于)四门课程成绩都大于7070分的学生分的学生3 数据筛选例数据筛选例3.1 表表3-1是是8名学生名学生4门课程的考试成绩门课程的考试成绩数据排序数据排序1.分类数据的排序分类数据的排序字字母母型型数数据据,排排序序有有升升序序降降序序之之分分,但但习习惯上用升序惯上用升序汉汉字字型型数数据据,可可按按汉汉字字的的首首位位拼拼音音字字母母排排列列,也也可可按按笔笔画画排排序序,其其中中也也有有笔笔画画多多少少的升序降序之分的升序降序之分2.数值型数据的排序数值型数据的排序4数据排序数据排序1.分类数据的排序分类数据的排序4 分类汇总分类汇总 根据不同的研究目的,按照某个类别进根据不同的研究目的,按照某个类别进行汇总分析。行汇总分析。分类汇总之前要先按分类项排序。分类汇总之前要先按分类项排序。简单分类汇总简单分类汇总 多级分类汇总多级分类汇总5 分类汇总分类汇总 根据不同的研究目的,按照某个类别进行汇根据不同的研究目的,按照某个类别进行汇数据透视表数据透视表 利用数据透视表可以按照研究目的不同,利用数据透视表可以按照研究目的不同,进行交叉汇总分析,使研究者可以从各种进行交叉汇总分析,使研究者可以从各种角度、维度去查看分析数据,从繁杂的数角度、维度去查看分析数据,从繁杂的数据中挖掘和整合数据。据中挖掘和整合数据。6数据透视表数据透视表 利用数据透视表可以按照研究目的不利用数据透视表可以按照研究目的不 例例3.2 在某大学随机抽取在某大学随机抽取30名学生,调查名学生,调查他们的性别、家庭所在地、平均月生活费他们的性别、家庭所在地、平均月生活费支出、平均每月购买衣物支出和购买衣物支出、平均每月购买衣物支出和购买衣物时所考虑的首选因素等,得到的数据如表时所考虑的首选因素等,得到的数据如表3-2,试建立一个数据透视表,在表的行变量试建立一个数据透视表,在表的行变量中给出性别和买衣物的首选因素,在列变中给出性别和买衣物的首选因素,在列变量中给出学生的家庭所在地区,对平均月量中给出学生的家庭所在地区,对平均月生活费和月平均衣物支出进行交叉汇总。生活费和月平均衣物支出进行交叉汇总。7 例例3.2 在某大学随机抽取在某大学随机抽取30名学生,调查他们的性别名学生,调查他们的性别3.2 品质数据的整理与展示品质数据的整理与展示 3.2.1 分类数据的整理与图示分类数据的整理与图示 1.列出各类别列出各类别 2.计算各类别的频数计算各类别的频数 3.制作频数分布表制作频数分布表 4.用图形展示用图形展示83.2 品质数据的整理与展示品质数据的整理与展示 3.2.1 分类数据的整理分类数据的整理分类数据中需要计算的指标分类数据中需要计算的指标1.1.频频 数:落在各类别中的数据个数数:落在各类别中的数据个数 频数分布:把各个类别及落在其中的相应频频数分布:把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来。数全部列出,并用表格形式表现出来。2.2.比比 例:某一类别数据占全部数据的比值例:某一类别数据占全部数据的比值3.3.百分比:将对比的基数作为百分比:将对比的基数作为100100而计算的比值而计算的比值4.4.比比 率:不同类别数值之间的比值率:不同类别数值之间的比值9分类数据中需要计算的指标分类数据中需要计算的指标1.频频 数:落在各类别中的数据个数数:落在各类别中的数据个数9【例例3.3】一家市场调查公司为研究不同品牌一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市饮料的市场占有率,对随机抽取的一家超市进行调查。调查员随机观察了进行调查。调查员随机观察了50名顾客购买名顾客购买饮料类型及购买者性别,并进行了记录,如饮料类型及购买者性别,并进行了记录,如果一个顾客购买某一品牌的饮料,就将这一果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次。数据见饮料的品牌名字记录一次。数据见Excel表。表。要求:对饮料类型和顾客性别的分布状况进要求:对饮料类型和顾客性别的分布状况进行描述分析,求不同品牌饮料的频数分布、行描述分析,求不同品牌饮料的频数分布、比例和百分比。比例和百分比。10【例【例3.3】一家市】一家市场调查场调查公司公司为为研究不同品牌研究不同品牌饮饮料的市料的市场场占有率,占有率,方法一:数据透视表方法方法一:数据透视表方法利用数据透视表功能,进行频数分析。在数据透视表【布局】对话框中,依次将“饮料类型”拖到“行”区域以及“数据”区域,将“顾客性别”拖到“列”区域。11方法一:数据透方法一:数据透视视表方法利用数据透表方法利用数据透视视表功能,表功能,进进行行频频数分析。数分析。11方法二:方法二:EXCEL中的函数功能中的函数功能插入插入 函数函数 数一数数一数 COUNT IF要计算某一类别的频数要计算某一类别的频数12方法二:方法二:EXCEL中的函数功能插入中的函数功能插入 函数函数 COU分类数据的图示分类数据的图示条形图条形图 条条形形图图是是用用宽宽度度相相同同的的条条形形的的高高度度或长短来表示数据多少的图形或长短来表示数据多少的图形 各各类类别别可可以以放放在在纵纵轴轴,称称为为条条形形图图,也也可以放在横轴,称为柱形图可以放在横轴,称为柱形图 对对比比条条形形图图(复复式式条条形形图图):显显示示分分类类变变量量在在不不同同时时间间或或不不同同空空间间上上的的差差异异或或变化变化13分类数据的图示条形图分类数据的图示条形图1314141515复式条形图复式条形图16复式条形图复式条形图16对比条形图电脑品牌销售量联想IBM索尼戴尔0100200300400500600电脑销售是的对比条形图一季度二季度17对比条形图对比条形图17分类数据的图示帕累托图1.按各类别数据出现的频数多少排序后绘制的柱形图 2.主要用于展示分类数据的分布18分类数据的图示分类数据的图示帕累托图按各类别数据出现的频数多少排序后绘制帕累托图按各类别数据出现的频数多少排序后绘制饼饼 图图1.饼饼图图:用用圆圆形形及及圆圆内内扇扇形形的的面面积积来来表表示示数值大小的图形。数值大小的图形。2.主主要要用用于于表表示示总总体体中中各各组组成成部部分分所所占占的的比例,对于研究结构性问题十分有用比例,对于研究结构性问题十分有用3.在在绘绘制制圆圆形形图图时时,总总体体中中各各部部分分所所占占的的百百分分比比用用圆圆内内的的各各个个扇扇形形面面积积表表示示,这这些些扇扇形形的的中中心心角角度度,是是按按各各部部分分百百分分比比占占3600的相应比例确定的的相应比例确定的19饼饼 图饼图:用圆形及圆内扇形的面积来表示数值大小的图形。图饼图:用圆形及圆内扇形的面积来表示数值大小的图形。192020环形图环形图1.环环形形图图中中间间有有一一个个“空空洞洞”,总总体体中中的的每一部分数据用环中的一段表示每一部分数据用环中的一段表示2.环形图与饼图类似,但又有区别环形图与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例饼图只能显示一个总体各部分所占的比例环环形形图图则则可可以以同同时时绘绘制制多多个个总总体体的的数数据据系系列,每一个总体的数据系列为一个环列,每一个总体的数据系列为一个环3.环形图可用于进行比较研究环形图可用于进行比较研究 4.环形图可用于展示分类数据和顺序数据环形图可用于展示分类数据和顺序数据21环形图环形图中间有一个环形图环形图中间有一个“空洞空洞”,总体中的每一部分数据用环中的,总体中的每一部分数据用环中的8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 图图3-4 3-4 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价22228%36%31%15%7%33%26%21%13%10%非非3.2.2 顺序数据的整理与图示顺序数据的整理与图示1.累积频数:将各有序类别的频数逐级累加累积频数:将各有序类别的频数逐级累加起来得到的频数。起来得到的频数。向上累积:从类别顺序的开始一方,向类别向上累积:从类别顺序的开始一方,向类别 顺序的最后一方累加频数;顺序的最后一方累加频数;向下累积:从类别顺序的最后一方,向类别向下累积:从类别顺序的最后一方,向类别 顺序的开始一方累加频数。顺序的开始一方累加频数。2.累积频率:将各类别的百分比逐级累加累积频率:将各类别的百分比逐级累加233.2.2 顺序数据的整理与图示累积频数:将各有序类别的频数顺序数据的整理与图示累积频数:将各有序类别的频数【例例例例3.53.5】在一项城市住房问题的研在一项城市住房问题的研在一项城市住房问题的研在一项城市住房问题的研究中,研究人员在甲乙两个城市究中,研究人员在甲乙两个城市究中,研究人员在甲乙两个城市究中,研究人员在甲乙两个城市各抽样调查各抽样调查各抽样调查各抽样调查300300户,其中的一个问户,其中的一个问户,其中的一个问户,其中的一个问题是:题是:题是:题是:“您对您家庭目前的住房您对您家庭目前的住房您对您家庭目前的住房您对您家庭目前的住房状况是否满意?状况是否满意?状况是否满意?状况是否满意?1 1非常不满意;非常不满意;非常不满意;非常不满意;2 2不满意;不满意;不满意;不满意;3 3一般;一般;一般;一般;4 4满意;满意;满意;满意;5 5非常满意。非常满意。非常满意。非常满意。24【例【例3.5】在一】在一项项城市住房城市住房问题问题的研究中,研究人的研究中,研究人员员在甲乙两个城在甲乙两个城甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计合计300100.025甲城市家庭甲城市家庭对对住房状况住房状况评评价的价的频频数分布回答数分布回答类别类别甲城市甲城市户户数百分比向数百分比向乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意209812040226.732.74013.37.3合计合计300100.026乙城市家庭乙城市家庭对对住房状况住房状况评评价的价的频频数分布回答数分布回答类别类别乙城市乙城市户户数百分比向数百分比向乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意209812040226.732.74013.37.3201182382783006.739.479.492.7100300280182622210093.360.620.67.3合计合计300100.027乙城市家庭乙城市家庭对对住房状况住房状况评评价的价的频频数分布回答数分布回答类别类别乙城市乙城市户户数百分比向数百分比向243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向上累积向上累积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向下累积向下累积甲城市家庭对住房状况评价的累积频数分布图甲城市家庭对住房状况评价的累积频数分布图甲城市家庭对住房状况评价的累积频数分布图甲城市家庭对住房状况评价的累积频数分布图2828243001322252700100200300400 非常非常3.3 数值型数据的整理与显示数值型数据的整理与显示 3.3.1 数据的分组数据的分组 293.3 数值型数据的整理与显示数值型数据的整理与显示 3.3.1 数据的分组数据的分组单变量值分组单变量值分组(要点)(要点)适合于离散变量适合于离散变量适合于变量值较少的情况适合于变量值较少的情况 步骤:步骤:排序排序将一个变量将一个变量值作为一组值作为一组30单变量值分组单变量值分组(要点)(要点)适合于离散变量适合于离散变量 排序将一个排序将一个 117 122 124 129 139 107 117 117 122 124 129 139 107 117 117 122 124 129 139 107 117 130 122 125 108 131 125 117130 122 125 108 131 125 117130 122 125 108 131 125 117122 133 126 122 118 108 110122 133 126 122 118 108 110122 133 126 122 118 108 110118 123 126 133 134 127 123118 123 126 133 134 127 123118 123 126 133 134 127 123118 112 112 134 127 123 119 118 112 112 134 127 123 119 118 112 112 134 127 123 119 113 120 123 127 135 137 114 113 120 123 127 135 137 114 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121120 128 124 115 139 128 124 121120 128 124 115 139 128 124 121【例例例例3.63.6】某某某某生生生生 产产产产 车车车车 间间间间 5050名名名名工工工工人人人人日日日日加加加加工工工工零零零零件件件件数数数数如如如如下下下下(单单单单位位位位:个个个个)。试试试试采采采采用用用用单单单单变变变变量量量量值值值值对对对对数数数数据据据据进进进进行行行行分组。分组。分组。分组。31 117 122 124 129 139 107107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 13932107 108 108 110 112 某车间某车间某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表名工人日加工零件数分组表零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)10710811011211311411511711812121113311912012112212312412512612712144322312812913013113313413513713921112211233某车间某车间50名工人日加工零件数分组表零件数频数零件数频数零件数名工人日加工零件数分组表零件数频数零件数频数零件数组距分组组距分组(要点)(要点)适合于连续变量n n适合于变量值较多的情况n n将变量值的一个区间作为一组n n可采用等距分组,也可采用不等距分组 34组距分组组距分组(要点)(要点)适合于连续变量适合于连续变量 组距分组组距分组(几个概念)(几个概念)1.下下 限:一个组的最小值限:一个组的最小值2.上上 限:一个组的最大值限:一个组的最大值3.组组 距:上限与下限之差距:上限与下限之差4.组中值:下限与上限之间的中点值组中值:下限与上限之间的中点值下限值下限值+上限值上限值2组中值组中值35组距分组组距分组(几个概念)(几个概念)1.下下 限:一个组的最小值下限:一个组的最小值下组距分组组距分组第第1步:排序,确定组数(步:排序,确定组数(K)5K15 能够显示数据的分布特征和规律能够显示数据的分布特征和规律第第2步:确定组距步:确定组距 组距(最大值最小值)组距(最大值最小值)组数组数 组距宜取组距宜取5 5或或1010的倍数的倍数 36组距分组第组距分组第1步:排序,确定组数(步:排序,确定组数(K)36 第一组的下限应低于最小值,第一组的下限应低于最小值,最后一组的上限应高于最大值。最后一组的上限应高于最大值。遵循遵循“不重不漏不重不漏”的原则的原则 第第3步:根据分组整理成频数分布表步:根据分组整理成频数分布表上组限不在内上组限不在内37 第一组的下限应低于最小值,上组限不在内第一组的下限应低于最小值,上组限不在内37等距分组表等距分组表(上下组限间断)(上下组限间断)表表3-6 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105109110114115119120124125129130134135139358141064610162820128合计合计5010038等距分组表等距分组表(上下组限间断)表(上下组限间断)表3-6 某车间某车间50名工人名工人等距分组表等距分组表(上下组限重叠)(上下组限重叠)表表3-5 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105110110115115120120125125130130135135140358141064610162820128合计合计5010039等距分组表等距分组表(上下组限重叠)表(上下组限重叠)表3-5 某车间某车间50名工人名工人等距分组表等距分组表(使用开口组)(使用开口组)表表3-7 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)110以下以下110115115120120125125130130135135以上以上358141064610162820128合计合计5010040等距分组表等距分组表(使用开口组)表(使用开口组)表3-7 某车间某车间50名工人日名工人日用用Excel制作数值型数据的频数分布表制作数值型数据的频数分布表【工具工具】【数据分析数据分析】【直方图直方图】【输入区域输入区域】:输入原始数据区域:输入原始数据区域 【接收区域接收区域】:输入各组的上限值:输入各组的上限值 【输出区域输出区域】:选择一个空白单元格:选择一个空白单元格(想要把(想要把输出的结果放在那里)输出的结果放在那里)【柏拉图柏拉图】、【累积百分率累积百分率】(不需要时,可(不需要时,可不选)不选)选择选择【图表输出图表输出】41用用Excel制作数值型数据的频数分布表【工具】制作数值型数据的频数分布表【工具】【数据分【数据分 利用利用FREQUENCYFREQUENCY函数,制作频数分布表函数,制作频数分布表 FREQUENCYFREQUENCY(Data_array,Bins_array)Data_array,Bins_array)Data_array Data_array为计算频数的数据区域或数组为计算频数的数据区域或数组 Bins_arrayBins_array为数据接收区间的数组,即指定为数据接收区间的数组,即指定的各分组的组上限值。的各分组的组上限值。注意:注意:1.FREQUENCY1.FREQUENCY函数返回的是一个数组;函数返回的是一个数组;2.2.在输入函数前,应选定返回数组的区域;在输入函数前,应选定返回数组的区域;3.3.函数录入以后,应按住函数录入以后,应按住Ctrl+Shift+Ctrl+Shift+回车(确定)回车(确定)42 利用利用FREQUENCY函数,制作频数分布表函数,制作频数分布表42分组数据分组数据直方图直方图1.用用矩矩形形的的宽宽度度和和高高度度来来表表示示频频数数分分布布的的图图形形,实实际际上上是是用用矩矩形形的的面面积积来来表表示示各各组的频数分布组的频数分布2.在在直直角角坐坐标标中中,用用横横轴轴表表示示数数据据分分组组,纵纵轴轴表表示示频频数数或或频频率率,各各组组与与相相应应的的频频数数 就就 形形 成成 了了 一一 个个 矩矩 形形,即即 直直 方方 图图(Histogram)43分组数据分组数据直方图用矩形的宽度和高度来表示频数分布的图形,实际直方图用矩形的宽度和高度来表示频数分布的图形,实际直方图与条形图的区别直方图与条形图的区别1.1.条条形形图图是是用用条条形形的的长长度度(横横置置时时)表表示示各各类类别别频频数数的的多多少少,其其宽宽度度(表表示示类类别别)则则是是固固定定的的;直直方方图图是是用用面面积积表表示示各各组组频频数数的的多多少少,矩矩形形的的高高度度表表示示每每一一组组的的频频数数或或百百分分比比,宽宽度度则则表表示示各各组组的的组组距距,其其高高度度与与宽宽度均有意义。度均有意义。2.2.直直方方图图的的各各矩矩形形通通常常是是连连续续排排列列,条条形形图图则是分开排列。则是分开排列。3.3.条条形形图图主主要要用用于于展展示示分分类类数数据据,而而直直方方图图则主要用于展示数值型数据。则主要用于展示数值型数据。44直方图与条形图的区别条形图是用条形的长度直方图与条形图的区别条形图是用条形的长度(横置时横置时)表示各类别表示各类别分组数据分组数据折线图折线图1.折线图也称频数多边形图折线图也称频数多边形图(Frequency polygon)2.是是在在直直方方图图的的基基础础上上,把把直直方方图图顶顶部部的的中中点点(组组中值中值)用直线连接起来,再把原来的直方图抹掉用直线连接起来,再把原来的直方图抹掉3.折折线线图图的的两两个个终终点点要要与与横横轴轴相相交交,具具体体的的做做法法是是第第一一个个矩矩形形的的顶顶部部中中点点通通过过竖竖边边中中点点(即即该该组组频频数数一一半半的的位位置置)连连接接到到横横轴轴,最最后后一一个个矩矩形形顶顶部部中中点点与与其其竖边中点连接到横轴竖边中点连接到横轴折折线线图图下下所所围围成成的的面面积积与与直直方方图图的的面面积积相相等等,二二者者所所表示的频数分布是一致的表示的频数分布是一致的45分组数据分组数据折线图折线图也称频数多边形图折线图折线图也称频数多边形图(Frequency 151512129 96 63 3105105 110110 115115 120120 125125 130130 135135 140140日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数(个个个个个个)频频频频频频数数数数数数(人人人人人人)折线图下的面积折线图下的面积折线图下的面积折线图下的面积与直方图的面积与直方图的面积与直方图的面积与直方图的面积相等!相等!相等!相等!某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图46151296310511011512012513013514未分组数据未分组数据 茎叶图茎叶图1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.由由“茎茎”和和“叶叶”两两部部分分构构成成,其其图图形形是是由数字组成的由数字组成的3.以以该该组组数数据据的的高高位位数数值值作作树树茎茎,低低位位数数字字作树叶作树叶4.茎叶图类似于横置的直方图,但又有区别茎叶图类似于横置的直方图,但又有区别直直方方图图可可大大体体上上看看出出一一组组数数据据的的分分布布状状况况,但但没有给出具体的数值没有给出具体的数值茎茎叶叶图图既既能能给给出出数数据据的的分分布布状状况况,又又能能给给出出每每一个原始数值,保留了原始数据的信息一个原始数值,保留了原始数据的信息47未分组数据未分组数据 茎叶图用于显示未分组的原始数据的分布茎叶图用于显示未分组的原始数据的分布47107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 13948107 108 108 110 112 树茎树茎树茎树茎 树叶树叶树叶树叶788788022347778889022347778889001222233334445566777889001222233334445566777889013344579901334457991010111112121313数据个数数据个数数据个数数据个数3 3131324241010茎叶图类似横置茎叶图类似横置茎叶图类似横置茎叶图类似横置的直方图的直方图的直方图的直方图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图49树茎树叶树茎树叶78802234777888900122223333零件数零件数 Stem-and-Leaf Plot Frequency Stem&Leaf 3.00 10.788 5.00 11.02234 8.00 11.57778889 14.00 12.00122223333444 10.00 12.5566777889 6.00 13.013344 4.00 13.5799 Stem width:10 Each leaf:1 case(s)5050未分组数据未分组数据箱线图箱线图1.箱箱线线图图由由一一组组数数据据的的5个个特特征征值值绘绘制制而而成成,它由一个箱子和两条线段组成它由一个箱子和两条线段组成2.其绘制方法是:其绘制方法是:首首先先找找出出一一组组数数据据的的5个个特特征征值值,即即最最大大值值、最最小小值值、中中位位数数Me 和和两两个个四四分分位位数数(下下四四分分位数位数QL和上四分位数和上四分位数QU)连连接接两两个个四四分分位位数数画画出出箱箱子子,再再将将两两个个极极值值点与箱子相连接点与箱子相连接 51未分组数据未分组数据箱线图箱线图1.箱线图由一组数据的箱线图由一组数据的5个特征值绘制而成个特征值绘制而成中位数中位数中位数中位数4 46 68 810101212QQU UUQQL LLX X最大值最大值最大值最大值最大值最大值X X最小值最小值最小值最小值最小值最小值简单箱线图简单箱线图简单箱线图简单箱线图52中位数中位数4681012QUQLX最大值最大值X最小值简单箱线图最小值简单箱线图52分布的形状与箱线图分布的形状与箱线图 不同分布的箱线图不同分布的箱线图不同分布的箱线图不同分布的箱线图左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布Q QQ L L L中位数中位数中位数中位数中位数中位数 Q QQU UULeft-skewed distributionLeft-skewed distributionLeft-skewed distribution右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布Q QQL LL 中位数中位数中位数中位数中位数中位数 Q QQU UURight-skewed distributionRight-skewed distributionRight-skewed distribution对称分布对称分布对称分布对称分布对称分布对称分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UUBell-shaped distributionBell-shaped distributionBell-shaped distribution53分布的形状与箱线图分布的形状与箱线图 不同分布的箱线图左偏分布不同分布的箱线图左偏分布Q L中位数中位数 未分组数据多批数据箱线图【例例】从从某某大大学学经经济济管管理理专专业业二二年年级级学学生生中中随随机机抽抽取取11人人,对对8门门主主要要课课程程的的考考试试成成绩绩进进行行调调查查,所所得得结结果果如如表表。试试绘绘制制各各科科考考试试成成绩绩的的比比较较箱箱线线图图,并并分分析析各各科科考考试试成成绩的分布特征绩的分布特征1111名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称学生编号学生编号1234567891011英语英语经济数学经济数学西方经济学西方经济学市场营销学市场营销学财务管理财务管理基础会计学基础会计学统计学统计学计算机应用基础计算机应用基础7665937468705585909581877573917897517685709268817174886984657395707866907378847093637980608781678691837776907082838292848170697278757891886694808571867468796281815578707568717754未分组数据未分组数据多批数据箱线图【例】多批数据箱线图【例】从某大学经济管理专业二年级从某大学经济管理专业二年级8门课程考试成绩的门课程考试成绩的Median/Quart./Range箱线图箱线图558门课程考试成绩的门课程考试成绩的Median/Quart./Range箱线箱线时间序列数据时间序列数据线图线图线图主要用于反映现象随时间变化的特征线图主要用于反映现象随时间变化的特征绘制线图时应注意以下几点绘制线图时应注意以下几点1.时间一般绘在横轴,指标数据绘在纵轴时间一般绘在横轴,指标数据绘在纵轴2.图图形形的的长长宽宽比比例例要要适适当当,其其长长宽宽比比例例大大致致为为10:73.一一般般情情况况下下,纵纵轴轴数数据据下下端端应应从从“0”开开始始,以以便便于于比比较较。数数据据与与“0”之之间间的的间间距距过过大大时时,可可以采取折断的符号将纵轴折断以采取折断的符号将纵轴折断56时间序列数据时间序列数据线图线图主要用于反映现象随时间变化的特征线图线图主要用于反映现象随时间变化的特征56【例例例例3.53.5】已知已知已知已知2006200620152015年我国城乡居年我国城乡居年我国城乡居年我国城乡居民家庭的人均民家庭的人均民家庭的人均民家庭的人均收入数据如表收入数据如表收入数据如表收入数据如表3-173-17。试绘制。试绘制。试绘制。试绘制线图线图线图线图¥年份年份农村城镇消费水平农村城镇消费水平城镇居民消费水平城镇居民消费水平20062006306630661073910739200720073538353812480124802008200840654065140611406120092009440244021512715127201020104941494117104171042011201161876187199121991220122012696469642186121861201320137773777323609236092014201487118711254242542420152015967996792721027210表表3-17 2006-2015年我国城乡居民人均消费水平年我国城乡居民人均消费水平57【例【例3.5】已知】已知20062015年我国城乡居民家庭的人均收年我国城乡居民家庭的人均收图图3-23 我国城乡居民人均消费水平我国城乡居民人均消费水平58图图3-23 我国城乡居民人均消费水平我国城乡居民人均消费水平58多变量数据的图示多变量数据的图示1.散点图:用二维坐标展示两个变量之间关系的图散点图:用二维坐标展示两个变量之间关系的图形。每组数据(形。每组数据(xi,yi)在坐标系中用一个点表示。)在坐标系中用一个点表示。2.气泡图:可用于展示三个变量之间的关系,一个气泡图:可用于展示三个变量之间的关系,一个变量放在变量放在x轴,另一个变量放在轴,另一个变量放在y轴,第三个变量轴,第三个变量用气泡的大小表示。用气泡的大小表示。3.雷达图:可显示多个变量之间的关系,也称为蜘雷达图:可显示多个变量之间的关系,也称为蜘蛛图。蛛图。59多变量数据的图示多变量数据的图示1.散点图:用二维坐标展示两个变量之间关系散点图:用二维坐标展示两个变量之间关系60606161雷达图的制作雷达图的制作 设有设有n组样本组样本S1,S2,Sn,每个样本测得,每个样本测得P个变个变量量X1,X2,Xp,要绘制这,要绘制这P个变量的雷达图,其个变量的雷达图,其具体做法是具体做法是 先做一个圆,然后将圆先做一个圆,然后将圆先做一个圆,然后将圆先做一个圆,然后将圆P P等分,得到等分,得到等分,得到等分,得到P P个点,令个点,令个点,令个点,令这这这这P P个点分别对应个点分别对应个点分别对应个点分别对应P P个变量,在将这个变量,在将这个变量,在将这个变量,在将这P P个点与圆心个点与圆心个点与圆心个点与圆心连线,得到连线,得到连线,得到连线,得到P P个幅射状的半径,这个幅射状的半径,这个幅射状的半径,这个幅射状的半径,这P P个半径分别作个半径分别作个半径分别作个半径分别作为为为为P P个变量的坐标轴,每个变量值的大小由半径上个变量的坐标轴,每个变量值的大小由半径上个变量的坐标轴,每个变量值的大小由半径上个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示的点到圆心的距离表示的点到圆心的距离表示的点到圆心的距离表示 再将同一样本的值在再将同一样本的值在再将同一样本的值在再将同一样本的值在P P个坐标上的点连线。这样,个坐标上的点连线。这样,个坐标上的点连线。这样,个坐标上的点连线。这样,n n个样本形成的个样本形成的个样本形成的个样本形成的n n个多边形就是一个雷达图个多边形就是一个雷达图个多边形就是一个雷达图个多边形就是一个雷达图62雷达图的制作雷达图的制作 设有设有n组样本组样本S1,S2,Sn,每个样本,每个样本0500100015002000 食品食品 衣着衣着 家庭设备用家庭设备用 品及服务品及服务 医疗保健医疗保健 交通通讯交通通讯 娱乐教育娱乐教育 文化服务文化服务 居住居住 杂项商品杂项商品 与服务与服务城镇居民农村居民 图图3-15 1997年城镇居民家庭消费支出年城镇居民家庭消费支出 (元)(元)630500100015002000 食品食品 6464统计表的结构统计表的结构表表表表3-20 20023-20 200220032003年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料项目项目单位单位2002年年 2003年年 调查户数调查户数 平均每户家庭人口平均每户家庭人口 平均每户就业人口平均每户就业人口 平均每户就业面平均每户就业面 平均一名就业者负担人数平均一名就业者负担人数 平均每人全部年收入平均每人全部年收入 可支配收入可支配收入 平均每人消费性支出平均每人消费性支出户户人人人人%人人元元元元元元453173.041.5851.971.928177.407702.806029.88480283.011.5852.491.919061.228472.206510.94资料来源:中国统计年鉴2004,中国统计出版社,2004,第359页。注:本表为城市和县城的城镇居民家庭抽样调查资料。65统计表的结构表统计表的结构表3-20 20022003年城镇居民年城镇居民
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!