统计学数据整理课件

上传人:文**** 文档编号:241569491 上传时间:2024-07-05 格式:PPT 页数:63 大小:512.83KB
返回 下载 相关 举报
统计学数据整理课件_第1页
第1页 / 共63页
统计学数据整理课件_第2页
第2页 / 共63页
统计学数据整理课件_第3页
第3页 / 共63页
点击查看更多>>
资源描述
2024/7/5一、数据的预处理一、数据的预处理二、数据的分组二、数据的分组三、品质数据的整理与显示三、品质数据的整理与显示四、数值型数据的整理与显示四、数值型数据的整理与显示五、统计表五、统计表第二章:数据的整理第二章:数据的整理本讲主要内容学习导航本讲主要内容学习导航数据的整理是数据收集与数据分析之间的中间环节数据的整理是数据收集与数据分析之间的中间环节数据整理是对收集来的数据进行加工整理使之符合数据整理是对收集来的数据进行加工整理使之符合统计分析的需要。如对数据进行图表显示,以发现数统计分析的需要。如对数据进行图表显示,以发现数据中的基本规律。据中的基本规律。数据整理的中心任务就是分组与编制频数分布表数据整理的中心任务就是分组与编制频数分布表2023/8/13一、数据的预处理第二章:数据的整理本讲主要一、数据的预处理第二章:数据的整理本讲主要统计整理的概念和意义统计整理的概念和意义 统计整理统计整理根据统计研究的任务,对统计调查所根据统计研究的任务,对统计调查所收集到的大量原始资料进行加工汇总,使其系统收集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合化、条理化、科学化,以得出反映事物总体综合特征的数据资料的工作过程。特征的数据资料的工作过程。统计整理是统计调查的继续,是统计分析统计整理是统计调查的继续,是统计分析的前提和基础,在整个统计工作中,发挥着承上的前提和基础,在整个统计工作中,发挥着承上启下的作用。启下的作用。统计整理的概念和意义统计整理的概念和意义数据的预处理数据的预处理数据的审核数据的审核发现数据中的错误发现数据中的错误数据的筛选数据的筛选找出符合条件的数据找出符合条件的数据数据排序数据排序发现数据的基本特征发现数据的基本特征升序和降序升序和降序数据的预处理数据的审核数据的预处理数据的审核数据的预处理数据的预处理数据的审核数据的审核(对原始数据对原始数据)-审核的内容审核的内容完整性审核完整性审核检查应调查的单位或个体是否有遗漏检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全所有的调查项目或指标是否填写齐全准确性审核准确性审核检查数据是否真实反映客观实际情况,内容是否符合实际检查数据是否真实反映客观实际情况,内容是否符合实际检查数据是否有错误,计算是否正确等检查数据是否有错误,计算是否正确等审核数据准确性的方法审核数据准确性的方法逻辑检查逻辑检查从定性角度,审核数据是否符合逻辑,内容是否合理,各从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象项目或数字之间有无相互矛盾的现象主要用于对定类数据和定序数据的审核主要用于对定类数据和定序数据的审核计算检查计算检查检查调查表中的各项数据在计算结果和计算方法上有无错检查调查表中的各项数据在计算结果和计算方法上有无错误误主要用于对定距和定比数据的审核主要用于对定距和定比数据的审核数据的预处理数据的审核数据的预处理数据的审核(对原始数据对原始数据)-审核的内容审核的内容数据的预处理数据的预处理数据的审核数据的审核(对第二手数据对第二手数据)适用性审核适用性审核弄清楚数据的来源、数据的口径以及有关的背景弄清楚数据的来源、数据的口径以及有关的背景材料材料确定这些数据是否符合自己分析研究的需要确定这些数据是否符合自己分析研究的需要时效性审核时效性审核应尽可能使用最新的统计数据应尽可能使用最新的统计数据确认是否必要做进一步的加工整理确认是否必要做进一步的加工整理数据的预处理数据的审核数据的预处理数据的审核(对第二手数据对第二手数据)数据的预处理数据的预处理数据的筛选数据的筛选对审核过程中发现的错误应尽可能予以纠正对审核过程中发现的错误应尽可能予以纠正当发现数据中的错误不能予以纠正,或者有些数据不当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛符合调查的要求而又无法弥补时,需要对数据进行筛选选数据筛选的内容包括:数据筛选的内容包括:将某些不符合要求的数据或有明显错误的数据予以剔除将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出数据予以剔出操作演示操作演示(调用调用Excel文件文件:数据的筛选数据的筛选)数据的预处理数据的筛选数据的预处理数据的筛选数据的预处理数据的预处理数据的排序数据的排序(要点要点)按一定顺序将数据排列,以发现一些明显的特征或趋势,找到按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索解决问题的线索排序有助于对数据检查纠错,以及为重新归类或分组等提供依排序有助于对数据检查纠错,以及为重新归类或分组等提供依据据在某些场合,排序本身就是分析的目的之一在某些场合,排序本身就是分析的目的之一排序可借助于计算机完成排序可借助于计算机完成数据的排序数据的排序(方法方法)分类数据的排序分类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分中也有笔画多少的升序降序之分数值型数据的排序数值型数据的排序递增排序:设一组数据为递增排序:设一组数据为X1,X2,XN,递增排序可表示为:,递增排序可表示为:X(1)X(2)X(2)X(N)排序后的数据我们在统计学上称之为:排序后的数据我们在统计学上称之为:“顺序统计量顺序统计量”数据的预处理数据的排序数据的预处理数据的排序(要点要点)一、数据的分组一、数据的分组为什么要进行数据分组?为什么要进行数据分组?通过分类发现数据内部的结构特点通过分类发现数据内部的结构特点数据分组时的关键问题是什么?数据分组时的关键问题是什么?选择选择分组标志分组标志:区分为不同组的标准或根据:区分为不同组的标准或根据分组的原则:体现分组的原则:体现组内同质、组内同质、组间异质;穷尽原则;互斥原则组间异质;穷尽原则;互斥原则数据分组的类型:按品质标志分组和按数量标志分组数据分组的类型:按品质标志分组和按数量标志分组确定各组界限确定各组界限分组标志可以有多个么?数据分组标志可以有多个么?数据分组体系分组体系平行分组体系平行分组体系按一个标志对总体进行分组称为简单分组,同一总体的几个简单分组按一个标志对总体进行分组称为简单分组,同一总体的几个简单分组按某一规定排列起来就构成一个平行分组体系。按某一规定排列起来就构成一个平行分组体系。例如:人口总体分别按性别、年龄、民族等标志进行分组,排列起来例如:人口总体分别按性别、年龄、民族等标志进行分组,排列起来就构成一个就构成一个平行分组体系平行分组体系.复合分组体系复合分组体系一个问体同时按两个或多个标志层叠分组,就称为复合分组。复合分一个问体同时按两个或多个标志层叠分组,就称为复合分组。复合分组形成的系列就叫组形成的系列就叫。例如:某校学生总体可先按学科分例如:某校学生总体可先按学科分(文理文理)、再按、再按(本、硕、博本、硕、博)、最后再、最后再按性别分组就构成了一个三级按性别分组就构成了一个三级复合分组体系复合分组体系。一、数据的分组为什么要进行数据分组?一、数据的分组为什么要进行数据分组?统计分组的作用(1)划分现象的类型划分现象的类型类型分组类型分组(2)揭示现象内部结构)揭示现象内部结构结构分组结构分组 (P48)(3)分析现象之间的依存关系)分析现象之间的依存关系分析分组分析分组 (P48)统计分组的作用统计分组的作用 揭露社会经济现象的类型,反映各类型的特点。揭露社会经济现象的类型,反映各类型的特点。类型分组类型分组 类型类型2000年年2001年年2002年年2003年年农业农业13 873.614 462.814 931.5 14870.1林业林业936.5938.81 033.51239.9牧业牧业 7 393.17 963.18 454.69538.8渔业渔业 2 712.62 815.02 971.13137.6合计合计24 915.826 179.627 390.829691.8例例单位:亿元揭露社会经济现象的类型,反映各类型的特点。揭露社会经济现象的类型,反映各类型的特点。类型分组类型分组 类类说明社会经济现象的内部结构。说明社会经济现象的内部结构。结构分组结构分组 年份年份2000200120022003第一产业第一产业16.415.815.314.6第二产业第二产业50.250.150.452.5第三产业第三产业33.434.134.333.1合计合计100.0100.0100.0100.0例例我国国内生产总值构成(%)说明社会经济现象的内部结构。说明社会经济现象的内部结构。结构分组结构分组 年份年份20002研究经济现象之间的依存关系。研究经济现象之间的依存关系。分析分组分析分组 耕作深度分组耕作深度分组(cm)地块数地块数平均收获率平均收获率(斤斤/亩亩)10-12 740012-141046014-161654016-1818-2012 5620680例例某乡某种农作物的耕作深度与收获率的关系研究经济现象之间的依存关系。研究经济现象之间的依存关系。分析分组分析分组 耕作深度分组耕作深度分组(cm二、数据的整理与显示二、数据的整理与显示一一.分类数据的整理与显示分类数据的整理与显示(基本过程基本过程)1 1、列出各类别、列出各类别2 2、计算各类别的频数、计算各类别的频数3 3、制作频数分布表、制作频数分布表4 4、用图形显示数据、用图形显示数据 二、数据的整理与显示一二、数据的整理与显示一.分类数据的整理与显示分类数据的整理与显示(基本过程基本过程)1、一一.分类数据的整理与显示分类数据的整理与显示频频 数:落在各类别中的数据个数。数:落在各类别中的数据个数。频频 率:某一类别数据的频数占总体单位个数的比率:某一类别数据的频数占总体单位个数的比重。重。频数分布频数分布:把频数以表格形式全部列出就是:把频数以表格形式全部列出就是绘制频数分布表的演示操作绘制频数分布表的演示操作(调用调用Excel文件文件:分类数分类数据的整理据的整理)比例:各类数据与全部数据之比比例:各类数据与全部数据之比百分数:把比例基数百分数:把比例基数100化化比率:各类数据间的比值比率:各类数据间的比值绘制绘制饼图饼图、柱形图与条形图的演示操作、柱形图与条形图的演示操作(调用调用Excel文件文件:分类数据的整理分类数据的整理)一一.分类数据的整理与显示频分类数据的整理与显示频 数:落在各类别中的数据个数。数:落在各类别中的数据个数。二、顺序数据的整理与显示二、顺序数据的整理与显示二二.顺序数据的整理与显示顺序数据的整理与显示亦可计算累计频数亦可计算累计频数(累积百分比累积百分比):将各类别的频数逐级累加:将各类别的频数逐级累加亦可计算累计频率:将各类别的频率亦可计算累计频率:将各类别的频率(百分比百分比)逐级累加逐级累加累积有两种:向上累积累积有两种:向上累积(沿顺序方向累加沿顺序方向累加)与向下累积与向下累积(逆顺序方向累加逆顺序方向累加)【实实实实例例例例】在在在在一一一一项项项项城城城城市市市市住住住住房房房房问问问问题题题题的的的的研研研研究究究究中中中中,研研研研究究究究人人人人员员员员在在在在甲甲甲甲乙乙乙乙两两两两个个个个城城城城市市市市各各各各抽抽抽抽样样样样调调调调查查查查300300户户户户,其其其其中中中中的的的的一一一一个个个个问问问问题题题题是是是是:“您您您您对对对对您您您您家家家家庭庭庭庭目目目目前前前前的的的的住住住住房房房房状状状状况况况况是是是是否否否否满满满满意意意意?(关关关关于于于于乙乙乙乙城城城城的的的的另另另另一张表见下页表一张表见下页表一张表见下页表一张表见下页表)1 1非非非非常常常常不不不不满满满满意意意意;2 2不不不不满满满满意意意意;3 3一一一一般般般般;4 4满满满满意意意意;5 5非常满意非常满意非常满意非常满意。表 甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积 向下累积 户数(户)百分比(%)户数(户)百分比(%)非常不满 不满意 一般 满意 非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0二、顺序数据的整理与显示二二、顺序数据的整理与显示二.顺序数据的整理与显示【实例】在一顺序数据的整理与显示【实例】在一演示累积分布图演示累积分布图:如何在同一图表中演示向上与向下累积分布?如何在同一图表中演示向上与向下累积分布?以本页的下图数据为例当堂演示以本页的下图数据为例当堂演示演示绘制环形图演示绘制环形图:饼图只能绘制同一总体的结构,那么如何绘制多总体结构?环形图!饼图只能绘制同一总体的结构,那么如何绘制多总体结构?环形图!结合下图与上图数据堂堂绘制结合下图与上图数据堂堂绘制表 乙城市家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积 向下累积 户数(户)百分比(%)户数(户)百分比(%)非常不满 不满意 一般 满意 非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计300100.0甲百分比(%)836311510乙百分比(%)7.033.026.021.312.7提取甲提取甲乙百分比乙百分比及回答及回答类别共类别共3列列演示累积分布图演示累积分布图:如何在同一图表中演示向上与向下累积分布?表如何在同一图表中演示向上与向下累积分布?表 三、数值型数据的整理与显示三、数值型数据的整理与显示频数分布表的编制频数分布表的编制数值型数据的图示数值型数据的图示频数分布的类型频数分布的类型三、数值型数据的整理与显示频数分布表的编制三、数值型数据的整理与显示频数分布表的编制频数分布表的编制频数分布表的编制频率频率f/ff/f频数频数f f分组分组x x确确确确定定定定组组组组距距距距计计计计算算算算频频频频数数数数确确确确定定定定组组组组数数数数编制频数分编制频数分布表的步骤布表的步骤编编编编制制制制表表表表格格格格频数分布表的编制频率频数分布表的编制频率f/f频数频数f分组分组x确定组距计算频数确定确定组距计算频数确定频数分布表的编制频数分布表的编制(实例)(实例)117 122 124 129 139 107 117 122 124 129 139 107 117 130 122 125117 130 122 125 108 131 125 117 122 133 108 131 125 117 122 133 126 122 118 108126 122 118 108 110 118 123 126 133 134 110 118 123 126 133 134 127 123 118 112127 123 118 112 112 134 127 123 119 113 112 134 127 123 119 113 120 123 127 135120 123 127 135 137 114 120 128 124 115 137 114 120 128 124 115 139 128 124 121139 128 124 121【例例例例】某某某某生生生生产产产产车车车车间间间间5050名名名名工工工工人人人人日日日日加加加加工工工工零零零零件件件件数数数数如如如如下下下下(单单单单位位位位:个个个个)。试试试试采采采采用用用用单单单单变变变变量量量量值值值值对对对对数数数数据据据据进进进进行行行行分分分分组组组组。频数分布表的编制频数分布表的编制(实例)(实例)117 122 124 12分组方法分组方法等距分组等距分组异距分组异距分组什么是单变量分组?(概念要点)1.将一个变量值作为一组2.适合于离散变量3.适合于变量值较少的情况1.什么是组距分组?(概念要点)2.将变量值的一个区间作为一组3.适合于连续变量4.适合于变量值较多的情况5.必须遵循“不重不漏”的原则6.可采用等距分组,也可采用不等距分组分组方法分组方法等距分组异距分组单变量值分组组距分组什么是单分组方法分组方法等距分组异距分组单变量值分组组距分组什么是单单变量值分组表单变量值分组表(实例)表 某车间50名工人日加工零件数分组表零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112单变量值分组表单变量值分组表(实例)表(实例)表 某车间某车间50名工人日加工零件数名工人日加工零件数组距分组组距分组(步骤)1.1.确确确确定定定定组组组组数数数数:组组组组数数数数的的的的确确确确定定定定应应应应以以以以能能能能够够够够显显显显示示示示数数数数据据据据的的的的分分分分布布布布特特特特征征征征和和和和规规规规律律律律为为为为目目目目的的的的。在在在在实实实实际际际际分分分分组组组组时时时时,可可可可以以以以按按按按 Sturges Sturges 提出的经验公式来确定组数提出的经验公式来确定组数提出的经验公式来确定组数提出的经验公式来确定组数KK2.2.确确确确定定定定各各各各组组组组的的的的组组组组距距距距:组组组组距距距距(Class Class Width)Width)是是是是一一一一个个个个组组组组的的的的上上上上限限限限与与与与下下下下限限限限之之之之差差差差,可可可可根根根根据据据据全全全全部部部部数数数数据据据据的的的的最最最最大大大大值值值值和和和和最最最最小小小小值值值值及及及及所分的组数来确定,即所分的组数来确定,即所分的组数来确定,即所分的组数来确定,即 组距组距组距组距(最大值最大值最大值最大值 -最小值)最小值)最小值)最小值)组数组数组数组数 3.3.根据分组整理成频数分布表根据分组整理成频数分布表根据分组整理成频数分布表根据分组整理成频数分布表 调用调用Excel文件文件组距分组组距分组(步骤)确定组数:组数的确定应以能够显示数据的分布(步骤)确定组数:组数的确定应以能够显示数据的分布组距分组组距分组(几个概念)(几个概念)1.组限:下限(一个组的最小值)和上限(一个组的最大值)2.全距:最大值与最小值之差3.组距:上限与下限之差 组数=全距/组距4.开口组:首未两组用“*以上”或“*以下”表示的叫5.闭口组:首未两组上下限俱全的叫闭口组4.组中值:闭口组的组中值是下限与上限之间的中点值开口组的组中值计算:缺下限开口组的组中值(左侧):=上限邻组组距/2缺上限开口组的组中值(右侧):=下限+邻组组距/2注意:开口组的计算方法不是一成不变的,可视实际需要特殊处理。(P53)下限值下限值+上限值上限值2组中值组中值组距分组组距分组(几个概念)(几个概念)1.组限:下限(一个组的最小值)和组限:下限(一个组的最小值)和等距分组表等距分组表(上下组限重叠)(上下组限重叠)表 某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105110110115115120120125125130130135135140358141064610162820128合计50100上下组限重叠时:如何解决上下组限重叠时:如何解决“不重不重”问题?问题?答方法之一是:上组限不在内原则!即左闭右开型答方法之一是:上组限不在内原则!即左闭右开型*,*)答方法之二是:上下组间断法,如下页表答方法之二是:上下组间断法,如下页表等距分组表等距分组表(上下组限重叠)表(上下组限重叠)表 某车间某车间50名工人日加工名工人日加工等距分组表等距分组表(上下组限间断)(上下组限间断)表 某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105109110114115119120124125129130134135139358141064610162820128合计50100上下组限重叠时:如何解决上下组限重叠时:如何解决“不重不重”问题?问题?答方法之二是:上下组间断法答方法之二是:上下组间断法.等距分组表等距分组表(上下组限间断)表(上下组限间断)表 某车间某车间50名工人日加工名工人日加工等距分组表等距分组表(使用开口组)(使用开口组)表 某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)110以下110114115119120124125129130134135以上358141064610162820128合计50100分组时,要遵循分组时,要遵循“不重不漏不重不漏”原则:如何解决原则:如何解决“不漏不漏”问题?问题?答方法是:采用开口组,使个别极端值不被漏掉!答方法是:采用开口组,使个别极端值不被漏掉!等距分组表等距分组表(使用开口组)表(使用开口组)表 某车间某车间50名工人日加工零名工人日加工零等距分组与异距分组等距分组与异距分组(在表现频数分布上的差异)(在表现频数分布上的差异)1.等距分组(上面全是以等距分组为例)l各组频数的分布不受组距大小的影响l可直接根据绝对频数来观察频数分布的特征和规律,绘直方图时可直接以组距为宽(x轴),以频数为高(y轴)来画!2.异距分组l各组频数的分布受组距大小不同的影响l各组绝对频数的多少不能反映频数分布的实际状况l需要用频数密度(频数密度频数/组距)反映频数分布的实际状况,绘直方图时需要以组距为宽(x轴),以频数密度为高(y轴)来画!组距组距频数频数频数密频数密度度101090909 9151520020013.313.35 52502505050151534034022.722.720202402401212505080801.61.6等距分组与异距分组等距分组与异距分组(在表现频数分布上的差异)等距分组(上面(在表现频数分布上的差异)等距分组(上面数值型数据的图示数值型数据的图示(用(用ExcelExcel作图)作图)直方图直方图折线图折线图曲线图曲线图数值型数据的图示(用数值型数据的图示(用Excel作图)作图)分组数据分组数据直方图直方图(直方图的制作)(直方图的制作)1.用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布2.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图(Histogram)3.直方图下的总面积等于1分组数据分组数据直方图直方图(直方图的制作)用矩形的宽度和高度来表示频(直方图的制作)用矩形的宽度和高度来表示频分组数据分组数据直方图直方图(直方图的绘制)直方图的绘制)频频频频频频数数数数数数(人人人人人人)151512129 96 63 3105105 110110 115115 120120 125125 130130 135135 140140日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数(个个个个个个)直方图下的面直方图下的面积之和等于积之和等于11图图图图 某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图分组数据分组数据直方图直方图(直方图的绘制)频(直方图的绘制)频151296310511分组数据分组数据直方图直方图(直方图与条形图的区别)(直方图与条形图的区别)1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列分组数据分组数据直方图直方图(直方图与条形图的区别)条形图是用条形的长(直方图与条形图的区别)条形图是用条形的长分组数据分组数据折线图折线图(折线图的制作)(折线图的制作)1.折线图也称频数多边形图(Frequency polygon)2.是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉。3.折线图的两个终点要与横轴相交,具体的做法是l第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴。l折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的。分组数据分组数据折线图折线图(折线图的制作)折线图也称频数多边形图(折线图的制作)折线图也称频数多边形图(F151512129 96 63 3105105 110110 115115 120120 125125 130130 135135 140140日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数(个个个个个个)频频频频频频数数数数数数(人人人人人人)折线图下的面积折线图下的面积与直方图的面积与直方图的面积相等!相等!分组数据分组数据折线图折线图(折线图的绘制)(折线图的绘制)图图图图 某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图151296310511011512012513013514未分组数据未分组数据茎叶图茎叶图(茎叶图的制作)(茎叶图的制作)1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.由由“茎茎”和和“叶叶”两两部部分分构构成成,其其图图形形是是由由数数字字组组成的成的3.以该组数据的高位数值作树茎,低位数字作树叶以该组数据的高位数值作树茎,低位数字作树叶4.对于对于n(20n300)个数据,茎叶图最大行数不超过个数据,茎叶图最大行数不超过 L=10 log 10 n 5.茎叶图类似于横置的直方图,但又有区别茎叶图类似于横置的直方图,但又有区别l直直方方图图可可大大体体上上看看出出一一组组数数据据的的分分布布状状况况,但但没没有有给给出出具体的数值具体的数值l茎茎叶叶图图既既能能给给出出数数据据的的分分布布状状况况,又又能能给给出出每每一一个个原原始始数值,保留了原始数据的信息数值,保留了原始数据的信息未分组数据未分组数据茎叶图茎叶图(茎叶图的制作)用于显示未分组的原始数据(茎叶图的制作)用于显示未分组的原始数据树茎树茎树茎树茎 树叶树叶树叶树叶78878802234777888902234777888900122223333444667778890012222333344466777889013344579901334457991010111112121313数据个数数据个数数据个数数据个数3 3131324241010茎叶图类似横置茎叶图类似横置的直方图的直方图未分组数据未分组数据茎叶图茎叶图(茎叶图的制作)(茎叶图的制作)图图图图 某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图树茎树叶树茎树叶78802234777888900122223333未分组数据未分组数据茎叶图茎叶图(扩展的茎叶图)(扩展的茎叶图)树茎树茎树茎树茎树茎树茎树叶树叶树叶树叶树叶树叶101010s ss10.10.10.11*11*11*11t11t11t11f11f11f11s11s11s11.11.11.12*12*12*12t12t12t12f12f12f12s12s12s12.12.12.13*13*13*12t12t12t13f13f13f13s13s13s13.13.13.7 778 88 88 80 002 2 32 2 32 2 34 54 54 57 7 77 7 77 7 78 8 8 98 8 8 98 8 8 90 0 10 0 10 0 12 2 2 2 3 3 3 32 2 2 2 3 3 3 32 2 2 2 3 3 3 34 4 4 5 54 4 4 5 54 4 4 5 56 6 7 7 76 6 7 7 76 6 7 7 78 8 98 8 98 8 90 10 10 13 33 33 34 4 54 4 54 4 57 779 99 99 9树茎树茎树茎树茎树茎树茎树叶树叶树叶树叶树叶树叶10*10*10*10.10.10.11*11*11*11.11.11.12*12*12*12.12.12.13*13*13*13.13.13.7 8 87 8 87 8 80 2 2 3 40 2 2 3 40 2 2 3 45 7 7 7 8 8 8 95 7 7 7 8 8 8 95 7 7 7 8 8 8 90 0 1 2 2 2 2 3 3 3 3 4 4 40 0 1 2 2 2 2 3 3 3 3 4 4 40 0 1 2 2 2 2 3 3 3 3 4 4 45 5 6 6 7 7 7 8 8 95 5 6 6 7 7 7 8 8 95 5 6 6 7 7 7 8 8 90 1 3 3 4 4 0 1 3 3 4 4 0 1 3 3 4 4 5 7 9 95 7 9 95 7 9 9图图图图 上图扩展后的茎叶图上图扩展后的茎叶图上图扩展后的茎叶图上图扩展后的茎叶图两等份两等份五等份五等份未分组数据未分组数据茎叶图茎叶图(扩展的茎叶图)树茎树叶(扩展的茎叶图)树茎树叶10s7树茎树叶树茎树叶未分组数据未分组数据箱线图箱线图(箱线图的制作)(箱线图的制作)1.1.用于显示未分组的原始数据或分组数据的分布2.2.箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成3.3.其绘制方法是:l l首首先先找找出出一一组组数数据据的的5 5个个特特征征值值,即即最最大大值值、最最小小值值、中中位位数数MMe e 和和两两个个四四分分位位数数(下下四四分分位位数数QQL L和上四分位数和上四分位数QQU U)l l连连接接两两个个四四分分(位位)数数画画出出箱箱子子,再再将将两两个个极极值值点与箱子相连接点与箱子相连接 未分组数据未分组数据箱线图箱线图(箱线图的制作)用于显示未分组的原始数据(箱线图的制作)用于显示未分组的原始数据未分组数据单批数据箱线图(箱线图的构成)(箱线图的构成)中位数中位数中位数中位数4 46 68 810101212QQU UUQQL LLX X最大值最大值最大值最大值最大值最大值X X最小值最小值最小值最小值最小值最小值图图图图 简单箱线图简单箱线图简单箱线图简单箱线图未分组数据未分组数据单批数据箱线图单批数据箱线图(箱线图的构成)中位数(箱线图的构成)中位数46810表 某车间50名工人日加工零件数分组表零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)107108110112113114115117118121211133119120121122123124125126127121443223128129130131133134135137139211122112表表 某车间某车间50名工人日加工零件数分组表零件数频数零件数频名工人日加工零件数分组表零件数频数零件数频未分组数据单批数据箱线图(实例)(实例)最小值最小值最小值最小值最小值最小值107107107最大值最大值最大值最大值最大值最大值139139139中位数中位数中位数中位数中位数中位数123123123下四分位数下四分位数下四分位数下四分位数下四分位数下四分位数117.75117.75117.75上四分位数上四分位数上四分位数上四分位数上四分位数上四分位数128128128105 110 115 120 125 130 135 140105 110 115 120 125 130 135 140105 110 115 120 125 130 135 140图图图图 上例中上例中上例中上例中5050名工人日加工零件数的箱线图名工人日加工零件数的箱线图名工人日加工零件数的箱线图名工人日加工零件数的箱线图未分组数据未分组数据单批数据箱线图单批数据箱线图(实例)最小值最大值中位数下四分(实例)最小值最大值中位数下四分分布的形状与箱线图分布的形状与箱线图 对称分布对称分布对称分布对称分布对称分布对称分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布Q QQL LL 中位数中位数中位数中位数中位数中位数 Q QQU UU图图图图 不同分布的箱线图不同分布的箱线图不同分布的箱线图不同分布的箱线图分布的形状与箱线图分布的形状与箱线图 对称分布对称分布QL中位数中位数 QU左偏分布左偏分布QL未分组数据未分组数据多批数据箱线图多批数据箱线图(实例)(实例)【例例例例】从从从从某某某某大大大大学学学学经经经经济济济济管管管管理理理理专专专专业业业业二二二二年年年年级级级级学学学学生生生生中中中中随随随随机机机机抽抽抽抽取取取取1111人人人人,对对对对 8 8门门门门 主主主主要要要要课课课课程程程程的的的的考考考考试试试试成成成成绩绩绩绩进进进进行行行行调调调调查查查查,所所所所得得得得结结结结果果果果如如如如表表表表3-83-8。试试试试绘绘绘绘制制制制各各各各科科科科考考考考试试试试成成成成绩绩绩绩的的的的批批批批比比比比较较较较箱箱箱箱线线线线图图图图,并并并并分分分分析析析析各各各各科科科科考考考考试试试试成成成成绩绩绩绩的的的的分分分分布布布布特征特征特征特征表 11名学生各科的考试成绩数据课程名称学生编号1234567891011英语经济数学西方经济学市场营销学财务管理基础会计学统计学计算机应用基础76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分组数据未分组数据多批数据箱线图多批数据箱线图(实例)【例】(实例)【例】从某大学经济管理从某大学经济管理未分组数据未分组数据多批数据箱线图多批数据箱线图(由由STATIATICA绘制的多批数据箱线图绘制的多批数据箱线图)图图图图 8 8门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图未分组数据未分组数据多批数据箱线图多批数据箱线图(由由STATIATICA 绘制的多绘制的多图图图图 11 11名学生名学生名学生名学生8 8门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图Min-Max25%-75%Median value455565758595105学生1学生2学生3学生4学生5学生6学生7学生8学生9学生10学生11未分组数据未分组数据箱线图箱线图(由由STATIATICASTATIATICA绘制的多批数据箱线图绘制的多批数据箱线图)图图 11名学生名学生8门课程考试成绩的箱线图门课程考试成绩的箱线图Min-Max2时间序列数据时间序列数据折线图折线图(实例)(实例)【例例例例】已知已知已知已知1991199119981998年年年年我国城乡居民我国城乡居民我国城乡居民我国城乡居民家庭的人均收家庭的人均收家庭的人均收家庭的人均收入数据如表。入数据如表。入数据如表。入数据如表。试绘制折线图试绘制折线图试绘制折线图试绘制折线图¥表 19911998年城乡居民家庭人均收入年份城镇居民农村居民199119921993199419951996199719981700.62026.62577.43496.24283.04838.95160.35425.1708.6 784.0 921.61221.01577.71926.12091.12162.0时间序列数据时间序列数据折线图折线图(实例)【例】已知(实例)【例】已知19911998年年时间序列数据(由(由 Excel Excel 绘制的线图)绘制的线图)020004000600019911992199319941995199619971998城镇居民农村居民收收入入(元)(元)图图 城乡居民家庭人均收入城乡居民家庭人均收入时间序列数据时间序列数据(由(由 Excel 绘制的线图)绘制的线图)02000400时间序列数据时间序列数据折线图折线图(折线图的制作)(折线图的制作)绘制折线图时应注意以下几点绘制折线图时应注意以下几点1.时间一般绘在横轴,指标数据绘在纵轴时间一般绘在横轴,指标数据绘在纵轴2.图图形形的的长长宽宽比比例例要要适适当当,其其长长宽宽比比例例大大致致为为10:73.一一般般情情况况下下,纵纵轴轴数数据据下下端端应应从从“0”开开始,以便于比较。始,以便于比较。时间序列数据时间序列数据折线图折线图(折线图的制作)绘制折线图时应注意以下(折线图的制作)绘制折线图时应注意以下1.雷雷达达图图(Radar Chart)是是显显示示多多个个变变量量的常用图示方法的常用图示方法3.在在显显示示或或对对比比各各变变量量的的数数值值总总和和时时十十分分有有用用4.假假定定各各变变量量的的取取值值具具有有相相同同的的正正负负号号,总总的绝对值与图形所围成的区域成正比的绝对值与图形所围成的区域成正比5.可用于研究多个样本之间的相似程度可用于研究多个样本之间的相似程度多变量数据多变量数据雷达图雷达图(要点)(要点)雷达图(雷达图(Radar Chart)是显示多个变量的常用图示方法)是显示多个变量的常用图示方法设有n组样本S1,S2,Sn,每个样本测得P个变量X1,X2,Xp,要绘制这P个变量的雷达图,其具体做法是多变量数据多变量数据雷达图雷达图(雷达图的制作)(雷达图的制作)n n 先先先先做做做做一一一一个个个个圆圆圆圆,然然然然后后后后将将将将圆圆圆圆P P等等等等分分分分,得得得得到到到到P P个个个个点点点点,令令令令这这这这P P个个个个点点点点分分分分别别别别对对对对应应应应P P个个个个变变变变量量量量,在在在在将将将将这这这这P P个个个个点点点点与与与与圆圆圆圆心心心心连连连连线线线线,得得得得到到到到P P个个个个幅幅幅幅射射射射状状状状的的的的半半半半径径径径,这这这这P P个个个个半半半半径径径径分分分分别别别别作作作作为为为为P P个个个个变变变变量量量量的的的的坐坐坐坐标标标标轴轴轴轴,每每每每个个个个变变变变量量量量值值值值的的的的大大大大小小小小由由由由半半半半径径径径上的点到圆心的距离表示上的点到圆心的距离表示上的点到圆心的距离表示上的点到圆心的距离表示n n 再再再再将将将将同同同同一一一一样样样样本本本本的的的的值值值值在在在在P P个个个个坐坐坐坐标标标标上上上上的的的的点点点点连连连连线线线线。这这这这样样样样,n n个样本形成的个样本形成的个样本形成的个样本形成的n n个多边形就是一个雷达图个多边形就是一个雷达图个多边形就是一个雷达图个多边形就是一个雷达图设有设有n组样本组样本S1,S2,Sn,每个样本测得,每个样本测得P个变量个变量X1,X多变量数据多变量数据雷达图雷达图(实例)(实例)【例例例例】19971997年年年年 我我我我国国国国城城城城乡乡乡乡居居居居民民民民家家家家庭庭庭庭平平平平均均均均每每每每人人人人各各各各项项项项生生生生活活活活消消消消费费费费支支支支出出出出数数数数据据据据如如如如表表表表。试试试试绘绘绘绘制制制制雷雷雷雷达图。达图。达图。达图。表 1997年城乡居民家庭平均每人生活消费支出项 目城镇居民农村居民 食品 衣着 家庭设备用品及服务 医疗保健 交通通讯 娱乐教育文化服务 居住 杂项商品与服务1942.59520.91316.89179.68232.90448.38358.64185.65 890.28 109.41 85.41 62.45 53.92 148.18 233.23 34.27合 计4185.641617.15多变量数据多变量数据雷达图雷达图(实例)【例】(实例)【例】1997年我国城乡居民家庭年我国城乡居民家庭0500100015002000 食品食品 衣着衣着 家庭设备用家庭设备用 品及服务品及服务 医疗保健医疗保健 交通通讯交通通讯 娱乐教育娱乐教育 文化服务文化服务 居住居住 杂项商品杂项商品 与服务与服务城镇居民农村居民 图图 1997年城镇居民家庭消费支出年城镇居民家庭消费支出 (元)(元)多变量数据多变量数据雷达图雷达图(由(由 Excel Excel 绘制的雷达图)绘制的雷达图)0500100015002000 食品食品 多变量数据多变量数据雷达图雷达图(实例)(实例)【例例例例】为为为为研研研研究究究究某某某某条条条条河河河河流流流流的的的的污污污污染染染染程程程程度度度度,环环环环保保保保局局局局分分分分别别别别在在在在上上上上游游游游、中中中中游游游游和和和和下下下下游游游游设设设设立立立立取取取取样样样样点点点点,每每每每个个个个取取取取样样样样点点点点化化化化验验验验水水水水中中中中的的的的五五五五项项项项污污污污染染染染指指指指标标标标,所所所所得得得得数数数数据据据据如如如如表表表表。将将将将各各各各指指指指标标标标用用用用雷雷雷雷达达达达图图图图表表表表示示示示出出出出来来来来,并并并并分分分分析析析析该该该该河河河河流流流流的的的的主主主主要污染源。要污染源。要污染源。要污染源。表 不同样本点的化验指标指标1 指标2指标3指标4 指标5上游中游下游4.520.342.175.01.46.8483 36208196 4111214 635多变量数据多变量数据雷达图雷达图(实例)【例】为研究某条河流的污染程度,(实例)【例】为研究某条河流的污染程度,多变量数据雷达图(由(由 Excel Excel 绘制的对数坐标雷达图)绘制的对数坐标雷达图)0.11101001000指标指标1指标指标2指标指标3指标指标4指标指标5上游中游下游图图3-16 河流污染指标雷达图河流污染指标雷达图 多变量数据多变量数据雷达图雷达图(由(由 Excel 绘制的对数坐标雷达图)绘制的对数坐标雷达图)数据类型及图示数据类型及图示(小结)(小结)数据类型与显示数据类型与显示数值型数据数值型数据品质数据品质数据分组数据分组数据总计表总计表茎茎叶叶图图条条形形图图圆圆形形图图环环形形图图直直方方图图箱箱线线图图折折线线图图原始数据原始数据时序数据时序数据折折线线图图雷雷达达图图多元数据多元数据数据类型及图示数据类型及图示(小结)数据类型与显示数值型数据品质数据分组(小结)数据类型与显示数值型数据品质数据分组频数分布的形状(常有U型、钟形与J形)类型 对称分布对称分布对称分布对称分布对称分布对称分布右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布正正正正正正J J J型分布型分布型分布型分布型分布型分布反反反反反反J J J型分布型分布型分布型分布型分布型分布U UU型分布型分布型分布型分布型分布型分布图图图图 几种常见的频数分布几种常见的频数分布几种常见的频数分布几种常见的频数分布频数分布的形状(常有频数分布的形状(常有U型、钟形与型、钟形与J形)类型形)类型 一一.统计表的构成统计表的构成二二.统计表的设计统计表的设计四、统计表四、统计表一一.统计表的构成四、统计表统计表的构成四、统计表统计表的结构统计表的结构表 19971998年城镇居民家庭抽样调查资料项目计量单位1997年 1998年(甲)(乙)(1)(2)一、调查户数 二、平均每户家庭人口数 三、平均每户就业人口数 四、平均每人全部收入 五、平均每人实际支出 消费性支出 非消费性支出 六、平均每人居住面积户人人元元元元平方米 37890 3.19 1.83 5188.54 4945.87 4185.64 755.94 11.90 39080 3.16 1.80 5458.34 5322.95 4331.61 987.17 12.40资料来源:中国统计摘要1999,中国统计出版社,1999,第79页。注:1本表为城市和县城的城镇居民家庭抽样调查材料。2消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗 保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。行行标标题题表头:总标题表头:总标题列列标标题题数数字字资资料料附附加加主词主词宾词宾词统计表的结构表统计表的结构表 19971998年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料 统计表的分类统计表的分类简单表简单表总体未分组总体未分组 分组表分组表总体按一个标志进行分组总体按一个标志进行分组复合表复合表总体按二个或二个以上标志进总体按二个或二个以上标志进行复合分组行复合分组 统计表的分类简单表总体未分组统计表的分类简单表总体未分组 分组表总体按一个标志进分组表总体按一个标志进1.1.总标题内容应满足总标题内容应满足总标题内容应满足总标题内容应满足3 3WW要求要求要求要求:时间地点及何种数据时间地点及何种数据时间地点及何种数据时间地点及何种数据2.2.数数数数据据据据计计计计量量量量单单单单位位位位相相相相同同同同时时时时,可可可可放放放放在在在在表表表表的的的的右右右右上上上上角角角角标标标标明明明明,不不不不同同同同时时时时应放在每个指标后或单列出一列标明应放在每个指标后或单列出一列标明应放在每个指标后或单列出一列标明应放在每个指标后或单列出一列标明3.3.表中的上下两条横线一般用粗线,其他线用细线表中的上下两条横线一般用粗线,其他线用细线表中的上下两条横线一般用粗线,其他线用细线表中的上下两条横线一般用粗线,其他线用细线4.4.通常情况下,统计表的左右两边不封口通常情况下,统计表的左右两边不封口通常情况下,统计表的左右两边不封口通常情况下,统计表的左右两边不封口5.5.表表表表中中中中的的的的数数数数据据据据一一一一般般般般是是是是右右右右对对对对齐齐齐齐,有有有有小小小小数数数数点点点点时时时时应应应应以以以以小小小小数数数数点点点点对对对对齐齐齐齐,而且小数点的位数应统一而且小数点的位数应统一而且小数点的位数应统一而且小数点的位数应统一6.6.对对对对于于于于根根根根本本本本没没没没有有有有数数数数字字字字的的的的表表表表格格格格单单单单元元元元,一一一一般般般般用用用用“”表表表表示示示示;当当当当缺乏某资料时,用符号缺乏某资料时,用符号缺乏某资料时,用符号缺乏某资料时,用符号“”表示表示表示表示7.7.必要时可在表的下方加上注释说明来源、加以注释等必要时可在表的下方加上注释说明来源、加以注释等必要时可在表的下方加上注释说明来源、加以注释等必要时可在表的下方加上注释说明来源、加以注释等8.8.如如如如果果果果栏栏栏栏数数数数过过过过多多多多,要要要要编编编编号号号号的的的的;主主主主词词词词和和和和计计计计量量量量单单单单位位位位各各各各栏栏栏栏用用用用(甲甲甲甲)、(乙乙乙乙)。宾词各栏用。宾词各栏用。宾词各栏用。宾词各栏用(1),(2)(1),(2)。9.9.统计表左右两端不封闭统计表左右两端不封闭统计表左右两端不封闭统计表左右两端不封闭:即即即即开口式开口式开口式开口式统计表的设计统计表的设计THE END总标题内容应满足总标题内容应满足3W要求要求:时间地点及何种数据统计表的设计
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!