资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,STAT,统计学第三章 统计数据的整理与显示,统,计,整,理,统,计,调,查,客观,现象,数量,表现,统计,总体,数量,特征,统计研究的程序,统计研究目的,统计设计,推,断,分,析,描,述,分,析,统计学第三章 统计数据的整理与显示,第三章 统计数据的整理与显示,3.1 统计整理与统计分组,3.2 分布数列的编制,3.3 统计图表,3.1 统计整理与统计分组,一、统计整理的意义和步骤,二、统计整理的基本方法,统计分组,统计整理,将,统计调查得到的原始资料进行科学的分组和汇总形成综合统计资料的工作过程,是统计调查的继续,统计分析的前提和基础,地位,统计数据的处理:,统计资料的分组、汇总及制表,统计数据的管理:,数据的传输、贮存、更新及输出,内,容,统计学第三章 统计数据的整理与显示,制定统计整理方案,对原始资料进行审核,数 据 处 理,制作统计表或统计图,统计整理的步骤,统计学第三章 统计数据的整理与显示,3.1 统计整理与统计分组,一、统计整理的意义和步骤,二、统计整理的基本方法,统计分组,将总体中所有单位按一定的标志分为性质不同但又有联系的若干部分的过程,统计分组,统计分组的作用:,总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。,统计学第三章 统计数据的整理与显示,划分社会经济现象的类型,反映社会经济现象的内部结构和比例关系,揭示社会经济现象之间的相互依存关系,选择分组标志,确定分组体系,总体单位归类,科学性,:,组间差异大,组内差异小。,完备性和互斥性,:,每个单位均能且只能归到某个组中。,统计分组的程序与原则,第三章 统计数据的整理与显示,对大学生月生活费支出情况进行分组研究:,按家庭收入水平分组;,按城乡分组;,按性别分组;,按年龄分组。,?,统计分组的程序与原则,对父母亲下岗情况进行分组研究:,单亲下岗;双亲下岗;双亲在岗。,不符合,科学性,不符合,完备性和互斥性,城乡区别离退休是否健在,?,第三章 统计数据的整理与显示,统计分组的程序与原则,分组体系,指同时使用两个以上标志分组时,分组标志的组合形式。,各分组标志并列使用,各分组标志交叉结合使用,平行分组体系,交叉分组体系,第三章 统计数据的整理与显示,平行分组体系,对教师的分类,按性别分类,男性,女性,按职称分类,按年龄分类,高级,中级,初级,青年,中年,共计7组 2+3+2,统计学第三章 统计数据的整理与显示,交叉分组体系,按性别分类,按职称分类,按年龄分类,男,女,高级,中级,初级,青年,中年,共计12组232,统计学第三章 统计数据的整理与显示,对教师的分类,第三章 统计数据的整理与显示,3.1 统计整理与统计分组,3.2 分布数列的编制,3.3 统计图表,3.2 分布数列的编制,一、分布数列的定义及种类,二、变量数列的编制,三、累计次数与累计频率,变量数列,品质数列,将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组在总体中所占的比重而形成的数列,分布数列,分,类,分组标志的具体表现,各组的次数或频率,构成要素,异距数列,等距数列,组距数列,单值数列,统计学第三章 统计数据的整理与显示,3.2 分布数列的编制,一、分布数列的定义及种类,二、变量数列的编制,三、累计次数与累计频率,单值数列,指每个组值只用一个具体的变量值表现的数列,同时,具备,变量数列的编制,变量是离散变量,变量的不同取值个数较少,编制条件:,【例】,己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。,统计学第三章 统计数据的整理与显示,日产量(件),X,工人数(人),f,20,21,22,23,24,25,26,3,5,6,4,3,2,1,合计,24,编制结果如下:,统计学第三章 统计数据的整理与显示,组距数列,指每个组的变量值用一个区间来表现的变量数列,变量数列的编制,变量是连续变量;,或:,总体单位数较多变量不同取值个数也较多的离散变量。,编制条件:,变量值变动区间的长度相等,变量值变动区间的长度不完全相等,等距数列,异距数列,统计学第三章 统计数据的整理与显示,相关概念,指每,组,两端表示各组界限的变量值,各组的最小值为,下限,,最大值为,上限,组限,每组,变量值变动区间的长度,为上下限之差,组距,每组,变量取值范围的中点数值,组中值,统计学第三章 统计数据的整理与显示,组中值=,某,地区100个百货商店,月销售额与流通费用情况,销售额(万元),商店数(个),每百元,商品销售额中支付的流通费(元),50以下,50100,100200,200300,300以上,10,20,30,25,15,14.2,11.4,10.1,9.2,8.5,上组限,U,下组限,L,如:组距,d=U-L,=100-50=50,(,万元,),如:组中值,x=(U+L)/2 =(100+200)/2,=150,(,万元),统计学第三章 统计数据的整理与显示,编制等距数列,适用于总体单位的标志值变动比较均匀的情况,实例,己知某地区某年50个商店商品销售额的资料如下(单位:百万元):,7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0,要求编制组距数列。,统计学第三章 统计数据的整理与显示,编制步骤:,求变异全距,确定组距及组数,确定组距的原则:,要能,区分各组的性质差异,要能反映总体资料的分布特征,为方便计算,尽可能为5或10的整数倍,R,组距(,d) ,组数(,m),编制等距数列,统计学第三章 统计数据的整理与显示,计算组数(组数不宜过多,也不宜太少),上例,中,取,d=5,,,则有,编制等距数列,(当 的结果为整数时),(当 的结果为小数时),统计学第三章 统计数据的整理与显示,确定组限,对于离散变量,相邻组组限可以,间断,,也可,重叠,;,对于连续变量,相邻组组限,必须重叠,;,符合“,上组限不计入,”原则;,首末两组可使用“,以下,”及“,以上,”的开口组。,组限的表示方法,编制等距数列,统计学第三章 统计数据的整理与显示,计算次数,编制等距数列,编制结果:,销售额(百万元),组中值,商店数,5,以下,510,1015,1520,2025,25以上,2.5,7.5,12.5,17.5,22.5,27.5,4,10,16,13,4,3,合计,50,分组划记法,茎叶图法,统计学第三章 统计数据的整理与显示,(5+(5-5))/2,=2.5,(25+(25+5))/2,=27.5,3.2 分布数列的编制,一、分布数列的定义及种类,二、变量数列的编制,三、累计次数与累计频率,频率,各组,单位数占总体单位总数的比重,累计次数(频率,),从变量值,低,的组开始,将各组次数(频率)逐次向变量值,高,的组累计,说明某一组,上限以下各组的累计次数(频率),。,向,上,累,计,向,下,累,计,从变量值,高,的组开始,将各组次数(频率)逐次向变量值,低,的组累计,说明某一组,下限以上各组的累计次数(频率),。,统计学第三章 统计数据的整理与显示,频数表,(用,SPSS,制作),有效数据,频数,频率,有效频率,累计频率,约2/3的人身高不超过165,cm,第三章 统计数据的整理与显示,3.1 统计整理与统计分组,3.2 分布数列的编制,3.3 统计图表,3.3 统计图表,一、统计图,二、统计表,统计图,以点、线条、面积等方法描述、显示统计数据的形式,具有直观、醒目、易于理解等特点,组成:,坐标系,图形,图例,单式图,复合图,叠加图,一个图只用来显示一种现象的数量特征,用一个图同时显示几种数量的分布或变化情况,统计学第三章 统计数据的整理与显示,几种常用的统计图,条形图,(,Bar),用于显示离散型变量的次数分布,统计学第三章 统计数据的整理与显示,几种常用的统计图,条形图,(,Bar),用于显示离散型变量的次数分布,统计学第三章 统计数据的整理与显示,几种常用的统计图,条形图,(,Bar),用于显示离散型变量的次数分布,统计学第三章 统计数据的整理与显示,条形图,(,Bar),用于显示离散型变量的次数分布,统计学第三章 统计数据的整理与显示,直方图,(,Histogram,),用于显示连续型变量的次数分布,统计学第三章 统计数据的整理与显示,直方图,条形图,用于显示连续型变量的次数分布,用于显示离散型变量的次数分布,圆形图,(,饼图,Pie,),用于显示定类变量的次数分布,统计学第三章 统计数据的整理与显示,统计学第三章 统计数据的整理与显示,统计学第三章 统计数据的整理与显示,线图,(,Line,),主要用于显示连续型变量的次数分布和现象的动态变化,统计学第三章 统计数据的整理与显示,散点图,(,Scatter,),主要用来观察变量间的相关关系,也可显示数量随时间的变化情况,统计学第三章 统计数据的整理与显示,3.3 统计图表,一、统计图,二、统计表,具有容量大、方便计算等特点,统计表的常用结构:,统计表,以纵横交叉的线条所形成的表格来表现统计资料的形式,统计学第三章 统计数据的整理与显示,总 标 题,宾词栏,主词栏,数据栏,统计学第三章 统计数据的整理与显示,统计表的加工方法,对主词栏加工,对宾词栏加工,(对主体进行分组),单式,加工,复式加工,(选择指标及对指标进行分组),简单分组,交叉分组,统计表的编制规则,统计学第三章 统计数据的整理与显示,选择合适的总标题;,主词栏与宾词栏要各归其位,相互对应;,表的上、下端用粗线或双线封口,左右两端一般不封口;,可在各列的文字标题下面设置编号加以标识;,数据栏不能有空白。,对,主词栏的单式加工,统计学第三章 统计数据的整理与显示,对,主词栏的复式加工,统计学第三章 统计数据的整理与显示,获,金牌项目,金牌数 占总数比例,跳水枚,0.1786,举重枚,0.1786,乒乓球枚,0.1429,羽毛球枚,0.1429,体操枚,0.1071,射击枚,0.1071,柔道枚,0.0714,田径枚,0.0357,跆拳道枚,0.0357,中国体育代表团在悉尼奥运会上获金牌的项目,统计学第三章 统计数据的整理与显示,品质数列,某,地区100个百货商店,月销售额与流通费用情况,统计学第三章 统计数据的整理与显示,销售额(万元),每百元,商品销售额中支付的流通费(元),21,35,36,39,45,45,46,47,329,360,387,18.3,16.9,17.2,15.6,14.7,14.2,13.6,12.9,8.2,7.1,7.6,按,销售额分组(万元),商店数(个),每百元,商品销售额中支付的流通费(元),50以下,50100,100200,200300,300以上,10,20,30,25,15,14.2,11.4,10.1,9.2,8.5,开口式组距数列组中值的计算:,首,组,假定下限首组上限相邻组组距,末组假定上限末组下限相邻组组距,先,计算开口组的假定上、下限:,因此有:,首组,组中值,末组,组中值,销售额(百万元),商店数,频率(),累计次数,累计频率(),5,以下,510,1015,1520,2025,25以上,4,10,16,13,4,3,8,20,32,26,8,6,合计,50,100,统计学第三章 统计数据的整理与显示,销售额(百万元),商店数,频率(),累计次数,累计频率(),向上累计,向上累计,5,以下,510,1015,1520,2025,25以上,4,10,16,13,4,3,8,20,32,26,8,6,4,14,30,43,47,50,8,28,60,86,94,100,合计,50,100,统计学第三章 统计数据的整理与显示,销售额(百万元),商店数,频率(),累计次数,累计频率(),向上累计,向下累计,向上累计,向下累计,5,以下,510,1015,1520,2025,25以上,4,10,16,13,4,3,8,20,32,26,8,6,4,14,30,43,47,50,50,46,36,20,7,3,8,28,60,86,94,100,100,92,72,40,14,6,合计,50,100,统计学第三章 统计数据的整理与显示,按月工资分组,按性别分(人),按级别分,小计,男,女,小计,技工,学徒工,300以下,300400,400500,500600,600700,700以上,4,16,22,15,10,5,1,6,10,11,8,4,3,10,12,4,2,1,4,16,22,15,10,5,0,2,4,5,8,5,4,14,18,10,2,0,合计,72,40,32,72,24,48,对,宾词栏的简单分组,按月工资分组,按级别分(人),总计,技工,学徒工,小计,男,女,小计,男,女,对,宾词栏的交叉分组,
展开阅读全文