资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2021/2/4,第二章 统计数据的搜集、整理和显示,#,2024/11/27,1,第,一,节 统计数据的搜集,1.1,统计数据的直接来源,1.2,调查方案设计,2024/11/27,2,1.1,统计数据的直接来源,统计调查,指人们有目的、有意识地运用各种科学方法,向客观实际搜集资料的过程。,统计调查是统计工作过程的基本阶段;,统计调查搜集的是原始资料。,统计调查是取得社会经济数据的主要手段。,2024/11/27,3,1.1,统计数据的直接来源,非专门调查,专门调查,为,解决某一问题专门组织,的调查,调查,问题,一次性调查,(,周期性调查,),经常性调查,调查,时间,非全面调查,对部分单位进行调查,全面调查,对每一单位逐一调查,调查,范围,划 分 类 别,标准,统 计 调 查 的 分 类,2024/11/27,4,1.1,统计数据的直接来源,统计调查的组织形式,统 计 调 查,统 计 报 表,普 查,抽 样 调 查,重 点 调 查,典 型 调 查,专 门 调 查,2024/11/27,5,1.1,统计数据的直接来源,1.,普查:,专门组织的、一次性的全面调查。,主要用于搜集某一时点或一定时期内的重要国情国力与资源状况的全面资料,为政府制定宏观经济政策提供依据。,全国范围:人口普查、农业普查、工业普查、第三产业普查、基本单位普查等。,2024/11/27,6,1.1,统计数据的直接来源,我国历年人口普查时间表,普 查 次 数,标 准 时 点,第一次全国人口普查,1953,年,06,月,30,日,24,时,第二次全国人口普查,1964,年,06,月,30,日,24,时,第三次全国人口普查,1982,年,07,月,01,日,00,时,第四次全国人口普查,1990,年,07,月,01,日,00,时,第五次全国人口普查,2000,年,11,月,01,日,00,时,2024/11/27,7,1.1,统计数据的直接来源,2.,统计报表,统计报表是按照国家有关规定,利用行政手段自上而下布置,统一规定、统一表式、统一指标内容、统一报送时间,由报告单位以原始资料为基础,自下而上、逐级上报的统计调查形式。,2024/11/27,8,1.1,统计数据的直接来源,统计报表制度是我国统计调查方法体系中的重要组织方式,具备统一性、时效性、全面性、可靠性等特点。,统计报表所收集的资料可以用于满足各级管理层次的需要。,2024/11/27,9,1.1,统计数据的直接来源,3.,抽样调查,运用一定方法在调查对象中抽取一部分单位作为样本,并通过观察样本的结果来推断总体数量特征。,基本原理,用样本的数量特征推断总体的数量特征。,2024/11/27,10,1.1,统计数据的直接来源,抽 样 调 查,随 机 抽 样,非 随 机 抽 样,纯 随 机 抽 样,等 距 抽 样,分 层 抽 样,整 群 抽 样,多 阶 段 抽 样,滚 雪 球 抽 样,配 额 抽 样,方 便 抽 样,判 断 抽 样,2024/11/27,11,1.1,统计数据的直接来源,简单随机抽样,又称,纯随机抽样,它是随机抽样中最简单、最基本的抽样方法。,也是其他随机抽样方法的基础。,简单随机抽样的特点:,随机入样,样本框,2024/11/27,12,1.1,统计数据的直接来源,2.,以样本指标推断总体参数。,3.,随机抽样调查的误差可以事先计算并加以控制。,影响误差大小的因素,总体内部的差异程度 ;,样本容量的大小 ;,抽样方式和方法。,2024/11/27,13,1.1,统计数据的直接来源,抽样调查适用于:,1.,不能或不必进行全面调查的情况;,2.,对全面调查资料进行验证与修正;,3.,时效性要求较高的调查。,2024/11/27,14,1.1,统计数据的直接来源,4,重点调查,专门组织的一种非全面调查,它是在总体中选择个别或者部分重点单位进行调查,以此来了解总体的基本情况。,重点单位,在总体中具有决定性作用的一个或者若干个单位。一般这些单位的数量较少,但标志值在总体中所占比例较大。,1 3001 400,调查期限调查工作的起止时间。,第一节 统计数据的搜集,变量分布数列的编制:,表2-550户居民消费支出频数表,组距:3104 = 77.,(2)按经验公式计算;,加:其他业务利润, 特征:“中间大、两头小”,1500 2000,组距 = 上限 下限,专门组织的一种非全面调查,它是在总体中选择个别或者部分重点单位进行调查,以此来了解总体的基本情况。,组限 区间端点。,50户居民消费支出直方图和折线图,统计报表所收集的资料可以用于满足各级管理层次的需要。,2024/11/27,15,1.1,统计数据的直接来源,5典型调查,是专门组织的一种非全面调查,它是从调查对象中选择具有,代表性,的单位作为,典型单位,,通过对其调查来认识客观事物的一种调查方法。,典型单位,最能够体现客观事物某方面特征的单位。,2024/11/27,16,1.2,调查方案设计,确定调查目的;,确定调查的必要性与可行性,明确调查对象与调查单位 :,调查对象,需要调查的现象总体;,调查单位,所要调查的具体单位;,报告单位,也称填报单位。,有时与调查单位一致,有时不一致。,2024/11/27,17,1.2,调查方案设计,4.,确定调查时间与工作时限,调查时间,资料所属时间,,时期资料,动态,时点资料,静态,调查期限,调查工作的起止时间。,2024/11/27,18,5.,确定调查项目和调查表:,调查项目,调查单位所承担的基本标志,调查表, “,一览表”、“单一表”,1.2,调查方案设计,2024/11/27,19,点 名 册,序号,学号,姓 名,性别,第 周,第 周,1,9901,张晓岚,女,2,9902,施元娜,女,3,9903,李 浩,男,4,9904,刘 光,男,5,9905,王 英,女,6,9906,陈 真,男,一览表,1.2,调查方案设计,2024/11/27,20,损 益 表,项 目,本月数,本年累计数,一、产品销售收入,减:产品销售成本,产品销售费用,产品销售税金及附加,二、产品销售利润,加:其他业务利润,单一表,1.2,调查方案设计,2024/11/27,21,6.,确定调查方法;,7.,调查人员的选择、组织和培训,8.,其他相关事项。,1.2,调查方案设计,2024/11/27,22,建立以必要的周期性,普查为基础,,经常性的,抽样调查为主体,,同时辅以重点调查,科学推算和少量全面报表综合的统计调查体系。,1.2,调查方案设计,2024/11/27,23,第,二,节 统计数据的搜集,2.1,统计分组,2.2,变量数列,2024/11/27,24,2.1,统计分组,数据整理,指对统计调查所搜集到的各种数据进行分组与汇总。,数据整理,可使统计数据系统化和条理化,并使数据的规律性清晰的显示出来。,统计分组,是数据整理的中心工作。,直方图底边为 组距,高为频数 f,指根据研究的目的和要求,按某个标志(或若干个标志)将总体划分为若干个不同性质的组。,简单随机抽样又称纯随机抽样,组距:3104 = 77.,某校二年级400名学生期末统计学考试成绩,经整理如下表:,1 统计数据的直接来源,检验统计资料的准确性;,调查人员的选择、组织和培训,(组距和组数的确定),分为:高、中上、中、低收入四挡;,1 统计数据的直接来源,检验统计资料的准确性;,比重 f / f(%),重点单位在总体中具有决定性作用的一个或者若干个单位。,1 统计数据的直接来源,2024/11/27,25,统计分组,指根据研究的目的和要求,按某个标志(或若干个标志)将总体划分为若干个不同性质的组。,使组内差异小,组间差异大,,使无序零乱的数据整理为有序、层次分明的数据。,2.1,统计分组,2024/11/27,26,统计分组的原则:,穷尽,(,完备,),性原则;,互斥性原则。,2.1,统计分组,2024/11/27,27,统计分组,2.1,统计分组,数量分组,品质分组,标志,性质,复合分组,简单分组,标志,多少,单项式分组,组距式分组,2024/11/27,28,第一、第二、第三产业,国有、集体、私营,大、中、小,党员、团员、群众,男、女,产业,所有制,规模,政治面貌,性别,社会经济,企业,人口,分 组,分组标志,分组对象,类别繁多的分组采用统一的分类标准,商品分类目录,工业产品目录,等,2.1,统计分组,2024/11/27,29,变量分组,1.,单项式分组,把一个变量值作为一组,总体中有多少个不同的变量值那就要分多少个组。,适用于:,离散型,变量且变量值变动范围,不大,的总体。,2.1,统计分组,2024/11/27,30,单项式分组的例子,2500,2000,1500,1000,800,6,5,4,3,5,4,3,2,1,工 资,(元),年 龄,(岁),技术级别,(级),月 份,(月),12,11,10,9,2.1,统计分组,2024/11/27,31,2.,组距式分组,把,一段区间上,的变量值作为一组;,适用:,1.,连续型,的变量;,2.,离散型,变量且变量值,变动范围大。,2.1,统计分组,2024/11/27,32,直 径,(cm),成 绩,(,分,),年 龄,(,岁,),工 资,(,元,),组距式分组的例子,2500,以上,2000 2500,1500 2000,1000 1500,800 1000,15 20,10 14,6 9,3 5,14.00 14.99,13.00 13.99,12.00 12.99,11.00 11.99,10.00 10.99,60,以下,60 70,70 80,80 90,90,以上,异 距 分 组,等 距 分 组,开口组,间断分组,连续分组,2.1,统计分组,2024/11/27,33,基本概念与基本原则,:,组限,区间端点。,分 “上限” 和 “下限”,上限,下限,组距,=,上限 下限,组中值,=,2.1,统计分组,2024/11/27,34,1.,组数,:,一般,5,15,组,组 数,(只能采用),变量值较多,变量值不多,连续型,离散型,组距式,单项式,分组,变量,2.1,统计分组,调查项目调查单位所承担的基本标志,800 1000,统计表按照主词是否分组及分组的情况可以分为三种:,把一段区间上的变量值作为一组;, 常用作各组的代表值。,简单随机抽样又称纯随机抽样,(2)按经验公式计算;,1990年07月01日00时,把一个变量值作为一组,总体中有多少个不同的变量值那就要分多少个组。,也是其他随机抽样方法的基础。,某车间工人月工资统计表,50户居民消费支出直方图,全国范围:人口普查、农业普查、工业普查、第三产业普查、基本单位普查等。,是专门组织的一种非全面调查,它是从调查对象中选择具有代表性的单位作为典型单位,通过对其调查来认识客观事物的一种调查方法。,1953年06月30日24时,2024/11/27,35,2.,组距,:,有等距和异距之分 ;,组距与组数成反比关系;,闭口组,上、下限都有的组;,开口组,只有上限或下限的组。,2.1,统计分组,2024/11/27,36,连续分组时,重叠式组限采用“,上限不在组内,”的原则;,开口组也有组距!,开口组的组距以相邻组的组距为该组组距,2.1,统计分组,2024/11/27,37,斯特杰斯经验公式:,(组距和组数的确定),2.1,统计分组,2024/11/27,38,3.,组中值,常用作各组的,代表值,。,2.1,统计分组,2024/11/27,39,(确定组距和组中值),500,2 750,500,500,500,200,2 250,1 750,1 250,900,组 距,(元),组 中 值(元),2500,以上,2 000 2 500,1500 2 000,1 000 1 500,800 1 000,工 资,(元),2.1,统计分组,2024/11/27,40,10,10,10,10,10,65,75,85,55,95,组 距,(,分,),组 中 值,(,分,),60,以下,60 70,70 80,80 90,90,以上,成 绩,(,分,),!,!,!,2.1,统计分组,2024/11/27,41,1.00,14.50,1.00,1.00,1.00,1.00,13.50,12.50,11.50,10.50,组 距,(,cm,),组 中 值(,cm,),14.00,以上,13.00 13.99,12.00 12.99,11.00 11.99,10.00 10.99,工 件 直 径,(,cm,),2.1,统计分组,2024/11/27,42,2.2,变量数列,频数分布和分布数列,:,频数分布,在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,并计算各组的单位数,称为频数分布。所形成的数列称为,分布数列,。,分布数列分,品质数列,和,变量数列,。,2024/11/27,43,2.2,变量数列,分布数列的两个基本要素:,按某标志所分的,组,;,对于变量数列,用,x,表示变量;,各组的,单位数,;,用,f,表示,频(次)数。,2024/11/27,44,品质分布数列的编制:,例:,某校,2009,年新生情况:,频率分布数列,品质分布数列,频数(次数)分布数列,品质分组,2 500,2 000,4 500,合 计,55.56,44.44,100.00,比重(),女,男,人 数,性 别,2.2,变量数列,2024/11/27,45,变量分布数列的编制:,单项式变量数列,【,例,】,:,调查了,500,户家庭的人口数量,其家庭人口数分布在,1,5,人之间,现将调查资料整理并编制成分布数列的形式,如下:,2.2,变量数列,1 3001 400, 常用作各组的代表值。,1953年06月30日24时,1953年06月30日24时,50户居民约消费品支出累计表,1 3001 400,第二节 统计数据的搜集,调查对象 需要调查的现象总体;,1964年06月30日24时,指根据研究的目的和要求,按某个标志(或若干个标志)将总体划分为若干个不同性质的组。,50户居民消费支出直方图和折线图,某校二年级400名学生期末统计学考试成绩,经整理如下表:,某校二年级400名学生期末统计学考试成绩,经整理如下表:,统计报表所收集的资料可以用于满足各级管理层次的需要。,计量各组次数,编制分布数列。,2024/11/27,46,100.0,7.4,12.6,44.0,26.0,10.0,500,37,5,63,4,220,3,135,2,45,1,合 计,f,x,比重(),户数(户),家庭人数(人),2.2,变量数列,2024/11/27,47,组距式变量数列,【,例,】,:,某校二年级,400,名学生期末,统计学,考试成绩,经整理如下表:,2.2,变量数列,2024/11/27,48,100.00,3.25,15.00,41.75,26.25,13.75,400,13,60,以下,60,60,70,167,70,80,105,80,90,55,90,以上,55,65,75,85,95,组中值,x,合 计,f,分 组,比重(),人数(人),成 绩(分),2.2,变量数列,2024/11/27,49,编制变量数列的程序,资料排序,最大值、最小值、全距;,确定数列类型,单项式、组距式?,确定组数和组距,等距、异距?,确定组限,开口组?,计量各组次数,编制分布数列。,2.2,变量数列,2024/11/27,50,【,例,】,某地区,30,户居民的人均月收入 (元)抽样资料如下,(略),编制变量数列,资料排序:,420 430 440 440 460 470 490 520 540 550 570 600 610 610 610 620 620 630 630 640 640 650 660 660 670 680 700 710 720 730,全距,R,730,420,310,元,2.2,变量数列,2024/11/27,51,数列类型,连续等距数列;,确定组数:,(,1,)根据对事物的具体分析,,分为:,高、中上、中、低收入,四挡;,组数:,n,= 4,,,组距:,310,4 = 77.580 (,元,),100 (,元,),2.2,变量数列,2024/11/27,52,30,合计,13.33,4,700,800,50.00,15,600,700,13.33,4,500,600,23.33,7,400,500,比重(),户数(户),人均月收入(元),100.00,23.34,2.2,变量数列,2024/11/27,53,(,2,)按经验公式计算;,2.2,变量数列,2024/11/27,54,100.00,30,合计,13.33,4,725,700,750,16.67,5,672,650,700,33.33,10,625,600,650,6.67,2,572,550,600,6.67,2,525,500,550,10.00,3,475,450,500,13.33,4,425,400,450,f,组中值,x,分组,比重(),户数(户),人均月收入(元),2.2,变量数列,2024/11/27,55,2.2,变量数列,2024/11/27,56,绘制,:,累计频数(频率)分布表,累计频数(频率)分布图,2.2,变量数列,2024/11/27,57,50,户居民约消费品支出累计表,(向上累计),100,98,94,86,72,50,50,49,47,43,36,25,100,2,4,8,14,22,22,16,2,10,累计比重,(,),累计户数,(户),50,1,2,4,7,11,11,8,1,5,户数,(户),合计,1 700,1 600,1 500,1 400,1 300,1 200,1 100,1 000,900,分组上限,(元),28,14,12,6,10,5,比重,(,),2.2,变量数列,2024/11/27,58,50,户居民约消费品支出累计表,(向下累计),2,6,1,3,7,累计比重,(,),累计户数,(户),14,28,50,72,88,90,14,25,36,44,45,100,50,100,2,4,8,14,22,22,16,2,10,50,1,2,4,7,11,11,8,1,5,户数,(户),合计,1 600,1 500,1 400,1 300,1 200,1 100,1 000,900,800,分组下限,(元),比重,(,),2.2,变量数列,2024/11/27,59,50,户居民,月消费品支出频率累计图,(向上和向下累计),2.2,变量数列,2024/11/27,60,3.5,频数分布的一般类型,P41,类型:,1.,钟型分布,特征:“,中间大、两头小,”,2.,U,型分布,3.,J,型分布,作用,:,检验统计资料的准确性;,分析现象变化的原因;,2024/11/27,61,第,三,节 统计数据的显示,3.1,统计表,3.2,调查图,2024/11/27,62,宾词栏,主词栏,指,标,数,值,横,行,标,题,纵览标题,总标题,3.1,统计表,1.,统计表的结构,合 计,第三,第二,第一,产 业,我国,2009,年,1,季度国内生产总值,100.00,44.23,48.62,7.15,比重,(,%,),65 745.1,29 077.0,31 968.1,4 700.0,GDP,(亿元),2024/11/27,63,统计表的类型,统计表按照主词是否分组及分组的情况可以分为三种:,简单表,简单分组表,复合分组表,3.1,统计表,2024/11/27,64,统计表左右两边不封闭开口式,绘制统计表的规则:,3.1,统计表,2024/11/27,65,40 000,100,40,合 计,12 000,25,10,20 000,50,20,8 000,25,10,按工资分组,1 200,1 000,800,工 资,比 重,人 数,xf,f,/ ,f,f,x,(,元,),(,),(,人,),(,元,),3.1,统计表,闭口组上、下限都有的组;,1 统计数据的直接来源,闭口组上、下限都有的组;,检验统计资料的准确性;,1953年06月30日24时,分为:高、中上、中、低收入四挡;,随机抽样调查的误差可以事先计算并加以控制。,确定组限 开口组?,1 统计数据的直接来源,1 000 1 500,第一节 统计数据的搜集,统计表按照主词是否分组及分组的情况可以分为三种:,确定数列类型 单项式、组距式?,1990年07月01日00时,简单随机抽样又称纯随机抽样,2024/11/27,66,40 000,100,40,合 计,12 000,25,10,20 000,50,20,8 000,25,10,按工资分组,1 200,1 000,800,工 资,比 重,人 数,xf,f,/ ,f,f,x,(,元,),(,),(,人,),(,元,),某车间工人月工资统计表,3.1,统计表,2024/11/27,67,常见的统计图有:,直方图、,折线图、曲线图、,茎叶图,【,例,】,某市,50,户居民消费支出资料(略):,由以上资料编制分组表如下:,3.2,统计图,2024/11/27,68,表,2-5,50,户居民消费支出频数表,分组(元),人数,f,比重,f /,f,(,%,),800900,3,6,9001 000,6,12,1 0001 100,8,16,1 1001 200,7,14,1 2001 300,13,26,1 3001 400,7,14,1 4001 500,4,8,1 5001 600,2,2,合 计,50,100,3.2,统计图,50,户居民消费支出直方图,800 900 1000 1100 1200 1300 1400 1500 1600,户数,f,消费支出,直方图底边为,组距,,高为,频数,f,3.2,统计图,户数,f,800 900 1000 1100 1200 1300 1400 1500 1600,消费支出(元),50,户居民消费支出折线图,折线图的顶点的坐标 (,组中值,次数,),3.2,统计图,50,户居民消费支出直方图和折线图,800 900 1000 1100 1200 1300 1400 1500 1600,户数,f,消费支出,3.2,统计图,50,户居民消费支出曲线图,户数,f,消费支出(元),3.2,统计图,2024/11/27,73,3.2,统计图,茎叶图,8,1,15.,2,6,3,2,1,14.,4,8,7,6,5,2,2,1,13.,7,7,7,6,6,5,5,5,3,3,1,1,0,0,12.,13,9,8,7,6,5,4,0,11.,7,8,8,7,5,5,3,1,1,10.,8,8,7,6,6,5,5,9.,6,8,7,1,8.,3,叶,茎,频数,2024/11/27,74,1.1,统计数据的直接来源,我国历年人口普查时间表,普 查 次 数,标 准 时 点,第一次全国人口普查,1953,年,06,月,30,日,24,时,第二次全国人口普查,1964,年,06,月,30,日,24,时,第三次全国人口普查,1982,年,07,月,01,日,00,时,第四次全国人口普查,1990,年,07,月,01,日,00,时,第五次全国人口普查,2000,年,11,月,01,日,00,时,2024/11/27,75,5.,确定调查项目和调查表:,调查项目,调查单位所承担的基本标志,调查表, “,一览表”、“单一表”,1.2,调查方案设计,2024/11/27,76,统计分组,2.1,统计分组,数量分组,品质分组,标志,性质,复合分组,简单分组,标志,多少,单项式分组,组距式分组,2024/11/27,77,斯特杰斯经验公式:,(组距和组数的确定),2.1,统计分组,2024/11/27,78,组距式变量数列,【,例,】,:,某校二年级,400,名学生期末,统计学,考试成绩,经整理如下表:,2.2,变量数列,有时与调查单位一致,有时不一致。,1982年07月01日00时,组距:3104 = 77.,累计频数(频率)分布表,工 资,1500 2000,某校二年级400名学生期末统计学考试成绩,经整理如下表:,1 统计数据的直接来源,减:产品销售成本,变量分布数列的编制:,简单随机抽样又称纯随机抽样,某校二年级400名学生期末统计学考试成绩,经整理如下表:,分布数列分品质数列和变量数列。,也是其他随机抽样方法的基础。,累计频数(频率)分布图,2024/11/27,79,数列类型,连续等距数列;,确定组数:,(,1,)根据对事物的具体分析,,分为:,高、中上、中、低收入,四挡;,组数:,n,= 4,,,组距:,310,4 = 77.580 (,元,),100 (,元,),2.2,变量数列,2024/11/27,80,40 000,100,40,合 计,12 000,25,10,20 000,50,20,8 000,25,10,按工资分组,1 200,1 000,800,工 资,比 重,人 数,xf,f,/ ,f,f,x,(,元,),(,),(,人,),(,元,),某车间工人月工资统计表,3.1,统计表,50,户居民消费支出直方图和折线图,800 900 1000 1100 1200 1300 1400 1500 1600,户数,f,消费支出,3.2,统计图,
展开阅读全文