资源描述
第三章 统计整理,统计整理的概念和内容 统计分组 变量数列 变量数列的表示方法 统计汇总的组织与技术 统计表,第三章 统计整理,重点: 统计分组的方法 变量数列与统计表的概念和编制 运用计算机进行数据资料的处理和图表的制作 难点: 频数分布的编制; 组限的表现形式; 组距和组中值的计算,引例,按百分制记分,某班30位学生统计学考试成绩(分)资料如下: 92 85 78 51 63 88 60 71 87 70 56 97 80 68 77 75 64 72 89 87 98 81 95 83 79 83 76 89 72 86,某班学生统计学考试成绩表,第一节 统计整理的概念与内容,一、统计整理的概念 统计整理是根据统计研究的目的和任务,对统计调查所搜集到的大量原始资料进行科学的分类和汇总,为统计分析提供系统化和条理化的综合统计资料的过程。,统计整理的意义,统计调查所搜集的反映个体量的原始资料是分散的,不是集中的;是零碎的,不是系统的。根据这些资料。人们难以从总体上分析和认识现象的数量表现。 至于某些已经加工的综合资料,则往往由于资料在分组方法、总体范围或指标涵义、口径、计算方法等方面不同,而不能满足统计分析的要求,也必须先通过统计整理,才能据以从总体上分析社会经济现象的数量表现,,二、数据整理的内容,统计资料整理的内容,进行统计分组统计整理的基础 进行资料的汇总统计整理的中心内容 编制统计表或统计图统计整理的有效表达形式,第二节 统计分组,一、统计分组的意义和作用 统计分组就是根据统计研究目的和任务,按照选定的变异标志将总体划分为若干部分或组别,使组与组之间具有差别性,而同一组内单位保持相对的同质性一种统计方法。 统计分组的意义在于:总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。,一、统计分组的意义和作用,统计分组的作用 区分社会经济现象的类型-类型分组 研究现象的内部结构-结构分组 分析现象之间的依存关系-分析分组,某地区2008年底各类工业企业数,企业规模与流通费用率依存关系,13,社会经济现象之间不同程度的存在着相互依存关系,通过统计分组,可以从数量上研究现象之间依存关系的规律性。 居民家庭随着月收入的增加而月支出也在增加的相关关系,统计分组的要求 三个要素: 母项、子项、分组标志 三个基本要求: 周延性、互斥性、分组标志的同一性,二、统计分组的要求和方法,统计分组,例1:从业人员按文化程度分组 小学毕业 中学毕业(含中专) 大学毕业,文盲或识字不多 小学毕业 中学毕业(含中专) 大专毕业 大学及大学以上 (),(),例2:某商场把服装分为男装、女装、童装。 () 成年装(男女装) 儿童装(男女装),统计分组,(),统计分组的方法 1、分组标志的选择 根据统计研究的具体任务和目的,选择分组标志。 在若干个标志中,选择能反映问题本质的重要标志进行分组。 结合研究现象所处的具体历史条件或社会经济发展的条件选择分组标志。,二、统计分组的要求和方法,统计分组的方法 2、按品质标志和数量标志分组,二、统计分组的要求和方法,经调查,某地年末货币流通量为15.3亿元,比上年增加4.5亿元。,统计分组的方法 2、按品质标志和数量标志分组,二、统计分组的要求和方法,经调查,某地年末货币流通量为15.3亿元,比上年增加4.5亿元。,某厂第二季度工人平均日产量,21,3、简单分组、复合分组和分组体系,根据分组选择标志的多少不同,统计分组又可分为: 简单分组 简单分组是指对统计总体仅按一个标志进行分组 复合分组 复合分组是指对同一总体采用两个或两个以上的标志重叠起来进行分组 分组体系 对于复杂的研究对象,必须从各个方面进行观察和分析研究,以获得对事物全貌的认识,因此要采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成一个体系,称为分组体系。,22,简单分组,复合分组,按性别分类,按职称分类,按年龄分类,男,女,高级,中级,初级,青年,中年,共计12组232,对教师的分类,分组体系,对教师的分类,按性别分类,男性,女性,按职称分类,按年龄分类,高级,中级,初级,青年,中年,共计7组 2+3+2,第三节 变量数列,一、变量数列的概念 在统计分组的基础上,将总体的所有单位按组归类整理,形成总体中各个单位数在各组间的分布,这种表明总体单位数在各组分配情况的分组资料,成为次数分布,又称分配数列 分布在各组的个体单位数叫次数或频数,各组次数占总次数的比重叫频率,第三节 变量数列,一、变量数列的概念,分 类,按品质标志分组品质数列,一般是单项式分组 某班学生的性别构成情况,某厂第二季度工人平均日产量,某工厂工人完成生产定额情况表,某市人口结构组成,某企业职工按工资分组表,组距数列中的几个概念,1、组数 2、组限 3、组距 组距=本组上限本组下限 组距=本组上限本组下限+1 思考:开口组的组距? 4、组中值,二、变量数列的编制,1、阵列,求全距 2、确定变量数列的形式 3、确定组距和组数 4、确定组限 5、计算各组单位数,二、变量数列的编制,0 1 2 3 4 1 1 1 3 3 3 3 4 5 1 5 0 5 3 3 4 4 3 4 4 3 3 2 2 3 3 2 2 3 3 2 2 2 2 2,50 60 71 76 80 91 52 64 72 77 81 99 54 62 73 77 82 92 63 72 78 83 94 65 73 79 84 96 67 74 76 86 68 75 75 87 64 75 74 85,某车间50名工人日加工零件数,117 122 124 129 139 107 117 130 122 125 110 118 123 126 133 134 127 123 118 112 108 131 125 117 122 133 126 122 118 108 112 134 127 123 119 113 120 123 118 112 137 114 120 128 124 115 139 128 124 121,50名工人分组步骤,确定组数k=1+3.322lg507 计算组距=(139-107)/7=4.65 确定组限,编制频数分布表,工人日加工零件频数分布表,第四节 变量数列的表示方法,一、列表法 即用统计表格形式表述变量数列的内容,这种表式也叫做次数分布表。,累计频数(频率),从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。,从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。,41,向上累计较小制累计,指各组频数或频率由变量值低的组向变量值高的组累计。 累计数反映各组上限以下的累计频数或频率。 如右表:学生考试成绩分布,42,向下累计较大制累计,指各组频数或频率由变量值高的组向变量值低的组累计。 累计数反映各组下限以上的累计频数或频率。 如右表:学生考试成绩分布,二、图示法 次数多边形图 次数直方图 累计次数分布图 次数分布曲线图,次数多边形图及次数直方图,累计次数(频率)分布图,在直角坐标点系上将各组组距的上限与其相应的累计频数(频率)构成坐标点,依次用直线(或光滑曲线)相连 。,在直角坐标点系上将各组组距的下限与其相应的累计频数(频率)构成坐标点,依次用直线(或光滑曲线)相连 。,累计次数(频率)分布图,49,次数分布曲线图,50,特征:”两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量分布次数少,形若古钟。 根据其偏斜情况分为对称钟型分布、左偏钟型分布和右偏钟型分布。,(一)钟型分布,次数分布曲线图,51,对称钟型分布,也叫正态分布,以中心变量值为对称轴呈对称分布。,人数,年龄,02:23:39,52,左偏钟型分布,也叫正偏钟型分布,变量值小的次数较变量值大的次数多。,人数,年龄,53,右偏钟型分布,也叫负偏钟型分布,变量值大的次数较变量值小的次数多。,人数,年龄,02:23:39,54,特征:靠近中间的变量值分布的次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的字型分布。 如人口死亡率按年龄分组。,(二)型分布,02:23:39,55,正J型分布:其特征是随着变量值的增大,分布次数也随之增多,若根据变量数列绘成线图,形若英文字母“J”。 如老年人口按年龄分组的死亡人数分布曲线多呈正J型。,(三)J型分布,02:23:39,56,反J型分布:其特征是随着变量值的增大,分布次数也随之减少,若根据变量数列绘成线图,形若反写的英文字母“J”, 如按年龄分组的人口总体的次数分布曲线多呈反J型。,反J型分布,02:23:39,57,洛伦兹曲线又称集中曲线,用以检验社会收入分配的平等程度。可拓展用于研究总体各单位标志分布集中状况或平均性的其他社会经济现象。,(四)洛伦兹分布,02:23:39,58,洛伦兹曲线以累计频率为横轴,以标志值累计比重为纵轴。,(四)洛伦兹分布,第五节 统计汇总的组织与技术,一汇总前的审核 审核方面:及时、完整、准确 审核方法:计算检查、逻辑检查,第五节 统计汇总的组织与技术,二统计汇总的组织形式 逐级汇总 集中汇总,第五节 统计汇总的组织与技术,三统计汇总的技术方法 手工汇总 划记法 过录法 折叠法 卡片法 电子计算机汇总,第六节 统计表,一统计表的概念和构成 从广义上说,统计表是以纵横线条交叉结合成的表格,用来表现统计资料的一种形式,包括统计工作各个环节所用的别哦啊个。本节侧重讨论由统计资料汇总整理而成的统计表的内容。,第六节 统计表,一统计表的概念和构成,总 标 题,主词栏,宾词栏,某地区2007和2008生产总值表,按宾词指标平行排列的统计表,按宾词指标层叠排列的统计表,二、统计表的种类 简单表 分组表 复合表,简单表 2005-2008某省国内生产总值 亿元,02:23:40,68,简单表,1999年国际旅游收入居世界前十名的国家,02:23:40,69,简单分组表,1998年某公司所属两企业自行车合格品数量表,复合分组表 2009年末某地区人口数,三、统计表的设计原则,练习:某医院急诊病人就诊等待时间如下,14 19 24 19 16 20 24 20 21 22 24 18 17 23 26 22 23 25 25 19 18 16 15 24 21 26 19 21 23 20 22 22 16 16 16 12 25 19 24 20 要求分5组。 1)构筑频数分布; 2)需急诊服务的病人的等待时间在20分钟以上的所占的比例; 3)绘制直方图; 4)上述数据显示了需急诊服务病人等待时间的何种状况。,练习:电子协会雇员选择开始工作的时间,7:00 8:30 9:00 8:00 7:30 7:30 8:30 8:30 7:30 7:00 8:30 8:30 8:00 8:00 7:30 8:30 7:00 9:00 8:30 8:00 汇总数据,构建: a、频数分布 b、百分数频数分布 c、饼形图 d、汇总结果表明弹性时间系统中雇员有什么偏好?,练习:某班学生统计学考试成绩的分配数列如下表,1某企业对某所属车间的生产计划完成百分比采用如下分组,请指出哪项是正确的( )。 A80_89 B80%以下 C80%以下 D85%以下 9099% 80.1_90% 80_100% 85_95% 100_109% 90.1_100% 100_110% 95_105% 110%以上 100.1_110% 110%以上 105_115%,单选题,2在进行组距式分组时,凡遇到某单位的标志值刚好等于相邻两组上下限的数值时,一般是( ), A) 将此值归入上限所在组 B) 将此值归入下限所在组 C) 将此值归入上限或下限所在的组均可 D) 另行分组,3品质分组和变量分组的区别在于( )。 A)分组的任务和作用不同 B)选择分组标志的多少不同 C)选择分组标志的性质不同 D)组数的多少不同,4下列分组哪些是按品质标志分组( )。 A)职工按文化程度分 B)固定资产按用途分组 C)工人按工资分组 D)学生按性别分组 E)企业按生产计划完成程度分组,多选题,5下列哪些分组是按数量标志分组( )。 A) 工人按出勤率分组 B) 学生按健康状况分组 C) 企业按固定资产原值分组 D) 家庭按收入水平分组 E) 人口按年龄分组,6在次数分配数列中,( )。 A) 各组的频数之和等于100 B) 各组的频率大于0 C) 频数越小,则该组的标志值所起的作用越小 D) 总次数一定,频数和频率成反比 E) 频率表明各组标志值对总体的相对作用程度,
展开阅读全文