第三章 统计资料的整理 统计学

上传人:小*** 文档编号:243126107 上传时间:2024-09-16 格式:PPT 页数:60 大小:1.52MB
返回 下载 相关 举报
第三章 统计资料的整理 统计学_第1页
第1页 / 共60页
第三章 统计资料的整理 统计学_第2页
第2页 / 共60页
第三章 统计资料的整理 统计学_第3页
第3页 / 共60页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三章 统计资料的整理,第一节统计整理与频数分布,一、统计整理的意义和步骤,二、统计分组,三、频数分布表(分配数列),第二节 统计表与统计图,一、统计表,二、统计图,授课,内容,第一节 统计整理与频数分布,一、统计整理的意义和步骤,二、统计分组,三、频数分布表,一、统计整理的意义和步骤,统计调查得到的,原始资料,1.,统计整理,数据搜集,收集的已加工的,次级资料,分散的,零乱的,计算范围,/,口径方法不同,数据需要条理化,/,系统化,必须再加工,?,一、统计整理的意义和步骤,统计整理是按照统计目的和任务的要求,根据统计统计对象的特点,对调查的统计资料进行分组、汇总,使其集中化、条理化、系统化的活动或过程 。,统计整理是统计工作的第三阶段。这个阶段是统计调查的继续,统计分析的前提。,1.,统计整理,承上启下的作用,一、统计整理的意义和步骤,1.,统计整理,统计调查得到的,原始资料,整理对象,收集的已加工的,次级资料,主要方法,分组,工作内容,分组后计算总体指标,整理目的,系统化、条理化的资料,以图、表、指标的形式展现,分组很重要,可别小瞧哦,一、统计整理的意义和步骤,人们需要系统化的资料才能对总体作出概括性的说明,揭示出总体的内在特征。,承前启后的作用。没有整理,再完备的统计调查都是徒劳,统计分析也无从下手;实现认识飞跃的基础,由个别到全体、由特殊到一般、由现象到本质、由感性到理性的转化。,积累历史资料的必要手段。动态分析的基础。,2.,整理的意义,一、统计整理的意义和步骤,审核统计资料。,包括:一手资料的,完整性、准确性审核,二手资料的时效性、适用性审核,一手资料,完整性审核,检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写齐全,准确性审核,检查数据是否真实反映客观实际情况,内容是否符合实际,检查数据是否有错误,计算是否正确等,3.,整理的步骤,二手资料,适用性审核,弄清楚数据的来源、数据的口径以及有关的背景材料,确定数据是否符合自己分析研究的需要,时效性审核,尽可能使用最新的数据,进行统计分组。,这是统计整理的关键问题。,进行资料的汇总。,这是统计整理的中心内容。,编制统计表或统计图。,统计整理的结果。,汇总技术,手工汇总、电子计算机汇总,二、统计分组,概念,根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究对象的总体划分为若干个不同性质的组。,原则,穷尽原则、互斥原则,例,1,:从业人员按文化程度分组,小学毕业,中学毕业(含中专),大学毕业,文盲或识字不多,小学毕业,中学毕业(含中专),大专毕业,大学及大学以上,(),(,),对总体而言,统计分组是“分”。,即把总体内部具有相对性质差异的各个部分区分开来 。,对总体单位而言,统计分组则是“合”。,即总体同类单位的集合,注意,:,统计分组,具有“分”与“合”的双重意义,注意,:统计分组的组内同质性与组间差异性,统计分组是在总体范围内,通过区分不同单位之间的性质差异,来揭示事物发展的特征和规律。各组之间必须具有性质上的差异。因此,统计分组必须准确地确定各组之间的界限;各组之间的界限应该是质的变化界限。,二、统计分组,作用,作用,1,:揭示总体内部结构,作用,2,:区分和判断社会经济现象的类型特征,作用,3,:揭示变量之间的依存关系,作用,1,:揭示总体内部结构,结构:,整体的构成部分,各部分关系,分 类,1985,年,1990,年,1995,年,2000,年,城乡结构,城镇,23.7,26.4,29.0,36.2,乡村,76.3,73.6,71.0,63.8,性别结构,男,51.7,51.5,51.0,51.6,女,48.3,48.5,49.0,48.4,我国人口城乡和性别结构表,作用,2,:区分和判断社会经济现象的类型特征,显示了总体的结构比重:反映了各个组成部分对总体的影响和决定程度,从而为判断总体的类型特征提供了依据 。,世界,(,平均,),美国,英国,法国,日本,印度,中国,2000,年,城市人口占总人口比重,乡村人口占总人口比重,42.2,57.8,82.7,17.3,88.3,11.7,78.3,21.7,63.3,36.7,21.9,78.1,36.2,63.8,1980,年世界城乡人口分布比较 单位:,%,作用,3,:揭示变量之间的依存关系,收入,支出,800,600,900,670,1000,750,1300,900,1500,950,1600,1000,按某一变量进行分组,来观察与其相关的其他变量取值的变化特点,从而可以揭示出分组变量与其他相关变量之间在方向上和数量上的相互关系。,二、统计分组,按分组标志的多少不同,简单分组,复合分组,按分组标志的性质不同,品质标志分组,数量标志分组,分组种类,数量标志分组,单项式变量分组,组距式变量分组,等距分组,不等距分组,简单分组,简单分组是指按一个标志进行分组。,复合分组,同一个总体在同一张分组表上,把两个或两个以上标志层叠起来进行分组。,数量标志分组,按数量标志分组也叫变量分组,单项式变量分组,组距式变量分组,组距式变量分组的几个基本概念,组限,分组的上限和下限,组距,=,上限一下限,开口组,闭口组,用组中值代表各组变量的假设前提是“,各组变量在各组内均匀分布或对称分布,”,闭口组 :,2639,岁 下限,26,上限,39,组中值(,26,39,),/2=32.5,开口组 :低于,26,岁 无下限组,组中值,26,13/2=19.5,您的年龄,:,低于,26,岁,2639,岁,4059,岁,60,岁以上,开口组,闭口组,全距与组距,等距与异距,组限与组中值,开口组与闭口组,“,名义组限”分组,和“实际组限”分组,重叠组限,“上限不在内”原则,例:学生按成绩分组(分),(,1,),5059,6069,7079,8089,90100,(,2,),60,以下,6070,7080,8090,90,以上,组距,=79-70=9,上限:,79,下限:,70,开口组,闭口组,组中值,组中值,组中值,重叠组限值,70,归于,7080,组,实际组限分组,名义组限分组,组距式变量分组的几个基本概念,统计分组的标志选择,1,)选择分组标志,统计分组的核心问题,分组标志,是将总体区分为各个性质不同的组的标准或依据。,选择分组标志的原则,是:结合一定的,历史条件或经济条件,,根据统计研究的,目的和任务,,选择,最能够反映和决定事物本质属性的标志作为分组标志,。,最能够反映和决定事物本质属性的标志,一是影响因素众多的复杂社会经济问题,应选择,最主要的、基础性的因素,作为分组标志 ;如研究我国经济结构必须选择所有制来来分类;,二是研究具有因果关系的现象时,应选择,决定性的因素,作为分组标志;例如,在研究社会分配关系时,应选择收入水平作为分组标志,来观察消费、社会财富集中状况等问题,三是具有随机性或偶然性变化特征的现象,应选择,相对稳定或可控制性强的特征,作为分组标志。例如,农业与选择施肥量作为分组标志,来观察产量的相应变化规律。,四是选择,客观标准或规定标准,作为分组标志,三、频数分布,1,、频数分布(也叫次数分布),定义:在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体中各单位在各组间的分布,叫做次数分布,分布在各组的个体单位数叫次数,又称频数。各组次数与总次数之比称比率,又称频率。,组成部分:一是对现象分的组,二是各组上变量出现的次数,分类:,根据分组标志特征的不同,分布数列可以分为,品质,数列与变量数列。,2,、,频数分布表的编制方法,第一步,在收集到的资料中,找出最小值与最大值,计算全距。,全距,=,最大值最小值,第二步,确定组距和组数。,一般组数确定为,5-7,组较好,尽量使用奇数组,避免偶数组,对于同一资料,在全距一定的情况下,组数与组距成反比例关系,即,第三步,确定各组组限。,确定组限时,一般是从最低组的下限开始或从最高组的上限开始。最低组的下限不要刚好等于原始资料中的最小值,而应略小于这个最小值;同样,最高组的上限应略高于原始资料中的最大值。特殊情况下,确定组限也可以从中间某组开始。,第四步,汇总各组标志值出现的次数,绘制变量数列表,。,下面举例说明频数分布(次数分布、分配数列)的编制方法,设有,50,名工人某月份完成生产定额的原始资料如下,(,单位:,),:,95 91 114 110 118 133 121 146 117 125,108 105 110 107 137 120 145 125 136 127,121 118 103 115,115,141 117 123 118 129,136 101 98 113,113,114 119 126 120 93,122 108 101 105 125 116 122 132 128 127,第一步,计算全距,全距,=,最大值最小值,=146,91=55,第二步,确定组距和组数,组距,d=,全距,/,组数,=55/6=9.17=10,第三步,确定各组组限。,第四步,汇总各组标志值出现的次数,绘制频数分布表。,频数分布表,按生产定额完成情况分组,%,工人数,/,人,90,100,4,100,110,10,110,120,15,120,130,13,130,140,5,140,150,3,合计,50,课堂练习,女性通常在多大年龄结婚?一家地方报纸列出在一周内申请结婚的女性的年龄如下:,30 27 40 30 26 31 24 23 25 29 32 29 22 33 29 46 25 34 19 23,23,44 29 30 25 23 25 27 37 24 22 27 31 24 26,要求:进行统计分组并形成分配数列,观察内在规律,第一步,计算全距,全距,=,最大值最小值,=46,19=27,第二步,确定组距和组数,组距,d=,全距,/,组数,=27/6=4.5=5,第三步,确定各组组限。,第四步,汇总各组标志值出现的次数,绘制频数分布表。,女性结婚年龄分组资料,年龄,人数,20,以下,20-25,25-30,30-35,35-40,40-45,45,以上,1,9,13,8,1,2,1,第二节 统计表与统计图,一、统计表,二、统计图,一、统计表,将统计数据按一定的顺序排列在表格上,就形成了统计表。从广义讲,统计表包括统计工作各阶段所使用的一切表格,有,调查表、汇总表,和,分析表,。本部分侧重就表现统计整理结果所用的统计表进行讨论。,从统计表的形式上看,,可由,总标题、横行标题、纵栏标题,和,指标数值,四部分组成。 此外有些统计表在表下还增列补充资料、注解、附记、资料来源、某些指标的计算方法、填表单位、填表人员以及填表日期等。,统计表的构成,统计表的构成,总标题,是表的名称,用以概括统计表中全部统计资料的内容。一般写在表的上端中部。,横行标题,是横行的名称,在统计表中通常用来表示各组的名称,它代表统计表所要说明的对象,一般写在表的左方。,纵栏标题,是纵栏的名称,在统计表中通常用来表示统计指标的名称。一般写在表的上方。,指标数值,列在各横行标题与各纵栏标题的交叉处。统计表中任何一个数字的内容由横行标题和纵栏标题所限定。,统计表的构成,总标题,横行标题,纵栏标题,指标数值,统计表的分类,统计表根据,主词是否分组以及分组程度不同,,可分为:,1,、,简单表,,是指对总体未作任何分组而形成的统计表,可以有两种形式:一是按总体单位名称排列的统计表;二是按时间顺序排列的统计表。,2,、,简单分组表,,是指总体仅按一个标志分组而形成的统计表。,3,、,复合分组表,,是指总体按两个或两个以上标志进行复合分组而形成的统计表。,统计表,年份,国内生产总值(亿元),1996,1997,1998,1999,2000,67884.6,74462.6,78345.2,82067.5,89403.6,1,、我国近年来国内生产总值资料:,2,、,年日均创国内生产总值:,按产业和,行业分组,国内生产总值(亿元),第一产业,第二产业,工业,建筑业,第三产业,交运仓储邮电通信业,批发零售贸易餐饮业,其他,39.6,110.7,95.8,14.9,74.1,12.2,18.7,43.2,合计,224.4,简单表,复合表,统计表,统计表的编制规则,开口式,上下端线要粗,表内一般不打横线,但合计栏要打横线,主词有计量单位要专列一栏,宾词的计量单位可写在标题旁或下方。,主词分栏用(甲)、(乙)、(丙),宾词分栏用(,1,)、(,2,)、(,3,),二、统计图,即用统计图形来表示次数分布的方法。常用的有以下种:,直方图,折线图,曲线图,1,、直方图,直方图,即用直方形的宽度和高度来表示次数分布的图形。,0 90 100 110 120 130 140 150,(完成,%,),14,10,4,人数,1,、直方图,绘制直方图时,横轴表示各组组限,纵轴表示次数(一般标在左方)和比率(一般标在右方),没有比率的直方图只保留左侧次数。,然后按分布在各组的次数及比率确定各组在纵轴上的坐标,并依据备组组距的宽度与次数的高度绘成直方形。,2,、折线图,折线图可以在直方图的基础上,用组中值与次数求坐标点连接而成,它表示次数分布的图形,0 90 100 110 120 130 140 150,(完成,%,),15,10,5,人数,3,、曲线图,曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。它实质上是对应于连续变量的次数或比率分布的函数关系图。,曲线图的绘制方法与折线图基本相同,只是连接各组次数坐,标点的线段应当用平滑曲线而不用折线,曲线图,0 90 100 110 120 130 140 150,15,10,5,人数,次数分布的主要类型,钟形分布,正态分布,右偏分布,左偏分布,U,形,分布,J,形分布,正,J,形分布,反,J,形分布,补充部分,EXCEL,公式和函数的运用,EXCEL,制作统计图和统计表,EXCEL,公式,1,、公式的基本特性:,公式的输入是以“,= ”,开始,公式的计算结果显示在单元格中,公式本身显示在编辑栏中。,(,工具,选项,菜单,),如:,=1+2+6,(数值计算),=A1+B2,(引用单元格地址),2,、常用的,EXCEL,公式,常用公式,算术运算符:,+ - * / %,字符运算符:,&,连接符,比较运算符:,= = ,逻辑运算符:,and or not,以函数形式出现,优先级顺序:,算术运算符字符运算符比较运算符逻辑函数符,(,使用括号可确定运算顺序,),3,、引用方式,1,、相对引用,2,、绝对引用,3,、混合引用,4,、跨工作表引用,5,、跨区域引用,4,、函数的概念,函数是,Excel,附带的预定义或内置公式,Excel,函数共九大类。,数学与三角函数,统计函数,数据库函数,逻辑函数,主要掌握函数功能和使用形式,求统计数据的个数,count,求数值数据的个数,counta,计算非空单元格的个数,countblank,计算空白单元格个数,countif,满足条件的单元格个数,常用的,EXCEL,函数,max,和,min,条件函数,if,平均值,average,sum,和,sumif,EXCEL,制表和制图,(,插入,图表,菜单,本节小结,1,、统计表的编制,2,、统计图的绘制,3,、,EXCEL,公式与函数原理,本章总结,统计整理的意义与内容,统计分组的方法、注意组距式分组,统计学图和统计表的制作,运用,EXCEL,公式和函数,数据搜集,数据整理,数据分析,数据解释,学习统计就是要学习,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!