统计学第三章统计整理

上传人:伴*** 文档编号:243155603 上传时间:2024-09-17 格式:PPT 页数:45 大小:642KB
返回 下载 相关 举报
统计学第三章统计整理_第1页
第1页 / 共45页
统计学第三章统计整理_第2页
第2页 / 共45页
统计学第三章统计整理_第3页
第3页 / 共45页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三章 统 计 整 理,教 学 目 的,统计调查搜集上来的资料,不论是哪一种类型的资料,都必须经过整理才能进一步进行分析。资料的类型不,同,研究的目的不同,资料整理的方法也不同。通过,本章的学习,要求掌握各种不同类型资料的整理方法、,整理原则、以及一些相关的概念,并能够利用所学的,方法对所给的实际资料按照研究目的的要求进行整理。,第三章 统计整理,1,在学习过程中主要解决以下几个问题,统计整理的意义和方法,统计分组的含义和种类,统计分组的方法,统计分布和分配数列的编制,统计表的结构和种类,第三章 统计整理,2,第三章 统计整理,第一节 统计整理的概念、原则和步骤,第二节 统计分组,第三节 次数分布,第四节 统计表,第三章 统计整理,3,第一节 统计整理的概念、原则和步骤,(,1,),一、统计整理的概念和意义,二、统计整理的方法,三、统计整理的原则和步骤,四、统计整理的组织形式,掌握四个问题,第三章 统计整理,4,一、统计整理,是根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程。,例如:通过调查取得,100,个商业企业某月销售额资料:,(单位:万元),20,,,60,,,45,,,90,,,105,,,56,,,250,,,89,,,130,,,30,,,98,,,300,。,将这些数据资料按“销售额”的多少进行整理,得到下,列整理结果:,销售额,(万元),企业数,(个),0 50 12,50 100 25,100 150 30,150 200 23,250 300 10,合 计,100,二、统计整理的方法:,分组、汇总、编表,第一节 统计整理的概念、原则和步骤,(,2,),第三章 统计整理,5,三、统计整理的原则和步骤,(一)原则,:,目的性原则,;,联系性原则,;,简明性原则,(二)步骤,1,、设计和编制统计资料的汇总方案;,2,、,对原始资料进行审核;,3,、用一定的组织形式和方法对原始资料进行分组、汇总和计算;,4,、对整理后的资料进行审核;,5,、编制统计表;,6,、进行统计资料汇编,系统的积累历史资料。,第一节 统计整理的概念、原则和步骤,(,3,),第三章 统计整理,6,调查资料的检查,准确性 完整性 及时性,准确性检查就是对调查误差的检查,登记性误差,代表性误差,由于错误判断事实或错误登记事实而发生的误差。这种误差可以避免,根据样本单位的数量特征推断总体数量特征时产生的误差。这种误差不可避免,逻辑检查:内容是否合理,有无矛盾,是否符合实际;,检查方法,第三章 统计整理,计算检查:数字有无差错,指标计算方法是否恰当,计算单位是否正确,指标之间平衡关系是否保持。,7,第一节 统计整理的概念、原则和步骤(,4,),四、统计整理的组织形式,1,、逐级汇总:,自下而上一级一级地汇总本地区、本系统、本单位的调查资料。,2,、集中汇总:,把全部调查资料集中在一个机关或最高统计机关进行汇总。,3,、综合汇总:,对各地区和各级都需要的基本资料进行逐级汇总,对全国的总的数字和其他需要在全国范围内进行加工的资料或本系统的全面资料则实行集中汇总。,第三章 统计整理,8,第二节 统计分组(,1,),一 统计分组的概念,统计分组,(Statistical classification),就是根据统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。,统计分组要达,到这样的要求,同一组内的单位性质相同,不,同组所包括的单位性质相异。,(组内同质性,组间差异性),第三章 统计整理,9,分组前,分组后,25,33,42,第三章 统计整理,统计分组图示,10,第二节 统计分组(,2,),二 作用,p.40,(,一)划分现象的类型,(二)揭示现象的内部结构,(三)分析现象之间的依存关系,三 分组标志的选择,p.43,(,一)根据统计研究的目的,选择反映事物本质的标志;,例如:,(二)结合具体时间地点条件来选择反映事物本质的标志。,第三章 统计整理,17,11,根据国务院的决定,继,1996,年第一次全国基本单位普查之后,我国于,2001,年进行了第二次全国基本单位普查。这次普查的标准时点为,2001,年,12,月,31,日,普查对象为中华人民共和国境内除城乡住户和个体工商户以外的所有,法人单位,及其所属的,产业活动单位,。 对普查数据可以作如下一些分类:,法人单位,(万个),比重,(,%,),产业活动单位,(万个),比重,(,%,),全 国,510.7,100.0,708.8,100.0,东 部,286.1,56.0,369.0,52.0,中 部,133.7,26.2,202.6,28.6,西 部,90.9,17.8,137.2,19.4,分类一:按东中西部地区的分组,第三章 统计整理,12,企业法人,(万个),比重,(,%,),从业人员,(万人),比重,(,%,),总 计,302.6,100.0,16502.2,100.0,国有企业,36.9,12.2,5056.8,30.6,集体企业,85.8,28.3,3763.1,22.8,私营企业,132.3,43.7,3170.3,19.2,股份制企业,30.0,9.9,2746.6,16.6,外商投资企业,5.7,1.9,644.0,3.9,港澳台投资企业,8.2,2.7,997.4,6.1,其他企业,3.7,1.3,124.0,0.8,分类二:按企业组织形式分组,第三章 统计整理,13,法人单位数(万个),比重(,%,),总 计,302.6,100.0,100,万元以下,183.1,60.5,100-1000,万元,93.7,31.0,1000,万元,1,亿元,22.6,7.5,1,亿元以上,3.2,1.0,分类三:按营业规模分组,第三章 统计整理,14,法人单位数(万个),比重(,%,),总 计,302.6,100.0,100,万元以下,229.8,76.0,100-1000,万元,57.7,19.1,1000,万元,1,亿元,13.1,4.3,1,亿元以上,2.0,0.6,分类四:按资产规模分组,11,第三章 统计整理,15,注一,法人单位:,是指依法成立,有自己的名称、组织机构和场所,能够独立承担民事责任;独立拥有和使用(或授权使用)资产,承担负债,有权与其他单位签订合同;会计上独立核算,能够编制资产负债表的单位。,注二,产业活动单位:,是指在一个场所从事一种或主要从事一种社会经济活动;相对独立组织生产经营或业务活动;能够掌握收入和支出等业务核算资料的单位。产业活动单位附属于法人单位。,注三,东、中、西部的划分:,东部,包括北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、广东、广西、海南省;,中部,包括山西、内蒙古、吉林、黑龙江、安徽、江西、河南、湖北、湖南省;,西部,包括重庆、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆。,返回,第三章 统计整理,16,第二节 统计分组(,3,),四 统计分组及分组体系,(一)简单分组和平行分组体系,p.44,(,二)复合分组和复合分组体系,五 统计分组方法,(一)按品质标志分组,(二)按数量标志分组,第三章 统计整理,17,品质,分组,方法,变量,分组,方法,以一个变量值代表一组。如:学生按报考科目分组等。这种分组适用于离散型变量,且变量值的个数较少的情况。,以变量值变动的一个区间作为一组,区间的,距离称为组距。适用于连续型变量和离散型,变量的变量值较多的情况。,按品质标志对资料进行分组。这种分组有些比较简单,,有些非常复杂,复杂的品质分组称为分类。如:人口,按性别分组、按职业分组、,国民经济按行业分组,、等。,单项式,分 组,组距式,分 组,在进行组距分组时,会涉及到一些问题,包括:,等距分组和不等距分组、组限、组中值。,第二节 统计分组(,4,),第三章 统计整理,18,第三节 次数分布(,1,),一 次数分布的概念,p.46,在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体中各个单位在各组间的分布,就叫次数分布或次数分配。,它由两部分组成:,总体所分的各个组(的名称)和各组所拥有的单位数(次数或频数)。,二 分配数列,(Distribution series),的种类,(一)品质数列,只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。,第三章 统计整理,19,第三节 次数分布(,2,),如下例:,第三章 统计整理,经济类型,企业数(个),比重(,%,),国有企业,股份制企业,合资企业,独资企业,100,80,50,20,40,32,20,8,合 计,250,100,各组名称,次数或频数,比率或频率,20,按数量标志分组形成为变量数列。,1,、单项数列,是总体按单项式分组而形成的变量数列,每个变量值是一个组,顺序排列。,(二)变量数列,(单项数列和组距数列),第三节 次数分布(,3,),拥有发电机组(套),发电厂数(个),比重(,%,),1,35,28.0,2,48,38.4,3,26,20.8,4,12,9.6,5,4,3.2,合计,125,100.0,变量,次数或频数,比率或频率,第三章 统计整理,21,2,、组距数列,是总体按组距式分组而形成的变量数列,每个组是由若干个变量值形成的区间表示,顺序排列。,工资分组 职工人数(人) 各组人数所占比重,(元) (次数或频数) (,%,) (频率),500600 100 25,600700 200 50,700800 100 25,合 计,400 100,次数和频率的大小反映了各组标志值对总体标志水平所起的,作用的大小。频率:各组的频率大于,0,小于,1,,各组的频率总,和等于,1,。,第三节 次数分布(,4,),第三章 统计整理,22,序 计划完成 工人数 比重 向上累计 向下累计,号 程度(,%,) (人) (,%,) 人数 比重 人数 比重,1 60 70 2 1.0,2 70 80 5 2.5,3 80 90 14 7.0,4 90 100 31 15.5,5 100110 65 32.5,6 110120 52 26.0,7 120130 23 11.5,8 130140 8 4.0,合 计,200 100,三、累计频数或频率分配数列的编制方法,通过累计频数分配数列可以反映累计到某一组出现的总次,数或总频率。想一想:第四组的累计结果说明什么问题?,2,7,21,52,117,169,192,200,1.0,3.5,10.5,26.0,58.5,84.5,96.0,100,8,31,83,148,179,193,198,200,4.0,15.5,41.5,74.0,89.5,96.5,99.0,100,第三节 次数分布(,5,),第三章 统计整理,23,第三节 次数分布(,6,),四 影响次数分布的要素,(,组距数列的编制,),(,一,),组距与组数,组距,=,本组上限本组下限,=,本组下限前组下限,(,二,),等距分组和异距分组,等距,分组,各组组距均相等。如:,1020,,,2030,,,3040,等。组距为,10,。这种分组适用于均匀分布的总体,。,异距,分组,各组组距不一定相等。如:,1020,,,2050,,,5060,,,6070,等。其中第二组与其它各组,组距不同。这种分组适用于资料分布离差较,大或特殊的研究目的。,第三章 统计整理,24,第三节 次数分布(,7,),(三)组限和组中值,1,、组限。,组限就是每一组两端的数值。每一组的起点值称为下限,每一组的终点值称为上限。确定组限的方法有两种:,间断,式确定组限和,重叠,式确定组限,。,2,、组中值。,每组上限与下限之间的中点数值,代表各组变量值的一般水平,是各组的假定平均数。,闭口,组组中值的计算:,组中值,=,(上限,+,下限),/2,开口组组中值的计算:,缺下限:组中值本组上限相邻组组距,/2,缺上限:组中值本组下限相邻组组距,/2,第三章 统计整理,25,实例,1,:某保险公司,100,名营销人员的佣金资料如下,490,620,820,580,950,620,760,690,620,760,460,580,950,880,620,620,880,690,690,760,580,760,620,760,820,520,580,760,460,760,690,880,520,580,580,760,690,690,580,620,420,690,620,690,760,880,690,580,690,580,420,690,620,520,580,690,620,760,760,880,580,690,580,760,760,820,950,460,760,620,460,760,620,690,620,880,820,420,620,880,820,520,760,950,820,690,820,690,760,760,490,580,760,820,880,580,580,690,620,880,第三章 统计整理,26,根据上述原始资料编制单项式变量数列如下,按佣金分组(元),营销人员人数(人),420,3,460,4,490,2,520,4,580,15,620,15,690,17,760,19,820,8,880,9,950,4,合计,100,从这一分配数列可以看出,佣金在,520,元以下和,820,元以上的人数较少,大部分集中在,520-760,元之间,但由于分组较多,各组分配规律并不明显。,第三章 统计整理,27,根据上述原始资料编制组距式变量数列如下,按佣金分组(元),人数(人),400-500,9,500-600,19,600-700,32,700-800,19,800-900,17,900-1000,4,合计,100,该分配数列明显表现出现象的分配规律:两头小中间大的次数分配。,第三章 统计整理,25,28,10,30,20,40,人数,元,营销人员佣金次数分配图,300,400,500,600,700,800,900,1000,1100,第三章 统计整理,29,实例,2,:某电脑公司某年前四个月各天的销售量数据如下(单位:台)。试对数据进行组距式分组。,30,确定组数:根据,Sturges,提出的经验公式得组数,k,为:,确定各组的组距:,d,(,237,141) 10,9.6,10,Sturges,提出的经验公式,有的书上表示为:,d,为组距,统计出各组的频数并整理成频数分布表,31,某电脑公司销售量分组表,30,32,230,240,220,直方图的绘制,某电脑公司销售量分布的直方图,140,150,210,直方图下的面积之和等于,1,190,200,180,160,170,频,数,(,天,),25,20,15,10,5,30,33,折线图与直方图,下的面积相等!,140,150,210,某电脑公司销售量分布的折线图与曲线图,190,200,180,160,170,220,230,240,频,数,(,天,),25,20,15,10,5,30,折线图与曲线图的绘制,34,第三节 次数分布(,8,),五 次数分布的特征,(一)次数分布的表示方法,1,、表示法,2,、图示法:,(,1,)直方图,(,2,)折线图,(,3,)曲线图,(二)次数分布的主要特征,1,、钟型分布,,2,、,U,型分布,,3,、,J,型分布,,4,、水平分布,第三章 统计整理,p.65,作业,1,35,频数分布的类型,对称分布,右偏分布,左偏分布,正,J,型分布,反,J,型分布,U,型分布,几种常见的频数分布,36,第四节 统计表,(,1,),一 统计表的概念,统计表,(Statistical table),是以纵横交叉的线条所绘制的表格来表现统计资料的一种形式。广义的统计表包括统计工作各个阶段中使用的一切表格。狭义的统计表则专指作为统计资料整理工具,表现统计资料整理结果的表格。,二 统计表的作用,p.57,第三章 统计整理,37,第四节 统计表,(,2,),三 统计表的构成,(一)统计表的形式结构,从形式来看,统计表由总标题、横行标题、纵栏标题、指标数值等四部分构成。,(二)统计表的内容结构,从内容看,统计表由主词和宾词两部分组成。,第三章 统计整理,38,统计表的结构,1999,2000,年城镇居民家庭抽样调查资料,项目,单位,1999,年,2000,年,调查户数,平均每户家庭人口,平均每户就业人口,平均每户就业面,平均一名就业者负担人数,平均每人全部年收入,可支配收入,平均每人消费性支出,户,人,人,%,元,元,元,元,40044,3.14,1.77,56.43,1.77,5888.77,5854.02,4615.91,4222.0,3.13,1.68,53.67,1.86,6316.81,6279.98,4998.00,资料来源:,中国统计年鉴,2001,,中国统计出版社,,2001,,第,305,页。,注:本表为城市和县城的城镇居民家庭抽样调查材料。,行标题,列标题,数字资料,总标题,附加,39,第四节 统计表,(,3,),四 统计表的种类,(一)按作用分,1,、调查表,2,、汇总表或整理表,3,、分析表,(二)按主词的分组情况分,1,、简单表,2,、分组表(简单分组表),3,、复合表(复合分组表),第三章 统计整理,40,第四节 统计表,(,4,),五、编制统计表应注意的问题,p.60,(,一)统计表的标题,(二)主词、宾词的排列顺序,(三)计量单位的使用,(四)填写数字的要求,(五)统计表的线条,(六)注解,第三章 统计整理,41,一、判断对错,1,、对统计资料进行分组的目的就是为了区分各组单位之间质,的不同。( ),2,、组中值是根据各组上限和下限计算的平均值,所以它代表,了各组的平均分配次数。( ),3,、分配数列的实质是把总体单位总量按照总体所分的组进行,分配。( ),4,、某企业职工按文化程度分组形成的分配数列是一个单项式,分配数列。( ),5,、对资料进行组距式分组,是假定变量值在各组内部的分布,是均匀的,所以这种分组会使资料的真实性受到损害。( ),6,、任何一个分布都必须满足:各组的频率大于,0,,各组的频数,总和等于,1,或,100%,( ),7,、统计分组后掩盖了各组内部各单位的差异,而突出了各组,之间单位的差异。( ),第三章 统计整理,42,二、单项选择题,1,、统计整理的关键是( ),A,、,对调查资料进行审核,B,、,对调查资料进行统计分组,C,、,对调查资料进行汇总,D,、,编制统计表,B,2,、下列分组中属于按品质标志分组的是( ),A,、,学生按考试分数分组,B,、,产品按品种分组,C,、,企业按计划完成程度分组,D,、,家庭按年收入分组,B,3,、有一个学生考试成绩为,80,分,在统计分组中,这个变量值,应归到( )组。,A,、,6070,分,B,、,7080,分,C,、,8090,分,D,、,90100,分,C,4,、某主管局将下属企业先按轻、重工业分组,再按规模分组,,这种分组属于( )分组。,A,、,简单分组,B,、,复合分组,C,、,分析分组,D,、,结构分组,B,第三章 统计整理,43,三、多项选择题,B C D E,2,、在次数分配数列中( ),A,、,总次数一定,频数和频率成反比,B,、,各组的频数之和等于,100,C,、,各组频率大于零,频率之和等于,1,D,、,频率越小,则组的标志值所起的作用越小,E,、,频率表明各组标志值对总体的相对作用程度,C D E,1,、下列数列属于( ),按生产计划完成程度分组,(%),企业数,8090 15,90100 30,100110 5,合 计,50,、品质分配数列 、变量分配数列,、组距式变量分配数列 、等距变量分配数列,、次数分配数列,第三章 统计整理,44,1,、,_,是统计工作的第三阶段,既是,_,的继续,又是,_,的前提。,2,、统计整理包括对,_,和,_,两个部分的整理,主要是对,_,进行的整理工作 。,3,、统计分组的关键问题在于,_,和,_,。按数量标志分组的结果形成,_,。,4,、在组距数列中,影响次数分布的要素主要有,_,和,_,。,5,、统计表从内容结构上看,是由,_,和,_,两部分构成。,6,、对同一总体选择两个或两个以上标志层叠起来进行的分组叫做:,_,。,四、填空题,统计分析,原始资料,划分分组界限,组距,主词,复合分组,统计整理,统计调查,次级资料,原始资料,变量数列,确定分组标志,组限,宾词,第三章 统计整理,45,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!