资源描述
,statistics,统计学,第四章综合指标,第四章,综合指标,本章内容,总量指标,相对指标,平均指标,标志变异指标,第一节,总量指标,总量指标,总量指标的概念,:,反映现象总体在一定时间、地点条件下的总规模和总水平的指标。,总量指标的特点:,总量指标是绝对数形式,一定有计量单位。(人口),总量指标数值大小受总体范围大小的影响。总体范围大,总量指标数值则大,反之,总量指标数值就小。(,GDP,),总量指标的计算只限于有限总体。 (空气),总量指标的作用:,反映社会经济现象总体的基本状况和基本实力。,是计算相对指标和平均指标的基础。,总量指标的分类,1.,按其反映的,内容,不同,总体单位总量指标,总体单位数多少的总量指标。,总体指标总量指标,总体单位某一数量标志值的总和。(性别、年龄),注意,!,对于一个确定的总体而言,总体单位总量指标是唯一的,而总体标志总量指标则有许多。,一个总量指标是总体单位总量还是总体标志总量,不是固定不变的,它是随着研究目的和研究对象的不同而发生变化的。,2.,其反映的,时间,状况不同,时期指标,表明社会经济现象总体在一段时期内发展过,程的总结果。(一年),时点指标,表明社会经济现象总体在某一时刻(瞬间),数量状况。(年初、年末),时期指标与时点指标的区别:,时期指标具有,可加性,,不同时期的指标数值相加表明较长时期的总量。时点指标不具有可加性,不同时点的指标数值相加没有实际意义。,时期指标的数值大小,与时期长短有关,,而时点指标数值的大小则与时间间隔长短没有直接关系。,时期指标的数值可以,连续计数,,而时点指标的数值只能间断计数。,3.,按其所采用的,计量单位,不同,实物量指标,表明事物使用价值 (千克、斤、件),价值量指标,表明事物价值量 (销售额),劳动量指标,以劳动时间作为计量单位 (天数、小时),总量指标的计算方法,直接计量法:,通过全面调查,对所研究的现象总体单位一一进行调查登记,然后,逐步加以汇总得到总量指标。(人口),估算法:,是间接计算总量指标的一种方法,当总体的总量指标不能直接计算,或不必直接计算时,便可采用估算法,(,平衡关系推算法、因素关系推算法、比例关系推算法、插值估算法,),。(工业产值),第二节,相对指标,相对指标的概念,相对指标,(,相对数,),:是通过两个有联系的指标进行,对比,,以反映现象总体的数量结构、变化程度或现象之间的数量关系。(男生占全班人数的百分比),相对指标的意义:,可使原来不能直接相比较的指标成为可比较。,是开展统计分析的重要工具。,能够反映出现象之间相互联系的程度。,相对指标的分类,结构相对指标,比例相对指标,比较相对指标,强度相对指标,动态相对指标,计划完成程度相对指标,相对指标,结构相对指标:,利用统计分组法,将总体划分为,性质不同,的部分,然后用各部分的,数值与总体数值对比,得到的相对数,从而反映总体,各组成部分占总体比重,的大小。,我国,2006,年,GDP,的产业构成,产 业,增加值,/,亿元,比重,/,第一产业,第二产业,第三产业,24700,102004,82703,11.8,48.7,39.5,合计,209407,100.0,比例相对指标,:用同一总体内部的两个,不同组成部分,之间的,数值对比,,以反映,各组成部分之间,的数量关系。,例如,我国,2006,年末人口总数为,131448,万人,其中男性人口,67728,万人,女性人口数为,63720,万人,人口性别比例为,106.3,100,。,比较相对指标:,用两个,不同总体,的,同类指标数值对比,,以反映,某一,现象在,同一时间内不同空间,条件下发展的均衡程度。,例,1,:,2005,年美国的,GDP,为,124550.7,亿美元,人均,GDP,为,43740,美元,而同年中国的,GDP,为,22289.0,亿美元,人均,GDP,为,1740,美元。则,也就是说,中国的国内生产总值相当于美国的,18,,而人均,GDP,只相当于美国的,3.98,。,动态相对指标:,通过对,某一,指标在,不同时间,上的数值进行对比而得到的相对指标。它能说明,同类事物,在,不同时间,上的发展和变化程度。,式中的报告期是指所要研究的时期,基期是指作为对比标准的时期。,2009,年我校学生人数,900,人,,2015,年学生人数,11000,人,,2016,年学生人数,13000,人,,2015,年的学生人数是,2009,年的,11000/900=1222%,,,2016,年的学生人数是,2009,年的,13000/900=1444%,强度相对指标:通过对,两个性质不同而又有密切联系,的指标进行对比,以反映现象强度、密度或普及程度的相对指标。,强度相对指标多为有名数,用复合单位表示,少数强度相对指标是无名数。(人均粮食产量、人均棉花产量、人均国民收入),应注意的是,强度相对指标在表现形式上同平均指标十分相似,但它们却有着实质性的差别,因为平均指标是总体标志总量除以总体单位总数,而强度相对指标是两个不同性质但又有密切联系的总体的指标之比。,计划完成程度相对指标:,将现象在某一时期,实际,完成的数值与,计划,数值对比得到的相对数。,计算计划完成程度相对指标时,要求分子分母在指标含义、计算口径、计算方法、计量单位、时间长度和空间范围等方面应完全一致。(在建工程的完工进度),计划完成程度相对指标的特点是:,由于计划数总是衡量计划完成情况的标准,故分子分母 不得互换;,判断计划完成程度的好坏,要视指标的类型而定。,计划相对指标的计算方法,1,计划指标是绝对数,实际完成数和计划数都是同一时期的,自计划期初至某时间的累计完成数对计划期全期计划数之比,2.,计划指标是相对数,当计划指标是增长率时,当计划指标是降低率时,3,计划指标是相对数,4,长期计划的制定与检查,水平法:规定出计划期最末一年应达到的水平,提前完成计划的时间(计划期月数实际完成月数),+,超额完成计划数,达标月(季)日均产量上年同月(季)日均产量,注意,在水平法检查计划时,从计划期的任何一个时间开始,如果连续累计一年(未必是一个年度)时间的数值,达到或超过了规定的计划期末年的数值,即可认为完成了计划。,例,2,:某企业按五年计划规定,最后一年销售量应达,200,万吨,计划执行情况如下表所示。,时 间,第一年,第二年,第三年,第四年,第五年,五年合计,上半年,下半年,一季度,二季度,三季度,四季度,一季度,二季度,三季度,四季度,销售量,110,122,66,74,37,38,42,49,53,58,65,72,775,试分析该企业销售量计划的执行情况。,解:,即超额,24,完成了销售量计划。,由于从第四年第三季度至第五年第二季度销售量的和为:,42+49+53+58,202,万吨,即超过了计划期末年规定的,200,万吨的任务,故提前完成计划时间(,60-54,),+2,(,58-38,),90,6,个月零,9,天,即提前,6,个月零,9,天完成了计划。,练习:某企业,1990,年产品销售量计划为上年的,108%,,,19891990,年动态相对指标为,114%,,试确定,1990,年产品销售计划完成程度,累计法:规定出全部计划期内累计达到的数值。,如果超额完成了计划,也要计算出提前完成计划的时间:从计划期开始至某一时间止所累计完成的实际数达到了计划规定的累计数,就是完成了计划,剩余时间就是提前完成计划的时间。,例某地区计划,5,年基本建设投资总额为,5000,亿元,,5,年内实际累计完成,5200,亿元。试计算计划相对指标。,解:计划相对指标为:,即该地区超额,4%,完成了基本建设投资任务。,计算和使用相对指标的原则,可比性原则,相对指标应和绝对数结合应用,选择好对比的基数,各种相对指标要结合使用,第三节,平均指标,平均指标,平均指标的概念,(,统计平均数,),:是反映统计数据(总体单位标志),一般,水平的统计指标。,平均指标的特点:,将各统计数据的,差异抽象化,,代表了全部统计数据的,一般,水平,反映了现象总体的,综合,数量特征。,平均指标的作用,反映了总体分布的集中趋势,利用平均指标便于进行对比分析,利用平均指标可以分析现象之间的依存关系,平均指标是制定定额的依据,利用平均指标可以作数量上的推算,平均指标的分类,数值平均数,位置平均数,算术平均数,调和平均数,几何平均数,中位数,众数,算术平均数,算术平均数(均值)(,arithmetic averages,):,总体标志总量,除以,总体单位总量,所得的平均数。,设有,n,个数据:,x,1,,,x,2,,,,,x,n,,则这,n,个数据的算术平均数为:,加权算术平均数,(weighted arithmetic averages),适用于分组的定距数据,计算过程:,各组标志值或组中值乘以相应的各组单位数求出各组,标志总量,加总求得总体标志总量,除以各组单位数之和,简单算术平均数,(simple arithmetic averages),适用于未分组的定距数据,例,3,:某企业的某生产班组有,8,个工人,每人日产量分别为:,26,、,21,、,25,、,23,、,22,、,24,、,25,、,28,件,试计算该班组工人的平均日产量。,解:平均每人日产量为:,简单算术平均数也可借助于,Excel,来计算:,将数据录入,Excel,工作表中;,点击“插入函数”,f,x,,出现“插入函数”对话框。在对话框“选择类别”一栏,选择“常用函数”,然后在“选择函数”中点击函数“,AVERAGE”,,出现“函数参数”对话框;,在“函数参数”对话框,Number1,一栏填入数据所在区域,点“确定”,即得平均数。,例,4,:某厂有各组的工资标准和职工人数如下表所示。,按工资标准分组,x,i,/,元,各组职工人数,f,i,/,人,各组工资额,x,i,f,i,(元,/,人),56,62,76,86,96,1,2,4,2,1,56,124,304,172,96,0.1,0.2,0.4,0.2,0.1,合计,10,752,1.0,试计算该厂职工的平均工资。,解:,即职工的平均工资为,75.2,元。,例,5,:某企业职工月工资分布情况如下表所示,试计算职工平均工资。,月工资,/,元,组中值,x(,元,),工人数,f(,人,),工资总额,xf(,元,),800,900,850,6,5100,900,1000,950,10,9500,1000,1100,1050,20,21000,1100,1200,1150,10,11500,1200,1300,1250,4,5000,合计,50,52100,解:首先计算出各组的组中值,然后利用加权算术平均形式来计算职工平,均工资:,即该企业职工月平均工资为,1042,元。,加权算术平均数的大小,不仅取决于各组标志值,x,的大小,同时还取决于各组的频数,f,。若总体中各组的标志值,x,一经确定,各组频数,f,的大小将对平均数的大小产生作用。频数较大组的标志值对平均数的影响大些;反之,频数较小组的标志值对平均数的影响则较小。由于各组频数的大小对各组标志值在计算平均数时的影响具有权衡轻重的作用,故将各组频数,f,称为权数。,算术平均数的数学性质,算术平均数与变量值项数的乘积永远等于各类变量值的算术总和。,或,总体的所有变量值与其算术平均数离差之和等于零。,或,各个变量值与算术平均数的离差平方和为最小值。,算术平均数的特征, 可用于同类现象一般水平的比较。, 对于一个数列来讲,算术平均数只有一个。, 在组距数列中,特别是具有开口组的数列,计算算术平均数 时,利用组中 值作为该组的代表值,存在假定性,其结 果只是一个接近实际平均数的近似值。, 算术平均数受极端值的影响。,调和平均数,(harmonic averages),调和平均数就是各个变量,倒数,的,算术平均数,的,倒数,。,1.,简单调和平均数,2.,加权调和平均数,例,6,:某年某甲乙两个工厂的某种产品销售情况如下表所示。,工厂名称,销售额,/,元,销售价格(元,/,件),甲,5000,1,乙,4800,1.2,试计算两个工厂产品的平均价格。,解:产品的平均价格是产品销售额与销售量之比,但是,在没掌握商品销售量资料的情况下,要求某种产品平均价格,就不能直接用算术平均数的方法计算,而必须先求出产品销售量,然后再以产品销售量去除产品销售额,才能求得平均价格。故,调和平均数的特点,调和平均数也易受极端值的影响。,当组距数列有开口组时,所遇到的问题与计算算,术平均数是一样的。,几何平均数,(geometric mean),几何平均数是,n,个变量值,乘积,的,n,次方根,。,几何平均数的适用范围,:,它常用于计算平均比率或平均速度。,应用条件:变量值的,连乘积等于总比率或总速度,;,变量值不得为,0,或负数。,例,7,:某产品有四道流水作业的加工工序。设某厂,5,月份四道工序的产品合格率分别为,90,、,95,、,92,和,90,,求该厂产品的平均合格率。,解:由于四道工序为流水作业,故产品的总合格率为四道工序合格率的连乘积:,90,95,92,90,,符合几何平均法的应用条件。因此,该厂产品的平均合格率为:,几何平均数可借助于,Excel,中的,GEOMEAN,函数来计算:,将数据输入,Excel,工作表;,打开,“,插入函数,”,f,x,的对话框,在,“,函数类型,”,一栏选择,“,统计,”,,然后在,“,选择函数,”,一栏选择,“,GEOMEAN,”,,点击,“,确定,”,,出现,“,函数参数,”,对话框;,在,“,函数参数,”,对话框中,Number1,一栏输入数据所在区域,点击,“,确定,”,,在输出区域内出现计算结果,此即几何平均数。,众数,(mode),众数是指在某一总体中出现,次数最多,的标志值,或者在变量数列中具有最多次数的变量值,用,M,0,表示。,众数的作用:,通过其频数得多少来反映研究总体频数分配的集中状况。,在没有必要或不可能计算平均数和中位数时,可利用众,数说明问题。,众数与算术平均数结合分析,可使分析更全面。,确定众数的方法,单项数列中,:只需找出次数最多的标志值即可。,组距数列中,:众数不能直接看出,要通过公式计算,然后确定,众数的近似值。,例,8,:某企业,500,名工人按工资分组,所得组距分布如下表所示,试计算工人工资的众数。,工人按工资分组,/,元,工人数,/,人,40,50,50,60,60,70,70,80,80,90,45,80,240,90,45,合计,500,解:首先需确定众数组。例中,60,70,元这一组的次数最多,故该组即为众数组。按表中资料代入下限公式或上限公式计算:,中位数,(median),中位数:将统计数据按大小顺序排列后,居于,中间位置,的,数据就是中位数。,中位数的特点:中位数不受极值的影响,通过中位数,可,以从个一侧面反映频数分布的,集中,趋势。,中位数的算法,由未分组资料确定中位数,先把各数据按大小顺序排列,:,如果项数是,奇数,,则按,(,n,+1,),/2,的公式计算即得中位数的位置,如果项数是,偶数,则取,中间位置,的,两个,数据的,算术平均数,作为中位数,由分组资料确定中位数,单项分布中,:直接根据,累积频数,来确定中位数,组距分布的情况下,:,例,9,:有,7,个职工的工资按高低排列为:,56,、,62,、,62,、,76,、,76,、,76,、,76,,求中位数。,解:中位数位置,=,(,7+1,),/2=4,即第四个工人的工资,76,元为中位数。,若职工人数增加到,8,个,其工资分别为,56,、,62,、,62,、,76,、,76,、,76,、,76,、,86,, 则:,中位数位置,=,(,8+1,),/2=4.5,即第四个职工至第,5,个职工之间为中间位置,故中位数就是第四项与第五项数据的算术平均数,即,(,76+76,),2=76,元,例,10,:两个公司职工文化程度资料如下表,试比较两公司职工的文化程度。,文化程度,人 数,向上累积频数,甲 公 司,乙 公 司,甲 公 司,乙 公 司,高中,专科,本科,硕士,博士,5,50,42,15,3,2,28,64,25,3,5,55,97,112,115,2,30,94,119,122,合计,115,122,解:甲公司职工总人数为,115,,按文化程度高低排序后,中位数位置为,(,115,1,),2,58,,根据向上累积频数可知中位数在第三组,故甲公司职,工文化程度中位数为“本科”。同理,乙公司职工文化程度中位数也为“本,科”。说明两公司职工的文化程度的一般水平是相同的。,例,11,:某市职工家庭人均收入资料如下表所示,试计算中位数。,每人平均月收入,/,元,职工户数,/,户,职工户数累计,向上累计,向下累计,10,20,20,30,30,40,40,50,50,60,60,70,70,80,80,90,100,300,1200,200,150,100,50,30,100,400,1600,1800,1950,2050,2100,2130,2130,2030,1730,530,330,180,80,30,合计,2130,解:根据表中资料可知中位数位置为,说明中位数应当在累计次数为,1065,的组内,从表中可以看出,中位数在,30,40,元的组内。,用下限计算公式计算为:,或用上限公式计算:,即中位数为,35.54,元。,平均指标的比较,算术平均数、调和平均数,和,几何平均数,适用于定距数据,故又称为,数值平均数。,中位数,和,众数,是根据统计数据的,位置,计算出来的,故又称为,位置平均数。,众数、中位数,和,均值,的关系,左偏分布,均值,中位数,众数,对称分布,均值,=,中位数,=,众数,右偏分布,众数,中位数,均值,应用平均指标需要注意的问题,计算平均指标必须以,同质,总体为基础。,进行平均分析时必须,结合组平均数和次数分配。,以,变异指标补充,说明平均指标。,练习:,某高校某系学生的体重资料如下:,试根据所给资料计算学生体重的算术平均数、中位数、众数。,按体重分组,(公斤),学生人数,(人),52以下,5255,5558,5861,61以上,28,39,68,53,24,合计,212,第四节,标志变异指标,标志变异指标,标志变异指标,是表明总体各个数据之间的,差异程度,,或者说是,离散程度,,又称为标志变动度。,标志变异指标的作用:,是衡量平均指标代表性大小的依据。,是抽样调查和相关分析中需要使用的一个重要指标。,标志变异指标的测定方法,全距,平均差,标准差,标准差系数,全距:总体中单位标志值的,最大值与最小值的差距,,即数列中两个极端数,值之差,又称,“极差”,。,全距(,R,),=,最大标志值最小标志值,全距(,range,),全距的计算较为简单,它只考虑到两头最大和最小的数值,所以易受极端值的影响。它没有考虑数列中间个变量值的变动,因而不能全面反应标志变动的程度。,如果统计资料经过整理,并形成组距分布数列,则全距的近似值为:,全距(,R,),=,最高组的上限,-,最低组的下限,2.,数据,已经整理成频数分布,,则可采用,加权平均式,来计算平均差,。,1.,未分组数据,可采用,简单平均式,来计算平均差。,平均差,:总体中各数据与平均数离差绝对值的算术平均数。,平均差(,mean deviation,),例,12,:下表是某车间的两个生产小组日产量资料,试通过平均差比较两组平均数的代表性。,第 一 组,第 二 组,日产量,/,件,标志值与,平均数的离差,离差绝对值,日产量,/,件,标志值与,平均数的离差,离差绝对值,x,i,x,i,20,40,60,70,80,100,120,-50,-30,-10,0,10,30,50,50,30,10,0,10,30,50,67,68,69,70,71,72,73,-3,-2,-1,0,1,2,3,3,2,1,0,1,2,3,合计,0,180,合计,0,12,解:两个小组工人的平均日产量都为,=70,件,根据简单平均式计算出两组工人日产量的平均差:,第一组的平均差,第二组的平均差,计算结果表明,第一组的平均差大于第二组,因此第一组的平均数的代表性比第二组小。,简单平均差也可借助于,Excel,中的“,AVEDEV”,函数来计算。,标准差:各数据与其平均数,离差平方,的,算术平均数,的,平方根,。,标准差的计算:,1.,未分组数据,,采用,简单平均式,来计算标准差。,2.,数据,已经整理成频数分布,,采用,加权平均式,来计算标准差。,标准差(,standard deviation,),第 一 组,第 二 组,日产量,/,件,标志值与,平均数的离差,离差平方,日产量,/,件,标志值与,平均数的离差,离差平方,x,i,x,i,20,40,60,70,80,100,120,-50,-30,-10,0,10,30,50,2500,900,100,0,100,900,2500,67,68,69,70,71,72,73,-3,-2,-1,0,1,2,3,9,4,1,0,1,4,9,合计,0,7000,合计,0,28,前面例子中,两组工人日产量的标准差分别为:,第一组标准差为:,第二组标准差为:,未分组数据的标准差,可借助于,Excel,中的“,STDEVP”,函数来计算(如果计算样本的标准差就要使用“,STDEV”,函数);方差可借助于“,VARP”,函数来计算(样本方差要使用“,VAR”,函数)。其操作步骤类似于平均数的计算,只是选择的是“统计”类型下的“,STEDVP”,和“,VARP”,函数。,例,13,:某企业职工工资状况如下表所示,计算职工工资的标准差。,按月工资额分组,/,元,组中值,/,元,职工人数,/,人,工资总额,离差,离差平方,离差平方,权数,x,i,f,i,x,i,f,i,50-60,60-70,70-80,80-90,90-100,100-110,110-120,55,65,75,85,95,105,115,40,90,200,300,550,360,60,2200,5850,15000,25500,52250,27300,6900,-35,-25,-15,-5,5,15,25,1225,625,225,25,25,225,625,49000,56250,45000,75000,13750,58500,37500,合计,1500,135000,335000,解:,平均数,标准差,是非数据,:,统计数据只表现为“,是,” 或“,非,”两种情况。,一般将反映“,是,”的数据记为,1,,将反映“,非,”的数据记为,0,。,标志值,x,i,单位数,f,i,x,i,f,i,1,n,1,n,1,p,p,0,n,0,0,q,0,合计,n,n,1,1,p,则:,是非数据及其标准差,标准差系数,标准差虽能正确地反映标志变动度的大小,但利用它来比较平均数的代表性是有限的。即只有在平均数相等的情况下,才能直接进行比较,如果平均数不相等,相差很大,就不能直接进行比较。因为标准差数值大小,不仅受各单位标志值之间变异程度的影响,而且受标志值平均水平高低的影响。为了比较不同水平的平均数的代表性,就必须以平均数去除标准差得到标准差系数,以消除标准差受平均水平的影响。,标准差系数:,例,14,:有两个工厂的工人的劳动生产率资料如下表,试比较两厂工人劳动生产率的代表性。,厂 名,平均劳动生产率(元,/,人),标准差,(元),离散系数,V(%),甲,16000,600,3.75,乙,8000,400,5.0,解:甲厂标准差大于乙厂,但不能由此判定甲厂工人平均劳动生产率的代表性比乙厂小。因为两厂的劳动生产率水平相差很大。要对比就必须用标准差系数指标,以消除两厂劳动生产率不同的影响。甲厂离散系数小于乙厂,说明甲厂标志变动程度小于乙厂,因而甲厂工人劳动生产率要均匀一些,平均劳动生产率的代表性高于乙厂。,甲、乙两单位人数及月工资资料如下:,月工资(元),甲单位人数(人),乙单位人数比重(,%,),400,以下,4,2,400-600,25,8,600-800,84,30,800-1000,126,42,1000,以上,28,18,合计,267,100,(,1,)比较甲乙两单位哪个单位工资水平高;,(,2,)说明哪个单位工资更具有代表性,
展开阅读全文