单元四统计描述(平均数、变异指标).ppt

上传人:sh****n 文档编号:12719199 上传时间:2020-05-19 格式:PPT 页数:136 大小:1.70MB
返回 下载 相关 举报
单元四统计描述(平均数、变异指标).ppt_第1页
第1页 / 共136页
单元四统计描述(平均数、变异指标).ppt_第2页
第2页 / 共136页
单元四统计描述(平均数、变异指标).ppt_第3页
第3页 / 共136页
点击查看更多>>
资源描述
1,单元四统计描述(下),2,任务三集中趋势的描述(平均数),一、算术平均数二、调和平均数三、几何平均数四、中位数五、众数六、算术平均数、中位数和众数的比较,3,一、描述分布集中趋势的主要指标及其分类,平均指标的概念平均指标又称平均数,它是统计分析中最常用的统计指标之一。它反映了社会经济现象中某同质总体某一数量标志在一定时间、地点条件下所达到的一般水平,或者反映某一总体、某一指标在不同时间上发展的一般水平(分布的集中趋势)。,4,集中趋势,反映同质总体内某一数量标志在具体时间、地点条件下达到的一般水平的综合指标。,数据集中区,变量x,集中趋势,一组数据向某一中心值靠拢的倾向,5,83名女生的身高,分布的集中趋势、中心数值,6,平均指标反映了总体分布的共性或一般水平,和标志变异指标一起分别从集中趋势和离中趋势两个方面来描述总体分布的特征。次数分布数列中,多数变量值集中在平均数附近,所以用平均数代表一般水平。,7,同质性,即总体内各单位的性质是相同的,如果各单位性质上存在着差异,就不能计算平均数。抽象性,即总体内各同质单位虽然存在数量差异,但在计算平均数时并不考虑这种差异,即把这种差异平均掉了。代表性,即尽管各总体单位的标志值大小不一,但我们可以用平均数这一指标值来代表总体一般水平。,平均指标具有三个特点:,8,可以用来比较同类现象在不同地区、部门、单位(即不同总体)发展的一般水平,用以说明经济发展的高低和工作质量的好坏。可以用来对同一总体某一现象在不同时期上进行比较,以反映该现象的发展趋势或规律。如对同一地区人均年收入逐年进行比较来反映该地区居民生活水平的发展趋势或规律。可以用来分析现象之间的依存关系。例如,分析施肥量和农作物的平均变量的依存关系;劳动生产率和平均单位成本间的依存关系。可以估算和推算其他有关数字,平均指标的作用,9,平均指标的种类,平均指标,静态平均数,动态平均数,位置平均数,数值平均数,几何平均数,调和平均数,算术平均数,中位数,众数,10,算术平均数,算术平均数是计算平均指标最常用的方法,其基本公式是:算术平均数与强度相对数的比较算术平均数的计算有简单算术平均数和加权平均数之分。计算平均数的要求:总体标志总量必须是总体各单位标志值的总和,标志值和单位之间一一对应。,11,1、概念不同。强度相对数是两个有联系而性质不同的总体对比而形成相对数指标。算术平均数是反映同质总体单位标志值一般水平的指标。2、主要作用不同。强度相对数反映两不同总体现象形成的密度、强度。算术平均数反映同一现象在同一总体中的一般水平。3、计算公式及内容不同。算术平均数分子、分母分别是同一总体的标志总量和总体单位数,分子、分母的元素具有一一对应的关系,即分母每一个总体单位都在分子可找到与之对应的标志值,反之,分子每一个标志值都可以在分母中找到与之对应的总体单位。而强度相对数是两个总体现象之比,分子分母没有一一对应关系。,算术平均数与强度相对数比较,12,如果我们掌握了总体各单位标志值,则将总体各单位的标志值简单相加,除以总体单位数,就得到的平均数,公式如下:计算公式:式中:算术平均数总和符号xi总体各单位标志值n总体单位数当统计资料未分组时可用简单算术平均法计算,(一)简单算术平均数,13,某企业某班组有8名工人,某日各人日产量(件)分别为:1212131313161717,则该组工人的平均日产量为:,例1,14,2、加权算术平均数主要用于原始资料已经分组,并得出次数分布的条件。计算公式:,式中:为算术平均数;为第组的次数;n为组数;为第组的标志值或组中值。,15,例2对例1的资料,把工人按日产量分组可得表5-1:,根据表资料,平均日产量应是:,16,例3将例2资料改为计算表52表52工人按日产量分组情况,17,则有平均日产量可见,某组标志值出现的次数越多,即权数f越大,平均数受该组的影响就越大,反之亦然。权数的实质就是各组单位数占总体单位数的比重.如果各组次数完全相同,即各组f相等,此时它不再对x大小产生影响,这时由于,则可得:简单算术平均数是加权算术平均数的特例,18,例4据例2资料,以各组次数占总次数为权数,计算平均日产量。,采用公式,19,由组距数列计算加权算术平均数例5.某商场食品部工人日销售资料如下,计算平均销售额,20,例6某公司所属15个商店某月商品销售额计划完程度如下表,计算平均销售额。商品销售计划完成程度检查表,21,如用计划销售额为权数,则:如用商店数作权数,则:,是非标志的均值(成数),例:某厂去年生产的产品中,合格率是98,计算该厂产品的平均合格率,24,权数的意义和作用,权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用。当各组的次数都相同时,即当f1=f2=f3=fn时,加权算术平均数就等于简单算术平均数。,25,3.算术平均数的数学性质,(1)算术平均数与标志值个数的乘积等于各标志值的总和简单算术平均数:加权算术平均数:(2)各个标志值与其算术平均数的离差之和等于零简单算术平均数:,26,3.算术平均数的数学性质续,加权算术平均数:(3)各标志值与算术平均数离差的平方和为最小值。,27,二、调和平均数,二、调和平均数含义:是算术平均数的变形。是各个变量值的倒数的算术平均数的倒数,故又称倒数平均数,通常用H表示。在现实生活中直接用调和平均数的地方很少见,而在社会经济统计学中经常用到的仅是一种特定权数的加权平均数,,28,二、调和平均数,1.简单调和平均数:标志值的倒数的算术平均数的倒数。例4-4:,29,例7某集贸市场西红柿的价格,早市每千克1元,午市每千克0.50元,晚市每千克0.25元,若早、中、晚各买1元钱,计算平均价格。用算术平均数计算:早、中、晚各买1元钱,合计花3元。早上用1元钱可买111千克,中午用1元钱可买2千克,晚上用1元钱可买4千克,合计共买西红柿7千克。平均价格数:用简单调和平均数计算:,30,二、调和平均数,2.加权调和平均数计算公式:例4-5:,31,例8如例7资料,早上买西红柿为3元,中午买2元,晚上买1元,则其平均价格为:,调和平均数的应用,第五章平均指标,【例】,某企业某日工人的日产量资料如下:,计算该企业该日全部工人的平均日产量。,即该企业该日全部工人的平均日产量为12.1375件。,解:,34,二、调和平均数,在权数选择合适时,加权调和平均数实际上是加权算术平均数的变形:,35,当各组标志总量相等,m1=m2=mn时,加权调和平均数可化简成为简单调和平均数形式:,36,x、f为已知,若只知x和xf,而f未知,则不能使用加权算术平均方式,只能使用其变形即加权调和平均方式。,苹果单价购买量总金额品种(元)(公斤)(元)红富士236青香蕉1.859,37,下面通过实例来说明加权算术平均数和加权调和平均数两种方法的应用。例9某饭店分一部、二部、三部,2000年计划收人分别为300万元、260万元、240万元,计划完成程度分别为102,107,109,求平均计划完成程度。根据掌握的资料,平均计划完成程度应采用以计划收人为权数的加权算术平均法来计算,38,表57某饭店计划完成资料及计算表平均计划完成程度为,39,如果掌握的资料是实际数,而不是计划数,就不能用加权算术平均数公式计算,应以实际收入为权数的加权调和平均数公式计算。见表58。表58某饭店实际完成资料及计算表,40,例102000年某工业部门相关指标数值,分别采用加权调和平均数法和加权算术平均数法计算生产工人平均劳动生产率。资料见表59。表592000年某工业部门有关资料,41,表5102000年平均生产工人劳动生产率计算表将表中数值代入公式,可得平均生产工人劳动生产率为:,42,三、几何平均数,含义:是若干项变量值连乘积的n次方根。通常不是用于计算静态的单位标志平均数,而是用于计算时间上相互衔接的比率的平均数。当各变量值的连乘积等于总比率或总速度时,适宜于用几何平均数计算各变量值的平均数。,43,三、几何平均数,1、简单几何平均数:是n个变量值xi连乘积的n次方根。计算公式为:G=式中G表示几何平均数,xi表示各项变量值例4-6:,44,三、几何平均数,加权几何平均数:是各标志值fi次方的连乘积的次方根,计算公式为:G=例4-7:,45,【例12】某地区上个五年计划期间,经济发展速度如下表所示:,则平均发展速度为:,46,【例13】某地区20年来经济发展速度如下表所示,求20年中经济平均发展速度。,20年中的经济平均发展速度为:,47,运用几何平均数注意的问题:,数列的标志值中有一个为0,则几何平均数为0用环比指数计算几何平均数,受到最初水平和最末水平影响。几何平均数主要用于计算平均发展速度,属于动态平均数。计算静态平均数时,较少用此法。,48,算术平均数、几何平均数、调和平均数三者关系,算术平均数、几何平均数、调和平均数三者之间的一般数量关系为:调和平均数小于几何平均数小于算术平均数;当各变量相等时,调和平均数等于几何平均数等于算术平均数。,49,四、众数Mode,1.定义:众数是指社会现象总体中最普遍出现的标志值。2.众数的几何意义,50,3.众数的确定,1)未分组资料确定众数2)单项式分配数列确定众数:出现次数最多的标志值就是众数3)组距式分配数列确定众数:由组距数列确定众数,先确定众数组,再通过一定的公式计算众数的近似值有下限公式与上限公式:,51,四、众数Mo续,下限公式:上限公式:例4-8:,第五章平均指标,【例】某金融机构以复利计息。近12年来的年利率有4年为3,2年为5,2年为8,3年为10,1年为15。求平均年利率。,设本金为V,则至各年末的本利和应为:,第1年末的本利和为:,第2年末的本利和为:,第12年末的本利和为:,分析:,第五章平均指标,第四节几何平均数,二、加权几何平均数,则该笔本金12年总的本利率为:,即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。,解,【专栏53】,分析,第1年末的应得利息为:,第2年末的应得利息为:,第12年末的应得利息为:,第五章平均指标,则该笔本金12年应得的利息总和为:=V(0.034+0.052+0.151),这里的利息率或本利率不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。因为,假定本金为V,第五章平均指标,所以,应采用加权算术平均数公式计算平均年利息率,即:,解:,(比较:按复利计息时的平均年利率为6.85),第五章平均指标,57,平均数的补充形式,属于位置平均数,两者都是为避免原数据中极端值的影响而采用的方法,都不受每个原数据大小的影响,具有稳健性,只受位置和次数的影响。例如用人口年龄中位数来说明人口年龄的类型,用价格中位数来说明市场物价现象等.,三位置平均数,58,(一)、众数(mode),概念:众数是总体中各单位出现次数最多(最普遍,最大众化)的那个标志值,也就是该总体各单位中最普通、最常出现的标志值。用众数也可以表明社会经济现象的一般水平。记作:M0特点:一组数据中出现次数最多的变量值适合于数据量较多且有明显的集中趋势时使用不受极端值的影响(缺乏敏感性)一组数据可能没有众数或有几个众数,59,众数的涵义某制鞋厂要了解消费者最需要哪种型号的皮鞋,调查了某百货商场某季度的销售情况.,从表中可以看出,25.5cm的鞋号销售量最多,如果我们计算算术平均数则为26.5cm,而这个号码显然是没有实际意义的,而直接用25.5cm做为顾客对皮鞋所需尺寸的集中趋势既便捷有符合实际,60,众数(不惟一性),无众数原始数据:10591268,一个众数原始数据:659855,多于一个众数原始数据:252828364242,61,1、由单项数列来确定众数将数据资料进行分组,编制次数分布数列;通过观察找出次数出现最多的那个标志值即可。,众数的确定,62,某年级女生的身高分布情况,求出众数,63,例14:某厂甲车间有200名工人,他们每月加工的零件数如下表所示:,M034,64,例15:某厂甲车间有200名工人,他们每月加工的零件数如下表所示:,则,日产量众数为13或者17,65,例16不同品牌饮料的频数分布情况如下表所示,这里的变量为饮料品牌众数为:可口可乐,66,例17甲城市家庭对住房状况评价如下表所示,众数为:不满意,67,方法:确定众数所在的组通过公式计算众数值公式为:,2、由组距数列来计算众数,U:众数所在组的上限L:众数所在组的下限i:众数所在组的组距:众数组与前一组次数之差:众数组与后一组次数之差,68,例18现检测某厂生产的一批电子产品的耐用时间,得到资料如下表所示:,众数位于第三组L=800U=1000i=1000-800=200244-16183244-15787,69,代入公式得:,405060708090100,5040302010,AGF,BC,人数,成绩,xy,LU,Mo=L+x=U-y,O,ED,绘图求得众数:即先画相邻三组次数分布直方图,然后连接相邻两组次数差的对角线,再以对角线的交点向x轴引一条垂线,它与X轴的交点即为众数.,405060708090100,5040302010,AGF,BC,人数,成绩,xy,LU,Mo=L+x=U-y,O,ED,72,也可以作图求解众数,M0=897.65,73,当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数。在数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)。,众数的原理及应用,74,五、中位数Median,1.定义:中位数是将总体各个单位按其标志值的大小顺序排列,处于数列中点的那个单位的标志值。在总体中,标志值小于中位数的单位占一半,标志值大于中位数的单位也占一半。,75,1.所给资料未分组(先按大小顺序排列)中位数位置:当n为奇数时,中位数就是居于中间位置的那个标志值。例19设有9个工人生产某种产品,其日产量件数按大小顺序排列为67778991014。则中位数位次即处于第5位的那个标志值为中位数。即Me=8件。,中位数的确定,76,例19设有10个工人生产某种产品,其日产量件数按大小顺序排列为6777899101418。则其中位数位次:中位数处在第5个标志值与第6个标志值之间中点的位置。则Me=(8+9)/2=8.5,当n为偶数时,中位数是处于中间位置的那两个标志值的算术平均数。,77,2.所给的资料已分组(1)根据单项数列确定中位数方法:先计算单项数列得累积次数,确定中位数位置看其在数列累积次数得哪一组中,则该组对应的标志值即为中位数。,78,例20某学院1999到2000学年共有30名同学获得奖学金学生获奖学金分布情况及计算表,79,从表中资料计算,中位数位置为:(人)中位数在第15人的位置上。无论是以下累计法还是以上累计法,所选择的累计人数数值都应是含15人的最小数值。表中的17和21符合这一要求,它们对应的都是第三组,即800元就中位数。,80,方法:先确定中位数所在位置然后用公式计算中位数公式为:该公式假定中位数组的频数在该组内均匀分布式中:L:中位数所在组下限U:中位数所在组上限fm:中位数所在组的次数i:中位数所在组的组距Sm-1:中位数所在组前面各组的累计次数Sm+1:中位数所在组后面各组的累计次数,(2)根据组距数列确定中位数,81,例21现检测某厂生产的一批电子产品的耐用时间,得到资料如下表所示:,82,83,五、中位数(续),(2)单项式分组资料确定中位数当为奇数时,当为偶数时,例题4-10:,84,五、中位数续,(3)组距式分组资料确定中位数下限公式:上限公式:例题4-11:,85,(三)几种平均数关系,86,1.众数、中位数、平均数的特点和应用,众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用,算术平均数、众数、中位数数值关系,87,(一)对称分布情况下,2.算术平均数、众数、中位数数值关系,88,(二)偏态分布情况下,89,在一般的情况下,不论是右偏还是左偏,中位数总是位于众数和算术平均数之间,根据皮尔逊经验公式,三者具有如下的关系等式:,例子:某厂上月产量的中位数为720,众数为640,则估计该厂的产量的算术平均数为?右偏还是左偏?,90,任务四离中趋势的描述(变异指标),变异指标的含义与作用极差平均差标准差变异系数,91,92,离中趋势,所谓离中趋势,是指数列中各变量值之间的差距和离散程度。例如有A、B、C、D四组学生各5人的成绩如下:A组:60,60,60,60,60B组:58,59,60,61,62C组:40,50,60,70,80D组:80,80,80,80,80数据显示,平均数相同,离势可能不同;平均数不同,离势可能相同。,93,变异指标含义,也称为标志变动度,是与平均指标相联系的一种综合指标。用于综合反映总体各个单位标志值的差异的程度。,总体指标和平均指标都是对总体的规模和一般水平的认识,但这些指标不能反映各单位的差异情况,相反地却掩盖了这些差异。如:,变异指标值越大,平均指标的代表性越小;反之,平均指标的代表性越大,94,例某车间两个生产小组各人日产量如下:甲组:20,40,60,70,80,100,120乙组:67,68,69,70,71,72,73下图可以看出甲组离散程度大,乙组离散程度小。,95,70,70,96,平均指标,说明变量的集中趋势,标志变异指标,说明变量的离中趋势,综合反映总体的差异性。,97,甲、乙两学生某次考试成绩列表,甲、乙两学生的平均成绩为80分,集中趋势一样,但是他们偏离平均数的程度却不一样。乙组数据的离散程度大,数据分布越分散,平均数的代表性就越差;甲组数据的离散程度小,数据分布越集中,平均数的代表性越大。,2.作用:,标志变异指标是评价平均数代表性的依据。,98,标志变动度可用来反映社会生产和其他社会经济活动过程的均衡性或协调性,以及产品质量的稳定程度。,99,全距是总体各单位标志值最大值和最小值之差,一、极差(全距)R,100,例甲乙两组工人,每组有工人7名,甲组全距:,表两组工人工资资料单位:元,乙组全距:,101,优点:缺点:,计算简单、直观。,(1)受极端值影响大;(2)没有量度中间各个单位间的差异性,数据利用率低,信息丧失严重;(3)受抽样变动影响大,大样本全距比小样本全距大。因为大样本更可能包含最极端的值.,102,平均差,平均差是总体各单位标志值与其算术平均数离差绝对值的算术平均数。或各变量值与其算术平均数的平均离差。用A.D表示,103,计算公式,(1)简单平均差适用于未分组资料,104,【例】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的平均差。,解:,即该售货小组5个人销售额的平均差为93.6元。,105,加权平均差适用于分组资料,106,【例】工人日产量分组资料如下,107,解:,108,例某班统计学考试分数资料如下,109,计算平均差如下:,110,注:,离差总体单位的标志值与其平均数之差即。平均差使用绝对值是为了避免各变量值与平均数的离差之和等于零。,111,优点:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。,平均差的特点,一般情况下都是通过计算另一种标志变异指标标准差,来反映总体内部各单位标志值的差异状况,112,(三)、方差与标准差S.D.(),标准差():是总体各单位的标志值与其算术平均数的离差平方的算术平均数的平方根,又称均方差。方差():是标准差的平方。,1.概念和计算:,113,简单标准差适用于未分组资料,计算公式:,114,【例A】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。,解:,(比较:其销售额的平均差为93.6元),即该售货小组销售额的标准差为109.62元。,115,加权标准差适用于分组资料,标准差的计算公式,116,【例】计算下表中某公司职工月工资的标准差。,117,解:,(比较:其工资的平均差为138.95元),即该公司职工月工资的标准差为167.9元。,118,例:以下是江苏省和浙江省2005年年营业收入超过10亿元企业,试用标准差来比较两省营业收入超过10亿元企业收入的稳定程度.,119,江苏:先计算平均数:=43.26(亿元)标准差=31.52(亿元)浙江:=32.98(亿元)=26.07(亿元),120,121,122,标准差的特点,不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算.由同一资料计算的标准差的结果一般要略大于平均差。,123,(四)是非标志的平均数和标准差,是非标志,又称交替标志,它是用“是”“否”或“有”“无”来表示的。由于是非标志只有两个标志表现,使得研究问题大为简化。常用1表示具有某种标志表现,其单位数用N1表示,用0表示不具有某种标志表现,其单位数用N0表示,全部总体单位数用N表示。这两部分单位数(N1和N0)在总体单位数(N)中所占的比例,即“是”或“非”的单位数在全体单位数中所占比例,称为“成数”,分别记为p和q。,124,总体中具有某种标志表现的单位数的成数pN1N总体中不具有某种标志表现的单位数所占的成数qN0N,125,是非标志的算术平均数为:是非标志的标准差为:,126,是非标志的标准差系数:例1:某批产品共500件,其中合格品480件,不合格品20件,要求计算成数、标准差和标准差系数。P=480/500=96%Q=20/500=4%标准差:(96%*4%)0.5=19.6%标准差系数:19.6%/96%0.2041,127,(五)、变异系数,1、变异系数CoefficientofVariation:变异系数也称离散系数,是各变异指标与其算术平均数的比值。2、作用:消除现象由于不同计量单位、不同平均水平所产生的影响,128,变异系数,129,身高的差异水平:cm,体重的差异水平:kg,不可比,用变异系数可比,130,常见的变异系数有:,极差系数:平均差系数:标准差系数:,131,标准差系数,变异系数指标,132,标准差系数,【例】某车间某小组有6个工人,分别带了1个徒工,其日产量(件)数列如下:甲组(工人组):626570738082乙组(徒工组):81317192224,133,可以看出甲组标志值变异程度较小,平均数更具有代表性,但进一步计算,,通过观察:,134,计算结果发现:甲组标准差大于乙组标准差,似乎可得出甲组平均数比乙组平均数代表性差的结论,这与事实不符。究其原因,是因为两数列原有标志值水平不一样,不能用来判断平均数的代表性。那么,怎样判断两个总体标志值的离散程度,评价其平均数的代表性大小呢?应进一步计算其标志变异的相对程度标志变动系数。,135,【例】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。,解:,一班成绩的标准差系数为:,二班成绩的标准差系数为:,因为,所以一班平均成绩的代表性比二班大。,136,复习思考题,1总量指标和相对指标各有哪些作用?2强度相对指标和平均指标的异同?3什么是计划完成相对数?检查中长期计划执行情况有哪些方法?4正确运用相对指标(/平均指标)有哪些原则?5与众数、中位数相比,算术平均数在对数据的计算处理上有何特点?6离散系数与极差、平均差、标准差(或方差)等一般变异指标相比,在数值表现形式上有何特点?在分析意义上有何差别?7计算题(重点加强,以教材本章自附习题为重),
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!