资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,平均数、标准差与变异系数,*,第三章 平均数、标准差与变异系数,第一节 平均数,平均数、标准差与变异系数,平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置。平均数主要包括有:,算术平均数,(arithmetic mean),中位数,(median),众数,(mode),几何平均数,(geometric mean),调和平均数,(harmonic mean),平均数、标准差与变异系数,一、算术平均数,算术平均数,是指资料中各观测值的总和除以观测值个数所得的商,简称,平均数或均数,,记为。,算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。,(一)直接法,主要用于样本含量,n,30以下、未经分组资料平均数的计算。,平均数、标准差与变异系数,设某一资料包含,n,个观测值:,x,1,、x,2,、x,n,,,则样本平均数可通过下式计算:,其中,为总和符号; 表示从第一个观测值,x,1,累加到第,n,个观测值,x,n,。当 在意义上已明确时,可简写为,x,,(3-1)式可改写为:,平均数、标准差与变异系数,【例3.1】 某种公牛站测得10头成年公牛的体重分别为500、520、535、560、585、600、480、510、505、490(,kg,),求其平均数。,由于 ,x,=500+520+535+560+58,+600+480+510+505+49,=5285,,n,=10,平均数、标准差与变异系数,得:,即10头种公牛平均体重为528.5,kg,。,(二)加权法,对于样本含量,n,30 以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数,计算公式为:,平均数、标准差与变异系数,式中: 第,i,组的组中值;,第,i,组的次数;,分组数,第,i,组的次数,f,i,是权衡第,i,组组中值,x,i,在资料中所占比重大小的数量,因此将,f,i,称为是,x,i,的“权”,加权法也由此而得名。,【例3.2】 将100头长白母猪的仔猪一月窝重(单位:,kg,)资料整理成次数分布表如下,求其加权数平均数。,平均数、标准差与变异系数,表31 100头长白母猪仔猪一月窝重次数分布表,平均数、标准差与变异系数,利用(32)式得:,即这100头长白母猪仔猪一月龄平均窝重为45.2,kg,。,计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权法计算。,平均数、标准差与变异系数,【例3.3】 某牛群有黑白花奶牛 1500头,其平均体重为750,kg,,而另一牛群有黑白花奶牛1200头,平均体重为725,kg,,如果将这两个牛群混合在一起,其混合后平均体重为多少?,此例两个牛群所包含的牛的头数不等,要计算两个牛群混合后的平均体重,应以两个牛群牛的头数为权,求两个牛群平均体重的加权平均数,即,平均数、标准差与变异系数,即两个牛群混合后平均体重为738.89,kg,。,(三)平均数的基本性质,1、样本各观测值与平均数之差的和为零,即,离均差之和等于零,。,或简写成,平均数、标准差与变异系数,2、样本各观测值与平均数之差的平方和为最小,即,离均差平方和为最小,。,(,x,i,- ),2, (,x,i,- a,),2,(常数,a,),或简写为: 几何平均数调和平均数,上述五种平均数,最常用的是算术平均数。,平均数、标准差与变异系数,第二节 标准差,一、标准差的意义,用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值变异程度大小的统计量。,平均数、标准差与变异系数,全距(极差),是表示资料中各观测值变异程度大小最简便的统计量。但是全距只利用了资料中的最大值和最小值,并不能准确表达资料中各观测值的变异程度,比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时,可以利用全距这个统计量。,平均数、标准差与变异系数,为 了 准 确 地 表示样本内各个观测值的变异程度 ,人们 首 先会考虑到以平均数为标准,求出各个观测值与平均数的离差,( ) ,称为,离均差,。,虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负 ,离均差之和 为零,即( ) = 0 ,因 而 不 能 用离均差之和( )来 表 示 资料中所有观测值的总偏离程度。,平均数、标准差与变异系数,为了解决离均差有正 、有负,离均差之和为零的问 题 , 可先求 离 均 差的绝 对 值 并 将 各 离 均 差 绝对 值 之 和 除以 观 测 值 个 数,n,求 得 平 均 绝 对 离差,即,| |/n,。虽然平均绝对离差可以表示资料中各观测值的变异程度 ,但由于平均绝对离差包含绝对值符号 ,使用很不方便,在统计学中未被采用。,平均数、标准差与变异系数,我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。,先将各 个离 均差平方,即 ( ),2,,再求,离均差平方和,, 即 ,简称,平方和,,记为,SS,; 由 于 离差平方和 常 随 样 本 大 小 而 改 变 ,为 了 消 除 样 本大小 的 影 响 , 用平方和 除 以 样 本 大 小, 即 ,求出离均差平方和的平均数 ;,平均数、标准差与变异系数,为了使所得的统计量是相应总体参数的无 偏估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量,n,,而用自由度,n-,1, 于是,我们 采 用统计量 表示资料的变异程度。,统计量 称 为,均 方,( mean square缩写为MS),又称,样本方差,,记为,S,2,,即,S,2,=,平均数、标准差与变异系数,相应的总体参数叫,总体方差,,记为,2,。对于有限总体而言,,2,的计算公式为:,平均数、标准差与变异系数,由于 样本方差 带有原观测单位的 平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时 , 常需要与平均数配合使用 ,这 时应 将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差,S,2,的平方根叫做,样本标准 差,,记为,S,,即:,平均数、标准差与变异系数,由于,所以上式可改写为:,平均数、标准差与变异系数,相应的总体参数叫,总体标准差,,记为。对于有限总体而言,的计算公式为:,在统计学中,常用样本标准差S估计总体标准差。,平均数、标准差与变异系数,二、标准差的计算方法,(一)直接法,对于未分组或小样本资料 , 可直接利用(311)或(3-12)式来计算标准差。,平均数、标准差与变异系数,【例3.9】 计算10只辽宁绒山羊产绒量: 450, 450, 500, 500, 500,550, 550, 550, 600, 600,650(g)的标准差。,此例,n,=10,经计算得:,x,=5400,,x,2,=2955000,代入(312)式得:,即10只辽宁绒山羊产绒量的 标准差 为65.828g。,平均数、标准差与变异系数,(二)加权法,对于已制成次数分布表的大样本资料,可利用次数分布表,采用加权法计算标准差。计算公式为:,式中,,f,为各组次数;,x,为各组的组中值;,f,=,n,为总次数。,平均数、标准差与变异系数,【例3.10】 利用某纯系蛋鸡200枚蛋重资料的次数分布表(见表3-4)计算标准差。,将表3-4中的,f、,fx、,代入(314)式得:,即某 纯 系 蛋 鸡200枚 蛋 重的标准差为3.5524,g,。,平均数、标准差与变异系数,表34 某纯系蛋鸡200枚蛋重资料次数分布,及标准差计算表,平均数、标准差与变异系数,三、标准差的特性,(一),标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。,(二),在计算标准差时,在各观测值加上或减去一个常数,其数值不变。,(三),当每个观测值乘以或除以一个常数,a,,则所得的标准差是原来标准差的,a,倍或1,/a,倍。,平均数、标准差与变异系数,(四),在资料服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右一倍标准差( S)范围内;约有95.43%的观测值在平均数左右两倍标准差( 2S)范围内;约有99.73%的观测值在平均数左右三倍标准差( 3S) 范 围内。也就是说全距近似地等于6倍标准差,可用(全距/6)来粗略估计标准差。,平均数、标准差与变异系数,第三节 变异系数,变异系数是衡量资料中各观测值变异 程度的另一个统计量 。,标 准差与平均数的比值称为,变异系数,,记为,CV,。,变异系数可以消除单位 和 (或)平 均数不同对两个或多个资料变异程度比较的影响。,平均数、标准差与变异系数,变异系数的计算公式为:,【例3.11】 已知某良种猪场长白成年母猪平均体重为 190,kg,, 标准差为10.5,kg,,而大约克成年母猪平均体重为196,kg,,标准差为8.5,kg,,试问两个品种的成年母猪,那一个体重变异程度大。,平均数、标准差与变异系数,由于,长白成年母猪体重的变异系数:,大约克成年母猪体重的变异系数:,所以,长白成年母猪体重的变异程度大于大约克成年母猪。,平均数、标准差与变异系数,注意,变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。,平均数、标准差与变异系数,
展开阅读全文