资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第四章 方差分析,(,analysis of variance,),上节课的统计假设测验是如何检验一个或者两个平均数的假设检验方法,用,u,测验或,t,测验。但实际工作中需要对多个(,k,3),样本平均数进行比较,并分析它们之间的差异,也就是多个(,k,3),样本平均数的假设检验方法,这时,若仍采用,t,检验法就不适宜了。这是因为:,第一节 方差分析的意义,1,、检验过程烦琐,例如,一试验包含,5,个处理,采用,t,检验法要进行,=10,次两两平均数的差异显著性检验;若有,k,个处理,则要作,k,(,k-1,)/,2,次类似的检验。,2,、无统一的试验误差,误差估计的精确性和检验的灵敏性低,对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计值。若用,t,检验法作两两比较,由于每次比较需计算一个 ,故使得各次比较误差的估计不统一,同时没有充分利用资料所提供的信息而使误差估计的精确性降低,从而降低检验的灵敏性。,例如,试验有,5,个处理,每个处理 重复,6,次,共有,30,个观测值。进行,t,检验时,每次只能利用两个处理共,12,个观测值估计试验误差,误差自由度为,2(6-1)=10,;若利用整个试验的,30,个观测值估计试验误差,显然估计的精确性高,且误差自由度为,5(6-1)=25,。可见,在用,t,检法进行检验时,由 于估计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。,3,、推断的可靠性低,即使利用资料所提供的全部信息估计了试验误差,若用,t,检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互比较的两个平均数会增大犯,I,型错误的概率,降低推断的可靠性。,由于上述原因,多个平均数的差异显著性检验不宜用,t,检验,须采用方差分析法。,方差分析,(analysis of variance,ANOVA),是由英国统计学家于,1923,年提出的。,这种方法是将,k,个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。,方差,是平方和除以自由度的商。,“,方差分析法是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术,”,,方差分析实质上是关于观测值变异原因的数量分析。,第四章 方差分析,(,analysis of variance,),方差分析,是用于两个及两个以上样本均数差别的显著性检验,以检验试验所得的两个及两个以上样本均数是否来自相同总体。它将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。,第二节 方差分析的基本原理,第四章 方差分析,(,analysis of variance,),由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。,方差分析的基本思想是:,将全部观察着的总变异按影响试验结果的诸因素分解为若干部分变异,构造出反映各部分变异作用的统计量,之后构造假设检验统计量,F,,实现对总体均属的推断。也就是通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。,第一节 方差分析的意义,第四章 方差分析,(,analysis of variance,),方差分析主要用途:,均数差别的显著性检验,分离各有关因素并估计其对总变异的作用,分析因素间的交互作用,方差齐性检验。,在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间的差异。例如农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫效果等,很多问题都可以使用方差分析方法去解决。,第一节 方差分析的意义,一、基本原理,二、,F,测验,(一),F,分布,(二),F,测验的思想,第四章 方差分析,第二节 方差分析的基本原理和,F,测验,一、基本原理:,看以下试验结果:有,K,个果树品种的品种对比试验,每个品种随机抽取,n,株调查单株产量,得到如下数据表,品种,单株,及产量,1,2,3,K,(,i=1K,),1,2,3,n,T,i,X,11,X,12,X,13,X,1n,X,21,X,22,X,23,X,2n,X,31,X,32,X,33,X,3n,X,K1,X,K2,X,K3,X,Kn,T,1,T,2,T,3,T,K,上表中,X,11,、,X,12,X,Kn,是,kn,个变异的数值,,即处理平方和,SS,t,=,与总平均数,用品种的平均数,品种不同引起的变异,,就是处理变异,,可能的原因有二:,一是品种不同;,总变异,SS,T,是,由哪些原因导致,的变异组成,?,其变异用离均差平方和表示即,总变异,SS,T,=,之差的平方和,乘以,n,表示,二是试验误差。,试验误差引起的变异,是指处理因素以外的其它偶然因素引起的变异,如土壤肥力、观察测定差异等,用,误差平方和,SS,e,来表示,当然,是,试验误差,。,是品种内观测值与该品种平均值之差,,于是,在这个试验中,有如下关系:,总变异平方和,处理间变异,SS,t,=,误差变异,SSe=,列成下面的表,一、自由度和平方和的分解,设有,k,组数据,每组皆具,n,个观察值,则该资料共有,nk,个观察值,其数据分组如表,6.1,。,表,6.1,每组具,n,个观察值的,k,组数据的符号表,组别,观察值,(,y,ij,,,i,=,1,,,2,,,,,k,;,j,=,1,2,,,n,),总和,平均,均方,1,y,11,y,12,y,1,j,y,1,n,T,1,2,y,21,y,22,y,2,j,y,2,n,T,2,i,y,i,1,y,i,2,y,i,j,y,i,n,T,i,k,y,k,1,y,k,2,y,kj,y,kn,T,k,在表,6.1,中,总变异是,nk,个观察值的变异,故其自由度,v,=,nk,1,,而其平方和,SS,T,则为:,(,61,),其中的,C,称为矫正数:,(62),对于第,i,组的变异,有,从而总变异,(61),可以剖分为,:,(,63,),即 总平方和,=,组内,(,误差,),平方和,+,处理平方和,组间变异由,k,个 的变异引起,故其自由度,v,=,k,1,组间平方和,SS,t,为:,组内变异为各组内观察值与组平均数的变异,故每组具有自由度,v,=,n,1,和平方和 ;而资料共有,k,组,故组内自由度,v,=,k,(,n,1),组内平方和,SS,e,为:,(65),(,64,),因此,得到表,6.1,类型资料的自由度分解式为:,(66),总自由度,DF,T,=,组间自由度,DF,t,+,组内自由度,DF,e,求得各变异来源的自由度和平方和后,进而可得,:,(67),MS,e,作分母去除,MS,t,,商数用,F,表示,即,F=MS,t,/MS,e,MS,t,可能有两种情况:,其一 处理间产量,有,显著差异,MS,t,=,处理效应方差(,MS,t,),+,误差方差(,MS,e,);,其二 处理间产量,无,显著差异,MS,t,是,误差方差,MS,e,的估计值,MS,t,=MS,e,前一种情况下,,后一种情况下,,可以,根据,F,的大小来判断处理间有无显著差异。,F,接近于,1,,处理间无显著差异;,F1,,处理间有显著差异。,F,接近于,1,。,1+,较大的数,即,F1;,方差分析的基本思路,方差分析的基本思路:,(,1,)把全部数据看成从,同一,总体抽出的几组样本,,求出总变异,即,SS,T,=,(,2,)将,总变异,根据可能引起变异的原因,分解成由各原因引起的变异平方和与自由度,得到各原因引起的方差;,(,3,)将,各项方差与误差方差相除得到,F,值;,(,4,)若,F1,,推断处理间有显著差异,,接着做多重比较;,(,5,)若,F,接近于,1,,推断处理间无显著差异,,,分析结束。,。,基本思路图示:,(,1,)若,F F,,处理间有显著差异,全部试验数据,总变异,SS,T,处理间变异,SS,t,误差变异,SS,e,相,除,得,F,相除得,MS,t,处理自由度,df,t,F,与,F,相比,结,论,总自由,度,df,T,相除得,MS,e,结,束,误差自由度,df,e,判,断,多重,比较,例,6.1,以,A,、,B,、,C,、,D 4,种药剂处理水稻种子,其中,A,为对照,每处理各得,4,个苗高观察值,(cm),,其结果如表,6.2,,试分解其自由度和平方和。,表,6.2,水稻不同药剂处理的苗高,(cm),药剂,苗高观察值,总和,T,i,平均,A,18 21 20 13,72,18,B,20 24 26 22,92,23,C,10 15 17 14,56,14,D,28 27 29 32,116,29,T,=,336,=21,根据,(66),进行总自由度的剖分:,总变异自由度,DF,T,=(,nk,1)=(4,4),1,=15,药剂间自由度,DF,t,=(,k,1)=4,1=3,药剂内自由度,DF,e,=,k,(,n,1)=4,(4,1),=12,根据,(63),进行总平方和的剖分:,或,或 药剂,A,内:,药剂,B,内:,药剂,C,内:,药剂,D,内:,所以,进而可得均方:,二、,F,测验,前面说,F 1,,则判断处理间有显著差异。,可是,究竟大到什么程度,才能判断有显著差异的呢?,要,FF,,才判断处理有显著差异,。,通过,F,与,F,相比较来测验处理间差异是否显著的方法叫,F,测验。,由上已知,方差比的分布规律如何?我们下面进行讨论。,,是方差比。,(一),F,分布:,(1)F,(,0,,,+,),(2),F,=1,(3),分布向左偏斜,F,分布,df,1,=,1,df,2,=,2,继续以,1,和,2,为自由度成对地抽取样本,见图:,将二者相除,,此“比”用,F,表示,,即,求得它们的均方为,和,按自由度,df,1,=,1,df,2,=,2,抽取两个样本,2,在,N,(,,)总体中,,样本不同,F,值不同 构成,F,分布。,F,连续型随机变量,F,分布的,概率密度函数,1,和,2,分别为,分布只与,1,和,2,有关,即以,1,和,2,为参数,如,1,和,2,确定,则曲线就定了,而与原总体参数无关。,1,和,2,不同,就得到不同的,曲线,。,的自由度,,F,为自变量。,和,F,分布曲线特征:,(,1,)具有平均数,=1,(,2,)取值区间为,0,,,;,(,3,)某一特定曲线的形,状则仅决定于参数,v,1,和,v,2,。,在,v,1,=1,或,v,1,=2,时,,F,分布,曲线是严重倾斜成反向,J,型;,当,v,1,3,时,曲线转为偏态,(,图,6.1,),。,图,6.1,F,分布曲线,(随,v,1,和,v,2,的不同而不同),对于任何,F,分布,可以用积分的方法求区间内的概率:,P(FF,i,)=F(F,i,)=,P(FF,i,),即阴影部分的概率,外面部分的概率为,P(F,i,,,+)=1-P(FF,i,),。,如图,。,应用上式求出各种自由度下,F,曲线不同概率相应的,F,值,制成,F,表。请看附表:,5%,与,1%,显著点的,F,值表,。,F,值表结构,第一横行 大均方自由度,=,分子自由度,=(,处理自由度,),第一纵列 小均方自由度,=,分母自由度,=(,误差自由度,),表 中,F,的临界值,:,上行是,F,0.05,;,下行是,F,0.01,,,查,df,1,=8,、,df,2,=20,的,F,值,见下图。,F,0.05,=2.45 F,0.01,=3.56,,,含义,F=2.45,是一个分界点,此点以外曲线与横轴所夹部分(阴影部分)概率为,5
展开阅读全文