生物统计学-方差分析

上传人:ning****hua 文档编号:243062382 上传时间:2024-09-14 格式:PPT 页数:167 大小:3.23MB
返回 下载 相关 举报
生物统计学-方差分析_第1页
第1页 / 共167页
生物统计学-方差分析_第2页
第2页 / 共167页
生物统计学-方差分析_第3页
第3页 / 共167页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第六章 方差分析,应用统计学,重庆大学生物工程学院,基本概念,方差分析:,方差分析是对两个或两个以上样本平均数差异显著性检验的方法。,例:,为研究某种生物材料的生物学性能,将材料分成三组,分别与成骨细胞共培养,1,7,11,天后测试细胞活性。为避免误差,每组测试,5,个样品,试判断材料的生物学性能。,基本概念,两个样本数据平均数比较,1,、当总体方差 和 已知,或总体方差 和 未知,但两样本均为大样本,u,检验,2,、当总体方差 和 未知,且两样本均为小样本,t,检验,例:,生产某种纺织品,要求棉花纤维长度平均在,30mm,以上。现有一棉花品种,以,n,400,进行抽样,测得纤维平均长度为,30.2mm,标准差为,2.5mm,,问该棉花品种的纤维长度是否合格?,分析:,1,),已知,u,检验,2,),由于只能大于,30mm,才能合格,故,单尾,检验,解:,(,1,)假设,,即该棉花品种纤维长度不能达到纺织品生产要求含量。对,(,2,)选取显著水平,(,3,)检验计算,(,4,)推断,u,0.05 ,显著水平上接受,H,0,,拒绝,H,A,。,即认为该棉花品种纤维长度不符合纺织品种生产要求,例,为了探讨不同窝的动物的出生重是否存在差异,随机选取,4,窝动物,每窝中均有,4,只幼仔,结果如下:,表,4,窝动物的出生重(克),动物号,窝 别,1,2,3,4,和,34.7,33.3,26.2,31.6,125.8,33.2,26.0,28.6,32.3,120.1,27.1,23.3,27.8,26.7,104.9,32.9,31.4,25.7,28.0,118.0,平均数,31.450,30.025,26.225,29.500,通过对以上数据的分析,判断不同窝别动物出生重是否存在差异。,方差分析的意义,k,个样本均数的比较:,如果仍用,t,检验或,u,检验,需比较次数为:,例如,4,个样本均数需比较次数为,6,次。,假设每次比较所确定的检验水准为,0.05,,,则每次检验拒绝,H,0,不犯第一类错误的概率为,1-0.05=0.95,;,那么,6,次检验都不犯第一类错误的概率为,(1-0.05)6=0.7351,,,而犯第一类错误的概率为,0.2649,方差分析的意义,k,个样本均数的比较:,如果仍用,t,检验或,u,检验,有以下问题:,1,、检验过程繁琐,2,、无统一的试验误差,误差估计的精确性和检,验的灵敏性低,3,、推断的可靠性降低,犯第,1,类错误的概率增加,方差分析,:,是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸。,u,检验和,t,检验可以判断两组数据平均数的差异的显著性,,而方差分析则可以同时判断多组数据平均数之间的差异的显著性。当然,在多组数据的平均数之间做比较时,可以在平均数的所有对之间做,t,检验。但这样做会提高犯,型错误的概率,因而是不可取的。,方差分析,由英国统计学家,R.A.Fisher,首创,为纪念,Fisher,,以,F,命名,故方差分析又称,F,检验 (,F,-test,)。用于推断,多个总体均数,有无差异,方差分析的定义,方差分析,是对两个或多个样本平均数差异显著性检验的方法。它是将测量数据的总变异按照变异来源分解为处理效应和试验误差,并做出其数量估计。,它将所有处理的观测值作为一个整体,一次比较就对多有各组间样本平均数是否有差异做出判断。如果差异不显著,则认为它们都是相同的;如果差异显著,再进一步比较是哪组数据与其它数据不同。,方差分析的意义,方差分析基本思想:,1,、把,k,个总体当作一个整体看待,2,、把观察值的总变异的平方和及自由度分,解为不同来源的平方和及自由度,3,、计算不同方差估计值的比值,4,、检验各样本所属的平均数是否相等,实际上是观察值变异原因的数量分析,方差分析的应用条件和用途,方差分析应用条件:,1,、各样本须是相互独立的随机样本,2,、各样本来自正态分布总体,3,、各总体方差相等,即方差齐,方差分析基本用途:,1,、多个样本平均数的比较,2,、多个因素间的交互作用,3,、回归方程的假设检验,4,、方差的同质性检验,第一节 方差分析的基本原理,试验指标,(Experimental index),:试验测定的项目或者性状。,日增重、产仔数、瘦肉率,试验因素,(Experimental factor),:影响试验指标的因素,也称:,处理因素,,简称,因素,或,因子,。,1,、可控因素(固定因素):人为可控,2,、非控因素(随机因素):不能人为控制,试验因素的表示:,大写字母,A,B,C,等来表示,一、相关术语,因素水平,(Level of factor),:试验因素所处的特定状态或者数量等级。简称,水平,水平的表示方法:,用代表该因素的字母添加下标表示,如,A,1,,,A,2,,,B,1,,,B,2,试验处理,(Treatment),:实施在试验单位上的具体项目,简称,处理,。,单因素:试验因素的一个水平,多因素:试验因素的一个水平组合,一、相关术语,试验单位,(Experimental unit),:试验载体,即根据研究目的而确定的观测总体,重复,(Repetition),:一个处理实施在两个或者两个以上的试验单位上,称为处理有重复。,试验单位数称为处理的重复数,一、相关术语,方差分析,是关于,k,(,k,3),个样本平均数的假设测验方法,是将,总变异,按照来源分为,处理效应,和,试验误差,,并做出其数量估计。,发现各变异原因在总变异中相对重要程度的一种统计分析方法。,二、方差分析的基本原理,总变异,分解为,组间变异,和,组内变异,。,组内变异,是个体差异所致,是抽样误差。,组间变异,可能由两种原因所致,,一是,抽样误差,;,二是,处理不同,。,在抽样研究中抽样误差是不可避免的,故导致组间变异的第一种原因肯定存在;第二种原因是否存在,需通过假设检验作出推断,二、方差分析的基本原理,三、数学模型,处理,A,1,A,2, A,i,A,k,重,复,x,11,x,21, x,i,1, x,k1,x,12,x,22, x,i2, x,k2,x,1,j,x,2,j,x,i,j,x,kj,x,1,n,x,2n,x,in,x,kn,总和,T,i,.,T,1,.,T,2,. ,T,i,. ,T,k,.,平均, ,每组具有,n,个观测值的,k,组样本数据资料,例 2.1,调查了5个不同小麦品系的株高,结果列于表21。,在这个例子中,只出现“品系”这样一个因素(,factor,),,故称单因素。共有5 个不同的品系,我们称品系这一因素共有5个水平(,level,)。5,个品系可以认为是5个总体,表 2,1,的数据是从5个总体中抽出的5个样本,通过比较这5个样本,判断这5个总体是否存在差异。,表 21 5个小麦品系株高调查结果,株号,株 高,1,2,3,4,5,和,64.6,65.3,64.8,66.0,65.8,326.5,64.5,65.3,64.6,63.7,63.9,322.0,76.8,66.3,67.1,66.8,68.5,336.5,71.8,72.1,70.0,69.1,71.0,354.0,69.2,68.2,69.8,68.3,67.5,343.0,平均数,65.3,64.4,67.3,70.8,68.6,例 2.2,为了探讨不同窝的动物的出生重是否存在差异,随机选取4窝动物,每窝中均有4只幼仔,结果如下:,表22 4窝动物的出生重(克),动物号,窝 别,1,2,3,4,和,34.7,33.3,26.2,31.6,125.8,33.2,26.0,28.6,32.3,120.1,27.1,23.3,27.8,26.7,104.9,32.9,31.4,25.7,28.0,118.0,平均数,31.450,30.025,26.225,29.500,通过对以上数据的分析,判断不同窝别动物出生重是否存在差异。,以上两个例子的共同点是:每个实验都只有一个因素,该因素有,a,个水平或称为有,a,个处理,(,treatment),,,这样的实验称为单因素实验。 从单因素实验的每一处理所得到的结果都是一随机变量,X,i,。,对于,a,个处理,各重复,n,次(或者说做,n,次观察)的单因素方差分析的一般化表示方法见表23 。,表 23单因素方差分析的典型数据,X,1,X,2,X,3,X,i,X,a,1,2,3,:,j,n,x,11,x,12,x,13,:,x,1j,:,x,1n,x,21,x,22,x,23,:,x,2j,:,x,2n,x,31,x,i1,x,a1,x,32,x,i2,x,a2,x,33,x,i3,x,a3,: : :,x,3j,x,ij,x,aj,: : :,x,3n,x,in,x,an,平均数,x,1 ,x,2 ,x,3 ,x,i,x,a,每一个观察值可以通过如下常用的所谓,线性统计模型,(,linear statistical model,),描述:,其中:,x,ij,是在第,i,水平(处理)下的第,j,次观察值。,是对所有观察值的一个参量,称为,总平均数,(,overall,mean,)。,i,是仅限于对第,i,次处理的一个参量,称为第,i,次,处理效应,(,treatment effect),。,方差分析的目的,就是要检验处理效应的大小或有无。,e,ij,是随机误差成份。,上述模型中,包括两类不同的处理效应。第一类处理效应称为,固定效应,(,fixed effect,),,它是由,固定因素,(,fixed factor,),所引起的效应。若因素的,a,个水平是经过特意选择的,则该因素称为固定因素。例如,几个不同的实验温度,几个不同的化学药物或一种药物的几种不同浓度,几个作物品种以及几个不同的治疗方案和治疗效果等。,在这些情况中,因素的水平是特意选择的,所检验的是关于,a,i,的假设,得到的结论只适合与方差分析中所考虑的那几个水平,并不能将其结论扩展到未加考虑的其它类似水平上。所以上述的那些因素:温度、药物、品种等,称为固定因素。处理这样的因素所用的模型称为,固定效应模型,(,fixed effect model)。,例2.1中的5个小麦品系是特意选择的,目的是从这5 个品系中,选出最优者,因而“品系”这个因素属于固定因素,所用的模型是固定效应模型。,第二类处理效应称为,随机效应,(,ran-,dom,effect,),,,它是由,随机因素,(,random factor,),所引起的效应。若因素的,a,个水平,是从该因素全部水平的总体中随机抽出的样本,则该因素称为随机因素。从随机因素的,a,个水平所得到的结论,可以推广到这个因素的所有水平上。处理随机因素所用的模型称为,随机效应模型,(,random effect mo-del,)。,例,2.2,的动物窝别,是从动物所有可能的窝别中随机选出来的,实验的目的是考查在窝别之间,出生重是否存在差异,因而“窝别”是随机因素。,有时固定因素和随机因素很难区分,除上述所讲的原则外,还可以从另一角度鉴别。,固定因素,是指因素水平,可以严格地人为控制,。在水平固定之后,它的效应值也是固定的。例如,研究三种温度对胰蛋白酶水解产物的影响。因为温度水平是可以严格控制的,即每一温度水平,在各个重复之间都可以准确地控制在一个固定值上,所以在重复该实验时,水解产物的产量也是固定的。简单地说,在水平(不同温度)固定以后,其效应值(产量)也是固定的。因此,温度是固定因素。,随机因素,的水平,是不能严格地人为控制的,,在水平确定之后,它的效应值并不固定。例如,在研究不同农家肥施用量对作物产量的影响试验中,农家肥是因素,不同施用量是该因素的不同水平,作物的产量是它的效应值。由于农家肥的有效成份很复杂,不能像控制温度那样,将农家肥的有效成份严格地控制在某一个固定值上。在重复试验时即使施以相同数量的肥料,也得不到一个固定的效应值。即在因素的水平(施肥量)固定之后,它的效应值(产量)并不固定,因而农家肥是一随机因素。,三、数学模型,三、数学模型,三、数学模型,四、平方和与自由度的分解,全部观测值的总变异可以用总体方差来度量。,方差即均方是离均差平方和除以自由度。,把一个实验资料的总变异按变异来源分解为相应的变异,首先要将总平方和与总自由度分解为各个变异来源的相应部分。,则考察总方差可以考察处理间方差和处理内的方差,四、平方和与自由度的分解,平方和的分解:,总,平方和,=,处理,间,平方和处理,内,平方和,四、平方和与自由度的分解,自由度的分解:,总,自由度,=,处理,间,自由度处理,内,自由度,四、平方和与自由度的分解,计算方差:,五、统计假设的显著性检验,F,检验,F,检验的目的:推断处理间的差异是否存在,五、统计假设的显著性检验,F,检验,注意:,方差分析中的,F,检验总是,单尾检验,而且为,右尾检验,F,越大,,越说明,组间方差,是主要方差来源,,因子影响越显著;,F,越小,,越说明,随机方差,是主要的方差来源,,因子的影响越不显著,五、统计假设的显著性检验,F,检验,eg,.,某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼,20,尾,随机分成,4,组,投喂不同饲料,经,1,个月以后,各组鱼的增重(,g,),资料如下表,试进行方差分析,饲,料,重复,A1,A2,A3,A4,1,319,248,221,270,2,279,257,236,308,3,318,268,273,290,4,284,279,249,245,5,359,262,258,286,分析,:,1,个因素,,4,个水平,,5,个重复的方差分析,解,:,不同饲料饲喂鱼增重的方差分析表,二、 固定效应模型,在固定效应模型中,,a,i,是处理平均数与总平均数的离差,且是个常量,因而,要检验,a,个处理效应的相等性,就要,a,i,判断各是否等于0。若各,a,i,都等于0,则各处理效应之间无差异。因此,零假设为:,备择假设为:,H,A,:,a,i,0(,至少有1个,i,)。,若接受,H,0,,,则不存在处理效应,每个观察值都是由平均数加上随机误差所构成。若拒绝,H,0,,,则存在处理效应,每个观察值是由总平均数、处理效应和误差三部分构成。,例 2.1,调查了5个不同小麦品系的株高,结果列于表21。,在这个例子中,只出现“品系”这样一个因素(,factor,),,故称单因素。共有5 个不同的品系,我们称品系这一因素共有5个水平(,level,)。5,个品系可以认为是5个总体,表 24的数据是从5个总体中抽出的5个样本,通过比较这5个样本,判断这5个总体是否存在差异。,表 21 5个小麦品系株高调查结果,株号,株 高,1,2,3,4,5,和,64.6,65.3,64.8,66.0,65.8,326.5,64.5,65.3,64.6,63.7,63.9,322.0,76.8,66.3,67.1,66.8,68.5,336.5,71.8,72.1,70.0,69.1,71.0,354.0,69.2,68.2,69.8,68.3,67.5,343.0,平均数,65.3,64.4,67.3,70.8,68.6,解:,在方差分析中,为了简化计算可以用编码法。方差分析的编码,必须将全部数据均减去同一个共同的数。在例2.1中,每一个,x,ij,都减去65,列成下表,,株号,品 系,1,2,3,4,5,0.4,0.3,0.2,1.0,0.8,0.5,0.3,0.4,1.3,1.1,2.8,1.3,2.1,1.8,3.5,6.8,7.1,5.0,4.1,6.0,4.2,3.2,4.8,3.3,2.5,总 和,x,i,x,2,i,x,i j,1.5,2.25,1.93,3.0,9.00,3.4,11.5,132.25,29.43,29.0,841.0,174.46,18.0,324.0,68.06,57,1308.50,277.28,先计算校正项,C,再计算,将以上结果列成方差分析表(见表25):,表25,不同小麦品系株高方差分析表,变 差 来 源,平 方 和,自 由 度,均 方,F,品 系 间,误 差,131.74,15.58,4,20,32.72,0.78,41.95*,总 和,147.32,24,*,a,0.01,当分子自由度为4,分母自由度为20时,,F,4,20,0.05,2.87,,F,4,20,0.01,4.43,,F,F,0.01,。,因此,不同小麦品系的株高差异极显著。习惯上用“*”表示在,0.05,水平上差异显著,用“*”表示在,0.01,水平上差异显著,常常称为差异“极显著”(,highly significant,)。,三、 随机效应模型,在实验中,经常回遇到某个因素有许多可能的水平,若参加实验的,a,个水平,是从该因素的水平总体中随机选出的,那么这一因素称为随机因素。其方差分析是通过随机选取的,a,个水平对该因素的水平总体做推断。要求水平的总体是无暇总体,即使不是无限总体,也应相当大,以至于可以认为是无限总体。例2.2中动物的“窝”是随机因素,每一窝是一个水平,这种动物所有的窝构成一水平总体。从该总体中随机选择4个水平(4窝)做实验,实验的目的是希望由这4窝动物去推断该种动物所有不同的窝别之间幼仔出生重是否存在差异。,固定效应模型中,a,i,0,的假设在这里不再适用。在随机模型中,对单个处理效应的检验是无意义的,所要检验的是关于,a,i,的变异性的假设,因而,,H,0,:,s,a,2,0,H,A,:,s,a,2,0,如果接受,H,0,:,s,a,2,0,,则表示处理之间没有差异;若拒绝,H,0,而接受,H,A,:,s,a,2,0,,则表示处理之间存在差异,方差分析的做法仍然是将总平方和分解,,自由度做同样分解,由此可得出,MS,t,和,MS,e,。,然后用,F,单侧检验(具,df,t,,,df,e,自由度),,方差分析的程序与固定效应模型的方差分析程序完全一样,但是结论不同。随机效应模型适用于全部水平的总体,而固定效应模型只适用于所选水平的总体。下面计算例 2.2,并对结果加以解释。,例 2.2,为了探讨不同窝的动物的出生重是否存在差异,随机选取4窝动物,每窝中均有4只幼仔,结果如下:,表22 4窝动物的出生重(克),动物号,窝 别,1,2,3,4,和,34.7,33.3,26.2,31.6,125.8,33.2,26.0,28.6,32.3,120.1,27.1,23.3,27.8,26.7,104.9,32.9,31.4,25.7,28.0,118.0,平均数,31.450,30.025,26.225,29.500,4.7 3.2 2.9 2.9,3.3 4.0 6.7 1.4,3.8 1.4 2.2 4.3,1.6 2.3 3.3 2.0,总 和,c,i,5.80 0.10 15.10 2.00,c,2,i,33.64 0.01 228.01 4.00,c,2,i j,49.98 33.49 69.03 32.86,11.20,265.66,185.36,解:,将表22中的每一个数值都减去30,列成下表,,将上述结果列成方差分析表:,表26 动物出生重方差分析,变 差 来 源,平 方 和,自 由 度,均 方,F,窝 别,误 差,58.575,118.945,3,12,19.525,9.912,1.97,总 和,177.52,15,查表得知,,F,3,12,0.05,3.49,,因,F,F,0.05,,,所以差异不显著。,通过对4窝动物出生重的调查,可以推断不同窝别动物的出生重没有显著差异。,Excel,方差分析,Office,的默认安装中没有,“,数据分析,”,要指定才会安装。一旦安装,,“,工具,”,菜单下出现,“,数据分析,”,条,可以用它来方便的做方差分析等统计推断分析。,可通过运行,Analysis,中的模板文件,ANALYS32.XLL,调入此宏,加载数据分析,如,“,工具,”,菜单下没有,“,数据分析,”,单击,“,加载宏,”,Excel,解方差分析,选一批单元格输入原始数据,;,Excel,解方差分析,选,“,工具,”,“,数据分析,”,;,Excel,解方差分析,选,“,工具,”,“,数据分析,”,“,单因素方差分析,”,Excel,解方差分析,“,单因素方差分析,”,对话框中:,输入区域,分组方式,输出选项,Excel,解方差分析,“,单因素方差分析,”,对话框中:填入信息后单击,“,确定,”,按钮,Excel,解方差分析,分析结果,Excel,解方差分析,方差分析结果表中各项目的含义,SS,平方和,df,自由度,MS,均方,F,及,F,crit,F,值及,F,临界值,,F,crit,=,FINV(a, df,1,df,2,),P-value F,分布概率,P-value=FDIST(F,df,1,df,2,),F,检验,如果否定了,H,0,,接受了,H,A,,表明试验的,总变异主要来源于处理间的变异,六、多重比较,多重比较:,假设对一个固定效应模型经过方差分析之后,结论是拒绝,H,0,,,处理之间存在差异。但这并不说在每对处理之间多存在差异。为了弄清究竟在哪些对之间存在显著差异,哪些对之间无显著差异,必须在个处理平均数之间一对一对地做比较,这就是多重比较。即:,多个平均数的相互比较,六、多重比较,常用的:,1,、最小显著差数法(,LSD,法),2,、最小显著极差法(,LSR,法),新复极差检验(,SSR,法),q,检验,LSD,称为,最小显著差数,(,least significant difference,),它的计算方法简述如下:,对于任意两组数据的平均数,差数(,x,1,x,2,),的差异显著性检验,可以用成组数据,t,检验,,当,n,1,n,2,时,最小显著差数法(,LSD,法),样本平均数的差数,样本平均数差数的标准误,其中,MS,e,为误差方差,即处理内方差,,n,为每一处理的观察次数,于是,具,k(n,1),自由度,当,t,t,0.05,时差异显著,当,t,t,0.01,时差异极显著。因此,当差异显著时,最小显著差数法(,LSD,法),并可得到,当,时差异显著。,t,0.05,2,MS,e,n,称为,最小显著差数,,记为,LSD。,每一对平均数的差与,LSD,比较,当,x,1,x,2, LSD,时,差异显著;否则差异不显著。,LSD,是一种很有用的检验方法,计算起来很方便,也容易比较。但是它有难以克服的缺点,即这种比较方法将会加大型错误的概率。,最小显著差数法(,LSD,法),LSD,法的步骤:,最小显著差数法(,LSD,法),1,、计算平均数,差,数标准误,2,、由,t,逆,函数,(,TINV,),和平均数差数标准误计算出达到差异显著的最小差数,记为,LSD,3,、将全部平均数,从大到小,依次排列,并比较若,即为在给定的水平上差异显著,,反之亦然,说明,实质上是,t,检验,但统一了标准误,简单、灵敏(降低了检验标准、夸大了差异的显著性),I,类错误概率增大,控制单次比较的,I,类错误时应用,无法控制所有比较的总体,I,类错误,最小显著差数法(,LSD,法),2,、求解达到差异显著的最小差数,(,LSD,),临界值:,t,0.05(16),=2.120,t,0.01(16),= 2.921,LSD,0.05(16),=2.120*14.622=31.0,LSD,0.01(16),=2.921*14.622=42.7,3,、将全部平均数,从大到小,依次排列,并比较,excel,数据的排序,工具,数据分析,排序与百分比,excel,数据的排序,处理,平均数,A,1,311.8,64.4*,49.0*,32.2*,A,4,279.6,32.2*,16.8,ns,A,2,262.8,15.4,ns,A,3,247.4,四种饲料饲喂鱼增重差异显著性,(,LSD,检验,梯形法,),4,、分析结果:,A,1,饲料对鱼增重效果极显著高于,A,3,和,A,2,,显著高于,A,4,;,A,4,饲料对鱼增重效果显著高于,A,3,;,A,4,和,A,2,,,A,2,和,A,3,饲料对鱼增重效果没有显著差异,四种饲料饲喂鱼增重差异显著性,(,LSD,检验,字母标记法,),处理,平均数,差异显著性,0.05,0.01,A1,A4,A2,A3,311.8,279.8,262.8,247.4,(1),在最大的平均数上标字母,a,A1,行标注,a,a,(2),将该平均数与以下各平均数相比,凡相差不显著的,(LSD,0.05,则,A4,标,b,b,(3),再以标有,b,的平均数为标准,与各个,比它大的平均数比较,,凡差数,差异不显著,的在字母的右边加标字母,b,,然后再以标,b,的最大平均数为标准与,以下未标字母,的平均数相比,凡相差不显著的都标上字母,b,,直到某个,与相差显著,的则标字母,c,往上:,(A4-A1),是已经比较了;往下,(A4-A2)=17.0,标,b,(A4-A3)=32.4,标,c,b,c,(4),以此重复,直到最小的平均数标记字母,以,A3,为标准,,,往上:,A3,与,A2,相比无显著差异,故在,A2,行,b,右边标注,c,,,A3,与,A4,已比较了,c,A,A,B,B,B,总结:差异不显著标同一字母,差异显著标不同字母,四种饲料饲喂鱼增重差异显著性,(,LSD,检验,字母标记法,),判断:,凡有一个相同标记字母的即为差异不显著,,凡具有不同标记字母的即为差异显著,分析结果:,A,1,饲料对鱼增重效果极显著高于,A,3,和,A,2,,显著高于,A,4,;,A,4,饲料对鱼增重效果显著高于,A,3,;,A,4,和,A,2,,,A,2,和,A,3,饲料对鱼增重效果没有显著差异,把,平均数的差异,看成是,平均数的极差,(range),根据极差范围内所包括的处理数(称为,秩次距,),k,的不同,而采用不同的检验尺度叫做,最小显著极差,LSR,秩次距,是指当平均数由大到小排序后,相比较的两个平均数之间(含这两个平均数)包含的平均数个数,I,类错误下降、工作量加大,最小显著极差法(,LSR,法),为了克服,LSD,法的缺点,,Duncan,(1955),提出了,Duncan,多范围检验,(,Duncan multiple test,)。,检验方法如下:,首先,将需要比较的,a,个平均数依次排列好,使之,并将每一对,x,之间的差(范围)列成下表,a a 1 3 2,1,x,1,x,a,x,1,x,a1,x,1,x,3,x,1,x,2,2,x,2,x,a,x,2,x,a1,x,2,x,3,a 2,x,a2,x,a,x,a2,x,a1,a 1,x,a1,x,a,注:表中的,x,均为,x,新复极差法,Duncan,检验与,LSD,的一个明显不同是,Duncan,检验中,不同对平均数的差有不同的临界值,R,k,。,其中,r,a,r,a,(,k,,,df,),的值可以从附表“多重比较中的,Duncan,表”中查出:表的最左边一列是误差自由度,df,a(,n,1),,最上一列为,k,值,表体为,r,a,(,k,df,)。,表中的,k,值是相比较的两个平均数之间所包含的平均数的个数,。如两个要比较的平均数相邻时,k,2,,两个要比较的平均数中间隔一个平均数时,k,3,,依此类椎。因为平均数共有,a,个,所以需查出,a,一1个,r,a,,,分别乘以,S,,,得:,先从表的第一行最左边的一个差,x,1,x,a,开始比较。若,x,1,x,a,R,a,,,则,x,1,与,x,a,的差异显著;否则差异不显著,然后比较下一个。若,x,1,x,a1,R,a,一1,,则,x,1,与,x,a1,差异显著,否则差异不显著, 。第一行比较完之后用同样的方法比较第二行。先从第二行最左边的一个差,x,2,x,a,开始,在,x,2,到,x,a,这个范围内共包含,a1,个平均数,因此,x,2,x,a,应与,R,a,1,比较,若,x,2,x,a,R,a,1,,,则差异显著,否则不显著,。第二行比较完再比较第三行,第四行, 。直到所有平均数的差均与其相应的,R,k,比较完为止。对于显著的标上“*”,极显著的标上“* *”。,新复极差法,此法是以统计量,SSR,的概率分布为基础的。,SSR,值由下式求得,SSR,检验步骤,计算出,平均数标准误,;,由自由度,df,e,、秩次距,M,(,所含平均数的个数,),查,临界,SSR,值(附表,6,),,计算最小显著极差,LSR,0.05,M,,,LSR,0.01,M,;,将平均数多重比较表中的各极差与相应的最小显著极差,LSR,0.05,M,LSR,0.01,M,比较,作出统计推断,有关采用,excel,自定义函数来生成,SSR,值可参见文献,q,检验法,此法是以统计量,q,的概率分布为基础的。,q,值由下式求得,q,值分布表附表,7,其余与,SSR,检验法一样,例,6.2:,测定东北、内蒙古、河北、安徽、贵州,5,个地区黄鼬冬季针毛的长度,(mm),,每个地区随机抽取,4,个样本,测定结果于下表,试比较各个地区黄鼬针毛长度的差异显著性,地区,东北,内蒙古,河北,安徽,贵州,1,32.0,29.2,25.5,23.3,22.3,2,32.8,27.4,26.1,25.1,22.5,3,31.2,26.3,25.8,25.1,22.9,4,30.4,26.7,26.7,25.5,23.7,分析,:,1,个因素,,5,个水平,,4,个重复的方差分析,解:,“,excel,”,“,工具,”,“,数据分析,”,“,单因素方差分析,”,由分析结果知:,P,0.01,,说明,5,个地区黄鼬冬季针毛长度差异显著,q,检验,1,、计算,平均数标准误,2,、查附表,7,,,当,df,e,=15,M,=2,q,0.05,=3.01,q,0.01,=4.17,则,当,M,=3,M,=4,M,=5,时按同理计算,结果列表,不同地区黄鼬冬季针毛长度的,LSR,值(,q,检验),地区,平均数,差异显著性,0.05,0.01,东 北,内蒙古,河 北,安 徽,贵 州,31.60,27.40,26.03,24.75,22.85,a,b,b,c,A,B,B,C,3,、不同地区黄鼬冬季针毛长度的差异显著(,q,检验),d,C,c,C,M,2,3,4,5,q,0.05,3.01,3.67,4.08,4.37,q,0.01,4.17,4.83,5.25,5.56,LSR,0.05,1.400,1.707,1.897,2.032,LSR,0.01,1.939,2.246,2.441,2.585,4,、,结果表明,:,东北与其他地区;内蒙古和安徽、贵州黄鼬冬季针毛长度差异均达极显著水平。,河北和贵州,安徽和贵州差异达显著水平。,内蒙古和河北,河北和安徽差异不显著。,LSD,检验的分析结果,:,东北与其他地区;内蒙古和安徽、贵州;以及,河北和贵州黄鼬冬季针毛长度差异均达极显著水平。,安徽和贵州差异达显著水平。,内蒙古和河北,河北和安徽差异不显著。,多重比较有多种方法,不同方法用途不同、比较的结果不同,总结:多重比较,尺度大小:,LSD,法,SSR,法,q,检验法,(,原因,:,SSR,和,q,检验是针对不同秩次距的平均数极差采用不同的显著尺度,充分考虑到同一总体抽样时,平均数的极差将随秩次距的增大而增大这一现象,),对试验要求严格时,用,q,检验法较为妥当,生物试验中,由于试验误差较大,常采用新复极差法(,SSR,法),应该注明利用的是何种多重比较方法,1,、多个实验组与一个对照组均数间两两比较,若目的是减小第,II,类错误,最好选用最小显著差法,LSD,;,若目的是减小第,I,类错误,最好选用,SSR,法。,总结:多重比较,2,、多个样本均数间两两比较,常用,q,检验的方法,第二节 单因素方差分析,单因素方差分析,分析目的:,判断某试验因素各水平的相对效果,分类:,根据,组内观测数目,(重复数)是否相同,1,、组内观测次数,相等,的方差分析,2,、组内观测次数,不等,的方差分析,各处理重复次数不等的方差分析,Excel,中对应函数:,求和:,SUM,(),求幂:,POWER,(,x,,,power,),求平方和:,SUMSQ,(),例题,6.3,.,用某种小麦种子进行切胚乳试验,试验分为,3,种处理:整粒小麦(,I,),切去一半胚乳(,II,),切去全部胚乳(,III,),同期播种于条件比较一致的花盆内,出苗后每盆选留,2,株,成熟后进行单株考种,每株粒重(,g,)结果如下表,试进行方差分析,分析,:,1,个因素,,10,个水平,,3,个重复的方差分析,解:,“,excel,”,“,工具,”,“,数据分析,”,“,单因素方差分析,”,结果分析,:,3,种处理的单株粒重无显著差异,第三节 二因素方差分析,两因素试验资料的方差分析是指对试验指标,同时,受到,两个试验因素作用,的试验资料的方差分析,两因素方差分析,主效应,:各试验因素的相对,独立作用,,简称主效或效应,互作,:某一因素在另一因素的不同水平上所产生的效应不同,则二因素间存在交互作用,简称,互作,。,互作效应,实际是由于两个或多个试验因素的相互作用而产生的效应,互作分类,:,1,、正的交互作用,2,、负的交互作用,3,、,无交互作用,:即互作效应为零。没有交互作用的因素是相互独立的因素,此时,不论在某个因素哪个水平,另一因素的效应都是相等的,互作效应,互作与主效应的关系,:,因素间的交互作用显著与否关系到主效应的利用价值,1,、若交互作用,不,显著:各因素的效应可以,累加,,各因素的最优水平组合起来,即为最优的处理组合,2,、若交互作用显著:各因素的效应就不能累加,最优处理组合的选定应根据各处理组合的直接表现选定,3,、有时候交互作用相当大,甚至可以忽略主效应,互作效应,二因素方差分析,分析目的:,判断对因素主效应和交互作用,分类:,1,、无重复观测值的二因素方差分析,2,、具有重复观测值的二因素方差分析,前提条件:两因素之间无交互作用,前提,二因素无互作,每个处理可不设重复,数据,假定,A,因素有,a,个水平、,B,因素有,b,个水平,每个水平组合,只有一个观测值,, 全试验共有,ab,个观测值,无重复观测值的二因素方差分析,因素,A,因素,B,B,1,B,2,B,b,和,平均,A,1,x,11,x,12,x,1,b,T,1.,A,2,x,21,x,22,x,2,b,T,2.,A,a,x,a,1,x,a,2,x,a,b,T,a,和,T,.1,T,.2,T,.,b,T,平均数,无重复观测值的二因素数据资料,A,因素每个水平看作,b,个重复,B,因素每个水平看作,a,个重复,模型假定,每个观察值为一个从平均值等于,ij,的群体随机、独立的抽样。共有,a,b,个样本。,处理效应和区组效应是加性的。处理和区组没有互作,数据的方差相等,e,ij,为随机误差,相互独立,且服从,N(0,,,2,),数学模型,=,总体平均,a,i,=,第,i,个处理效应,,i.,b,j,=,第,j,个区组的效应,,.j,e,ij,=,随机误差项,,x,ij,ij,方差剖分,无重复观测值二因素的试验,A,因素的每个水平有,b,次重复,,B,因素的每个水平有,a,次重复,每个观测值同时受到,A,、,B,两 因素及随机误差的作用。因此全部,a,b,个观测值的,总变异可以剖分为,A,因素水平间变异、,B,因素水平间变异及试验误差三部分,自由度也相应剖分,平方和计算,各项方差计算,ANOVA,表,变异,来源,SS,df,MS,F,c.v.,A,因素,SS,A,a,-1,B,因素,SS,B,b,-1,误差,SS,e,(,a,-1)(,b,-1),和,SS,T,ab,-1,例题,6.4:,将一种生长激素配成,M1,,,M2,,,M3,,,M4,,,M5,五种浓度,并用,H1,,,H2,,,H3,三种时间浸渍某大豆品种的种子,出苗,45,天后得到各处理每一植株的平均干物重,(g),结果如下表,试作方差分析。,分析,:,2,个因素,无重复的方差分析,解:,“,excel,”,“,工具,”,“,数据分析,”,“,无重复双因素方差分析,”,F,检验结果表明:,激素处理浓度之间的,F,值大于,F,0.01,,达到极显著水平;,激素处理时间之间的,F,值未达到显著水平,,说明不同激素浓度对大豆干物重有极显著的影响。,多重比较(用,SSR,检验):,激素处理浓度之间的效应达到极显著水平,而激素处理时间之间的,F,值未达到显著水平,所以只对,5,种浸渍浓度进行多重比较。,计算浓度之间的平均数标准误:,查,SSR,值表(附表,6,),得到在,df,e,8,时,不同秩次距下的,SSR,值和,LSR,值,不同激素浓度大豆干物重多重比较的,LSR,值(,SSR,检验),浓度,平均数,差异显著性,0.05,0.01,M1,M2,M4,M5,M3,13.67,12.33,9.67,3.67,3.00,a,a,b,c,A,A,B,C,M,2,3,4,5,SSR,0.05,3.26,3.40,3.48,3.52,SSR,0.01,4.75,4.94,5.06,5.14,LSR,0.05,1.48,1.55,1.58,1.60,LSR,0.01,2.16,2.25,2.30,2.34,不同激素浓度大豆干物重平均数的差异显著(,SSR,检验),c,C,多重比较结果表明:,5,种生长激素浓度度对大豆干物重有极显著的影响。,M1,与,M2,,,M5,与,M3,之间差异不显著;,除此之外,其他激素浓度之间的大豆干物重均达到极显著差异。,5,种激素浓度中,,M1,和,M2,的处理效果较好,如果两个因素存在互作,将互作项和误差项的平方和自由度分解,有互作试验设计,设重复,有重复观测值的二因素方差分析,上面讲过,因素可分作固定因素和随机因素。在两因素实验中,,当两个因素都是固定因素时,,称为,固定模型,(,fixed model,);,两个因素均为随机因素时,,称为,随机模型,(,random model,);,一个因素是固定因素,另一个因素是随机因素时,,称为,混合模型,(,mixed model,)。,这三种模型虽然在计算方法上没有多大不同,但在检验以及对结果解释上却截然不同。尤其是在两因素之间存在交互作用时,不同类型模型的区别就更明显。,两因素实验的典型设计,是:假定,A,因素有,a,水平,,B,因素有,b,水平,则每一次重复都包括,ab,次实验,并设实验重复次数,n,次,,ijk,表示,A,因素的第,i,水平,,B,因素第,j,水平和第,k,次重复的观察值。数据将以下表的形式出现。,表2,-7,中,A,和,B,可以是固定因素,也可以是随机因素,因而引出三种不同的统计模型。,表27 两因素交互分组实验的一般格式,因素,B,j,1,2,b,总计,B,1,B,2,B,b,因,素,A,i,1,,2,,,,a,A,1,111,112,11n,121,122,12n,1b1,1b2,1bn,1,A,2,211,212,21n,221,222,22n,2b1,2b2,2bn,2,A,a,a11,a12,a1n,a21,a22,a2n,ab1,ab2,abn,a,总计,1,2,b,1,表27中的各种符号做如下说明:,c,i,表示,A,因素第,i,水平的所有观察值的和;,c,j,表示,B,因素第,j,水平的所有观察值的和;,c,ij,表示,A,的第,i,水平和,B,的第,j,水平的所有观察值的和;,c,表示所有观察值的综合。,数学模型,平方和的计算,自由度计算,各项方差计算,F,检验,固定模型,两因素固定模型方差分析表如下:,表28 固定模型方差分析表(因素,A、B,固定型),变差来源,平方和,自由度,均 方,F,因 素,A,因 素,B,交互作用,AB,误 差,SS,A,SS,B,SS,AB,SS,e,1,1,(,a-1)(b-1),ab(n-1),MS,A,MS,B,MS,AB,MS,e,MS,A,MS,e,MS,B,MS,e,MS,AB,MS,e,总 和,SS,T,abn-1,例2.3,为了从三种不同原料和三种不同发酵温度中,选出最适的条件,设计了一个两因素试验。并得到以下结果(表29):,原料种类,A,温 度,B,30,35,40,1,2,3,41,49,23,25,47,59,50,40,43,35,53,50,11,13,25,24,43,38,33,36,55,38,47,44,6,22,26,18,8,22,18,14,30,33,26,19,在这个试验中,温度和原料均为固定因素。每一处理有4次重复。因此可按上面叙述过的方法分析。将表中的每一数字均减去30,列成表210.1,由表210.1中,可以计算出,及,表210.1 发酵实验方差分析计算表,原料,A,温度,B,c,ij,1,c,ij,2,c,ij,3,c,ij,4,c,ij,c,2,ij,c,2,ijk,1,2,3,30,35,40,30,35,40,30,35,40,11,-19,-24,17,13,-22,13,25,0,19,-17,18,29,8,-8,5,8,3,-7,-5,-4,20,3,-12,23,17,-4,-5,-6,-12,10,6,-16,20,14,-11,18,-47,-48,76,30,-58,61,64,-12,324,2209,2304,5776,900,3364,3721,4096,144,556,711,800,1630,278,948,1123,1174,146,84,22838,7366,利用,ij,列列成表210.2。,表210.2 发酵实验方差分析表,温 度,B,c,i,c,2,i,30 35 40,原 1,料 2,A 3,18 -47 -48,76 30 -58,61 54 -12,-77,48,113,5929,2304,12769,c,j,c,2,j,155 47 -118,24025 2209 13924,84,40158,21002,由表210.2 中可以计算出,列成方差分析表:,表211 发酵实验方差分析表,变差来源,平方和,自由度,均 方,F,原料,A,温度,B,AB,误 差,1554.17,3150.58,808.75,1656.50,2,2,4,27,777.09,1575.29,202.19,61.35,12.67*,25.68*,3.30*,总 和,7170.00,35,*
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!