i第八章单因素方差分析

上传人:无*** 文档编号:241944694 上传时间:2024-08-07 格式:PPTX 页数:61 大小:939.99KB
返回 下载 相关 举报
i第八章单因素方差分析_第1页
第1页 / 共61页
i第八章单因素方差分析_第2页
第2页 / 共61页
i第八章单因素方差分析_第3页
第3页 / 共61页
点击查看更多>>
资源描述
第八章第八章第八章第八章 单因素方差分析单因素方差分析单因素方差分析单因素方差分析One-factor analysis of varianceOne-factor analysis of variance本本 章章 内内 容容第一节第一节 方差分析简述方差分析简述第二节第二节 固定效应模型固定效应模型第四节第四节 多重比较多重比较第三节第三节 随机效应模型随机效应模型第五节第五节 方差分析应具备的条件方差分析应具备的条件方方差差分分析析(analysis of variance,ANOVA):是是同同时时判判断断多多组组数数据据平平均均数数之之间间差差异异显显著著性性的的统统计计假假设设检检验验,是是两两组组数数据据平平均均数数差差异异显著性显著性t t 检验的延伸。检验的延伸。ANOVA ANOVA 由由 英英 国国 统统 计计 学学 家家R.A.FisherR.A.Fisher首首创创,用用于于推推断断多个总体均数多个总体均数有无差异。有无差异。第一节第一节 方差分析简述方差分析简述一、方差分析的一般概念一、方差分析的一般概念1、概念、概念单单因因素素方方差差分分析析(一一种种方方式式分分组组的的方方差差分分析析):研究对象只包含一个因素研究对象只包含一个因素(factor)的方差分析。的方差分析。单单因因素素实实验验:实实验验只只涉涉及及一一个个因因素素,该该因因素素有有a个个水水平平(处处理理),每每个个水水平平有有n次次实实验验重重复复,这样的实验称为单因素实验。这样的实验称为单因素实验。水水平平(level):每每个个因因素素不不同同的的处处理理(treatment)。【例例】随随机机选选取取4窝窝动动物物,每每窝窝中中均均有有4只只幼幼仔仔,称称量量每每只只幼幼仔仔的的出出生生重重,结结果果如如下下。判判断断不不同同窝窝的的动物出生重是否存在显著性差异。动物出生重是否存在显著性差异。4窝动物的出生重窝动物的出生重 单位:单位:g32.931.425.728.0118.029.50027.123.327.826.7104.926.22533.226.028.632.3120.130.02534.733.326.231.6125.831.4501234和和平均数平均数窝窝 别别动物号动物号2、单因素方差分析的数据格式:、单因素方差分析的数据格式:yi1yi2yi3yijyinYiya1ya2ya3yajyany31y32y33y3jy3ny21y22y23y2jy2ny11y12y13y1jy1n123jn平均数平均数YaY3Y2Y1二、不同处理效应与不同模型二、不同处理效应与不同模型1、方差分析中每一观测值的描述、方差分析中每一观测值的描述 线性统计模型线性统计模型 yij:在第:在第i水平下的第水平下的第j次观测值;次观测值;:总平均数,是对所有观测值的一个参数;:总平均数,是对所有观测值的一个参数;i:处理效应,是仅限于对第:处理效应,是仅限于对第i次处理的一个参数;次处理的一个参数;ij:随机误差成分。:随机误差成分。2、固定效应:由固定因素所引起的效应。固定效应:由固定因素所引起的效应。固定因素的水平可以严格地人为控制,在固定因素的水平可以严格地人为控制,在水平固定之后,它的效应值也是固定的。水平固定之后,它的效应值也是固定的。固定模型:处理固定因素所用的模型。固定模型:处理固定因素所用的模型。在在固固定定模模型型中中,方方差差分分析析所所得得到到的的结结论论只只适适合合于于选选定定的的那那几几个个水水平平,不不能将结论扩展到未加考虑的其它水平上。能将结论扩展到未加考虑的其它水平上。固定因素:所研究因素各个水平是经固定因素:所研究因素各个水平是经过过特意选择特意选择的,这样的因素称为固定因的,这样的因素称为固定因素。素。3、随机效应:由随机因素所引起的效应。随机效应:由随机因素所引起的效应。随机因素:随机因素:所研究因素各个水平是从该因素水所研究因素各个水平是从该因素水平总体中平总体中随机抽出随机抽出的,这样的因素称为随机因素。的,这样的因素称为随机因素。随机模型:处理随机因素所用的模型。随机模型:处理随机因素所用的模型。在在随随机机模模型型中中,方方差差分分析析所所得得到到的的结结论论,可可以以推推广广到到这这个个因因素素的的所所有有水水平上,是对水平总体的推断平上,是对水平总体的推断。随机因素的水平是不能严格人为控制的,随机因素的水平是不能严格人为控制的,在水平确定之后,它的效应值并不固定。在水平确定之后,它的效应值并不固定。第二节第二节 固定效应模型固定效应模型一、线性统计模型一、线性统计模型要检验要检验a个处理效应的相等性,就要判断各个处理效应的相等性,就要判断各i是否为是否为0。H0:1=2=a=0HA:i 0 (至少有(至少有1个个i)若接受若接受H0,则不存在处理效应,每个观测值是由总,则不存在处理效应,每个观测值是由总平均数加上随机误差构成;平均数加上随机误差构成;若拒绝若拒绝H0,则存在处理效应,每个观测值是由总平,则存在处理效应,每个观测值是由总平均数、处理效应及误差三部分构成。均数、处理效应及误差三部分构成。处理间处理间(组间组间)变异变异总变异总变异误差或处理内误差或处理内(组内组内)变异变异1.总变异是测量值总变异是测量值yij与总的均数间的差异。与总的均数间的差异。2.处理间变异是由处理效应引起的变异。处理间变异是由处理效应引起的变异。3.处理内变异是由随机误差引起的变异。处理内变异是由随机误差引起的变异。用离均差平方和的平均用离均差平方和的平均(均方、方差)(均方、方差)反映变异的大小反映变异的大小 1.总平方和总平方和(total sum of squares,SST):):每个每个测量值与总平均数离差的平方和的总和,反应了测量值与总平均数离差的平方和的总和,反应了一组数据总的变异程度。计算公式为:一组数据总的变异程度。计算公式为:校正项校正项(校正系数,校正系数,correction):dfT=N-1=an-1 二、平方和与自由度的分解二、平方和与自由度的分解2.处理间平方和处理间平方和(sum of squares among treatments,SSA):):各个处理组的平均数与总平均各个处理组的平均数与总平均数离差的平方和,数离差的平方和,SSA反映了各处理组均数的变异反映了各处理组均数的变异程度。计算公式为:程度。计算公式为:dfA=a-1处理均方处理均方(treatment mean square,MSA):处理间平方和除以自由度。:处理间平方和除以自由度。(含有误差成分)(含有误差成分)误误差差平平方方和和(error sum of squares,SSe)或或称称处处理理内内平平方方和和(sum of squares within treatment):各各处处理理内内部部观观测测值值与与相相应应处处理理平平均均数数离离差差的的平平方方和和,SSe反反映映了各处理组内观测值的变异程度了各处理组内观测值的变异程度。计算公式为:。计算公式为:dfe=dfT-dfA=an-a误差均方误差均方(error mean square,MSe):误差:误差平方和除以误差自由度。平方和除以误差自由度。MSe反映了随机因素所造成的反映了随机因素所造成的方差的大小。方差的大小。3在在同同一一处处理理组组内内虽虽然然每每个个受受试试对对象象接接受受的的处处理理相相同同,但但观测值仍各不相同,这是由随机因素(误差)引起的。观测值仍各不相同,这是由随机因素(误差)引起的。三、检验统计量三、检验统计量F,当当FF时时,拒拒绝绝零零假假设设,处处理理平平均均数数间间差差异异显显著著,MSA显著高于显著高于MSe,产生的变异是由处理因素造成的,产生的变异是由处理因素造成的。做做F单侧上尾检验单侧上尾检验四、方差分析表四、方差分析表na-1SST总总 和和MSA/MSeMSAa-1SSA处理间处理间F均方均方自由度自由度平方和平方和变差来源变差来源单因素固定效应模型方差分析表单因素固定效应模型方差分析表误差或处理内误差或处理内SSea(n-1)MSe五、方差分析的指导思想与基本原理五、方差分析的指导思想与基本原理方方差差分分析析的的指指导导思思想想:是是将将所所有有测测量量值值间间的的总总变变异异按按照照其其变变异异的的来来源源分分解解为为多多个个部部分分,然然后后进进行行比比较较,评评价价由由某某种种因素所引起的变异是否具有统计学意义。因素所引起的变异是否具有统计学意义。方差分析的基本原理方差分析的基本原理:将将总总平平方方和和分分解解为为处处理理平平方方和和和和误误差差平平方方和和,根根据据相相应应的的自自由由度度,得得到到相相应应的的均方;均方;处处理理均均方方反反映映处处理理因因素素所所造造成成的的方方差差的的大大小小,误误差差均均方方反反映映随随机机因因素素(误误差差)所所造成的方差的大小;造成的方差的大小;处处理理均均方方除除以以误误差差均均方方反反映映处处理理效效应应的显著性。的显著性。六、单因素方差分析与成组数据六、单因素方差分析与成组数据t检验的异同检验的异同单因素方差分析单因素方差分析成组数据成组数据 t 检验检验相同相同不同不同平均数差异显著性检验平均数差异显著性检验平均数差异显著性检验平均数差异显著性检验两个平均数差异的检验两个平均数差异的检验多个平均数差异的分析多个平均数差异的分析利用平均数的差利用平均数的差利用平均数的方差利用平均数的方差计算统计量计算统计量t计算统计量计算统计量F【例例8.1】调查了调查了5个不同小麦品系的株高,结果如个不同小麦品系的株高,结果如下。试判断这下。试判断这5个品系的株高是否存在显著性差异。个品系的株高是否存在显著性差异。七、实例七、实例株号株号品品 系系12345和和平均数平均数64.665.364.866.065.8326.565.364.565.364.663.763.9322.064.467.866.367.166.868.5336.567.371.872.170.069.171.0354.070.869.268.269.868.367.5343.068.65个小麦品系株高个小麦品系株高(cm)调查结果调查结果 列出方差分析计算表:列出方差分析计算表:解解:序号序号品品 系系12345-0.40.3-0.21.00.81.52.251.93-0.50.3-0.4-1.3-1.1-3.09.003.42.81.32.11.83.511.5132.2529.436.87.15.04.16.029.0841.00174.464.23.24.83.32.518.0324.0068.06总和总和57.01308.50277.28(编码法(编码法 -65)利用公式计算各项平方和:利用公式计算各项平方和:列出方差分析表:列出方差分析表:结论:结论:F4,20,0.05=2.86624147.32总总 和和42.2332.940.78420131.7415.58品系间品系间误误 差差F均方均方自由度自由度平方和平方和变差来源变差来源不同小麦品系株高方差分析表不同小麦品系株高方差分析表=0.05选定的选定的5 5个不同小麦品系的株高差异极显著。个不同小麦品系的株高差异极显著。F4,20,0.01=4.431FF0.01=0.01第三节第三节第三节第三节 随机效应模型随机效应模型随机效应模型随机效应模型一、随机效应模型的方差分析一、随机效应模型的方差分析1、方方差差分分析析的的程程序序与与固固定定效效应应模模型型方方差差分析的程序一样。分析的程序一样。2、随随机机效效应应模模型型方方差差分分析析所所得得结结论论适适用用于于水水平平的的总总体体,固固定定效效应应模模型型方方差差分分析析所得结论只适用于所选定的所得结论只适用于所选定的a个水平。个水平。【例例8.2】随随机机选选取取4窝窝动动物物,每每窝窝中中均均有有4只只幼幼仔仔,称称量量每每只只幼幼仔仔的的出出生生重重,结结果果如如下下。判判断断不不同同窝窝的的动物出生重是否存在显著性差异。动物出生重是否存在显著性差异。二、实例二、实例4窝动物的出生重窝动物的出生重 单位:单位:g32.931.425.728.0118.029.50027.123.327.826.7104.926.22533.226.028.632.3120.130.02534.733.326.231.6125.831.4501234和和平均数平均数窝窝 别别动物号动物号解解:总和总和-11.2265.66185.362.91.4-4.3-2.0-2.04.0032.86-2.9-6.7-2.2-3.3-15.1228.0169.033.2-4.0-1.42.30.10.0133.494.73.3-3.81.65.833.6449.981234窝窝 别别序号序号 列出方差分析计算表列出方差分析计算表(-30):计算各项平方和:计算各项平方和:列出方差分析表:列出方差分析表:结论:结论:F3,12,0.05=3.49动物出生重方差分析表动物出生重方差分析表不同窝别动物的出生重没有显著差异。不同窝别动物的出生重没有显著差异。FF0.0515147.32总总 和和1.9719.5259.91231258.575118.945窝窝 间间误误 差差F均方均方自由度自由度平方和平方和变差来源变差来源=0.05=0.01三、不等重复时平方和和自由度的计算三、不等重复时平方和和自由度的计算dfA=a-1dfe=N-adfT=N-1第四节第四节第四节第四节 平均值之间的多重比较平均值之间的多重比较平均值之间的多重比较平均值之间的多重比较接受接受H0(FF),表示各处理组均数表示各处理组均数 不全相等,差异有统计学意义。不全相等,差异有统计学意义。哪两均数之间差异显著?哪两均数之间差异显著?哪两均数之间差异不显著?哪两均数之间差异不显著?方差分析终止方差分析终止需要进一步做多重比较需要进一步做多重比较多重比较多重比较 (multiple comparison):经过方差分析,若结论是各处理均数差异显著经过方差分析,若结论是各处理均数差异显著(FF,拒绝,拒绝H0),则必须在各处理均数之间,则必须在各处理均数之间一对一对地做比较,以判断究竟在哪些对均数一对一对地做比较,以判断究竟在哪些对均数之间存在显著差异,哪些对之间没有显著差异,之间存在显著差异,哪些对之间没有显著差异,这种比较称为多重比较。这种比较称为多重比较。1、最小显著差数法最小显著差数法:把任意两组数据平均数差的绝对值与:把任意两组数据平均数差的绝对值与LSD 比较,以判断不同组数据平均数差异显著性的多重比较方法。比较,以判断不同组数据平均数差异显著性的多重比较方法。一、最小显著差数一、最小显著差数(Least Significant Difference,LSD)法法成组数据成组数据t检验检验2、LSD的公式推导:的公式推导:当当n1=n2称为称为最小显著差数最小显著差数,记为,记为LSD。|dy|与与LSD比较,得出结论。当比较,得出结论。当|dy|LSD时,时,该对平均数差异显著;否则差异不显著。该对平均数差异显著;否则差异不显著。3、LSD检验程序:检验程序:计算计算LSD 列表计算每一对平均数差的绝对值列表计算每一对平均数差的绝对值|dx|;二、二、Duncan多范围检验多范围检验 Duncan multiple range test1、Duncan多范围检验程序:多范围检验程序:将将需需要要比比较较的的a个个平平均均数数依依照照从从大大到到小的次序重新排列。小的次序重新排列。原始处理组号原始处理组号平均数平均数 重新排序号重新排序号1 2 a-1 ay1 y2 ya-1 ya 计计算算每每一一对对平平均均数数间间的的差差(大大值值小值),列成表。小值),列成表。计算临界值计算临界值Rk,列表。,列表。不同对平均数的差有不同的临界值不同对平均数的差有不同的临界值Rk。r(k,df)的值由附表的值由附表9(多重比较中的多重比较中的Duncan表表)查出。查出。df=a(n-1),是误差项自由度。,是误差项自由度。k是是相相比比较较的的两两个个平平均均数数间间包包含含的的平平均均数数的的个个数数(包包括括这这两两个个平平均均数数),计计算算公公式式是是两两平均数下标的差加上平均数下标的差加上1。dfka(n-1)23a-1ar0.05 Rkr0.01 Rkk=2,3,a有有a个个平平均均数数,有有a-1个个k值值,需需查查出出a-1个个r,分分别别乘乘以以Sy,得到,得到a-1个个Rk值。值。比较每一对平均数差与相应的比较每一对平均数差与相应的Rk,得出结论。得出结论。若若平平均均数数差差大大于于相相应应的的Rk,说说明明这这一一对对平平均均数数之之间间差差异异显显著著或或者者极极显显著著,以符号以符号“”或或“”表示;表示;若若平平均均数数差差小小于于相相应应的的Rk,说说明明这这一一对平均数之间差异不显著。对平均数之间差异不显著。【例例8.1】调调查查了了5个个小小麦麦品品系系的的株株高高,结结果果如如下下。经经方方差差分分析判断这析判断这5个品系的株高存在显著性差异个品系的株高存在显著性差异,试做多重比较分析。,试做多重比较分析。2、实例、实例株号株号品品 系系12345和和平均数平均数64.665.364.866.065.8326.565.364.565.364.663.763.9322.064.467.866.367.166.868.5336.567.371.872.170.069.171.0354.070.869.268.269.868.367.5343.068.65个小麦品系株高个小麦品系株高(cm)调查结果调查结果 排序排序:解:解:求差求差:列表列表计算计算Rk:结论结论:品系号品系号平均数平均数排序号排序号70.8168.6267.3365.3464.45543212346.44.22.90.95.53.32.03.51.32.21.5881.6671.7101.7384.024.224.334.401.1651.2251.2561.2842.953.103.183.25234520Rkr0.01Rkr0.05kdf品系品系和和间株高差异不显著,间株高差异不显著,品系品系和和间株间株高差异显著,其余各高差异显著,其余各品系间株高差异极显著。品系间株高差异极显著。第五节第五节 方差分析应具备的条件方差分析应具备的条件1、可加性:每个处理效应和误差效应、可加性:每个处理效应和误差效应 是可加的;是可加的;一一、方差分析应满足的三个条件、方差分析应满足的三个条件 2、正态性:实验误差应当是服从正态、正态性:实验误差应当是服从正态 分布的独立随机变量;分布的独立随机变量;3、方差齐性:各处理的误差方差应具、方差齐性:各处理的误差方差应具 备齐性。备齐性。1、Bartlett检验基本原理:检验基本原理:二、多个方差齐性检验二、多个方差齐性检验 Bartlett检验检验当当a个个随随机机样样本本是是从从独独立立正正态态总总体体中中抽抽取取时时,可可以以计计算算出出统统计计量量K2。当当n=minni充充分分大大时时(n3),K2的的抽抽样样分分布布非非常常接接近近于于a-1自自由由度度的的x2分布。分布。2、Bartlett检验程序:检验程序:假设:假设:H0:12=22=a2HA:至少有两个至少有两个i 2不相等不相等 计算检验统计量计算检验统计量K2 结论:结论:当当K2x2a-1,时拒绝零假设,方差不齐,应做数时拒绝零假设,方差不齐,应做数据变换;否则,接受零假设,方差具有齐性。据变换;否则,接受零假设,方差具有齐性。当各处理样本当各处理样本含量相同时含量相同时3、变换、变换 平方根变换平方根变换将将每每个个观观测测值值取取其其平平方方根根,做做方方差差齐齐性性检检验验,若方差整齐,然后对平方根进行方差分析。若方差整齐,然后对平方根进行方差分析。属属于于泊泊松松分分布布的的数数据据,常常常常需需要要采采取取平平方方根根变变换换;当当观观测测数数值值很很小小时时,如如有有几几个个数数小小于于1010时时,为为了了矫矫正正,可可以以使使用用观观测测值值加加上上1 1再再取取平平方方根根的变换。的变换。平方根反正弦变换平方根反正弦变换取取每每个个观观测测值值平平方方根根的的反反正正弦弦值值,然然后后做做方方差差分析。分析。适用于以百分数表示的二项分布数据。适用于以百分数表示的二项分布数据。百百分分数数的的变变化化范范围围很很大大时时,要要使使用用反反正正弦弦变变换换,变变换换后后的的数数据据可可以以从从附附表表1010中中查查出出;百百分分数数的的变变化化范范围围在在0 02020,用用平平方方根根变变换换;百百分分数数的的变变化化范范围围在在80100,先先用用100减减去去各各百百分分数数,然然后后做做平平方方根根变变换换;百百分分数数的的变变化化范范围围在在3070,可可以不做变换以不做变换。对数变换对数变换取每个观测值对数值,然后做方差分析。取每个观测值对数值,然后做方差分析。大大范范围围的的正正整整数数适适用用于于对对数数变变换换;对对于于一一些些小小的的数数值值,如如小小于于10时时,每每一一观观测测值都加上值都加上1再变换再变换。三、方差分析总程序:三、方差分析总程序:1、多个方差齐性检验、多个方差齐性检验 Bartlett检验检验当当K2x2a-1,时时,方方差差不不齐齐,应应做做数数据据变变换换;否否则则,方方差具有齐性,可以进入方差分析程序。差具有齐性,可以进入方差分析程序。列出方差分析计算表列出方差分析计算表(编码法)(编码法)利用公式计算各项平方和利用公式计算各项平方和2、方差分析、方差分析 列出方差分析表列出方差分析表 结论结论FF时时表表示示各各处处理理组组均均数数差差异异显显著著需要进一步做多重比较。需要进一步做多重比较。3、Duncan多范围检验多范围检验 排序排序 求差求差 计算计算Rk 结论结论4、得出结论,给予生物学解释、得出结论,给予生物学解释
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!