第六章 方差分析

上传人:沈*** 文档编号:240570717 上传时间:2024-04-17 格式:PPT 页数:46 大小:2.27MB
返回 下载 相关 举报
第六章 方差分析_第1页
第1页 / 共46页
第六章 方差分析_第2页
第2页 / 共46页
第六章 方差分析_第3页
第3页 / 共46页
点击查看更多>>
资源描述
第六章第六章 方差分析方差分析 教学目的和要求教学目的和要求教学目的和要求教学目的和要求1 1、掌握方差分析的基本原理及其基本概念,包括方差分析的理论、掌握方差分析的基本原理及其基本概念,包括方差分析的理论模型、处理因素、处理水平、单元、元素、均衡交互作用等。模型、处理因素、处理水平、单元、元素、均衡交互作用等。2 2、掌握多重比较的概念及其常用的多重的几种多重比较的方法。、掌握多重比较的概念及其常用的多重的几种多重比较的方法。3、进行方差分析的基本条件,方差齐次性检验。、进行方差分析的基本条件,方差齐次性检验。4、掌握进行双因子及多因子方差分析的条件和类型。、掌握进行双因子及多因子方差分析的条件和类型。5、熟练掌握应用、熟练掌握应用SPSS for WindowsSPSS for Windows下进行方差分析的步骤并且下进行方差分析的步骤并且能对处理结果作出正确的解释。能对处理结果作出正确的解释。教学难点1、均方的分解。2、试验处理和水平的确定。第一节第一节 方差分析的基本原理方差分析的基本原理问题的提出问题的提出某猪场对4个不同品种幼猪进行4个月增重量的测定,每个品种选择体重接近的幼猪4头,测定结果列于表中,请问那个品系的增重效果最好?(p85,例6.1)如果采用T检验进行一对一比较的方法检验4个样本平均数之间的差异显著性,就需要做 6次检验,每次无效假设的概率都是10.95,而且这些检验都是独立的,那么6次都接受的概率是0.9560.735,犯错误的概率为10.7350.265,即6次犯错误可能性的累积,因此所犯错误的概率大大增加,方差分析的概念方差分析的概念最早由英国著名科学家R.A.Fisher 提出。方差分析是分析试验(或观测)数据的一种分析方法,所要解决的基本问题是通过数据分析,查明与研究对象有关的各个因素以及各个因素间交互作用对该研究对象的影响。方差分析所研究的对象都假定服从正态分布。方差分析的数学模型假定有k组观测数据,每组有n个观测值,则用线性可加模型来描述每一观测值,有:xijiij xij是在第i次处理下的第j次观测值,为总体平均数,i为处理效应,ij是试验误差,要求ij是相互独立的,且服从正态分布N(0,2)。对于由样本估计的线性模型为:为样本平均数,ti为样本的处理效应,eij为试验误差。模型的类型及相关概念模型的类型及相关概念方差分析模型方差分析模型xij i ij 根据根据 I的特征的特征固定模型随机模型各个处理的效应值i是固定的,各个处理的平均效应ii是一个常量,且 除去随机误差之后每个处理所产生的效应是固定的。i是一个随机变量,是从期望均值为0,方差为2的正态总体中得到的随机变量。两种模型的区别1、固定因素是指因素的水平水平可以严格地人为控制,它的效应效应值也是固定值也是固定的,试验重复时可以得到相同的结果。随机因素的水平不能严格人为控制,水平不能严格人为控制,在水平确定之后其效应值并不固定,重复试验时也很难得出相同的结果。2、随机模型和固定模型在设计思想和统计推断上有明显不同,因此进行方差分析时的公式推导也有所不同。在进行统计推断时假设检验构成的统计数不同。3、模型分析的侧重点也不完全相同,固定模型主要侧重于效应值i的估计和比较,而随机模型则侧重效应方差的估计和检验。4、对于多因素试验来说还金出现混合模型的情况。进行方差分析的几个重要的概念1因素因素(Factor)因素是可能对应变量有影响的变量,通常就是数学模型中的处理处理。一般来说,因素会有不止一个水平,分析的目的就是考察或比较各个水平对应变量的影响是否相同。因素的取值范围不能无限,只能有若干个水平,在SPSS中应当将因素作为分类变量分类变量来处理。2水平(Level)因素的不同取值等级称作水平,例如性别有男、女两个水平。需要注意的是有时候水平是人为划分出来的,比如身高被分为高、中、低三个水平。在SPSS中,定义水平均在Values中定义不同水平。3单元(Cell)指各因素水平之间的组合,我们所说的方差齐就是指的各个单元间的方差齐。4均衡(Balance)如果一个实验设计中任一因素各水平在所有单元格中出现的次数相同,且每个单元格内的元素数相同,则该试验是均衡的,否则,就被称为不均衡。不均衡的实验设计在分析时较为复杂。5交互作用(Interaction)如果一个因素的效应大小在另一个因素不同水平下明显不同,则称为两因素间存在交互作用。方差分析的数学推导和计算过程平方和和自由度的分解平方和和自由度的分解 平方和的分解平方和的分解 总变异处理间变异处理内变异SST=SSt+SSe 自由度的分解自由度的分解总自由度处理间自由度处理内自由度总自由度处理间自由度处理内自由度dfdfT Tdfdft tdfdfe e 统计假设的显著性检验统计假设的显著性检验F F检验检验 H H0 0:,同时给出同时给出H HA A:结论结论平方和的分解平方和的分解 设试验A具有k个处理样本,每个样本有n个观测值,则试验A共有nk个观测值。试验变异(总变异)处理间变异处理内变异处理间平方和处理间平方和处理内平方和总平方和各变异部分的平方和与各部自由度之比,即为度量各部变异的大小指标。自由度分解自由度分解总自由度dfTnk1 处理间自由度dfdft tk k1 1 处理内自由度dfdfe e=k k(n n1)1)各部方差处理间方差 处理内方差 统计假设的显著性检验统计假设的显著性检验F F检验检验 从一个总体随机抽取两个样本,其样本方差分别为 和 ,其比值为F 值。服从F分布。F分布设从一正态总体N(,2)中随机抽取样本容量为n1和n2的两个独立样本,其样本方差为和,则定义和的比值为F:F值具有的自由度df1n1-1和的自由度df2n2-1。如果对一正态总体在特定的df1和df2进行一系列随机独立抽样,则所有可能的F值就构成一个F分布。F分布的概率密度函数是由两个独立2变量的概率密度所构成的联合概率密度,其方程为:F分布的概率累积函数为:F分布有以下特征:(1)F分布的平均数F1,F的取值区间为0,;(2)F分布曲线的形状仅决定于df1和df2。在df11或2时,F分布曲线呈严重倾斜的反向J型,当df13时转为左偏曲线(图3.14)。例6.11、建立数据文件2、计算3、结果多重比较多重比较 F检验只能说明k个平均数间有没有显著差异,但并不能说明哪些平均数间有显著差异。要明确不同处理平均数两两间差异的显著性,每个处理的平均数都要与其他的处理进行比较。这种差异显著性的检验就叫多重比较多重比较。最小显著差数法最小显著差数法(LSD法法)最小显著差数法的实质是两个平均数相比较的t检验法。检验的方法是首先计算出达到差异显著的最小差数,记为LSD,然后用两个处理平均数的差与LSD比较,若 ,即为在给定的。水平上差异显著,反之,差异不显著。在t检验中,例6.1 最小显著差数法最小显著差数法(LSD法法)的局限性的局限性 LSD法实际上是两组数据比较的t检验直接用于多重比较。t检验要求所检验的两组样本相互独立。但是对于方差分析的k组样本来说,并非总是相互独立的。也就是说对k组样本的k个平均数两两比较时,共有k(k1)/2个比较,这k个平均数不可能完全相互独立,如果将它们作为相互独立的比较来处理,必然降低显著性水平(导致 值增大),从而导致犯第一类错误的概率显著增加。Cochran和Cox曾经指出,在比较三个平均数时其最大的差数将有14的可能性大于LSD0.05。比较6个平均数时,超过40;比较10个平均数时,超过60;比较20个平均数时,其最大的差数将有90的可能性大于LSD0.05。所以,用LSD法来比较全部平均数时(尤其是在分组超过3组时),是极为不恰当的。往往会导致错误的结论。针对LSD法的局限性,现在提出了许多进行k组平均数比较的方法。最小显著极差法最小显著极差法(LSR法法)新复极差检验新复极差检验(SSR检验检验)q检验检验 LSR法采用不同平均数间用不同的显著差数标准显著差数标准进行比较,可用于平均数间的所有相互比较。又称Duncan法 也称为Newman-Keuls检验。1新复极差检验新复极差检验(SSR检验检验)按相比较的样本容量计算平均数标准误(n1=n2=n)查所具有自由度dfe和比较所含平均数个数k时的SSR值(附表8),然后算出最小显著极差值 将各平均数按大小顺序排列,用各个M值的LSR值即可检验各平均数间极差的显著性。当当n1 n2时时中n为下式计算得到:例6.1结论:猪的4个品种中只有大白与沈黑,大白与沈白4个月增重量差异达到显著,其他品种间差异不显著。SPSS进行Duncan检验Q检验q检验法也称为Newman-Keuls检验,方法与新复极差检验相似,其区别仅在于计算最小显著极差LSR时不是查SSR,而是查q值(附表9)。SPSS处理过程处理过程 第二节第二节 单因素方差分析单因素方差分析 一、组内观测次数相等的方差分析一、组内观测次数相等的方差分析 二、组内观测次数不相等的方差分析二、组内观测次数不相等的方差分析 利用利用SPSS进行单因子方差分析进行单因子方差分析例6.2 测定东北、内蒙古、河北、安徽、贵州5个地区黄鼬冬季针毛的长度,每个地区随机抽取4个样本,测定的结果如表611,试比较各地区黄鼬针毛长度差异显著性。分析步骤:建立数据文件AnalyzeCompare meansOne-way ANPVAOne-Way ANOVA确定分析变量及分组确定分析变量及分组选择进行多组比较的方法选择进行多组比较的方法计算结果计算结果多重比较表多重比较表第三节第三节 二因素方差分析二因素方差分析 一、模型的选用一、模型的选用在二因素试验中,当二因素都是固定因素时称为固定模型;二因素均为随机因素时,称为随机模型;一个因素是固定因素另一个因素是随机因素时,称为混合模型。二、主效应与交互作用二、主效应与交互作用各试验因素的相对独立作用称为该因素的主效应,简称主效。某一因素在另一因素的不同水平上所产生的效应不同,则二因素间存在交互作用二因素间存在交互作用(简称互作简称互作)。因素间的交互作用显著与否关系到主效应的利用价值,若交互作用不显著,则各若交互作用不显著,则各因素的效应可以累加,各因素的最优水平组合起来,即为最优的处理组合。若交因素的效应可以累加,各因素的最优水平组合起来,即为最优的处理组合。若交互作用显著,则各因素的效应就不能累加,最优处理组合的选定应根据各处理组互作用显著,则各因素的效应就不能累加,最优处理组合的选定应根据各处理组合的直接表现选定。合的直接表现选定。有时交互作用相当大,甚至可以忽略主效应。二因素间是否存在交互作用有专门的统计判断方法,有时也可根据专业知识判断。三、数学模型1、无交互作用xij i j ij 2、有交互作用xijk i j()ij ijk 双因子方差分析数据表双因子方差分析数据表进行SPSS分析处理的要点例6.5 为了研究某种昆虫滞育期长短与环境的关系,在给定的温度和光照条件下在实验室培养,每一处理记录4只昆虫的滞育天数,结果列于表625中,试对该资料进行方差分析。分析:分析:本题属于典型的双因子固定模型方差分析实验。根据昆虫发育特征,往往光照和温度均显著影响昆虫的滞育,因此温度和光照周期之间可能具有交互作用存在。SPSS分析分析1、数据文件的建立两因子、每一因子两因子、每一因子3个水平!个水平!2、AnalyzeGeneral linear model Univariate变量、因子和模型的选择变量、因子和模型的选择分析结果分析结果第四节 多因素方差分析多因素方差分析 实际工作中,如果需要考察三个或多个因素的效应时,相当于把二因素方差分析扩展到一般情况。在一个试验中,A因素有a水平,B因素有b水平,C因素有c水平等,假设每一处理都有n次重复,总观测次数为abcn次。本节仅对三因素的情况进行分析。数学模型xijkl表示A因素第i水平,B因素第j水平,C因素第k水平第l次重复的观测值(其中i1,2,a;j1,2,b;k1,2,c;ll,2,n);为总体平均数,i、j、k分别表示A因素、B因素、C因素的效应,()ij、()ik、()jk分别表示AB、AC、BC的交互效应,()ijk表示三因素的交互效应(ABC),ijkl表示试验误差。同队应满足条件:;2;是独立分布,服从N(0,2)。三因子方差分析表实际分析时,可列出三个两向表,把三因素方差分析化为二因素方差分析。实际分析时,可列出三个两向表,把三因素方差分析化为二因素方差分析。例6.7 为了研究在猪饲料中添加肮氨酸为了研究在猪饲料中添加肮氨酸(因素因素A)、蛋氨酸蛋氨酸(因素因素B)和蛋白质和蛋白质(因因素素C)对猪日增重对猪日增重(kg)的影响,设计了下面的试验,每一组共用两头猪作的影响,设计了下面的试验,每一组共用两头猪作重复,结果如表重复,结果如表633,试作方差分析,试作方差分析。数据输入分析步骤结果分析第五第五节节 方差分析缺失数据的估计方差分析缺失数据的估计 用方差分析的数据通常根据事先设计好的实验数据结果,意外事件常使某一个或某几个用方差分析的数据通常根据事先设计好的实验数据结果,意外事件常使某一个或某几个数据丢失,比如收获的作物可能遭到毁坏,动物可能有死亡,或者在记录时可能漏记或记错数据丢失,比如收获的作物可能遭到毁坏,动物可能有死亡,或者在记录时可能漏记或记错等等。数据的缺失使平方和的线性可加模型无效,因此无法直接进行方差分析。缺失的数据等等。数据的缺失使平方和的线性可加模型无效,因此无法直接进行方差分析。缺失的数据可用统计方法从理论上估计出,填写在表内的表格之中,然后用前面介绍过的方法进行分析。可用统计方法从理论上估计出,填写在表内的表格之中,然后用前面介绍过的方法进行分析。但有一点必须明确,缺失数据估计并不能恢复原来的数据,只能是补足后不致干扰其余数据,但有一点必须明确,缺失数据估计并不能恢复原来的数据,只能是补足后不致干扰其余数据,估计的数据并不能提出任何新的信息,因此,试验中应尽量避免这类情况发生。弥补缺失数估计的数据并不能提出任何新的信息,因此,试验中应尽量避免这类情况发生。弥补缺失数据的原则是,使补上缺失的数据后,误差平方和最小。据的原则是,使补上缺失的数据后,误差平方和最小。一、缺失一个数据的估计方法一、缺失一个数据的估计方法 解该方程。得x=42.87543。把这个数据填在表内,方差分析除总自由度dfT和误差自由度dfe各需减1外,其他仍可以按前面介绍的方法进行。二、缺失两个数据的估计方法二、缺失两个数据的估计方法 假定x23和x37都缺失,分别称为x和y。其弥补原则和弥补一个数据是一样的,即使SSe达到极小。先由下式求出误差平方和:SSeSSTSSASSB丢失的数据补上后仍按通常方法计算,误差自由度及总自由度均减2。由于误差自由度减小,F检验的灵敏度相应降低,对分析问题是不利的,补救的数据只是不干扰方差分析,并不能提供丢失的信息,所以进行试验时,要谨慎小心,尽量避免数据的丢失。第六节第六节 方差分析的基本假定和数据转换方差分析的基本假定和数据转换 一、方差分析的基本假定一、方差分析的基本假定 1正态性:试验误差应当是服从正态分布的独立的随机变量。因为方差分析只能估计随机误差,顺序排列或顺序取样资料不能作方差分析。2可加性 处理效应与误差效应应该是可加的,并服从方差分析的数学模型,即xij+i+ij,这样才能将试验的总变异分解为各种原因所引起的变异,以确定各变异在总变异中所占的比例,对试验结果作出客观评价。3方差同质性 所有试验的误差方差应具备同质性,也叫方差的齐性,即 。二、数据转换二、数据转换 在生物学中有时会遇到一些样本,其所来自的总体和上面提到的方差分析基本假定相抵触,这些数据在作方差分析之前必须经过适当处理即数据转换来变更测量标尺。样本的非正态性、不可加性和方差的异质性通常连带出现,主要的是考虑处理效应与误差效应的可加性。其次才考虑介差同质性。(一一)平方根转换平方根转换 有些生物学观测数据为波松分布而非正态分布。比如一定面积上某种杂草株数或昆虫头数等。样本平均数与其方差有比例关系,采用平方根转换可获得同质的方差。一般将原观测值转换成 ,数据较小时采 。例如表6-40中所列的一定面积燕麦田中杂草的株数。从直观上看。A1、A2和A3、A4及A5间的数据相差太大。方差同质性是不成立的。数据转换分析结果(二二)对数转换对数转换 如果已知资料中的效应成比例而不是可加的,或者标准差(或极差)与平均数大体成比例时,可以便用对数变换。在5次三个相继的夜里捕获昆虫的几何平均数,试验采用三种捕蛾灯诱捕(表643)。转换步骤结果分析(三三)反正弦转换反正弦转换 如果数据是比例数或以百分率表示的,其分布趋向于二项分布,方差分析时应作反正弦转换。例6.8 研究水同低温贮藏时间对大白菜花粉生活力的彤响,花粉置于冰箱中经2h、4h、6h后;镜检有生活力花粉的百分数,每处理检查6个视野,对照为新鲜花粉,结果如表645,试分析不同处理时间对花粉生活力影响的差异。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!