资源描述
第六章,方差分析,1,主要内容,6.1 方差分析简介 6.2 单因素方差分析 6.3 多因素方差分析 6.4 协方差分析 6.5 多元方差分析,2,6.1 方差分析简介,(1) 方差分析的概念 事件的发生往往与多个因素有关,但各个因素对事件发生的中的用作用是不一样的,而且同一因素的不同水平对事件发生的影响也是不同的。如农业研究中土壤、肥料、日照时间等因素对某种农作物产量的影响,不同饲料对牲畜体重增长的效果等,都可以使用该着分析方法来解决。 (2) 方差分析的基本原理 方差分析的基本原理是认为不同处理组的均值间的差别基本来源有两个: 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异 实验条件,即不同的处理造成的差异,称为组间差异。,3,6.1 方差分析简介,(3) 方差分析常用术语 观测变量:也叫因变量,如上例中的作物产量; 控制变量:影响实验结果的自变量,也称因子,如上例中的品种、施肥量等; 水平:控制变量的不同类别,如A品种,B品种;10公斤化肥、20公斤化肥、30公斤化肥等; 随机因素:因素的水平与实验结果的关系是随机的,即不确定因素。 (4) 方差分析的两个基本假设 观测变量各总体应服从正态分布 ; 观测变量总体的方差应相等,即方差具有齐性:,4,6.1 方差分析简介,(5) 方差分析的一般步骤 第1步 方差分析条件检测。 服从正态分布和方差齐性、控制变量的类别(即水平数量)有限 第2步 提出原假设。 第3步 构造检验的统计量。 第4步 统计决策。,5,主要内容,6.1 方差分析简介 6.2 单因素方差分析 6.3 多因素方差分析 6.4 协方差分析 6.5 多元方差分析,6,6.2 单因素方差分析,6.2.1 基本概念及统计原理 (1) 基本概念 单因互方差分析(One-way ANOVA)也称一维方差分析,它检验由单一因素影响的一个(或几个相互独立的)因变量,由因素各水平分组的均值之间的差异,是否具有统计意义,或者说它们是否来源来同一总体。 (2) 统计原理 单因素方差分析采用的统计推断方法是计算F统计量,进行F检验。总的变异平方和记为SST,分解为两部分:一部分是由控制变量引起的离差,记为SSA(组间Between Groups离差平方和);另一部分是由随机变量引起的离差,记为SSE(组内Within Groups离差平方和)。于是有: SST=SSA+SSE 其中:,SSA=,SSE=,7,6.2 单因素方差分析,F统计量是平均组间平方和与平均组内平方和的比值,计算公式为: 从F值的计算公式可以看出,如果控制变量的不同水平对观测变量有显著影响,那么观测变量的组间离差平方和就必然大,F值也就较大;反之,如果控制变量的不同水平没有对观测变量造成显著影响,那么组内离差平方和的影响就会比较小,F值就比较小。,8,6.2 单因素方差分析,(3) 分析步聚 第1步 提出零假设:H0为控制变量不同水平下观测变量各总体均值无显著差异,即: 第2步 选择检验统计量:方差分析采用的是F统计量,服从(k-1,n-k)个自由度的F分布。 第3步 计算检验统计量的观测值和概率p值:如果控制变量对观测变量造成了显著影响,观测变量总的变差中控制变量影响所造成的比例相对于随机变量就会较大,F值显著大于1;反之,F值接近于1。 第4步 给出显著性水平,作出决策:如果相伴概率p值小于显著性水平 ,则拒绝零假设;反之,认为控制变量不同水平下各总体均值没有显著差异。,9,6.2 单因素方差分析,6.2.2 SPSS实例分析 【例6.1】用四种饲料喂猪,共19头分为四组,每一组用一种饲料。一段时间后称重,猪体重增加数据如下表所示,比较四种饲料对猪体重增加的作用有无不同。,10,6.2 单因素方差分析,第1步 分析:由于考虑的是一个控制变量(饲料)对一个观测变量(猪体重)的影响,而且是4种饲料,所以不适宜用独立样本T检验(仅适用两组数据),应采用单因素方差分析。 第2步 数据的组织:数据分成两列,一列是猪的体重,变量名为“weight”,另一变量是饲料品种(变量值分别为1,2,3,4),变量名为“fodder”,输入数据并保存。 第3步 方差相等的齐性检验:由于方差分析的前提是各个水平下(这里是不同的饲料folder影响下的体重weight)的总体服从方差相等的正态分布,且各组方差具有齐性。其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的,因此必须对方差相等的前提进行检验。,11,6.2 单因素方差分析,不同饲料的方差齐性检验结果,方差齐性检验的H0假设是:方差相等。从上表可看出相伴根据Sig.=0.995 (0.05)说明应该接受H0假设(即方差具有齐性)。故下面就用方差相等的检验方法。,12,6.2 单因素方差分析,几种饲料的方差检验(ANOVA)结果,上表是几种饲料方差分析的结果,组间(Between Groups)平方和(Sum of Squares)为20538.698,自由度(df)为3,均方为6846.233;组内(Within Groups)平方和为652.159,自由度为15,均方为43.477;F统计量为157.467。由于组间比较的相伴概率Sig.(p值)=0.0000.05,故应拒绝H0假设(四种饲料喂猪效果无显著差异),说明四种饲料对养猪的效果有显著性差异。,13,6.2 单因素方差分析,第4步 多重比较分析:通过上面的步骤,只能判断4种饲料喂猪效果是否有显著差异。如果想进一步了解究竟是哪种饲料与其他组有显著性的均值差别(即哪种饲料更好)等细节问题,就需要在多个样本均值间进行两两比较。由于第3步检验出来方差具有齐性,故选择一种方差相等的方法,这里选LSD方法;显著性水平默认取0.05;,14,6.2 单因素方差分析,第5步 运行主要结果及分析:,从整个表反映出来四种饲料相互之间均存在显著性差异,从效果来看是第4种最好,其次是第3种,第1种最差。,15,6.2 单因素方差分析,均值折线图,上图为几种饲料均值的折线图,可以看出均值分布比较陡峭,均值差异也较大。,16,主要内容,6.1 方差分析简介 6.2 单因素方差分析 6.3 多因素方差分析 6.4 协方差分析 6.5 多元方差分析,17,6.3 多因素方差分析,6.3.1 基本概念及统计原理 基本概念 多因素方差分析用来研究两个及两个以上的控制变量是否对观测变量产生显著影响。多因素方差分析不仅能够分析多个控制因素对观测变量的影响,也能够分析多个控制因素的交互作用对观测变量产生影响,进而最终找到利于观测变量的最优组合。 多因素方差分析不仅需要分析多个控制变量独立作用对观测变量的影响,还要分析多个控制变量的交互作用对观测变量的影响,及其他随机变量对结果的影响。因此,需要将观测变量总的离差平方各分解为3个部分: 多个控制变量单独作用引起的离差平方和; 多个控制变量交互作用引起的离差平方和; 其他随机因素引起的离差平方和。,18,6.3 多因素方差分析,(2) 统计原理 以两个控制变量为例,多因素方差分析将观测变量的总离差平方和分解为:SST=SSA+SSB+SSAB+SSE 设控制变量A有k个水平,变量B有r个水平 ,则SSA的定义为(SSB的定义类似):,其中, 为因素A第i个水平和因素B第j个水平下的样本观测值个数, 为因素A第i个水平下观测变量的均值。,其中, 是因素A、B在水平i、j下的观测变量均值。,19,6.3 多因素方差分析,在固定效应模型中,各F统计量为:,在随机效应模型中, 统计量不变,其他两个F统计量分别为:,20,6.3 多因素方差分析,(3) 分析步骤 第1步 提出零假设:多因素方差分析的零假设H0是:各控制变量不同水平下观测变量各总体均值无显著差异,控制变量各效应和交互作用效应同时为0,即控制变量和它们的交互作用对观测变量没有产生显著性影响。 第2步 构造检验统计量:多因素方差分析采用的是F统计量,根据效应模型选择。 第3步 计算检验统计量的观测值和概率p值:SPSS会自动将相关数据代入各式,计算出检验统计量的观测值的概率p值(也称相伴概率值Sig.)。 第4步 给出显著性水平 ,作出决策。,21,6.3 多因素方差分析,6.3.2 SPSS实例分析 【例6.2】研究一个班三组不同性别的同学(分别接受了三种不同的教学方法)在数学成绩上是否有显著差异,数据如下表。,22,6.3 多因素方差分析,第1步 分析:需要研究不同教学方法和不同性别对数学成绩的影响。这是一个多因素(双因素)方差分析问题。 第2步 数据组织:如上表的变量名组织成4列数据。 第3步 变量设置:按“分析|一般线性模型| 单变量”的步骤打开单变量对话框。并将“数学”变量移入因变量框中,将“组别”和“性别”移入固定因子中,如下图:,23,6.3 多因素方差分析,第4步 设置方差齐性检验:由于方差分析要求不同组别数据方差相等,故应进行方差齐性检验,单击“选项”按钮,选中“方差齐性检验”,显著性水平 设为默认值0.05。 第5步 设置控制变量的多重比较分析:单击“两两比较”按钮,如下图,在其中选出需要进行比较分析的控制变量,这里选“组别”,再选择一种方差相等时的检验模型,如LSD。,24,6.3 多因素方差分析,第6步 选择建立多因素方差分析的模型种类:打开“模型”对话框,本例用默认的全因子模型。 第7步 以图形方式展示交互效果:设置方式如下图。,25,6.3 多因素方差分析,第8步 对控制变量各个水平上的观察变量的差异进行对比检验:选择“对比”对话框,对两种因素均进行对比分析,用“简单”方法,并以最后一个水平的观察变量均值为标准。 第9步 主要结果及分析,表示了各控制因素的个案数,即分组描述情况。,是对数学进行方差齐性检验的结果,可以看出方差无显著差异,应用前面的LSD方法的结果。,26,6.3 多因素方差分析,该表是进行多因素方差分析的主要部分,由于指定建立全因子模型,因此总的离差平方和分为3个部分:多个控制变量对观察量的独立作用、交互作用及随机变量的影响。,27,6.3 多因素方差分析,这是组别变量的均值比较结果,可以看第1,2组与第3组比较的均值差异均显著。,28,6.3 多因素方差分析,性别比较图,从上图可看出,不同性别之间的成绩也有显著性差异。,29,6.3 多因素方差分析,不同教学方法的比较,由于在前面检验方差具有齐性,从LSD结果看出其均值第0组第2组第1组。,30,6.3 多因素方差分析,交互作用的影响图,从上图可知两因素的交互作用对数学的学习成绩具有显著性影响。,31,主要内容,6.1 方差分析简介 6.2 单因素方差分析 6.3 多因素方差分析 6.4 协方差分析 6.5 多元方差分析,32,6.4 协方差分析,6.4.1 基本概念及统计原理 基本概念 协方差分析是将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制因素进行评价。 例如,研究某种药物对病症的治疗效果,如果仅仅分析药物本身的作用,而不考虑不同患者自身不同的体质,那么很可能得不到结论或得到的结论不正确。因此,在分析时应尽量排除这些因素的影响。 协方差将那些很难控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对观察量的影响,从而实现对控制变量效果的准确评价。,33,6.4 协方差分析,统计原理 以单因素协方差分析为例,总的离差平方和表示为:,协方差仍采用F检验,F统计量的计算公式为:,34,6.4 协方差分析,分析步骤 第1步 提出零假设:协方差分析的零假设H0是:控制变量和协变量对观测变量均无显著性影响。 第2步 选择检验统计量:协方差分析采用的是F统计量 ,其计算公式同前。 第3步 计算检验统计量的观测值和概率p值。 第4步 给出显著性水平 ,作出决策。,35,6.4 协方差分析,6.4.2 SPSS实例分析 【例6-3】已知一个班三组同学的入学成绩和分别接受了三种不同的教学方法后的数学成绩如下表所示,试研究这三组同学在接受了不同的教学方法后在数学成绩上是否有显著性差异。,36,6.4 协方差分析,第1步 分析:入学成绩肯定会对最后成绩有所影响,这里着重分析不同教学方法的影响,应将入学成绩(数学基础)的影响去除,考虑用协方差分析。 第2步 数据组织:将姓名、数学、入学成绩和组别分别定义为:“name:”、“math”、“entrance”和“group”。 第3步 检验协方差分析的前提条件:该前提条件是各组方差是否一致和协变量“entrance”与控制变量“group”是否具有交互作用。,左表是方差的齐性检验结果,由于其相伴概率值Sig.=0.1310.05,因此认为各组的方差具有齐性。,37,6.4 协方差分析,上表是检验控制变量与协变量是否具有交互作用,从其中可看出group与entrance的交互作用项Sig.=0.7840.05,因此认为它们之间没有交互作用。,38,6.4 协方差分析,从以上分析可知,例6-3是满足协方差分析中关于方差齐性和协变量与控制变量之间没有交互作用这两个基本条件的,因此可用协方差分析来处理。 第4步 执行协方差分析:其设置与单变量分析相似。 第5步 主要结果及分析。,39,主要内容,6.1 方差分析简介 6.2 单因素方差分析 6.3 多因素方差分析 6.4 协方差分析 6.5 多元方差分析,40,6.5 多元方差分析,6.5.1 基本概念及统计原理 基本概念 多元方差分析是研究多个控制因素(自变量)与多个因变量相互关系的一种统计分析方法,又称为多变量分析。多元分析实质上是单变量统计方法的发展和推广,适用于研究控制因素同时对两个或两个以上的因变量产生影响的情况,用来分析控制因素取不同水平时这些因变量的均值是否存在显著性差异。,41,6.5 多元方差分析,6.5.1 基本概念及统计原理 (2)统计原理 多元方差分析的基本原理同一元方差分析相似,是将总变异按照其来源(或实验设计)分为多个部分,从而检验各个因素对因变量的影响以及各因素间的交互作用。在这个过程中可以分析每个因素的作用,也可以分析因素之间的交互作用、协方差,以及各控制因素与协变量之间的交互作用。 多元方差分析的优点是可以在一次研究中同时检验具有多个水平的多个因素各自对因变量的影响以及各因素间的交互作用。 在方差分析中,要求样本必须满足独立、正态、等方差的总体,而对于多元方差分析而言,由于涉及多个因变量,除要求每个因变量满足以上条件外,还必须满足以下条件。 各因变量间具有相关性; 每一组都有相同的方差协方差矩阵; 各因变量为多元正态分布。,42,6.5 多元方差分析,6.5.2 多元方差分析SPSS实例分析 【例6-4】 某科研所研究某树种在不同海拔、不同施肥量情况下的苗高增加量和地径增加量的差别,将海拔设为3个水平,并将施肥量也设为3个水平,将两个因素组合成9个组合,每个组合重复3次。试分析海拔和施肥量对苗高增加量和地径增加量的影响,并分析海拔与施肥量是否存在交互作用。,43,6.5 多元方差分析,6.5.2 多元方差分析SPSS实例分析,44,6.5 多元方差分析,6.5.2 多元方差分析SPSS实例分析,第1步 分析。 这是一个两个控制因素对两个因变量影响的分析,是一个多元方差分析问题。 第2步 数据组织。 按表6.17的变量名组织成4列数据。 第3步 分析过程设置。 选择菜单“分析一般线性模型多变量”。将“苗高增加量”和“地径增加量”移入因变量框,将“海拔”和“施肥量”移入固定因子框。打开“事后比较(H)”对话框,将“海拔”和“施肥量”移入到“下列各项的事后检验”列表框,并勾选“假定等方差”选项组中的“LSD”复选框。打开“选项(O)”对话框,在“显示”选项组中,勾选“齐性检验”复选框。完成设置并运行。 第4步 主要结果及分析。,45,6.5 多元方差分析,6.5.2 多元方差分析SPSS实例分析,(1)因变量的方差齐性检验结果 从表可看出,苗高增加量和地径增加量的显著性概率P值分别为0.344和0.166,均大于显著性水平0.05,说明两者在各组总体方差具有齐性,满足方差分析的前提条件。,46,6.5 多元方差分析,6.5.2 多元方差分析SPSS实例分析,(2)多元方差分析结果,表是多元变量检验结果,可看出海拔与施肥量两个主效应的4种检验显著性概率均小于0.05,说明海拔与施肥量对苗高增加量和地径增加量有显著性影响;而“海拔*施肥量”的4种检验的显著性概率均大于0.05,说明两者对苗高增加量和地径增加量的影响不存在交互作用,47,6.5 多元方差分析,6.5.2 多元方差分析SPSS实例分析 (3)主体间效应的检验结果 从主体间效应的检验结果可看出,苗高增加量在海拔和施肥量上的显著性概率分别为0.002和0.000,说明苗高增加量在海拔和施肥量上均存在显著性差异;地径增加量在海拔和施肥量上的显著性概率分别为0.018和0.000,说明地径增加量在海拔和施肥量上均存在显著性差异;而苗高增加量与地径增加量在“海拔*施肥量”上的显著性概率为0.237和0.058,均大于0.05,说明海拔与施肥量的交互作用在苗高增加量与地径增加量上均无显著性差异。这与表6.19的分析情况相吻合。,48,6.5 多元方差分析,6.5.2 多元方差分析SPSS实例分析 (4)多重比较结果分析 从海拔的多重比较结果,可看出苗高增加量在海拔1与2、1与3、2与3上的显著性概率分别为0.927、0.002和0.002,说明苗高增加量在海拔1与3、2与3上存在显著性差异,在1与2上没有显著性差异;同时,可看出地径增加量在海拔1与3、2与3上存在显著性差异,而在1与2上没有显著性差异。,49,6.5 多元方差分析,6.5.2 多元方差分析SPSS实例分析 (4)多重比较结果分析,从施肥量的多重比较结果,可看出苗高增加量在施肥量1与2、1与3和2与3上均存在显著性差异;地径增加量在施肥量1与2、1与3上存在显著性差异,而在2与3上没有显著性差异。,50,The End,51,
展开阅读全文