资源描述
1第五节第五节 方差分析方差分析(Analysis of Variance)方差分析由英国统计学方差分析由英国统计学家在家在1923年提出,为纪年提出,为纪念念Fisher,以,以F 命名,命名,故方差分析又称故方差分析又称 F 检检验。验。2例例15-17 某研究者将某研究者将 27 只雄性大鼠随机分成只雄性大鼠随机分成三组(每组三组(每组 9 只),给予不同处理后只),给予不同处理后 3 周,周,测定血清中的测定血清中的SOD(超氧化物歧化酶)活性。(超氧化物歧化酶)活性。结果见下表。问三组的结果见下表。问三组的SOD活性是否相同活性是否相同?3三组大鼠血清中三组大鼠血清中SOD活性活性/(mol/L)对照组对照组 环孢素组环孢素组 环孢素环孢素+精氨酸组精氨酸组 365.1 348.3 360.5 394.2 355.2 368.0 373.3 319.9 386.4 375.2 354.4 369.4 358.6 352.7 352.1 370.8 356.8 371.5 350.2 324.4 374.1 410.2 356.2 368.4 360.5 350.2 372.14想一想,可否用想一想,可否用 t 检验检验?第第 1 组和第组和第 2 组比较,组比较,t 检验;检验;第第 1 组和第组和第 3 组比较,组比较,t 检验;检验;第第 2 组和第组和第 3 组比较,组比较,t 检验。检验。每作每作1次比较:次比较:犯第一类错误概率犯第一类错误概率 不犯第一类错误的概率不犯第一类错误的概率前后前后3次比较:次比较:不犯第一类错误的概率不犯第一类错误的概率3 犯第一类错误的概率犯第一类错误的概率5 方差分析(方差分析(analysis of variance,ANOVA)又称又称变异数分析变异数分析或或 F 检验检验。主要原理:主要原理:将各组数据的总变异按设计及研将各组数据的总变异按设计及研究目的分为若干部分,再计算各部分的均方,两究目的分为若干部分,再计算各部分的均方,两均方之比为均方之比为 F 值。值。F 值与值与 F 临界值比较,决定临界值比较,决定 P 值大小,再根据值大小,再根据 P 值大小推断结论。值大小推断结论。6用途:用途:n 两个或两个以上样本均数的比较;两个或两个以上样本均数的比较;n 分析一个、两个或者多个因素的作用和影响;分析一个、两个或者多个因素的作用和影响;n 分析因素之间的独立作用或交互作用;分析因素之间的独立作用或交互作用;n 两样本或多样本的方差齐性检验。两样本或多样本的方差齐性检验。用途和适用条件用途和适用条件7适用条件:适用条件:n 各样本是相互各样本是相互独立独立的随机样本;的随机样本;n 各样本来自各样本来自正态总体正态总体;n 各处理组各处理组总体方差相等总体方差相等(齐性)。(齐性)。8基本思想:基本思想:按分析目的和设计把全部数据之间按分析目的和设计把全部数据之间的总变异分成两部分或更多部分,然后借助的总变异分成两部分或更多部分,然后借助F分布作出统计推断。分布作出统计推断。总变异总变异=组间变异组间变异+组内变异组内变异9 组间变异组间变异主要受到主要受到处理因素处理因素和和个体误差个体误差两方面影两方面影响,响,组内变异组内变异主要受主要受个体误差个体误差的影响。当的影响。当H0为真时,为真时,由于处理因素不起作用,组间变异只受个体误差的影由于处理因素不起作用,组间变异只受个体误差的影响。此时,组间变异与组内变异相差不能太大,两部响。此时,组间变异与组内变异相差不能太大,两部分的均方(方差)也相差不大,分的均方(方差)也相差不大,其比值其比值 F 值接近值接近1。如果比值远远大于如果比值远远大于1,如大于,如大于3-5倍时,则处理因倍时,则处理因素就产生作用,影响了数据的结果。素就产生作用,影响了数据的结果。10 离均差平方和与其自由度之比在方差分析中称为离均差平方和与其自由度之比在方差分析中称为均方均方(记作(记作MS),当),当 H0 为真时,组间均方与组内为真时,组间均方与组内均方相差不大,两者比值均方相差不大,两者比值 F 值约接近于值约接近于1。即。即 F=组间均方组间均方/组内均方组内均方 1 当当H0不成立时,处理因素产生了作用,使得组间不成立时,处理因素产生了作用,使得组间均方增大,此时均方增大,此时 F 1,当大于等于当大于等于F 临界值时,则临界值时,则P,可认为可认为H0不成立,各样本均数不全相等。不成立,各样本均数不全相等。11类型类型n 单因素方差分析单因素方差分析(one-way ANOVA)也称)也称完全完全随机设计随机设计的方差分析,单向或单方式方差分析,的方差分析,单向或单方式方差分析,该设计只能分析一个因素下多个水平对试验结果该设计只能分析一个因素下多个水平对试验结果的影响。的影响。n 双因素方差分析双因素方差分析(two-way ANOVA)也称也称随随机区组设计机区组设计的方差分析,双向或双方式方差分析,的方差分析,双向或双方式方差分析,该设计可分析两个因素。一个为处理因素,一个该设计可分析两个因素。一个为处理因素,一个为区组因素。为区组因素。12n 三因素方差分析三因素方差分析也称拉丁方设计(也称拉丁方设计(Latin square design)的方差分析,该设计可以同时分析三个因)的方差分析,该设计可以同时分析三个因素对试验结果的作用,且三个因素之间相互独立,素对试验结果的作用,且三个因素之间相互独立,不能有交互作用。不能有交互作用。n 析因设计的方差分析析因设计的方差分析(factorial design)当两个)当两个因素或多个因素之间存在相互影响或交互作用时,因素或多个因素之间存在相互影响或交互作用时,可用该设计进行分析。该设计不仅可以分析多个可用该设计进行分析。该设计不仅可以分析多个因素的独立作用,也可分析多个因素之间的交互因素的独立作用,也可分析多个因素之间的交互作用,是一种高效率的方差分析方法。作用,是一种高效率的方差分析方法。是一种全面的组合试验方法,当试验因素和水是一种全面的组合试验方法,当试验因素和水平较多时,试验次数会急剧增多。平较多时,试验次数会急剧增多。13例例17 某研究者将某研究者将 27 只雄性大鼠随机分成只雄性大鼠随机分成三组(每组三组(每组 9 只),给予不同处理后只),给予不同处理后 3 周,周,测定血清中的测定血清中的SOD(超氧化物歧化酶)活性。(超氧化物歧化酶)活性。结果见下表。问三组的结果见下表。问三组的SOD活性是否相同活性是否相同?14 三组大鼠血清中三组大鼠血清中SOD活性活性/(mol/L)对照组对照组 环孢素组环孢素组 环孢素环孢素+精氨酸组精氨酸组 365.1 348.3 360.5 394.2 355.2 368.0 373.3 319.9 386.4 375.2 354.4 369.4 358.6 352.7 352.1 370.8 356.8 371.5 350.2 324.4 374.1 410.2 356.2 368.4 360.5 350.2 372.1从这个表,可以看到从这个表,可以看到三种变异:三种变异:组内数据的变异组内数据的变异 组内变异组内变异 三组之间数据的变异三组之间数据的变异 组间变异组间变异 全部数据间的变异全部数据间的变异 总变异总变异 15基本思想:基本思想:按分析目的和设计把全部数据之间按分析目的和设计把全部数据之间的总变异分成两部分或更多部分,然后借助的总变异分成两部分或更多部分,然后借助F分布作出统计推断。分布作出统计推断。总变异总变异=组间变异组间变异+组内变异组内变异16组内变异组内变异(SS e)组内各个观测值组内各个观测值 X i j 与本组内均值与本组内均值 之差之差的平方和。反映了组内(同一水平下)样本的随的平方和。反映了组内(同一水平下)样本的随机波动。机波动。iXkinjiijeiXXSS11217组间变异组间变异(SS TR)组内均值组内均值 与总均值与总均值 之差的平方和。反之差的平方和。反映了处理因素各个水平组间的差异,同时也包含映了处理因素各个水平组间的差异,同时也包含了随机误差。了随机误差。iX21XXnSSikiiTRX18总变异总变异(SS T)全部测量值大小不同,这种变异称为总变异,全部测量值大小不同,这种变异称为总变异,以各测量值以各测量值 X ij与总均数与总均数 间的差异度量。间的差异度量。211kinjijTiXXSSX19总变异、组间变异、组内变异的关系总变异、组间变异、组内变异的关系:eTRTSSSSSSeTRT对应自由度的关系对应自由度的关系:20均方均方(mean square)n 离均差平方和大小离均差平方和大小:与变异程度大小有关与变异程度大小有关 与其自由度大小有关与其自由度大小有关n 将各部分离均差平方和除以相应自由度,其比将各部分离均差平方和除以相应自由度,其比值称为均方差,简称均方值称为均方差,简称均方(MS)。kn/1k/eeeeSSSSMSSSSSMSTRTRTRTR组内均方:组间均方:21F 值与值与 F 分布分布n 组间均方与组内均方的比值称为组间均方与组内均方的比值称为 F 统计量,服统计量,服从从 F 分布,即分布,即:n如果如果 H0 成立,即各处理组的样本来自相同总成立,即各处理组的样本来自相同总体,处理因素没有作用,则组间变异同组内变体,处理因素没有作用,则组间变异同组内变异一样,只反映随机误差作用的大小。异一样,只反映随机误差作用的大小。eTRMSMSF 224.3.3 4.3.3 F F分布分布图图4-3 4-3 不同自由度时的不同自由度时的F F分布曲线分布曲线 F分布有两个自由度,第一自由度分布有两个自由度,第一自由度()是分子的自由是分子的自由度,第二自由度度,第二自由度()是分母的自由度。是分母的自由度。1210221,10521,2110,11021,F F分布是方差比的分布,常用于分布是方差比的分布,常用于方差齐性检验、方差分析等。方差齐性检验、方差分析等。2221SSF 23 单因素方差分析(单因素方差分析(one-way ANOVA)也)也称完全随机设计的方差分析,单向或单方式称完全随机设计的方差分析,单向或单方式方差分析,该设计只能分析一个因素下多个方差分析,该设计只能分析一个因素下多个水平对试验结果的影响。水平对试验结果的影响。一、完全随机设计完全随机设计多个样本均数比较多个样本均数比较24方差分析表方差分析表25例例17 某研究者将某研究者将 27 只雄性大鼠随机分成只雄性大鼠随机分成三组(每组三组(每组 9 只),给予不同处理后只),给予不同处理后 3 周,周,测定血清中的测定血清中的SOD(超氧化物歧化酶)活性。(超氧化物歧化酶)活性。结果见下表。问三组的结果见下表。问三组的SOD活性是否相同活性是否相同?26 三组大鼠血清中三组大鼠血清中SOD活性活性/(mol/L)对照组对照组 环孢素组环孢素组 环孢素环孢素+精氨酸组精氨酸组 365.1 348.3 360.5 394.2 355.2 368.0 373.3 319.9 386.4 375.2 354.4 369.4 358.6 352.7 352.1 370.8 356.8 371.5 350.2 324.4 374.1 410.2 356.2 368.4 360.5 350.2 372.1从这个表,可以看到从这个表,可以看到三种变异:三种变异:组内数据的变异组内数据的变异 组内变异组内变异 三组之间数据的变异三组之间数据的变异 组间变异组间变异 全部数据间的变异全部数据间的变异 总变异总变异 27 对照组对照组 环孢素组环孢素组 环孢素环孢素+精氨酸组精氨酸组 合计合计 365.1 348.3 360.5 394.2 355.2 368.0 373.3 319.9 386.4 375.2 354.4 369.4 358.6 352.7 352.1 370.8 356.8 371.5 350.2 324.4 374.1 410.2 356.2 368.4 360.5 350.2 372.1 ni 9 9 9 27 3358.1 3118.1 3323.1 9799.3 373.1 346.5 369.2 1255770.5 1081872.7 1227682.9 3565326.1iXiX2iX281.建立假设,确定检验水准建立假设,确定检验水准 H0:1=2=3 H1:1、2、3 不等或不全相等不等或不全相等 292.选定检验方法,计算统计量选定检验方法,计算统计量5062.013735.18-8797.19-3735.183556528.91-93323.13118.13358.1-n8797.193556528.91-3565326.10C-91.3556528273.9799222i2i222组间总组内组间总SSSSSSCXSSXSSNXC308.855210.921867.60210.92245062.011867.6023735.18243-27-2131261-271-组内组间组内组内组内组间组间组间组内组间总MSMSFvSSMSvSSMSkNvkvNv313.确定确定 P 值,作出推断结论值,作出推断结论以以 v组间组间 为为 v1,以,以 v组内组内 为为 v2,查附表,查附表 F 界值表,界值表,得得F0.01(2,24),本例,本例 F F0.01(2,24),故,故 P。结论:结论:按按 a=0.05 检验水准,拒绝检验水准,拒绝 H0,接受,接受 H1,可认,可认为三组的为三组的 SOD 活性有差别,但不能认为任何两组活性有差别,但不能认为任何两组SOD活性均有差别。活性均有差别。3233P19720034表表 15 12 例例 17 资料的方差分析表资料的方差分析表变异来源变异来源 SS v MS F P 总总 8797.19 26 组间组间 3735.18 2 1867.59 8.854 0.01 组内组内 5062.01 24 210.9235二、二、随机区组设计随机区组设计资料的方差分析资料的方差分析 随机区组设计随机区组设计(randomized block design)又又称为配伍组设计,涉及称为配伍组设计,涉及处理因素处理因素(主要因素)(主要因素)和和区组因素区组因素(配伍组因素,个体特征),故随(配伍组因素,个体特征),故随机区组设计的多个样本均数比较分析又称两因机区组设计的多个样本均数比较分析又称两因素方差分析。素方差分析。36随机区组设计资料常见情况:随机区组设计资料常见情况:n 区组设计资料区组设计资料:先将全部观察对象按某种或某些:先将全部观察对象按某种或某些特征分为若干个区组,每个区组的观察对象数等于特征分为若干个区组,每个区组的观察对象数等于处理组数处理组数 k,然后将同一区组的,然后将同一区组的 k 个对象随机分配个对象随机分配到到 k 个不同的处理组所得到的数据资料;个不同的处理组所得到的数据资料;n 同一个对象的同一个对象的k个部位测定同一指标所得的数据个部位测定同一指标所得的数据资料;资料;n 同一样品用多种不同方法测定同一指标所得的数同一样品用多种不同方法测定同一指标所得的数据资料。据资料。37随机区组设计资料数据结构随机区组设计资料数据结构38变异分解变异分解总变异总变异SST可分解为:可分解为:n 处理因素的变异处理因素的变异SSA SSA 反映了各个水平组间的差异反映了各个水平组间的差异(包含随机误差包含随机误差)n 区组因素的变异区组因素的变异SSB SSB 反映了各个区组间的差异反映了各个区组间的差异(包含随机误差包含随机误差)n 随机误差随机误差SSe SSe 反映了样本的随机波动反映了样本的随机波动三者的关系如下:三者的关系如下:eBATSSSSSSSS39方差分析表方差分析表40例例15-18 按性别相同、年龄相近、病情相近按性别相同、年龄相近、病情相近把把 33 例某病患者配成例某病患者配成 11 个区组,每区组个区组,每区组 3 个个患者,分别给予患者,分别给予A 药、药、B 药和药和 C药治疗。治疗药治疗。治疗后患者血浆中的后患者血浆中的 IGA 含量见表含量见表15-14。问经三。问经三种不同药物治疗后该病患者血浆中种不同药物治疗后该病患者血浆中IGA含量有含量有无差别?无差别?41区组号区组号 A药药 B药药 C药药 7 1.17 1.26 1.08 3.51 n i 11 1 1 11 33(N)()()iXiijXX表表 15-10 三种不同药物治疗后某病患者血浆三种不同药物治疗后某病患者血浆IGA含量含量jijXjijX22X42处理间:处理间:H0:1=2=3,即三种不同药物治疗后,即三种不同药物治疗后IGA 含量的总体均数相等;含量的总体均数相等;H1:1、2、3 不等或不全相等不等或不全相等 区组间:区组间:H0:1=2=11,即,即11个区组的个区组的IGA含量的含量的 总体均数相等;总体均数相等;H1:1、2、11 不等或不全相等不等或不全相等 1.建立假设,确定检验水准建立假设,确定检验水准 432.选定检验方法,计算统计量选定检验方法,计算统计量7117.08706.31629.07452.48706.32048.83359.4.14.654.5k1629.02048.831155.1880.1605.17bSS4.745283.2048-87.9500C-2048.833340.52222j2iij222i2j222 区组处理总误差区组处理总SSSSSSSSCXSSCXXSSNXCij448736.100356.0/3871.0/2890.20356.0/0815.0/0356.020/7117.0/3871.010/8706.3/0815.02/1629.0/20111131b1k101111b2131k321331误差区组区组误差处理处理误差误差误差区组区组区组处理处理处理误差区组处理总MSMSFMSMSFSSMSSSMSSSMSN45 对于三种药物,对于三种药物,以以v处理处理为为 v1,以,以v误差误差为为v2,查,查F界值表得:界值表得:F(2,20),本例,本例F处理处理=2.2893 F(2,20),故故P。按按 检验水准,不拒绝检验水准,不拒绝 H0,即尚即尚不能认为三种不同药物治疗后该病患者血浆中不能认为三种不同药物治疗后该病患者血浆中IGA含量不同。含量不同。3.确定确定 P 值,作出推断结论值,作出推断结论46 对于区组,对于区组,以以v区组区组为为 v1,以,以v误差误差为为v2,查,查F界值界值表得:表得:F(10,20),F(10,20),本例,本例F区组区组=10.8736 F(10,20),故故P 。按按 检验水准,拒绝检验水准,拒绝 H0,接接受受 H1,可认为不同区组血浆中可认为不同区组血浆中IGA含量不同。含量不同。47P19720048表表 15 15 例例 18 资料的方差分析表资料的方差分析表变异来源变异来源 SS v MS F P 总总 4.7452 32 处理处理 0.1629 2 0.0815 2.2893 0.05 区组区组 3.8706 10 0.3871 10.8736 0.01 误差误差 0.7117 20 0.035649三、两两比较的三、两两比较的 q 检验检验拒绝拒绝H 0,接受,接受H 1,表示总体均数不全相等。表示总体均数不全相等。哪两两均数相等?哪两两均数相等?哪两两均数不等?哪两两均数不等?需要进一步作多重比较。需要进一步作多重比较。50SNK(Student-Newman-Keuls)法法 最常用方法之一,其检验统计量为最常用方法之一,其检验统计量为q,故,故又称为又称为q 检验检验。BABAMSXXqn1n12误差MS误差误差:单因素方差分析中的组内均方(:单因素方差分析中的组内均方(MS组内组内),),或两因素方差分析中的误差均方(或两因素方差分析中的误差均方(MS误差误差)51例例19 对例资料不同组的对例资料不同组的SOD活性的均数活性的均数作两两比较。作两两比较。BA1.建立假设,确定检验水准建立假设,确定检验水准 H0:任两组的:任两组的SOD活性的总体均数相等,即活性的总体均数相等,即 H1:任两组的:任两组的SOD活性的总体均数不等,即活性的总体均数不等,即 BA522.将三个样本均数从大到小排列,编上组次将三个样本均数从大到小排列,编上组次 组次组次 1 2 3 均数均数 组别组别 对照组对照组 环孢素环孢素+精氨酸组精氨酸组 环孢素组环孢素组3.计算计算 q 值,列出两两比较的值,列出两两比较的 q 检验计算表检验计算表 53表表 15 16 三个样本均数两两比较的三个样本均数两两比较的 q 检验计算表检验计算表对比组对比组 均数之差均数之差 组数组数 q 值值 q 界值界值 P 值值 A与与B a P=0.05 P (1)(2)(3)(4)(5)(6)(7)1与与2 3.90 2 0.80 2.95 4.02 1与与3 26.60 3 5.51 3.58 4.64 2与与3 22.70 2 4.71 2.95 4.02 BAXX 按水准,按水准,1与与3对比组以及对比组以及2与与3对比组拒绝对比组拒绝H0,接受,接受H1,说明对,说明对照组与环孢素组的照组与环孢素组的SOD活性有差别,环孢素活性有差别,环孢素+精氨酸组与环孢精氨酸组与环孢素组的素组的SOD活性也有差别,但活性也有差别,但1与与2对比即对照组与环孢素对比即对照组与环孢素+精精氨酸对比不拒绝氨酸对比不拒绝H0,尚不能认为有差别。,尚不能认为有差别。54
展开阅读全文