方差分析多组资料均数的比较

上传人:san****019 文档编号:20664022 上传时间:2021-04-11 格式:PPT 页数:44 大小:969.50KB
返回 下载 相关 举报
方差分析多组资料均数的比较_第1页
第1页 / 共44页
方差分析多组资料均数的比较_第2页
第2页 / 共44页
方差分析多组资料均数的比较_第3页
第3页 / 共44页
点击查看更多>>
资源描述
2021年 4月 11日 第四章 多组资料均数的比较 (ANOVA) 2021年 4月 11日 多组资料均数的比较 第一节 方差分析的基本思想及应用条件 第二节 完全随机设计资料的方差分析 第三节 随机 单位 组设计资料的方差分析 第四节 均数间的多重比较 第五节 析因设计资料的方差分析 第六节 Bartlett齐性检验 2021年 4月 11日 将所研究的对象分为多个处理组 ,施加不同的 干预,施加的干预称为 处理因素( factor) ,处 理因素至少有两个 水平 (level)。 用这类资料的 样本信息来推断各处理组间多个总体均数是否存 在差别,常采用的统计分析方法为 方差分析 (analysis of variance, ANOVA)。 由英国统计学家 R.A.Fisher首创,为纪念 Fisher,以 F命名,故方差分析又称 F检验 ( F test) 。 第一节 方差分析的基本思想及应用条件 2021年 4月 11日 表 4 - 1 168 h 后 处 死 不 同 时 期 切 痂 烫 伤 大 鼠 的 肝 脏 ATP 含 量 ( mg ) A 组 ( 对 照 ) B 组 ( 24 h ) C 组 ( 96 h ) 合 计 7 .76 11.14 10.85 7 .71 11.60 8.58 8 .43 11.42 7.19 8 .47 13.85 9.36 1 0.30 13.53 9.59 6 .67 14.16 8.81 1 1.73 6.94 8.22 5 .78 13.01 9.95 6 .61 14.18 11.26 6 .97 1 7.72 8.68 n i 1 0 10 10 30 N i X 8 .04 12.76 9.25 10 .02 X i n j iji XT 1 8 0.43 1 27.55 92.49 30 0.47 X i n j iji XQ 1 2 67 6.32 1 696.9 6 8 68.93 32 42.21 2 X i为组的编号, A, B, C j为组内为个体编号, 1, 2, , 10 2021年 4月 11日 i为组的编号, 1, 2, 3 j为组内为个体编号, 1, 2, , 10 表 4 - 1 168h 后 处 死 不 同 时 期 切 痂 烫 伤 大 鼠 的 肝 脏 ATP 含 量 ( mg ) A 组 ( 对 照 ) B 组 ( 24 h ) C 组 ( 96 h ) 合 计 X 11 X 2 1 X 3 1 X 1 2 X 22 X 32 X 1 3 X 23 X 33 X 1 4 X 24 X 34 X 1 5 X 25 X 35 X 1 6 X 26 X 36 X 1 7 X 27 X 37 X 1 8 X 28 X 38 X 1 9 X 29 X 39 X 11 0 X 2 1 0 X 3 1 0 n i n 1 n 2 n 3 N n 1 + n 2 + n 3 i X 1 1 11 nXX i n j j 2 1 22 nXX i n j j 3 1 33 nXX i n j j NXX k i n j ij i 1 1 S i Q 1 T 1 2 / n 1 Q 2 T 2 2 / n 2 Q 3 T 3 2 / n 3 i n j iji XT 1 i n j j XT 1 11 i n j j XT 1 22 i n j j XT 1 33 k i n j ij i XX 1 1 i n j iji XQ 1 2 i n j j XQ 1 2 11 i n j j XQ 1 2 22 i n j j XQ 1 2 33 k i n j ij i XX 1 1 22 2021年 4月 11日 1. 总变异 ( Total variation):全部测量值 Xij 与总均数 间的差别 2. 组间变异 ( between group variation ) 各 组的均数 与总均数 间的差异 3. 组内变异 ( within group variation )每组的 10个原始数据与该组均数 的差异 试验数据有三个不同的变异 iX X XiX 下面先用 离均差平方和 (sum of squares of deviations from mean, SS)表示变异的大小 2021年 4月 11日 1. 总变异 1; )( 2 2 2 2 1 1 2 1 11 1 22 NNXC CX NXX NXXXXSS k i n j k i n j ij k i n j ijij i ii 其中 自由度 总 SS总 反映了 所有测量值 之间总的变异程度, SS总 =各测量值 Xij与总均数 差值的平方和 X 13075)02.1068.8()02.1071.7()02.1076.7( 222 总SS 2021年 4月 11日 SS组间 反映了 各组均数 间的变异程度 组间变异随机误差 + 处理因素效应 2. 组间变异 1; )( 2 2 2 1 2 1 1 2 1 1 2 12 kNXC CnTNX n T NX n X XXnSS ii k i i i k i k i k i n j ij i n j ij ii i i 其中 组间 组间 iX mi mj 2.120)02.1025.9(10)02.1076.12(10)02.1004.8(10 222 组间SS 2021年 4月 11日 在同一处理组内,虽 然每个受试对象接受的处 理相同,但测量值仍各不 相同,这种变异称为组内 变异。 SS组内 仅仅反映了 随 机误差 的影响。也称 SS误差 3. 组内变异 kN SnXXSS k i n j k i iiiij i 组间 组内 1 1 1 22 )1()( m i 0.113)25.968.8()04.871.7()04.876.7( 222 组内SS 2021年 4月 11日 三种“变异”之间的关系 组内组间总 SSSSSS += , 且 总 = 组 间 + 组 内 组 内 变 异 SS 组 内 : 随 机 误 差 组 间 变 异 SS 组 间 : 处 理 因 素 + 随 机 误 差 2021年 4月 11日 One-Factor ANOVA Partitions of Total Variation Variation Due to Treatment SSB Variation Due to Random Sampling SSW Total Variation SST Commonly referred to as: Sum of Squares Within, or Sum of Squares Error, or Within Groups Variation Commonly referred to as: Sum of Squares Among, or Sum of Squares Between, or Sum of Squares Model, or Among Groups Variation = + 2021年 4月 11日 均方 (mean square, MS) 变 异 程 度 除 与 离 均 差 平 方 和 的 大 小 有 关 外 , 还 与 其 自 由 度 有 关 , 由 于 各 部 分 自 由 度 不 相 等 , 因 此 各 部 分 离 均 差 平 方 和 不 能 直 接 比 较 , 须 将 各 部 分 离 均 差 平 方 和 除 以 相 应 自 由 度 , 其 比 值 称 为 均 方 差 , 简 称 均 方 ( m e a n s q u a r e , MS ) 。 组 间 均 方 和 组 内 均 方 的 计 算 公 式 为 : SS MS 组间 组间 组间 SS MS 组内 组内 组内 2021年 4月 11日 均方 之比 F value 如 果 各 组 样 本 的 总 体 均 数 相 等 ( H 0 : 12 mm k m ) , 即 各 处 理 组 的 样 本 来 自 相 同 总 体 , 无 处 理 因 素 的 作 用 , 则 组 间 变 异 同 组 内 变 异 一 样 , 只 反 映 随 机 误 差 作 用 的 大 小 。 组 间 均 方 与 组 内 均 方 的 比 值 称 为 F 统 计 量 MS F MS 组间 组内 1 组间 , 2 组内 F 值 接 近 于 l , 就 没 有 理 由 拒 绝 H 0 ; 反 之 , F 值 越 大 , 拒 绝 H 0 的 理 由 越 充 分 。 数 理 统 计 的 理 论 证 明 , 当 H 0 成 立 时 , F 统 计 量 服 从 F 分 布 。 2021年 4月 11日 F 分布 F分布概率密度函数: 2 21 21 1 2 2/ 2 2/ 1 21 21 1 21 )( 22 2 )( F F Ff 式 中 )( 为 伽 玛 函 数 ; 21 MSMS组内均方组间均方F , 是 两 个 均 方 的 比 值 ; 1 、 2 分 别 为 F 值 的 分 子 与 分 母 的 自 由 度 , 这 是 F 分 布 的 两 个 参 数 , 由 这 两 个 自 由 度 可 决 定 F 分 布 的 图 形 形 状 , 因 此 F 分 布 可 用 ),( 21 F 表 示 。 以 F 为 横 轴 , )( Ff 为 纵 轴 可 绘 制 F 分 布 的 图 形 。 2021年 4月 11日 0 . 0 0 . 2 0 . 4 0 . 6 0 . 8 1 . 0 1 . 2 1 . 4 0 1 2 3 4 F f( F ) F 分布曲线 10,10 21 5,1 21 5,5 21 2021年 4月 11日 F 界值表 附表 4 F界值表(方差分析用,单侧界值) 上行: P=0.05 下行: P=0.01 分母自由度 2 分子的自由度, 1 1 2 3 4 5 6 1 161 200 216 225 230 234 4052 4999 5403 5625 5764 5859 2 18.51 19.00 19.16 19.25 19.30 19.33 98.49 99.00 99.17 99.25 99.30 99.33 25 4.24 3.39 2.99 2.76 2.60 2.49 7.77 5.57 4.68 4.18 3.85 3.63 2021年 4月 11日 方差分析的基本思想 首先将 总变异 分解为 组间变异 和 误差(组内) 变异 ,然后比较两者的均方,即计算 F值 ,若 F值 大于某个临界值,表示处理组间的效应不同,若 F值接近甚至小于某个临界值,表示处理组间效 应相同 (差异仅仅由随机原因所致 )。 对于不同设计的方差分析,其思想都一样, 即均将处理间平均变异与误差平均变异比较。不 同之处在于 变异分解的项目 因设计不同而异。 2021年 4月 11日 方差分析的应用条件 各样本是相互独立的随机样本; 各样本来自正态总体; 各处理组总体方差相等,即方差齐性或 齐同( homogeneity of variance)。 上述条件与两均数比较的 t检验的应用条件相同。 当组数为 2时,方差分析与两均数比较的 t检验 是等价的,对同一资料 ,有 Ft 2021年 4月 11日 第二节 完全随机设计的方差分析 完全随机设计 (completely random design) 也叫 单因素 方差分析 ( one way ANOVA)。将受试对象 随机 地分 配到各个处理组的设计。 随机分组方法 : 1. 编号 ,确定分组方案(如较少 10个随机数为 A,中间 10个数为 B,较大 10个随机数为 C) 2. 产生随机数字(附表 15,或电脑),排序 3. 按方案分组 编 号 1 2 3 4 5 6 7 8 9 10 29 30 随机数 12.1 3.9 18.3 27.1 26.7 28.8 1.4 12.8 26.0 5.0 24.4 29.7 8.4 分组 B A C C C C A B C A C C A 2021年 4月 11日 二、方差分析的步骤 ( 一 ) 建 立 假 设 并 确 定 检 验 水 准 0 H : 321 mmm ( 不 同 时 期 切 痂 对 ATP 含 量 无 影 响 ) ; 1 H : 321 , mmm 不 全 相 等 ( 不 同 时 期 切 痂 对 ATP 含 量 有 影 响 ) ; 05.0 。 ( 二 ) 计 算 F 值 ( 三 ) 查 F 值 表 ( 附 表 4 ) , 确 定 P 值 , 下 结 论 m1 m2 m3 H0: m1 = m2 = m3 = . = mk m1 m2 m3 H1: not all the mi are equal m1 m2 m3 2021年 4月 11日 (二)计算 F值(方差分析表) 完 全 随 机 设 计 方 差 分 析 表 变 异 来 源 SS MS F 组 间 C n X i i j ij - )( 2 1k 组间组间 SS 组内组间 MSMS 组 内 ( 误 差 ) 组间总 SSSS - kN - 组内组内 SS 总 CX - 2 1-N NXC /)(= 2 2021年 4月 11日 计算 F值(方差分析表) 本 例 ( 表 4 - 1 ) C = 4074.3009 30 )47.300( 2 SS 总 = 8026.2324074.300921.3242 , 总 = 3 0 1 = 29 SS 组 间 = 8314.1194074.3009 10 )49.92( 10 )55.127( 10 )43.80( 222 , 组间 3 1 =2 SS 组 内 = SS 总 SS 组 间 9712.1128314.1198026.232 , 组内 = 30 3= 27 代 入 方 差 分 析 表 中 并 求 出 相 应 的 MS 及 F 值 , 见 表 4 - 3 。 表 4 - 1 资 料 的 方 差 分 析 表 变 异 来 源 SS DF MS F 值 P 值 组 间 11 9.831 4 2 59 .916 14 .32 5. 76348 E - 05 组 内 11 2.971 2 27 4. 184 总 计 23 2.802 6 29 Excel 计 算 F 值 相 应 的 P 值 得 公 式 : FDIST ( 14.32 , 2 , 27 ) 2021年 4月 11日 (三)下结论 P 5.76348E - 05 0.00006 按 =0.05 水 准 , 拒 绝 0H , 接 受 1H , 认 为 三 组 的 差 别 具 有 统 计 学 意 义 , 不 同 时 期 切 痂 对 大 鼠 肝 脏 的 ATP 含 量 有 影 响 。 如 想 知 道 哪 两 组 间 有 差 别 ( 如 本 例 更 关 心 两 个 切 痂 组 的 ATP 含 量 是 否 有 差 别 ) , 可 进 行 多 个 均 数 的 两 两 比 较 , 具 体 见 本 章 第 四 节 。 2021年 4月 11日 第三节 随机单位组设计的方差分析 随机单位组设计 (randomized block design) : 又称 随机区组设计 、 配伍组设计,也叫双因素方差分 析( two-way ANOVA) 。是配对设计的扩展。 具体做法:将受试对象按性质(如性别、年龄、 病情等) ( 这些性质是非处理因素,可能影响试验 结果 )相同或相近者组成 b个单位组(配伍组),每 个单位组中有 k个受试对象,分别随机地分配到 k个处 理组。 这样,各个处理组不仅 样本含量相同 , 生物学特 点 也较均衡。 比完全随机设计更容易察觉处理间的差 别 。 2021年 4月 11日 表 4-4 注射不同剂量雌激素后的大白鼠子宫重量 (g) 雌 激 素 剂 量 ( ug/100 g) 大 白 鼠 种 类 ( 同 窝 ) 0. 2 0.4 0.8 合 计 ( k i ijj XB 1 ) A 10 6 11 6 14 5 3 67 B 42 68 11 5 2 25 C 70 11 1 13 3 3 14 D 42 63 87 1 92 n i ( b ) 4 4 4 12 ( N ) i X 65 .0 8 9.5 12 0.0 91.5 ( X ) b j iji XT 1 2 60 358 48 0 1 098 ( X ) b j iji XQ 1 2 19 664 34370 5950 8 11 3542 ( 2 X ) 2021年 4月 11日 一、随机单位组设计 随机分组方法( 每个单位组内随机 ): 1. 将同种类同窝大白鼠为一个单位组,并编号; 2. 给同窝中 3只大白鼠编号;规定随机数小者分到 甲组,中等分到乙组,大者分到丙组; 3. 给每个大白鼠一个随机数; 4. 按规定分组 表 4个单位组大白鼠按 随机单位组组设计 分组 单位组号 1 2 3 4 小白鼠 1 2 3 4 5 6 7 8 9 10 11 12 随机数 68 35 26 00 99 53 93 61 28 52 70 05 序 号 3 2 1 1 3 2 3 2 1 2 3 1 分配结果 丙 乙 甲 甲 丙 乙 丙 乙 甲 乙 丙 甲 2021年 4月 11日 二、方差分析的步骤 m1 m2 m3 H0: m1 = m2 = m3 = . = mk m1 m2 m3 H1: not all the mi are equal m1 m2 m3 与完全随机设计的方差分析基本相同,主要 区别在于: F值计算的方差分析表( ANOVA table)不同。 变异来源从 组内变异 中分解出 单位组变异 与 误差变异 。 2021年 4月 11日 (二)计算 F值(方差分析表) 随 机 单 位 组 设 计 的 方 差 分 析 表 变 异 来 源 SS MS F 处 理 组 间 CX b i j ij 2 1 1k 处理处理 SS 误差处理 MSMS 单 位 组 间 CX k j i ij 2 1 b - 1 单位单位 SS 误差单位 MSMS 误 差 单位处理总 SSSSSS 单位处理总 误差误差 SS 总 CX - 2 1-N NXC /)(= 2 2021年 4月 11日 计算 F值(方差分析表) 本 例 ( 表 4 - 4 ) : C = 100467 12 )1098( 2 SS 总 = 13075100467113542 SS 处 理 = 6074100467 4 480358260 222 SS 单 位 = 67.6457100467 3 192314225367 2222 SS 误 差 = 33.54367.6457607413075 表 4 - 6 例 4 - 2 资 料 方 差 分 析 表 变 异 来 源 SS DF MS F 值 P 值 处 理 组 间 单 位 组 间 6074.00 6457.67 2 3 3037.00 2152.56 33.54 23 .77 0.000554 0.000992 误 差 543.33 6 90.55 总 计 13075.00 11 2021年 4月 11日 (三)下结论 本 例 P 0.000554 , 按 =0.0 1 水 准 , 拒 绝 0H , 接 受 1H , 认 为 三 个 雌 激 素 剂 量 组 的 大 白 鼠 子 宫 重 量 的 差 别 具 有 统 计 学 意 义 , 即 注 射 不 同 剂 量 的 雌 激 素 对 大 白 鼠 子 宫 的 重 量 有 影 响 。 多 个 均 数 的 两 两 比 较 , 见 下 一 节 随 机 单 位 组 设 计 利 用 单 位 组 控 制 了 非 实 验 因 素 , 并 在 进 行 方 差 分 析 时 将 单 位 组 间 的 变 异 从 组 内 变 异 中 分 解 出 来 。 因 此 , 当 单 位 组 间 差 别 有 统 计 学 意 义 时 , 这 种 设 计 由 于 减 少 了 误 差 , 较 完 全 随 机 设 计 的 试 验 效 率 提 高 了 。 2021年 4月 11日 t检验与 F检验的关系 当处理组数为 2时,对于相同的资料,如 果同时采用 t检验与 F检验,则有: 随机单位组设计 ANOVA的 处理组 F值与 配对设计 的 t值; 完全随机设计 ANOVA的 F值 与 两样本 均数比较 的 t值间均有: tF 2021年 4月 11日 完全随机设计 ANOVA与随机单位组设计 ANOVA 随机单位组设计 ANOVA将完全随机设计 ANOVA的组内变异分解为单位组间变异与误差变 异,即: 误差单位组内误差单位组内 ; SSSSSS 2021年 4月 11日 不同设计应采用不同的 ANOVA方法 表 4 - 6 例 4 - 2 资 料 随 机 单 位 组 设 计 的 方 差 分 析 表 变 异 来 源 SS DF MS F 值 P 值 处 理 组 间 单 位 组 间 6074.00 6457.67 2 3 3037.00 2152.56 33.54 23 .77 0.000554 0.000992 误 差 543.33 6 90.55 总 计 13075.00 11 表 4 - 6 例 4 - 2 资 料 完 全 随 机 设 计 的 方 差 分 析 表 变 异 来 源 SS DF MS F 值 P 值 处 理 组 间 组 内 6074.00 70 01 .00 2 9 3037.00 777 . 8 9 3.90 0.0 6 015 2021年 4月 11日 第四节 均数间的多重比较 当方差分析的结果拒绝 H0,接受 H1 时,只说明 k个总体均数不全相等。若想进一步 了解哪些两个总体均数不等,需进行多个样 本均数间的两两比较或称多重比较( multiple comparison)。也叫 post hoc检 验 2021年 4月 11日 若用上一章的 两样本均数比较的 t检验 进行 多重比较,将会加大犯 类错误(把本无差别 的两个总体均数判为有差别)的概率。 例如,有 4个样本均数,两两组合数为 ,若用 t检验做 6次比较,且每次比较的检验水准 选为 ,则每次比较不犯 类错误的概率 为( 1 0.05), 6次均不犯 类错误的概率为 . 这时,总的检验水准变为 为什么一般 t检验作多重比较 是错误的? 26.0)05.01(1 6 624 0.05 6)05.01( 2021年 4月 11日 一、 SNK q检验(多个均数间 全面比较 ) 二、 LSD t检验(有 专业意义 的均数间比较) 三、 Dunnett检验 (多个 实验组与对照组 比较) 还有 TUKEY 、 DUNCAN、 SCHEFFE、 WALLER 、 BON等比较方法 “ 多重比较”的几种方法 2021年 4月 11日 SNK( Student-Newman-Keuls)检验,亦称 q检验 一、 SNK q检验 ij ij XX XX q S , = 误 差 , 11 2ij XX ij MS S nn 误差 i X , i n 和 j X , j n 为 两 对 比 组 的 样 本 均 数 和 样 本 例 数 。 2021年 4月 11日 例 4 - 3 续 例 4 - 1 试 比 较 三 个 组 两 两 之 间 的 差 别 。 解 : 1 . 建 立 假 设 并 确 定 检 验 水 准 ; 2. 计 算 q 值 0 H : ji mm 1 H : ji mm ; 05.0 将 三 个 样 本 均 数 从 小 到 大 排 列 , 并 赋 予 秩 次 均 数 8.04 9 .25 12.76 组 别 A 组 C 组 B 组 秩 次 1 2 3 表 4 - 7 多 个 均 数 两 两 比 较 q 值 表 比 较 组 秩 次 ( 1 ) ji XX ( 2 ) a ( 3 ) q ( 4 ) 05.0 q ( 5 ) P 值 ( 6 ) 1 , 2 1.21 2 1.8702 2.9 05 05.0P 1 , 3 4.72 3 7.2952 3. 5 10 05.0P 2 , 3 3.51 2 5.4250 2.9 05 05.0P 3. 根 据 和 a 与 , 查 q 界 值 表 ( 附 表 5 ) , 确 定 P 值 , 下 结 论 647.0)101101(2184.4 ji XXS 2021年 4月 11日 最小显著差异( Least significant difference) t检验 二、 LSD t检验 L S D - t = ij ij XX XX S , = 误 差 , 11 ijXX ij S MS nn 误差 i X , i n 和 j X , j n 为 两 个 对 比 组 第 i 组 与 第 j 组 的 样 本 均 数 和 样 本 例 数 , 误差 MS 为 方 差 分 析 表 中 的 误 差 均 方 。 2021年 4月 11日 例 4 - 4 续 例 4 - 1, 24 小 时 切 痂 组 和 对 照 组 的 比 较 建 立 假 设 并 确 定 检 验 水 准 ; 0 H : 024 mm h ; 1 H : 024 mm h ; 05.0 求 L SD - t 值 误差 MS 184.4 , 76.1224 hX , 04.8 0 X , 10 024 nn h ji XX S = ) 11 ( ji nn MS 误差 = 915.0) 10 1 10 1 (184.4 LSD - 158.5 915.0 04.876.12 ji XX ji S XX t 查 t 界 值 表 ( 附 表 2 ) 得 P 值 , 下 结 论 052.2 27,2/05.0 t , 因 t 27,2/05.0 t , 故 P 27,2/05.0 t , 故 P 27,2/05.0 q , P 0.05 2021年 4月 11日 第六节 Bartlett方差齐性检验 H 0 : 各 总 体 方 差 齐 同 , H 1 : 各 总 体 方 差 不 齐 。 k i iiC SnSkN C 1 222 ln)1(ln)( 1 1 k 误差 MSnXXS k i i k i n j iijC i 11 1 22 )1()( ; kNnk C k i i 1 )1( 1 )1(3 1 1 1 式 中 k 为 组 数 , i n 为 各 组 例 数 , N 为 总 例 数 , 2 i S 为 各 组 方 差 。 统 计 量 2 服 从 以 k - 1 为 自 由 度 的 2 分 布 。 若 P 值 较 小 , 则 拒 绝 H 0 , 认 为 方 差 不 齐 ; 否 则 , 可 认 为 方 差 齐 同 。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!