【医学统计学】多个样本均数比较的方差分析

上传人:ra****d 文档编号:244185107 上传时间:2024-10-03 格式:PPT 页数:117 大小:695KB
返回 下载 相关 举报
【医学统计学】多个样本均数比较的方差分析_第1页
第1页 / 共117页
【医学统计学】多个样本均数比较的方差分析_第2页
第2页 / 共117页
【医学统计学】多个样本均数比较的方差分析_第3页
第3页 / 共117页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,2024/10/3,医学统计学供研究生用,1,第四章 多个样本均数比较的方差分析,Analysis of variance,ANOVA,2,方差分析,方差分析的根本思想,完全随机设计的单因素,随机区组设计的两因素方差分析,交叉设计的方差分析,多个样本均数间的多重比较,3,第一节 方差分析的根本思想,用途:检验3组及以上总体均数是否相等。,通过分析处理组均数之间的差异,推论它们所代表的k个总体均数间是否存在差异,或k个处理组间的差异是否具有统计学意义。,4,总变异,=,组间变异,+,组内变异,表 糖尿病患者、,IGT,异常及正常人的,载脂蛋白测定结果,糖尿病,IGT,正常人,85.70,96.00,144.00,105.20,124.50,117.00,111.00,99.00,159.00,106.50,120.00,115.00,均数,105.45(11),102.39(9),122.80(10),5,全部实验结果存在三种不同的变异,总变异,:全部实验数据大小不等。变异的大小用观察值与总均数的离均差平方和表示,记为,SS,总,组间变异:,各处理组的样本均数也大小不等,变异的大小用各组均数与总体均数的离均差平方和表示,记为,SS,组间,。,组内变异:,各处理组内部观察值也大小不等,可用各处理组内部每个观察值与组均数的离均差平方和表示。记为,SS,组内,。,6,总变异,=,组间变异,+,组内变异,总变异:,组间变异:,组内变异,:,总,=N-1 ,组间,=k-1 ,组内,=N-k,7,F= MS,组间,/ MS,组内,如果:各样本均数来自同一总体0: m1=m2 =mk,即各组均数之间无差异。,那么:组间变异与组内变异均只能反映随机误差,此时:F 值应接近1。,反之,假设各样本均数不是来自同一总体,组间变异应较大, F 值将明显大于1,那么不能认为组间的变异仅反映随机误差,也就是认为处理因素有作用。,8,F,值要到多大才有统计学意义呢?,在各样本来自正态总体,各样本所来自的总体方差相等的假定之下,当,H,0,成立时,检验统计量,F,服从自由度,组间,=k-1,,,组内,=,N-k,的,F,分布,表示为,:,F,F,(,组间,组内,),可由,F,界值表查出在某一, 水准下,F,分布的单尾界值,F,。当,F,。,F,9,方差分析的根本思想,根据资料的设计类型,将全部观察值总的离均差平方和及自由度分解为两个或多个局部,,除随机误差如SS组内外,其余每个局部的变异如SS组间可由某个因素的作用或某几个因素的交互作用,如A因素B因素加以解释。,通过比较不同变异来源的均方,借助F分布作出统计推断,从而了解该因素对观测指标有无影响。,10,方差分析对数据的根本假设方差分析的应用条件,任何两个观察值之间均不相关,每一水平下的观察值均来自正态总体,各总体方差相等,即方差齐性homogeneity of variance,11,第二节 完全随机设计资料的单因素方差分析,在实验研究中,将受试对象随机分配到一个研究因素的多个水平中去,然后观察实验效应。,在观察研究中,按某个因素的不同水平分组,比较该因素的效应。如比较糖尿病患者,IGT异常和正常人的载脂蛋白有无差异人群这个研究因素分为3个水平。,如将30名乙型脑炎患者随机分为三组,分别用单克隆抗体、胸腺肽和利巴韦林三种药物治疗药物这个研究因素分为3个水平,观察治疗后的退热时间。,12,一、完全随机设计,如何随机分组? 如欲将24只小白鼠随机分为3组。,方法如下:,首先,将小白鼠124编号,利用随机数字表附表15,p832,依次读取两位数作为一个随机数字录于编号下,,将全部随机数从小到大编序号,规定序号:18 甲组;916 乙组;1724为丙组,13,二、变异分解 :,例:某社区随机抽取了30名糖尿病患者11例,IGT异常9例和正常人10例进行载脂蛋白mg/dL测定,问三种人的载脂蛋白有无差异?,14,1.,完全随机设计方差分析中变异的分解,总变异,=,组间变异,+,组内变异,表,糖尿病患者、,IGT,异常及正常人的载脂蛋白测定结果,糖尿病,IGT,正常人,85.70,96.00,144.00,105.20,124.50,117.00,111.00,99.00,159.00,106.50,120.00,115.00,均数,105.45(11),102.39(9),122.80(10),15,2.,分析计算步骤,建立检验假设和确定检验水准,H,0,:,三种人载脂蛋白的总体均数相等,即,m,1,=,m,2,=,m,3,H,1,:,三种人载脂蛋白的总体均数不全相等,计算检验统计量,F,值,16,表 糖尿病患者、,IGT,异常及正常人的载脂蛋白测定结果,糖尿病,IGT,正常人,85.70,96.00,144.00,105.20,124.50,117.00,111.00,99.00,159.00,106.50,120.00,115.00,X,ij,1160,11,105.45,123509.5,912.5,9,102.39,96045.4,1228 3309.5,10 30,122.80 110.3,153420 372974.9,ni,X, X,ij,2,17,表 糖尿病患者、,IGT,异常及正常人的载脂蛋白测定结果,糖尿病,IGT,正常人,X,ij,1160,11,105.45,123509.5,912.5,9,102.39,96045.4,1228 3309.5,10 30,122.80 110.3,153420 372974.9,ni,X, X,ij,2,C2/30=365093 校正数,SS总365093=7881.87,SS组间=116022/9+12282/10-365093,SS组内= SS总- SS组间,18,表 完全随机设计资料的方差分析表,19,确定P值和作出推断结论,查附表3 F界值表 P710,1 = 2, 2 = 27,F0.05(2,27)=3.35, F0.01(2,27),本例F=5.85 F0.01(2,27) ,故。,可认为三种人的载脂蛋白不同。,方差分析计算表,变异来源,SS,MS,F,P,组间,2384.03,2,1192.01,5.85,0.05,区组间,2376.38,7,339.48,13.96,0.01,误差,340.54,14,24.32,总,2861.84,23,39,确定,P,值和作出推断结论:,F2,14,。尚不能认为三种营养素喂养的小白鼠体重增量有差异。,F7,14, 。可认为8个区组的小白鼠体重增量有差异,即遗传因素对小白鼠体重增量有影响但一般更关注处理组间差异的假设检验。,40,一般而言,随机区组设计较成组设计更容易检验出处理组间的差异,提高了研究效率。但不是在任何情况下都能提高研究效率。,区组效应是否具有统计学意义是 重要的,它说明区组的划分是否成功,即到达:区组内各实验单位很均匀,而不同区组内的实验单位具有很大差异。,如果区组效应无统计学意义,那么并不能提高研究效率,甚至会降低研究效率。,如果MS区组 MS误差,假设没有足够理由显示不同区组间的差异确有统计学意义,那么宁可不分区组。,41,SPSS,操作与结果解释,随机区组设计的两因素方差分析,42,二、随机区组设计的两因素方差分析,例题,在不同的室温下测定家兔的血糖浓度。室温分七组,家兔分四个种属,每一种属七只。问不同温度的血糖浓度有无差异及不同水平血糖浓度均数的变化趋势?,43,1.,建立,SPSS,数据工作表,家兔,种属,室温,5,10,15,20,25,30,35,130,110,82,82,110,120,140,120,130,110,83,100,140,160,150,140,100,110,120,120,160,120,100,74,82,100,110,130,44,1.,选用,SPSS,过程:,Analyze,General Linear Model,Univariate,45,在,Univariate,对话框,,将血糖浓度选入,Dependent Variable,栏,;,将室温选入,Fix factors,栏,;,将,家兔种属选入,Random factors,栏,46,单击,Model,按钮,47,选择,Custom,48,将室温和家兔种属选入Model栏,从下拉菜单项选择择Main effents(因不能分析交互作用)。单击Continue返回。,49,3. SPSS,结果解释:,50,经随机区组设计的两因素方差分析:,不同室温血糖浓度的差异有统计学意义,不同家兔种属血糖浓度的差异也有统计学意义,51,第四节交叉设计资料的方差分析,在医学研究中,将A、B两种处理先后施加于同一批受试对象,先随机的将一半的受试对象接受A后接受B,而另外一半那么相反,先接受B再接受A,将两种处理因素在全部试验过程中交叉进行,故称之为交叉设计crossover design。,52,交叉设计,是一种特殊的自身对照设计,克服了试验前后自身对照由于观察期间各种非试验因素对试验结果的影响所造成的偏移。,53,交叉设计的优点:,1.,节约样本含量,2.,控制了时间因素以及个体差异对处理方式的影响,3.,每一个试验对象同时接受试验因素和对照,从医德的观点出发,均等考虑了每一个患者的利益,54,交叉设计的缺点:,不允许有病人失访,否那么会造成该个体已有的数据完全浪费,不适用于病程较短的急性病治疗效果的研究,55,交叉设计的限制条件,前一个试验阶段的处理效应不能持续作用到下一个试验阶段,洗脱时间washout time:目的是消除残留效应carry-over effect,56,例题,为了研究12名高血压病人用A、B两种治疗方案疗效的差异,随机的让其中6名病人先以A法治疗,后以B法治疗,而另外一半的6名病人那么先用B法,后用A法,记录治疗后血压的下降值KPa,请分析A、B两方案疗效有无差异。,57,二阶段交叉设计变异的来源:,1.处理药物效应,2.阶段效应,3.顺序效应和个体差异,其中处理效应是希望研究的因素,而顺序效应那么在目前常用的统计分析中被忽略,因为这是交叉设计能够实施的前提条件。,保证顺序效应忽略的方法,就是消除残留效应。,4.误差,58,例:,12,例高血压病人交叉设计资料,阶段,1,2,3,4,5,6,7,8,9,10,11,12,I,B,B,A,B,A,A,A,A,B,B,B,A,3.07,1.33,4.44,1.87,3.20,3.73,4.13,1.07,1.07,2.27,3.47,2.40,II,A,A,B,A,B,B,B,B,A,A,A,B,2.80,1.47,3.73,3.60,2.67,1.60,2.67,1.73,1.47,1.87,3.47,1.73,59,第五节 拉丁方设计latin square design,拉丁方设计是将三个因素一个处理因素两个控制因素按水平数r排列成一个rr的随机方阵。如33、44拉丁方。,60,常用拉丁方表,A,B,C,C,A,B,B,C,A,A,B,C,D,B,A,D,C,C,D,B,A,D,C,A,B,将两个控制因素分别安排在拉丁方设计的行和列上,需对根本拉丁方表作行列变换。,61,拉丁方设计的优点:,与随机区组相比较,可以多安排一个控制因素,,增加了均衡性,减少了误差,提高了效率。,62,例,4-5,比较A、B、C、D、E、F 6种药物给家兔注射后产生的皮肤疱疹大小mm2,研究者选用6只家兔、并在每只家兔的6个不同部位进行注射。 试验结果见下表,试做拉丁方设计和方差分析。,63,家兔编号,(行区组),注射部位编号(列区组),1,2,3,4,5,6,1,A(73),B(75),C(67),E(61),D(69),F(79),2,B(83),A(81),E(99),F(82),C(85),D(87),3,E(73),D(60),F(73),C(77),B(68),A(74),4,F(58),C(64),B(64),D(71),A(77),E(74),5,C(64),F(62),D(64),A(81),E(85),B(71),6,D(77),E(75),A(73),B(59),F(85),C(82),拉丁方设计与试验结果皮肤疱疹大小,mm2,拉丁方设计与随机区组区别,64,拉丁方设计变异的来源:,1.,处理组变异,2.,行区组变异,3.,列区组变异,4.,误差,其中处理效应是希望研究的因素。,65,第四节多个样本均数间的多重比较 multiple comparison,概念,无效假设的两种情况,常用方法,66,一、概念,指出哪几组均数之间的差异具有或不具有统计学意义。,当比照组数大于2时,为什么不能用t检验?因为会增加第一类错误的概率,使本来无无差异的两总体均数判为有差异。,如有5个样本均数,可作10次t检验。每次不犯第一类错误的概率为1-。每次比较均不犯第一类错误的概率仅为10,每次犯第一类错误的概率为1-0.5987=,明显增加了犯第一类错误的概率。,67,二、无效假设的两种情况,检验某几个特定总体均数是否相等,其无效假设称为局部无效假设。,比方:多个处理组与对照组比较;,处理后不同时间与处理前比较;,几个特定的处理组间比较,检验全部k个总体均数是否相等,其无效假设称为完全无效假设。,比方一般涉及到每两个均数的两两比较。,68,三、,常用方法,Bonferroni,Tukey,Dunnett-t检验,Tamhanes T2,LSD-t 检验least significant difference,SNK- q检验Student-Newman-Keuls,69,SPSS统计软件中的两两比较方法,70,1. LSD-t,检验,Least significant difference t test,最小有意义差异,比较k组中一对或几对在专业上有特殊意义的均数差值的总体均数是否为“0;,71,LSD-t,检验公式,以误差自由度误差或组内和检验水准查t界值表,缺点:没有调整多重比较的检验水准,比较的次数愈多,犯I类错误的可能性愈大。,72,2. Dunnett-t,k1个实验组与一个对照组均数差异的多重比较。,根据算得的t值,误差自由度误差 ,试验组数k-1,以及检验水准查Dunnett-t 界值表,作出推断结论。,73,3. SNK,-,q,检验,Student-Newman-Keuls,q检验,一般在方差分析结果拒绝H0时,再用q检验进行多重比较,缺点:没有调整多重比较的检验水准,比较的次数愈多,犯I类错误的可能性愈大。,74,4. Bonferroni,样本组数不宜过多,样本数一般4,这时的检验效率高于Tukey法。,调整了多重比较时的检验水准:,= / 比较的总次数,,当计算所得的tt(,)时,那么以P 称所比较的两组均数的差异有统计学意义。,是SPSS统计软件推荐的方法,75,5. Tukey,当比较的样本数大于 5时,检验效率高于Bonferroni。当样本数为5时,要作10次两两比较;当样本数为6时,要作15次两两比较,调整了多重比较时的检验水准,是SPSS统计软件推荐的方法,76,Bonferroni and Tukey,The Bonferroni and Tukey,s,honestly significant difference tests are,commonly used multiple comparison tests.,77,Bonferroni,For a small number of pairs, Bonferroni is more powerful.,78,Tukey,When testing a large number of pairs of means, Tukey,s,honestly significant difference test is more powerful than the Bonferroni test,.,79,容易得出有统计学意义结论的,依次为:,LSD最容易,SNK,Tukey,bonferroni 最不容易,80,6.方差不齐时的两两比较,Tamhanes T2法: Conservative pairwise comparisons test 保守的两两比较检验,I类错误小 based on a t test. This test is appropriate when the variances are unequal.,Dunnetts T3,GamesHow U,Dunnetts C,81,多个方差的齐性检验,Levene Test,A homogeneity-of-variance test that is less dependent on the assumption of normality than most tests. For each case, it computes the absolute difference between the value of that case and its cell mean and performs a one-way analysis of variance on those differences.,82,SPSS,操作与结果解释,方差分析,83,建立SPSS数据工作表g:分组1:糖尿病;2:IGT; 3:正常人X:载脂蛋白,表 糖尿病患者、,IGT,异常及正常人的载脂蛋白测定结果,糖尿病,IGT,正常人,85.70,96.00,144.00,105.20,124.50,117.00,111.00,99.00,159.00,106.50,120.00,115.00,均数,105.45(11),102.39(9),122.80(10),一、完全随机设计方差分析的,SPSS,84,2.,选用,SPSS,过程,85,One-way ANVOA,对话框,将,x,选入,Dependent List,栏,,g,选入,Factor,栏,86,单击,Post Hoc,按钮,87,选择,Bonferroni,,,单击,Continue,返回,88,选择,Descriptive,,,Homogeneity,单击,Continue,返回,89,单击,OK,按钮运行,ANOVA,过程,90,3. 结果解释 三组均数mg/dL依次为: 正常人122.80 、糖尿病患者 105.46 和IGT患者 102.39 。,91,经方差齐性检验,按,水准,还不能认为,3,个总体方差不等。,92,经完全随机设计的单因素方差分析,,F=5.85, P=0.008,可认为三种人的载脂蛋白不同。,93,经Bonferroni检验,正常人与糖尿病患者、正常人与IGT患者载脂蛋白的差异有统计学意义,94,二、随机区组设计的两因素方差分析,在不同的室温下测定家兔的血糖浓度。室温分七组,家兔分四个种属,每一种属七只。问不同温度的血糖浓度有无差异及不同水平血糖浓度均数的变化趋势?,家兔,种属,室温,5,10,15,20,25,30,35,130,110,82,82,110,120,140,120,130,110,83,100,140,160,150,140,100,110,120,120,160,120,100,74,82,100,110,130,95,1.,建立,SPSS,数据工作表,家兔,种属,室温,5,10,15,20,25,30,35,130,110,82,82,110,120,140,120,130,110,83,100,140,160,150,140,100,110,120,120,160,120,100,74,82,100,110,130,96,随机区组设计方差分析的,Spss,过程,Analyze General Lineal Model Univariate,Dependent list,:,血糖浓度,Fixed Factor,框,:,室温,Random Factor,框:,家兔种属,Model ,Custom,Build Terms,下拉:,Main effects,Model,框:,室温、家兔种属,OK,97,单击,Post Hoc,按钮,98,将变量:室温选入Post Hoc Tests for 栏,以便进行两两比较。由于组数多,选择Tukey进行两两比较。单击Continue 按钮返回,99,单击,OK,按钮,100,3. SPSS,结果解释:,Means,过程显示不同室温的均值:可见从,5,分钟,(130.0 mg%),到,20,分钟,(89.3 mg%),,血糖均值由高逐渐降低;从,20,分钟,(89.3 mg%),到,35,分钟,(147.5 mg%),,血糖均值由低逐渐升高。,101,3. SPSS,结果解释,102,经随机区组设计的两因素方差分析:,不同室温血糖浓度的差异有统计学意义,不同家兔种属血糖浓度的差异也有统计学意义,103,期望均方表可不看该结果,104,Tukey检验结果1,105,Tukey检验结果2,106,Tukey,法的均衡子集表,107,三、交叉设计方差分析的,SPSS,例,4-6,分析,A,、,B,两种闪烁液测定血浆中,3H-cGMP,的交叉试验结果。第,I,阶段,1,、,3,、,4,、,7,、,9,号用,A,测定,,2,、,5,、,6,、,8,、,10,号用,B,测定;第,II,阶段,1,、,3,、,4,、,7,、,9,号用,B,测定,,2,、,5,、,6,、,8,、,10,号用,A,测定。试对交叉试验结果进行方差分析。,108,1.,建立数据库,109,交叉设计方差分析的,Spss,过程,Analyze General Lineal Model Univariate,Dependent list,:,X,Fixed Factor,框,:,treat phase,Random Factor,框,person,Model Custom,Build Terms,下拉:,Main effects,Model,框:,treat,、,phase,、,person,OK,110,四、拉丁方设计方差分析的,SPSS,例4-5比较A、B、C、D、E、F 6种药物给家兔注射后产生的皮肤疱疹大小mm2,研究者选用6只家兔、并在每只家兔的6个不同部位进行注射, 试做拉丁方设计和方差分析。,111,1.,建立数据库,112,拉丁方设计方差分析的,Spss,过程,Analyze General Lineal Model Univariate,Dependent list,:,area,Fixed Factor,框,:,no,、,part,、,drug,Model Custom,Build Terms,下拉:,Main effects,Model,框:,no,、,part,、,drug,OK,113,方差分析要点,掌握方差分析的根本思想;方差分析变异的分解。,熟悉One-Way ANOVA过程和GLM- General Linear Model 过程的操作;并能对计算结果进行正确的分析包括两两比较的结果选择。,114,1,、完全随机设计的单因素方差分析,单因素方差分析的总变异分几局部?,F值是 与 的比值?,如各样本均数来自同一总体,那么F值理论上等于 。,假设各样本均数不是来自同一总体,那么 变异会增大,F值将明显 于1 。,115,2,、随机区组设计的两因素方差分析,随机区组设计的两因素方差分析的总变异分为几局部?由于从总变异中多别离出区组变异, 使误差更能反映随机误差的大小,因而提高了检验效率。,前提:区组效应具有统计学意义,116,3、多个样本均数每两个均数间的两两比较,多个样本均数每两个均数间的两两比较常用的统计方法是:Bonferroni(组数少),Tukey (组数多) ,Tamhanes T2(方差不齐,结论较保守) 。,多个实验组与一个对照组均数间的两两比较常用的统计方法是Dunnett - t 。,比较G组中某一对或几对在专业上有特殊意义的均数差值的总体均数是否为“0,较常用的统计方法是 LSD 。,117,作业 p6466,三、计算分析题,题1、2、3、4、5、6,如果差异有统计学意义,须作方差齐性检验,并进行多重比较。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 商业计划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!