医学统计学及其软件包.ppt

上传人:za****8 文档编号:13198208 上传时间:2020-06-07 格式:PPT 页数:72 大小:219.56KB
返回 下载 相关 举报
医学统计学及其软件包.ppt_第1页
第1页 / 共72页
医学统计学及其软件包.ppt_第2页
第2页 / 共72页
医学统计学及其软件包.ppt_第3页
第3页 / 共72页
点击查看更多>>
资源描述
医学统计学及其软件包,第五章方差分析,上海第二医科大学生物统计教研室,第一节概论,方差分析(AnalysisofVariance,简记为:ANOVA)的应用范围很广,本章的方差分析主要用于检验计量资料中两个或两个以上均数间差别显著性的方法。以一个实例说明方差分析的基本思想和原理。,第二节单因素方差分析(one-wayANOVA,completelyrandomdesignANOVA),例5.1小白鼠给药前后发生咳嗽的推迟时间(秒)复方复方可待因40506015-1030-510577。例数151510均值31.674460.7,常见的错误是进行三组之间的两两t检验。这将增加第一类误差的概率。如两组比较作一次t检验取=0.05;三组之间的两两t检验作三次t检验,至少有一次拒绝H0的概率为0.14。五组之间的两两t检验作十次t检验,至少有一次拒绝H0的概率为0.40。两组以上均数的比较不能用两两t检验,而必须用方差分析。,要比较三种药物的平均推迟咳嗽时间有否差异?,总体1N(1,12)样本1(n1,S1)总体2N(2,22)样本2(n2,S2)总体3N(3,32)样本3(n3,S3)已知:12=22=32,不相等问:1=2=3??1,2,3不相等,方差分析法的模型,方差分析法的基本思想,组间变异(不同药物引起,包含误差)总变异组内变异(误差引起)如不同药物的作用相同,并且无抽样误差,则:F=组间变异/组内变异=1由于抽样误差,F不等于1,但和1相差不大,F越大概率越小,如概率P0.05,则可认为不同药物的作用是不相同的。即样本均数之间的差异有统计学意义。,总变异,组内变异,组间变异,方差分析法的基本思想为:根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分为相应的各个部分,各部分的离均差平方和除以相应自由度得出各个均方,然后列出方差分析表算出F值,作出统计推断。,方差分析法的基本思想,方差分析法的基本思想,H0:1=2=3H1:至少有一个等式不成立或:H0:三种药物对小白鼠镇咳作用相同H1:三种药物镇咳作用不完全相同,方差分析法的基本思想,离均差平方和用SS表示,自由度用DF表示,均方(MEANSQUARE)用MS表示MS=SS/DF即方差。SS总=SS组间+SS组内DF总=DF组间+DF组内F=MS组间/MS组内=(SS组间/DF组间)/(SS组内/DF组内)根据F和DF组间,DF组内查方差分析用F界值表,得P值。如P0.05,拒绝H0。,方差分析法的基本思想,以上分解和检验可列成方差分析表的形式:方差分析表变异来源平方和自由度均方F值P值SourceSSDFMSFP总变异组间误差,方差分析法的基本思想,如果影响数据变异的因素不止一个,则可作二因素或三因素等的方差分析,总变异可分解成和各因素相对应的各个变异;这样,分解越细,误差越小,检验的效率就越高。,方差分析的基本要求,1.各组样本来自正态分布的总体。2.各总体的方差相等。3.各效应的可加性。如不符合基本要求时,可进行变量变换,变换成正态分布后再进行检验或用非参数检验的方法。,变量变换,1.服从对数正态分布的资料可用对数变换y=log(x)2.服从泊松分布的资料可用平方根变换y=3.表达成百分数的资料可用平方根反正弦变换y=arcsin,校正数,总平方和,组间平方和,方差分析基本步骤,组内平方和=总平方和组间平方和,DF总=N-1,DF组间=组数-1,DF组内=DF总-DF组间,方差分析表变异来源SSdfMSFP总变异31939.939药物间变异5062.466722531.23333.4845F0.05故知P3.46,故P0.05,而其余二个Q皆小于q0.05;因此复方与可待因两药对小白鼠平均推迟咳嗽时间,在=0.05水平上有显著差异,其余任两药间差异皆不显著。,均数间两两比较,进行均数间两两比较的方法很多:SNK(Student-Newman-Keuls)检验,DUNCAN检验,Tukey检验,LSD(最小显著差)检验,Scheffe检验,等。如只须几个实验组和一个对照组比较,实验组之间不比较:DUNNETT检验,DUNCAN新法,等,第四节方差齐性检验,H0:各个正态总体方差相等,即12=22=K2H1:至少存在一对i,j,有i2j2本书中介绍一种稳健的(Robust)方差齐性检验方法-Levene检验,它可以用于两个或两个以上方差的齐性检验。(1)对于K组的样本资料,求得各组的均数后计算观察值距各自组均数的绝对离差。(2)以绝对离差作为主要变量,使用前述的方差分析法。当拒绝H0时,认为各组方差不齐;当不拒绝H0时,认为方差齐性。,算得三个药物组:=31.6667,=44,=60.7,得绝对离差如下:复方复方可待因8.333360.721.66672430.7.18.333314再用上表中绝对离差值进行方差分析。,第四节方差齐性检验,第四节方差齐性检验,变异来源SSDFMSFP总变异9108.3939药物间679.562339.781.490.2382误差8428.8337227.80由于P=0.2382,因此不拒绝H0,而认为三组方差齐性,因此符合均数间比较的方差分析法的基本要求。,第五节随机单位组设计方差分析(randomizedblockdesignANOVA),随机单位组设计又称随机区组设计,随机配伍组设计,它是两样本配对试验的扩大。,单位组处理1处理2.处理k1X11X12X1k2X21X22X2k。bXb1Xb2Xbk,随机单位组设计方差分析,大白鼠注射不同剂量雌激素后的子宫重量(g)雌激素剂量(g/100g)大白鼠种系0.20.40.8A106116145B4268115C70111133D426387,随机单位组设计方差分析,欲比较因素的K个水平的各变量均值,同时控制另一个因素的作用。试验设计时,先将受试对象按其它控制因素性质相同或相近者组成单位组,每个单位组有K个受试对象,分别随机分配至因素的K个水平上。这时每个水平的受试对象不仅数量相同,而且性质亦相同或相近,就能缩小误差,提高实验效率。这样的设计可将单位组亦看作一个因素,就成为二个因素的设计,随机单位组设计方差分析,处理间变异组间总变异单位组间变异组内误差(误差)和单因素方差分析相比,误差减少了,检验效率提高了。,随机单位组设计方差分析,可作二个假设检验:(1)H0:因素各水平x的均值相同H1:因素中至少有二个水平的x均值不相同F1=MS因素/MS误差DF因素=K-1,DF误差=(bk-1)-(k-1)-(b-1)=bk-k-b+1(2)H0:各个单位组的x均值相同H1:至少有二个单位组的x均值不相同F2=MS单位组/MS误差DF单位组=b-1,DF误差=bk-k-b+1当欲进一步比较因素中任二个的水平x均值是否相同。可用本章第三节中均数间两两比较的检验。,大白鼠注射不同剂量雌激素后子宫重量,处理组:雌激素剂量,三水平(0.2,0.4,0.8)单位组:大白鼠种系,四水平(A,B,C,D),变异来源SSDFMSFP总1307511剂量间60742303733.540.01种系间6457.6732152.5623.770.05受试者间2853.674713.4116.270.05误差526.141243.84F0.05(4,12)=3.26,F0.01(4,12)=5.41,处理因素为药物,复方1,复方2,可待因,处理因素为药物不同浓度,控制因素为动物种系,单因素方差分析,单位组设计方差分析,拉丁方设计方差分析,防护服A、B、C、D、E,受试者甲、乙、丙、丁、戊,试验日期1、2、3、4、5,第七节析因设计的方差分析(factorialdesignANOVA),析因设计是一种多因素的交叉分组试验设计。例如:提取某蛋白质成分的研究中,蛋白质的提取量和温度,试剂浓度及PH值有关。温度分高,中,低三个水平;试剂浓度分0.1,0.2,0.3,0.4四个水平;PH值分6和8二个水平。这三个因素的各水平相结合,共形成342=24种处理组;各种处理组各有数例,这样的试验叫析因设计。由于进行了交叉设计,同时每组又有重复,因此可检验各因素间的交互作用(interaction)。上述试验也可称为342析因试验设计。重复数可以相等也可以不相等,一般地说,重复数相等时,效率最高。,第七节析因设计的方差分析,最简单的析因设计是22析因设计。有二个因素,每个因素分二个水平。因素A:分A1和A2二个水平;因素B:分B1和B2二个水平;分四个处理组:A1B1,A1B2,A2B1和A2B2。每个处理组做若干次试验。,第七节析因设计的方差分析,例5.4某研究所对甲、乙两药的降胆固醇作用进行研究,将甲药视作为因素,下有二个水平,水平1为不加甲药,水平2为加甲药。乙药为因素,水平1为不加乙药,水平2为加乙药。构成了22=4个水平组合,试验中将12个高胆固醇病人随机分为四组,每组3例,进行治疗,观察胆固醇的下降值。本试验为22析因试验设计,重复数为3。,22析因设计试验结果因素(乙药)因素(甲药)水平1(不加)水平2(加)水平10.4160.728(不加)0.6500.8060.4680.598水平21.4561.664(加)1.1442.0281.0922.080,第七节析因设计的方差分析,交互作用,当二个因素的作用相互独立时,称这二个因素无交互影响;当二个因素的作用不独立,而相互有影响时,称这二个因素有交互影响。当存在交互影响时表示一个因素各水平间的差异随着另一个因素的水平改变而不同;当不存在交互影响时,则各个因素独立,即一个因素水平改变时不影响另一个因素的各水平之效应。因素A和因素B的交互作用记为AB。交互作用:几个因素联合作用不等于这几个因素单独作用的累加(有的情况是相乘),称这几个因素间存在交互作用,否则称为不存在交互作用或称为这几个因素相互独立。,第七节析因设计的方差分析,因素1引起的变异(甲药)因素2引起的变异(乙药)总变异因素1和因素2的交互作用引起的变异误差可作三个假设检验。,第七节析因设计的方差分析,(1)H0:因素的各水平的胆固醇的平均降低值相同;H1:因素的各水平的胆固醇的平均降低值不相同;(2)H0:因素的各水平的胆固醇平均降低值相同;H1:因素的各水平的胆固醇平均降低值不相同;(3)H0:因素的各水平的胆固醇平均下降值的差异,独立于因素,或者因素的各水平的胆固醇平均下降值的差异独立于因素;H1:两者不独立。第(3)个假设就是检验两个因素的交互影响。,第七节析因设计的方差分析,例5.4的方差分析表变异来源SSDFMSFP总变异3.814611因素2.801412.801496.26800.01因素0.597610.597620.53610.010.181310.18316.2921累加:有协同作用联合作用累加:有桔抗作用联合作用=累加:无交互作用本例有协同作用。,第八节方差分析的SAS程序,可用于各种方差分析的SAS过程较多,常用的有二个过程:ANOVA过程:只用于单因素方差分析及各种平衡设计资料(即各组例数相等)的方差分析。GLM(generallinearmodel)过程:用于各种试验设计的方差分析和协方差分析。GLM过程可完全替代ANOVA过程的作用,并且语句相同。,第九节平衡不完全单位组设计方差分析(balancedincompleteblockdesignANOVA),在随机单位组设计中有时处理组的水平数太多,大于单位组中的个体数,这时就可以有计划地安排每个单位组中的处理,使全部试验中每种处理的重复数相同,每两种处理同时出现在同一单位组中的次数相同,这就是平衡不完全单位组设计的方法。对于一个具体设计,欲用本方法时需查有关的书籍,作出实验安排。,第九节平衡不完全单位组设计方差分析,要比较9种饲料的作用,用同一窝的白鼠作为单位组。如用随机单位组设计,则每一窝都要有9个白鼠。但实际上做不到每一窝9个白鼠,只能做到每一窝4个白鼠。这时可选用平衡不完全单位组设计。本例处理组的水平数为9,每各单位组中实验单位数为4,可从有关专著中查到设计格式,以达到使全部试验中每种处理的重复数相同,每两种处理同时出现在同一单位组中的次数相同。根据设计格式安排试验,得到结果,再进行统计分析。,单位组(窝)处理16(2.6)4(9.7)3(5.4)5(6.9)26(5.9)7(2.6)9(5.9)2(6.3)31(7.0)6(5.6)9(5.9)3(3.3)49(2.4)4(5.0)7(3.0)6(2.4)59(5.0)8(7.4)5(10.3)3(9.4)64(10.1)1(9.7)6(5.7)8(7.5)72(3.9)4(5.1)5(6.4)9(6.3)88(5.0)6(6.1)7(5.4)3(3.3)92(2.8)6(2.6)5(2.8)8(3.3)102(5.7)8(9.3)3(5.4)9(6.1)112(5.7)7(6.6)1(5.5)8(5.3)121(3.0)8(1.4)9(5.2)4(2.8)133(7.5)7(2.2)5(2.6)1(5.4)143(3.7)1(5.2)4(2.4)2(2.4)159(3.0)7(2.6)1(5.7)5(2.4)164(5.5)2(6.0)7(5.6)3(3.3)177(2.6)5(5.9)4(6.0)8(5.6)182(7.3)5(5.4)6(5.7)1(5.4),第十节正交试验设计方差分析(orthogonalexperimentdesignANOVA),正交试验是一种高效,快速的多因素试验方法,能同时对多个因素,多个水平进行比较。正交试验利用一套规格化的正交表,使每次试验的因素,水平得到最合理的安排,所以能以较少的试验次数提供因素,交互影响等有关信息,作出统计推断。通过试验常能找出最佳实验条件,最好的生产条件,最合适的配料方案等。,第十节正交试验设计方差分析,正交试验设计方差分析的一般步骤为:(1)确定所研究的因素和水平;(2)选择合适的正交表,安排试验;(3)通过试验获得数据;(4)对试验结果用方差分析方法作出统计推断。,第十节正交试验设计方差分析,例5.6过氧乙酸是广泛应用的一种杀灭病毒性肝炎病毒的主要消毒剂,但其有效成分极不稳定,以致影响其消毒效果,现对下列四个因素,每个因素2个水平进行研究,由放置24个小时后过氧乙酸残存量(mg/3ml),分析哪些为主要影响因素。A:稳定剂,水平1:加磷酸0.3%;水平2:不加磷酸;B:水浴温度,水平1:25-30;水平2:35-40;C:浸泡口表,水平1:浸泡口表10支;水平2:不浸口表;D:加盖与否,水平1:加盖;水平2:不加盖。,第十节正交试验设计方差分析,选用L8(27)正交表:试验号12345671111111121112222312211224122221152121212621221217221122182212112,第十节正交试验设计方差分析,二列间交互影响:列1234567132547621674537654412353261,第十节正交试验设计方差分析,选择适当的正交表后,需先作表头设计;即哪一列安排哪个因素,哪一列为交互影响?必须剩下至少一列为误差项。本例可安排如下:列号1234567因素ABABCACBCDCDBDAD如需考虑6个一级交互影响,则L8(27)正交表太小,要选更大的正交表。这里只考虑2个交互影响:AB和AD。选用L8(27)作如下表头设计列号1234567因素ABABCADD,第十节正交试验设计方差分析,据L8(27)中的1,2,4,7列所示的因素水平进行试验得:试验号A(1)B(2)C(5)D(7)残存量111117.004.11211226.053.50312121.100.80412211.900.96521122.401.65621214.001.50722110.350.30822220.300.90,第十一节协方差分析(analysisofcovariance),在各种试验设计中,对主要变量(dependentvariable)Y研究时,常希望其他可能影响Y的变量保持基本一致,以达到均衡可比。例如:比较几种药物的降压作用,各试验组在原始血压、性别、年龄等指标应无显著差异。,第十一节协方差分析,有时这些变量不能控制,须在统计分析时,通过一定方法来消除这些变量的影响后,再对主要变量y作出统计推断。如果所控制的变量是分类变量时,可用多因素的方差分析;当要控制的变量是连续型变量时,可用协方差分析。,称这些影响变量为协变量(Covariate),消除协变量的影响后,或将协变量化成相等后,对y的修正均数所作的方差分析称为协方差分析。例如:比较几种不同饲料对动物体重增加的作用,可把动物的进食量作为协变量。比较大学生和运动员的肺活量时,可把身高作为协变量。比较治疗后二组舒张压的大小,可把治疗前的舒张压作为协变量。,第十一节协方差分析,第十一节协方差分析,协方差分析的基本原理:协方差分析是把直线回归和方差分析结合起来的一种统计分析方法。当不同处理结果的y值还受协变量x的影响时,先找出y与x的直线关系,求出把x值化为相等后y的修正均数,然后进行比较,这样就能消除x对y的影响,更恰当地评价各种处理的作用。,雌雄两组羔羊体重增加情况比较,协方差分析步骤:(1)各处理组分别拟合直线回归方程,第十一节协方差分析,(2)比较各处理组的斜率,求公共回归系数。公共回归系数bc=0.1938,第十一节协方差分析,(3)求各组回归方程的截距a,用公式,(4)得到各组回归方程,第十一节协方差分析,(5)从y中将x的影响扣除,(即把x化成相等后,对于y的修正均数进行方差分析),第十一节协方差分析,协方差分析三个重要的假设:1.各组样本来自正态总体,且方差齐性。2.总体回归系数不等于0。3.各组的总体回归系数相等。协变量总变异处理误差,第十一节协方差分析,各种试验设计,如:完全随机化设计,随机区组设计,拉丁方设计,析因设计,平衡不完全单位组设计,正交试验设计等,都可以带有协变量,而且可以不止一个。SAS软件能对其作协方差分析,首先逐一作所列协变量是否对Y有影响的显著性检验,然后按设计方案,扣除协变量的影响后,对主要变量Y的修正均数作比较,得出统计结论。也可进一步比较任两个修正均数。,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!