资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,如某种农作物的收获量受作物品种、,肥料种类及数量等的影响;选择不同,的品种、,肥料种类及数量进行试验,,日常生活中经常发现,影响一个事物的因素很多,希望找到影响最显著的因素,1,看哪一个影响大?并需要知道,起显著作用的因素在什么时候,起最好的影响作用。,方差分析就是解决这些问题的,一种有效方法。,2,因素(因子)可以控制的试验条件,因素的水平 因素所处的状态或等级,单(双)因素方差分析讨论一个(两个)因素对试验结果有没有显著影响。,第一节 概述,3,例如:某厂对某种晴棉漂白工艺中酸液浓度(g/k)进行试验,以观察酸液浓度对汗布冲击强力有无显著影响。,序号,冲击强力,浓度,1 2 3 4 5 6,A1 16.2 15.1 15.8 14.8 17.1 15.0,A2 16.8 17.5 17.1 15.9 18.4 17.7,A3 19.0 20.1 18.9 18.2 20.5 19.7,方差分析就是把总的,试验数据的波动分成,1,、反映,因素水平,改变引起的波动。,2、反映,随机因素,所引起的波动。,然后加以比较进行统,计判断,得出结论。,4,方差分析的基本思想:把全部数据关于总均值的离差平方和分解成几部分,每一部分表示某因素诸水平交互作用所产生的效应,将各部分均方与误差均方相比较,从而确认或否认某些因素或交互作用的重要性。,用公式概括为:,总变异=组间变异+组内变异,各因素引起,由个体差异引起(误差),种类:,常用方差分析法有以下4种,1、完全随机设计资料的方差分析(单因素方差分析),2、随机区组设计资料的方差分析(二因素方差分析),3、拉丁方设计资料的方差分析(三因素方差分析),4、R*C析因设计资料的方差分析(有交互因素方差分析),5,第二节 单因素方差分析,一、假设检验,设:A1、A2、A3、为三个总体X1、X2、X3,每个总体有6个样本Xi1、Xi2、Xi6(i=1,2,3 )。,注:要判断酸液浓度的3种水平对汗布的冲击强力是否有显著影响,实质上就是检验3种不同水平所对应的3个总体是否有显著差异的问题。即检验3个总体数学期望是否相等。,以后就是求解问题,为了说明一般解的公式(方法),如下作一般分析。,6,一般形式:,序号,结果,水平,1 2 n,A1 X11 X12 X1n,A2 X21 X22 X2n,A3 Xm1 Xm2 Xmn,。,假定:数据满足正态性、独立性、方差齐性。(进行方差分析的条件),要检验因素A对指标是否显著影响,就是检验假设:,H0:,1=2=m,接受H0:即认为来自同一总体,差异由随机因素所造成。,若拒绝H0:表明它们之间差异显著,差异有因素水平的改变所引起。,做法:为了检验假设H0,要从总的误差中将系统误差和随机误差分开。,7,二、离差平方和的分解与显著检验,记:,将Q进行分解:,由于,8,故:,下面通过比较QE和QA来检验假设H0。,在假设H0成立的条件下,可以证明:,相互独立,9,方法:(检验方法),(1)当H0:,1=2=m 成立时。,(2)统计量:,即:,10,(3),给定显著性水平 ,查表得临界值,(4)由样本观察值计算出F,(5)若F ,则拒绝H0。(说明因素A各水平间有显著性差异),(6)若F ,则接受H0。(说明因素A各水平间无显著性差异),三、计算的简化,1、对Q、QE、QA计算简化。(给出一个简化的计算公式和数据简化的方法),令:,11,同样可推出:,2、,数据的简化:,试验数据经过变换,数据简化后对F值的计算没有影响,不会影响检验的结果,四、方差分析表,方差来源 离差平方和 自由度 F值 F0.05 F0.01 显著性,因素A QA m-1,试验误差 QE m(n-1),总误差 Q mn-1,12,例:前例题,1、对数据的简化,得下表:,序号,冲击强力,浓度,1 2 3 4 5 6,A1 -8 -19 -12 -22 1 -20 -80 1454,A2 -2 5 1 -11 14 7 14 396,A3 20 31 19 12 35 27 144 3820,由表中数据可算出,13,计算,计算出F值:,14,方差来源 离差平方和 自由度 F值 F0.05 F0.01 显著性,因素A 4217.3 2 28.38 3.68 6.38 *(十分显著),试验误差 1114.7 15,总误差 5332 17,列表:,说明:,说明酸液浓度对汗布冲击强力有十分显著的影响。,15,五、各水平下试验次数不等时的方差分析,设第 i个水平试验次数为ni,则有,自由度分别为f=n-1,fE=n-m,fA=m-1.检验统计量为,式中:,16,第三节 双因素方差分析,例如:某厂对生产的高速钢铣刀进行淬火工艺试验,考察回火温度A和淬火温度B两个因素对强度的影响。今对两个因素各3个水平进行试验,得平均硬度见表:,Bj,Ai,试验结果,B1(1210C)B2(1235C)B3(1250C),A1(280C)64 66 68,A2(300C)66 68 67,A3(320C)65 67 68,假设:美中不足组合水平下服从正态分布、互相独立、方差相等。,所需要解决的问题是:所有Xij的均值是否相等。,17,假设检验:,1)在假设H0成立的条件下。,2)统计量,3)给定显著水平 ,查表得临界值,4)由样本观察值计算FA、FB,5)若 时,接受H0,因素的影响不显著。,若 时,拒绝H0。,对因素B同理说明。,18,方差分析表:,方差来源 离差平方和 自由度 F值 F0.05(2,4)F0.01(2,4)显著性,因素A 1.56 2 FA=1.01 6.94 18.0,因素B 11.56 2 FB=7.46 6.94 18.0 *,试验误差 3.1 4,总误差 16.22 8,A影响不显著。,B影响显著,由于,高速钢洗刀的硬度越大越好,因此因素B可取B3水平,即淬火温度1250C为好,因素A水平的确定,应考虑经济方便,取A1水平为好。,19,SAS系统中区分两种情况:,1、每组观测数据相等,可用ANOVA过程处理以上四种情形的方差分析。,2、若每组观测数据不相等,可用GLM过程处理以上四种情形的方差分析。,20,均衡数据的方差分析(ANOVA过程),过程说明:,1、PROC ANOVA;,2、CLASS 变量表;,3、MODEL 因变量表=效应;,4、MEANS 效应/选择项;,5、ALPHA=p 显著性水平(缺省值为0.05),CLASS和MODEL是必需的,,CLASS必须的MODEL之前。,可以是数值型和字符型,是指因变量与自变量效应,模型如下:,1、主效应模型 MODEL y=a b c;(a b c是主效应,y是因变量),2、交互模型 MODEL y=a b c a*b a*c b*c a*b*c;,3、嵌套效应 MODEL y=a b c(a b);,4、混合效应模型号 MODEL y=a b(a)c(a)b*c(a);,输出因变量均数,对主效应均数间的检验。,21,例:,1、单因素方差分析,某劳动卫生组织研究棉布、府绸、的确凉、尼龙四种衣料内棉花吸附十硼氢量。每种衣料做五次测量,所得数据如下。试检验各种衣料见棉花吸附十硼氢量有没有显著差别?,棉布 府绸 的确凉 尼龙,2.33 2.48 3.06 4.00,2.00 2.34 3.06 5.13,2.93 2.68 3.00 4.61,2.73 2.34 2.66 2.80,2.33 2.22 3.06 3.60,22,单因素方差分析SAS程序的输入:,循环语句,删除变量,CLASS和MODEL语句是必需的,CLASS必须出现在MODEL语句前。,23,组间占总的比例,单因素方差分析SAS程序输出结果:,结论:,在CLASS语句中指出的P值。P0.003,可得出各衣料组间有非常显著差异。,24,2、两因素方差分析,例:用4种不同方法治疗8名病者,其血浆凝固时间的资料如表,,试分析影响血浆凝固的因素。,受试者编号(区组),处理组,1 2 3 4,8.4 9.4 9.8 12.2,12.8 15.2 12.9 14.4,9.6 9.1 11.2 9.8,9.8 8.8 9.9 12.0,8.4 8.2 8.5,8.5,8.6 9.9 9.8 10.9,8.9 9.0 9.2 10.4,7.9 8.1 8.2 10.0,25,两因素方差分析SAS程序的输入:,26,两因素方差分析SAS程序输出结果:,结论:总误差:F=14.04,P0.0001,故总体有非常显著差异。,A因素:F=6.62,P0.0025,故认为因素A(治疗方法)对血浆凝固时间影响很大。,B因素:F=17.2,P0.0001,故认为因素B(不同病者)对血浆凝固时间影响很大。,27,3、三因素方差分析(交互作用不存在),例:五种防护服,由五人各在不同的五天中穿着测定脉搏数,如表。,试比较五种防护服对脉搏数有无不同。,试验日期,受试者,甲 乙 丙 丁 戊,A129.8 B116.2 C114.8 D104.0 E100.6,B144.4 C119.2 D113.2 E132.8 A115.2,C143.0 D118.0 E115.8 A123.0 B103.8,D133.4 E110.8 A114.0 B 98.0 C110.6,E142.8 A110.6 B105.8 C120.0 D109.8,28,三因素方差分析SAS程序的输入:,29,三因素方差分析SAS程序输出结果:,结论:,因F=6.80,P0.0011,故总体有非常显著差异。,其中K因素影响极大F=16.27,P0.001。,因素P、C都无显著差异。,30,4、有交互因素的方差分析,例:治疗缺铁性贫血病人12例,分为4组给予不同治疗,一个月后观察红细胞增加(百万/mm),资料如表。试分析两种药物对红细胞增加的影响。,甲药(A),不用(A0)用(A1),乙药(B),不用B0,用 B1,0.8 0.9 0.7 1.3 1.2 1.1,0.9 1.1 1.0 2.1 2.2 2.0,31,有交互因素方差分析SAS程序的输入:,32,有交互因素方差分析SAS程序输出结果:,结论:,因F=98.75,P=0.00010.01,故总体有非常显著的差异,,因素A、B、A*B都对红细胞增加数有非常大的影响。,33,非平衡数据的方差分析(GLM过程),在SAS/STAT中GLM(General Linear Models)过程分析功能最多。包括:,1、简单回归(一元),2、加权回归,3、多重回归及多元回归,4、多项式回归,5、方差分析(尤其不平衡分析),6、偏相关分析,7、协方差分析,8、多元方差分析,9、反应面模型分析,10、重复测量方差分析,34,GLM过程在方差分析中的应用:,MODEL语句反映因变量与自变量的模型,其形式:,模型说明 模型类型,MODEL Y=A B;主效应,ODEL Y=A B A*B;交互效应,MODEL Y=A B A(B);嵌套效应,ODEL Y1 Y2=A B;多元方差分析,MODEL Y=A X;协方差分析,,是分类变量,是连续型变量。,35,、不平衡单因素方差分析,例:健康男子各年龄组淋巴细胞转化率()如表,问各组淋巴细胞转化率的均数之间的差异是否显著?,健康男子各年龄组淋巴细胞转化率(),11-20岁58 61 61 62 63 68 70 70 74 78,41-50岁54 57 57 58 60 60 63 64 66,61-75岁 43 52 55 56 60,36,不平衡单因素方差分析SAS程序的输入:,37,不平衡单因素方差分析SAS程序输出结果:,38,2、不平衡二因素方差别分析,假设如下数据作二因素方差分析,因素,b1 b2 b3,因素,a1,a2,3.3 2.6 1.5 3.6 3.1 1.9 0.8 1.6 3.2 2.6 5.2 4.7,2.2 1.3 4.2 4.3 5.3 2.8
展开阅读全文