资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,5,方差分析,5.1,方差分析基本原理,5.2,单因素方差分析,5.3,双因素,方差分析,某饮料生产企业研制出一种新型饮料,饮料的颜色:橘黄色、粉色、绿色和无色透明,饮料的营养含量、味道、价格、包装相同,收集该饮料的销售情况的超级市场地理位置相似、经营规模相仿,试分析饮料的颜色是否对销售量产生影响,超市,无色,粉色,橘黄色,绿色,1,2,3,4,5,26.5,28.7,25.1,29.1,27.2,31.2,28.3,30.8,27.9,29.6,27.9,25.1,28.5,24.2,26.5,30.8,29.6,32.4,31.7,32.8,四色饮料在五家超市的销售情况,设 为无色饮料的平均销量, 为粉色饮料的销量,,设,为橘黄色饮料,的平均,销量 为绿色,饮料的,销量。,则原问题转化为以下假设检验:,表示总体,X,的均值,,i,表示总体,A,i,的均值,,方案,i,的主效应,a,i,=,i,反映颜色,A,i,对销售量的影响,随机样本,X,ij,,可以视为各个方案的总体均值,i,与随机误差之和:,X,ij,=,i,+,ij,由于,X,ij,是来自,A,i,的观察值,于是有,X,ij,=,i,+,ij,=a,i,+ ,ij,(,i,=1,2,4;,j,=1,2,5),分析过程,分解总体离差平方和,总体销售量离差平方和,S,T,有两个来源,一是由水平不同造成的不同水平下平均销售量差异,S,A,一是由除了颜色之外的随机干扰造成的、同一水平下的销售量差异,S,E,其中,,m,表示因素,A,(颜色)的水平数,m=4,,,n,表示观测次数,n=5,假设每个水平下总体,A,i,的,服从正态分布,,各观测值,相互独立,,且,方差相等,,则上式子转化为:,总体离差的自由度分解,分析过程(续),将离差均方化,得均方和(为了具有可比性),MS,A,=S,A,/f,A,MS,E,=S,E,/f,E,比较,计算,F,值:,F=MS,A,/ MS,E,检验,所示看,F,统计量是否落在接受域还是拒绝域中,若,F,F,0.05,(,f,A,f,E,),,则无显著影响,记为,/,若,F,0.05,(,f,A,f,E,) ,F,F,0.01,(,f,A,f,E,),,则影响特别显著,记为*,单因素方差分析表,方差来源,离差平方和,自由度,均方和,F,值,检验结论,因素,A,随机干扰,E,总和,T,S,A,S,E,S,T,f,A,f,E,f,T,MS,A,MS,E,F=MS,A,/MS,E,销售量(箱),试验批号,各水平下平均,销售量,Xi,1,2,3,4,5,因素,(颜色),A,1,(粉色),26.5,28.7,25.1,29.1,27.2,27.32,A,2,(无色),31.2,28.3,30.8,27.9,29.6,29.56,A,3,(绿色),27.9,25.1,24.2,26.5,26.5,26.44,A,4,(桔色),30.8,29.6,32.4,32.8,32.8,31.46,总平均销量,28.695,方差来源,离差平方和,自由度,均方和,F,值,检验结论,因素,A,(颜色),随机干扰,E,总和,T,S,A,=76.85,S,E,=39.08,S,T,=115.93,f,A,=3,f,E,=16,f,T,=19,MS,A,=25.615,MS,E,=2.443,F=10.485,*,例,5.1,的单因素方差分析表,注:,F,0.05,(3,16)=3.24,F,0.01,(3,16)=5.29,由于,F,=10.458,F,0.01,(,f,A,f,E,),所以颜色对饮料销售量有特别显著影响,方差分析基本原理,方差分析的实质:检验多个总体均值是否有显著性差异(观测值变异原因的数量分析),将,k,个处理的观测值作为一个整体看待,,把观测值,总变异的平方和及自由度,分解为相应于,不同变异来源的平方和及自由度,,进而获得不同变异来源总体方差估计值,通过计算这些总体方差的估计值的比例,检验各样本所属总体平均数是否相等,方差分析基本概念,因素:,影响实验结果的条件,常用大写字母,A,、,B,、,C,、,等表示,单因素实验:当研究中只考察一个因素,双因素(多因素)实验:同时研究两个或两个以上的因素,因素水平,/,水平,:因素所处的某种特定状态或数量等级,用代表该因素的字母加添足标表示,如,A,1,、,A,2,、,,,B,1,、,B,2,、,处理,:事先设计好的实施在实验单位上的具体项目,在单因素实验中,,一,个处理就是实验因素的某一水平,在多因素实验中,实验因素的一个水平组合就是一个处理,方差分析中的基本假定,(,1,)每个总体都应服从正态分布(分布的正态性),(,2,)各组观察数据,是从具有相同方差的总体中抽取的,(,3,)观察值是独立的,例,5.1,数学成绩分析,40,名学生随机分成,5,个班,每个班的班主任负责不同科目,A,表示班主任教数学,B,表示班主任教语文,C,表示班主任教生物,D,表示班主任教地理,E,表示班主任教物理,用方差分析的方法检验,5,组不同班主任的学生数学成绩是否有显著差异,A,B,C,D,E,76,76,62,65,67,78,67,70,68,71,65,70,69,68,72,72,64,73,71,69,71,67,71,61,74,72,83,69,69,79,83,72,73,65,76,79,73,69,69,84,解题过程,建立假设,H,0,:,1,=,2,=,3,=,4,=,5,平方和,S,T,=1160.4,,,S,A,=314.4,S,E,=S,T,-S,A,=1160.4-314.4=864,自由度,f,A,=,?,,f,E,=,?,均方,MS,A,=S,A,/f,A,=314.4/4=78.6,MS,E,=S,E,/f,E,=846/35=24.17, F,检验,F=MS,A,/MS,E,=78.6/24.17=3.252,查,F,分布表,(,单侧,)F,0.05,(4,,,35)=2.64,,,FF,0.05,,,p0.05,,拒绝原假设,故在不同班主任的班级中数学成绩有显著不同, 方差分析表,方差来源,离差平方和,自由度,均方和,F,值,检验结论,因素,A,随机干扰,E,总和,T,314.4,846,1160.4,4,35,39,78.6,24.17,F=3.252,*,注:*表示在,0.05,水平上显著,A,B,C,D,E,76,76,62,65,67,78,67,70,68,71,65,70,69,68,72,72,64,73,71,69,71,67,71,61,74,72,83,69,69,79,83,72,73,65,76,79,73,69,69,84,例,5.3,服务质量分析,为了对几个行业的服务质量进行评价,在零售业、旅游业、航空公司、家电制造业分别抽取了不同的样本,记录了一年中消费者对总共,23,家服务企业投诉的次数,试分析这四个行业的服务质量是否有显著差异?,(,0.05),消费者对四个行业的投诉次数,观察值,(j),行业,(A),零售业,旅游业,航空公司,家电制造业,1,57,62,51,70,2,55,49,49,68,3,46,60,48,63,4,45,54,55,69,5,54,56,47,60,6,53,55,7,47,解题过程,设四个行业被投诉次数的均值分别为,,1,,,2,,,3,,,4,,则需要检验如下假设,H,0,:,1,=,2,=,3,=,4,=,(,四个行业的服务质量无显著差异,),H,1,:,1,,,2,,,3,,,4,不全相等,(,有显著差异,),计算结果如下:,方差来源,离差平方和,自由度,均方和,F,值,检验结论,因素,A,随机干扰,E,总和,T,845.2174,362,1207.217,281.7391,19.05263,14.78741,注,,F0.05(3,19)=3.13,F0.01(3,19)=5.01.,5.2.2,多个总体均值的多重比较检验,通过方差分析,F,检验,如果最终结论是否定了原假设,那么我们知道至少两个水平的总体均值是不同的。但是不知道哪两个或者哪几个均值不同。如果要回答这个问题,就需要多重比较。,LSD,方法:由,Fisher,提出的最小显著差异方法,是对检验两个总体均值是否相等的,t,检验方法的总体方差估计加以修正,(,用,MSE,来代替,),而得到的,可用于判断均值之间差异,LSD,的操作步骤,(,1,)提出假设,H,0,:,i,=,j,(,第,i,个总体的均值等于第,j,个总体的均值,),H,1,:,i,j,(,第,i,个总体的均值不等于第,j,个总体的均值,),(,2,)检验的统计量为,(,3,)若,|t|t,,拒绝,H,0,;若,|t|t,,不能拒绝,H,0,基于统计量 的,LSD,方法的操作步骤为,1,、,计算,LSD,。( 的临界值 ),2,、,检验,若,| |,LSD,,拒绝,H,0,,若,|,|2.096,,颜色,1,与颜色,2,的销售量有显著差异,|,x,1,-,x,3,|= |27.3-26.4| =0.92.096,,颜色,1,与颜色,4,的销售量有显著差异,|,x,2,-,x,3,|= |29.5-26.4| =3.12.096,,颜色,2,与颜色,3,的销售量有显著差异,|,x,2,-,x,4,|= |29.5-31.4| =1.92.096,, 颜色,3,与颜色,4,的销售量有显著差异,5.3,双因素方差分析,双因素:是指问题中有两个,(,反映条件或前提的,),变量,A,r,是变量,A,的一个取值,(,又称因素,A,的一个水平,),B,n,是变量,B,的一个取值,(,又称因素,B,的一个水平,),假设在,A,i,与,B,j,下的总体,X,ij,,服从,N,(,ij,2,)分布,且相互独立,无交互作用。设在双因素各种水平的组合下进行试验,得到数据结构如下表。,双因素方差分析的数据结构表,表中,,x,ij,表示因素,A,i,和因素,B,j,下的试验效果的观察值,因素,B,1,因素,B,2,因素,B,n,因素,A,1,x,11,x,12,x,1n,因素,A,2,x,21,x,22,x,2n,因素,A,r,x,r1,x,r2,x,rn,总体,X,ij,的总平均:,第,i,行总体的平均:,第,j,列总体平均:,A,i,的主效应:,B,j,的主效应:,如果,A,i,与,B,j,间不存在交互效应,就有,ij,=+ a,i,+b,j,把,Xij,分解为因素,A,和因素,B,的效应和均值以及随机误差的和,。,随机样本,X,ij,可以视为其总体均值,ij,与随机误差,ij,之和,X,ij,=,ij,+,ij,ij,服从,N,(,0,2,)分布,并且,ij,之间相互独立于是有,X,ij,= + a,i,+b,j,+,ij,称为“无交互影响的双因素,(,一元,),模型”,X,ij,的构成,(各方案的总体均值),ij,服从,N(0,,,2,),i,(=,i,),b,i,(=,j,),总体均值,主效应,随机扰动,ij,=+ a,i,+b,j,离平方和,SST,、,SSA,、,SSB,、,SSE,的自有度分别为?,SST:nr-1,、,SSA:r-1,、,SSB:n-1,、,SSE:nr-r-n+1=(n-1)(r-1),的自有度分别为?,和,前面处理类似,我们得出如下均方差,无重复实验双因素方差分析方案的假设,零假设:,备择假设: 之间不完全相等(至少,有两个不等),或不全等于,0,之间不完全相等(至少,有两个不等),或不全等于,0,无交互作用的双因素方差分析例题,某企业有三台不同型号的设备,生产同一产品,现有,5,名工人轮流在此三台设备上操作,记录下他们的日产量如下表。试根据方差分析说明这三台设备之间和,5,名工人之间对日产量的影响是否显著。结果如下表所示,,第一步,提出原假设和备择假设:,第二步,计算方差分析表:,5.3.2,有交互作用的双因素方差分析,为了研究两个因素是否独立,有无交互作用,我们需要在各个因素水平组合下,进行重复实验;因此,有交互作用时,方差分析的数据结构会有所不同。设因素,A,和因素,B,每一对水平搭配下重复实验的次数都相同,则方差分析数据结构表如下所示:,双因素重复试验的方差分析数据结构表,问:,(,1,)因素,A,的不同水平(方案)的效果(均值)有无显著影响?,(,2,)因素,B,的不同水平(方案)的效果(均值)有无显著影响?,(,3,)因素,A,与,B,之间的交互作用如何?,观测数据,因素,B,1,因素,B,2,因素,B,n,因素,A,1,x,111,x,112,x,11m,x,121,x,122,x,12m,x,1n1,x,1n2,x,1nm,因素,A,2,x,211,x,212,x,21m,x,221,x,222,x,2m,x,2n1,x,2n2,x,2nm,因素,A,r,xr,11,x,r12,x,r1m,x,r11,x,r22,x,r2m,x,rn1,x,r22,x,rnm,假设在,A,i,与,B,j,下的总体,X,ij,,服从,N(,i,,,2,),分布,(,1,)总体平均分布,(,2,)第,i,行总体的平均,(,3,)第,j,列总体平均,(,4,),A,i,的主效应,(,5,),A,j,的主效应,把,Xij,分解为因素,A,和因素,B,的效应、交互效应、均值以及随机误差的和,。,若,A,i,与,B,j,间存在交互影响,则,称为,A,i,与,B,j,的交互效应,有,ij,=,+a,i,+b,j,+c,ij,随机变量可以写成均值和误差之和:,X,ijl,=,ij,+,ijl,ijk,服从,N(0,,,2,),分布,并且,ijk,之间相互独立,则有,X,ijl,=,+a,i,+b,j,+c,ij,+,ij,l,i=1,,,2,,,,,s,;,j=1,,,2,,,,,n,;,l,=1,,,2,,,,,m,;,m,是实验次数,X,ij,的构成,ij,的构成,i,(=,i,),b,i,(=,j,),c,ij,ij,服从,N(0,,,2,),全局稳定的中心,行、列稳定中心,与全局中心的偏差,交互作用,随机扰动,与无交互作用的双因素方差分解相比,这里多出了一项,SSAB,它表示另个因素,的交互作用。离差平方和,SST,、,SSA,、,SSB,、,SSAB,、,SSE,的自有度分别为?,和,前面处理类似,我们得出如下均方差,有交互作用的双因素方差分析例题,为了分析光照因素,A,与噪音因素,B,对工人生产有无影响,光照效应与噪音效应有没有交互作用,在此两因素不同的水平组合下做试验,结果如下表所示,,第一步,提出原假设和备择假设:,第二步,计算方差分析表:,
展开阅读全文