资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,6-,*,统计学概论,本资料来源,第八章,方,方,差,差分析,第一节,方,方,差,差分析,的,的基本,问,问题,第二节,单,单,因,因素方,差,差分析,第三节,双,双,因,因素方,差,差分析,2,第一节,方,方,差,差分析,的,的基本,问,问题,一、方,差,差分析,问,问题的,提,提出,问题:,消,消费者,与,与供应,厂,厂商间,经,经常出,现,现纠纷,。,。纠纷,发,发生后,,,,消费,者,者经常,会,会向消,费,费者协,会,会投诉,。,。消协,对,对以下几个行业分,别,别抽取,几,几家企,业,业,统,计,计最近,一,一年中,投,投诉次,数,数,以,确,确定这几个行业的,服,服务质,量,量是否,有,有显著,的,的差异,。,。结果,如,如下表,:,:,3,观测值,行业,零售业,旅游业,航空业,家电制造业,1,57,68,31,44,2,66,39,49,51,3,49,29,21,65,4,40,45,34,77,5,34,56,40,58,6,53,51,7,44,行业平均,49,48,35,59,总平均,47.9,4,二、概,念,念:方,差,差分析,简,简称,ANOV,(,AnalysisofVariance,),该,统,统计分,析,析方法,能,能一次性地检验多个总,体,体均值是否存,在,在显著,差,差异。,H0,:,H1,:,不,不全,等,等。,5,(一),因,因素。因素又,称,称因子,,,,是在,实,实验中,或,或在抽,样,样时发,生,生变化,的,的,“,量,”,,通常,用,用,A,、,B,、,C,、,表示。方差分,析,析的目的就是,分,分析因子对实验或抽样,的,的结果有无显,著,著影响。,前面例子中的,因,因素?,如果在实验中,变,变化的因素只,有,有一个,这时,的,的方差分析称,为,为单因素方差,分,分析;在实验,中,中变化的因素,不,不只一个时,,就,就称多因素方,差,差分析。双因,素,素方差分析是,多,多因素方差分,析,析的最简单情,形,形。,6,(二)水平。,因,因子在实验中,的,的不同状态称,作,作水平。如果,因,因子,A,有,r,个不同状态,,就,就称它有,r,个水平,可用,表,表示。我们都,针,针对因素的不,同,同水平或水平,的,的组合,进行,实,实验或抽取样,本,本,以便了解,因,因子的影响。,前面例子中因,子,子的水平?,7,(三)交互影,响,响。当方差分,析,析的影响因子,不,不唯一时,必,要,要注意这些因,子,子间的相互影,响,响。如果因子,间,间存在相互影,响,响,我们称之,为,为,“,交互影响,”,;如果因子间,是,是相互独立的,,,,则称为无交互影响。交互影响有,时,时也称为交互,作,作用,是对实,验,验结果产生作,用,用的一个新因,素,素,分析过程,中,中,有必要将,它,它的影响作用,也,也单独分离开,来,来。,8,三、方差分析,的,的原理,(一)方差的,分,分解。样本数,据,据波动就有二,个,个来源:一个是随机波,动,动,一个是因,子,子影响。样本数据的,波,波动,可通过离差平方和来反映,这个,离,离差平方和可,分,分解为组间方差与组,内,内方差两部分。,组间方差反映,出,出不同的因子,对,对样本波动的,影,影响;,组内方差则,是,是不考虑组,间,间方差的纯,随,随机影响。,9,离差平方和,的,的分解是我,们,们进入方差,分,分析的,“,切入点,”,,这种方差,的,的构成形式,为,为我们分析,现,现象变化提,供,供了重要的,信,信息。如果组间方,差,差明显高于,组,组内方差,说明样本,数,数据波动的,主,主要来源是,组,组间方差,,因,因子是引起,波,波动的主要,原,原因,可以,认,认为因子对,实,实验的结果,存,存在显著的,影,影响;反之,如果,波,波动的主要,部,部分来自组,内,内方差,则因子的,影,影响就不明,显,显,没有充,足,足理由认为,因,因子对实验,或,或抽样结果,有,有显著作用,。,。,10,(二)均方,差,差与自由度,因素或因素,间,间,“,交互作用,”,对观测结果,的,的影响是否,显,显著,关键,要,要看组间方,差,差与组内方,差,差的比较结,果,果。当然,,产,产生方差的,独,独立变量的,个,个数对方差,大,大小也有影,响,响,独立变,量,量个数越多,,,,方差就有,可,可能越大;,独,独立变量个,数,数越少,方,差,差就有可能,越,越小。为了,消,消除独立变,量,量个数对方,差,差大小的影,响,响,我们用,方,方差除以独,立,立变量个数,,,,得到,“,均方差(,MeanSquare,),”,,作为不同,来,来源方差比,较,较的基础。,引,引起方差的,独,独立变量的,个,个数,称作,“,自由度,”,。,11,检验因子影,响,响是否显著,的,的统计量是,一,一个,F,统计量:,F,统计量越大,越说明组,间,间方差是主,要,要方差来源,,,,因子影响越,显,显著;,F,越小,越说,明,明随机方差,是,是主要的方,差,差来源,因,子,子的影响越,不,不显著。,12,第二节,单,单因素方差,分,分析,一、单因素,条,条件下离差,平,平方和的分,解,解,数据结构如,下,下:,13,总离差平方,和,和,SST=SSE+SSA,反映全部数,据,据之间差异,组间方差总,和,和:样本均,值,值与总体均,值,值的差异,,反,反映了因素,的,的不同水平,组内方差总,和,和:样本观,测,测值与样本,均,均值的差异,,,,反映了随,机,机误差的影,响,响,14,二、因素作,用,用显著性的,检,检验,自由度的确,定,定:,SST,是由于的波,动,动引起的方,差,差,但是,,这,这里所有的,nr,个变量并不,独,独立,它们,满,满足一个约,束,束条件,,,,真,正,正独立的变,量,量只有,nr-1,个,自由度,是,是,nr-1,。,SSA,是因子在不,同,同水平上的,均,均值变化而,产,产生的方差,。,。但是,,r,个均值并不,是,是独立的,,它,它们满足一,个,个约束条件,,,,,它,它的自由度,是,是,r-1,。,15,SSE,是由所有的,在,在各因素水,平,平上的围绕,均,均值波动产,生,生,它们满,足,足的约束条,件,件一共,r,个,,失去了,r,个自由度,,所,所以,SSE,的自由度是,nr-r,。,SST,、,SSA,和,SSE,的自由度满,足,足如下关系,:,:,nr-1=(r-1)+(nr-r),16,检验统计量,是,是,:,式中,:,17,F,值越大,越,说,说明总的方,差,差波动中,,组,组间方差是,主,主要部分,,有,有利于拒绝,原,原假设接受,备,备选假设;,反,反之,,F,值越小,越,说,说明随机方,差,差是主要的,方,方差来源,,有,有利于接受,原,原假设,有,充,充分证据说,明,明待检验的,因,因素对总体,波,波动有显著,影,影响。因此,,,,检验的拒,绝,绝域安排在,右,右侧。,18,接受域,拒绝域,19,方差分析需,满,满足的假设,条,条件,(,1,)样本是独,立,立的随机样,本,本;,(,2,)各样本皆,来,来自正态总,体,体;,(,3,)总体方差,具,具有齐性,,即,即各总体方,差,差相等。,20,Stata,oneway response_varfactor_varifinweight,options,tabulate,:产生方差,分,分析表,以,及,及平均数和,标,标准差,scheffe,选项生成了,一,一个表来显,示,示在每一对,平,平均数之间,的,的差异是否显著,原假设:多,总,总体的均值,相,相等,根据,Barlett,检验的,P,值判断是否,同,同方差,原假设:多,总,总体同方差,21,第三节,双,双因素方差,分,分析,(一)无交,互,互影响:,22,数据的离差,平,平方和分解,形,形式为:,SST=SSA+SSB+SSE,23,SSA,表示的是因,素,素,A,的组间方差,总,总和,,SSB,是因素,B,的组间方差,总,总和,都是,各,各因素在不,同,同水平下各,自,自均值差异,引,引起的;,SSE,仍是组内方,差,差部分,由,随,随机误差产,生,生。,各个方差的,自,自由度是:,SST,的自由度为,nr-1,,,SSA,的自由度为,r-1,,,SSB,的自由度为,n-1,,,SSE,的自由度为,nr-r-n-1=,(,r-1,),(n-1),。,24,各个方,差,差对应,的,的均方,差,差是:,对因素,A,而言:,对因素,B,而言:,对随机,误,误差项,而,而言:,25,我们得,到,到检验,因,因素,A,与,B,影响是,否,否显著,的,的统计,量,量分别,是,是:,26,(二),有,有交互,影,影响,27,离差平,方,方和分,解,解形式,:,:,SST=SSA+SSB+SSAB+SSE,28,上式中,29,离差平,方,方和,SST,、,SSA,、,SSB,、,SSAB,和,SSE,的自由,度,度分别,是,是,rnm-1,、,r-1,、,n-1,、,(r-1)(n-1),和,rn(m-1),。,30,相应的,均,均方差,是,是,31,检验因,素,素,A,与,B,影响是,否,否显著,的,的统计,量,量分别,是,是,:,检验交,互,互影响,是,是否显,著,著的统,计,计量度,是,是:,32,
展开阅读全文