第-6章-方差分析课件

上传人:vc****3p 文档编号:250509722 上传时间:2024-11-03 格式:PPT 页数:41 大小:360.27KB
返回 下载 相关 举报
第-6章-方差分析课件_第1页
第1页 / 共41页
第-6章-方差分析课件_第2页
第2页 / 共41页
第-6章-方差分析课件_第3页
第3页 / 共41页
点击查看更多>>
资源描述
第 1 章 论,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,云南财经大学统计信息学院,*,统 计 学,STATISTICS,第 6章 方差分析,学习目标,6.1,方差分析的基本问题,6.2,单因素方差分析,6.3,双因素方差分析,云南财经大学统计信息学院,第 6章 方差分析学习目标云南财经大学统计信息学院,1,学习重点,解释方差分析的概念,解释方差分析的基本思想和原理,掌握单因素方差分析的方法及应用,4. 掌握双因素方差分析的方法及应用,云南财经大学统计信息学院,学习重点解释方差分析的概念云南财经大学统计信息学院,2,6.1,方差分析的基本问题,什么是方差分析(ANOVA)?,检验多个总体均值是否相等,通过分析数据的误差判断各总体均值是否相等,研究分类型自变量对数值型因变量的影响,一个或多个分类型自变量,两个或多个 (,k,个) 处理水平或分类,一个数值型因变量,有单因素方差分析和双因素方差分析,单因素方差分析:涉及一个分类的自变量,双因素方差分析:涉及两个分类的自变量,云南财经大学统计信息学院,6.1 方差分析的基本问题什么是方差分析(ANOVA)?,3,什么是方差分析?,(例题分析),【 例 】,某饮料企业研制出的一种新型饮料。饮料有四种颜色,分别为桔黄色、粉色、绿色和无色透明。随机从五家超市上收集前一期该饮料的销售量,如下表所示:,饮料的颜色对销量的影响,颜色,超市,无色,粉色,桔黄色,绿色,1,2,3,4,5,26.5,28.7,25.1,29.1,27.2,31.2,28.3,30.8,27.9,29.6,27.9,25.1,28.5,24.2,26.5,30.8,29.6,32.4,31.7,32.8,云南财经大学统计信息学院,什么是方差分析? (例题分析)【 例 】某饮料企业研制出的,4,什么是方差分析?,(例题分析),分析饮料颜色对其销售量是否有显著差异。,即检验这四种颜色饮料的销量的均值是否相等,若它们的均值相等,则意味着饮料颜色对其销售量是没有影响的,即它们之间的销量没有显著差异;若均值不全相等,则意味着饮料颜色对其销售量是有影响的,它们之间的销售量有显著差异,云南财经大学统计信息学院,什么是方差分析? (例题分析)分析饮料颜色对其销售量是否有,5,方差分析中的有关术语,因素或因子,(factor),所要检验的对象,要分析颜色对饮料的销量是否有影响,,颜色,是要检验的因素或因子,水平或处理,(,treatment),因子的不同表现,无色、粉色、桔黄色、绿色就是因子的水平,观察值,在每个因素水平下得到的样本数据,每种颜色饮料的销量就是观察值,云南财经大学统计信息学院,方差分析中的有关术语因素或因子(factor)云南财经大学统,6,方差分析的基本思想和原理,(两类误差),随机误差,因素的同一水平(总体)下,样本各观察值之间的差异,比如,同一颜色下不同销售地点的销量是不同的,这种差异可以看成是随机因素的影响,称为,随机误差,系统误差,因素的不同水平(不同总体)下,各观察值之间的差异,比如,不同颜色饮料销量之间的差异,这种差异,可能,是由于抽样的随机性所造成的,,也可能,是由于行业本身所造成的,后者所形成的误差是由系统性因素造成的,称为,系统误差,云南财经大学统计信息学院,方差分析的基本思想和原理(两类误差)随机误差云南财经大学统,7,方差分析的基本思想和原理,1.比较两类误差,以检验均值是否相等,2.比较的基础是方差比,3.如果系统(处理)误差明显地不同于随机误差,则均值就是不相等的;反之,均值就是相等的,4.误差是由各部分的误差占总误差的比例来测度的,云南财经大学统计信息学院,方差分析的基本思想和原理1.比较两类误差,以检验均值是否相,8,方差分析的基本思想和原理,(误差平方和),数据的误差用平方和,(,sum of squares,),表示,组内平方和,(,within groups,),因素的同一水平(同一个总体)下样本数据的平方和,组内平方和只包含,随机误差,组间平方和,(,between groups,),因素的不同水平(不同总体)下各样本之间的平方和,组间平方和既包括,随机误差,,也包括,系统误差,云南财经大学统计信息学院,方差分析的基本思想和原理(误差平方和)数据的误差用平方和(,9,方差分析的基本思想和原理,(误差的比较),若原假设成立,组间平方和与组内平方和经过平均后的数值就应该很接近,它们的比值就会接近1,若原假设不成立,组间平方和平均后的数值就会大于组内平方和平均后的数值,它们之间的比值就会大于1,当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响,判断颜色对饮料销量是否有显著影响,也就是检验销量的差异主要是由于什么原因所引起的。如果这种差异主要是系统误差,说明不同颜色对饮料销量有显著影响,云南财经大学统计信息学院,方差分析的基本思想和原理(误差的比较)若原假设成立,组间平,10,6.2,单因素方差分析,设因素有,k,个水平,每个水平的均值分别用,1,2, ,k,表示,要检验,k,个水平(总体)的均值是否相等,需要提出如下假设:,H,0,:,1,2,k,H,1,:,1,2, ,,k,不全相等,设,1,为无色饮料销量的均值,,2,为粉色饮料销量的均值,,3,为桔黄色饮料销量的均值,,4,为,绿色饮料销量的均值,,,提出的假设为,H,0,:,1,2,3,4,H,1,:,1,2,3,4,不全相等,云南财经大学统计信息学院,6.2 单因素方差分析设因素有k个水平,每个水平的均值,11,单因素方差分析的数据结构,(one-way analysis of variance),观察值,(,j,),因素(,A,),i,水平,A,1,水平,A,2,水平,A,k,1,2,:,:,n,x,11,x,21,x,k,1,x,12,x,22,x,k,2,: :,:,:,: :,:,:,x,1,n,x,2,n,x,kn,云南财经大学统计信息学院,单因素方差分析的数据结构(one-way analysis,12,分析步骤,提出假设,构造检验统计量,统计决策,云南财经大学统计信息学院,分析步骤提出假设云南财经大学统计信息学院,13,提出假设,一,般提法,H,0,:,m,1,=,m,2,=,=,m,k,自变量对因变量没有显著影响,H,1,:,m,1,,,m,2,,,,,m,k,不全相等,自变量对因变量有显著影响,注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等,云南财经大学统计信息学院,提出假设一般提法云南财经大学统计信息学院,14,构造检验的统计量,构造统计量需要计算,水平的均值,全部观察值的总均值,误差平方和,均方,(,MS,),云南财经大学统计信息学院,构造检验的统计量构造统计量需要计算云南财经大学统计信息学院,15,构造检验的统计量,(计算水平的均值),假定从,第,i,个总体中抽取一个容量为,n,i,的简单随机样本,第,i,个总体的样本均值为该样本的全部观察值总和除以观察值的个数,计算公式为,式中:,n,i,为第,i,个总体的样本观察值个数,x,ij,为第,i,个总体的第,j,个观察值,云南财经大学统计信息学院,构造检验的统计量(计算水平的均值)假定从第i个总体中抽取一,16,构造检验的统计量,(计算全部观察值的总均值),全部观察值的总和除以观察值的总个数,计算公式为,云南财经大学统计信息学院,构造检验的统计量(计算全部观察值的总均值)全部观察值的总和,17,构造检验的统计量,(计算总离差平方和,SST,),全,部观察值 与总平均值 的离差平方和,反映全部观察值的离散状况,其计算公式为,前例的计算结果:,SST,= (26.5-28.695),2,+,+,(32.8-28.695),2,=115.9295,云南财经大学统计信息学院,构造检验的统计量(计算总离差平方和 SST)全部观察值,18,构造检验的统计量,(计算水平项平方和,SSA,),各组平均值 与总平均值 的离差平方和,反映各总体的样本均值之间的差异程度,又称,组间平方和,该平方和既包括随机误差,也包括系统误差,计算公式为,前例的计算结果:,SSA,= 76.8455,云南财经大学统计信息学院,构造检验的统计量(计算水平项平方和 SSA)各组平均值,19,构造检验的统计量,(计算误差项平方和,SSE,),每个水平或组的各样本数据与其组平均值的离差平方和,反映每个样本各观察值的离散状况,又称,组内平方和,该平方和反映的是随机误差的大小,计算公式为,前例的计算结果:,SSE,= 39.084,云南财经大学统计信息学院,构造检验的统计量(计算误差项平方和 SSE)每个水平或组的,20,构造检验的统计量,(三个平方和的关系),总离差平方和(,SST,)、误差项离差平方和(,SSE,)、水平项离差平方和 (,SSA,) 之间的关系,SST,=,SSA,+,SSE,前例的计算结果:,115.9295=76.8455+39.084,云南财经大学统计信息学院,构造检验的统计量(三个平方和的关系)总离差平方和(SST,21,构造检验的统计量,(三个平方和的作用),SST,反映全部数据总的误差程度;,SSE,反映随机误差的大小;,SSA,反映随机误差和系统误差的大小,如果原假设成立,则表明没有系统误差,组间平方和,SSA,除以自由度后的,均方,与组内平方和,SSE,和除以自由度后的,均方,差异就不会太大;如果,组间均方,显著地大于,组内均方,,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差,判断因素的水平是否对其观察值有影响,实际上就是比较,组间方差,与,组内方差,之间差异的大小,云南财经大学统计信息学院,构造检验的统计量(三个平方和的作用) SST反映全部数据总,22,构造检验的统计量,(计算均方,MS,),各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是,均方,,也称为方差,计算方法是用误差平方和除以相应的自由度,三个平方和对应的自由度分别是,SST,的,自由度为,n,-1,,其中,n,为全部观察值,的个数,SSA,的,自由度为,k,-1,,其中,k,为因素,水平(总体)的,个数,SSE,的,自由度为,n,-,k,云南财经大学统计信息学院,构造检验的统计量(计算均方MS)各误差平方和的大小与观察值,23,构造检验的统计量,(计算均方,MS,),组间方差,:,SSA,的均方,记为,MSA,,计算公式为,组内方差,:,SSE,的均方,记为,MSE,,计算公式为,云南财经大学统计信息学院,构造检验的统计量(计算均方 MS) 组间方差:SSA的均方,24,构造检验的统计量,(计算检验统计量,F,),将,MSA,和,MSE,进行对比,即得到所需要的检验统计量,F,当,H,0,为真时,二者的比值服从分子自由度为,k,-1、分母自由度为,n,-,k,的,F,分布,即,云南财经大学统计信息学院,构造检验的统计量(计算检验统计量 F )将MSA和MSE进,25,如果均值相等,,F,=,MSA,/,MSE,1,构造检验的统计量,(,F,分布与拒绝域),a,F,分布,F,(,k,-1,n,-,k,),0,拒绝,H,0,不能拒绝,H,0,F,云南财经大学统计信息学院,如果均值相等,F=MSA/MSE1构造检验的统计量(F分,26,统计决策,将统计量的值,F,与给定的显著性水平,的临界值,F,进行比较,作出对原假设,H,0,的决策,根据给定的显著性水平,,在,F,分布表中查找与第一自由度,df,1,k,-1、第二自由度,df,2,=,n,-,k,相应的临界值,F,若,F,F,,则拒绝原假设,H,0,,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响,若,F,F,,则,拒绝,原假设,H,0,,表明均值之间的差异是显著的,即所检验的行因素对观察值有显著影响,若,F,A,F,,则,拒绝,原假设,H,0,,表明均值之间有显著差异,即所检验的列因素对观察值有显著影响,云南财经大学统计信息学院,分析步骤(统计决策) 将统计量的值F与给定的显著性水平,40,End of Chapter 6,休息片刻!,云南财经大学统计信息学院,End of Chapter 6休息片刻!云南财经大学统计信,41,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!