单因素方差分析课件

上传人:9** 文档编号:252552927 上传时间:2024-11-17 格式:PPT 页数:30 大小:225.19KB
返回 下载 相关 举报
单因素方差分析课件_第1页
第1页 / 共30页
单因素方差分析课件_第2页
第2页 / 共30页
单因素方差分析课件_第3页
第3页 / 共30页
点击查看更多>>
资源描述
*,*,单击此处编辑母版标题样式,-,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单因素方差分析,1,-,单因素方差分析1-,什么是方差分析?,检验多个总体均值是否相等,通过对各观察数据误差来源的分析来判断多个总体均值是否相等,2,-,什么是方差分析?检验多个总体均值是否相等2-,什么是方差分析?,(一个例子),表8-1 该饮料在五家超市的销售情况,超市,无色,粉色,橘黄色,绿色,1,2,3,4,5,26.5,28.7,25.1,29.1,27.2,31.2,28.3,30.8,27.9,29.6,27.9,25.1,28.5,24.2,26.5,30.8,29.6,32.4,31.7,32.8,【例8.1】,某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为,橘黄色,、,粉色,、,绿色,和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,见表8-1。试分析饮料的颜色是否对销售量产生影响。,3,-,什么是方差分析?(一个例子)表8-1 该饮料在五家,什么是方差分析?,(例子的进一步分析),检验饮料的颜色对销售量是否有影响,也就是检验四种颜色饮料的平均销售量是否相同,设,1,为无色饮料的平均销售量,,2,粉色饮料的平均销售量,,3,为橘黄色饮料的平均销售量,,4,为绿色饮料的平均销售量,,也就是检验下面的假设,H,0,:,1,2,3,4,H,1,:,1,2,3,4,不全相等,检验上述假设所采用的方法就是方差分析,4,-,什么是方差分析?(例子的进一步分析)检验饮料的颜色对销售,方差分析的基本思想和原理,(几个基本概念),因素或因子,所要检验的对象称为因子,要分析饮料的颜色对销售量是否有影响,,颜色,是要检验的因素或因子,水平,因素的具体表现称为水平,A,1,、,A,2,、,A,3,、,A,4,四种颜色就是因素的水平,观察值,在每个因素水平下得到的样本值,每种颜色饮料的销售量就是观察值,5,-,方差分析的基本思想和原理(几个基本概念)因素或因子5-,方差分析的基本思想和原理,(几个基本概念),试验,这里只涉及一个因素,因此称为单因素四水平的试验,总体,因素的每一个水平可以看作是一个总体,比如,A,1,、,A,2,、,A,3,、,A,4,四种颜色可以看作是四个总体,样本数据,上面的数据可以看作是从这四个总体中抽取的样本数据,6,-,方差分析的基本思想和原理(几个基本概念)试验6-,单因素方差分析的数据结构,观察值,(,j,),因素,(,A,),i,水平A,1,水平A,2,水平A,k,1,2,:,:,n,x,11,x,12,x,1k,x,21,x,22,x,2k,:,:,x,n1,x,n2,x,nk,7,-,单因素方差分析的数据结构 观察值(j)因素(A)i,方差分析中的基本假定,每个总体都应服从正态分布,对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本,比如,每种颜色饮料的销售量必需服从正态分布,各个总体的方差必须相同,对于各组观察数据,是从具有相同方差的总体中抽取的,比如,四种颜色饮料的销售量的方差都相同,观察值是独立的,比如,每个超市的销售量都与其他超市的销售量独立,8,-,方差分析中的基本假定每个总体都应服从正态分布8-,方差分析中的基本假定,在上述假定条件下,判断颜色对销售量是否有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等的问题,如果四个总体的均值相等,可以期望四个样本的均值也会很接近,四个样本的均值越接近,我们推断四个总体均值相等的证据也就越充分,样本均值越不同,我们推断总体均值不同的证据就越充分,9,-,方差分析中的基本假定在上述假定条件下,判断颜色对销售量是否有,提出假设,一般提法,H,0,:,m,1,=,m,2,=,m,k,(因素有,k,个水平),H,1,:,m,1,,,m,2,,,m,k,不全相等,对前面的例子,H,0,:,m,1,=,m,2,=,m,3,=,m,4,颜色对销售量没有影响,H,0,:,m,1,,,m,2,,,m,3,,,m,4,不全相等,颜色对销售量有影响,10,-,提出假设一般提法10-,方差分析的基本思想和原理,(两类方差),组内方差,因素的同一水平,(,同一个总体,),下样本数据的方差,比如,无色饮料,A,1,在5家超市销售数量的方差,组内方差只包含,随机误差,组间方差,因素的不同水平,(,不同总体,),下各样本之间的方差,比如,,A,1,、,A,2,、,A,3,、,A,4,四种颜色饮料销售量之间的方差,组间方差既包括,随机误差,,也包括,系统误差,11,-,方差分析的基本思想和原理(两类方差)组内方差11-,构造检验的统计量,(计算水平的均值,),假定从第,i,个总体中抽取一个容量为,n,i,的简单随机样本,第,i,个总体的样本均值为该样本的全部观察值总和除以观察值的个数,计算公式为,式中:,n,i,为第,i,个总体的样本观察值个数,x,ij,为第,i,个总体的第,j,个观察值,12,-,构造检验的统计量(计算水平的均值)假定从第i个总体中抽取,构造检验的统计量,(计算全部观察值的总均值,),全部观察值的总和除以观察值的总个数,计算公式为,13,-,构造检验的统计量(计算全部观察值的总均值)全部观察值的总,构造检验的统计量,(前例计算结果,),表8-2 四种颜色饮料的销售量及均值,超市,(,j,),水平,A,(,i,),无色(,A,1,),粉色(,A,2,),橘黄色(,A,3,),绿色(,A,4,),1,2,3,4,5,26.5,28.7,25.1,29.1,27.2,31.2,28.3,30.8,27.9,29.6,27.9,25.1,28.5,24.2,26.5,30.8,29.6,32.4,31.7,32.8,合计,136.6,147.8,132.2,157.3,573.9,水平均值,观察值个数,x,1,=,27.32,n,1,=5,x,2,=,29.56,n,2,=5,x,3,=,26.44,n,3,=5,x,4,=,31.46,n,4,=5,总均值,x,=28.695,14,-,构造检验的统计量(前例计算结果)表8-2 四种颜色,构造检验的统计量,(计算总离差平方和,SST,),全部观察值 与总平均值 的离差平方和,反映全部观察值的离散状况,其计算公式为,前例的计算结果:,SST,=(26.5-28.695),2,+(28.7-28.695),2,+(32.8-28.695),2,=115.9295,15,-,构造检验的统计量(计算总离差平方和 SST)全部观察值,构造检验的统计量,(计算组内误差项平方和,SSE,),每个水平或组的各样本数据与其组平均值的离差平方和,反映每个样本各观察值的离散状况,又称,组内离差平方和,该平方和反映的是随机误差的大小,计算公式为,前例的计算结果:,SSE,=39.084,16,-,构造检验的统计量(计算组内误差项平方和 SSE)每个水平或,构造检验的统计量,(计算组间误差项平方和,SSA,),各组平均值 与总平均值 的离差平方和,反映各总体的样本均值之间的差异程度,又称,组间平方和,该平方和既包括随机误差,也包括系统误差,计算公式为,前例的计算结果:,SSA,=76.8455,17,-,构造检验的统计量(计算组间误差项平方和 SSA)各组平均值,构造检验的统计量,(三个平方和,的关系),总离差平方和(,SST,)、误差项离差平方和(,SSE,)、水平项离差平方和(,SSA,)之间的关系,SST,=,SSE,+,SSA,18,-,构造检验的统计量(三个平方和的关系)总离差平方和(SST,构造检验的统计量,(三个平方和的作用,),SST,反映了全部数据总的误差程度;,SSE,反映了随机误差的大小;,SSA,反映了随机误差和系统误差的大小,如果原假设成立,即,H,1,H,2,H,k,为真,则表明没有系统误差,组间平方和,SSA,除以自由度后的,均方,与组内平方和,SSE,和除以自由度后的,均方,差异就不会太大;如果,组间均方,显著地大于,组内均方,,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差,判断因素的水平是否对其观察值有影响,实际上就是比较,组间方差,与,组内方差,之间差异的大小,为检验这种差异,需要构造一个用于检验的统计量,19,-,构造检验的统计量(三个平方和的作用)SST反映了全部数据,构造检验的统计量,(计算均方,MS,),各离差平方和的大小与观察值的多少有关,为了消除观察值多少对离差平方和大小的影响,需要将其平均,这就是均方差,计算方法是用离差平方和除以相应的自由度,三个平方和的自由度分别是,SST,的自由度为,n,-1,,其中,n,为全部观察值的个数,SSA,的自由度为,k,-1,,其中,k,为因素水平(总体)的个数,SSE,的自由度为,n,-,k,20,-,构造检验的统计量(计算均方 MS)各离差平方和的大小与观察,构造检验的统计量,(计算均方,MS,),SSA,的均方也称,组间方差,,记为,MSA,,计算公式为,SSE,的均方也称,组内方差,,记为,MSE,,计算公式为,21,-,构造检验的统计量(计算均方 MS)SSA的均方也称组间方,构造检验的统计量,(计算检验的统计量,F,),将,MSA,和,MSE,进行对比,即得到所需要的检验统计量,F,当,H,0,为真时,二者的比值服从分子自由度为,k,-1、分母自由度为,n,-,k,的,F,分布,即,22,-,构造检验的统计量(计算检验的统计量 F)将MSA和MSE,构造检验的统计量,(,F,分布与拒绝域,),如果均值相等,,F,=,MSA,/,MSE,1,a,F,分布,F,(,k,-1,n,-,k,),0,拒绝,H,0,不能拒绝,H,0,F,23,-,构造检验的统计量(F分布与拒绝域)如果均值相等,F=MSA,统计决策,将统计量的值,F,与给定的显著性水平,的临界值,F,进行比较,作出接受或拒绝原假设,H,0,的决策,根据给定的显著性水平,,在,F,分布表中查找与第一自由度,df,1,k,-1、第二自由度,df,2,=,n,-,k,相应的临界值,F,若,F,F,,则拒绝原假设,H,0,,表明均值之间的差异是显著的,所检验的因素(,A,)对观察值有显著影响,若,F,F,,则不能拒绝原假设,H,0,,表明所检验的因素(,A,)对观察值没有显著影响,24,-,统计决策 将统计量的值F与给定的显著性水平的临界值F,单因素方差分析表,(基本结构),方差来源,平方和,SS,自由度,df,均方,MS,F,值,组间(因素影响),组内(误差),总和,SSA,SSE,SST,k,-1,n,-,k,n,-1,MSA,MSE,MSA,MSE,25,-,单因素方差分析表(基本结构)方差来源平方和SS自由度均方F,方差分析中的多重比较,(作用),多重比较是通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异,多重比较方法有多种,这里介绍Fisher提出的,最小显著差异,方法,简写为,LSD,,该方法可用于判断到底哪些均值之间有差异,LSD,方法是对,检验两个总体均值是否相等的,t,检验方法,的总体方差估计加以修正(用,MSE,来代替)而得到的,26,-,方差分析中的多重比较(作用)多重比较是通过对总体均值之间的,方差分析中的多重比较,(步骤),提出假设,H,0,:,m,i,=,m,j,(第,i,个总体的均值等于第,j,个总体的均值,),H,1,:,m,i,m,j,(第,i,个总体的均值不等于第,j,个总体的均值,),检验的统计量为,若|,t,|,t,,拒绝,H,0,;,若|,t,|,t,,不能拒绝,H,0,27,-,方差分析中的多重比较(步骤)提出假设若|t|t,拒,方差分析中的多重比较,(基于统计量,x,i,-,x,j,的,LSD,方法),通过判断样本均值之差的大小来检验,H,0,检验的统计量为,:,x
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!