第8章-方差分析课件

上传人:沈*** 文档编号:241680147 上传时间:2024-07-15 格式:PPTX 页数:67 大小:940.50KB
返回 下载 相关 举报
第8章-方差分析课件_第1页
第1页 / 共67页
第8章-方差分析课件_第2页
第2页 / 共67页
第8章-方差分析课件_第3页
第3页 / 共67页
点击查看更多>>
资源描述
第 8 章 方差分析8.1 方差分析方差分析的基本原理的基本原理8.2 单因素方差分析单因素方差分析8.3 双因素方差分析双因素方差分析第 8 章 方差分析8.1 方差分析的基本原理18.1 方差分析的基本原理方差分析的基本原理 8.1.1 8.1.1 什么是方差分析?什么是方差分析?8.1.2 8.1.2 误差分解误差分解 8.1.3 8.1.3 方差分析的基本假定方差分析的基本假定8.1 方差分析的基本原理 8.1.1 什么是方2什么是方差分析(ANOVA)?(analysis of variance)1.检验多个总体均值是否相等;通过分析观测数据的误差来判断各总体均值是否相等;用方差来衡量误差的大小。2.研究分类型自变量对数值型因变量的影响;一个或多个分类自变量u2个或多个(k 个)处理水平或分类一个数值型因变量3.有单因素方差分析和双因素方差分析;单因素方差分析:一个分类自变量双因素方差分析:两个分类自变量什么是方差分析(ANOVA)?(analysis of v32014-12-16什么是方差分析?(例题分析)【例例例例 8-18-1】确定超市的位置和竞争者的数量对销售额是否确定超市的位置和竞争者的数量对销售额是否有显著影响,获得的年销售额数据有显著影响,获得的年销售额数据(单位:万元单位:万元)如下如下表:表:因素因素因素因素水平或处理水平或处理水平或处理水平或处理样本数据样本数据样本数据样本数据2014-12-16什么是方差分析?(例题分析)【例 42014-12-16什么是方差分析?(例题分析)1.分析“超市位置”和“竞争者数量”对销售额的影响;2.如果只分析超市位置或只分析竞争者数量一个因素对销售额的影响,则称为单单因因素素方方差差分分析析(one-way analysis of variance);3.如果只分析超市位置和竞争者数量两个因素对销售额的单独影响,但不考虑它们对销售额的交交互互效效应应(interaction),则称为只考虑主效应的双因素方差分析;4.如果除了考虑超市位置和竞争者数量两个因素对销售额的单独影响外,还考虑二者对销售额的交互效应,则称为考虑交互效应的双因素方差分析。2014-12-16什么是方差分析?(例题分析)分析“超58.1.2 误差分解8.1 方差分析的基本原理方差分析的基本原理8.1.2 误差分解8.1 方差分析的基本原理62014-12-16方差分析的基本原理(误差分解)1.总误差总误差(total error):反映全部观测数据的误差;所抽取的全部36家超市的销售额之间差异;2.组组间间误误差差(between-group error)处处理理误误差差(treatment error):由于不同处理造成的误差,它反映了处理(超市位置)对观测数据(销售额)的影响,也叫做系统误差系统误差;3.组内误差组内误差(within-group error)随机误差随机误差(random error):由于随机因素造成的误差,也简称为误差误差(error);2014-12-16方差分析的基本原理(误差分解)总误差(72014-12-16方差分析的基本原理(误差分解)1.数据的误差可以用平平方方和和(sum of squares)来表示,常简记为SS;总平方和总平方和,记为,记为SST;反映全部数据总误差大小的平方和;抽取的全部36家超市销售额之间的误差平方和组间平方和,记为组间平方和,记为SSA;反映系统误差(处理误差)大小的平方和;也称为处理平方和(treatment sum of squares)组内平方和,记为组内平方和,记为SSE;反映随机误差大小的平方和;也称为误差平方和(sum of squares of error)2014-12-16方差分析的基本原理(误差分解)数据的误82014-12-16方差分析的基本原理(误差分解)误差平方和的分解及其关系误差平方和的分解及其关系误差平方和的分解及其关系误差平方和的分解及其关系总误差总误差总平方和总平方和(SST)系统误差系统误差随机误差随机误差组间平方和组间平方和(SSA)组内平方和组内平方和(SSE)=+2014-12-16方差分析的基本原理(误差分解)总误差总2014-12-16方差分析的基本原理(误差分析)1.方差分析的基本原理,就是要分析数据的总误差中有没有系统误差。如果超市的不同位置对销售额没有显著影响,意味着没有系统误差。这时,每种处理所对应的总体均值(i)应该相等。2.如果存在系统误差,每种处理所对应的总体均值(i)至少有一对不相等;3.就例8-1而言,在只考虑超市位置一个因素的情况下,方差分析也就是要检验下面的假设:H0:1 2 3 H1:1,2,3 不全相等不全相等2014-12-16方差分析的基本原理(误差分析)方差分析10方差分析的基本原理(方差比较)1.若不同位置对销售额没有影响,则组间方差中只包含随机误差,没有系统误差。这时,组间方差与组内方差经过平均后的数值就应该很接近,它们的比值就会接近1;2.若不同位置对销售额有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差平均后的数值就会大于组内方差平均后的数值,它们之间的比值就会大于1;当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响;方差分析的基本原理(方差比较)若不同位置对销售额没有影响,112014-12-16方差分析的基本假定1.正态性(normality)。每个总体都应服从正态分布,即对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;在例8-1中,要求每个位置超市的销售额必须服从正态分布;检验总体是否服从正态分布的方法有很多,包括对样本数据作直方图、茎叶图、箱线图、正态概率图等;2.方差齐性(homogeneity variance)。各个总体的方差必须相同,对于分类变量的每个水平,有12=22=k2;在例8-1中,要求不同位置超市的销售额的方差都相同;3.独立性(independence)。每个样本数据是来自因素各水平的独立样本(该假定不满足对结果影响较大);在例8-1中,3个样本数据是来自不同位置超市的3个独立样本;2014-12-16方差分析的基本假定正态性(normali12单因素方差分析的数学模型l设因素A有k种处理(比如超市位置有“居民区”、“商业区”、“写字楼”3种),单因素方差分析可用下面的线性模型来表示:l设总均值为,第i个处理的效应可以用第i个处理的均值与总均值的差表示,记为i,即i=i-;这样,第i个处理均值被分解成i=i+,方差分析模型可以改写为:单因素方差分析的数学模型设因素A有k种处理(比如超市位置有“138.2 8.2 单因素方差分析单因素方差分析8.2.1数据结构8.2.2分析步骤8.2.3关系强度的测量8.2.4方差分析中的多重比较8.2 单因素方差分析8.2.1数据结构14单因素方差分析的数据结构(one-way analysis of variance)观测值观测值 (j)因素因素(A)i 水平水平A1 水平水平A2 水平水平Ak12:n x11 x21 xk1 x12 x22 xk2 :x1n x2n xkn单因素方差分析的数据结构(one-way analysis15提出假设1.一般提法:H0:1=2=k 自变量对因变量没有显著影响;H1:1,2,k不全相等自变量对因变量有显著影响;2.要注意的是:若拒绝原假设,只是表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等。提出假设一般提法:16构造检验的统计量构造统计量需要计算:各个水平的均值;全部观测值的总均值;各个离差平方和;各个均方(MS,即方差)。构造检验的统计量构造统计量需要计算:17构造检验的统计量(计算水平的均值)1.假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观测值总和除以观测值的个数;2.计算公式为 式中:式中:n ni i为第为第 i i 个总体的样本观测值个数个总体的样本观测值个数 x xij ij 为第为第 i i 个总体的第个总体的第 j j 个观测值个观测值 构造检验的统计量(计算水平的均值)假定从第i个总体中抽取一18构造检验的统计量(计算全部观测值的总均值)1.全部观测值的总和除以观测值的总个数;2.计算公式为 构造检验的统计量(计算全部观测值的总均值)全部观测值的总和19构造检验的统计量(计算总离差平方和 SST)1.全部观测值 与总平均值 的离差平方和;2.反映全部观测值的离散状况;3.其计算公式为:构造检验的统计量(计算总离差平方和 SST)全部观测值 20构造检验的统计量(计算组间平方和 SSA)1.各组平均值 与总平均值 的离差平方和;2.反映各总体的样本均值之间的差异程度,又称水平项平方和;3.该平方和既包括随机误差,也包括系统误差;4.计算公式为:构造检验的统计量(计算组间平方和 SSA)各组平均值 21构造检验的统计量(计算组内平方和 SSE)1.每个水平或组的各样本数据与其组平均值的离差平方和;2.反映每个样本各观测值的离散状况,又称误差项平方和(或残差平方和);3.该平方和反映的是随机误差的大小;4.计算公式为:构造检验的统计量(计算组内平方和 SSE)每个水平或组的各22构造检验的统计量(三个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系:SST=SSA+SSE构造检验的统计量(三个平方和的关系)总离差平方和(SST23构造检验的统计量(计算均方MS)1.各误差平方和的大小与观测值的多少有关,为消除观测值多少对误差平方和大小的影响,需要将其平均,这就是均方,均方,即方差;2.计算方法是用误差平方和除以相应的自由度;3.三个平方和对应的自由度分别是:SST 的自由度为n-1,其中n为全部观测值的个数;SSA的自由度为k-1,其中k为因素水平的个数;SSE 的自由度为n-k;构造检验的统计量(计算均方MS)各误差平方和的大小与观测值24构造检验的统计量(计算均方 MS)1.组组间间方方差差:SSA的均方,记为MSA,计算公式为:2.组组内内方方差差:SSE的均方,记为MSE,计算公式为:构造检验的统计量(计算均方 MS)组间方差:SSA的均方25构造检验的统计量(计算检验统计量 F)1.将MSA和MSE进行对比,即得到所需要的检验统计量F;2.当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k 的 F 分布,即:构造检验的统计量(计算检验统计量 F)将MSA和MSE进26构造检验的统计量(F分布与拒绝域)F 分布分布F(k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不拒绝不拒绝不拒绝不拒绝H H H H0 0 0 0F F构造检验的统计量(F分布与拒绝域)a F 分布F(k-27单因素方差分析结果(基本结构)单因素方差分析结果(基本结构)282014-12-16单因素方差分析(例题分析)拒绝拒绝H02014-12-16单因素方差分析(例题分析)拒绝H029Spss方差分析预处理分析之前需要将原始数据进行调整;将超市位置作为一个单独的变量,作为spss是一列;并对其取值居民区、商业区、写字楼分别进行赋值编码;保证超市位置的变量类型为数值,度量尺度为名义。Spss方差分析预处理分析之前需要将原始数据进行调整;302014-12-16用SPSS进行方差分析选择【分析-比较均值】,并选择【单因素方差分析ANOVA】;将因变量选入因变量列表框,将影响因素选入因子列表框;点确定;另,使用教材介绍的GLM分析方法;2014-12-16用SPSS进行方差分析选择【分析-比较均312014-12-16用SPSS进行方差分析(均值图)2014-12-16用SPSS进行方差分析(均值图)32关系强度的测量 1.拒绝原假设表明因素(自变量)与观测值之间有关系;2.组间平方和(SSA)度量了自变量对因变量的影响效应;实际上,只要组间平方和SSA不等于0,就表明两个变量之间有关系(只是是否显著的问题);当组间平方和(SSA)比组内平方和(SSE)大,而且大到一定程度时,就意味着两个变量之间的关系显著;反之,就意味着两个变量之间的关系不显著。关系强度的测量 拒绝原假设表明因素(自变量)与观测值之间有关33关系强度的测量 1.变量间关系的强度用自变量平方和(SSA)及残差平方和(SSE)占总平方和(SST)的比例大小来反映;2.自变量平方和占总平方和的比例记为R2,即:3.其平方根R也可以用来测量两个变量之间的关系强度。关系强度的测量 变量间关系的强度用自变量平方和(SSA)及残34方差分析中的多重比较(multiple comparison procedures)1.通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异;2.可采用Fisher提出的最最小小显显著著性性差差异异方法,简写为LSD;3.LSD是对检验两个总体均值是否相等的t检验方法的总体方差估计加以修正,即用MSE代替两个总体的方差计算得到的。方差分析中的多重比较(multiple compariso35方差分析中的多重比较(步骤)1.提出假设H0:i=j(第i个总体的均值等于第j个总体的均值)H1:i j(第i个总体的均值不等于第j个总体的均值)2.计算检验的统计量:3.计算LSD:4.决策:若 ,拒绝H0;若 ,不拒绝H0方差分析中的多重比较(步骤)提出假设362014-12-16多重比较的LSD方法(例题分析)第第1步:步:提出假设检验1:检验2:检验3:第2步:计算检验统计量检验1:检验2:检验3:2014-12-16多重比较的LSD方法(例题分析)第1步372014-12-16多重比较的LSD方法(例题分析)第第3步:步:计算LSD第第4步:步:做出决策不拒绝不拒绝H H0 0,没有证据表明居民区和,没有证据表明居民区和商商业区的业区的超市销售额之间有显著超市销售额之间有显著差异;差异;拒绝拒绝H H0 0,居民区和写字楼的超市销售,居民区和写字楼的超市销售额之间有显著额之间有显著差异;差异;拒绝拒绝H H0 0,商业区和写字楼的超市销售,商业区和写字楼的超市销售额之间有显著额之间有显著差异;差异;2014-12-16多重比较的LSD方法(例题分析)第3步382014-12-16用SPSS进行多重比较【例例8-3】多重比较多重比较2014-12-16用SPSS进行多重比较【例8-3】多重比398.3 8.3 双因素方差分析双因素方差分析8.3.1双因素方差分析及其类型8.3.2无交互作用的双因素方差分析8.3.3有交互作用的双因素方差分析8.3 双因素方差分析8.3.1双因素方差分析及其类型40双因素方差分析(two-way analysis of variance)1.分析两个因素(行因素Row和列因素Column)对试验结果的影响;2.如果两个因素对试验结果的影响是相互独立的,分别判断行因素和列因素对试验数据的影响,这时的双因素方差分析称为无无交交互互作作用用的的双双因因素素方方差差分分析析或 无无 重重 复复 双双 因因 素素 方方 差差 分分 析析(Two-factor without replication);3.如果除了行因素和列因素对试验数据的单独影响外,两个因素的搭配还会对结果产生一种新的影响,这时的双因素方差分析称为有有交交互互作作用用的的双双因因素素方方差差分分析析或可可重重复复双双因因素素方方差差分分析析(Two-factor with replication);双因素方差分析(two-way analysis of v41双因素方差分析的基本假定1.每个总体都服从正态分布;对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本2.各个总体的方差必须相同;对于各组观测数据,是从具有相同方差的总体中抽取的3.观测值是独立的;双因素方差分析的基本假定每个总体都服从正态分布;422014-12-16双因素方差分析(数学模型)l设因素A有I种处理(比如超市位置有“居民区”、“商业区”、“写字楼”3种处理),因素B有J种处理(比如竞争者数量有0个、1个、2个、3个及以上4种处理),双因素方差分析可用下面的线性模型来表示:ij02014-12-16双因素方差分析(数学模型)设因素A有I43无交互作用双因素方差分析 (例题分析)不同品牌的彩电在各地区的销售量数据不同品牌的彩电在各地区的销售量数据 品牌因素品牌因素地区因素地区因素地区地区1地区地区2地区地区3地区地区4地区地区5品牌品牌1品牌品牌2品牌品牌3品牌品牌4365345358288 350368323280 343363353298 340330343260 323333308298【例例例例】有有四四个个品品牌牌的的彩彩电电在在五五个个地地区区销销售售,为为分分析析彩彩电电的的品品牌牌(品品牌牌因因素素)和和销销售售地地区区(地地区区因因素素)对对销销售售量量是是否否有有影影响响,对对每每个个品品牌牌在在各各地地区区的的销销售售量量取取得得以以下下数数据据。试试分分析析品品牌牌和和销售地区对彩电的销售量是否有显著影响?销售地区对彩电的销售量是否有显著影响?(=0.05=0.05)无交互作用双因素方差分析 (例题分析)不同品牌的彩电在各44数据结构 数据结构 45数据结构 是行因素的第是行因素的第i i个水平下各观测值的个水平下各观测值的平均值;平均值;是列因素的第是列因素的第j j个水平下的各观测值的个水平下的各观测值的均值;均值;是全部是全部 kr kr 个样本数据的总个样本数据的总平均值;平均值;数据结构 是行因素的第i个水平下各观测值的平均46分析步骤(提出假设)提出假设;对行因素提出的假设为:H0:1=2=i=k (i为第i个水平的均值)H1:i (i=1,2,k)不全相等对列因素提出的假设为:H0:1=2=j=r (j为第j个水平的均值)H1:j(j=1,2,r)不全相等分析步骤(提出假设)提出假设;47分析步骤(构造检验的统计量)计算平方和(SS);总误差平方和:行因素误差平方和:列因素误差平方和:随机误差项平方和:分析步骤(构造检验的统计量)计算平方和(SS);48分析步骤(构造检验的统计量)总离差平方和(SST)、水平项离差平方和(SSR和SSC)、误差项离差平方和(SSE)之间的关系:SST=SSR+SSC+SSE 分析步骤(构造检验的统计量)总离差平方和(SST)49分析步骤(构造检验的统计量)计算均方(MS);各个离差平方和除以相应的自由度;三个平方和的自由度分别是:总离差平方和SST的自由度为kr-1;行因素的离差平方和SSR的自由度为k-1;列因素的离差平方和SSC的自由度为r-1;随机误差平方和SSE的自由度为(k-1)(r-1);分析步骤(构造检验的统计量)计算均方(MS);50分析步骤(构造检验的统计量)计算均方(MS);行因素的均方,记为MSR,计算公式为:列因素的均方,记为MSC,计算公式为:随机误差项的均方,记为MSE,计算公式为:分析步骤(构造检验的统计量)计算均方(MS);51分析步骤(构造检验的统计量)计算检验统计量(F);检验行因素的统计量:检验列因素的统计量:分析步骤(构造检验的统计量)计算检验统计量(F);52分析步骤(统计决策)将统计量的值F与给定的显著性水平的临界值F进行比较,作出决策;根据给定的显著性水平在F分布表中查找相应的临界值 F;若FRF,则拒拒绝绝原假设H0,表明均值之间的差异是显著的,即所检验的行因素对观测值有显著影响;若FCF,则拒拒绝绝原假设H0,表明均值之间有显著差异,即所检验的列因素对观测值有显著影响;分析步骤(统计决策)将统计量的值F与给定的显著性水平53双因素方差分析结果(基本结构)双因素方差分析结果(基本结构)54双因素方差分析(例题分析)提出假设;对品牌因素提出的假设为:H0:1=2=3=4(品牌对销售量没有影响)H1:i (i=1,2,4)不全相等(品牌对销售量有影响)对地区因素提出的假设为:H0:1=2=3=4=5(地区对销售量没有影响)H1:j(j=1,2,5)不全相等(地区对销售量有影响)双因素方差分析(例题分析)提出假设;55双因素方差分析(例题分析)结论:结论:FR18.10777F3.4903,拒绝原假设H0,说明彩电的品牌对销售量有显著影响;FC2.100846 F3.2592,不拒绝原假设H0,不能认为销售地区对彩电的销售量有显著影响。双因素方差分析(例题分析)结论:562014-12-16双因素方差分析在用SPSS中进行双因素方差分析时,需要把多个样本的观测值作为一个变量输入,然后把两个因素分表单列,并与相应的销售额对应;第第1步步:选择【分析】,并选择【广义线性模型-广义线性模型】进入主对话框;第2步:在模型标签下默认选线性,在响应标签下将因变量选入【因变量】框中,在预测标签中将影响因素选入【因子】框中,在模型标签将两个因子选入模型窗口,需要考虑交互作用时,选上交叉项;第3步:其他标签默认,点击确定;2014-12-16双因素方差分析在用SPSS中进行双因素57双因素方差分析(关系强度的测量)1.行平方和(行SS)度量了品牌这个自变量对因变量(销售量)的影响效应;2.列平方和(列SS)度量了地区这个自变量对因变量(销售量)的影响效应;3.这两个平方和加在一起则度量了两个自变量对因变量的联合效应;4.联合效应与总平方和的比值定义为R2:5.其平方根R反映了这两个自变量合起来与因变量之间的关系强度。双因素方差分析(关系强度的测量)行平方和(行SS)度量了品58双因素方差分析(关系强度的测量)例题分析:品牌因素和地区因素合起来总共解释了销售量差异的83.94%;其他因素(残差变量)只解释了销售量差异的16.06%;R=0.9162,表明品牌和地区两个因素合起来与销售量之间有较强的相关关系。双因素方差分析(关系强度的测量)例题分析:592014-12-16有交互作用双因素方差分析(例题分析)【例 8-1】确定超市的位置和竞争者的数量对销售额是否有显著影响:2014-12-16有交互作用双因素方差分析(例题分析)【60有交互作用双因素方差分析(例题分析)【例例】城市道路交通管理部门为研究不同的路段和不同的时间段对行车时间的影响,让一名交通警察分别在两个路段和高峰期与非高峰期亲自驾车进行试验,通过试验取得共获得20个行车时间(分钟)的数据,如下表。试分析路段、时段以及路段和时段的交互作用对行车时间的影响。有交互作用双因素方差分析(例题分析)【例】城市道路交通管理61有交互作用情况下的数据结构:行因素行因素(i)列列因素因素(j)A1 A2 ArB1 y111 y121 y1r1 :y11m y12m y1rmB2 y211 y221 y2r1 :y21m y22m y2rmBk yk11 yk21 ykr1 :yk1m yk2m ykrm有交互作用情况下的数据结构:行因素列因素(j)A162有交互作用双因素方差分析(平方和的计算)设:为对应于行因素的第i个水平和列因素的第j个 水平的第l层的观测值;为行因素的第i个水平的样本均值;为列因素的第j个水平的样本均值;对应于行因素的第i个水平和列因素的第j个水 平组合的样本均值;为全部n个观测值的总均值;有交互作用双因素方差分析(平方和的计算)设:为对63有交互作用双因素方差分析(平方和的计算)1.总平方和:2.行变量平方和:3.列变量平方和:4.交互作用平方和:5.误差项平方和:有交互作用双因素方差分析(平方和的计算)总平方和:64有交互作用双因素分析(方差分析表的结构)有交互作用双因素分析(方差分析表的结构)65本章小结1.方差分析方差分析(ANOVA)的概念的概念2.方差分析的原理方差分析的原理3.方差分析中的基本假设方差分析中的基本假设4.单因素方差分析单因素方差分析5.双因素方差分析双因素方差分析本章小结方差分析(ANOVA)的概念66平时作业七8.3、8.4平时作业七8.3、8.467
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!