北大光华陈奇志老师saS课件8

上传人:wjs****19 文档编号:241789712 上传时间:2024-07-24 格式:PPTX 页数:118 大小:1.69MB
返回 下载 相关 举报
北大光华陈奇志老师saS课件8_第1页
第1页 / 共118页
北大光华陈奇志老师saS课件8_第2页
第2页 / 共118页
北大光华陈奇志老师saS课件8_第3页
第3页 / 共118页
点击查看更多>>
资源描述
1八、八、SAS系统与方差分析2007200720072007北京大学北京大学北京大学北京大学2 目目 录录 1.单因素方差分析单因素方差分析 2.多因素方差分析多因素方差分析 3.均值估计与比较均值估计与比较 4.非参数统计非参数统计2007200720072007北京大学北京大学北京大学北京大学3 方差分析方差分析(ANOVA)方差分析方差分析(Analysis of Variance,简记为 ANOVA)是分析是分析试验数据的一种常用数据的一种常用统计方法方法.在方差分析中在方差分析中,我我们把把试验数据数据(响响应变量量)的的总变差差(总波波动)分解分解为所考察因素所考察因素(分分类变量量)的的变差和由随机因素引起的差和由随机因素引起的变差差,然后通然后通过分析比分析比较这些些变差来推断哪些因素差来推断哪些因素对指指标(响响应变量量)影响最影响最显著著,哪些不哪些不显著著.对多个均多个均值进行行统计推断通常使用方差分析推断通常使用方差分析.2007200720072007北京大学北京大学北京大学北京大学4单因素方差分析 方差分析的问题与模型:方差分析的问题与模型:为了比较不同配方和工艺条件对产品产量为了比较不同配方和工艺条件对产品产量和质量的影响,往往需要进行多个总体均值的和质量的影响,往往需要进行多个总体均值的比较比较.方差分析就是对两个或多个总体均值进方差分析就是对两个或多个总体均值进行比较最常用的一种统计方法行比较最常用的一种统计方法.例如有例如有k种不同的工艺条件,种不同的工艺条件,在方差分析中在方差分析中也称每种工艺条件为一个水平,在每个水平下,也称每种工艺条件为一个水平,在每个水平下,例如在第例如在第i种水平下,产品产量种水平下,产品产量的的全体为一个总全体为一个总体,对此总体得到了产品产量体,对此总体得到了产品产量的观测的观测样本为样本为Xi1 1,Xi2 ,Xin.希望由此对不同水平下总体希望由此对不同水平下总体的均值进行比较的均值进行比较.2007200720072007北京大学北京大学北京大学北京大学5单因素方差分析假设假设观察到的观察到的Xij 可可用以下的模型表示:用以下的模型表示:Xij=i+ij ,11jn,11ik 其中其中 i表示第表示第i种水平下产量的均值,种水平下产量的均值,ij为为第第i种种水平下水平下产量产量的的第第j次观测次观测值值所包含的随机误差,所包含的随机误差,在方差分析中为了得到有效的检验法还常假定在方差分析中为了得到有效的检验法还常假定 ij 满足:满足:ij 为相互独立的,即不同水平下为相互独立的,即不同水平下观测观测的的 样本是相互独立的;样本是相互独立的;ij 都是正态分布的,都是正态分布的,且且 ij 的均值都为的均值都为0 0,方差也相同方差也相同.2007200720072007北京大学北京大学北京大学北京大学6单因素方差分析 在上面的模型中,观测到的数据的均值受在上面的模型中,观测到的数据的均值受一个因素不同水平的影响,即一个因素不同水平的影响,即 i依赖于依赖于因素的因素的第第i个水平个水平,这类问题称为单因素问题,用以处,这类问题称为单因素问题,用以处理这类问题的统计方法称为单因素的方差分析理这类问题的统计方法称为单因素的方差分析.要分析的变量要分析的变量(指标指标)X称为因变量、响应变量称为因变量、响应变量或分析变量或分析变量.比较不同水平下均值是否相同的问题就归比较不同水平下均值是否相同的问题就归为检验如下的假设:为检验如下的假设:H H0 0:1=2=.=k,H H1 1:1,2,.,k不全相等;不全相等;2007200720072007北京大学北京大学北京大学北京大学7单因素方差分析例例(隔隔热试验的例子的例子):为检验三种隔三种隔热材料的效果材料的效果进行行30次次试验,每种每种10次次.比比较三种材料的平均温度三种材料的平均温度变化是否一化是否一样.对对2007200720072007北京大学北京大学北京大学北京大学8单因素方差分析 方差分析模型方差分析模型在方差分析中:在方差分析中:指指标(或称因或称因变量或响量或响应变量量):记录在各种在各种试验条件下的条件下的观测结果果;若干个因素若干个因素(或称自或称自变量或分量或分类变量量):设定定观测的的试验条件条件.分分类变量的不同量的不同值又称又称为水平水平.2007200720072007北京大学北京大学北京大学北京大学9单因素方差分析 方差分解与方差分解与统计检验方差分析将方差分析将观测到的响到的响应变量的量的变差分解差分解为由于分由于分类变量不同水平量不同水平产生的生的(组间)变差和差和随机随机误差差(组内内)进行分析行分析.2007200720072007北京大学北京大学北京大学北京大学10单因素方差分析 方差分解与方差分解与统计检验-观测数据数据 组均值组均值2007200720072007北京大学北京大学北京大学北京大学11单因素方差分析方差分解与方差分解与统计检验单因素数据的方差分析(均因素数据的方差分析(均值模型)模型)或(效或(效应模型、模型、线性模型)性模型)方差分解方差分解自由度分解自由度分解组间组间组内组内2007200720072007北京大学北京大学北京大学北京大学12单因素方差分析 方差分解与方差分解与统计检验2007200720072007北京大学北京大学北京大学北京大学13单因素方差分析 方差分解与方差分解与统计检验 方差分解与方差分解与检验-Total SS=SS(因素因素A)+Residual SS Total DF=DF(A)+Residual DF MS(A)=SS(A)/DF(A)F(A)=MS(A)/Residual MS 2007200720072007北京大学北京大学北京大学北京大学14单因素方差分析 验证方差模型的假定方差模型的假定方差分析模型的假定:方差分析模型的假定:误差项误差项 e eij:同方差、零均值同方差、零均值 相互独立相互独立 正态分布正态分布 (e eijN(0,N(0,2 2)常用残差的比较盒形图和残差分布常用残差的比较盒形图和残差分布QQ图来验证这些假定图来验证这些假定.违反这些假定会使方违反这些假定会使方差分析的检验失效差分析的检验失效.2007200720072007北京大学北京大学北京大学北京大学15单因素方差分析 例子例子-胶合板耐磨性试验胶合板耐磨性试验 例例1.1(1.1(胶合板耐磨性试验胶合板耐磨性试验)为了比较五种不同品牌为了比较五种不同品牌的胶合板的质量,从每种品牌中随机抽取的胶合板的质量,从每种品牌中随机抽取4 4个样品作个样品作耐磨性试验耐磨性试验.记录了每次试验测量的板材磨损数量,记录了每次试验测量的板材磨损数量,数据存放在数据集数据存放在数据集SASUSER.VENEERSASUSER.VENEER中中(见下表见下表).).该数该数据集有两个变量:据集有两个变量:BRANDBRAND表示胶合板的品牌;表示胶合板的品牌;WEARWEAR表表示测得的磨损数量示测得的磨损数量.胶合板磨损数据胶合板磨损数据 品品 牌牌 磨损数量磨损数量(每个牌子四个样品每个牌子四个样品)ACME 2.3,2.1,2.4,2.5 CHAMP 2.2,2.3,2.4,2.6 AJAX 2.2,2.0,1.9,2.1 TUFFY 2.4,2.7,2.6,2.7 XTRA 2.3,2.5,2.3,2.42007200720072007北京大学北京大学北京大学北京大学16单因素方差分析例子例子-胶合板耐磨性试验胶合板耐磨性试验 试用试用SASSAS菜单系统菜单系统INSIGHT,INSIGHT,分析家或用编程分析家或用编程方法检验五种不同品牌的胶合板的质量是否有方法检验五种不同品牌的胶合板的质量是否有显著性差异显著性差异?在使用方差分析之前在使用方差分析之前,利用图形进行直观地利用图形进行直观地比较结果是有益的比较结果是有益的.在在InsightInsight中打开中打开SASUSER.VENEER,SASUSER.VENEER,比较不同牌子的胶合板磨损比较不同牌子的胶合板磨损数量:数量:2007200720072007北京大学北京大学北京大学北京大学17单因素方差分析 用用INSIGHTINSIGHT进行进行探索数据探索数据 选选 分析分析(Analyze)Analyze)盒盒形形图图/马马赛赛克克图图(Box Plot/Mosaic Plot)(Y)(Y)在弹出的对话窗选中品牌在弹出的对话窗选中品牌BRAND,BRAND,点击点击X X 选中选中磨损数量磨损数量WEARWEAR,点击点击Y Y 确定确定(OK)(OK)。则在输出结果窗中给出则在输出结果窗中给出5种不同牌子的盒形图种不同牌子的盒形图.2007200720072007北京大学北京大学北京大学北京大学18单因素方差分析 用用INSIGHTINSIGHT进行进行探索数据探索数据2007200720072007北京大学北京大学北京大学北京大学19单因素方差分析 用用INSIGHTINSIGHT进行进行探索数据探索数据 为了更清楚地显示不同牌子的胶合板的均值为了更清楚地显示不同牌子的胶合板的均值和方差的信息和方差的信息,可在图形左下角的下拉菜单中选可在图形左下角的下拉菜单中选中中:均值均值(Means)Means)、值、值(Values)Values)和和 取消观测取消观测(Observations).Observations).从从图图上上可可以以看看出出,五五种种牌牌子子测测试试结结果果标标准准差差的的差差异异并并不不显显著著(菱菱形形的的高高度度差差异异不不大大),均均值值间间有有一一定定的的差差异异.但但在在统统计计上上差差异异是是否否显显著著还还需要行方差分析需要行方差分析.2007200720072007北京大学北京大学北京大学北京大学20单因素方差分析 用用INSIGHTINSIGHT进行进行单因素方差分析方差分析 探探索索完完数数据据以以后后,接接着着进进行行方方差差分分析析.在在使使用用InsightInsight进行方差分析时自变量进行方差分析时自变量X必须是列名型的。必须是列名型的。选选 分析分析(Analyze)Analyze)拟合拟合(Fit)Fit)(X YX Y)在弹出的拟合窗选中自变量在弹出的拟合窗选中自变量BRAND,BRAND,点击点击X 选中因变量选中因变量 WEAR,点击点击 Y 确定确定(OK).在随即显示的分析结果中包含若干个表:在随即显示的分析结果中包含若干个表:第第一一个个表表提提供供拟拟合合模模型型的的一一般般信信息息:(1)WEAR=BRAND表表示示这这个个分分析析是是以以WEAR为为因因变变量量,BRAND为自变量的线性模型;为自变量的线性模型;2007200720072007北京大学北京大学北京大学北京大学21单因素方差分析 用用INSIGHTINSIGHT进行进行单因素方差分析方差分析 (2)(2)响响应应分分布布是是正正态态分分布布,因因为为这这是是缺缺省省的的分分布布,要要这这一一分分析析成成立立,误误差差项项应应该是近似正态分布的该是近似正态分布的.(3)(3)关关联联函函数数提提供供数数据据中中响响应应变变量量和和模模型型中中的的响响应应变变量量间间的的联联系系.在在这这个个例例子子中中,因因为为在在模模型型拟拟合合前前没没有有对对响响应应变变量量进进行行任任何何变变换换,所所以以关关联联函函数数是是恒恒等等函函数数:g()=.2007200720072007北京大学北京大学北京大学北京大学22单因素方差分析 用用INSIGHTINSIGHT进行进行单因素方差分析方差分析 第第二二、第第三三张张表表提提供供自自变变量量的的取取值值水水平平的的信息:信息:即即BRAND为为列列名名型型的的,有有五五个个水水平平,在在设设定定标标识识变变量量的的时时侯侯,P_2P_2、P_3P_3、P_4P_4、P_5P_5和和P_6P_6分分别别为为ACME、AJAX、CHANP、TUFFY和和XTRA 五五个牌子的标识变量个牌子的标识变量.2007200720072007北京大学北京大学北京大学北京大学23单因素方差分析 用用INSIGHTINSIGHT进行进行单因素方差分析方差分析 为了用一般线性模型来描述因变量为了用一般线性模型来描述因变量WearWear与自与自变量变量BrandBrand(因素或分类变量因素或分类变量)间的线性关系式间的线性关系式,把分类变量把分类变量BrandBrand数量化数量化,引入引入4 4个标识变量个标识变量Z1 1,Z2 2,Z3 3,Z4 4,并令并令 Brand Brand Z1 1 Z2 2 Z3 3 Z4 4 ACME 1 0 0 0 AJAX 0 1 0 0 CHANP 0 0 1 0 TUFFY 0 0 0 1 XTRA 0 0 0 02007200720072007北京大学北京大学北京大学北京大学24单因素方差分析 用用INSIGHTINSIGHT进行进行单因素方差分析方差分析 以下把方差分析模型写成一般以下把方差分析模型写成一般线性模型线性模型:(注意注意:k k =)当取第当取第i个水平时个水平时,即即(zi1 1,zi(k-1)-1)=(0,)=(0,1,1,0),0)(第第i个元素为个元素为1 1的的k-维向量维向量).).若用若用INSIGHTINSIGHT的记号的记号,线性模型表为线性模型表为:当取第当取第i个水平时个水平时,即即(_2,_k)=(0,)=(0,1,1,0),0),(此例此例k=5,=5,为第为第i个元素为个元素为1 1的维向量的维向量).).2007200720072007北京大学北京大学北京大学北京大学25单因素方差分析 用用INSIGHTINSIGHT进行进行单因素方差分析方差分析 第第四四张张表表给给出出响响应应变变量量均均值值关关于于自自变变量量不不同同水水平平的模型方程式的模型方程式:若若变变量量BRAND(牌牌子子)为为ACME,ACME,则则P_2P_2为为1,1,其其他他为为0 0;若牌子为若牌子为AJAX,AJAX,则则P_3P_3为为1,1,其他为其他为0,0,以此类推以此类推.由模型方程式可得出各品牌下磨损量均值的估计值由模型方程式可得出各品牌下磨损量均值的估计值.如品牌如品牌ACMEACME的磨损量均值估计为的磨损量均值估计为 2.3750-0.05=2.3750-0.05=2.325;2.325;而品牌而品牌XTRAXTRA的磨损量均值为的磨损量均值为 2.3750.2.3750.2007200720072007北京大学北京大学北京大学北京大学26单因素方差分析 用用INSIGHTINSIGHT进行进行单因素方差分析方差分析第五张表给出模型拟合的汇总信息:第五张表给出模型拟合的汇总信息:1 1、响响应应变变量量的的均均值值(Mean Mean of of ResponseResponse),即即变变量量WEAR 20WEAR 20次试验结果次试验结果的平均值的平均值2.3450;2 2、均均方方误误差差平平方方根根(Root Root MSEMSE)为为误误差差项项(假假定定误差项有等方差)的标准差的估计值。误差项有等方差)的标准差的估计值。3 3、R平方是判定平方是判定(决定决定)系数系数(coefficient ofcoefficient of determination),determination),阐阐明明了了自自变变量量所所能能描描述述的的变变化化在在全全部部校校正正平平方方和和中中的的比比例例。它它的的值值总总在在0 0和和1 1之之间间,若其值若其值:2007200720072007北京大学北京大学北京大学北京大学27单因素方差分析 用用INSIGHTINSIGHT进行进行单因素方差分析方差分析 1 1)接接近近于于0 0,自自变变量量(因因素素)不不能能说说明明指指标标数数据的大部分变异;据的大部分变异;2 2)接接近近于于1 1,自自变变量量说说明明数数据据的的变变化化中中的的一一个个相相对对较较大大的的比比例例.虽虽然然希希望望R平平方方接接近近于于1 1,但但对对R平平方方大大小小的的判判定定还还依依赖赖于于问问题题的的具具体体内容。内容。4 4、校校正正R平平方方(Aaj Aaj R-SqR-Sq)是是类类似似于于R平平方方的的统统计计量量,但但它它随随模模型型中中的的参参数数的的个个数数而而修修正正,尤尤其其在在回回归归分分析析中中比比较较拟拟合合同同一一数数据据的的不不同同模模型时,校正型时,校正R平方是有用的。平方是有用的。2007200720072007北京大学北京大学北京大学北京大学28单因素方差分析 用用INSIGHTINSIGHT进行进行单因素方差分析方差分析 第六张方差分析表包含对模型效果显著性的假设第六张方差分析表包含对模型效果显著性的假设检验检验H H0 0:1=2=.=k 1 1、一般、一般,自由度自由度(DF)DF)可想象为独立信息源的个数可想象为独立信息源的个数.模型自由度(模型自由度(Model DFModel DF)是处理数减)是处理数减1 1;校校正正平平方方和和的的总总自自由由度度(C C totaltotal)是是样样本本容容量量20减减1 1;2007200720072007北京大学北京大学北京大学北京大学29单因素方差分析 用用INSIGHTINSIGHT进行进行单因素方差分析方差分析2 2、模型平方和(、模型平方和(SS ModelSS Model)汇总了组间差异;)汇总了组间差异;误差平方和(误差平方和(SS ErrorSS Error)汇总了组内差异)汇总了组内差异;全部校正平方和(全部校正平方和(SS C-TotalSS C-Total)=SSM+SSE=SSM+SSE。3 3、均均方方(Mean Mean SquareSquare)是是由由平平方方和和被被相相应应的的自自由由度相除而得到的。度相除而得到的。F统计量统计量 =模型均方(模型均方(MS ModelMS Model)/误差均方(误差均方(MS ErrorMS Error)比比较较F统统计计量量相相应应的的p值值,若若p值值 0.05 0.05=,则则拒拒绝绝原假设,原假设,反之反之则接受原假设。则接受原假设。在在这这里里,p值值=0.0017=0.0017小小于于0.050.05,所所以以拒拒绝绝原原假假设设,即不同牌子的即不同牌子的胶合板的磨损数量有显著差异。胶合板的磨损数量有显著差异。2007200720072007北京大学北京大学北京大学北京大学30单因素方差分析 用用INSIGHTINSIGHT进行进行单因素方差分析方差分析 III型检验用于检验因素型检验用于检验因素(自变量自变量)brand对指标对指标(响应变量响应变量)wear的作用是否的作用是否显著显著.单因素方差分析只考虑一个因素单因素方差分析只考虑一个因素,故故第七张表提供与第六张表本质相同的内第七张表提供与第六张表本质相同的内容容(就是第六张表的第一行就是第六张表的第一行).2007200720072007北京大学北京大学北京大学北京大学31单因素方差分析 用用INSIGHTINSIGHT进行进行单因素方差分析方差分析 在在参参数数估估计计表表中中,有有关关于于不不同同水水平平下下磨磨损损数数量量差异的估计和检验:差异的估计和检验:1 1、根根据据标标识识变变量量规规定定的的方方法法,截截距距项项的的估估计计2.37502.3750是是对对应应牌牌子子XTRA(该该因因素素的的最最后后一一个个水水平平)的的磨磨损损数数量量的的均均值值,其其后后的的 t 检检验验是是检检验验这一均值是否为这一均值是否为0(0(H H0 0:k=0)=0)2007200720072007北京大学北京大学北京大学北京大学32单因素方差分析用用INSIGHTINSIGHT进行进行单因素方差分析方差分析 2 2、ACMEACME后后 的的 估估 计计-0.0500是是 牌牌 子子 ACME与与XTRA磨磨损损量量均均值值之之差差(1-k=1 1)的的估估计计值值,其其后后的的t检检验验也也是是检检验验这这两两个个磨磨损损量量均均值值之之差差 1 1是否为是否为0.0.由由于于p值值为为0.63130.05,所所以以ACME和和XTRA两个牌子的磨损指数没有显著差异的两个牌子的磨损指数没有显著差异的.从这里我们还可以得到从这里我们还可以得到 1 1的估计值为的估计值为 2.375-0.050=2.325.2007200720072007北京大学北京大学北京大学北京大学33单因素方差分析用用INSIGHTINSIGHT进行进行单因素方差分析方差分析 3 3、在在表表中中还还有有容容差差(Tolerance)和和方方差差膨膨胀胀因因子子(Variance inflation factors),在在单单因因素素方方差差分分析析中中没没有有提提供供什什么么信信息息,在在多多元元回回归归分析中将考察这些统计量分析中将考察这些统计量.再接下来的一行再接下来的一行AJAX后的估计后的估计-0.325-0.325 是是品牌品牌AJAX与与XTRA磨损磨损量量均值之差的估计值均值之差的估计值,并检验均值差是否为并检验均值差是否为0.0.由于由于p值为值为0.00620.00620.05,0.05,这说明这两个品牌的磨损这说明这两个品牌的磨损量量均值有显著均值有显著差异差异.其余几行也是估计和检验别的品牌与其余几行也是估计和检验别的品牌与XTRAXTRA磨损磨损量量均值的差异均值的差异.2007200720072007北京大学北京大学北京大学北京大学34单因素方差分析用用INSIGHTINSIGHT进行进行单因素方差分析方差分析-考察模型假定考察模型假定 在在显显示示结结果果窗窗的的底底部部有有一一个个残残差差对对预预测测值值的的散散点点图图,这这个个图图可可以以帮帮助助校校验验模模型型的的假假定定.从从图图中中看看出出,残残差差有有大大体体随随机机的的散散布布,它它表表明明等等方方差差的的假假设设并并没没问问题题.2007200720072007北京大学北京大学北京大学北京大学35单因素方差分析用用INSIGHTINSIGHT进行进行单因素方差分析方差分析-考察模型假定考察模型假定 为为了了验验证证残残差差为为正正态态分分布布的的假假定定,回回到到数数据据窗窗.可可以以看看到到残残差差和和预预测测值值已已加加到到数数据据集集之之中中,可可以以用用分分布布Distribution(Y)来来验验证证残残差差的的正正态性态性.选:选:1、分析、分析(Analyze)分布分布(Distribution)(Y),R_WEAR Y,OK;2、曲线、曲线(Curves)分布检验分布检验(Test for Distribution)选中选中正态正态 在在Test for Distribution表表中中看看到到,p值值大大于于0.05,不不能能拒拒绝绝原原假假设设,表表明明没没有有破破坏坏正正态态性性的假定的假定.2007200720072007北京大学北京大学北京大学北京大学36单因素方差分析用分析员应用作单因素方差分析用分析员应用作单因素方差分析 1 1、在分析员应用中打开、在分析员应用中打开SASUSER.VENEERSASUSER.VENEER;2 2、选、选 统计统计 方差分析方差分析 单向方差分析;单向方差分析;3 3、在在弹弹出出的的单单向向ANOVA窗窗中中选选模模型型的的因因变变量量和变量和变量:BRAND BRANDIndependentIndependent,WEARWEARDependentDependent;若要作图或进行多重比较若要作图或进行多重比较,可点击可点击Plots或或MeansMeans.比比如如在在这这里里我我们们点点击击Plots键键,并并选选择择绘绘制制均均值值图图,在在均均值值图图选选项项中中条条形形高高度度选选为为2倍倍均均值值的的标标准准差差OKOK.2007200720072007北京大学北京大学北京大学北京大学37单因素方差分析用分析员应用作单因素方差分析用分析员应用作单因素方差分析 2007200720072007北京大学北京大学北京大学北京大学38单因素方差分析用分析员应用作单因素方差分析用分析员应用作单因素方差分析 输出的方差分析表输出的方差分析表,汇总统计量及单个因素对指标汇总统计量及单个因素对指标作用是否显著的检验结果见下表作用是否显著的检验结果见下表.汇总信息汇总信息方差分析表方差分析表因素效应因素效应的检验的检验2007200720072007北京大学北京大学北京大学北京大学39单因素方差分析用分析员应用作单因素方差分析用分析员应用作单因素方差分析 因素因素Brank(品牌品牌)各水平下磨损量的均值图各水平下磨损量的均值图2007200720072007北京大学北京大学北京大学北京大学40单因素方差分析 ANOVA和和GLM过程的程的简单用法用法PROC GLM DATA=数据集名;CLASS 变量名列;MODEL 因变量名列=自变量名列;RUN;在在SAS/STAT模块中提供多个模块中提供多个PROC实现方差分析的实现方差分析的功能功能:GLM:一般线性模型,有均值检验与比较功能:一般线性模型,有均值检验与比较功能;ANOVA:用于均衡设计观测数据的方差分析:用于均衡设计观测数据的方差分析;TTEST:两独立样本均值的比较:两独立样本均值的比较.其他:其他:NESTED,VARCOMP,REG,CATMOD,NPAR1WAY PLAN 2007200720072007北京大学北京大学北京大学北京大学41单因素方差分析 ANOVA和和GLM过程的程的简单用法用法-例子例子 例例1.1(胶合板磨胶合板磨损试验):为比比较5种不同品牌种不同品牌产品的品的质量量,每种每种抽取抽取4个做磨个做磨损试验.试用用编程的方法比程的方法比较种品牌的种品牌的质量有无量有无显著差异著差异.解解:proc anova data=veneer;class brand;model wear=brand;run;或或 proc glm data=veneer;class brand;model wear=brand;run;(Anova11.sas)结论结论:由方差分析表由方差分析表或因素的效应检验或因素的效应检验结果可知结果可知:F=7.40,=7.40,p=0.0017=0.00170.050.05故五种品牌的质量故五种品牌的质量有显著差异有显著差异.2007200720072007北京大学北京大学北京大学北京大学42单因素方差分析 ANOVA和和GLM过程的程的简单用法用法-例子例子 例例1.2(饲料料对比比试验):为比比较种不同的种不同的饲料料配方配方对养养鸡增肥的效果增肥的效果,每种每种饲料配方各喂养料配方各喂养10只小只小鸡,于于60天后天后测量其重量量其重量.试用用编程的方法程的方法比比较种种饲料配方料配方对小小鸡增肥的效果有无增肥的效果有无显著著差异差异.(Anova12.sas)data d12(drop=i);input type$;do i=1 to 10;input y;output;end;cards;A 1073 1058 1071 1037 1066 1026 1053 1049 1065 1051B 1016 1058 1038 1042 1020 1045 1044 1061 1034 1049C 1084 1069 1106 1078 1075 1090 1079 1094 1111 1092;解解:2007200720072007北京大学北京大学北京大学北京大学43单因素方差分析 ANOVA和和GLM过程的简单用法过程的简单用法-例子例子proc anova data=d12;class type;model y=type;means type;run;proc glm data=d12;class type;model y=type;run;quit;ANOVAANOVA过程输出的方差分析表过程输出的方差分析表2007200720072007北京大学北京大学北京大学北京大学44单因素方差分析 ANOVA和和GLM过程的简单用法过程的简单用法-例子例子ANOVAANOVA过程输出的各水平下均值的估计值过程输出的各水平下均值的估计值结论结论:饲料配方对小鸡增肥的效果有显著影响饲料配方对小鸡增肥的效果有显著影响;且配方且配方C对小鸡增肥的效果最好对小鸡增肥的效果最好.2007200720072007北京大学北京大学北京大学北京大学45多因素方差分析 在在上上面面介介绍绍的的单单因因素素方方差差分分析析中中,所所研研究究的的指指标标(因因变变量量)只只受受一一个个因因素素(自自变变量量)不不同同水水平平的的影影响响。但但在在一一些些实实际际问问题题中中,影影响响指指标标(因因变变量量)的的因因素素(自自变变量量)不不止止一一个个,这这就就要要考考虑虑两两个个或或多多个个因因素素的的问问题题.另另这这些些因因素素间间还还可可能能存存在在交交互互作作用用,即即这这些些因因素素的的水水平平之之间间的的不不同同搭搭配配对对指指标标可可能能有影响有影响.2007200720072007北京大学北京大学北京大学北京大学46多因素方差分析不存在交互作用的多因素方差分析不存在交互作用的多因素方差分析 例例2.1(驱驱虫虫剂剂药药效效试试验验):在在数数据据集集PESTCIDEPESTCIDE中中,记记录录了了用用五五种种不不同同配配方方的的驱驱虫虫剂剂在在三三个个住住宅宅中中实实验验的的结结果果,变变量量PCTLOSSPCTLOSS记记录录了了驱驱虫虫剂剂使使用用一一周周后后药药效效损损耗耗的的百百分分比比,这这是是衡衡量量驱驱虫虫剂剂持持续续使使用用效效果果的的主主要要标标志志,分分类类变变量量BLOCKBLOCK和和BLENDBLEND分分别别表表示示该该实实验验所所在在的的住住宅宅和和驱驱虫虫剂剂的的代代号号。确确定定哪哪种种驱驱虫虫剂剂最最长长效效是是实实验验的的主主要要目目的的。但但是是因因为为环环境境条条件件不不同同一一种种驱驱虫虫剂剂在在不不同同的的住住宅宅可可能能有有不不同同的的效效果果。若若将将不不同同驱驱虫虫剂剂使使用用于于不不同同的的住住宅宅,则则会会将将驱驱虫虫剂剂不不同同的的差差异异与与住住宅宅不不同同的的影影响响混混淆淆在在一一起起,无无法法区区分分出出好好的的驱驱虫虫剂剂,为为此此可可在在每每个个住住宅宅的的不不同同房房间间随随机机地地试试用用一一种种驱驱虫虫剂剂。试试用用方方差差分分析析将将驱驱虫虫剂剂不不同同和和住住宅宅不不同同的的影影响响区区分分开开来来。这这种种实实验验方方式式又又称称随随机机化化实实验验。每每个个住住宅宅称称为为一个区组。一个区组。2007200720072007北京大学北京大学北京大学北京大学47多因素方差分析不存在交互作用的多因素方差分析不存在交互作用的多因素方差分析2007200720072007北京大学北京大学北京大学北京大学48多因素方差分析不存在交互作用的多因素方差分析不存在交互作用的多因素方差分析 较较为为一一般般的的是是考考虑虑有有重重复复观观测测的的情情形形。若若第第一一个个因因素素A A有有l个个水水平平,第第二二个个因因素素B B有有m水水平平。在在因因素素A A的的第第i个个水水平平和和因因素素B B的的第第j个个水水平平下下进进行行了了多多次次观观测测,记记为为 Xijk,11kn,对,对Xijk考虑以下模型:考虑以下模型:Xijk=+i+j+ijk ,(11kn ,11il,11jm)其其中中表表示示总总平平均均的的效效应应,i 和和j分分别别表表示示因因素素A A的的第第i个个水水平平和和因因素素B B的的第第j个个水水平平的的附附加加效效应应,ijk为为误误差差,同同样样这这里里的的误误差差也也假假定定它它是是独独立立的的并并且且是是等等方方差差的的正正态分布。态分布。以上模型中假设两因素没有存在交互作用以上模型中假设两因素没有存在交互作用.2007200720072007北京大学北京大学北京大学北京大学49多因素方差分析不存在交互作用的多因素方差分析不存在交互作用的多因素方差分析 为为了了说说明明因因素素A A对对指指标标有有无无显显著著影影响响,就就是要检验如下假设:是要检验如下假设:H H0 0:1 =2 2=l =0=0 ,H H1 1:1 1,2 2,l不全等于不全等于0 0;为为了了说说明明因因素素B B对对指指标标有有无无显显著著影影响响,就就是是要检验如下假设:要检验如下假设:H H0 0:1 1=2 2=m =0=0 ,H H1 1:1 1,2 2,m不全等于不全等于0 0;而而模模型型无无显显著著效效果果是是指指以以上上两两个个假假设设的的原原假假设设同时成立。同时成立。2007200720072007北京大学北京大学北京大学北京大学50多因素方差分析用用Insight作多因素方差分析并进行说明作多因素方差分析并进行说明 1 1、在、在InsightInsight中打开中打开PESTCIDEPESTCIDE;2 2、由由于于在在InsightInsight中中,要要求求方方差差分分析析中中的的自自变变量量必必须须是是列列名名型型的的,故故先先把把变变量量BLOCKBLOCK的的测测量水平由区间型改为列名型;量水平由区间型改为列名型;3 3、分析、分析(Analyze)(Analyze)拟合拟合(Fit)(X Y(Fit)(X Y),),规定分类变量规定分类变量(因素因素)BLOCKXBLOCKX,BLENDXBLENDX,规定响应变量规定响应变量(指标指标)PCTLOSS YPCTLOSS Y;在在随随即即显显示示的的分分析析结结果果中中的的几几张张表表的的含含义义与与单因素方差分析相应的表的功能是类似的:单因素方差分析相应的表的功能是类似的:2007200720072007北京大学北京大学北京大学北京大学51多因素方差分析用用Insight作多因素方差分析并进行说明作多因素方差分析并进行说明 第一张表提供了模型的一般信息第一张表提供了模型的一般信息.第第二二张张表表列列举举了了作作为为分分类类变变量量的的BLOCKBLOCK和和BLENDBLEND的水平的信息:的水平的信息:2007200720072007北京大学北京大学北京大学北京大学52多因素方差分析用用Insight作多因素方差分析并进行说明作多因素方差分析并进行说明 第第三三张张参参数数信信息息表表给给出出了了标识变量标识变量P_iP_i的定义的定义:当当BLOCK=1BLOCK=1时时,P_2=1,P_2=1,而而P_3=0,P_4=0;P_3=0,P_4=0;否则否则P_2=0,P_2=0,而某个而某个P_i=1(i=3P_i=1(i=3或或4).4).其其他类似;他类似;当当BLEND=ABLEND=A时时,P_5=1,P_5=1,而而其余其余P_i=0(i=6,7,8,9);P_i=0(i=6,7,8,9);否则否则P_5=0,P_5=0,而某个而某个P_i=1 P_i=1(i=6).(i=6).其他类似其他类似.当当BLOCK=2,BLEND=C时,时,P31,P71,其余的其余的Pi=0(i=2,4,5,6,8,9)2007200720072007北京大学北京大学北京大学北京大学53多因素方差分析用用Insight作多因素方差分析并进行说明作多因素方差分析并进行说明 第四张表给出了第四张表给出了模型方程模型方程:利利用用参参数数信信息息表表中中标标识识变变量量的的定定义义可可以以推推算算出出在在各各个个因因素素不不同同水水平平下下变变量量PCTLOSSPCTLOSS均均值值的的估计信息。估计信息。比如当比如当BLOCK=1,BLEND=ABLOCK=1,BLEND=A时时,变量变量PCTLOSSPCTLOSS均值均值的估计值为的估计值为19.16-0.8-1.8333=16.5267.当当BLOCK=BLOCK=3,BLEND=E,BLEND=E时时,变量变量PCTLOSSPCTLOSS均值的估均值的估计值为计值为19.16.2007200720072007北京大学北京大学北京大学北京大学56多因素方差分析用用Insight作多因素方差分析并进行说明作多因素方差分析并进行说明 在第六张方差分析表中:在第六张方差分析表中:检检验验模模型型显显著著性性的的F统统计计量量为为2.52,相相应应的的p p值值为为0.1133 0.05=;=;所所以以无无法法拒拒绝绝BLENDBLEND和和BLOCKBLOCK对对分分析析变变量量(指指标标)PCTLOSS)PCTLOSS无无显显著著影影响响的的假设,即模型是不显著的假设,即模型是不显著的.2007200720072007北京大学北京大学北京大学北京大学57多因素方差分析用用Insight作多因素方差分析并进行说明作多因素方差分析并进行说明 在第七张在第七张型型(各因素效应各因素效应)检验表中:检验表中:进进一一步步将将模模型型平平方方和和分分解解为为属属于于BLOCK和和BLEND的的平平方方和和。在在模模型型显显著著的的情情况况下下常常需需要要进进一一步步分分析析两两个个因因素素是是否否都都有有显显著著影影响响或或者者只只有有一一个个因因素素是是显显著著的的,这这时时就就需需要要用用到到这这张张表表提提供供的的信信息息。在在这这里里两两个个因因素素的的p值值都都大大于于0.05,再再一一次次说说明明了了这这两个因素对指标两个因素对指标PCTLOSS都无显著影响。都无显著影响。2007200720072007北京大学北京大学北京大学北京大学58多因素方差分析用用Insight作多因素方差分析并进行说明作多因素方差分析并进行说明 第九张表为参数第九张表为参数(均值或效应均值或效应)的估计表的估计表.2007200720072007北京大学北京大学北京大学北京大学59多因素方差分析用用Insight作多因素方差分析并进行说明作多因素方差分析并进行说明 第九张参数估计表第九张参数估计表(l=3,=3,m=5)=5):参数估计表也是根据标识变量的定义参数估计表也是根据标识变量的定义,对参数或不同水平下参数之差进行估计和对参数或不同水平下参数之差进行估计和检验检验.例如第一行是对例如第一行是对BLOCK=3,BLEND=EBLOCK=3,BLEND=E水平下均水平下均值值 35(lm)的估计和检验的估计和检验;第二行是第二行是BLOCK=1,BLEND=EBLOCK=1,BLEND=E水平下的均值水平下的均值 15与与BLOCK=3,BLEND=EBLOCK=3,BLEND=E水平下的均值水平下的均值 35之差之差 15的的估计与检验估计与检验.根据根据t 统计量的统计量的p值来检验两个水平值来检验两个水平下均值是否有显著差异下均值是否有显著差异.2007200720072007北京大学北京大学北京大学北京大学60多因素方差分析用用Insight作多因素方差分析并进行说明作多因素方差分析并进行说明 考察模型假定:考察模型假定:在在显显示示窗窗的的底底部部有有一一个个残残差差对对预预测测值值的的散散点点图图,可可以以象象单单因因素素分分析析一一样样考考察察残残差差分布的正态性假定分布的正态性假定.2007200720072007北京大学北京大学北京大学北京大学61多因素方差分析用分析员应用作多因素方差分析用分析员应用作多因素方差分析 在分析员应用环境下调入数据后,选:在分析员应用环境下调入数据后,选:统计统计方差分析方差分析(ANOVA)ANOVA)因子方差分析,因子方差分析,PCTLOSS PCTLOSS Dependent Dependent,BLENDBLEND、BLOCK BLOCK Independent Independent;若若要要得得到到用用图图形形表表示示的的两两个个因因素素不不同同水水平平下均值和标准差的信息,可按下均值和标准差的信息,可按 Plots键键,在在Means Plots框框中中选选上上Plots Dependent Means for Main Effects(作作主主效效应应响响应应均均值值图图)。2007200720072007北京大学北京大学北京大学北京大学62多因素方差分析用编程用编程作多因素方差分析作多因素方差分析data pestcide;input block blend$pctloss;cards;1 B 18.2 1 A 16.3 1 C 17.0 1 E 18.3 1 D 15.12 A 16.5 2 E 18.3 2 B 19.2 2 C 18.1 2 D 16.03 B 17.1 3 D 17.8 3 C 17.3 3 E 19.8 3 A 17.5;Proc anova data=pestcide;class block blend;model pctloss=block blend;Run;Quit;(anova21.sas)2007200720072007北京大学北京大学北京大学北京大学63多因素方差分析用编程用编程作多因素方差分析作多因素方差分析 由方差分析表可得出由方差分析表可得出 模型的均方模型的均方 MSM=2.2006667MSM=2.2006667 误差的均方误差的均方 MSE=0.874(MSE=0.874(作为作为 2 2的估计的估计)F 统计量的值为统计量的值为2.522.52,相应的显著性概率值相应的显著性概率值 p=0.1133=0.11330.05,0.05,这表明在这表明在=0.05=0.05的水平下不能否定的水平下不能否定BlockBlock和和BlandBland对指标没有显著影响的假设对指标没有显著影响的假设(i=0=0且且 j=0)=0).2007200720072007北京大学北京大学北京大学北京大学64多因素方差分析用编程用编程作多因素方差分析作多因素方差分析 由各因素效应检验的结果可得出由各因素效应检验的结果可得出 检验检验H H0 0:1 =2 2=l =0=0 ,F 统计量的值为统计量的值为0.940.94,相应的显著性概率值相应的显著性概率值 p=0.4289=0.42890.05,0.05,这表明在这表明在=0.05=0.05的水平下不能否定的水平下不能否定BlockBlock对指标没有显对指标没有显著影响的假设著影响的假设.检验检验H H0 0:1 1=2 2=m =0=0 ,F 统计量的值为统计量的值为3.313.31,相应的显著性概率值相应的显著性概率值 p=0.0705=0.07050.05,0.05,这表明在这表明在=0.05=0.05的水平下不能否定的水平下不能否定BlandBland对指标没有显对指标没有显著影响的假设著影响的假设.两个因素中两个因素中BlandBland比比BlockBlock重要些重要些(0.07(0.070.42)0.42)2007200720072007北京大学北京大学北京大学北京大学65多因素方差分析存在交互作用的多因素方差分析存在交互作用的多因素方差分析 在在多多因因素素的的问问题题中中,例例如如考考察察添添加加剂剂和和工工艺艺条条件件对对产产品品产产量量的的影影响响,不不同同的的添添加加剂剂会会要要求求不不同同的的工工艺艺条条件件,在在一一种种工工艺艺条条件件下下有有效效的的添添加加剂剂,在在另另一一种种工工艺艺条条件件下下可可能能是是完完全全无无效效的的.这这种种现现象象,就就是是两两者者对对产产量量的的影影响响不不是是两两者者效效果果的的简简单单叠叠加加,而而是是两两种种因因素素不不同同水水平平之之间间的的搭搭配配对对产产量量有有影影响响.在在方方差差分分析析中中称称为为两两个个因因素素存存在在交交互作用互作用.2007200720072007北京大学北京大学北京大学北京大学66多因素方差分析存在交互作用的多因素方差分析存在交互作用的多因素方差分析例例2.22.2 例例2.2(肥肥料料和和种种子子对对产产量量的的影影响响):在在数数据据集集DST.FCTORIALDST.FCTORIAL中中,记记录录了了不不同同的的种种子子处处理理方方法法和和不不同同施施肥肥水水平平对对农农作作物物产产量量的的影影响响.变变量量YIELDYIELD表表示示产产量量,METHODMETHOD和和VARIETYVARIETY分分别别表表示示处处理理方方法法和和施施肥肥水水平平.关关心心的的是是这这两两个个因因素素对对产产量量的的影影响响,在在这这个个例例子子中中,不不同同的的种种子子处处理理方方法法对对不不同同的的施施肥肥水水平平可可能能有有不不同同的的反反应应,所所以以要要考虑存在交互作用的模型考虑存在交互作用的模型.2007200720072007北京大学北京大学北京大学北京大学67多因素方差分析存在交互作用的多因素方差分析存在交互作用的多因素方差分析 对对于于存存在在交交互互作作用用的的观观测测 Xijk,采采用用以以下下的模型:的模型:Xijk=+i+j+ij+ijk ,(1(1kn,11il,11jm)其其中中表表示示平平均均的的效效应应,i 和和j分分别别表表示示因因素素A A的的第第i个个水水平平和和因因素素B B的的第第j个个水水平平的的附附加加效效应应,ij 表表示示因因素素A A的的第第i个个水水平平和和因因素素B B的的第第j个个水水平平交交互互作作用用的的附附加加效效应应.ijk为为误误差差,这这里里也也假假定它是独立的并且是等方差的正态分布定它是独立的并且是等方差的正态分布.2007200720072007北京大学北京大学北京大学北京大学68多因素方差分析存在交互作用的多因素方差分析存在交互作用的多因素方差分析 为为了了说说明明交交互互作作用用有有无无显显著著影影响响,就就是是要要检检验如下假设:验如下假设:H H0 0:11=12=lm=0 ,H H1 1:11、12、lm不全为零;不全为零;所所以以在在多多因因素素方方差差分分析析中中,在在多多因因素素无无交交互互作作用用方方差差分分析析所所作作检检验验的的基基础础上上,还还要要加加上上对对有有无无交互作用的检验交互作用的检验.2007200720072007北京大学北京大学北京大学北京大学69多因素方差分析用分析员应用作多因素方差分析用分析员应用作多因素方差分析例例2.22.2 在分析员应用环境下调入数据后,选:在分析员应用环境下调入数据后,选:1 1、统计统计方差分析方差分析因子方差分析,因子方差分析,YIELDYIELDDependent,Dependent,METHOD METHOD、VARIETYVARIETYIndependentIndependent;2 2、点击、点击ModelModel,在弹出的建模菜单中选:,在弹出的建模菜单中选:点点 Standard Models选选 Effects up to 2-way interactions。注注意意表表示示交交互互作作用用的的VARIETY*METHODVARIETY*METHOD加加入入了了模型效应拦。模型效应拦。显示的结果也包含方差分析表和汇总信息。显示的结果也包含方差分析表和汇总信息。2007200720072007北京大学北京大学北京大学北京大学70多因素方差分析用分析员应用作多因素方差分析用分析员应用作多因素方差分析例例2.22.2 方差分析表方差分析表汇总信息汇总信息型检验表型检验表-各因素效各因素效应的检验应的检验2007200720072007北京大学北京大学北京大学北京大学71多因素方差分析用分析
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 生活常识


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!