多元统计学ppt课件-方差分析

上传人:txadgkn****dgknqu... 文档编号:241604867 上传时间:2024-07-08 格式:PPT 页数:119 大小:1.42MB
返回 下载 相关 举报
多元统计学ppt课件-方差分析_第1页
第1页 / 共119页
多元统计学ppt课件-方差分析_第2页
第2页 / 共119页
多元统计学ppt课件-方差分析_第3页
第3页 / 共119页
点击查看更多>>
资源描述
方差分析方差分析ANOVA(analysis of variance)方差分析方差分析ANOVA(analysis of varianc1竞争者数量对销售额影响的分析竞争者数量对销售额影响的分析竞竞争者数量争者数量对销对销售售额额影响的分析影响的分析2本章主要内容本章主要内容n n方差分析的基本原理方差分析的基本原理n n单因子方差分析单因子方差分析n n多因子方差分析多因子方差分析n n协方差分析协方差分析本章主要内容方差分析的基本原理本章主要内容方差分析的基本原理3方差分析的基本原理方差分析的基本原理n n方差分析及其有关术语方差分析及其有关术语n n方差分析的基本思想和原理方差分析的基本思想和原理n n方差分析的基本假定方差分析的基本假定n n问题的一般提法问题的一般提法方差分析的基本原理方差分析及其有关方差分析的基本原理方差分析及其有关术语术语4n在现实的生产和经营管理过程中,影响产品质量、在现实的生产和经营管理过程中,影响产品质量、数量或销量的因素往往很多,如农作物的收获量受数量或销量的因素往往很多,如农作物的收获量受作物品种、肥料种类及数量等的影响;超市不同位作物品种、肥料种类及数量等的影响;超市不同位置、竞争者数量对超市销售额的影响置、竞争者数量对超市销售额的影响;大学生性别、大学生性别、年级、专业类别、家庭类型、恋爱状态因素对大学年级、专业类别、家庭类型、恋爱状态因素对大学生消费的影响。在众多因素中,有些因素影响大些,生消费的影响。在众多因素中,有些因素影响大些,有些则小些。有些则小些。n现实中常常需要分析哪几种因素对生产或销售起显现实中常常需要分析哪几种因素对生产或销售起显著影响,并需知道起显著作用的因素如何进行最优著影响,并需知道起显著作用的因素如何进行最优组合,可以获得最理想的效果。组合,可以获得最理想的效果。n方差分析是解决这些问题的一种有效方法方差分析是解决这些问题的一种有效方法什么是方差分析什么是方差分析在在现实现实的生的生产产和和经营经营管理管理过过程中,影响程中,影响产产品品质质量、数量或量、数量或销销量的因素量的因素5【例例例例3.13.13.13.1】为了对几个行业的服务质量进行评价,消费者协会为了对几个行业的服务质量进行评价,消费者协会为了对几个行业的服务质量进行评价,消费者协会为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中消在四个行业分别抽取了不同的企业作为样本。最近一年中消在四个行业分别抽取了不同的企业作为样本。最近一年中消在四个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共费者对总共费者对总共费者对总共23232323家企业投诉的次数如下表:家企业投诉的次数如下表:家企业投诉的次数如下表:家企业投诉的次数如下表:消费者对四个行业的投诉问题消费者对四个行业的投诉问题【例【例3.1】为为了了对对几个行几个行业业的服的服务质务质量量进进行行评评价,消价,消费费者者协协会在四会在四6方差分析解决的问题方差分析解决的问题n n分析分析分析分析分类型自变量分类型自变量分类型自变量分类型自变量对对对对数值型因变量数值型因变量数值型因变量数值型因变量是否有显著影是否有显著影是否有显著影是否有显著影响响响响n n分析分析分析分析“不同数量竞争者(四类)不同数量竞争者(四类)不同数量竞争者(四类)不同数量竞争者(四类)”对对对对“销售额销售额销售额销售额”的影的影的影的影响响响响n n分析分析分析分析“行业行业行业行业”对对对对“投诉次数投诉次数投诉次数投诉次数”的影响的影响的影响的影响n n做出这样的判断最终被归结为检验四种情况下的做出这样的判断最终被归结为检验四种情况下的做出这样的判断最终被归结为检验四种情况下的做出这样的判断最终被归结为检验四种情况下的平均销售额(平均投诉次数)是否相等。平均销售额(平均投诉次数)是否相等。平均销售额(平均投诉次数)是否相等。平均销售额(平均投诉次数)是否相等。n n如果均值相等,就意味着如果均值相等,就意味着如果均值相等,就意味着如果均值相等,就意味着“竞争者的数量竞争者的数量竞争者的数量竞争者的数量”对对对对“销售销售销售销售额额额额”(“行业行业行业行业”对对对对“投诉次数投诉次数投诉次数投诉次数”)没有显著影响。)没有显著影响。)没有显著影响。)没有显著影响。方差分析解决的方差分析解决的问题问题分析分分析分类类型自型自变变量量对对数数值值型因型因变变量是否有量是否有显显著影著影7“方差分析方差分析”中中“方差方差”的含义的含义n n19231923年,年,年,年,FisherFisher首先提出了首先提出了首先提出了首先提出了“方差分析方差分析方差分析方差分析”,通常认,通常认,通常认,通常认为他是这一方法的创始人为他是这一方法的创始人为他是这一方法的创始人为他是这一方法的创始人n n“方差分析方差分析方差分析方差分析”所分析的并非是所分析的并非是所分析的并非是所分析的并非是“方差方差方差方差”,而是研究数,而是研究数,而是研究数,而是研究数据间的据间的据间的据间的“变异变异变异变异”,是在可比较的群组中,把总的变,是在可比较的群组中,把总的变,是在可比较的群组中,把总的变,是在可比较的群组中,把总的变异按各指定的变异来源进行分解的一种技巧。异按各指定的变异来源进行分解的一种技巧。异按各指定的变异来源进行分解的一种技巧。异按各指定的变异来源进行分解的一种技巧。n n方差分析检验的是均值是否相等,而不是方差是方差分析检验的是均值是否相等,而不是方差是方差分析检验的是均值是否相等,而不是方差是方差分析检验的是均值是否相等,而不是方差是否相等否相等否相等否相等“方差分析方差分析”中中“方差方差”的含的含义义1923年,年,Fisher首先提出首先提出8方差分析中的有关术语方差分析中的有关术语n n试验指标试验指标试验指标试验指标(指标指标指标指标):):y yn n如亩产,投诉次数如亩产,投诉次数如亩产,投诉次数如亩产,投诉次数n n因子因子因子因子(因素因素因素因素)(factorfactor)n n影响试验指标影响试验指标影响试验指标影响试验指标y y的因素的因素的因素的因素n nA,B,CA,B,Cn n如品种,行业如品种,行业如品种,行业如品种,行业n n因子的水平(处理)(因子的水平(处理)(因子的水平(处理)(因子的水平(处理)(treatmenttreatment)n n因子的不同表现因子的不同表现因子的不同表现因子的不同表现 n n A A1 1,A,A2 2,A,Ar r或或或或 B B1 1,B,B2 2,B,Bs sn n 如五个不同品种,四个行业(零售业、旅游业、航空如五个不同品种,四个行业(零售业、旅游业、航空如五个不同品种,四个行业(零售业、旅游业、航空如五个不同品种,四个行业(零售业、旅游业、航空公司、家电制造业)公司、家电制造业)公司、家电制造业)公司、家电制造业)方差分析中的有关方差分析中的有关术语试验术语试验指指标标(指指标标):y9方差分析中的有关术语方差分析中的有关术语n n观测值观测值n n在每个因子水平下得到的样本数据在每个因子水平下得到的样本数据在每个因子水平下得到的样本数据在每个因子水平下得到的样本数据n ny yij ijn n水平数水平数:r;sn n单因子方差分析单因子方差分析(one-way ANOVA)n n只有一个因子只有一个因子只有一个因子只有一个因子n n多因子方差分析多因子方差分析(MANOVA)n n两个及两个以上的个因子两个及两个以上的个因子两个及两个以上的个因子两个及两个以上的个因子方差分析中的有关方差分析中的有关术语观测值术语观测值10方差分析的基本思想和原理方差分析的基本思想和原理(图形分析图形分析)零售业零售业 旅游业旅游业 航空公司航空公司 家电制造家电制造方差分析的基本思想和原理方差分析的基本思想和原理(图图形分析形分析)11n从从散点图上可以看出散点图上可以看出n不同行业被投诉的次数是有明显差异的不同行业被投诉的次数是有明显差异的n即即使使是是在在同同一一个个行行业业,不不同同企企业业被被投投诉诉的的次次数数也也明明显不同显不同n家电制造业被投诉的次数较高,航空公司被投诉的次数较低家电制造业被投诉的次数较高,航空公司被投诉的次数较低n行行业与被投诉次数之间有一定的关系业与被投诉次数之间有一定的关系n如如果果行行业业与与被被投投诉诉次次数数之之间间没没有有关关系系,那那么么它它们们被被投投诉诉的的次次数数应应该该差差不不多多相相同同,在在散散点点图图上上所所呈呈现现的的模式也就应该很接近模式也就应该很接近从散点从散点图图上可以看出上可以看出12 仅仅从从散散点点图图上上观观察察还还不不能能提提供供充充分分的的证证据据证证明明不不同行业被投诉的次数之间有显著差异同行业被投诉的次数之间有显著差异n这种差异也可能是由于抽样的随机性所造成的这种差异也可能是由于抽样的随机性所造成的n需需要要有有更更准准确确的的方方法法来来检检验验这这种种差差异异是是否否显显著著,也也就是进行方差分析就是进行方差分析n即即通通过过对对数数据据误误差差来来源源的的分分析析判判断断不不同同总总体体的的均均值值是否相等。是否相等。仅仅从散点从散点图图上上观观察察还还不能提供充分的不能提供充分的证证据据证证明不同行明不同行业业被投被投诉诉的的13方差分析的基本思想和原理方差分析的基本思想和原理(两类误差两类误差)n随机误差随机误差n因素的同一水平因素的同一水平(总体总体)下,样本各观察值之间的差异下,样本各观察值之间的差异n比如,同一行业下不同企业被投诉次数是不同的比如,同一行业下不同企业被投诉次数是不同的n这种差异可以看成是随机因素的影响,称为这种差异可以看成是随机因素的影响,称为随机误差随机误差 n系统误差(处理误差)系统误差(处理误差)n因因素素的的不不同同水水平平(不不同同总总体体)下下,各各观观察察值值之之间间具具有有一一定定的的差差异异(如如不不同同行行业业之之间间的的被被投投诉诉次次数数之之间间的的差差异异),这这种种差差异异可可能能是是由由于于抽抽样样的的随随机机性性所所造造成成的的,也也可可能能是是由由于于行行业业本本身身所所造造成成的的,后后者者所所形形成成的的误误差差是是由由系统性因素造成的,称为系统性因素造成的,称为系统误差系统误差方差分析的基本思想和原理方差分析的基本思想和原理(两两类误类误差差)随机随机误误差差14方差分析的基本思想和原理方差分析的基本思想和原理(两类偏差平方和两类偏差平方和)n数据的误差用平方和数据的误差用平方和(sum of squares)表示表示n组内偏差平方和组内偏差平方和(within groups)n因素的同一水平因素的同一水平(同一个总体同一个总体)下样本数据的方差下样本数据的方差n比如,零售业被投诉次数的方差比如,零售业被投诉次数的方差n组内方差只包含组内方差只包含随机误差随机误差n组间偏差平方和组间偏差平方和(between groups)n因素的不同水平因素的不同水平(不同总体不同总体)下各样本之间的方差下各样本之间的方差n比如,四个行业被投诉次数之间的方差比如,四个行业被投诉次数之间的方差n组间方差既包括组间方差既包括随机误差随机误差,也包括,也包括系统误差系统误差方差分析的基本思想和原理方差分析的基本思想和原理(两两类类偏差平方和偏差平方和)数据的数据的误误差用平方差用平方15方差分析的基本思想和原理方差分析的基本思想和原理(两类偏差平方和的比较两类偏差平方和的比较)n若若不不同同行行业业对对投投诉诉次次数数没没有有影影响响,则则组组间间误误差差中中只只包包含含随随机机误误差差,没没有有系系统统误误差差。这这时时,组组间间误误差差与与组组内内误误差差经经过过平均后的数值就应该很接近,它们的比值就会接近平均后的数值就应该很接近,它们的比值就会接近1 1n若若不不同同行行业业对对投投诉诉次次数数有有影影响响,在在组组间间误误差差中中除除了了包包含含随随机机误误差差外外,还还会会包包含含有有系系统统误误差差,这这时时组组间间误误差差平平均均后后的的数数值值就就会会大大于于组组内内误误差差平平均均后后的的数数值值,它它们们之之间间的的比比值值就就会大于会大于1 1n当当这这个个比比值值大大到到某某种种程程度度时时,就就可可以以说说不不同同水水平平之之间间存存在在着显著差异,也就是自变量对因变量有影响着显著差异,也就是自变量对因变量有影响n判判断断行行业业对对投投诉诉次次数数是是否否有有显显著著影影响响,实实际际上上也也就就是是检检验验被被投投诉诉次次数数的的差差异异主主要要是是由由于于什什么么原原因因所所引引起起的的。如如果果这这种种差差异异主主要是系统误差,说明不同行业对投诉次数有显著影响要是系统误差,说明不同行业对投诉次数有显著影响方差分析的基本思想和原理方差分析的基本思想和原理(两两类类偏差平方和的比偏差平方和的比较较)若不同行若不同行业业16n比较两类误差,以检验均值是否相等比较两类误差,以检验均值是否相等n比较的基础是偏差平方和之比比较的基础是偏差平方和之比n如果系统误差显著地不同于随机误差,则均如果系统误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等的值就是不相等的;反之,均值就是相等的方差分析的基本思想和原理方差分析的基本思想和原理比比较较两两类误类误差,以差,以检验检验均均值值是否相等方差分析的基本思想和原理是否相等方差分析的基本思想和原理17方差分析的基本假定方差分析的基本假定n每个每个总体都应服从正态分布总体都应服从正态分布n对对于于因因素素的的每每一一个个水水平平,其其观观察察值值是是来来自自服服从从正正态态分分布总体的简单随机样本布总体的简单随机样本n比如,每个行业被投诉的次数必需服从正态分布比如,每个行业被投诉的次数必需服从正态分布n各个各个总体的方差必须相同总体的方差必须相同n各组观察数据是从具有相同方差的总体中抽取的各组观察数据是从具有相同方差的总体中抽取的n比如,四个行业被投诉次数的方差都相等比如,四个行业被投诉次数的方差都相等n观观察值是独立的察值是独立的n比比如如,每每个个行行业业被被投投诉诉的的次次数数与与其其他他行行业业被被投投诉诉的的次次数独立数独立方差分析的基本假定每个方差分析的基本假定每个总总体都体都应应服从正服从正态态分布分布18方差分析中的基本假定方差分析中的基本假定n在在上上述述假假定定条条件件下下,判判断断行行业业对对投投诉诉次次数数是是否否有有显显著著影影响响,实实际际上上也也就就是是检检验验具具有有同同方方差差的的四个正态总体的均值是否相等四个正态总体的均值是否相等n如如果果四四个个总总体体的的均均值值相相等等,可可以以期期望望四四个个样样本本的均值也会很接近的均值也会很接近n四四个个样样本本的的均均值值越越接接近近,推推断断四四个个总总体体均均值值相相等等的证据也就越充分的证据也就越充分n样样本本均均值值越越不不同同,推推断断总总体体均均值值不不同同的的证证据据就就越越充分充分 方差分析中的基本假定在上述假定条件下,判断行方差分析中的基本假定在上述假定条件下,判断行业对业对投投诉诉次数是否次数是否19 如果原假设成立,即如果原假设成立,即HH0 0:1 1=2 2=3 3 =4 4n四个行业被投诉次数的均值都相等四个行业被投诉次数的均值都相等n意味着意味着每个样本都来自均值为每个样本都来自均值为、方、方差为差为 2 2的同一的同一正态总体正态总体 x x xf(x)f(x)f(x)1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 如果原假如果原假设设成立,即成立,即H0:m1=m2=m3=20若备择假设成立,即若备择假设成立,即H H1 1:i i(i i=1=1,2 2,3 3,4)4)不全相等不全相等不全相等不全相等n至少有一个总体的均值是不同的至少有一个总体的均值是不同的n四个样本分别来自均值不同的四个正态总体四个样本分别来自均值不同的四个正态总体 X X Xf(X)f(X)f(X)3 3 3 3 1 1 1 1 2 2 2 2 4 4 4 4 若若备择备择假假设设成立,即成立,即H1:mi(i=1,2,3,4)不全不全21问题的一般提法问题的一般提法n设设因因素素有有r 个个水水平平,每每个个水水平平的的均均值值分分别别用用 1 1、2 2、r r 表示表示n要要检检验验r个个水水平平(总总体体)的的均均值值是是否否相相等等,需需要要提提出出如如下假设下假设:n nH H0 0:1 1 2 2 r r n nH H1 1:1 1,2 2,,r r不全相等不全相等方差分析实质是检验多个方差分析实质是检验多个总体均值是否相等的问题总体均值是否相等的问题问题问题的一般提法的一般提法设设因素有因素有r 个水平,每个水平的均个水平,每个水平的均值值分分别别用用1、22本节小结本节小结n n方差分析采用数理统计方法对所得结果进行分析,方差分析采用数理统计方法对所得结果进行分析,方差分析采用数理统计方法对所得结果进行分析,方差分析采用数理统计方法对所得结果进行分析,以鉴别各种因素对研究对象的某些特性值影响大以鉴别各种因素对研究对象的某些特性值影响大以鉴别各种因素对研究对象的某些特性值影响大以鉴别各种因素对研究对象的某些特性值影响大小。小。小。小。n n方差分析是检验多个总体均值是否相等的一种统方差分析是检验多个总体均值是否相等的一种统方差分析是检验多个总体均值是否相等的一种统方差分析是检验多个总体均值是否相等的一种统计方法。计方法。计方法。计方法。n n方差分析是通过对试验结果的分析去判断因子是方差分析是通过对试验结果的分析去判断因子是方差分析是通过对试验结果的分析去判断因子是方差分析是通过对试验结果的分析去判断因子是否显著的一种统计方法。否显著的一种统计方法。否显著的一种统计方法。否显著的一种统计方法。n n方差分析方法是解决具有相同方差的方差分析方法是解决具有相同方差的方差分析方法是解决具有相同方差的方差分析方法是解决具有相同方差的(k2(k2)个正个正个正个正态总体的均值是否有显著差异问题的有效方法。态总体的均值是否有显著差异问题的有效方法。态总体的均值是否有显著差异问题的有效方法。态总体的均值是否有显著差异问题的有效方法。本本节节小小结结方差分析采用数理方差分析采用数理统计统计方法方法对对所得所得结结果果进进行分析,以行分析,以鉴别鉴别各各23单因子方差分析单因子方差分析单单因子方差分析因子方差分析24单因子方差分析单因子方差分析(one-way ANOVA)(one-way ANOVA)n n解决一个因子的不同水平的试验结果之间解决一个因子的不同水平的试验结果之间的差异显著性问题。的差异显著性问题。n n解决一个分类型自变量对因变量的影响程解决一个分类型自变量对因变量的影响程度问题。度问题。单单因子方差分析因子方差分析(one-way ANOVA)解决一个因子的解决一个因子的251 1、模型与假设的提出、模型与假设的提出n n考虑因子考虑因子考虑因子考虑因子A A取取取取r r个水平,分析这个水平,分析这个水平,分析这个水平,分析这r r个水平对指标个水平对指标个水平对指标个水平对指标y y的的的的影响影响影响影响n n在每个在每个在每个在每个A Ai i下下下下,重复做重复做重复做重复做mm次试验,次试验,次试验,次试验,i i=1,2,=1,2,r rn n一般情况,假定在一般情况,假定在一般情况,假定在一般情况,假定在A Ai i水平下的指标水平下的指标水平下的指标水平下的指标 其中其中其中其中要求要求要求要求y yij ij 的方差的方差的方差的方差2 2 2 2是相同的是相同的是相同的是相同的 1、模型与假、模型与假设设的提出考的提出考虑虑因子因子A取取r个水平,分析个水平,分析这这r个水平个水平对对指指26单因子方差分析数据单因子方差分析数据(表表)模型模型单单因子方差分析数据因子方差分析数据(表表)模型模型27假设的提出假设的提出n n在单因子方差分析中就是要通过对数据在单因子方差分析中就是要通过对数据yij的的分析去判断分析去判断1,2,r是否全部相同是否全部相同n nyij 的数据结构形式的数据结构形式:yij =i+i jn n i i 为在为在为在为在A Ai i水平下水平下水平下水平下 y yij ij 的平均水平的平均水平的平均水平的平均水平n n ij ij为在第为在第为在第为在第i i水平下第水平下第水平下第水平下第j j 次试验的随机误差,且次试验的随机误差,且次试验的随机误差,且次试验的随机误差,且 假假设设的提出在的提出在单单因子方差分析中就是要通因子方差分析中就是要通过对过对数据数据yij的分析去判的分析去判28n n即要检验假设即要检验假设 H0:1=2=r 是否成立是否成立n n讨论因子讨论因子A的不同水平对试验结果之间差异的不同水平对试验结果之间差异的影响是否显著的问题的影响是否显著的问题即要即要检验检验假假设设29假设的另一种提法假设的另一种提法n na ai i为因子为因子为因子为因子A A A A的第的第的第的第i i水平的水平的水平的水平的效应效应效应效应:a ai i=i i -其中其中其中其中:为总的平均水平,为总的平均水平,为总的平均水平,为总的平均水平,n n 假假设设的另一种提法的另一种提法ai为为因子因子A的第的第i水平的效水平的效应应:30n nyij 的数据结构形式的数据结构形式:yij=+ai+i jn n 为总的平均水平为总的平均水平为总的平均水平为总的平均水平n n ij ij为在第为在第为在第为在第i i水平下第水平下第水平下第水平下第j j次试验的随机误差次试验的随机误差次试验的随机误差次试验的随机误差yij 的数据的数据结结构形式构形式:31单因子方差分析数据结构模型单因子方差分析数据结构模型,且相互独立,且相互独立,且相互独立,且相互独立单单因子方差分析数据因子方差分析数据结结构模型,且相互独立构模型,且相互独立32n n即要即要检验假设检验假设 H0:a1=a2=ar=0 是否成立是否成立n n讨论讨论因子因子A的不同水平的效应是否可以忽略的不同水平的效应是否可以忽略不计的问题不计的问题即要即要检验检验假假设设332 2、检验统计量的确定、检验统计量的确定n nyij取值不同主要原因有:一是可能取值不同主要原因有:一是可能A取不同取不同水平所引起水平所引起的;二是的;二是随机误差引起随机误差引起的。的。n n偏差平方和的分解是构建适用于方差分析偏差平方和的分解是构建适用于方差分析的的 F 统计量的重要工具。统计量的重要工具。n n是区分是区分系统性误差系统性误差(条件误差(条件误差)和和随机误差随机误差(偶然性误差偶然性误差)的主要方法。的主要方法。2、检验统计检验统计量的确定量的确定yij取取值值不同主要原因有:一是可能不同主要原因有:一是可能A取不取不34偏差平方和的分解偏差平方和的分解n n数据总的差异可用总偏差平方和数据总的差异可用总偏差平方和ST来表示来表示n n引入引入Ai 水平的均值水平的均值(组平均组平均)偏差平方和的分解数据偏差平方和的分解数据总总的差异可用的差异可用总总偏差平方和偏差平方和ST来表示来表示35n n 总的偏差平方和分解总的偏差平方和分解 总总的偏差平方和分解的偏差平方和分解36n n总偏差平方和总偏差平方和 ST:n n因子因子A偏差平方和偏差平方和(组间偏差平方和组间偏差平方和)SA:n n随机偏差平方和随机偏差平方和(组内偏差平方和组内偏差平方和)Se:总总偏差平方和偏差平方和 ST:37n n 各偏差平方和的含义各偏差平方和的含义n n组内组内组内组内偏差平方和偏差平方和偏差平方和偏差平方和 S Se e:n n反映了同一水平下的试验值与其平均值的偏差平方和反映了同一水平下的试验值与其平均值的偏差平方和反映了同一水平下的试验值与其平均值的偏差平方和反映了同一水平下的试验值与其平均值的偏差平方和n n反映每个样本各观察值的离散状况反映每个样本各观察值的离散状况反映每个样本各观察值的离散状况反映每个样本各观察值的离散状况n n是由随机因素引起的是由随机因素引起的是由随机因素引起的是由随机因素引起的n n组间组间组间组间偏差平方和偏差平方和偏差平方和偏差平方和 S SA A:n n反映了由于因子水平变化所引起的组平均与总平均的偏反映了由于因子水平变化所引起的组平均与总平均的偏反映了由于因子水平变化所引起的组平均与总平均的偏反映了由于因子水平变化所引起的组平均与总平均的偏差平方和差平方和差平方和差平方和n n反映各总体的样本均值之间的差异程度反映各总体的样本均值之间的差异程度反映各总体的样本均值之间的差异程度反映各总体的样本均值之间的差异程度n n一般是由随机因素和系统误差引起的一般是由随机因素和系统误差引起的一般是由随机因素和系统误差引起的一般是由随机因素和系统误差引起的 各偏差平方和的含各偏差平方和的含义组义组内偏差平方和内偏差平方和 Se:38n n如如如如果果果果原原原原假假假假设设设设成成成成立立立立,则则则则表表表表明明明明没没没没有有有有系系系系统统统统误误误误差差差差,组组组组间间间间平平平平方方方方和和和和SSA SSA SSA SSA 除除除除以以以以自自自自由由由由度度度度后后后后的的的的均均均均方方方方与与与与组组组组内内内内平平平平方方方方和和和和SSESSESSESSE和和和和除除除除以以以以自自自自由由由由度度度度后后后后的的的的均均均均方方方方差差差差异异异异就就就就不不不不会会会会太太太太大大大大;如如如如果果果果组组组组间间间间均均均均方方方方显显显显著著著著地地地地大大大大于于于于组组组组内内内内均均均均方方方方,说说说说明明明明各各各各水水水水平平平平(总总总总体体体体)之间的差异不仅有随机误差,还有系统误差之间的差异不仅有随机误差,还有系统误差之间的差异不仅有随机误差,还有系统误差之间的差异不仅有随机误差,还有系统误差n n判判判判断断断断因因因因素素素素的的的的水水水水平平平平是是是是否否否否对对对对其其其其观观观观察察察察值值值值有有有有影影影影响响响响,实实实实际际际际上上上上就是比较就是比较就是比较就是比较组间均方组间均方组间均方组间均方与与与与组内均方组内均方组内均方组内均方之间差异的大小之间差异的大小之间差异的大小之间差异的大小n n 三个平方和的作用三个平方和的作用如果原假如果原假设设成立,成立,则则表明没有系表明没有系统误统误差,差,组间组间平方和平方和SSA 除以自除以自39统计量的构建统计量的构建n n由于由于 ,且相互独立,则且相互独立,则:n n由于由于 ,所以在,所以在 H0为真时,为真时,统计统计量的构建由于量的构建由于 ,且相互独立,且相互独立,则则40n n在假设在假设在假设在假设HH0 0成立时成立时成立时成立时n n检验假设检验假设检验假设检验假设HH0 0的拒绝域为的拒绝域为的拒绝域为的拒绝域为其中其中其中其中 为显著性水平,为显著性水平,为显著性水平,为显著性水平,是自由度为是自由度为是自由度为是自由度为 的的的的F F分布分布分布分布 上侧分位数上侧分位数上侧分位数上侧分位数。越小,拒绝越小,拒绝越小,拒绝越小,拒绝HH0 0的把握越大,因子的把握越大,因子的把握越大,因子的把握越大,因子A A的显著性越高。的显著性越高。的显著性越高。的显著性越高。在假在假设设H0成立成立时时41方差分析表方差分析表方差分析表方差分析表42判断说明判断说明*:*:高度显著高度显著 F F F F0.010.01 *:*:显著显著 F F0.05 0.05 F F F F0.010.01(*):(*):一般显著一般显著 F F0.1 0.1 F F F F0.43xf(x)F F 分布分布F0.1F0.05F0.01概率为概率为0.010.01概率为概率为0.050.05*概率为概率为0.10.1(*)*xf(x)F 分布分布F0.1F0.05F0.01概率概率为为0.44各总体观测值不等情形下的单因子方差分析各总体观测值不等情形下的单因子方差分析n对于一般情形:各因子水平下的观测值的个数不对于一般情形:各因子水平下的观测值的个数不完全一样,假设为完全一样,假设为mi,则单因子的方差分析完全,则单因子的方差分析完全类似。类似。n相关符号如下:相关符号如下:各各总总体体观测值观测值不等情形下的不等情形下的单单因子方差分析因子方差分析对对于一般情形:各因子水于一般情形:各因子水45方差分析表方差分析表方差分析表方差分析表46例例3.1 SPSSANALYZECompare MeansOne-way ANOVA例例3.1 SPSSANALYZECompare Means47n n输出结果输出结果输出结果输出结果ANOVAANOVA投诉次数投诉次数投诉次数投诉次数 n n注意注意注意注意:1.1.数据的录入数据的录入数据的录入数据的录入 2.2.结果的解释结果的解释结果的解释结果的解释n n结果解释结果解释结果解释结果解释n n由于由于由于由于p p=0.0390.05=0.0390.050.8980.05,不能拒绝原假设,即认为四,不能拒绝原假设,即认为四,不能拒绝原假设,即认为四,不能拒绝原假设,即认为四个总体的方差相等,满足方差齐性假定个总体的方差相等,满足方差齐性假定个总体的方差相等,满足方差齐性假定个总体的方差相等,满足方差齐性假定。Test of Homogeneity of VariancesTest of Homogeneity of Variances输输出出结结果果结结果解果解释释Test of Homogeneity of53 Multiple ComparisonsMultiple ComparisonsDependent Variable:Dependent Variable:投诉次数投诉次数投诉次数投诉次数*The mean difference is significant at the.05 level.*The mean difference is significant at the.05 level.结论:结论:结论:结论:家电家电家电家电制造制造制造制造业与业与业与业与航空航空航空航空公司公司公司公司有显有显有显有显著性著性著性著性差异差异差异差异 Multiple Comparisons*The me54Homogeneous Subsets结论:结论:结论:结论:1.1.由于由于由于由于A A4 4(家电制造业)与其它几个行业分在不同均衡子集内,所(家电制造业)与其它几个行业分在不同均衡子集内,所(家电制造业)与其它几个行业分在不同均衡子集内,所(家电制造业)与其它几个行业分在不同均衡子集内,所以家电制造业与其它几个行业的投诉次数有显著性差异;以家电制造业与其它几个行业的投诉次数有显著性差异;以家电制造业与其它几个行业的投诉次数有显著性差异;以家电制造业与其它几个行业的投诉次数有显著性差异;2.2.在假设在假设在假设在假设 1 1=2 2=4 4下的下的下的下的p p-值为值为值为值为0.1590.159 0.050.05,所以,不能拒绝原假,所以,不能拒绝原假,所以,不能拒绝原假,所以,不能拒绝原假设,即认为这三个行业的投诉次数无显著性差异。设,即认为这三个行业的投诉次数无显著性差异。设,即认为这三个行业的投诉次数无显著性差异。设,即认为这三个行业的投诉次数无显著性差异。Homogeneous Subsets结论结论:55小结小结n n用SPSS进行方差分析的步骤n n方差齐性检验方差齐性检验方差齐性检验方差齐性检验n n方差分析方差分析方差分析方差分析n n多重比较(在需要的情况下)多重比较(在需要的情况下)多重比较(在需要的情况下)多重比较(在需要的情况下)n n小小结结用用SPSS进进行方差分析的步行方差分析的步骤骤56多因子方差分析多因子方差分析n n无交互作用的两因子方差分析无交互作用的两因子方差分析n n 有交互作用的两因子方差分析有交互作用的两因子方差分析多因子方差分析无交互作用的两因子方差分析多因子方差分析无交互作用的两因子方差分析57什么是多因子方差分析什么是多因子方差分析n n研究两个或两个以上的因素是否对指标产生显著影响研究两个或两个以上的因素是否对指标产生显著影响研究两个或两个以上的因素是否对指标产生显著影响研究两个或两个以上的因素是否对指标产生显著影响n n如研究如研究如研究如研究不同的品牌和不同的地区对某产品销售量的影响不同的品牌和不同的地区对某产品销售量的影响n各个因素的不同水平的搭配所产生的新的影响在统计学上称为各个因素的不同水平的搭配所产生的新的影响在统计学上称为交互作交互作用用。n各因子间是否存在交互作用是多因子方差分析新产生的问题。各因子间是否存在交互作用是多因子方差分析新产生的问题。两个因子间交互作用的概念,反映了单因子方差分析与多因两个因子间交互作用的概念,反映了单因子方差分析与多因子方差分析的本质区别。子方差分析的本质区别。n n多因子方差分析可以分析多个因素对指标的独立影响,也可多因子方差分析可以分析多个因素对指标的独立影响,也可多因子方差分析可以分析多个因素对指标的独立影响,也可多因子方差分析可以分析多个因素对指标的独立影响,也可以分析多个因素的交互作用是否对指标产生显著影响。进而以分析多个因素的交互作用是否对指标产生显著影响。进而以分析多个因素的交互作用是否对指标产生显著影响。进而以分析多个因素的交互作用是否对指标产生显著影响。进而找到利于指标的最优组合找到利于指标的最优组合找到利于指标的最优组合找到利于指标的最优组合n多因子方差分析问题的分析比较复杂,但其解题的思想和基多因子方差分析问题的分析比较复杂,但其解题的思想和基本方法类同,因而本章仅介绍两因子方差分析。本方法类同,因而本章仅介绍两因子方差分析。什么是多因子方差分析研究两个或两个以上的因素是否什么是多因子方差分析研究两个或两个以上的因素是否对对指指标产标产生生显显58什么是无交互作用什么是无交互作用n n一个因子水平下的好坏及其程度不受另一个一个因子水平下的好坏及其程度不受另一个因子不同水平影响的情况,称为两因子间因子不同水平影响的情况,称为两因子间无无交互作用交互作用n n例如,见下表例如,见下表什么是无交互作用一个因子水平下的好坏及其程度不受另一个因子不什么是无交互作用一个因子水平下的好坏及其程度不受另一个因子不59什么是有交互作用什么是有交互作用n n一个因子水平下的好坏及其程度与另一个因子一个因子水平下的好坏及其程度与另一个因子取什么水平有关,称为两因子间取什么水平有关,称为两因子间有交互作用有交互作用n n例如,见下表例如,见下表什么是有交互作用一个因子水平下的好坏及其程度与另一个因子取什什么是有交互作用一个因子水平下的好坏及其程度与另一个因子取什60一、无交互作用的一、无交互作用的 方差分析方差分析一、无交互作用的一、无交互作用的 方差分析方差分析61无交互作用的两因子方差分析无交互作用的两因子方差分析【例例例例3.23.2】有有有有四四四四个个个个品品品品牌牌牌牌的的的的彩彩彩彩电电电电在在在在五五五五个个个个地地地地区区区区销销销销售售售售,为为为为分分分分析析析析彩彩彩彩电电电电的的的的品品品品牌牌牌牌(品品品品牌牌牌牌因因因因素素素素)和和和和销销销销售售售售地地地地区区区区(地地地地区区区区因因因因素素素素)对对对对销销销销售售售售量量量量是是是是否否否否有有有有影影影影响响响响,对对对对每每每每个个个个品品品品牌牌牌牌在在在在各各各各地地地地区区区区的的的的销销销销售售售售量量量量取取取取得得得得以以以以下下下下数数数数据据据据。试试试试分分分分析析析析品品品品牌和销售地区对彩电的销售量是否有显著影响?牌和销售地区对彩电的销售量是否有显著影响?牌和销售地区对彩电的销售量是否有显著影响?牌和销售地区对彩电的销售量是否有显著影响?(=0.05=0.05)无交互作用的两因子方差分析【例无交互作用的两因子方差分析【例3.2】有四个品牌的彩】有四个品牌的彩电电在五个在五个621 1、模型与假设的提出、模型与假设的提出n n考虑因子考虑因子A取取r个水平,因子个水平,因子B取取s个水平,分个水平,分析这析这rs个水平组合个水平组合(A i,B j)对指标对指标yij的影响的影响n n在每个在每个(A i,B j)下下,只做只做 1 次试验次试验n n一般情况,假定在一般情况,假定在(A i,B j)水平组合下的指标水平组合下的指标 y i j N(i j,2),i=1,2,r;j=1,2,s 其中要求其中要求y i j 的方差的方差2是相同的是相同的1、模型与假、模型与假设设的提出考的提出考虑虑因子因子A取取r个水平,因子个水平,因子B取取s个水平,个水平,63两因子方差分析数据两因子方差分析数据(表表)模型模型两因子方差分析数据两因子方差分析数据(表表)模型模型64其中:其中:其中:其中:其中:其中:65n nyij 的数据结构形式的数据结构形式:y i j=i j+i jn n i ji j 为为为为y y i j i j 的平均水平的平均水平的平均水平的平均水平n n i j i j 为在为在为在为在(A i ,B j)水平下试验的随机误差水平下试验的随机误差水平下试验的随机误差水平下试验的随机误差假设的提出假设的提出yij 的数据的数据结结构形式构形式:假假设设的提出的提出66n n ai为因子为因子A的第的第i水平的效应水平的效应:a i=Ai-n n 为总的平均水平为总的平均水平为总的平均水平为总的平均水平n n AiAi为为为为A Ai i的平均水平的平均水平的平均水平的平均水平n nbj为因子为因子B的第的第j水平的效应水平的效应:b j=Bj-n n 为总的平均水平为总的平均水平为总的平均水平为总的平均水平n n BjBj为为为为B Bj j的平均水平的平均水平的平均水平的平均水平 ai为为因子因子A的第的第i水平的效水平的效应应:67n ny i j 的数据结构形式的数据结构形式:y i j=+ai+bj+ijn n 为总的平均水平为总的平均水平为总的平均水平为总的平均水平n n ij ij 为在为在为在为在(A Ai i ,B Bj j)水平下试验的随机误差水平下试验的随机误差水平下试验的随机误差水平下试验的随机误差y i j 的数据的数据结结构形式构形式:68两因子方差分析数据结构模型两因子方差分析数据结构模型两因子方差分析数据两因子方差分析数据结结构模型构模型69n n即要即要即要即要检验假设检验假设检验假设检验假设 H01:a1=a2=ar=0 H02:b1=b2=bs=0 是否成立是否成立n n若若若若HH0101成立成立成立成立,则说明因子,则说明因子,则说明因子,则说明因子A A取取取取r r个水平对指标个水平对指标个水平对指标个水平对指标y y无显著无显著无显著无显著影响,反之拒绝影响,反之拒绝影响,反之拒绝影响,反之拒绝HH0101,说明因子说明因子说明因子说明因子A A取取取取r r个水平对指标个水平对指标个水平对指标个水平对指标y y有显著影响。有显著影响。有显著影响。有显著影响。n n若若若若HH0202成立成立成立成立,则说明因子,则说明因子,则说明因子,则说明因子B B取取取取s s个水平对指标个水平对指标个水平对指标个水平对指标y y无显著无显著无显著无显著影响,反之拒绝影响,反之拒绝影响,反之拒绝影响,反之拒绝HH0202,说明因子说明因子说明因子说明因子B B取取取取s s个水平对指标个水平对指标个水平对指标个水平对指标y y有显著影响。有显著影响。有显著影响。有显著影响。n n用用用用F F检验法对两个假设进行判断,检验法对两个假设进行判断,检验法对两个假设进行判断,检验法对两个假设进行判断,讨论两因子的不讨论两因子的不讨论两因子的不讨论两因子的不同水平的效应是否可以忽略不计的问题同水平的效应是否可以忽略不计的问题同水平的效应是否可以忽略不计的问题同水平的效应是否可以忽略不计的问题。即要即要检验检验假假设设702 2、检验统计量的确定、检验统计量的确定n nyij取值不同主要原因有:一是取值不同主要原因有:一是可能可能A和和B取不取不同水平所引起同水平所引起的;二是的;二是随机误差引起的随机误差引起的。n n偏差平方和的分解是构建适用于方差分析的偏差平方和的分解是构建适用于方差分析的 F 统计量的重要工具。统计量的重要工具。n n是区分条件误差是区分条件误差(系统性误差系统性误差)和随机误差和随机误差(偶偶然性误差然性误差)的主要方法。的主要方法。2、检验统计检验统计量的确定量的确定yij取取值值不同主要原因有:一是可能不同主要原因有:一是可能A和和B71偏差平方和的分解偏差平方和的分解n n数据总的差异可用总偏差平方和数据总的差异可用总偏差平方和ST来表示来表示n n引入引入Ai 水平下数据平均值水平下数据平均值n n引入引入Bj 水平下数据平均值水平下数据平均值偏差平方和的分解数据偏差平方和的分解数据总总的差异可用的差异可用总总偏差平方和偏差平方和ST来表示来表示72n n 总的偏差平方和分解总的偏差平方和分解 总总的偏差平方和分解的偏差平方和分解73多元多元统计统计学学ppt课课件件-方差分析方差分析74n n总偏平方和总偏平方和总偏平方和总偏平方和 S ST T:n n因子因子因子因子A A偏差平方和偏差平方和偏差平方和偏差平方和(组间偏差平方和组间偏差平方和组间偏差平方和组间偏差平方和)S SA A :n n因子因子因子因子B B偏差平方和偏差平方和偏差平方和偏差平方和(组间偏差平方和组间偏差平方和组间偏差平方和组间偏差平方和)S SB B:n n随机偏差平方和随机偏差平方和随机偏差平方和随机偏差平方和(组内偏差平方和组内偏差平方和组内偏差平方和组内偏差平方和)S Se e:总总偏平方和偏平方和 ST:75n n组间偏差平方和组间偏差平方和 SA,SB:n n反映了由于因子水平变化所引起的组平均与反映了由于因子水平变化所引起的组平均与反映了由于因子水平变化所引起的组平均与反映了由于因子水平变化所引起的组平均与总平均的偏差平方和总平均的偏差平方和总平均的偏差平方和总平均的偏差平方和n n一般是由系统因素和随机因素引起的一般是由系统因素和随机因素引起的一般是由系统因素和随机因素引起的一般是由系统因素和随机因素引起的n n剩余偏差平方和剩余偏差平方和 Se:n n一般是由除了系统因素引起的偏差以外的其一般是由除了系统因素引起的偏差以外的其一般是由除了系统因素引起的偏差以外的其一般是由除了系统因素引起的偏差以外的其它偶然因素引起的它偶然因素引起的它偶然因素引起的它偶然因素引起的组间组间偏差平方和偏差平方和 SA,SB:76统计量的构建统计量的构建由于由于 ,且相互独立,且相互独立,则则:由于由于 ,所以在,所以在 H H0101为真时为真时:由于由于 ,所以在,所以在 H H0202为真时为真时:统计统计量的构建由于量的构建由于 ,且相互独且相互独77HH0101,HH0202都成立时都成立时都成立时都成立时H01,H02都成立都成立时时78在假设在假设在假设在假设HH0101成立时成立时成立时成立时在假设在假设在假设在假设HH0202成立时成立时成立时成立时 在假在假设设H01成立成立时时79检验假设检验假设检验假设检验假设HH0101的拒绝域为的拒绝域为的拒绝域为的拒绝域为检验假设检验假设检验假设检验假设HH0202的拒绝域为的拒绝域为的拒绝域为的拒绝域为其中其中其中其中 为显著性水平,为显著性水平,为显著性水平,为显著性水平,或或或或 为为为为F F分布的分布的分布的分布的 上侧分位数。上侧分位数。上侧分位数。上侧分位数。越小,拒绝假设的把握越大,因子的显著性越高。越小,拒绝假设的把握越大,因子的显著性越高。越小,拒绝假设的把握越大,因子的显著性越高。越小,拒绝假设的把握越大,因子的显著性越高。检验检验假假设设H01的拒的拒绝绝域域为为80方差分析表方差分析表方差分析表方差分析表81判断说明判断说明*:*:高度显著高度显著 F F F F0.010.01*:*:显著显著 F F0.05 0.05 F F F F0.010.01(*):(*):一般显著一般显著 F F0.1 0.1 F F F F0.82例例3.2SPSSANALYZEGeneral Linear ModelUnivariate例例3.2SPSSANALYZEGeneral Linear83例例3.2 2 结论:结论:结论:结论:p=p=00.0500.050.1440.05 ,不拒绝原假设,不拒绝原假设,不拒绝原假设,不拒绝原假设HH0 0,不能认为销售地区对彩电的,不能认为销售地区对彩电的,不能认为销售地区对彩电的,不能认为销售地区对彩电的 销售量有显著影响销售量有显著影响销售量有显著影响销售量有显著影响例例3.2 结论结论:84不能认为销售地区不能认为销售地区不能认为销售地区不能认为销售地区对彩电的销售量有对彩电的销售量有对彩电的销售量有对彩电的销售量有显著影响显著影响显著影响显著影响品牌品牌品牌品牌4 4与其他三个品牌之与其他三个品牌之与其他三个品牌之与其他三个品牌之间的销售量有显著影响间的销售量有显著影响间的销售量有显著影响间的销售量有显著影响不能不能认为销认为销售地区品牌售地区品牌4与其他三个品牌之与其他三个品牌之85二、有交互作用的二、有交互作用的 方差分析方差分析二、有交互作用的二、有交互作用的 方差分析方差分析86有交互作用的两因子方差分析有交互作用的两因子方差分析n n【例【例【例【例3.33.3】一家超市连锁店进行了一项研究,想确一家超市连锁店进行了一项研究,想确一家超市连锁店进行了一项研究,想确一家超市连锁店进行了一项研究,想确定竞争者的数量和超市所在位置对销售额是否有显定竞争者的数量和超市所在位置对销售额是否有显定竞争者的数量和超市所在位置对销售额是否有显定竞争者的数量和超市所在位置对销售额是否有显著性影响。将超市位置按商业区、居民区和写字楼著性影响。将超市位置按商业区、居民区和写字楼著性影响。将超市位置按商业区、居民区和写字楼著性影响。将超市位置按商业区、居民区和写字楼分成分成分成分成3 3类,并在不同位置随机抽取类,并在不同位置随机抽取类,并在不同位置随机抽取类,并在不同位置随机抽取3 3家超市,竞争家超市,竞争家超市,竞争家超市,竞争者数量按者数量按者数量按者数量按0 0个、个、个、个、1 1个、个、个、个、2 2个和个和个和个和3 3个以上分为四类,获个以上分为四类,获个以上分为四类,获个以上分为四类,获得的年销售额数据如下表:得的年销售额数据如下表:得的年销售额数据如下表:得的年销售额数据如下表:有交互作用的两因子方差分析【例有交互作用的两因子方差分析【例3.3】一家超市】一家超市连锁连锁店店进进行了一行了一87多元多元统计统计学学ppt课课件件-方差分析方差分析88什么是交互作用什么是交互作用n所谓交互作用,简单来说就是不同因子对试验所谓交互作用,简单来说就是不同因子对试验所考察的指标的复合作用。即一个因子水平下所考察的指标的复合作用。即一个因子水平下的好坏及其程度受另一个因子不同水平影响的的好坏及其程度受另一个因子不同水平影响的情况,记作情况,记作。n当需要考虑两个因子的交互作用时,每组试验当需要考虑两个因子的交互作用时,每组试验条件的试验条件的试验至少做两次至少做两次,否则无法将交互作用,否则无法将交互作用的平方和从误差平方和中分出来。(可以减轻的平方和从误差平方和中分出来。(可以减轻误差的干扰,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!