资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS,数据分析教程,方差分析,方差分析的主要内容,掌握方差分析的基本思想,了解方差分析和比较均值的异同,掌握单因素方差分析的应用条件、方法和结果的解释,掌握多因素方差分析的应用条件、方法和结果的解释,掌握协方差分析的应用条件、方法和结果的解释,t,检验应用于研究单样本均值的比较和两个样本均值的比较。在生产活动和科学研究中经常会遇到比较三个或者三个以上样本均值的差异问题。这时,采用的统计方法称为方差分析,简称,ANOVA,(,AN,alasis,O,f,VA,riance,)。,例如某机构对当前民众的生活状况进行调查,根据被调查者的回答把居民对待生活的态度分为三类:认为生活丰富多彩、生活平平常常和生活乏味三类,它们想知道人们对待生活的态度是否和他们受教育的情况有关系,即这三类人是否在受教育程度上有显著的区别。,方差分析的术语,试验中的实验结果是需要分析的变量,称为响应变量,或者因变量。方差分析的因变量必须为尺度类型的数据(即连续数据)。,影响试验结果的因素即为影响响应变量的变量,称为自变量或者因子。根据试验中这些因素的处理方式,因素可以分为控制因素、随机因素和协变量。,因子的不同取值称为因子的不同水平。,控制因素一般要求为分类变量,而协变量要求为尺度数据。,控制因素:它是试验中可以控制的影响试验结果的因素,因素的不同水平会导致不同的试验结果。,不可控因素:因素的水平与试验结果的关系是随机的,即不确定因素,但是不同于随机因素,可以理解为非研究关心的因素或非处理因素。,随机因素:因素与试验结果的关系是随机的,其水平也是随机出现的。,处理:在试验中,控制因素的一个水平或者几个控制因素的某一水平组合称为一个处理。,方差分析的前提条件,方差分析的自变量是“因子”或者“因素”,它是分类变量;其因变量则为尺度变量,需要满足以下两个基本前提条件:,每个处理的因变量为正态分布(正态性),每个处理的因变量具有相同的方差(方差齐性),单因素的方差分析,用于研究一个影响因素对试验结果的影响,它用于比较两个或者两个以上的总体之间是否有显著的差异,SPSS,的单因素方差分析提供下列分析结果:,试验结果在不同组别的统计,检验各个组别方差是否相等,各个组别的概略图(均值图),配对多重比较,不同组别组合的对比检验,同类子集,单因素方差分析举例,销售经理想了解新员工培训的最佳方式。目前有三种新员工培训方式:为期一天的培训、为期二天的培训和为期三天培训。现在需要比较用这三种方式培训员工的效果,分析这三种培训方式培训员工的效果是否有显著的差异,如果有差异,哪种培训方式最佳。,打开数据文件,salesperformance.sav,,它包含两个变量,,“,组,”,变量记录了培训方式;,“,得分,”,是对员工培训效果的评价。,SPSS,实现,选择,【,分析,】【,比较均值,】【,单因素,ANOVA】,选择两两比较方法,选择进行方差齐性检验和统计量、图形,点击,【,选项,】,,在统计量部分勾选,“,描述性,”,和,“,方差同质性检验,”,两项,同时勾选,“,均值图,(M),”,。,结果解释,两两比较结果及解释,由于,Levene,检验没有证据说明三种培训方式的方差相等,参照两种不同的两两比较的结果是必要的。,Bonferroni,和,Tamhane,多重比较的结果是一致的。即培训,2,天和培训,3,天没有显著的区别,而培训,1,天与另外两种培训都有显著区别。,同质子集,Tukey,B,两两比较输出的结果,它把在,5%,的显著性水平下没有区别的总体放在同一列,作为同类子集。这里,培训,2,天和培训,3,天没有显著区别,它们作为一类。而培训,1,天单独作为,1,类。,轮廓图,轮廓图为各个总体的均值的折线图,从中可以直观的看出各个总体均值的趋势。,多因素方差分析,如果影响试验结果的因素有两个或者两个以上,是否不同的处理对试验结果有显著性影响,不同的因素是否有交互作用?可以应用,SPSS,的一般线性模型(,GLM,)来完成多因素的方差分析。,SPSS GLM,过程假设条件,误差之间相互独立,并且也独立于模型中的其他变量。一般好的试验设计都可以避免违反该条件。,不同处理的误差为常数。,误差服从均值为,0,的正态分布。,举例,一家连锁零售商店对它们客户的购买习惯进行了一项调查,它记录了客户性别,购买模式、上一个月的购买金额等信息。该商店需要了解在控制客户性别的条件下,是否客户购买的频率和花费的金额有关系,以此来决定是否采取相应的促销活动,。,打开数据文件,grocery_1month.sav,。,选择,【,分析,】【,一般线性模型,】【,单变量,】,绘制选项,把,style,选入水平轴,,gender,选入单图,然后点击,“,添加,”,。再把,style,和,gender,互相交换,选入不同的框中,单击,“,添加,”,。,结果及其解释(,1,),结果及其解释(,2,),结果及其解释(,3,),男性和女性在每周购物和两周一次购物的均值线是平行的,都是男高女低;而在经常购物上,二者差距不大,经常购物均值线和另外两条线有交叉,表明二个因素有交互效应。效应是否显著在“主体间效应的检验”表中标识。,结果及其解释(,4,),男性的所有消费方式的消费金额均大于女性,男性和女性消费方式的曲线是不平行的,表明二者有交互效应。女性在经常性购物中花费金额最多;而男性则在每周购物方式中花费最多。,协方差分析,(ANCOVA),既分析控制因素影响,又分析协变量的影响以及控制因素和协变量关系的方法称为协方差分析。,协方差分析是针对在试验阶段难以控制或者无法严格控制的因素,在统计分析阶段进行统计控制,它在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归和方差分析结合起来的方法。,协方差分析的数学模型,协方差分析的数学模型为,这里 表示在控制因素的,i,水平下的第,j,次试验的因变量观测值;为因变量总体均值,;,表示控制因素的水平,i,下对因变量产生的效应;为协变量的回归系数;表示在控制因素的水平,i,下的第,j,次试验的协变量观测值;为抽样误差,假设它是服从方差相等的正态分布变量。,案例分析,政府就业促进部门想了解他们的就业促进项目是否发挥了实质性的作用,他们随机选取了参加该项目的人和没有参加该项目的人,调查这些人在实施该项目前后的收入变化。这里研究的目标变量为参加项目后人们的薪水,用它来衡量人们找到工作的好坏,即变量,“,incaft,”,(参加项目后的薪水)为因变量。由于参加该就业促进项目之前人们的薪水是不同的,如果不考虑该因素,直接比较参加项目之后人们薪水的区别是不合理的。因此把参加该项目前人们的薪水,(,incbef,),作为协变量,把是否参加就业促进项目(,prog,)作为控制因素,即自变量。,对协变量和控制因素的分析,在进行协方差分析之前,一般要先检查进行协方差分析的前提条件是否满足。,协变量和因变量之间是否有线性关系可以通过绘制散点图来直观的观测二者之间线性关系的强弱。,控制因素和协变量之间是否有交互作用,可以先预先进行方差分析检查二者之间的交互效应是否显著。,协变量和控制因素散点图,选择,【,分析,】【,一般线性模型,】【,单变量,】,把,“,incaft,”,选入,“,因变量(,D,),”,框中;把变量,“,prog,”,选入,“,固定因子,(F),”,框中,把,“,incbef,”,选入,“,协变量(,C,),”,框中。,设置因子模型,结果及其解释,动手练习,得克萨斯州的一所大学提出了三种,GMAT,辅导课程:即,3,小时复习、,1,天课程和,10,周强化班,他们需要了解这三种辅导方式如何影响,GMAT,成绩。另外,通常考生来自三类院校,即商学院、工学院、艺术与科学院。因此,了解不同类型学校毕业的考生,GMAT,成绩是否有差异也是一个让人感兴趣的话题。他们在三类学校中每一个随机抽取,6,个学生,随机指派两名到一门辅导课程中,最后他们的,GMAT,成绩结果记录于数据文件,GmatScore.sav,中。问题为:,1),不同的辅导课程是否对学生,GMAT,的成绩有显著的影响?来自不同类型学校的学生的,GMAT,成绩是否有显著的差别?请给出理由。,2),是否一类学校的考生适应一种辅导课程,而另一类学校的考生适合其他课程?请给出理由。,本章小结,方差分析本质上是多个总体均值的比较。根据控制因素个数的不同,方差分析分为单因素方差分析、多因素方差分析等。本章介绍了方差分析的基本思想、术语,单因素方差分析、多因素方差分析的方法和技巧。另外,本章同时介绍了协方差分析的方法和技巧。,
展开阅读全文