资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,0,t,检验应用于研究单样本均值的比较和两个样本均值的比较。在生产活动和科学研究中经常会遇到比较三个或者三个以上样本均值的差异问题。这时,采用的统计方法称为方差分析,简称,ANOVA,(,AN,alasis,O,f,VA,riance,)。,例如某机构对当前民众的生活状况进行调查,根据被调查者的回答把居民对待生活的态度分为三类:认为生活丰富多彩、生活平平常常和生活乏味三类,它们想知道人们对待生活的态度是否和他们受教育的情况有关系,即这三类人是否在受教育程度上有显著的区别。,第1页/共33页,t检验应用于研究单样本均值的比较和两个样本均值的比较。在生产,1,方差分析的术语,试验中的实验结果是需要分析的变量,称为响应变量,或者因变量。方差分析的因变量必须为尺度类型的数据(即连续数据)。,影响试验结果的因素即为影响响应变量的变量,称为自变量或者因子。根据试验中这些因素的处理方式,因素可以分为控制因素、随机因素和协变量。,因子的不同取值称为因子的不同水平。,控制因素一般要求为分类变量,而协变量要求为尺度数据。,第2页/共33页,方差分析的术语试验中的实验结果是需要分析的变量,称为响应变量,2,控制因素:它是试验中可以控制的影响试验结果的因素,因素的不同水平会导致不同的试验结果。,不可控因素:因素的水平与试验结果的关系是随机的,即不确定因素,但是不同于随机因素,可以理解为非研究关心的因素或非处理因素。,随机因素:因素与试验结果的关系是随机的,其水平也是随机出现的。,处理:在试验中,控制因素的一个水平或者几个控制因素的某一水平组合称为一个处理。,第3页/共33页,控制因素:它是试验中可以控制的影响试验结果的因素,因素的不同,3,方差分析的前提条件,方差分析的自变量是“因子”或者“因素”,它是分类变量;其因变量则为尺度变量,需要满足以下两个基本前提条件:,每个处理的因变量为正态分布(正态性),每个处理的因变量具有相同的方差(方差齐性),第4页/共33页,方差分析的前提条件方差分析的自变量是“因子”或者“因素”,它,4,单因素的方差分析,用于研究一个影响因素对试验结果的影响,它用于比较两个或者两个以上的总体之间是否有显著的差异,SPSS,的单因素方差分析提供下列分析结果:,试验结果在不同组别的统计,检验各个组别方差是否相等,各个组别的概略图(均值图),配对多重比较,不同组别组合的对比检验,同类子集,第5页/共33页,单因素的方差分析用于研究一个影响因素对试验结果的影响,它用于,5,单因素方差分析举例,销售经理想了解新员工培训的最佳方式。目前有三种新员工培训方式:为期一天的培训、为期二天的培训和为期三天培训。现在需要比较用这三种方式培训员工的效果,分析这三种培训方式培训员工的效果是否有显著的差异,如果有差异,哪种培训方式最佳。,打开数据文件,salesperformance.sav,,它包含两个变量,,“,组,”,变量记录了培训方式;,“,得分,”,是对员工培训效果的评价。,第6页/共33页,单因素方差分析举例销售经理想了解新员工培训的最佳方式。目前有,6,SPSS,实现,选择,【,分析,】【,比较均值,】【,单因素,ANOVA】,第7页/共33页,SPSS实现选择【分析】【比较均值】【单因素ANOVA】,7,选择两两比较方法,第8页/共33页,选择两两比较方法第8页/共33页,8,选择进行方差齐性检验和统计量、图形,点击,【,选项,】,,在统计量部分勾选,“,描述性,”,和,“,方差同质性检验,”,两项,同时勾选,“,均值图,(M),”,。,第9页/共33页,选择进行方差齐性检验和统计量、图形点击【选项】,在统计量部分,9,结果解释,第10页/共33页,结果解释第10页/共33页,10,两两比较结果及解释,由于,Levene,检验没有证据说明三种培训方式的方差相等,参照两种不同的两两比较的结果是必要的。,Bonferroni,和,Tamhane,多重比较的结果是一致的。即培训,2,天和培训,3,天没有显著的区别,而培训,1,天与另外两种培训都有显著区别。,第11页/共33页,两两比较结果及解释由于Levene检验没有证据说明三种培训方,11,同质子集,Tukey B,两两比较输出的结果,它把在,5%,的显著性水平下没有区别的总体放在同一列,作为同类子集。这里,培训,2,天和培训,3,天没有显著区别,它们作为一类。而培训,1,天单独作为,1,类。,第12页/共33页,同质子集Tukey B两两比较输出的结果,它把在5%的显著性,12,轮廓图,轮廓图为各个总体的均值的折线图,从中可以直观的看出各个总体均值的趋势。,第13页/共33页,轮廓图轮廓图为各个总体的均值的折线图,从中可以直观的看出各个,13,多因素方差分析,如果影响试验结果的因素有两个或者两个以上,是否不同的处理对试验结果有显著性影响,不同的因素是否有交互作用?可以应用,SPSS,的一般线性模型(,GLM,)来完成多因素的方差分析。,第14页/共33页,多因素方差分析如果影响试验结果的因素有两个或者两个以上,是否,14,SPSS GLM,过程假设条件,误差之间相互独立,并且也独立于模型中的其他变量。一般好的试验设计都可以避免违反该条件。,不同处理的误差为常数。,误差服从均值为,0,的正态分布。,第15页/共33页,SPSS GLM过程假设条件误差之间相互独立,并且也独立于模,15,举例,一家连锁零售商店对它们客户的购买习惯进行了一项调查,它记录了客户性别,购买模式、上一个月的购买金额等信息。该商店需要了解在控制客户性别的条件下,是否客户购买的频率和花费的金额有关系,以此来决定是否采取相应的促销活动,。,第16页/共33页,举例一家连锁零售商店对它们客户的购买习惯进行了一项调查,它记,16,打开数据文件,grocery_1month.sav,。,选择,【,分析,】【,一般线性模型,】【,单变量,】,第17页/共33页,打开数据文件grocery_1month.sav。第17页/,17,绘制选项,把,style,选入水平轴,,gender,选入单图,然后点击,“,添加,”,。再把,style,和,gender,互相交换,选入不同的框中,单击,“,添加,”,。,第18页/共33页,绘制选项把style选入水平轴,gender选入单图,然后点,18,结果及其解释(,1,),第19页/共33页,结果及其解释(1)第19页/共33页,19,结果及其解释(,2,),第20页/共33页,结果及其解释(2)第20页/共33页,20,结果及其解释(,3,),男性和女性在每周购物和两周一次购物的均值线是平行的,都是男高女低;而在经常购物上,二者差距不大,经常购物均值线和另外两条线有交叉,表明二个因素有交互效应。效应是否显著在“主体间效应的检验”表中标识。,第21页/共33页,结果及其解释(3)男性和女性在每周购物和两周一次购物的均值线,21,结果及其解释(,4,),男性的所有消费方式的消费金额均大于女性,男性和女性消费方式的曲线是不平行的,表明二者有交互效应。女性在经常性购物中花费金额最多;而男性则在每周购物方式中花费最多。,第22页/共33页,结果及其解释(4)男性的所有消费方式的消费金额均大于女性,男,22,协方差分析,(ANCOVA),既分析控制因素影响,又分析协变量的影响以及控制因素和协变量关系的方法称为协方差分析。,协方差分析是针对在试验阶段难以控制或者无法严格控制的因素,在统计分析阶段进行统计控制,它在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归和方差分析结合起来的方法。,第23页/共33页,协方差分析(ANCOVA)既分析控制因素影响,又分析协变量,23,协方差分析的数学模型,协方差分析的数学模型为,y,ij,=,+a,i,+,z,ij,+,ij,这里,y,ij,表示在控制因素的,i,水平下的第,j,次试验的因变量观测值;,为因变量总体均值,;,a,i,表示控制因素的水平下对因变量产生的效应;,为协变量的回归系数;,z,ij,表示在控制因素的水平下的第次试验的协变量观测值;,ij,为抽样误差,假设它是服从方差相等的正态分布变量。,第24页/共33页,协方差分析的数学模型协方差分析的数学模型为第24页/共33页,24,案例分析,政府就业促进部门想了解他们的就业促进项目是否发挥了实质性的作用,他们随机选取了参加该项目的人和没有参加该项目的人,调查这些人在实施该项目前后的收入变化。这里研究的目标变量为参加项目后人们的薪水,用它来衡量人们找到工作的好坏,即变量,“,incaft,”,(参加项目后的薪水)为因变量。由于参加该就业促进项目之前人们的薪水是不同的,如果不考虑该因素,直接比较参加项目之后人们薪水的区别是不合理的。因此把参加该项目前人们的薪水,(incbef),作为协变量,把是否参加就业促进项目(,prog,)作为控制因素,即自变量。,第25页/共33页,案例分析 政府就业促进部门想了解他们的就业促进项目是否发,25,对协变量和控制因素的分析,在进行协方差分析之前,一般要先检查进行协方差分析的前提条件是否满足。,协变量和因变量之间是否有线性关系可以通过绘制散点图来直观的观测二者之间线性关系的强弱。,控制因素和协变量之间是否有交互作用,可以先预先进行方差分析检查二者之间的交互效应是否显著。,第26页/共33页,对协变量和控制因素的分析在进行协方差分析之前,一般要先检查进,26,协变量和控制因素散点图,第27页/共33页,协变量和控制因素散点图第27页/共33页,27,选择,【,分析,】【,一般线性模型,】【,单变量,】,把,“,incaft,”,选入,“,因变量(,D,),”,框中;把变量,“,prog,”,选入,“,固定因子,(F),”,框中,把,“,incbef,”,选入,“,协变量(,C,),”,框中。,第28页/共33页,选择【分析】【一般线性模型】【单变量】第28页/共33页,28,设置因子模型,第29页/共33页,设置因子模型第29页/共33页,29,结果及其解释,第30页/共33页,结果及其解释第30页/共33页,30,动手练习,得克萨斯州的一所大学提出了三种,GMAT,辅导课程:即,3,小时复习、,1,天课程和,10,周强化班,他们需要了解这三种辅导方式如何影响,GMAT,成绩。另外,通常考生来自三类院校,即商学院、工学院、艺术与科学院。因此,了解不同类型学校毕业的考生,GMAT,成绩是否有差异也是一个让人感兴趣的话题。他们在三类学校中每一个随机抽取,6,个学生,随机指派两名到一门辅导课程中,最后他们的,GMAT,成绩结果记录于数据文件,GmatScore.sav,中。问题为:,1),不同的辅导课程是否对学生,GMAT,的成绩有显著的影响?来自不同类型学校的学生的,GMAT,成绩是否有显著的差别?请给出理由。,2),是否一类学校的考生适应一种辅导课程,而另一类学校的考生适合其他课程?请给出理由。,第31页/共33页,动手练习 得克萨斯州的一所大学提出了三种GMAT辅导课程,31,集体项目,第32页/共33页,集体项目第32页/共33页,32,感谢您的欣赏!,第33页/共33页,感谢您的欣赏!第33页/共33页,33,
展开阅读全文