资源描述
方差分析变异分解思路剖析上一篇 / 下一篇 2008-02-29 17:53:09 / 个人分类:心理统计 查看( 15 ) / 评论( 0 ) / 评分( 0 / 0 ) 第一部分:方差分析变异分解的整体思想方差分析法是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术,方差分析实质上是关于观测值变异原因的数量分析。从变异性分解角度来看,主要是对观测值的总变异进行分解。分解为两大部分:第一,来自于自变量不同处理效应的影响;第二,来自于误差因素的影响(即包括随机化选择被使过程中所产生的随机因素,也包括一些无法辨别来源的残差)。以单因素完全随机设计为例。某心理学家为了考察训练教程对儿童创造思维能力的影响,将20名被试随机分成四个组,每组5人,每组采用一种教程进行训练,一学期后每个被试的创造思维能力评分如下表,试检验训练教程的作用是否有显著的差异。在这个例子中,自变量为训练教程,一共有四个水平。因变量为创造性思维能力得分。那么所有被试在因变量上得分的差异性(即变异)可以分解为两个来源:第一,由于自变量的四个水平所产生的四个组之间的差异性;第二,由于选择被试所导致的组内被试之间的差异性。第二部分:不同实验设计下变异来源分解剖析一、单因素完全随机设计变异分解的一般逻辑:首先,计算总变异;然后,计算处理产生的变异;最后,用总变异减去处理产生的变异即误差变异。在单因素完全随机设计中,处理产生的变异即水平组间变异。利用原始数据计算变异的公式规律:第一,总平方和和组间平方和的后一项记为CM,矫正数,均为总数据和的平均平方。求多少和,即对多少平均。第二,总平方和的前一项为所有原始数据平方的和。第三,组间平方和的前一项为每组数据和的平方求平均,然后把几个组的计算结果相加。PS:对我们的启示是在平方和处理变异分解过程中,我们只要搞清楚处理处理是指那几个组就差异就可以了。以第一部分中单因素随机实验设计为例。具体数据见下表:总数据和为477,总数据和的平方为:227529,平均的总数据和的平方为:11376.45(有20个数据)。该项即为矫正项。所有原始数据平方的和为:13309。因此,总平方和为1932.55。组间平方和的前一项为每组数据和的平方求平均,然后把几个组的计算结果相加。即:12930.2。因此,组间平方和为:1553.75。组内平方和为总平方和减去组间平方和。因此,组内平方和为:378.80。具体结果见下表。总结:我们发现,在方差分析不同实验设计的变异分解中,总变异的概念是一致的,矫正项的概念是一致的。而误差变异又可以通过总变异减去处理变异即可。因此,只要搞清楚处理变异的计算就可以搞定所有实验设计下方差变异的分解问题。处理变异计算的关键点:只要搞清楚处理来源涉及到哪几个处理水平之间的差异性即可。下面以各种其它实验设计的方差分解为例,进一步理解这一思想。二、单因素随机区组设计单因素随机区组设计和单因素完全随机设计的区别是单因素区组设计通过区组因素很好的控制了一个无关变量对因变量的影响(即:区组因素是一个无关变量)。在统计上来说,是通过估计出区组因素所产生的平方和,减少了误差平方和的大小,从而提高了统计检验效力。单因素随机区组设计的一个前提条件是:区组因素和自变量因素之间不存在交互作用。否则需要采用两因素析因实验设计。单因素随机区组设计的总变异被分解为以下的几个部分:第一,自变量效应所产生的变异;第二,区组效应所产生的变异;第三,误差变异。自变量效应所产生的变异以及区组效应所产生的变异的计算方法同单因素完全随机设计的组间效应的计算。关键是要搞清楚是在计算哪几个组之间的变异性。三、单因素重复测量实验设计单因素重复测量实验设计和单因素完全随机实验设计的区别在于被试分配到处理中的方法是不一样的。在单因素完全随机设计中,不同处理水平下的被试是不一样的。而在单因素重复测量实验设计中,所有的被试均接受了所有处理水平的影响。单因素重复测量实验设计的优点是可以控制被试间差异这一无关变量对因变量所造成的影响。从统计上来说,是通过把被试间差异所导致的变异从误差变异中区分出来,减少了误差平方和的大小,从而提高了统计检验效力。单因素重复测量实验设计的总变异可以分解为以下几个部分:第一,自变量效应所产生的变异;第二,被试间差异所导致的变异;第三,误差变异。下图反映的是三种不同的单因素实验设计的被试分配方案:四、多因素析因完全随机实验设计多因素析因完全随机实验设计属于被试间设计的一个多因素析因实验设计,其优点是可以进行交互作用的分析。交互作用产生的变异是通过对组间变异分解实现的。在多因素析因完全随机实验设计中,我们把组间变异分解为主效应和交互作用效应。已2*3完全随机析因设计为例。假定存在两个自变量因素A和B,A有两个水平,称为A1,A2,B有三个水平,称为B1,B2,B3。那么组间总变异是由A因素和B因素相交以后产生的6个处理水平组所产生的变异。而A因素的主效应和B因素的主效应是分别由A因素2个水平组和B因素的三个水平组所产生的。交互作用效应即用组间效应减去A因素和B因素的主效应获得的。2*3完全随机析因设计的总变异可以分解为以下几个部分:第一,A因素主效应所产生的变异;第二,B因素主效应所产生的变异;第三,AB因素的交互作用效应所产生的变异;第四,误差变异。五、多因素析因重复测量实验设计多因素析因重复测量实验设计属于被试内设计,其与单因素重复测量实验设计的差别同多因素完全随机析因设计和单因素完全随机设计的区别。其优点也是可以进行交互作用的分析。在此不在赘述。多因素析因重复测量实验设计的总变异可以分解为以下几个部分:第一,A因素主效应所产生的变异;第二,B因素主效应所产生的变异;第三,AB因素的交互作用效应所产生的变异;第四,被试间差异所导致的变异;第五,误差变异。六、多因素析因混合实验设计多因素析因混合实验设计即包括了组间因素,也包括了组内因素(即被试内因素)。因此在分析过程中是最复杂的。其复杂性只要体现在对于组间因素的效应分析所采用的误差因素和对组内因素的效应分析所采用的误差因素是不一样的。也可以认为是把组间设计的方差分解和组内因素的方差分解结合起来的一种方差分析技术。具体分解过程可以参考舒华多因素实验设计一书。实验心理学笔记(随课笔记)2来自:杜英春 2004年12月20日17:58第二章 实验设计(二)实验设计的类型根据实验控制条件严密程度的不同,可将实验设计分为:真实验设计、准实验设计和前实验设计。真实验设计 :实验者可以有效地操纵实验变量,能有效地控制各种额外变量,能在随机化原则的基础上选择和分配被试。前实验设计:往往不易采取随机化原则分配被试,而且也不易主动地控制自变量和其他额外变量。准实验设计:对实验控制的严密程度介于前实验设计和真实验设计之间。 根据各自变量或各处理水平在被试之间的分配方式,可分为组内设计、组间设计和混合设计三种设计类型。组间设计就是把数目相同的被试分配到自变量的不同水平或不同的自变量上。组间设计这一概念与三个英语名词对应:between-group designbetween-subjects designindependent-group design组内设计就是使每个被试轮流分配到自变量的不同水平或不同的自变量上。组内设计也与三个英语名词对应:within-group designwithin-subjects designrepeated-measures design 例:研究学习时间对学习效果的影响。方法1:让15名被试学习20个英语单词5分钟,让另外15名被试学习同样的单词15分钟,然后用再现法考查识记的效果。方法2:让15名被试对20个英语单词学习5分钟,再学习另外20个单词15分钟,然后用再现法考查识记的效果。 对组间设计的评价优点:一种自变量(或实验条件)不会影响另一种自变量,因为每个被试只对一种自变量做反应。缺点 :分配到各实验条件下的被试可能在各方面不是等同的。解决方案:1、匹配组设计(matched groups design) 2、随机组设计(random groups design) 对组内设计的评价优点:1、组内设计消除了被试的个别差异对实验的影响。2、组内设计用于研究练习的阶段性最为理想。3、组内设计不需要太多的被试 。 缺点:一种实验条件下的操作将会影响另一种实验条件下的操作,也就是实验顺序造成了麻烦。此方法不能用来研究某些被试特点自变量之间的差异。 如果实验中每一种实验条件需要较长时间的恢复期,则不宜使用组内设计。 当自变量的不同水平代表一种连续事件的延续结果时,不宜使用组内设计。组间设计(between Group Designs )(一)完全随机化设计1、随机实验组控制组前测后测设计(1)设计模式RO1XO2RO3 O4其中R表示采用随机方法分配被试和实验处理X,O1和O3表示对两组被试的前测成绩,O2和O4表示两组被试的后测成绩。(2)对设计的评价基本控制了绝大多数影响内部效度的因素。由于使用了前测验,可能会有测验的反作用,影响实验设计的外部效度。(3)实例分析沃坦阿贝等人(Watanabe et al.)培养学生根据报纸标题预测报道内容的能力。2、随机实验组控制组后测设计(1)设计模式RXO1R O2(2)对设计的评价几乎具备前一种实验设计的所有优点,同时,由于两组被试没有进行前测验,从而控制了测验与实验处理的交互作用对实验外部效度的影响。(3)实例分析Loftus and Burns (1982)实验目的:考察暴力场面对人的记忆的影响。被试:226名University of Washington的自愿参加者;随机分配到以下两组。组一:看带有暴力场面的电影组二:看非暴力场面的电影看完电影之后,要求两组被试回答25道关于电影中事件的问题。其中一道题非常关键:问被试在银行外面露天停车场踢球的男孩穿的足球衫上的号码是多少。因变量是正确回忆出男孩运动衫号码的人数的百分数。结果:组一,4%;组二,28%。3、随机多组后测设计设计模式RX1O1RX2O2RX3O3通过随机化的方式分配被试和实验处理到不同的组别中,对各组被试进行后测验。4、所罗门设计(1)基本格式:实验处理有无测 有前测 O1 O2 定 无前测 O3 O4其中O1、O2、O3、O4都是后测的结果。 (2)对设计的评价这实际上是将前面第1、2种设计方案合并在一起。优点是可以将事前测定的反作用效果分离出来,对于实验处理的效果更加清楚。这是一种理想的设计方案。集中了前两个设计的优点。但它所选被试较多,实验经费较大,一般不轻易采用。(二)匹配组设计匹配组设计是用某些足以影响因变量的因素,对被试进行测量,根据测量结果将被试分成等组。分组有两种方法:1、将成绩相等的被试匹配成对,把每一对中的两名被试随机分配到实验组和控制组,称为配对等组法。2、使各组全体被试的成绩在平均数、标准差两方面相等,称为全体等组法。 1前观测配对后观测等组设计(1)设计模式RXO1OMRCO2(2)对设计的评价由于使用了相关标准对被试进行匹配,能够严格控制被试的个体差异。使用了控制组,能够控制外来的额外变量。但前测验会对实验有一定污染。2、配对后观测等组设计实验模式MRXO1MRCO2例:某校实施创造力开发训练计划组内设计(Within group design)为了消除组内设计中实验顺序带来的缺点,我们可以采用两种方法:1、完全的平衡方法2、拉丁方方法1、完全的平衡方法ABBA平衡法:假设我们的实验有两个自变量A与B,那么用一半被试按AB顺序做实验,另一半被试按BA顺序实验。ABBA平衡法方法是一种简单而有效的平衡练习效果的实验方法,这种方法一般应用于较少的实验条件和重复次数较少的实验中。并且,如果练习效果不是呈线性增长的,那么,这种平衡就是无效的。完全的平衡方法就是把所有可能的顺序都排列出来进行实验。当实验中有3个自变量时,就有6种可能的实验顺序;当有4种自变量时,就有24种可能的顺序。因此,当自变量水平过多时,就使实验无法进行。这时就应当采用不完全平衡的实验设计。2、拉丁方方法(Latin Square)这种方法保证每个自变量都同等地出现在实验顺序的每一个位置。 下面介绍一种安排拉丁方的方法:假设有n个自变量,那么实验的第一个顺序是:12n3(n-1)4(n-2)5(n-3)6第二个顺序是依次在第一个顺序上加1,如2314n5(n-1)依次类推。在后来的各顺序中遇到n时,改为1。完全平衡方法举例Sackheim,Gur和Saucy(1978)使用组内设计研究人的两侧面孔在情绪表达强度上的差异。早期的研究者发现,被试能够准确地区分呈现给他们的人类的6种基本情绪(快乐、惊奇、恐惧、悲伤、愤怒、和厌恶)的照片。Sackheim和他的合作者利用一个人的一侧面孔和其镜像重新构成一张完整的面孔的照片。如图:点转到内部心理过程上去了。图 1-3(参见上页)用模型的方式表示行为主 义和认知主义的区别。在 70 年代,曾任美国心理学会主席的麦基奇(W.J.Mckeachie,1921)在一篇报告中说,心理学是什么,这一概念已发 生改变,在詹姆斯的经典教科书里,把心理学定义为“对意识状态的描述和 解释”,后来改为“研究行为的科学”,今天我们的定义又改变了,心理学 又回到意识上来了。但是,更多的教科书和心理学家把心理学定义为研究行 为和心理过程的科学。这就既包括外观的、可观察的动作,又包括内部的心 理活动。在研究方法上,行为主义强调严格的实验方法,排斥一切主观经验 的报告,认知心理学则既注重实验室研究、又重视主观经验的报告。目前, 认知心理学已经成为心理学中的一个重要潮流。可以这样说,心理实验方法 发展的第二阶段,前期主要受到行为主义的影响,后期主要受到认知心理学 的影响。从以上心理学实验发展的历史我们可以看出,由于在心理学中采用了实 验法,才有了对心理现象进行客观研究的手段,才能从对心理现象的一般哲 学推论,进入到具体心理过程及其物质基础的分析研究,从而能越来越深入 地揭示各种心理活动的规律,大大丰富了心理科学。从某种意义上说,正是 因为实验心理学和心理物理法的诞生和发展,才使心理学完全从哲学中分离 出来,成为一门独立的科学。实验方法的建立,特别是从 20 世纪 50 年代以来,心理学已广泛应用了现代科学和工程技术的最新成就。近年来,随着科学技术的日益发展,国际 上的一些新技术、新概念和新方法已被引进心理学领域中,如控制论、信息 论、微电子技术、分子生物学、数理分析等,使心理学的实验研究水平有了 显著的提高。心理学家从信息加工的角度去看待知觉、学习、记忆及思维等 心理过程。心理学与邻近学科有了越来越多的共同语言,从而更有利于其发 展。这使我们认识到,心理学应注意从邻近学科中汲取有益成果,这样才有 助于逐步揭示心理现象的奥秘。实验方法的应用,使心理学的发展大为加快。从心理学实验方法的建立到现在才一百多年,而心理学的发展却大大超过以往许多世纪。虽然科学的 心理学不能归结为实验心理学,实验方法也不是心理学研究的唯一方法。但 是,任何当代心理学的教科书都以大量的篇幅证明,现代心理学中的大量事 实大都来自先前的实验研究,心理学实验的诞生和发展有力地说明了实验方 法是揭露心理和行为的规律的重要途径和手段。就以武德沃斯 (RobertSessions Woodworth,18691962)等所著的实验心理学一书中所列举的参考文献来说,1938 年的第一版列举了 1770 项,到 1955 年的第 二版就列举了 2480 项,其中有 50是旧版中未曾引用过的。1971 年的第三 版的参考文献目录长达 100 页,不下于 4000 项,其中 80以上是旧版未曾 引用过的。它所引用的资料主要来源于美国的材料,主要也只是涉及心理学 基础领域的实验研究。一位心理学工作者可以对心理学的任一领域或任一分支进行特别研究, 可以专门从事儿童心理、教育心理、医学心理、或知觉心理、思维心理,以 至社会心理的研究。但是,如果他想成为一个真正严格的、科学的心理工作 者,他就必须要很好地掌握实验心理学的研究内容和方法,了解应当如何科 学地考察心理和行为的规律。实验研究和任何一种研究方法一样,有它一定的局限性。这是因为实验研究是在一定控制条件下进行的,实验结果有时会与现实生活中人们的心理 活动不完全一样。这种现象的发生在科学研究中并不少见,更不是不能解决 的。只要研究课题来自实际,研究结果又不断到社会实际中去检验;同时, 在研究过程中又不仅仅注意心理活动的单因素的实验研究,还注意多因素的 交互作用的研究,那么,其研究结果是会与现实生活相一致的。综上所述,综观心理学研究的历史,可以这样说,实验法是心理学的主 要研究方法,实验心理学的诞生意味着科学心理学的建立。它是使心理学成 为一门独立科学的基石。当然,它也不是心理学的唯一的研究方法,它和观 察法(observation method)、临床法(clinical method)、问卷法(question- naire method)等研究方法相辅相成,构成完整的心理学方法学。本 章 实 验一、自变量和因变量的确定(一)目的:(1)通过动作学习的过程了解心理实验中确定自变量和因变量的方法;(2)学习使用触棒迷津。(二)材料:触棒迷津、小棒、遮眼罩、秒表、记录纸。(三)程序:(1)三人一组,被试者带上遮眼罩,用小棒走迷津(实验前被试者勿看 迷津,也勿用手触摸迷津)。主试者对被试者的指示语必须这样说明:“在 排除视觉的条件下,尽快地学会用小棒走迷津,中间不要停顿,要积极运用 动觉、记忆和思维,争取早些学会”。主试者把小棒放在迷津的入口处,然 后让被试者用优势手拿住小棒,手臂悬空。(2)被试者手执小棒静侯。主试者在每次开始前 2 秒钟,先发出“预备” 口令,主试者再说“开始”时,被试者才用小棒走动。在发出“开始”口令 的同时,主试者开动秒手表。(3)被试者在走迷津的过程中,凡进入盲巷一次就算出错一次,主试者 记下错误次数。(4)当被试者的小棒进入迷津终点,主试者立刻说“到了”,同时停秒表,记录走一遍迷津所用的时间(秒)。再做下一次的准备工作。(5)学习遍数因被试者而异,均以连续三次不出错为学会的标准。(6)若被试者在学习途中感到疲劳,可在某次走到终点后休息几分钟。(四)结果:将每次走迷津所用的时间和错误次数列成表格(见下页)。本实验记录用纸自变因 量 变量学 习 遍 数 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ? 所需时间(秒) 错误次数(次) 注:学习遍数因被试者而异,均以连续三次不出错为学会的标准,学习遍数超过 15 次者可自行加行。(五)讨论:(1)本实验中自变量是什么?为什么在实验前要对所用的自变量提出一 个操作上的定义?(2)本实验用什么作因变量的指标?它的作用是什么?(3)本实验控制了那些变量?二、自变量的范围和间距(一)目的:通过对皮肤两点阈的测定,学习确定心理实验中变量范围和间距的方法。(二)材料:两点阈量规、遮眼罩、记录纸。(三)程序:(1)主试者选定被试者的左手背(A 区)与前臂背面为测量区,前臂背 面又分为二个区(B、C 区),本试验取 A、C 两个区。测量前,在各区内标 上蓝印或划出圆圈,刺激在圈内进行。(2)在使用两点阈量规时,必须垂直接触皮肤,对两个尖点施力均匀, 接触时间不超过 2 秒钟,先在自己手上练习几次,再在被试者的非测验区练 习几次。(3)实验序列的长度和起点,可根据初步测验后确定,大致在 715 毫米的范围内取 5 个点,每步变化在 1 毫米左右。每种间距做 20 次,顺序随 机安排。本实验记录用纸一刺激代号相对应的实际刺激值代号 1 2 3 4 5 ? 刺激值(m) (4)每隔 100 次,休息 5 分钟。被试者有时产生一种持久的两点后象(即使只有一点或距离很近的两点刺激,也有感到两点的印象),此时应给予休 息,使其恢复两点的标准。每隔数十次,可插入一次一点刺激,测验被试者 是否有这种后象。(5)主试者对被试者的指示语必须这样说明:“在排除视觉的条件下,当被试者感觉到是两点时说二;当被试者感觉到一点时说一;当被 试者不能确定感觉到的是几点时说不”。本实验记录用纸二被试者反应记录表(6)主试者在每次刺激前先发出预备信号:“注意”。在被试者作出反 应后,要记录下来。(7)在全部测量完毕后,在记录中挑出有“不”的序列,再重复那些序 列,获得确定的判断。(四)结果:分别求出左手 A 区和 C 区的两点阈限,并对两均数的差别 进行考验。(五)讨论:(1)说明身体部位不同,触觉有差异,两点阈值从一个侧面揭示了触觉 感受性的大小。(2)如果要测定皮肤某部位的两点阈限,自变量的范围和间距应如何安 排?本章摘要1.实验心理学就是在实验控制条件下对心理和行为进行研究工作的心理 学。这一心理学分支是以研究方法来定义的。也就是说,只要是用实验法来 研究的心理学问题,都可以包括在实验心理学的范围内。2.实验是一种控制的观察,与自然的或偶然的观察不同,实验是实验者 人为地使现象发生,对产生现象的情景或影响现象的条件加以操纵、变化与 控制的观察。3.实验具有三个明显的特征:实验者掌握有主动权;实验具有可核对性、 或验证性;实验者可以系统地变化条件,观察因这些条件的变化而引起的现 象上的变化。4.变量是指在数量上或者质量上可以改变的事物的属性。在心理学的实 验中,研究者必须考虑三类变量:(1)已知的、对有机体反应发生影响的变 量,叫作自变量,它是由实验者操作、掌握的变量;(2)由操纵自变量而引 起被试者的某种特定的反应,叫因变量,它是由实验者观察或记录的变量;(3)在实验中应保持恒定的变量,叫控制变量。5.心理实验的对象统称为被试者,包括人和动物。在实验中,特别是在 以人为被试者的实验中,处理好实验者(即主试者)与被试者的关系是实验 取得成功的一个重要条件。6.额外变量(即控制变量)是使实验结果发生混淆的主要根源。对额外变量的控制常用的方法有:排除法、恒定法、匹配法、随机化法、抵消平衡 法和统计控制法。7.实验效度是指实验方法达到实验目的的程度。换言之,实验效度就是实验结果符合客观实际的程度。实验效度主要包括内部效度和外部效度。8.实验的程序是实验的进程,它是指实验在各个阶段应做的事。心理学 实验通常遵循的基本程序是:(1)课题的确定;(2)被试者的选择;(3) 实验因素的控制;(4)实验资料的收集、分析和综合;(5)撰写实验报告。9.课题的确定是科学研究的第一步,研究课题的来源通常有四个方面:实际的需要,理论,个人的经验,过去的研究与文献。10.心理学实验的被试者是多种多样的。有正常人,也有疾病患者;有各 种年龄阶段的人,也有动物。不同的实验对象,通常要求有不同的实验操作。11.操作定义的提出,受到心理学家们的欢迎。在心理学上,对一个心理 现象根据测定其程序下的定义称之为操作定义。12.一个完整的实验报告必须包括以下几项内容:摘要、引言、方法、结 果、讨论、参考文献及附录。13.实验心理学的发展,大约经历了两个阶段。从 18 世纪中叶到 19 世纪 中叶是心理实验的第一阶段,也可说是实验心理学的准备阶段。在这一阶段 具有以下特点:应用的方法类似于某些简单的物理学和生理学的实验法;研 究的问题只限于某些简单心理现象的量的测量;被试者的陈述带有十分初级 的性质。14.心理实验发展的第二阶段始于 19 世纪 60 年代,一直延续到今天。开 始阶段是与冯特的工作相联系的,这一阶段也可称为实验心理学的诞生、传 播和发展阶段。心理实验发展的第二阶段,前期主要受到行为主义的影响; 后期主要受到认知心理学的影响。15.综观心理学研究的历史,可以这样说,实验法是心理学的主要研究方 法。实验心理学的诞生意味着科学心理学的建立,它是使心理学成为一门独 立科学的基石。当然,它也不是心理学的唯一的研究方法,它和观察法、临 床法、问卷法等方法相辅相成,构成完整的心理学方法学。建议参考资料1.王甦等(1993):当代心理学研究。北京市:北京大学出版社。2.杨治良(1988):心理物理学。兰州市:甘肃人民出版社。3.张春兴(1991):现代心理学。台北市:东华书局(繁体字版)。上 海市:上海人民出社(1994)(简体字版)。4.波林(高觉敷译,1981):实验心理学史。上海市:商务印书馆。5.黄希庭(主编)(1988):心理实验指导。北京市:人民教育出版社。6.Atkinson,R.C.et al.(1988).Stevenshandbook of experimental psy-chology (2nd ed). New York: A Wiley-Interscience Publication.7.Kantowitz , B.H. , Roediger , H.L. ( 1984 ) .Experimentalpsychology(2nd ed.).New York:West Publishing Co.第二章 实验设计本章内容细目第一节 实验设计的基本类型一、被试者内设计 46(一)实验前后设计(二)定时系列设计(三)抵消实验条件的设计 二、被试者间设计 51(一)随机组设计(二)配对组设计 三、混合设计 56第二节 多变量实验技术一、多自变量实验的优点 58 二、多因素实验设计 63 三、拉丁方设计 65第三节 实验数据的统计分析一、统计表和统计图 66(一)统计表(二)统计图 二、实验数据的初步整理 73(一)偶然误差与系统误差(二)集中量(三)差异量 三、显著性检验 82(一)显著性检验的含义(二) t 检验(三)F 检验(四)X2 检验本章摘要建议 参考资料前面谈到,心理学是一门实验科学。为了完成好一个实验,并使其在方 法上能站得住脚,必须首先做好实验设计,这是实验成功的关键。一个好的 实验设计能够用最少的人力、物力来获得最多和最有效的实验数据以达到最 佳的实验目的。否则,如果实验设计不当、对非实验条件控制不严、实验方 法和程序安排不合理,即使实验的规模较大、实验次数较多,但是所得到的 实验数据却不能为最初所提出的问题提供合理的答案,达不到原来的实验目 的。这样的实验设计不是好的设计。一个良好的实验设计是实验研究能够作出成果的重要因素,实验设计是整个实验研究的重要组成部分。有人以为只有实验终了得出数据之后再考虑 统计处理,这样想法是片面的。事实上,只有在实验开始之前就有精心的实 验设计,才能事半而功倍。心理是一种复杂的现象,它跟自然现象和社会现 象一样,也有着自己本身的规律性。实验就是揭示这些规律性。但心理科学 的实验设计要比其他科学更为困难,这是因为无论是实验对象,还是环境条 件,反应测定都要受到很大的限制。因此,掌握好实验设计技术也就更加重 要。科学的探索要求不断地发展自己的手段和方法,也就是要不断地创造出 新的“工具”。这些新的方法和“工具”,理所当然地能反映在实验设计之 中。历史事实表明,方法上的创新能使我们产生意想不到的效果。顾名思义,实验设计就是对实验的设计。在长期的科学实验中,科学工 作者已经总结出一些在实验设计时所必须遵守的共同原则、具体的实验方法 和技术上应注意的细节。本章内容主要讨论下面六个问题:1.何谓实验设计,它有哪些基本类型。2.多自变量实验设计有哪些优点。3.统计表有何功能。4.统计图有何功能。5.标准差的主要用途有哪些。6.什么叫显著性检验?在使用显著性检验时应注意什么。第一节 实验设计的基本类型实验设计(experimental design)乃是进行科学实验前做的具体计划。 它主要是控制实验条件和安排实验程序的计划。它的目的在于找出实验条件 和实验结果之间的关系,做出正确的结论,来检验解决问题的假设。心理实 验设计的内容包括:刺激变量(或刺激变项)(stimulus variable)的确定 及其呈现的方式,反应变量(或反应变项)(response variable)的指标及 其测量方法,对一切有关变量(或变项)(variable)的控制措施,确定被 试者人数和选择被试者的方法,拟定主试在实验开始前对被试者要说的指示 语,规定实验次数,安排实验程序,规定使用仪器的型号,处理实验数据的 方法等等。实验设计要对实验结果有预见性,要保证严格按照实验设计进行 才能取得有效的实验数据。每一个实验设计都必须回答三个基本问题:(1)实验采用多少自变量? 例如在一个阅读速度的研究中取“照明强度”为自变量。(2)各自变量内又 采用多少处理水平?例如照明强度又分为强、中、弱等处理水平。(3)在各 自变量和各处理水平中用相同的被试者,还是用不同的被试者?根据这三个 条件的组合,就可构成许多不同类型的实验设计。一般根据对上述三个问题的回答,就可把实验设计的类型大体上分为三种:被试者内设计、被试者间设计以及同时包括被试者内与被试者间的混合 设计(mixed design)。被试者如果在自变量发生变化的所有情况下接受实验,则是被试者内设计。例如,自变量是照明强度,假如有强、中、弱等三种照度供操纵;因变 量是观测一个在标准条件下视角为一分的 C 型视标的距离。采用被试者内设 计时,同一被试者需要在三种照明条件下都接受测试。如被试者只接受多个自变量情况中的一个,即不同的被试者接受不同自变量的处理,这类设计便是被试者间设计。在上例中,如实验者令一组被试 者在强照度条件下测试,令另一组被试者接受中等照度条件下的测试,令第 三组被试者接受弱照度条件下的测试,如此类推,直到各组都分别接受某一 种照度条件下的测试。这种实验设计就是被试者间设计。为什么在被试者内设计和被试者间设计中,实验都可以同时操作两个或两个以上的自变量呢?乍看之下,这种处理似乎违背了实验法“单一变量” 的原则。其实,由于实验者采用了统计方法,可以通过平衡多变量的关系, 通过控制其他一些自变量,使某一阶段变化特性显露出来,这一问题就迎刃 而解了。因此,可以说统计技术是实验设计的基础。所谓混合设计,是指在一项实验中,有些自变量是被试者内的,而有些 自变量是被试者间的。例如,一个被试者接受甲变量的每一种情况,但只接 受乙变量的一种情况。根据被试者内设计和被试者间设计的特征,这时的甲 变量是被试者内自变量,乙变量则是被试者间自变量了。这类实验设计即是 混合设计。一、被试者内设计被试者内设计 (或受试者内设计、单组实验设计) ( within- subjectsdesign)是每个被试者须接受自变量的所有情况的处理。其基本原 理是:每个被试者参与所有的实验处理,然后比较相同被试者在不同处理下 的行为变化。这种实验设计下的同一被试者既为实验组提供数据,也为控制组提供数据。因此,被试者内设计无需另找控制组的被试者。 在实验研究中,如果实验者主要想研究每一个被试者对实验处理所引起的行为上的变化,一般可考虑采用被试者内设计。被试者内设计又可分为三 种子类型:(一)实验前后设计实验前后设计(experimental before-after design)是指在实验条件 处理前对被试者进行观测的结果与实验条件处理后所做的同样观测的结果加 以对比的设计。也就是说,这种设计类型是实验(处理)前后的比较设计。 我们可用表 2-1 来表示这种设计的模式。实验(处理)前、后设计,具有二个优点:(1)能较明显地检查出实验 处理的效果如何。因为在这种实验中,前、后被试者是同一的,如果能够控 制好无关变量的话,那么实验处理前后的差异,就是实验处理的结果。(2)表 2-1 实验前与实验后设计模式组数前观测处理后观测 1 Y1 X Y2 说明:Y1 表示实验处理前对被试者观测所得值Y2 表示实验处理后对被试者观测所得值X 表示实验条件处理 对被试者的需要量较少,一组被试者当二组被试者用,无须再增设被试者控制组。不仅效率提高了,而且被试者变量也得到了较好的控制。然而,我们应该看到不足之处。各类被试者内设计的共同缺点是,这类 设计需要每个被试者在实验中花费很多时间。通常一个被试者被要求执行几 项任务,这势必会产生疲劳,影响实验结果。而前、后设计还有二个不足之 处:(1)由于前、后两次观测之间存在时间间隔,这就会带来外来影响。一 般来说,前、后间隔时间愈长,则影响就愈大。反之,如果前、后两次观测 时间很接近,倒可以认为这是实验处理引起的行为差异。(2)容易产生顺序 误差。即前面的观测影响后面观测的结果,从而影响实验结果。例如实验中 第一次观测会产生学习、疲劳、情绪等效应,从而影响第二次观测的结果。(二)定时系列设计定时系列设计(time serial design)是指实验处理前对一组被试者作 一系列的定时重复观测,然后实施实验处理。再对被试者作一系列的定时重 复观测,分析自变量(实验处理)对因变量的关系。定时系列设计可以看作 是前、后设计的扩展形式。定时系列设计,一般先分别求出实验处理前和实 验处理后的平均数,也有分别取众数或中数的。我们用表 2-2 来表示这种设 计的模式。表 2-2 定时系列设计模式组数前观测处理后观测 1 Y1a 、 Y1b 、 Y1c X Y2a 、 Y2b 、 Y2c 说明:Y1a、Y1b、Y1c 分别表示实验处理前之观测值Y2a、Y2b、Y2c 分别表示实验处理后之观测值X 表示实验条件处理 定时系列设计除了具有上述前、后设计的二个优点之外,还具有以下二个优点:(1)降低由于一次观测而得到被试者不正常行为的机率。实验处理 前和实验处理后分别对每一位被试者作一系列测定,这就能降低只作一次观 测而得到不正确结果的机率。(2)提供测量过程中的信息。无论是在实验处 理前,或是在实验处理后,均对被试者进行一系列的观测,这样就可以使我 们看出发展趋向。但是,问题还具有两面性,定时系列设计的这些优点,也加重了前、后 设计所存在的弱势:(1)由于更多次的观测,势必延长实验时间,从而会有 更多的外来影响。(2)也正是更多次的观测,更易引起顺序误差,更易导致 练习、疲劳、紧张或厌烦等效应,影响实验结果。(三)抵消实验条件的设计抵消实验条件的设计(reversal experimental condition design)是 指抵消实验过程中无关变量的一种设计。前面讲到,有些无关变量在某些实 验情况下既不能被消除,又不能保持恒定。例如,单组实验往往由于前一处 理影响后一处理的效果,产生顺序误差。为了抵消顺序误差,最简单的方法 就是用 ABBA 的排列顺序来安排实验顺序。其模式可用表 2-3 表示。从表 2-3 中可见,首先给被试者作第一种处理(XA)和第一种处理后的观测(Y2a),其次作第二种处理(XB)和处理后的第二次观测(Y2b),再重复第二种、最后重复第一种的处理和观测。整个实验程序的安排,就是抵消 实验条件的设计的基本形式。这里不妨举一个例子。有甲乙两种操作方式,我们要比较这两种操作方式哪一种更正确,更快些。我们知道,以人作为被试者的实验,在不同时间 所得结果必然有所不同,甚至同一人以同一操作方式作一系列实验,要使其 中两次结果完全相同也是一件不容易的事。定时系列规则是解决此类问题的 方法之一。但是定时系列规则不能消除和顺序有关的实验误差。表 2-3 抵消实验条件设计的模式处 理 XA XB XB XA 后观测 Y2a Y2b Y2c Y2d 为了消除这类影响,方法之一就是使用抵消实验条件的设计。本例就可用表 2-4 表示其模式。表 2-4 抵消实验条件设计的实例处理操作方式甲操作方式乙操作方式乙操作方式甲结果试验一之观测值试验二之观测值试验三之观测值试验四之观测值 这种实验设计在处理 XA 的情况下得到两个数值,在处理 XB 的情况下也得到两个数值。统计时就通过分别求平均数后,加以比较。这样的实验设计, 既安排了二种操作方式在程序上的均等,同时又提供了估计随机误差的可能性。抵消实验条件的设计具有三个明显的优点:(1)能较好地控制被试者变 量,这是单组实验设计的共同优点。单组实验设计不但比两组实验设计用的 被试者数量少,而且由于两种实验条件使用同一被试者,从而较好地控制了 实验变量。(2)能较好地控制顺序误差。在心理实验中有许多变量与时间有 关,例如学习、练习、迁移、挫折、疲劳等等。这些变量特别需要用这类实 验设计来消除顺序误差。如果一半被试者所作的顺序为 ABBA,另一半被试者 所作的顺序为 BAAB,那就抵消得更彻底。(3)时间上比较经济。这类实验 一般观测次数不多,上面操作方式甲乙的比较,也只要通过四次观测就能完 成某一被试者的实验。因此,被试者较易配合,以顺利完成实验,同时也排 除了某一些实验误差。抵消实验条件设计虽有上述优点,但也有其局限性。主要有两点:(1) 反应变量在时间维度(轴)上的关系是线性时才能使用。抵消实验条件的设 计的前提条件是反应变量在时间维度(轴)上的关系是线性关系。例如单纯 的前影响作用,无论是从试验一到试验二,还是从试验三到试验四,都是后 者受前者的影响。但是,当这些变量的实际效果与行为效果的关系是非线性 时,则采用这类设计也不能达到抵消实验的顺序误差的目的。(2)对有些实 验不适用。例如用两种学习方法学习同一实验材料就不适用。若一定要用这 种设计,就必须改用同一被试用两种学习方法,学习两种难度相等的不同材 料,才能消除练习误差,同时还应用相同的计量单位,否则无法进行比较。 以上我们介绍了三类单组实验设计,清楚了这些设计所具有的优点。在心理 实验中确实有不少运用这种设计方法达到较好效果的例子。例如:杨治良等(1979)曾用单组实验前后设计,对痛的成分进行心理学研究。采用这种设计的出发点是愿接受痛刺激的被试者不可多得,为了弥补单组实验和被试者 数量较少的不足,实验采用单组实验前后设计。在这样的设计中,被试者变 量能得到较好的控制,因为能消除由被试差异引起的误差,从而对自变量的 效果作出更精确的估计。同时,为尽可能减少单组实验中的被试者在实验中 花费很多时间,实验采用了心理量表法记分,通过被试者一次反应,记录较 多的反应指标,而这些指标之间又存在着很大的一致性(见表 25)。从表25 可见,众多的生理和心理指标增加了对照程度,在一定程度上弥补了被试者较少的缺陷。表 2-5 痛反应量表极拒大相当于各级刺激的强度为被试的平均值(采自杨治良,1979)应看到单组实验设计有其局限性,同时,正如前面所述,对有些实验不 适用。单组实验设计在不能避免某种系统误差时,就要用被试者间设计或混 合设计来完善实验设计。二、被试者间设计被试者内设计要求每一个被试者接受所有自变量处理,关键是如何安排 各处理的先后次序。被试者间设计(或组间法)(betweensubjects design) 是要求每个被试者(组)只接受一个自变量处理,对另一被试者(组)进行 另一种处理,故又称这种设计为独立组设计 (independent groups design)。这种设计的主要问题是如何决定哪一个被试者(组)接受哪一个 实验处理。若有两种以上的处理,有多少种处理就采用多少个被试者(组)。 被试者间设计或独立组设计有两类设计技术:随机组设计和配对组设计。(一)随机组设计随机组设计(或随机分组设计)(randomgroups design)是将被试者 随机地分配在不同的组内接受不同的自变量处理。这一假设是将被试者随机 分配到不同的组,若对各组用一样的课题,在相同的条件下进行测量,其结 果就成为相等组(或等组)(equivalent groups),则它们的成绩在统计上 应是相等的。换句话说,假设各组在与实验课题有关的特性上(如年龄、智 力、性格特征等)没有差别(在统计允许的限度以内),而实验结果却出现 了差别,这差别就是由于处理的不同而引起的。从统计理论来讲,特别是从抽样理论来说,此设计的各被试者样本(随 机组)在未受不同的实验处理前,他们的作业平均数在统计上是没有显著差异的,如果有,也仅仅是抽样变动。各自样本的平均数 X 都是总体平均数 的无偏估计值。换言之,各随机组在未经受不同处理之前是相等的(在统计 允许的限度以内)。若这些随机组经受不同的实验处理后,经 t 检验和 F 检 验后发现作业的平均数有显著性差异,那么这些差别是实验处理的不同引起 的。各实验处理的平均数不是来自总体的平均数,而是来自各实验处理总 体1,2,?,k。这就是根据随机理论所作的逻辑推理。怎样才能做到随机分组呢?常用的方法有两种:同时分配法和次第分配 法。这两种方法各有其特点,可择宜采用。1.同时分配法同时分配的条件是,被试者同时等候,而实验者可随意调 派其中任何一个被试者。同时分配法通常有三种技术。(1)抽签法:先将所有被试者编号,记入纸片,每一纸片号码代表一个 被试者,然后将纸片放入容器内搅匀,按组抽取。若要将 40 个被试者分为四 组时,第一次抽 10 片,代表第一组,第二次也抽 10 片,代表第二组,依次 类推。假定 40 个被试者中有 16 个女生,则每组应各有 4 名女生。所以可以在 16 名女生中先随机选 4 名,再在 24 名男生中随机选 6 名,归入第一组, 依次类推。(2)笔划法:若要将 40 个被试者分为四组时,首先将被试者依其姓氏 笔划数进行次序排列,再查随机数表每一数列的第一位数,只取第一个数为1、2、3、和 4 的数字,分别归属四个组,各查 10 个,共查满 40 个以后,按姓氏笔划先后对入 1、2、3、4 所表示的组别。用此法时只要注意在查第一位 数为 1、2、3、4 的随机数时各查 10 个即可。(3)报数法:若要将 40 个被试者分为四组时,采用类似于体育课上的报数,假定被试者都坐在教室内,实验者令其从第一排报数,报 1 的被试者 都被分在第一组、报 2 的被试者都分在第二组,依此类推,只是要注意原有 顺序的影响。若每排报数的方向随机改变,例如用 1234,4321,2341 等不同 的顺序报数,则随机分组的效果将更好。2.次第分配法 次第分配法的条件是,由于实验持续时间较长或其他原因,实验者知道有一群被试者,但不知道究竟那位被试者什么时间会来,只 能根据预先拟好的原则进行分派,而且当实验结束时,各组要符合随机组的 要求。这里介绍两种技术。(1)简便法:按被试者出现在实验的先后分派,第一名属第一组,第二名属第二组,第三名属第三组,依此类推等。这有点像同时分配法中的第三 例。一般而言,使用本法能满足随机的条件,然而它取决于被试者报到的次 序是否符合随机原则。(2)区内随机法:为了避免被试者非随机出现的可能性,可按照被试者 来到实验室的先后,使用区内随机次序分派被试者归属各组。例如,可根据 随机数表来分配被试者。随机组设计有优点也有缺点。其优点是:(1)用随机分配被试者的方法 可控制两组被试者变量的差异,分组方法简单可行。(2)由于对每一被试者 只作一次观测,可消除某些实验误差,如消除学习误差的影响。这种设计的 缺点是:(1)分成等组的方法仍欠精密。(2)若两组在不同时期观测,就 有可能插入实验以外的偶发事件,影响因变量的观测结果。(二)配对组设计配对组设计(或对等组设计)(matchedgroups design)是随机组设计的一种逻辑扩展。配对组设计的目的是使各组的特性更加相同。这种设计 可控制组内变异和组间变异。在心理学研究中常常会遇到某些变量,特别是 机体内部的变量,例如智力、态度?。它们对实验变量(自变量),例如 对教材、教法等来说是额外的、无关的,而对因变量来说却是有关的。因此, 它们是共变量。共变量若不受到实验控制,则进行 F 检验时作为实验误差的 组内误差往往就不合理地扩大了。配对组设计就能解决此类问题。这一设计 要求把共变量分成几个等级,经过测量,然后把具有同一等级特征的 K 个被 试者加以配对,此时,每一个配对组便是一个层级。配对组的 K 个被试者每 人只接受一种实验处理,至于谁应接受哪一种实验处理,则用随机分派的方 法来决定。表 26 乃是配对组设计的基本模式。表 26 配对组设计的基本模式(采自杨治良、乐竟泓,1990)在表 26 上,每一等级的每一处理只是观察一个被试者的做法,有时所 观察的基本单位不是一个被试者,而是一个团体或一个子集合。配对法常有两个步骤:第一,令所有被试者做“共同作业”,即接受预 备测验,获得作业分数;第二,根据作业分数形成配对组。第一步:共同作业共同作业(common task)亦称为先检验(或前测)(pretest)。配对 组设计的优劣完全依赖实验作业是否与共同作业有高度的相关。先检验与实 验作业的相关越高,组间差异越小,则接受不同处理后的实验结果越能反映 实验处理的差异。先检验作业有两种:一种是和实验作业有高度相关的其他 作业;另一种是
展开阅读全文