第8章 假设检验

上传人:zou****hua 文档编号:184994593 上传时间:2023-02-02 格式:DOCX 页数:25 大小:148.72KB
返回 下载 相关 举报
第8章 假设检验_第1页
第1页 / 共25页
第8章 假设检验_第2页
第2页 / 共25页
第8章 假设检验_第3页
第3页 / 共25页
点击查看更多>>
资源描述
第六章 假设检验 教学目的:理解假设检验的一般原理和步骤;掌握平均数的显著性检验;平均数差异显著性 检验;方差差异的检验。教学重点:假设检验的一般原理;平均数的显著性检验;平均数差异显著性检验;方差差 异的检验等假设检验方法与步骤。教学时数:(8 学时)假设检验是指先对总体提出某项假设(对总体参数或分布所作的某一假设),然后利用从总 体中抽样所得的样本信息,根据一定概率来检验所提的假设是否正确,从而做出接受或拒绝的决 策。假设检验是推断统计中最重要的内容。假设检验包括参数检验和非参数检验。若进行假设检验时总体的分布形式书籍,需要对总体 的未知参数进行假设检验,称其为参数检验;若对总体分布形式所知甚少,需要对未知分布函数 的形式及其他特征进行假设检验,通常称之为非参数检验。本章是假设检验方法中检验目的最简单、思想方法最具有共性,统计计算最直接的一种方法。 假设检验的内容繁多,但不管其检验目的如何变化,也不管其抽样分布如何不同,具体的计算方 法如何有别,假设检验的基本思想都是一样的。要学会各种具体的统计假设检验,首先必须掌握 其基本思想方法。第一节 假设检验的基本思想与方法一、原理与概念 通过一个具体例子引入: 某学科考试成绩历来都是服从正态分布的,总平均数一直维持在60 分的水平上,总体标准 差为 15,1998 年 10 月实行新的教学方法后,某研究者希望检验一下这次的总体水平是否还是 60分,他随机抽取了一个n=120的样本,算得平均数为63,问这次该科考试的总平均是否还是60 分?初看这个例子,样本平均数为63, p =60,似乎可马上得出“不是”的结论,但这样简单地 分析是错误的,因为我们不忘记抽样是有误差的,即使该学科这次考试的总体平均数还是60分, 从中抽取一个样本,其平均数恰好为60分的可能性是很小的,因而就因为平均数不等于60,而 否定总体p =60的简单分析是错误的。但反过来,就因为抽样是有误差的,因此就认为这3分之 差是误差也无充分理由。这3分之中,也可能有着真实的差异。如何判断呢?根据抽样分布理论,样本均值处在以总体均值为均值,以总体方差的n分之一为方差的正态 分布中,所以到底这次考试的总体均值在60分之上还是之下仍不知道,因此这种顺推的办法是 行不通的。既然顺推行不通,我们进行反证,先假设这次该科考试的总平均还是60分,然后检X验这一假设的正确性。根据抽样分布理论,63分就处在总体均值60分Z二0 =2.09处,n而在正态分布中, Z=1. 96以上的概率为0. 05,故若总体均值为60分,则一次抽样就抽到平均数 为 63 分的概率是一小概率事件,则认为是不可能发生的。例:有人调查早期教育对儿童智力发展的影响,从受过良好早期的儿童中随机抽取70 人进行 韦氏儿童智力测验(常模 p =100,0 =15),结果样本平均数为103.3,能否认为受过良好早 oo期教育的儿童智力高于一般水平。分析1、首先,要明确这里的总体和样本指的是什么?总体,所有受过良好早期教育的儿童;样本,被选中的那70名受过良好早期教育的儿童。2、 常模(p =100, o =15丿指的是什么?常模是指所有儿童的智力平均水oo平,就是这里所说的“一般水平”,给出的目的是把它当作一个标准,让它与受过良好早期教育 的儿童的平均智力(总体均值)进行比较。3、现在,要进行比较的两个事物中的一方清楚了,但另一方呢? 即受过良好早期教育 的儿童的平均智力是多少呢?我们不知道它的确切值,只知道70名受过良好早期教育儿童的平 均智商1 03.3分,要是1 03.3与那个我们不知道的总体均值之间有什么直接联系问题也就解决了! 根据抽样分布理论,样本均值处在以总体均值为均值,以总体方差的 n 分之一为方差的正态分布 中,所以倒底1 03.3在总体均值之上还是之下我们仍然不知道,因此这种顺推的办法是行不通的。4、我们再回到问题“受过良好早期教育的儿童的平均智力(总体均值)与常模比较大小” 这个问题上来,既然我们顺推行不通,我们进行反证,我们去证明假设“受过良好早期教育的儿 童的平均智力(总体均值)等于常模均值100”会是怎样的情况呢?要是这样,根据抽样分布理 论,样本均值 103.3 就处在“总体均值”以上的 Z=1.84 个标准差单位处,而在正态分布中, Z=1.645以上的概率是5%,所以在前面的假设下(总体均值为100丿,一次抽样就抽到一个平 均数为103.3的样本是一个发生可能性很小的事件,而我们常常认为“小概率事件在一次抽样中 是不可能发生的”,所以在总体均值为100的情况下,一次抽样就抽到一个平均数为103.3的样 本是有矛盾的,因此我们所做的假设是不成立的。(一)假设从上例可看出,假设检验的前提是建立假设,也称研究假设,是根据已知理论或事实对现象 所作的假定性说明。例如,有人观察到这样一个事实:那些患临床抑郁症的人在12 月底到 2 月 初更容易患病。于是有人提出假设认为这是一个心理现象,是放假的结果,因为病人都希望在假 期能过得愉快和充实,但这种愿望往往不能完全实现,因此他们的抑郁症就容易引发。另外有人 认为是物理现象,因为冬天缺乏太阳光。这就是假设。假设必须进行验证,才能承认或否认它。 检验的方法往往是进行实验或调查,然后再进行统计。用统计术语来描述假设就称为统计假设。假设是科学研究中广泛使用的一种方法,如天文学史上的日心说,宇宙发生史上的大爆炸说, 地球形成史上的冷凝说等等。统计假设检验中使用的假设有两种,一种称为虚无假设,又称原假设或零假设,另一种称为 备择假设,二者相互是对立的。原假设往往是研究者根据样本信息期望拒绝的假设(无差异假设), 以 H0 表示,备择假设与原假设相互排斥,是研究者根据样本信息期望证实的假设(有差异假设), 以斗表示。一般将含有的列为H0。在假设检验中,假设都是成对出现的,其中第一个为原假设,第二个为备择假设,二者从形 式上看是同时出现的,缺一不可,从逻辑上看是非此即彼的,二者不可能同时成立,也不可能同 时不成立。对于上例,H0: p =p , H1: p Hp 0,在H0成立的情况下,根据抽样分布的理论,有X IIZ =/ 0N(0,1)由X的实际值可求出Z的实际值,Z0=2.19,6._nPV0.05,这是一个小概率事件,可认定假设是不成立的。假设检验:是用抽样出来的随机样本来检验样本所代表的总体的有关特征,它的基本思想 是小概率反证法思想。当总体分布形式已知时,可以事先根据有关资料对这些参数作一个假设(H ),然后在此基础上构造适当的统计(要求在H下无未知量,和有精确的分布规律),并依 oo据样本信息进行计算,在一定的概率(95%或99%)下进行推理,并最终判别假设(H )的合理性,o即在 H 和 H 间作出选择。o1(二)检验统计量上例中 Z 就称为检验统计量,它是根据检验目的和抽样分布而设计的,专门用于统计假设 检验的,在其计算中要应用到与所检验参数相应的样本统计量。如检验两总体的平均数是否有差 异,则要应用两样本平均数;检验两总体方差是否有差异,就要用到两样本方差。检验统计量的设计要根据抽样分布,只有这样,才能找到它的概率分布形态,也才能考察它 的取值概率。如抽样分布是正态分布,计算的就是正态分布的Z分数;抽样分布是t分布,计算 的就是t分布的t分数。(三)小概率事件0WPW1不可能事件必然事件如果某一事件的P小于事先规定的水平,就称为小概率事件。如规定P=0.01,在正常人群 中随机抽取一人智商高于140以上的PvO.01一般,人们对小概率事的发生感到吃惊,如中奖、商场抽奖都是自己的员工等,甚至怀疑在 哪个环节出了错。小概率事件原理即认为小概率事件不可能在一次抽样中不可能发生。如990个红球和10个 白球,从中随机抽取一个,一般猜是红。虽然小概率事件毕竟不是不可能事件,还会发生,但就 整个判断决策来说,猜红球的决策是正确的,这种决策思维方法就是小概率事件原理。如一公认 是小概率的事件竟然在一次随机抽样中发生了,有很大的可能是某个环节出了差错,我们必须去 查找它的原因。小概率事件是否出现,是对假设作决断的根据。上例即是假定原假设成立的情况下,来考察 样本统计量的值在以|J为中心的抽样分布上的出现的P如何,如P大,则保留原假设,否则, 拒绝原假设。(四)假设检验的思想方法一一带有概率值保证的反证法 反证法是大家熟悉的一种逻辑推理证明方法。正面推论难,从反面证明否命题的荒谬却往往事半功倍。如证ab,却设aWb,推论出错误的结果,或与已知不符合的结果。假设检验从逻辑过程来看也是一种反证法。 (详述) 所谓带有概率值保证是指上述的假设检验是根据小概率事件原理做出的,而根据小概率事件 原理作决策是一种科学正确的决策方法,但并不能保证每次的决策都是正确的,只是犯错误的概 率 P 很小,而且是我们可以控制的。它与数学反证法的区别:一是数学反证法结论是百分之百的正确,二是数学反证法如最终推 不出错误,反证法无意义,而假设检验不然,过程仍成立,只是结论不同而已,“无充分理由拒 绝原假设”,即承认原假设,如仍感到怀疑,则要重新抽样。(五)显著性水平样本统计量的值究竟在以总体|J为中心的抽样分布上出现的P小到什么程度才算小概率 事件发生了?这是由研究者对于假设检验的结论所要达到的可靠性程度所决定的。统计学中一般 规定两种水平0.05和0.01。如研究者在0.05的水平上对假设进行检验,那么只要样本统计量的 值在抽样分布上出现的P小于0.05,就认为小概率事件发生了,应拒绝原假设。统计学中把这种拒绝原假设的P值称为显著性水平。也即统计推断时可能犯错误的概率。 即决策中的风险。显著性水平么/ ),越不易拒绝H0,可靠性f显著性水平(aT),越容易拒绝h 0,可靠性/(六)接受区域和拒绝区域二、单侧检验与双侧检验前面所做的假设为H:卩=卩H1:呼卩所关心的问题是,卩与卩是否有差异,并不关心是 o o 1o ,o大是小,因此,这种检验方法则在卩。两端都需要一个临界点,把临界点以外的区域作为拒绝域。 这时,若显著性水平为0.05,则两端的拒绝域的面积比例各为0.025。这种只强调差异而不强调方向性的检验为双侧检验。 而如:某高校参加同专业的统一考试,随机抽查64份试卷,由此求得平均成绩为69分,标 准差为 9.5 分,已知该校全体考生成绩分布服从正态分布,且总平均分为65 分,问该高校考生 的平均成绩是否显著地高于全体考生的平均水平?在此例中,它提出的是M 65是否成立。当然,仅从成绩来看,69分比64分高,但我们需 要了解的是,这种高5分的差异是来自抽样误差还是系统误差,所以这时的假设应为H0: p W 65, H: p 65,若接受Ho,就意味着该校考生水平不高于全体考生的平均水平;反之,则 是高于平均水平。此时显著性水平为a的拒绝域在右边,面积为a,称右单侧检验。这种强调某一方向的检验 为单侧检验。通常适用于检验某一参数是否“大于”或“优于”、“快于”及“小于”、“劣于”、 “慢于”另一参数等一类问题。在实际研究中何时用单侧检验,何时用双侧检验,一定要根据研究的目的来确定,不能随心 所欲地选用,二者的区别:1问题的提法不同。 2建立假设的形式不同。3.否定域不同。右单侧:ZZa, 左单侧:Zv-Za双侧:|Z| Z込注意:检验方式对B错误有影响,该用单侧检验的问题,如果用双侧检验,其结果一方面可能使 结论由“显著”变为“不显著”,另一方面也使B增加,反之,应用双侧检验的用了单侧 检验,虽减少了单侧检验B,但是使无方向的问题人为地成为单方向的问题,这也有违研 究目的。一般,双侧检验:信息量少,初探 单侧检验:信息丰富,验证三、统计决策的两类错误 前面讲了假设检验进行判断的依据是小概率事件原理,即认为小概率事件在一次试验中是不 可能发生的,但实际上,小概率事件也有可能发生,只是发生的概率小而已,这就可能导致错误。 从假设检验的基本思想来看,决策结果可能引起两种错误:a型错误:Ho为真时,拒绝,也称I型错误。“弃真”B型错误:Ho为假时,接受,也称II型错误。“取伪”注意:接受 Ho 时,并不等于说二者100%无差异,同样有犯错误的可能。 无论是“弃真”还是“取伪”,在现实中都是无法避免的,这就是通常所说的“次策失误”。 当然,我们可以通过增加样本容量的办法来减少犯两类错误的概率,决策H0性质、拒绝接受属真I型(a )错误正确实伪正确II型(B )错误例如,对于法官的判案,法官也必须面对Ho (被告无罪)与H1 (被告有罪)的决择,如果 被告确实是无辜,却判为有罪,就是法 官犯了a错误,如果被告确实有犯罪事 实却宣判无罪,则法官犯了 B错误。但 一般来说,法官们的信条应该是“宁可 误判无罪,也不应累及无辜”,而不应 是蒋介石的“宁可错杀一千,不可漏掉 一个”。两类错误的关系:(1)是两个前提下的概率, 是一次假设检验的两个可信度指标,但一次实际的检验决策中只可能犯其中的一种错误,因 为真实情况要么是H0为真,要么是H1为真。a是拒绝Ho时犯错误的概率(此时的前提是“Ho为真”)B是接受Ho时犯错误的概率(此时的前提是“Ho为假”)所以a +B不一定等于1,这是两类错误的关系中较为重要的一点。讨论:Ho为真时(左图),临界点右边表示拒绝区域,面积比率为a ;临界点左边表示接受区域, 面积比率为B。Ho为假时(左图),样本平均值落在临界点左边,这时接受原假设所犯错误的概率为B 由于影响B型错误P值大小的因素中有一些是不确定因素,因此在实际检验中B值是无法 求得的。显而易见,a +B不一定等于1。(2)在其他条件下变的情况下,二者不能同时减小或增大原则:力争在保证a的前提下,降低B。一般在差异检验中主要关心的是能否有充分理由拒绝原假设,从而证实备择假设,所以 a在统计中规定较严,至于B往往就不那么重视了。有许多情况需要在规定a的同时,尽是 减小B,这时最直接的方法是n f,因为样本平均数分布的标准误为/订,当n f时,样 本平均数分布将变得陡峭,在a和其它条件不变时B将减小。(3)1-卩反映的是正确辩认真实差异的能力,在统计中称1-卩为统计检验力。Ho为假时,接受原假设所犯错误的概率为B,那么此时拒绝原假设正确的概率为1-B, 即指当H1为真(Ho为假)时,即两平均数确有差异时,能以1-B的概率接受之。当a及其它条件不变时,减小两平均数的距离,必引起B增大,(1-B )减小,也就是说, 其他条件不变,两平均数的真实差异很小时,正确接受H1的概率I,正确检验出真实差异 的把握(;相反,其它条件不变,两平均数的真实差异变大,贝|(1-B ) f,正确检验出真 实差异的把握f,所以说(1-B )反映了正确辨认真实差异的能力,统计中称(1-B )为统计检 验力,如果真实差异很小,某个检验仍能以很大的把握检验出来,就说明这个检验的统计检 验力比较大。影响B的因素, a :a I B fJm 1-M 0 :(M 1-MB In :n f B I四、假设检验的步骤1、提出假设( Ho 和 H1)o12、选择适当的统计量并计算其值;3、根据给定的小概率(显著性水平)a,查表查临界值5、统计决策第二节 总体均值的显著性检验总体均值的假设检验, (检验统计量、抽样分布)根据随机抽取样本、总体分布、总体参数情况、样本容量的不同,就要选择不同的检验方法。具体有以下三种:x-U总体正态,总体方差已知Z二0SExN (0,1)t(nl)nW3x - U总体正态,总体方差未知t二0SExZ(0, 1)n30x U总体非正态,n30z二SEx一、总体正态分布,总体方差已知0,1)x - UcZ = 亠N (0,1)SE-SExx例1:某地区数学统考,假设其成绩服从正态分布,已知卩o =50分,O =12分,从该地区随机选取一个班作为样本,该班有学生50人,经计算该班x =53分,试问该班成绩与总平均成绩的差异是否显著。解:(1)建立假设H。:卩=卩。H1: p Hpx-U(2)计算检验统计量Z二 0 SExo,X-U0=3/1.7=1.76a _n当a =0.05 时,Z a 2=1.96(4)1.760.05 差异不显著该班学生成绩与总平均成绩的差异不显著例2:某专业课在全国同类高校内进行统一测试,已知全体考生成绩服从正态分布,卩=64分,o接受HoO =8.6分,从某高校随机抽20份试卷,经计算得x =70分,问该校学生是否显著地优于全体学生的平均水平。解: (1)建立假设Ho:卩知。斗:p p(2)计算检验统计量Z二o,x U X U0 =0 =6/1.92=3.125SE a -xn(3) 当a =0.01 时, z =2.330.01(4) 3.125*2.33 P0.01 差异极其显著拒绝 Ho该校学生的平均成绩极其显著地优于全体学生的平均水平。例3:全国统考,卩=63.5, O =18.7,某城市x =65.1, n=168人,问该城市的平均成绩与全国的总 平均成绩是否有显著差异。一 x U X 一Z二” 0 =一L =1.1091.96 拒绝H,有显著差异SE 右x n总结:1、n太小,即使H0不对,也难于有足够的证据否决n小时,否决H的意义大(可靠)2、n太大,可把与H。很细微的差别检验出来,无实际意义。n大时,接受H。的意义大3、若要检验可靠些, n 需大些,一般教育研究n三50,心理研究n230,调查研究n三100(10%)二、总体分布正态,总体方差未知 其基本原理与前相同,所不同的是在计算标准误时,由于总体方差未知,要用无偏估计量代替,所服从的分布是t(n-1)分布。x U t =0SE-t( n1 )SE = Sn1x n在实际中当n30时,t分布常被近似地按正态分布对待,可近似应用Z检验,而在nW30 时,必须用 t 检验例 1:学生的学习成绩与教师的教学方法有关。某校一教师采用了一种他认为新式有效的教学方 法。经过一学年的教学后,从该教师所教班级中随机抽取了 6 名学生的考试成绩,分别为 48.5, 49.0, 53.5, 49.5, 56.0, 52.5,而在该学年考试中,全年级的总平均分数为52.0, 试分析采用这种教学方法与未采用这种新教学方法的学生成绩有无显著的差异。 (已知考 生成绩服从正态分布,取a =0.05)。解:计算得 x =51.5S=2.48提出假设,H : |J p H : |J工o o 1 o这里不知道总体的方差,因此在H : J J的条件下有:ooxUt =0SExxU051.5 52.02.986 1= 0.41接受零假设,查 T 分布表得,t = 2.571,而|t = 0.41 2.571,0.05 2(5)认为两种教学方法并没有显著。例2:甲教师担任5个班的英语课,研究演讲对成绩有无促进,选一班做实验,一个周期后,其 余4个班的平均成绩为78分,从该班随机抽取15人,平均成绩为82.33分,S=7.1,问 该班的平均成绩是否显著地高于其余4个班的平均成绩。解:提出假设,H: p WjH: pjoo1oM =p的条件下有:o二 2.276这里不知道总体的方差,因此在H :ox p x p 82.33 78 t 二 o 二二SE S7.1 _xvn 11-761,拒绝零假设认为该班成绩显著地高于其余4 个班的平均成绩。例3: 某心理学家认为一般汽车司机的视反应时平均185 毫秒,有人随机抽取37名汽车司机作为研究样本进行了测定,结果平均值为180毫秒,标准差25毫秒。能否根据测试结果否定该心理学家的结论(假定人的视反应时符合正态分布)。解:提出假设,H : m =m =185 H : m工=185oo1o这里不知道总体的方差,因此在H : m =m =175的条件下有:oo180185= 1.2xpt =0SEx查T分布表得,t = 2.031,而-2.031-1.22.031,接受零假设,0.052(36)认为该心理学家的结论基本上是正确的。例4 已知 4岁正常男童平均体重为15.6公斤,从某幼儿园中随机抽取20名4岁男童,经测量计算 出这20名男童平均体重为1 6公斤,标准差为1.76公斤,试问该幼儿园4岁男童的体重与4岁正常 男童平均体重有无显著性差异?解:建立假设:H。:尸卩。斗:啣。计算统计量:SEX1.76v20 1= 0.4X p16 15.6t =0 = 1SE-0.4X判断结果:t = 2.093(19)0.05 2因为10.05,差异不显著。故该幼儿园4 岁男童平均体重与正常男童平均体重无显著差异。例 5:某实验组随机选择了 40 名儿童作提高儿童智力水平实验,实验结束后,结参加实验的儿 童进行韦氏儿童智力测验,结果得到这40名儿童的智商平均值为105, S=12,已知韦氏儿童智 力测验的平均值为 100,试问该实验是否成功。解:提出假设,H : m Wm H : mmoo 1o这里不知道总体的方差,因此在H : m =M =175的条件下有:oox p x p105 1005t =0 = = 2.6SE S121.92xvn 12.423,拒绝零假设,0.01(39)认为实验是成功的。从t分布表中可以看出,在某一a下,随机df的增大,t逐渐接近Z,例如当df=10时,aat =2.23,而df=120时,t =1.98,非常接近1.96。因而在实际中当n30时,t分布常被近似地按正态分布对待,而在nW30时,必须用t检验。因此, Z 检验又叫大样本的检验方法t 检验又叫小样本的检验方法三、总体分布非正态如前所述,进行平均数差异的显著性检验的条件之一就是总体应服从正态分布,若总体为非 正态分布,因其x的抽样分布既不服从正态分布,也不服从t分布,原则上无法检验,这时应该 进行非参数检验,有时也可以对原始数据进行对数转换或其他转换(目的在于使非正态数据转化 为正态形式),然后再做Z检验或t检验。但若n30时,x的分布随n f趋近于正态分布。X LX/S即 Z =亠N (0,1) SE = & 或 SE - -=-SE-X / yjnXJ nX例 1:某省进行数学竞赛,结果分数不是正态分布,总平均分 43.5 分,某市参赛学生 168 人,x =45.1, S=18.6,问该市平均分与省平均分是否有显著差异。解:提出假设,H : pH :o o 1这里总体非正态,但n30Z-45.1 - 43.5SE18.6-1.112.58,故认为二者差异极其显著。 0.01 2(二)两总体方差未知1 两总体方差相等lb 2 b 2|1 F此时:SE - =4 +2 = .Q2 (+)Dx V n n V 0 n n 12、 1 2S2p(n -1)S2+ (n -1)S21nl12n 2-1(n -1) + (n -1)12由于方差未知,可将两样本修正方差的加权平均作为汇合方差(联合方差)SE -Dx(11 )(n -1)S2+ (n -1)S2二 S 2 (一 + )二.1n1-12p n nT 1 2 11 11( + )n n1 2由抽样分布理论可知:t = 1z t( n + n 一 2 )SE -12Dx为什么相关样本和独立大样本不用汇合方差呢?因为相关样本是成对数据,每对数据都能 求出差数,可将平均数差异的显著性检验转化为差数的显著性检验。由于无需用汇合方差,也就 无需进行齐性检验。而独立大样本平均数之差的标准误,是统计学家根据大样本抽样原理建立起 来的,它不需要假定两个总体方差相等,故无需进行方差齐性检验。例 1: 在一项关于反馈对知觉判断的影响的研究中,将被试随机分成两组,其中一组60 人作为实验组(每一次判断后将结果告诉被试),实验兀=80,标准差为18,另一组52人作为控制组(不让其知道每一次判断的结果), X2 =73,标准差为 15,试问二组的平均结果有无显著差异。解:假设实验数据服从正态分布,在此两总体方差未知,但两样本方差相差不大,故可接受 两总体方差相等的前提假设。提出假设,H : |J p H : |J工o1211211、n S2 + n S211SE - = .S2( +) =2亠(+ ) =3.15Dxi p n n V n + n 一21 12*12X - X c CC t 二丄2 =2.22SEDx查表得,o.O12(11O)= 2.618,0.05 2(11。)= 1.982.6182.22*1.98故认为二者差异显著。可见:对同一个问题,显著性水平的不同,会导致结论的不同,若在较小的a上拒绝Ho,则较大的a上也拒绝;若在较大的a上拒绝Ho,则在较小的a上不一定拒绝故进行统计分析时,一定要写明采用了何种统计方法,也要注意选取的a值,这样才能让读者明了统计分析结果的确切意义例2:某校进行一次速度测验,共选40人参加,其中男生22人,女生18人,经计算,男生测 验的平均分为72分,标准差为8分,女生测验的平均分为70分,标准差为7.6分,已知 该速度测验结果服从正态分布,试问男女生速度测验的平均结果有无显著差异。解: 已知结果服从正态分布,在此两总体方差未知,但两样本方差相差不大,故可接受两总体方差相等的前提假设。提出假设,H : J J H : Jo121121 T、_ nS 2 + n S 2 11SE -Dx=IS2 ( + ) = 1_12 芬( + ) =2.55p n nn + n 一 2 n n12 12 1 2X 一 X t =12 =0.78SE -Dx查表得,t= 2.0210.78V2.021故认为二者差异不显著。0.05 2(38)例 3: 某校进行一次智力速度测验,共有19名学生参加,其中男生12人,女生7 人,测验共 有200道题,在规定时间里,答对1 题记1 分,测验结束后,得到以下的测验成绩: 男生:83, 146, 119, 104, 120, 161, 107, 134, 115, 129, 99, 123女生:70,118,101,85,107,132,94 试确定男生、女生的平均成绩有无显著差异。解: X 二 120 X 二 101 S2 二 408.67S2 二 364.571 2 1 2假设实验数据服从正态分布,在此两总体方差未知,但两样本方差相差不大,故可接受两总体方差相等的前提假设。提出假设,H : |J p H : |J工X 一 X12 =1.91SE -Dxo1211211、 n S 2 + n S 211SE = ,S2(+)二2 亠(+) =9.96Dx p n nn + n 一 2 n n12 ; 1 2 1 2查表得,0.05 2(17)二211 WS故认为二者差异不显著。例 4: 将 20 名小朋友随机分成两组进行走迷宫实验,一组让它们在实验之前在迷宫里先玩耍半 小时(称为探索时间),这一组称为实验组;另一组作为控制组不给予事先的探索时间。 正式实验时,记录下小朋友记住迷宫以达到一次走完而不出错的标准所需的时间,结果如 后,假设实验结果服从正态分布,试检验有无事先探索时间对小朋友走迷宫是否有显著的影响。实验组6 2 4 2355 6 3 4控制组4 2 6 755 4 755解:计算可得,X1二4 X2二5 S12二4 S;二4,可认为两总体的方差是相等的。I 11SE - = :S2(+)Dx p n n* 1 2n S 2 + n S 21_12 2n + n 一 21 21 1(+) = 0.667n n1 2X 一 Xt =12 = 1.5SE -Dx查T分布表得気5/2(=2.101,因此在0.05的显然性水平下,或有95%的把握说,两总 体均值的差异不显著,即有无事先的探索时间对小朋友走迷宫无显著的影响。* 特殊的,当两样本的容量相等时,考虑检验统计量的公式2两总体方差不等X 一 Xt = 丄2SEDxX 一 X12:S 2 + S 212n 一 1如果从经验上得知两总体方差不等,或从样本中所求得S12、S;相差较大那么求联合方差失去意义,此时可以无偏估计量代替SEDx忑2=n11 +n1S 2n 2 1n2X 一 x,但此时t = 寫 2不服从tSE -Dx分布,呈与t分布近似的t分布。f X X检验统计量为t 幕 2t (df),必须注意它的自由度与上述有所不同SE -Dx1)阿斯平威尔士检验df -k2 (1- k)2 +nn其中k =S2n1-1n1S2n1-1n1S2n 2-1n2例:解:X -X1 2n1-1 + n 2-1n n1 2为了对某门课的教学方法进行改革某校对各方面情况相似的两个班进行教改试验甲班45人采用教师面授方法乙班36人采用教师讲授要点学生讨论的方法。一学年后 用同一试题对两个班的学生进行测验得到以下结果:甲班平均分69.5分标准差8.257 乙班平均分 78.0 分标准差16.27。试问两种教学方法其效果是否有显著差异。 因两样本方差相差太大提出假设,H : p检验统计量t |S 2将近似地服从自由度为df的t分布。o1S21n - 1(2) k =S2 S21 +n -1 n - 112故认为总体方差不等。H1: M 円 21.5491.549 + 7.563 一 17df =沁50k2 (1- k)2+n1X -X. 1 2ST1 + 21 n 一 1 n 一 11 269.5 - 78.0二 2.81682572 16.272+4435查表得10.01 2(50)二 2.6822.816*2.682故认为二者有极其显著的差异。122)柯克兰一柯克斯(CochranCox)检验上面所介绍的t只是近似地服从t分布,不能将df=n1+n2-2时的临界值作为t的临界值。对 于给定的a , t的临界值可近似由t和t的加权平均计算出来d( n -1)d( n -1)2 n12 n 2S21 tn 1 d即 f = 11 J DS2+a tn 一 1 d (n -1) _22 2S 2 S 21 +2n - 11例:仍以上例说明:t=2.816t 二 2.6940.01 2(44)t 二 2.7 2 40.01 2(25)16.272x 2.724二 2.7198.257 2x 2.694 + 44t = d28.257216.272+44352.816*2.719, 故认为二者存在极其显著的差异注意:若n=n2,此时(-12-;时)、寸矛n 一 1)这说明当总体呈正态分布,但总体方差未知且不等时,只要n =n,仍然可以近似地应 12用a 2二 2条件下的t检验(只是此时自由度应从2n-2变为n-1),这实际表明当 j HQ ;时,安 排n =n,可以起一定的校正作用,所以在研究中,应充分重视取样时n =n的优越性。1 2 1 23两样本都是大样本容量SE -=差是否相等。由抽样分布知若ni 30 n2 30,此时的t分布近似服从Z分布因而可以不管方性别人数平均数S男18076.211.5女16078.210.5-4SE -DXDx:S 2 S 2ni 1 + n 2 1 :n n1 2例: 高一学生英语测验成绩如下:解:样本容量大于 30,是大样本的平均数差异显著性检验提出假设,H : |J pH : |J工o12112X - X-(2) Z = 土 2=-1.425I S 2 S 21 +2n -1 n -1丫 1 2 1.4251.96 故认为二者无显著差异。例2:从某地区的六岁儿童中随机抽取男童46人,测量身高,平均数为114cm,标准差为5cm, 抽取女童36人,平均身高为112.5cm,标准差为6.5cm,问该地区六岁男女儿童身高是否 有显著差异?假设儿童的身高不服从正态分布。X 一 X114 一 112 5解:由于总体不服从正态分布,但样本容量比较大,Z =12=沁1.15I1 S 2S 2152 6.521 + 2 +n -1 n -145351 1 2 显然1.15 1.96 = Z0.05/2因此在0.05的显然性水平下,或者说有95%的把握,该地 区六岁男女儿童身高无显著差异。二、两组样本相关(两总体正态) 两组样本内的个体之间存在一一对应关系,这样的两个样本称为相关样本。 n1=n2 有两种情况:(1)用同一个测验对同一组被试前后进行两次测验,所获得的两组测验结果。(2)根据某些条件基本相同的原则,把被试匹配成对,然后将每对被试随机地 分入实验组和对照组,对两组被试施行不同的实验处理之后,用同一测验所 获得的结果(一)已知两组样本相关系数S 2 + S 2 - 2rSS” S 2 + S 2 - 2rS SSE 2 =n2n1-1_n2-1D xnX X / 八 t 二 12 t(n 1)SEDX 例:某地两年内进行了两次物理竞赛,已知两竞赛成绩均服从正态分布,某校有10 名学生先后 两次都参加了竞赛,平均成绩分别为 72 分、70 分,标准差分别为 12、14,相关系数 r=0.76, 问该地两次竞赛成绩有无显著差异。匕二 0.6523.067解:提出假设,H。:片二卩2 H1:片卸2t =|S2 + S2 2rS S1212查表得10.05 2(9)二 2.2620.6523.250 故认为二者有极其显著的差异。例:某研究者认为哥哥比弟弟更具创造性,故随机抽取10 对兄弟进行创造性测验,结果如下,假设测验成绩符合正态分布。问应如何评价该研究者的看法?哥哥:65486352615363706566合计弟弟:61426652475865626469D46-3.0014-5-281-320D216369.001962546419360解:显然这是相关总体,而且假设服从正态分布提出假设,H。:片知2 H:片 卩2经计算 X1 二 60.6 X2 二 58.6=5.6621 V 工 D 2 S 2 =乙(D D)2 =D niX X 60.658.6工十=1.06 查表得:t0.05(10-1) = t0.05(9) = 1.833(因为比较的是好不好,所以用单侧),1.06V1.833,所以在0.05的显著性水平下有95%的把握说,哥哥并不比弟弟更具创造性。三、总体为非正态分布 当两总体中有任一总体为非正态分布时,两样本平均数之差的分布既不服从正态分布,也不 服从t分布,因此在原则上无法检验,但正如单总体平均数的显著性检验一样,总体平均数差异 的显著性检验中,当n30时,其平均数之差的抽样分布近似服从Z分布,故可用Z检验。 (一) 独立样本2. I、22未知Z 二X X1 2S 2 S 2 + +2n 一 1 n 一 11 2X XZ二 1 厶2 24 +2n n 1 2例:某地进行一次外语考试,已知考试结果为非正态分布,从甲乙两校各抽取50名学生,甲校 平均成绩为92,标准差为11.5,乙校平均成绩为89,标准差为12,试问甲乙两校在这次外 语考试中有无显著性差异。解:提出假设,H : p p H : p工o12112 X - X3 Z 二 1= 1.27I S 2S 2勺56381 +2n 一 1 n 一 11 2 1.271.96 故认为两校在这次外语测验中无显著性差异(二)相关样本2、 b12、1、b 2、Q 2 已知12Z 二X
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑环境 > 机械电气


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!