资源描述
第22讲 假设检验教学目的:通过本单元的学习,掌握假设检验的基本概念,会做一个正态总体及两个正态总体参数的假设检验。教学重点:假设检验的基本方法及步骤,一个正态总体及两个正态总体参数假设检验的方法。教学难点:假设检验的基本原理。教学时数:3学时。教学过程:第七章 假设检验7.1 假设检验的基本概念1. 问题的提出在实际问题中,我们经常要遇到这样一类问题。在一个总体中原来参数为,由于工作或生产条件的改变,参数可能要变化,是变大了,还是变小了,或者是没变?这是我们要知道的。它可以通过所谓的“假设检验”来实现。例如,据以往经验,某地区成年男性平均身高为172()。现随机抽取一个样本,算得平均身高为174()。能否据此认为该地区成年男性平均身高提高了,或者是没有变?如果将该地区成年男性身高记作总体,这就是检验的均值的变化情况。当检验平均身高有没有变化时,可以用检验假设:; :表示。称为原假设,称为备择假设(一般它是的对立面),与统称为检验假设。当检验平均身高有没有提高时,可以用检验假设:; :表示。也可以用检验假设:;: 表示。又例如,甲、乙两台包装机包装白糖,各随机抽取一个样本,算得样本标准差分别为20()和24()。问能否据此认为甲包装机工作更稳定一些?如果将甲、乙两台包装机包装白糖的质量分别记作总体、。这就是比较与的方差与大小。可以用检验假设:; :表示,或者用检验假设:; :表示。2. 假设检验的基本原理与推理方法作假设检验时,先提出检验假设与,我们首先承认原假设成立,在此基础上随机抽取一个样本进行统计推断。如果通过推断得到一个合理现象(这个样本不是小概率事件),则没有理由拒绝原假设,因此我们接受原假设,并且拒绝备择假设;相反,如果通过推断得到一个不合理现象(这个样本是小概率事件),则没有理由接受原假设,因此我们拒绝原假设,并且接受备择假设。这就是假设检验的基本原理,有些类似于反证法。假设检验的推理方法是用置信区间的方法,根据已知条件(要充分利用已知信息)选择一个分布已知的统计量,由检验的显著性水平(是一个比较小的数,常取,等,一般它是事先给定的)确定一个的拒绝域,满足 或再由取定的样本值计算统计量。如果,则说明这个样本是小概率事件,现在小概率事件于一次抽样中居然发生了,我们有理由认为不合理,于是拒绝,而接受;否则(既),不合理现象没有发生,我们没有理由拒绝,于是接受,而拒绝。下面看一个例子。例1 某工厂生产的一种电子元件,在正常情况下,其使用寿命服从正态分布。某日从该厂生产的一批这种电子元件中随机抽取16个,测得样本均值,假定电子元件寿命的方差不变,问能否认为该日生产的这批电子元件的寿命均值?解 这里,检验假设为 :; :由服从正态分布及方差已知,可取统计量 , 在成立时,服从标准正态分布。又由于是的估计,在成立时,不能过大,从而也不能过大。因此,过大是小概率事件,记 如果取显著性水平,查表得,此时 。于是,拒绝,接受。即认为该日生产的这批电子元件的寿命均值。如果取显著性水平,查表得,此时 。于是,接受,拒绝。即认为该日生产的这批电子元件的寿命均值。由此例看出显著性水平不同,结论可能不同。因此,假设检验的结果是与显著性水平密切相关的。3. 双侧假设检验与单侧假设检验在例1中,当成立时,有不能过大,由此得拒绝域为,它位于取值的两端,这样的假设检验称为双侧假设检验(或双尾假设检验)。如果检验参数为,它的检验假设一般提法为:; : 在实际问题中,我们更多关心的是参数是否大于某一个值,或者小于某一个值,例如,在例1中我们将问题改为“问能否认为该日生产的这批电子元件的寿命均值不小于?”更为合理。这时检验假设的提法为 :; :这里,。现在仍选作为统计量,而是的估计,在成立时,大一些较为合理,它较小就不合理了,因此较小是小概率事件。如果记 但是,由于。因此,不是正态总体的均值,从而的分布未知,在此我们无法求得值。为此,再另选一个量,它服从标准正态分布。当成立时,有,于是 这表明事件是比事件发生的概率还要小的小概率事件。因此,只要令对于本题,如果取显著性水平,查表得,此时,于是拒绝,接受。即认为该日生产的这批电子元件的寿命均值显著小于。在上述假设检验中,由于的拒绝域位于取值的一端,这样的假设检验称为单侧假设检验(或单尾假设检验)。在单侧假设检验中,如果的拒绝域位于这个取值的左端,这样的假设检验称为左侧单侧假设检验(或左侧单尾假设检验)。如果检验参数为,它的检验假设一般提法为:; :在上面解题中我们看到,由于的复杂,导致解题过程也比较复杂。为了简化解题过程,可以将左侧单侧假设检验中假设检验简化为 :; :要注意的是,如果接受时,结论应为。类似有右侧单侧假设检验(或右侧单尾假设检验),其检验假设为 :; :也可以简化为 :; :它的拒绝域位于这个量取值的右端。4. 假设检验的一般步骤假设检验一般可以按以下五个步骤进行。(1)根据要检验的问题提出检验假设,包括原假设与备择假设。(2)根据已知条件选一个统计量,要求在成立时,该统计量分布已知。(3)根据显著性水平,查所选统计量的分布临界值,确定的拒绝域。(4)根据样本观测值计算统计量,并与临界值比较。(5)下结论。如果计算的统计量在的拒绝域内,则拒绝,接受;如果计算的统计量不在的拒绝域内,则接受,拒绝 。5. 假设检验可能犯的两类错误在假设检验中,由于我们是以局部(一个样本)去推断全局(总体),并且又是依据“小概率事件原理”下结论。无论小概率有多小,还是有发生的可能。所以利用上面的方法进行假设检验,可能要作出错误的判断,这种错误的判断有两种情况,这就是所谓的两类错误。(1) 原假设实际是正确的,但是经过检验将其拒绝了。这样的错误称为“弃真” 错误,也叫第一类错误。犯这类错误的概率不超过显著性水平。(2) 原假设实际是不正确的,但是经过检验将其接受了。这样的错误称为“存伪”错误,也叫第二类错误。犯这类错误的概率通常记作。在样本容量一定时,减小,则增大;减小,则增大,二者不可兼顾。要想让二者都减小,只能通过增大样本容量的方法,这样就要增加检验的成本。7.2 单个正态总体参数的假设检验设总体服从正态分布,是容量为的样本,是样本均值,是样本方差。单个正态总体参数的假设检验就是关于未知参数与的假设检验。1. 正态总体均值的假设检验 (1)已知,检验: 由于已知,选统计量 在成立时,服从标准正态分布,既,。 若:,如例1中分析,得的拒绝域为。 若:,如例1中分析,得的拒绝域为。(注意,此时,若成立,应理解为。在后面的单侧假设检验中,均需类似理解。) 若:,例2 设某砖厂生产的砖的抗断强度,某天从该厂生产的砖中随机抽取6块,测得抗断强度如下(单位:):32.56 29.66 31.64 30.00 31.87 31.03检验这天该厂生产的砖的平均抗断强度是否仍为?(取显著性水平 ) 解 这里,。设:; :选统计量,对显著性水平,查表得。故,拒绝,接受,即不能认为这天该厂生产的砖的平均抗断强度仍为。例3 在上例中,检验这天该厂生产的砖的平均抗断强度是否不小于?(取显著性水平)解 这里,。设:; :选统计量,对显著性水平,查表得,拒绝,接受,即认为这天该厂生产的砖的平均抗断强度显著小于。注 在单侧假设检验中,我们是选左侧单侧假设检验,还是选右侧单侧假设检验?根据经验,在均值的假设检验中,先计算样本均值,如果,选用左侧单侧假设检验为好。如果,选用右侧单侧假设检验为好。在其它问题的单侧检验中也类似,若作参数的单侧检验,当由样本算得的估计值满足时,一般选用左侧单侧假设检验好一些;如果时,一般选用右侧单侧假设检验好一些。(2)未知,检验:由于未知,考虑用样本方差替代,因此选统计量 .在 成立时,服从自由度为的分布,即。 若:, 若:,。例4 化肥厂用自动包装机包装化肥,某日随机抽取9包,测得质量(单位:)如下: 49.7 49.8 50.3 50.5 49.7 50.1 49.9 50.5 50.4若每包化肥的质量服从正态分布,问是否可以认为这天每包化肥的平均质量为50?(取显著性水平)解 设每包化肥质量为,则, 未知。 设:; :选统计量 对显著性水平,查表得,接受,拒绝。因此,认为这天每包化肥的平均质量为50。 例5 已知某炼铁厂的铁水含碳量服从正态分布,均值。某日随机测得7炉铁水,算得平均含碳量,标准差。以显著性水平检验这天铁水含碳量的均值是否显著提高? 解 这里, 未知。 设:; :选统计量对显著性水平,查表得,拒绝,接受,既认为这天该厂铁水含碳量的均值显著提高。注 此题中如果显著性水平,结论将如何?请同学们自己考虑。2. 正态总体方差的假设检验(1)已知,检验:由于已知。于是,选统计量在成立时,服从自由度为的分布,既。 若:,由于。因此,在成立时,即不能过大,也不能过小。表得,。于是,的拒绝域为或。 若:,在成立时,即时,大一些较合理,过小不合理,过是小概率事件。因此,令 例6 在例2中,以显著性水平,检验这天该厂生产的砖的抗断强度的标准差是否为? 解 这里,而已知。设:; :由已知,选统计量 对显著性水平,查表得,拒绝,接受,既这天该厂生产的砖的抗断强度的标准差不能认为是。(2)未知,检验: 由于未知,用替代前面中的。于是,选统计量在成立时,服从自由度为的分布,即。与前面完全相同的理由得 若:,的拒绝域为或。 若:,的拒绝域为。 若:,的拒绝域为。 例7 自动车床加工某种零件,其直径(单位:)服从正态分布,要求。某天开工后,随机抽取30件,测得数据如下:零件直径()9.29.49.69.810.010.210.410.610.8频数113675421检验这天加工的零件是否符合要求?(取显著性水平)解 这里,未知。设:; :由未知,选统计量对显著性水平,查表得, 拒绝,接受,即这天加的工零件直径的方差大于,不符合要求。7.3 两个正态总体参数的假设检验设总体和分别服从正态分布,和,和分别是总体和的容量为和的样本,和分别是两个样本的均值,和分别是两个样本的方差。两个正态总体参数的假设检验,就是比较与之间,与之间的关系。1. 两个正态总体均值与的比较(1)当及已知时,检验:由于和已知,因此选统计量在成立时,服从标准正态分布,即,。 若: 由于成立,有,又与分别是与的估计。因此,不能过大,所以也不能过大,过大是小概率事件。由,得的拒绝域为。 若:,此时,不能过小,过小是小概率事件。由,得的拒绝域为。 若:,此时,不能过大,过大是小概率事件。由,得的拒绝域为。例8 两种工艺下纺的细纱的强力与分别服从正态分布,和,各抽取容量为50的样本,算得,。问两种工艺下纺的细纱的强力有无明显差异?(取显著性水平)解 这里,为已知。设:; :由及已知,选统计量,对显著性水平,查表得,拒绝,接受,即两种工艺下纺的细纱的强力有明显差异。(2)当及未知(但是与相等为已知条件)时,检验:由于及未知,考虑用和分别近似替代和,为使分布已知,应选统计量 在成立及时,服从自由度为的分布,即。 若:,与前面相同的道理,此时,不能过大,过大是小概率事件。由,查表得。于是,的拒绝域为。 若:,类似,不能过小,过小是小概率事件。由,得的拒绝域为。 若:,此时,不能过大,过大是小概率事件。由,得的拒绝域为。例9 某灯泡厂在采用一项新工艺的前后,分别抽取10个灯泡进行寿命试验。计算得到:采用新工艺前灯泡寿命的样本均值为,样本标准差为;采用新工艺后灯泡寿命的样本均值为,样本标准差为。设灯泡的寿命服从正态分布,问由此是否可以认为采用新工艺后灯泡的平均寿命有显著提高?(取显著性水平,假定采用新工艺前、后灯泡寿命的方差不变,这将在后面进行检验) 解 设采用新工艺前灯泡寿命为,采用新工艺后灯泡寿命为,这里及未知。设:; :由及未知,选统计量对显著性水平,查表得。由,计算得 拒绝,接受,即采用新工艺后灯泡的平均寿命有显著提高。2两个正态总体方差与的比较(1)当与已知时,检验:由于与已知,选统计量在成立时,。 若: , 由知,在成立时,即不能过大,也不能过小。过大与过小是小 上侧临界值表,得,。于是,的拒绝域为,或,。 若: ,在成立时,即时,大一些较合理,过小不合理,过是小概率事件。,于是,的拒绝域为,。 例10 甲、乙两台包装机包装的白糖质量都服从均值为的正态分布从它们包装的白糖中随机抽取如下样本(单位:): 甲机: 998 1005 1001 1002 996 995 乙机: 1010 989 992 990 1007比较甲、乙两台包装机哪台工作更稳定一些?(取显著性水平) 解 设甲、乙两台包装机包装的白糖质量分别记作和,则 , ,比较两台包装机哪台工作更稳定,就是比较与的大小。这里已知,算得=设:; :由于与已知,选统计量 对显著性水平,查表得 , ,拒绝,接受,即甲包装机工作更稳定一些。(2)当与未知时,检验:由于与未知,用与分别替代与。于是,应选统计量 在成立时,。与上面完全相同的理由,得 若: , 则的拒绝域为,或, 若: ,则的拒绝域为 , 若: ,则的拒绝域为 , 例11 以显著性水平,检验例9中。解 设采用新工艺前灯泡寿命为,采用新工艺后灯泡寿命为,这里与未知。:;: 选统计量对显著性水平,。 , 接受,拒绝,即可以认为。19
展开阅读全文