统计学06总体参数的假设检验课件

上传人:痛*** 文档编号:240929121 上传时间:2024-05-18 格式:PPT 页数:68 大小:436.83KB
返回 下载 相关 举报
统计学06总体参数的假设检验课件_第1页
第1页 / 共68页
统计学06总体参数的假设检验课件_第2页
第2页 / 共68页
统计学06总体参数的假设检验课件_第3页
第3页 / 共68页
点击查看更多>>
资源描述
统计学从数据到结论统计学从数据到结论1第六章 总体参数的假设检验第六章 总体参数的假设检验2o如果一个人说他从来没有骂过人。如果一个人说他从来没有骂过人。他能够证明吗?他能够证明吗?o要证明他没有骂过人,他必须出示要证明他没有骂过人,他必须出示他从小到大每一时刻的录音录像,他从小到大每一时刻的录音录像,所有书写的东西等等,还要证明这所有书写的东西等等,还要证明这些物证是完全的、真实的、没有间些物证是完全的、真实的、没有间断的。这简直是不可能的。断的。这简直是不可能的。o即使他找到一些证人,比如他的同即使他找到一些证人,比如他的同学、家人和同事,那也只能够证明学、家人和同事,那也只能够证明在那些证人在场的某些片刻,他没在那些证人在场的某些片刻,他没有被听到骂人。有被听到骂人。如果一个人说他从来没有骂过人。他能够证明吗?3o反过来,如果要证明这个人反过来,如果要证明这个人骂过人很容易,只要有一次骂过人很容易,只要有一次被抓住就足够了。被抓住就足够了。o看来,企图肯定什么事物很看来,企图肯定什么事物很难,而否定却要相对容易得难,而否定却要相对容易得多。这就是假设检验背后的多。这就是假设检验背后的哲学。哲学。o科学总往往是在否定中发展科学总往往是在否定中发展反过来,如果要证明这个人骂过人很容易,只要有一次被抓住就足够4o在假设检验中,一般要设立在假设检验中,一般要设立一个一个原假设原假设(上面的(上面的“从来从来没骂过人没骂过人”就是一个例子);就是一个例子);o而设立该假设的动机主要是而设立该假设的动机主要是企图利用人们掌握的反映现企图利用人们掌握的反映现实世界的数据来找出假设与实世界的数据来找出假设与现实之间的矛盾,从而否定现实之间的矛盾,从而否定这个假设。这个假设。在假设检验中,一般要设立一个原假设(上面的“从来没骂过人”就5o在多数统计教科书中在多数统计教科书中(除理论除理论探讨外探讨外)假设检验都是以否定假设检验都是以否定原假设为目标。原假设为目标。o如否定不了,说明证据不足,如否定不了,说明证据不足,无法否定原假设。但不能说无法否定原假设。但不能说明原假设正确。明原假设正确。o就像一两次没有听过他骂人就像一两次没有听过他骂人还远不能证明他从来没有骂还远不能证明他从来没有骂过人。过人。在多数统计教科书中(除理论探讨外)假设检验都是以否定原假设为66.1 假设检验的过程和逻辑假设检验的过程和逻辑o先先要要提提出出个个原原假假设设,比比如如某某正正态态总总体体的的均均值值等等于于5(m m=5)。这这种种原原假假设设也也称称为为零假设零假设(null hypothesis),记为,记为H0。o与与此此同同时时必必须须提提出出备备选选假假设设(或或称称为为备备择择假假设设,alternative hypothesis),比比如如总总体体均均值值大大于于5(m m5)。备备选选假假设设记记为为H1或或Ha。形形式式上上,这这个个关关于于总总体体均均值的值的H0相对于相对于H1的检验记为的检验记为6.1 假设检验的过程和逻辑先要提出个原假设,比如某正态总76.1 假设检验的过程和逻辑假设检验的过程和逻辑o备备选选假假设设应应该该按按照照实实际际世世界界所所代代表表的的方方向向来来确确定定,即即它它通通常常是是被被认认为为可可能能比零假设更符合数据所代表的现实。比零假设更符合数据所代表的现实。o比比如如上上面面的的H1为为m m5;这这意意味味着着,至至少少样本均值应该大于样本均值应该大于5;o至于是否显著,依检验结果而定。至于是否显著,依检验结果而定。o检检验验结结果果显显著著(significant)意意味味着着有有理理由由拒拒绝绝零零假假设设。因因此此,假假设设检检验验也也被称为被称为显著性检验显著性检验(significant test)。6.1 假设检验的过程和逻辑备选假设应该按照实际世界所代表86.1 假设检验的过程和逻辑假设检验的过程和逻辑o有有了了两两个个假假设设,就就要要根根据据数数据据来来对对它它们进行判断。们进行判断。o数数据据的的代代表表是是作作为为其其函函数数的的统统计计量量;它它在在检检验验中中被被称称为为检检验验统统计计量量(test statistic)。o根根据据零零假假设设(不不是是备备选选假假设设!),可可得得到到该该检检验验统统计计量量的的分分布布;再再看看这这个个统统计计量量的的数数据据实实现现值值(realization)属属不属于小概率事件。不属于小概率事件。6.1 假设检验的过程和逻辑有了两个假设,就要根据数据来对96.1 假设检验的过程和逻辑假设检验的过程和逻辑o也也就就是是说说把把数数据据代代入入检检验验统统计计量量,看看其其值值是是否否落落入入零零假假设设下下的的小小概概率率范畴范畴;o如如果果的的确确是是小小概概率率事事件件,那那么么就就有有可可能能拒拒绝绝零零假假设设,或或者者说说“该该检检验验显著,显著,”o否否则则说说“没没有有足足够够证证据据拒拒绝绝零零假假设设”,或者,或者“该检验不显著。该检验不显著。”6.1 假设检验的过程和逻辑也就是说把数据代入检验统计量,106.1 假设检验的过程和逻辑假设检验的过程和逻辑o注注意意:在在我我们们所所涉涉及及的的问问题题中中,零零假假设和备选假设在假设检验中并不对称。设和备选假设在假设检验中并不对称。o因因检检验验统统计计量量的的分分布布是是从从零零假假设设导导出出的的,因因此此,如如果果发发生生矛矛盾盾,就就对对零零假假设不利了。设不利了。o不不发发生生矛矛盾盾也也不不能能说说明明零零假假设设没没有有问问题。题。6.1 假设检验的过程和逻辑注意:在我们所涉及的问题中,零116.1 假设检验的过程和逻辑假设检验的过程和逻辑o在在零零假假设设下下,检检验验统统计计量量取取其其实实现现值值及及(沿沿着着备备选选假假设设的的方方向向)更更加加极极端端值的概率称为值的概率称为p-值(值(p-value)。o如如果果得得到到很很小小的的p-值值,就就意意味味着着在在零零假假设下小概率事件发生了。设下小概率事件发生了。o如如果果小小概概率率事事件件发发生生,是是相相信信零零假假设设,还是相信数据呢?还是相信数据呢?o当然多半是相信数据,拒绝零假设。当然多半是相信数据,拒绝零假设。6.1 假设检验的过程和逻辑在零假设下,检验统计量取其实现126.1 假设检验的过程和逻辑假设检验的过程和逻辑o但但小小概概率率并并不不能能说说明明不不会会发发生生,仅仅仅仅发发生生的的概概率率很很小小罢罢了了。拒拒绝绝正正确确零零假假设设的的错错误误常常被被称称为为第第一一类类错错误误(type I error)。o在在备备选选假假设设正正确确时时反反而而说说零零假假设设正正确确的的错错误误,称称为为第第二二类类错错误误(type II error)。在在本本书书的的假假设设检检验验问问题题中中,由由于于备备选选假假设设不不是是一一个个点点,所所以以无无法法算出犯第二类错误的概率。算出犯第二类错误的概率。6.1 假设检验的过程和逻辑但小概率并不能说明不会发生,仅136.1 假设检验的过程和逻辑假设检验的过程和逻辑o零零假假设设和和备备选选假假设设哪哪一一个个正正确确,是是确确定定性性的的,没没有有概概率率可可言言。而而可可能能犯犯错错误的是人。误的是人。o涉涉及及假假设设检检验验的的犯犯错错误误的的概概率率就就是是犯犯第第一一类类错错误误的的概概率率和和犯犯第第二二类类错错误误的的概率。概率。o负负责责任任的的态态度度是是无无论论做做出出什什么么决决策策,都应该给出该决策可能犯错误的概率。都应该给出该决策可能犯错误的概率。6.1 假设检验的过程和逻辑零假设和备选假设哪一个正确,是146.1 假设检验的过程和逻辑假设检验的过程和逻辑o到到底底p-值值是是多多小小时时才才能能够够拒拒绝绝零零假假设设呢呢?也也就是说,需要有什么是小概率的标准。就是说,需要有什么是小概率的标准。o这这要要看看具具体体应应用用的的需需要要。但但在在一一般般的的统统计计书书和和软软件件中中,使使用用最最多多的的标标准准是是在在零零假假设设下下(或或零零假假设设正正确确时时)根根据据样样本本所所得得的的数数据据来来拒拒绝绝零零假假设设的的概概率率应应小小于于0.05,当当然然也也可可能能是是0.01,0.005,0.001等等。等等。o这这 种种 事事 先先 规规 定定 的的 概概 率率 称称 为为 显显 著著 性性 水水 平平(significant level),用字母,用字母a a来表示。来表示。6.1 假设检验的过程和逻辑到底p-值是多小时才能够拒绝零156.1 假设检验的过程和逻辑假设检验的过程和逻辑oa a并并不不一一定定越越小小越越好好,因因为为这这很很可可能能导导致致不不容容易易拒拒绝绝零零假假设设,使使得得犯犯第第二二类类错错误误的的概概率率增大。增大。o当当p-值值小小于于或或等等于于a a时时,就就拒拒绝绝零零假假设设。所所以以,a a是是所所允允许许的的犯犯第第一一类类错错误误概概率率的的最最大大值值。当当p-值值小小于于或或等等于于a a时时,就就说说这这个个检检验验是显著的。是显著的。o无无论论统统计计学学家家用用多多大大的的a a作作为为显显著著性性水水平平都都不不能能脱脱离离实实际际问问题题的的背背景景。统统计计显显著著不不一一定定等价于实际显著。反过来也一样。等价于实际显著。反过来也一样。6.1 假设检验的过程和逻辑a并不一定越小越好,因为这很可166.1 假设检验的过程和逻辑假设检验的过程和逻辑o归纳起来,假设检验的逻辑步骤为:归纳起来,假设检验的逻辑步骤为:o1.写出零假设和备选假设;写出零假设和备选假设;o2.确定检验统计量;确定检验统计量;o3.确定显著性水平确定显著性水平a a;o4.根据数据计算检验统计量的实现值;根据数据计算检验统计量的实现值;o5.根据这个实现值计算根据这个实现值计算p-值;值;o6.进进行行判判断断:如如果果p-值值小小于于或或等等于于a a,就就拒拒绝绝零零假假设设,这这时时犯犯(第第一一类类)错错误误的的概概率率最最多多为为a a;如如果果p-值值大大于于a a,就就不不拒拒绝绝零零假假设设,因为证据不足。因为证据不足。6.1 假设检验的过程和逻辑归纳起来,假设检验的逻辑步骤为176.1 假设检验的过程和逻辑假设检验的过程和逻辑o实实际际上上,多多数数计计算算机机软软件件仅仅仅仅给给出出p-值值,而而不给出不给出a a。这有很多方便之处。这有很多方便之处。o比比如如a a=0.05,而而假假定定所所得得到到的的p-值值等等于于0.001。这这时时如如果果采采用用p-值值作作为为新新的的显显著著性性水水平平,即即新新的的a a=0.001,于于是是就就可可以以说说,在在显显著著性性水水平为平为0.001时,拒绝零假设。时,拒绝零假设。o这这样样,拒拒绝绝零零假假设设时时犯犯错错误误的的概概率率实实际际只只是是千千分分之之一一而而不不是是旧旧的的a a所所表表明明的的百百分分之之五五。在在这这个个意意义义上上,p-值值又又称称为为观观测测的的显显著著性性水水平(平(observed significant level)。6.1 假设检验的过程和逻辑实际上,多数计算机软件仅仅给出186.1 假设检验的过程和逻辑假设检验的过程和逻辑o在在统统计计软软件件输输出出p-值值的的位位置置,有有的的用用“p-value”,有有的的用用significant的的缩缩写写“Sig”就就是这个道理。是这个道理。o根根据据数数据据产产生生的的p-值值来来减减少少a a的的值值以以展展示示结结果的精确性总是没有害处的。果的精确性总是没有害处的。o这这好好比比一一个个身身高高180厘厘米米的的男男生生,可可能能愿愿意意被被认认为为高高于于或或等等于于180厘厘米米,而而不不愿愿意意说说他他高高于于或或等等于于155厘厘米米,虽虽然然这这第第二二种种说说法法数数学上没有丝毫错误。学上没有丝毫错误。6.1 假设检验的过程和逻辑在统计软件输出p-值的位置,有196.1 假设检验的过程和逻辑假设检验的过程和逻辑o关关于于“临临界界值值”的的注注:作为概率的显著性水平a实际上相应于一个检验统计量取值范围的一个临临界界值值(critical value),它定义为,统计量取该值或更极端的值的概率等于a。也就是说,“统统计计量量的的实实现现值值比比临临界界值值更更极极端端”等等价价于于“p-值值小小于于a a”。使用临界值的概念进行的检验不计算p-值。只比较统计量的取值和临界值的大小。6.1 假设检验的过程和逻辑关于“临界值”的注:作为概率的206.1 假设检验的过程和逻辑假设检验的过程和逻辑o使使用用临临界界值值而而不不是是p-值值来来判判断断拒拒绝绝与与否否是是前前计计算算机机时时代代的的产产物物。当当时时计计算算p-值值不不易易,只只采采用用临临界界值值的的概概念念。但但从从给给定定的的a a求求临临界界值值同同样样也也不不容容易易,好好在在习习惯惯上上仅仅仅仅在在教教科科书书中中列列出出相相应应于于特特定定分分布布的的几几个个有有限限的的a a临临界界值值(比比如如a a=0.05,a a=0.025,a a=0.01,a a=0.005,a a=0.001等等等等),或或者者根根据据分分布布表表反反过过来来查临界值(很不方便也很粗糙)。查临界值(很不方便也很粗糙)。o现现在在计计算算机机软软件件大大都都不不给给出出a a和和临临界界值值,但但都都给给出出p-值值和和统统计计量量的的实实现现值值,让让用用户户自自己己决定显著性水平是多少。决定显著性水平是多少。6.1 假设检验的过程和逻辑使用临界值而不是p-值来判断拒216.1 假设检验的过程和逻辑假设检验的过程和逻辑o在在一一些些统统计计教教科科书书中中会会有有不不能能拒拒绝绝零零假假设设就就“接接受受零零假假设设”的的说说法法。这这种种说说法法是是不不严严格格的。的。o首首先先,如如果果你你说说“接接受受零零假假设设”,那那么么就就应应该该负负责责任任地地提提供供接接受受零零假假设设时时可可能能犯犯第第二二类类错错误误的的概概率率。这这就就要要算算出出在在备备选选假假设设正正确确的的情情况况下下错错误误接接受受零零假假设设的的概概率率。但但是是,这这只只有有在在备备选选假假设设仅仅仅仅是是一一个个与与零零假假设设不不同同的的确确定值(而不是范围)时才有可能。定值(而不是范围)时才有可能。o多多数数基基本本统统计计教教科科书书的的备备选选假假设设是是一一个个范范围围而根本无法确定犯第二类错误的概率。而根本无法确定犯第二类错误的概率。6.1 假设检验的过程和逻辑在一些统计教科书中会有不能拒绝226.1 假设检验的过程和逻辑假设检验的过程和逻辑o在在许许多多统统计计教教科科书书中中,往往往往把把一一系系列列不不能能拒拒绝绝零零假假设设的的检检验验当当成成接接受受这这些些假设的通行证。假设的通行证。o比比如如不不能能拒拒绝绝某某样样本本的的正正态态性性就就变变成成了证明了该样本是正态的等等。了证明了该样本是正态的等等。o不不能能拒拒绝绝这这些些零零假假设设,仅仅仅仅说说明明根根据据所所使使用用的的检检验验方方法法(或或检检验验统统计计量量)和和当当前前的的数数据据没没有有足足够够证证据据拒拒绝绝这这些些假设而已。假设而已。6.1 假设检验的过程和逻辑在许多统计教科书中,往往把一系236.1 假设检验的过程和逻辑假设检验的过程和逻辑o对对于于同同一一个个假假设设检检验验问问题题,往往往往都都有有多多个个检检验验统统计计量量;而而且且人人们们还还在在构构造造更优良的检验统计量。更优良的检验统计量。o人人们们不不可可能能把把所所有有的的目目前前存存在在的的和和将将来可能存在的检验都实施。来可能存在的检验都实施。o因因此此,只只能能够够说说,按按照照目目前前的的证证据据,不不足足以以拒拒绝绝零零假假设设而而已已。后后面面将将会会用用例例子子说说明明“接接受受零零假假设设”的的说说法法是是不不妥当的。妥当的。6.1 假设检验的过程和逻辑对于同一个假设检验问题,往往都246.2 对于正态总体均值的检验对于正态总体均值的检验6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验o例例6.1一一个个顾顾客客买买了了一一包包标标有有500g重重的的一一包包红红糖糖,觉觉得得份份量量不不足足,于于是是找找到到监监督督部部门门;当当然然他他们们会会觉觉得得一一包包份份量量不不够够可可能能是是随随机机的的。于于是是监监督督部部门门就就去去商商店店称称了了50包包红红糖糖(数数据据在在sugar.txt);其其中中均均值值(平平均均重重量量)是是498.35g;这这的的确确比比500g少少,但但这这是是否否能能够够说说明明厂厂家家生生产产的的这这批批红红糖糖平平均均起起来来不不够够份份量量呢呢?于于是是需需要要统统计计检检验验。可可以以画画出出这这些些重重量量的的直方图直方图6.2 对于正态总体均值的检验6.2.1 根据一个样本2550包红糖重量的直方图包红糖重量的直方图 50包红糖重量的直方图 266.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验o这这个个直直方方图图看看上上去去象象是是正正态态分分布布的的样样本本。不不妨假定这一批袋装红糖有正态分布。妨假定这一批袋装红糖有正态分布。o由由于于厂厂家家声声称称每每袋袋500g(标标明明重重量量),因因此此零零假假设设为为总总体体均均值值等等于于500g(被被怀怀疑疑对对象象总总是放在零假设);是放在零假设);o而而且且由由于于样样本本均均值值少少于于500g(这这是是怀怀疑疑的的根根据据),把把备备选选假假设设定定为为总总体体均均值值少少于于500g(备备选选假假设设为为单单向向不不等等式式的的检检验验称称为为单单尾尾检检验验,为不等号为不等号“”的称为双尾检验的称为双尾检验)6.2.1 根据一个样本对其总体均值大小进行检验这个直方图276.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验o检检验验统统计计量量就就是是第第四四章章引引进进的的作作为为对对均值的某种标准化的均值的某种标准化的o符符号号中中的的m m0通通常常表表示示为为零零假假设设中中的的均均值值(这这里里是是500)。在在零零假假设设之之下下,它它有有自自由由度度为为n-1=49的的t分分布布。当当然然实实际际上上不不必必代代入入这这个个公公式式去去手手工工计计算算了了,让计算机去代劳好了。让计算机去代劳好了。6.2.1 根据一个样本对其总体均值大小进行检验检验统计量286.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验o计计算算结结果果是是t=-2.696(也也称称为为t值值),同同时时得得到到p-值值为为0.005(由由于于计计算算机机输输出出的的为为双双尾尾检检验验的的p-值值,比比单单尾尾的的大大一一倍倍,应应该该除除以以2)。看看来来可可以以选选择择显显著著性性水水平平为为0.005,并并宣宣称称拒拒绝零假设,而错误拒绝的概率为绝零假设,而错误拒绝的概率为0.005。6.2.1 根据一个样本对其总体均值大小进行检验计算结果是29统计量统计量t=-2.696相应于左边相应于左边尾概率(尾概率(p-值)值)0.005 统计量t=-2.696相应于左边尾概率(p-值)0.005 306.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验o上上 面面 例例 子子 的的 备备 选选 假假 设设 为为 小小 于于(“”)某某个值的情况。个值的情况。o取取备备选选假假设设为为均均值值大大于于或或小小于于某某个个值值的的检检验验称称为为单单尾尾检检验验(one-tailed test,也也称称为为单单侧侧检检验验或或单单边边检检验验)。下下面面举举一一个个选选假假设设为为均均值值大大于于(“”)某个值的例子。)某个值的例子。6.2.1 根据一个样本对其总体均值大小进行检验上面例子的316.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验o例例6.2(exh.txt)汽汽车车厂厂商商声声称称其其发发动动机机排排放放标标准准的的一一个个指指标标平平均均低低于于20个个单单位位。在在抽抽查查了了10台台发发动动机机之之后后,得得到到下下面面的的排排放放数数据据:17.0、21.7、17.9、22.9、20.7、22.4、17.3、21.8、24.2、25.4。该该样样本本均均值值为为21.13。究究竟竟能能否否由由此此认认为为该该指指标标均均值值超超过过20?这这次次的的假设检验问题就是假设检验问题就是6.2.1 根据一个样本对其总体均值大小进行检验例6.2(326.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验o和和前前面面的的例例子子的的方方法法类类似似,可可以以发发现现p-值值为为0.1243(计计算算机机输输出出的的双双尾尾检检验验的的p-值值除除以以2),因因此此,没没有有证证据据否否定定零零假假设设。这这时时的的检检验验统统计计量量t=1.2336。也也可可以以画画出出类类似似于于图图6.2的的图图(图图6.3)这这时时的的t分分布布的的自自由由度度为为9。下面是结果的计算机输出:下面是结果的计算机输出:6.2.1 根据一个样本对其总体均值大小进行检验和前面的例33统计量统计量t=1.2336相应于右边相应于右边尾概率(尾概率(p-值)值)0.1243 统计量t=1.2336相应于右边尾概率(p-值)0.1243346.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验o注注意意:在在假假设设检检验验中中往往往往也也用用带带等等号号的的不不等等式来表示零假设,比如上述的检验记为式来表示零假设,比如上述的检验记为o但但这这里里用用于于计计算算p-值值的的零零假假设设还还是是m m=20;但但如如果果能能够够拒拒绝绝零零假假设设m m=20,那那么么对对于于任任何何m m小小于于20的的零零假假设设就就更更有有理理由由拒拒绝绝了了。这这和和以以拒拒绝绝零零假假设设为为初初衷的假设检验思维方式是一致的。衷的假设检验思维方式是一致的。6.2.1 根据一个样本对其总体均值大小进行检验注意:在假356.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验o还还有有所所谓谓的的双双尾尾检检验验(two tailed test,也称为也称为双侧检验双侧检验或或双边检验双边检验)问题,即问题,即o在在这这种种情情况况下下,尾尾概概率率不不仅仅是是左左边边或或右右边边的的一一个个尾尾概概率率,而而是是两两边边尾尾概概率率之之和和。因因此此如如果果是是一一个个单单尾尾检检验验问问题题,用用了了双双尾尾检检验验的的模模式式,p-值值就就比比用用单单尾尾检验时大了一倍。检验时大了一倍。6.2.1 根据一个样本对其总体均值大小进行检验还有所谓的366.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验o如如果果上上面面发发动动机机排排放放指指标标例例子子的的检检验验问问题题改改为为是是否否该该发发动动机机的的排排放放指指标标均均值等于值等于20。即。即o这这时时t统统计计量量还还是是取取原原来来的的值值1.2336,但但p-值值为为0.12432=0.2486。图图6.3就就变变成图成图6.4的样子的样子6.2.1 根据一个样本对其总体均值大小进行检验如果上面发37统计量统计量t=1.2336,而,而p-值等于值等于左右尾概率之和,即左右尾概率之和,即0.2486统计量t=1.2336,而p-值等于左右尾概率之和,即0.2386.2.2 根据来自两个总体的独立样本对其总体均值的检验根据来自两个总体的独立样本对其总体均值的检验o例例6.3(数数据据:drug.txt)为为检检测测某某种种药药物物对对攻攻击击性性情情绪绪的的影影响响,对对处处理理组组的的100名名服服药药者者和和对对照照组组的的150名名非非服服药药者者进进行行心心理理测测试试,得得到到相相应应的的某某指指标标。要要检检验验处处理理组组指指标标的的总总体体均均值值m m1是是否否等等于于对对照照组组指指标标的的总总体体均均值值m m2。相相应应的的假设检验问题为:假设检验问题为:或6.2.2 根据来自两个总体的独立样本对其总体均值的检验例396.2.2 根据来自两个总体的独立样本对其总体均值的检验根据来自两个总体的独立样本对其总体均值的检验o通通 过过 计计 算算,t统统 计计 量量 等等 于于 0.942,p-值值 为为0.1735(输输出出中中的的双双尾尾检检验验p-值值的的一一半半)。因因此此无无法法拒拒绝绝零零假假设设,即即不不能能得得出出处处理理组组的的平平均均指指标标大大于于对对照照组组的的结结论论。计计算算机机输输出出的的相应表格(部分,删除了置信区间部分)为:相应表格(部分,删除了置信区间部分)为:6.2.2 根据来自两个总体的独立样本对其总体均值的检验通406.2.2 根据来自两个总体的独立样本对其总体均值的检验根据来自两个总体的独立样本对其总体均值的检验o注注意意:这这个个输输出出的的前前面面三三列列用用Levene的的F-检检验验来来看看这这两两个个样样本本所所代代表表的的总总体体之之方方差差是是否否相相等等(零零假假设设为为相相等等)。第第一一行行是是该该检检验验的的零零假假设设:两两个个总总体体方方差差相相等等,而而第第二二行行为为备备选选假假设设:两两个个总总体体方方差差不不等等。如如果果该该检检验验显显著著,即即在在Sig列列中中的的该该Levene检检验验p-值值很很小小(这这里里是是0.008),就就应应该该看看第第二二行行备备选选假假设设的的t检检验验输输出出,这这里里是是0.347;由由于于是是单单边边检检验验,p-值值0.347/2=0.1735;如如果果Levene检检验验的的p-值值较较大大(本本例例并并不不大大),则则看看第第一一行行原原假假设设下下的的结结果果。之之所所以以要要检检验验总总体体方方差差,是是因因为为总总体体方方差差相相同同时使用的检验统计量与方差不同时使用的不同。时使用的检验统计量与方差不同时使用的不同。6.2.2 根据来自两个总体的独立样本对其总体均值的检验注416.2.3 成对样本的问题成对样本的问题o例例6.4减减肥肥数数据据(diet.txt)。这这里里有有50对对数数据据。为为50人是减肥前后的重量人是减肥前后的重量o要比较要比较50个人在减肥前后的重量。个人在减肥前后的重量。o不不能能用用前前面面的的独独立立样样本本均均值值差差的的检检验验;这这是是因因为为两两个个样样本本并并不不独独立立。每每一一个个人人减减肥肥后后的的重重量量都都和和自自己己减减肥肥前前的的重重量量有有关关。但但不不同同人人之之间间却却是是独独立立的。的。o令令所所有有个个体体减减肥肥前前后后重重量量差差(减减肥肥前前重重量量减减去去减减肥后重量)的均值为肥后重量)的均值为m mD;这样所要进行的检验为;这样所要进行的检验为6.2.3 成对样本的问题例6.4减肥数据(diet.tx426.2.3 成对样本的问题成对样本的问题o我我们们可可以以把把两两个个样样本本中中配配对对的的观观测测值值逐逐个个相相减减,形形成成一一个个由由独独立立观观测测值值组组成成的的样样本本;然然后用单样本检验方法,看其均值是否为零。后用单样本检验方法,看其均值是否为零。o在在相相减减之之后后公公式式和和单单样样本本均均值值检检验验无无异异。当当然然,如如果果直直接接选选用用软软件件中中成成对对样样本本均均值值的的检检验验,就就不不用用事事先先逐逐个个相相减减了了。这这里里也也有有单单尾尾和双尾检验。和双尾检验。o这这里里介介绍绍的的是是假假定定总总体体分分布布为为正正态态分分布布时时的的t检检验验。总总体体分分布布未未知知时时,应应该该利利用用第第十十六六章章的非参数检验方法。的非参数检验方法。6.2.3 成对样本的问题我们可以把两个样本中配对的观测值436.2.3 成对样本的问题成对样本的问题o再再接接着着看看例例6.4。计计算算机机输输出出了了双双尾尾p-值值0.002,这这里里的的单单尾尾p-值值于于是是为为0.001。因因此此在在显显著著性性水水平平为为0.001时时,可可以以拒拒绝绝零零假假设设。也也就就是是说说,减减肥肥后后和和减减肥肥前前相相比比,平平均均重重量量显显著著要要轻轻。下下面面是是这这个个检检验的验的SPSS的部分计算机输出为(删去了置信区间):的部分计算机输出为(删去了置信区间):6.2.3 成对样本的问题再接着看例6.4。计算机输出了双446.3 对于比例的检验对于比例的检验6.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验o例例6.5(two.txt)为为评评价价电电视视的的收收视视率率,电电话话调调查查,在在某某一一节节目目播播出出的的时时候候,被被访访的的正正在在观观看看电电视视的的人人中中有有23的的正正在在观观看看这这个个节节目目。现现在在想想知知道道,这这是是否否和和该该节节目目的的制制作作人人所所期期望望的的p0=25有有显显著著不足。不足。o这这显显然然是是一一个个参参数数为为p的的二二项项分分布布问问题题。形形式式上上的的假设检验问题是假设检验问题是6.3 对于比例的检验6.3.1 对于离散变量总体比例456.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验o如如果果n为为访访问问的的正正在在看看电电视视的的人人数数,x为为其其中中观观看看该节目的人数,那么样本中的观看比例为该节目的人数,那么样本中的观看比例为o检检验验统统计计量量则则是是在在零零假假设设下下当当大大样样本本时时近近似似有有标标准正态分布的统计量准正态分布的统计量6.3.1 对于离散变量总体比例的检验如果n为访问的正在看466.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验o这个数值用手算也不费力气。请注意,这个数值用手算也不费力气。请注意,o前前面面第第五五章章提提起起过过,即即使使被被访访者者的的百百分分比比一一样样,但但样样本本少少的的信信息息就就少少。对对于于假假设设检检验验也也是是一一样样。样样本本量量对对于于假假设检验的结果就十分重要。设检验的结果就十分重要。o对对于于本本例例,现现在在还还未未给给出出样样本本量量n呢呢!下下面面看看看看不不同同的的样样本本量量会会得得到到什什么么结结果(假定果(假定x/n=0.23不变)不变)6.3.1 对于离散变量总体比例的检验这个数值用手算也不费476.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验1.如如样样本本量量为为n=1500(和和数数据据给给的的一一样样),那那么么,上上面面的的检检验验得得到到的的p-值值为为0.0368。因因此此,可可以以认认为为(如如果果选选显显著著性性水水平平为为0.05的的话话)说说收收视视率率有有25是过分了。即拒绝零假设。是过分了。即拒绝零假设。2.如如样样本本量量为为n=100,那那么么,上上面面的的检检验验得得到到的的p-值值为为0.3221。因因此此,没没有有足足够够的的理理由由拒拒绝绝收收视视率率有有25的零假设(如果选显著性水平为的零假设(如果选显著性水平为0.05的话)的话)注注意意,利利用用软软件件时时,上上面面的的p-值值计计算算往往往往在在公公式式中中加加上上用用连连续续变变量量近近似似离离散散变变量量分分布布时时常常用用的的连连续续性性纠纠正正,因因此此结结果果和和用用上上面面公公式直接手算的稍有不同。式直接手算的稍有不同。6.3.1 对于离散变量总体比例的检验如样本量为n=150486.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验o下下面面是是对对于于n=1500时时,例例6.5的的SPSS输输出出。这这里里正正在在观观看看该该节节目目的的人人数数为为n1=345,而而1500人人中中观观看看其其他他节节目目的的人人数数为为n2=1155。样样本本中中收收视视比比例例为为n1/n345/15000.23。6.3.1 对于离散变量总体比例的检验下面是对于n=150496.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验o前前面面对对总总体体比比例例的的检检验验所所用用的的公公式式利利用用了了二二项项分分布布的的大大样样本本正正态态近近似似;怎怎样样才才是是大大样样本本呢呢?这这和和第第五五章章求求比比例例的的置置信信区区间间时时大大样样本本的的近近似似标标准准类类似,即当区间似,即当区间o完完全全包包含含在在(0,1)区区间间内内部部时时,可可以以认认为为样样本本足够大,能够用正态近似。足够大,能够用正态近似。6.3.1 对于离散变量总体比例的检验前面对总体比例的检验506.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验o对对于于两两个个样样本本,也也有有关关于于两两个个总总体体比比例例之之差差p1p2的的检检验验。还还拿拿收收视视率率为为例例。节节目目甲甲的的样样本本收收视视率率为为20,节节目目乙乙为为21,是是不不是是节节目目甲甲的的总总体体收收视视率率就就真真的的低低于于节节目目乙乙?即检验即检验o这这里里的的零零假假设设意意味味着着节节目目甲甲和和节节目乙收视率相等。目乙收视率相等。6.3.1 对于离散变量总体比例的检验对于两个样本,也有关516.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验o假假定定n1=1200,n2=1300,检检验验统统计计量量则则是是在在零零假假设设下下当当大大样样本本时时有有近似标准正态分布的统计量近似标准正态分布的统计量o得得到到p-值值等等于于0.2679。因因此此,在在显显著著性性水水平平即即使使是是0.1时时,也也没没有有足足够够证证据据可可以以拒拒绝绝“节节目目甲甲和和节节目目乙收视率相等乙收视率相等”的零假设。的零假设。6.3.1 对于离散变量总体比例的检验假定n1=1200,526.3.2 对于连续变量比例的检验对于连续变量比例的检验o有有时时需需要要检检验验收收入入低低于于某某个个水水平平的的人人占占有有的的比比例例p是是否否和和预预期期的的p0一一样样。和和6.3.1节节一一样样,只只要要把把大大于于某某水水平平的的观观测测值值看看作作Bernoulli试试验验的的“成成功功”,而而把把小小于于某某水水平平的的观观测测值值看看成成“失失败败”,就就回回到到二二项项分分布布的的问问题题了了。当当然然,用用不不着着把把这这些些连连续续变变量量的的观观测测值值都都变变成成“成成功功”和和“失失败败”之之后后,再再数数各各有有多多少少。统计软件会替我们做所有的事情。统计软件会替我们做所有的事情。o下面通过一个例子来说明。下面通过一个例子来说明。6.3.2 对于连续变量比例的检验有时需要检验收入低于某个536.3.2 对于连续变量比例的检验对于连续变量比例的检验o例例6.6 某某微微生生物物的的寿寿命命问问题题(数数据据life.txt)。这这里里有有某某微微生生物物在在一一种种污污染染环环境境下下生生存存的的寿寿命命数数据据(单单位位:小小时时)6.3.2 对于连续变量比例的检验例6.6 某微生物的寿命546.3.2 对于连续变量比例的检验对于连续变量比例的检验o问问题题是是存存活活时时间间低低于于2小小时时的的是是否否少少于于70%(存存活活时时间间多多于于2小小时时的的是是否否多多于于30%)?零零假假设设为为存存活活时时间间低低于于2小小时时的的少少于于或或等等于于70%,备备选选假假设设为为存存活活时时间间低低于于2小小时时的的多多于于70%。该该检检验验用用符号表示,对于符号表示,对于p00.7,6.3.2 对于连续变量比例的检验问题是存活时间低于2小时556.3.2 对于连续变量比例的检验对于连续变量比例的检验o由计算机很容易得到检验结果由计算机很容易得到检验结果o这这说说明明,活活不不过过2小小时时的的有有52个个观观测测值值,所所占占的的比比例例为为90%。检检验验的的精精确确p-值值和和大大样样本本近近似似的的p-值值均均为为0.002。因因此此,可可以以拒拒绝绝“存存活活时时间间低低于于2小时的少于小时的少于70%”的零假设。的零假设。6.3.2 对于连续变量比例的检验由计算机很容易得到检验结566.3.2 对于连续变量比例的检验对于连续变量比例的检验o这这个个检检验验的的假假设设还还可可以以有有另另一一种种等等价价形形式式。前前面面第第三三、四四章章介介绍绍过过样样本本和和总总体体的的a a-分分位位数数的的概概念念。例例6.6的的检检验验问问题题等等价价于于检检验验0.7分分位位数数q是是等等于于2(q0=2)还是小于)还是小于2;即:;即:o该该例例的的结结论论是是实实际际存存活活时时间间的的0.7分分位位数数q小于小于2小时。小时。6.3.2 对于连续变量比例的检验这个检验的假设还可以有另576.3.2 对于连续变量比例的检验对于连续变量比例的检验o上上面面的的检检验验又又称称为为(推推广广的的)符符号号检检验验(sign test)。它它用用不不着着对对总总体体分分布布进进行行任任何何假假定定。而而狭狭义义的的符符号号检检验验是是指指上上面面的的p00.5或或者者(等等价价地地)q0等等于于中中位位数数的的情情况况。通通常常把把符符号号检检验验归归于于非非参参数数检检验验范范畴畴(参参见见后后面面介介绍绍非非参参数数检检验验的的一一章章)。6.3.2 对于连续变量比例的检验上面的检验又称为(推广的586.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法不妥o虽虽然然前前面面已已经经有有了了一一些些例例子子说说明明“接接受受零零假假设设”说说法法的的不不妥妥,但但还还可可能能会会有有些些人人对对于于在在检检验验结结果果不不显显著著时时只只能能说说“不不能能拒拒绝绝零零假假设设”而而不不能能说说“接接受受零零假假设设”感感到到不不解解。下下面面用用一一个个个个描描述述性性例例子来说明。子来说明。6.4 从一个例子说明“接受零假设”的说法不妥虽然前面已经596.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法不妥o例例6.7(数数据据 rice.txt)一一个个大大米米加加工工厂厂卖卖给给一一个个超超市市一一批批标标明明10kg重重的的大大米米。而而该该超超市市怀怀疑疑该该厂厂家家缺缺斤斤短短两两,对对10包包大大米米进进行行了了称称重重,得得到到下下面面结结果果(单单位位:千千克克)这这里里假假定打包的大米重量服从正态分布。定打包的大米重量服从正态分布。6.4 从一个例子说明“接受零假设”的说法不妥例6.7(606.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法不妥o由由于于发发生生分分歧歧,于于是是各各方方同同意意用用这这个个数数据据进进行行关关于于大大米米重重量量均均值值m m的的t检检验验;以以厂厂家家所所说说的的平平均均重重量量为为10kg作作为为零零假假设设,而而以以超超市市怀怀疑疑的的份份量量不不足足10kg作为备选假设:作为备选假设:o于于是是,超超市市、加加工工厂厂老老板板和和该该老老板板的的律师都进行了检验。结果是:律师都进行了检验。结果是:6.4 从一个例子说明“接受零假设”的说法不妥由于发生分歧616.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法不妥o1超超市市用用全全部部数数据据进进行行t检检验验,得得到到拒拒绝绝零零假假设设的的结结论论。他他们们根根据据计计算算得得到到:样样本本均均值值为为9.92kg,而而p-值值为为0.0106。因因此此超超市市认认为为,对对于于显显著著性性水水平平a a=0.05,应应该该拒拒绝绝零零假假设。设。6.4 从一个例子说明“接受零假设”的说法不妥1超市用全626.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法不妥o2大大米米加加工工厂厂老老板板只只用用2个个数数据据,得得到到“接接受受零零假假设设”的的结结论论。大大米米加加工工厂厂老老板板也也懂懂些些统统计计,他他只只取取了了上上面面样样本本的的头头两两个个个个数数目目9.93和和9.83进进行行同同样样的的t检检验验。通通过过对对这这两两个个数数进进行行计计算算得得到到:样样本本均均值值为为9.88kg,而而p-值值为为0.1257。虽虽然然样样本本均均值值不不如如超超市市检检验验的的大大,但但p-值值大大大大增增加加。加加工工厂厂老老板板于于是是下下了了结结论论:对对于于水水平平a a0.05,“接接受受零零假假设设”,即即加加工工厂厂的大米平均重量的确为的大米平均重量的确为10kg。6.4 从一个例子说明“接受零假设”的说法不妥2大米加工636.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法不妥o3大大米米加加工工厂厂老老板板的的律律师师用用了了全全部部数数据据,但但不不同同的的检检验验方方法法,得得到到“接接受受零零假假设设”的的结结论论。大大米米加加工工厂厂老老板板的的律律师师说说可可以以用用全全部部数数据据。他他利利6.3.2节节对对于于连连续续变变量量比比例例的的检检验验,也也就就是是关关于于中中位位数数的的符符号号检检验验(注注意意对对于于正正态态分分布布,对对中中位位数数的的检检验验等等价价于于对对均均值值的的检检验验)。根根据据计计算算,得得到到该该检检验验的的p-值值为为0.0547。所所以以这这个个律律师师说说在在显显著著性性水水平平a a=0.05时时,应应该该“接接受受零零假假设设”。还还说说,“既既然然三三个个检检验验中中有两个都接受零假设,就应该接受。有两个都接受零假设,就应该接受。”6.4 从一个例子说明“接受零假设”的说法不妥3大米加工646.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法不妥o加加工工厂厂老老板板实实际际上上减减少少了了作作为为证证据据的的数数据据,因因此此只只能能得得到到“证证据据不不足足,无无法法拒拒绝绝零零假假设设”的的结结论论。但但加加工工厂厂老老板板利利用用一一些些错错误误的的统统计计教教科科书书的的说说法法,把把“证证据据不不足足以以拒拒绝绝零零假假设设”改改成成“接接受受零零假假设设”了了。而而且且,从从样样本本中中仅仅选选择择某某些些数数目目(等等于于销销毁证据)违背统计道德。毁证据)违背统计道德。6.4 从一个例子说明“接受零假设”的说法不妥加工厂老板实656.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法不妥o律律师师虽虽然然用用了了全全部部数数据据,但但用用了了不不同同的的方方法法。他他也也只只能能够够说说“在在这这个个检检验验方方法法下下,证证据据不不足足以以拒拒绝绝零零假假设设”而而不不能能说说“接接受受零零假假设设”。另另外外,律律师师对对超超市市用用更更有有效效的的检检验验方方法法得得到到的的“拒拒绝绝零零假假设设”的的结结论论视视而而不不见见,这这也也违违背背了了统统计计原原理理。其其实实,对对于于同同一一个个检检验验问问题题,可可能能有有多多种种检检验验方方法法。但但只只要要有有一一个个拒拒绝绝,就就可可以以拒拒绝绝。那那些些不不能能拒拒绝绝的的检检验验方方法法是是能能力力不不足足。用用统统计计术术语语来来说说,该该拒拒绝绝而而不不能能拒拒绝绝的的检检验验方方法法是是势势(power)不不足,或者足,或者效率(效率(efficiency)低。低。6.4 从一个例子说明“接受零假设”的说法不妥律师虽然用了666.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法不妥o该例说明了几个问题:该例说明了几个问题:o在在已已经经得得到到样样本本的的情情况况下下,随随意意舍舍取取一一些些数数目目是是违违背背统统计计原原理理和和统统计计道道德德的。这相当于篡改或销毁证据。的。这相当于篡改或销毁证据。o由由于于证证据据不不足足而而不不能能拒拒绝绝零零假假设设绝绝对对不不能能说说成成“接接受受零零假假设设”。如如果果一一定定要要说说,请请给给出出你你接接受受零零假假设设所所可可能能犯犯第第二二类类错错误误的的概概率率(这这是是无无法法算算出出的的)。这是加工厂老板和律师所犯的错误。这是加工厂老板和律师所犯的错误。6.4 从一个例子说明“接受零假设”的说法不妥该例说明了几676.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法不妥o例例中中律律师师的的检检验验和和超超市市所所做做的的检检验验都都针针对对同同样样的的检检验验问问题题,但但由由于于超超市市的的检检验验方方法法比比律律师师的的检检验验更更强强大大(或或更更强强势势,more powerful,更更有有效效率率,more efficient),所所以以超超市市拒拒绝绝了了零零假设,而律师的检验则不能拒绝。假设,而律师的检验则不能拒绝。o如如果果有有针针对对同同一一检检验验问问题题的的许许多多检检验验方方法法,那那么么,只只要要有有一一个个拒拒绝绝,就就必必须须拒拒绝绝。绝绝对对不不能能“少少数数服服从从多多数数”,也不能,也不能“视而不见视而不见”。6.4 从一个例子说明“接受零假设”的说法不妥例中律师的检68
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!