资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,第九章 假设检验,STAT,随着我国加入,WTO,,我国的企业面临着异常严重的挑战,汽车行业的形势尤为严峻。是挑战也是机遇,为了迎接挑战,国内汽车行业纷纷采取各种应对措施。,A,汽车集团公司对本公司的,A1,型号汽车的发动机系统进行了一系列改进,提高了启动速度,降低了噪音,改称为,A2,型。其中,公司关心的一个重要问题是汽车的节能性。节油是汽车的一个卖点,改进前的,A1,型汽车油耗较高,每百公里油耗为,8.48,升,公司希望改进后的车型比改进前节油,至少不比改进前更废油。,实践中的统计,STAT,为此,随机抽取了,15,辆,A2,型汽车做试验,测得,15,辆汽车的每百公里耗油量的数据如下表:,15,辆汽车每百公里耗油量(单位:升),其平均数为,8.377,。对此数据,技术部经理认为可以肯定改进后的汽车更省油。,实践中的统计,8.50,8.75,8.33,8.21,8.52,8.30,8.31,8.19,8.40,8.86,8.41,8.01,8.20,8.26,8.39,STAT,公司质量部经理对此结论有不同看法,他认为这个现象有可能是由抽样的随机性造成的,现在就下结论说改进后的汽车更省油还为时过早,应该对此问题作统计上的假设检验。质量部的张工程师刚通过国家质量工程从业资格认证考试,学会了不少统计方法,质量部经理就派张工解决这个问题。通过简单的计算,很快张工就得得到结论,他说,以现有的数据并不能认为改进前后汽车的油耗有明显变化。那么,张工是怎样作出他的统计分析结论的呢?,实践中的统计,STAT,本章重点,1,、假设检验的基本原理;,2,、假设检验的形式与种类;,3,、第一类错误与第二类错误;,4,、区间估计与假设检验的方法。,本章难点,1,、假设检验的基本原理;,2,、第一类错误与第二类错误。,9,章 假设检验,STAT,对研究性假设的检验,我们前面的案例就可以看成是一个研究性假设的例子。,研究性假设是:改进后的车型更节油,即平均油耗低于,8.48,升。,通常,,研究性假设,作为备择假设。,则上例中我们可建立如下的零假设和备择假设:,9.1,零假设和择假设,STAT,例:某饮料生产商声称:他们生产的两升罐装饮料平均至少有,67.6,盎司中的饮料。为了检验该生产商的陈述,我们将抽取一个两升灌装饮料的样本,然后对其中所装应料的重量进行测量。,该问题即属于对,陈述正确性,的检验,一般的,我们都先假定生产商的陈述属正确的。,则上例中我们可建立如下的零假设和备择假设:,对陈述正确性的检验,STAT,对决策情况下的检验,不管接受零假设还是接受备择假设,都须作出决策。,例:根据从刚刚收到的货物中所抽取的零件的样本,质量控制检验员就必须做出决策:是接受这批货物还是因为其不符合规格而向供应商退回这批货物。假定零件的平均长度是,2,英寸。,则上例中我们可建立如下的零假设和备择假设:,STAT,建立零假设和备择假设总结:,设 表示在零假设和备择假设中考虑的某一特定数值。一般来说,对总体均值的假设检验采取下面的三种形式之一:,STAT,第一类错误:拒绝正确的原假设,简称“拒真”;,第二类错误:接受错误的原假设,简称“纳伪”,如下所示:,我们把两类错误发生的概率表示如下:,第一类错误发生的概率;,第二类错误发生的概率;,9.2,第一类和第二类错误,总体情况,结论,H,0,正确,H,0,错误,接受,H,0,正确结论 第二类错误,拒绝,H,0,第一类错误 正确结论,STAT,在实践中,我们通常确定允许犯第一类错误的概率的最大值,将其称为显著性水平。,可以选择,=,0.05,或,=,0.01,。,STAT,例:联邦贸易委员会定期进行调查,目的是检验生产商们对自己产品的陈述。例如,大听的,Hilltop,咖啡的标签标明:听内至少装有,3,磅的咖啡,我们用假设检验来检验标签的陈述是否正确。若抽取了,36,听咖啡作为样本。步骤:,1.,建立零假设和备择假设。,若根据样本计算出来的样本平均重量低于,3,磅,我们就可以怀疑零假设的正确性。究竟样本低到什么程度我们才可以认为对总体所作的假定是错误的呢,?,即愿意冒第一类错误的风险,错误的控告该公司违背了标签的陈述。,这取决于决策者的态度。,9.3,大样本情况下总体均值的单侧检验,STAT,当,n=36,时,样本均值服从正态分布,我们可以用,统计量 的取值来衡量样本均值偏离总体均值的程度。,我们先考察 的情况,下图表明观察到的样本均值低于总体均值的,1.645,倍标准差的概率是,0.05,。如果,FTC,认为,犯第一类错的概率为,0.05,是可以接受的,那么,只要统计量,z,的值显示样本均值低于总体均值的,1.645,倍的标准差以上,我们就可以拒绝零假设。也就是,STAT,图,1,样本均值低于总体均值的,1.645,倍的标准差的概率,3,STAT,在进行检验之前,我们要确定犯第一类错误的最大允许概率,即显著性水平。,在上例中,假定,FTC,的检验计划的主管人员作出了下列陈述:如果公司的产品重量符合技术规格的要求 ,我们就有,99%,的概率对该公司采取不利的行动。当我们控告该公司的产品重量不足时,我们愿意冒的犯这类错误的风险的概率是,1%,。,可以推定,。查标准正态分布表,可得临界值为,2.33,。,STAT,若根据样本均值计算得,Z,值小于,-2.33,,就可以拒绝零假设,接受备择假设。,称,假定根据,36,个听装咖啡样本计算出的均值 ,有根据以前的研究,我们知道总体的标准差 ,计算,z,值:,STAT,若 ,则统计量的值,如果 ,犯第一类错误的概率比 时犯第一类错的概率小。检验统计量的值在拒绝域内出现的可能性更小。,所以,确定检验的临界值时,只要假定 可以了。,STAT,总结:,在大样本情况下,无论总体标准差已知或未知,样本均值总是服从正态分布,则可归纳左侧检验的一般步骤:,1,、建立零假设和备择假设,2,、确定检验统计量,并计算其值,3,、根据事先确定的显著性水平,查标准正态分布表得临界值,4,、拒绝规则:,9.3.1,单个总体均值的单侧假设检验,STAT,同理,在大样本情况下,右侧检验的一般步骤:,1,、建立零假设和备择假设,2,、确定检验统计量,并计算其值,3,、根据事先确定的显著性水平,查标准正态分布表得临界值,4,、拒绝规则:,STAT,例:某市的一家公司生产一种新型的轮胎,这种新型轮胎的设计规格是平均行驶里程至少为,28000,英里。随机抽取了,30,只轮胎作为一个样本进行检验,结果,样本均值时,27500,英里,样本标准差是,1000,英里。采用,0.05,的显著性水平,检验是否有足够的证据拒绝轮胎的平均行驶里程至少为,28000,英里的陈述。,解:已知,1,、建立零假设和备择假设,STAT,2,、确定检验统计量,并计算其值,3,、,4,、,练习:P272,T14,STAT,P,值是指观察到的样本均值小于或等于观察值的概率。也可以称为观测的显著性水平。,以希尔托普公司的咖啡问题为例来计算样本均值 的,P,值。,我们已经给出检验统计量的值,z=-2.67,查标准正态分布表,可以求出在均值与,z=-2.67,之间的区域面积是,0.4962,。由此得到样本均值小于或等于观察值 的概率是,0.5000-0.4962=0.0038,,即,P,值就是,0.0038,。,9.3.2 P,值的作用,STAT,P,值可以用来进行假设检验的决策,如果,P,值比显著性水平小,则检验统计量的值就在拒绝域内,若更大,则落入接受域内。上例中,,P=0.0038,假设检验的,P,值标准,STAT,例:根据美国高尔夫球协会的准则,只有射程和滚动距离平均为,280,码的高尔夫球可在比赛中使用。假定某公司最近开发了一种高技术生产方法,用这种方法生产的高尔夫球的射程和滚动距离平均为,280,码。现在抽取一个有,36,个高尔夫球的随机样本来检验该公司的陈述是否为真。数据如下表。(假定在显著性水平为,0.05,的条件下进行)。,9.4,大样本情况下总体均值的双侧检验,269,301,296,275,282,276,284,272,263,300,295,265,282,263,286,260,285,264,268,288,271,260,270,293,299,293,273,278,278,279,266,269,274,277,281,291,STAT,该问题就是一个双侧检验的例子。,先建立如下的零假设和备择假设:,在大样本的情况下,仍然选择统计量,Z,和单侧检验不同的是,此时的拒绝域分布在正态曲线的两侧,对应的概率均为 。查表时应该查 对应的临界值,STAT,上例中,依据表中资料可计算得,,则统计量的值为,根据给定的显著性水平,STAT,归纳:在大样本情况下,双侧检验的一般步骤:,1,、建立零假设和备择假设,2,、确定检验统计量,并计算其值,3,、根据事先确定的显著性水平,查标准正态分布表得临界值,4,、拒绝规则:,STAT,对于前面关于高尔夫球的例子,我们已知对应样本均值 的,z,值是,-0.75,,从标准正态分布表可以查到,在均值和,z,值,-0.75,只见的面积是,0.2734,。因此,左侧的面积为,0.2266,,而此时左侧的拒绝域内的面积为,=0.025,。,0.22660.025,,统计量不再拒绝域内,不能拒绝零假设,与前的结论相同。,P,值为,z,值对应一侧面积的,2,倍。,此时,判断的标准仍然是,双侧检验的,P,值,STAT,在大样本的情况下,给定置信水平 的总体均值的置信区间为:,进行假设检验时,首先需要对总体的参数作出假定:,双侧检验,9.4.3,区间估计和假设检验的关系,(,1,),STAT,因此,双侧假设检验的样本均值的非拒绝区域可以由下式给出:,双侧假设检验的非拒绝域和置信区间之间的关系:,(,2,),STAT,由此得到由置信区间方法到假设检验的运算过程:,假设的形式:,(,1,)从总体中抽取一个简单随即样本构建总体均值的置信区间:,(,2,)如果置信区间包含假定的 值,则不拒绝零假设 。,否则,拒绝,STAT,例:仍然采用前述关于高尔夫球的双侧检验的例子:,根据样本数据我们已经计算得到:,对于给定的置信水平,可以得到总体均值的,95%,的置信区间为:,即,274.58282.42,总体均值的假设值 在这个区间,所以我们不能拒绝零假设。,STAT,在区间估计中我们已经知道,当总体服从正态分布且总体方差未知时,小样本下的统计量,这时对总体均值的检验就应该采用,t,统计量来进行。,例:如果机场的总体平均质量等级得分大于或等于,7,分,那么就可以认为该机场提供的服务质量为优良。现随机抽取了,12,个乘客作为样本,得到伦敦某机场的质量等级分数如下:,7,、,8,、,10,、,8,、,6,、,9,、,6,、,7,、,7,、,8,、,9,、,8,。假定总体的等级近似服从标准正态分布,在,0.05,的显著性水平下可以认为该机场服务质量优良吗?,9.5,小样本情况下总体均值检验,STAT,1.,建立零假设和备择假设,2.,选择统计量,t,,并计算,3.,4.,STAT,注意:小样本的情况下的检验步骤与判断准则与大样本情况下的基本不同,唯一的不同是小样本对应,t,分布,而大样本对应正态分布。,另外,小样本下也可以运用,P,值来判断,但是由于,t,分布的表编制不很详细,不能通过查表来准确计算,P,值,但是判断的原则依然与前相同,,练习:,P282,T34,STAT,9.6,总体比例的检验,STAT,我们只考虑 的情况下,样本比例服从正态分布下的总体比例的假设检验。,由于比例是特殊的均值,因此对比例进行检验的步骤及判断准则与对均值的检验相同,只需要检验统计量中的均值换成比例对应的指标就可。,例:在过去的几个月中,在松树溪打高尔夫球的人中有,20%,是女性。为了提高女性高尔夫球收的比例,球场采取了一项特殊的激励措施来吸引女性。
展开阅读全文