资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,5,章 假设测验,Tests of Significance,Section 5.1Principle of Significance Tests,假设测,验的基本原理,一、假设测验的理论基础,某人宣称自由球命中率有80%。,命中率有80%的射手,实地投射只有8/20命中率的机会不大。,实地投射结果显示投20球中8球。,结论:命中率有80%的宣称不可信。,命中率有80%的自由球射手投20球命中的次数应服从二项分,布,B(20, 0.8)。,命中的次数小于或等于8的,概率,约为 0.0001。,即重复实地投射20球10,000次只中8球以下的情形约只发生一次。,假设宣称的叙述为真(命中率有80%) ,可推得实验结果发生的可能性很低,则该实验结果的发生(实地投射20球中8球),即为宣称的叙述不真的好证据。,“,Prove by Contradiction,”,小概率原理,一、假设测验的理论基础,例 某地区的当地小麦品种一般,667m,2,产,300kg,,即当地品种这个总体的平均数,=300(kg),,并从多年种植结果获得其标准差,=75(kg),,而现有某新品种通过,25,个小区的试验,计得其样本平均产量为每,667m,2,330kg,即,=330,,问新品种产量与当地品种产量是否有显著差异?,二、假设测验的步骤,(,一,),先假设新品种产量与当地品种产量无差异,记作,无效假设或零假设,对立假设或备择假设,二、假设测验的步骤,二、假设测验的步骤,(,二,),在承认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率,先承认无效假设,从已知总体中抽取样本容量为,n,=25,的样本,该样本平均数的抽样分布具正态分布形状,平均数,=300(kg),,标准误,=15(kg),。如果新品种的平均产量很接近,300 kg,,应接受,H,0,。如果新品种的平均产量与,300,相差很大,应否定,H,0,。但如果试验结果与,300,不很接近也不相差悬殊,就要借助于概率原理,具体做法有以下两种:,1.,计算概率,在假设,为正确的条件下,根据的抽样分布算出获得,330kg,的概率,或者说算得出现随机误差,30(kg),的概率:在此,,查附表,当,u,=2,时,,P,(,概率,),界于,0.04,和,0.05,之间,即这一试验结果:,30(kg),,属于抽样误差的概率小于,5%,。,二、假设测验的步骤,2.,计算接受区和否定区,在假设,H,0,为正确的条件下,根据 的抽样分布划出一个区间,如 在这一区间内则接受,H,0,,如 在这一区间外则否定,H,0,。由于,因此,在 的抽样分布中,落在,( ),区间内的有,95%,,落在这一区间外的只有,5%,。,二、假设测验的步骤,如果以,5%,概率作为接受或否定,H,0,的界限,则上述区间,( ),为接受假设的区域,简称,接受区,( acceptance region ),; 和 为否定假设的区域,简称,否定区,( rejection region ),。,同理,若以,1%,作为接受或否定,H,0,的界限,则,( ),为接受区域, 和,为否定区域。,二、假设测验的步骤,如上述小麦新品种例,,=300,,,1.96 =29.4(kg),。因之,它的两个,2.5%,概率,的否定区域为,300,29.4,和,300+29.4,,即,大于,329.4(kg),和小于,270.6(kg),的概率只有,5,。,图,5%,显著水平假设测验图示,(表示接受区域和否定区域),二、假设测验的步骤,(,三,),根据“小概率事件实际上不可能发生”原理接受或否定假设,当 由随机误差造成的概率,P,小于,5,%,或,1,%,时,就可认为它不可能属于抽样误差,从而否定假设。,如,P,0.05,,则称这个差数是显著的。,如,P, ,0,假设:,否定区,H,0,: ,0,H,A,:, ,0,左尾测验,右尾测验,单尾测验,(one-sided test),接受区,接受区,三、两尾测验与一尾测验,u,0.05,=1.64,u,0.01,=2.33,单尾,测验,分位数,双尾,测验,分位数,u,0.05,=1.96,u,0.01,=2.58,否定区,否定区,否定区,接受区,接受区,查表时,单尾概率等于双尾概率,乘以,2,三、两尾测验与一尾测验,假设测验的两类错误,H,0,正确,H,0,错误,否定,H,0,错误,(),推断正确,(1-),接受,H,0,推断正确,(1-),错误,(),第一类错误(,type,I,error,),又称弃真错误或,错误,;,第二类错误(,type,I,I,error,),,又称纳伪错误或,错误,第一类错误的概率为显著水平 值。,第二类错误的概率为 值。,四、假设测验的两类错误,关于两类错误的讨论可总结如下:,(1),在样本容量,n,固定的条件下,提高显著水平,(,取较小的 值,),,如从,5,%,变为,1,%,则将增大第二类错误的概率 值。,(2),在,n,和显著水平 相同的条件下,真总体平均数 和假设平均数 的相差,(,以标准误为单位,),愈大,则犯第二类错误的概率 值愈小。,(3),为了降低犯两类错误的概率,需采用一个较低的显著水平,如,=0.05,;或适当增加样本容量。,(4),如果显著水平 已固定下来,则改进试验技术和增加样本容量可以有效地降低犯第二类错误的概率。,四、假设测验的两类错误,Section 5.,2,Significance Tests,for,Mean,s,平均数,的假设测验,一、,t,分布,数据来自正态总体,N(,2,),的假设下,随机样本的均数 服从正态,N(,2,/,n,),标准差,未知,,用,样本标准差,s,估计,以 标准化后服从标准正态,以 标准化后则服从,t,分布,的标准差估计值 又称为 的标准误 (,standard error of mean,简记为,),0,标准正态分布,t,分布自由度9,t,分布自由度2,一、,t,分布,t,分布图形与正态分布图形相似,都具有对称于零、单峰及钟形的特性,t,分布图形的散布(,spread),比正态分布图形大,,t,分布图形的尾端具有较大的概率,以 替代 来标准化,使得,t,分布有较大的变异性。,t,分布自由度越大图形越接近正态。,样本,容量,越大,s,估计,越,可靠,,估计值造成的额外变异性越,小,。,一、,t,分布,在,自由度为 的,t,分布,曲线图下, 右方,与 左方,的面积,和,为,a,则称 为,自由度为 的,t,分布概率为,a,的双侧,临界值。可查表。,0,面积为,a/2,面积为,a/2,一、,t,分布,在,自由度为 的,t,分布,曲线图下, 右方的面积为,a,则称 为,自由度为 的,t,分布概率为,a,的单侧,临界值。可查表。,0,面积为,a,一、,t,分布,-t,t,0,一、,t,分布,t,界值表,1.812,2.228,-2.228,t,f,(,t,),=10,的,t,分布图,例,1 ,某春小麦良种的千粒重,34g,,现自外地引入一高产品种,在,8,个小区种植,得其千粒重,(g),为:,35.6,、,37.6,、,33.4,、,35.1,、,32.7,、,36.8,、,35.9,、,34.6,,问新引入品种的千粒重与当地良种有无显著差异?,这里总体 为未知,又是小样本,故需用,t,测验;又新引入品种千粒重可能高于也可能低于当地良种,故需作两尾测验。测验步骤为:,二、单个样本平均数的假设测验,H,0,:,34g,;对,H,A,:,34g,。,显著水平,=0.05,。,测验计算:,查附表 ,,v,=7,时,,t,0.05,=2.365,。现实得,|,t,|0.05,。,推断:接受,H,0,:,34g,,即新引入品种千粒重与当地良种千粒重指定值没有显著差异。,二、单个样本平均数的假设测验,由两个样本平均数的相差,以测验这两个样本所属的总体平均数有无显著差异。,测验方法,成组数据的平均数比较,成对数据的比较,三、,两个样本平均数相比较的假设测验,(,一,),成组数据的平均数比较,如果两个处理为完全随机设计的两个处理,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据,以组,(,处理,),平均数作为相互比较的标准。,在两个样本的总体方差 和 为未知,但可假定,,而两个样本又为小样本时,用,t,测验。,三、,两个样本平均数相比较的假设测验,从样本变异算出平均数差数的均方 ,,其两样本平均数的差数标准误为:,于是有:,由于假设,故,自由度,三、,两个样本平均数相比较的假设测验,例,2,调查某农场每亩,30,万苗和,35,万苗的稻田各,5,块,得亩产量,(,单位:,kg,),于表,1,,试测验两种密度亩产量的差异显著性。,表,1,两种密度的稻田亩产,(kg),y,1,(30,万苗,),y,2,(35,万苗,),400,450,420,440,435,445,460,445,425,420,假设,H,0,:,两种密度的总体产量没有差异,即,对,显著水平,=0.05,测验计算:,=428kg =440kg,SS,1,=1930,SS,2,=550,故,三、,两个样本平均数相比较的假设测验,查附表,,v,=4+4=8,时,t,0.05,=2.306,。,现实得,|,t,|=1.080.05,。,推断:接受假设,,两种密度的亩产量没有显著差异。,三、,两个样本平均数相比较的假设测验,(,二,),成对数据的比较,若试验设计是将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为,成对数据,。,成对数据,由于同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控制试验误差,具有较高的精确度。,在分析试验结果时,只要假设两样本的总体差数的平均数 ,而不必假定两样本的总体方差 和 相同。,三、,两个样本平均数相比较的假设测验,设两个样本的观察值分别为,x,1,和,x,2,,共配成,n,对,各个对的差数为,d,=,x,1,x,2,,差数的平均数为 ,则差数平均数的标准误 为:,它具有,v,=,n,1,。若假设,,则上式改为:,即可测验,三、,两个样本平均数相比较的假设测验,例,3,选生长期、发育进度、植株大小和其他方面皆比较一致的两株番茄构成一组,共得,7,组,每组中一株接种,A,处理病毒,另一株接种,B,处理病毒,以研究不同处理方法的饨化病毒效果,表,2,结果为病毒在番茄上产生的病痕数目,试测验两种处理方法的差异显著性。,表,2,A,、,B,两法 处理,的病毒在番茄上产生的病痕数,组 别,y,1,(A,法,),y,2,(B,法,),d,1,10,25,15,2,13,12,1,3,8,14,6,4,3,15,12,5,5,12,7,6,20,27,7,7,6,18,12,三、,两个样本平均数相比较的假设测验,假设:两种处理对饨化病毒无不同效果,即,;对,。 显著水平,。,查附表,v,=7-1=6,时,t,0.01,=3.707,。实得现,|,t,|,t,0.01,,故,P,0.01,。 推断:否定,,接受,,即,A,、,B,两法对饨化病毒的效应有极显著差异。,三、,两个样本平均数相比较的假设测验,成对数据和成组数据平均数比较的不同,:,(1),成对数据和成组数据平均数比较所依据的条件不同。,前者是假定各个配对的差数来自差数的分布为正态的总体,具有,N,(0,,,),;而每一配对的两个供试单位是彼此相关的。,后者则是假定两个样本皆来自具有共同,(,或不同,),方差的正态总体,而两个样本的各个供试单位都是彼此独立的。,(2),在实践上,如将成对数据按成组数据的方法比较,容易使统计推断发生第二类错误,即不能鉴别应属显著的差异。故在应用时需严格区别。,三、,两个样本平均数相比较的假设测验,Section 5.,3,Significance Tests,for,Proportion,百分数的假设测验,测验某一样本百分数 所属总体百分数与某一理论值或期望值,p,0,的差异显著性。,由于样本百分数的标准误 为:,故由,即可测验,H,0,:,p=p,0,。,一、单个样本百分数,(,成数,),的假设测验,例,4,以紫花和白花的大豆品种杂交,在,F,2,代共得,289,株,其中紫花,208,株,白花,81,株。如果花色受一对等位基因控制,则根据遗传学原理,,F,2,代紫花株与白花株的分离比率应为,31,,即紫花理论百分数,p,=0.75,,白花理论百分数,q,=1,p,=0.25,。问该试验结果是否符合一对等位基因的遗传规律?,一、单个样本百分数,(,成数,),的假设测验,因为实得,|,u,|0.05,。,推断:接受,H,0,:,p,=0.75,,即大豆花色遗传是符合一对等位基因的遗传规律的,紫花植株百分数,=0.72,和,p,=0.75,的相差系随机误差。如果测验,H,0,:,p,=0.25,,结果完全一样。,假设大豆花色遗传符合一对等位基因的分离规律,紫花植株的百分数是,75%,,即,H,0,: p,=0.75,;对,H,A,: p,0.75,。,显著水平,0.05,,作两尾测验,u,0.05,=1.96,。,测验计算:,一、单个样本百分数,(,成数,),的假设测验,测验两个样本百分数和所属总体百分数,p,1,和,p,2,的差异显著性,.,设两个样本某种属性个体的观察百分数分别为 和,,而两样本总体该种属性的个体百分数分别为,p,1,和,p,2,,则两样本百分数的差数标准差 为:,即可对,H,0,:,p,1,=,p,2,作出假设测验。,故由,二、两个样本百分数,(,成数,),的假设测验,例,5,调查低洼地小麦,378,株,(,n,1,),,其中有锈病株,355,株,( x,1,),,锈病率,93.92%( ),;调查高坡地小麦,396,株,(,n,2,),,其中有锈病,346,株,( x,2,),,锈病率,87.31%( ),。试测验两块麦田的锈病率有无显著差异?,假设,H,0,:两块麦田的总体锈病率无差别,即,H,0,:,p,1,=,p,2,;对,H,A,:,p,1,p,2,。取,,两尾测验,,u,0.05,=1.96,。,测验计算:,二、两个样本百分数,(,成数,),的假设测验,实得,|,u,|,u,0.05,,故,P,0.05,,,推断:否定,H,0,:,p,1,=,p,2,接受,H,A,:,p,1,p,2,,即两块麦田的锈病率有显著差异。,二、两个样本百分数,(,成数,),的假设测验,Section 5.,4,Estimating Confidence Interval,区间估计,所谓,参数的区间估计,是指在一定的概率保证之下,估计出一个范围或区间以能够覆盖参数。,这个区间称,置信区间,( confidence interval ),,区间的上、下限称为,置信限,( confidence limit ),,区间的长度称为,置信距,。,一般以,L,1,和,L,2,分别表示置信下限和上限。,保证该区间能覆盖参数的概率以,P,=(1,),表示,称为,置信系数或置信度,。,一、什么是区间估计,并有,在总体方差 为未知时,置信区间为:,上式中的 为置信度,P,=(1,),时,t,分布的,t,临界值。,二、单一总体平均数的置信区间,例,6,例,1,已算得某春小麦良种在,8,个小区的千粒重平均数 , 。试估计在置信度为,95%,时该品种的千粒重范围。,由附表查得,v,=7,时,t,0.05,=2.365,,故有,,,即,推断:该品种总体千粒重在,33.836.6g,之间的置信度为,95%,。在表达时亦可写作 形式,即该品种总体千粒重,95%,置信度的区间是,35.2(2.3650.58)=35.21.4(g),,即,33.836.6g,。,二、单一总体平均数的置信区间,三、两总体平均数差数的置信区间,(,一,),成组数据,如果两总体方差未知,但相等,即 ,则,的,1-,置信区间为:,并有,以上的 为平均数差数标准误, 是置信度为,1,,自由度为,v,=n,1,+n,2,2,时,t,分布的临界值。,例,7,试估计例,2,资料两种密度,667,m,2,产量差数在置信度为,99%,时的置信区间。,在前面已算得:,由附表查得,v,=8,时,,t,0.01,=3.355,故有,L,1,=(428,440),(3.35511.136)=,49.4,,,L,2,=(428,440)+(3.35511.136)=25.4(kg),。,结果说明,,667,m,2,栽,30,万亩苗的产量可以比,667,m,2,栽,35,万苗的每亩少收,49.4kg,至每亩多收,25.4kg,,波动很大。所以这个例子是接受 的,.,的。,三、两总体平均数差数的置信区间,(,二,),成对数据,由,可得 的,1-,置信区间,:,并有,为置信度为,1,,,v,=,n,1,时,t,分布的临界,t,值。,其中,三、两总体平均数差数的置信区间,例,8,试求例,3,资料 的,99%,置信限。,在例,3,已算得:,并由附表查得,v,=6,时,t,0.01,=3.707,于是有,:,L,1,=,8.3,(3.707,1.997)=,15.7,(,个,),,,L,2,=,8.3+(3.707,1.997)=,0.9,(,个,),。,或写作,以上,L,1,和,L,2,皆为负值,表明,A,法处理病毒在番茄上产生的病痕数要比,B,法减小,0.915.7,个,此估计的置信度为,99%,。,三、两总体平均数差数的置信区间,(,一,),单一总体百分数的置信区间,在置信度,P,=1,下,对总体,p,置信区间的近似估计为:,并有,以上式中,四、百分数的置信区间,例,9,调查,100,株玉米,得到受玉米螟危害的为,20,株,即,=20/100=0.2,或,=20,。试计算,95%,置信度的玉米螟危害率置信区间。,故,L,1,=0.2,(1.96,0.04)=0.1216,,,L,2,=0.2+(1.96,0.04)=0.2784,四、百分数的置信区间,(,二,),两个二项总体百分数差数的置信区间,在,1,的置信度下,,p,1,p,2,的置信区间为:,并有,其中,四、百分数的置信区间,例,10,例,5,已测知低洼地小麦的锈病率,=93.92%,(,n,1,=378),,高坡地小麦的锈病率,=87.31%(,n,2,=396),,它们有显著差异。试按,95%,置信度估计两地锈病率相差的置信区间。,由附表查得,u,0.05,= 1.96,,而,故有,L,1,=(0.9392,0.8731),(1.96,0.02075)=0.0256,,,L,2,=(0.9392,0.8731)+(1.96,0.02075)=0.1070,,即低洼地的锈病率比高坡地高,2.5610.70%,,此估计的置信度为,95%,。,四、百分数的置信区间,Section 5.,5,Relation between C,onfidence Interval,and,Significance Tests,区间估计与假设测验的关系,区间估计亦可用于假设测验。,对参数所作假设若恰落在该范围内,则这个假设与参数就没有真实的不同,因而接受,H,0,;,反之,如果对参数所作的假设落在置信区间之外,则说明假设与参数不同,所以应否定,H,0,,接受,H,A,。,例,11,例,1,已算得新引入春小麦品种的千粒重,故其,95%,置信区间的两个置信限为:,L,1,=35.2,(2.365,0.58)=33.8(g),L,2,=35.2+(2.365,0.58)=36.6(g),曾经假设 ,此值落在上述置信区间内,所以不能认为新引入品种与当地原有良种的千粒重有显著差异,即接受 。这和例,1,的结论完全相同。,例,12,在例,3,已求得两种不同处理的病毒,接种在番茄上产生的病痕数的相差,在,1,置信度下的区间为,(,个,),。,如果假设 ,则该区间内并不包括,0,值,所以,两种处理方法是有显著差异的,显著水平是,0.05,。其结论与例,3,同。,例,13,在例,10,已求得低洼地小麦锈病率与高坡地小麦锈病率的相差的,95%,置信区间为:,2.56% (,p,1,p,2,)10.7%,。,若假设,H,0,:,p,1,=,p,2,,则该假设在上述置信区间外,故在,=0.05,水平上否定,H,0,,接受,H,A,:,p,1,p,2,0,。,区间估计与假设测验关系总结为以下几点:,(1),若在,1,的置信度下,两个置信限同为正号或同为负号,则否定无效假设,而接受备择假设。,(2),若在,1,置信度下,两个置信限为异号,(,一正一负,),,即其区间包括零值,则无效假设皆被接受。,(3),若两个置信限皆为正号,则有一个参数大于另一个参数的结论成立。,(4),若两个置信限皆为负号,则有一个参数小于另一个参数的结论成立。,
展开阅读全文