资源描述
,单击此处编辑母版标题样式,#,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第一节 统计假设测验基本原理,一、统计假设测验的意义,随机抽取甲乙两个品种,10,个点的产量结果资料如下(单位:,kg/10m,2,):,甲:,11,,,11,,,9,,,12,,,10,,,13,,,13,,,8,,,10,,,13,乙:,8,,,11,,,12,,,10,,,9,,,8,,,8,,,9,,,10,,,7,经计算,得甲品种,10,个点的产量平均数,=11,kg/10m,2,,标准差,S,1,=1.76,kg/10m,2,;乙品种,10,个点产量平均数,=9.2,kg/10m,2,,标 准 差,S,2,=1.549,kg/10m,2,。,牛牛文库文档分享,第一节 统计假设测验基本原理 一、统计假设测验的意义,1,能否仅凭这两个平均数的差值,-=1.8,kg/10m,2,,立即得出甲与,乙,两品种产量不同的结论呢?统计学认为,这样得出的结论是不可靠的。这是因为如果我们再分别随机抽测,10,个点,又可得到两个样本资料。由于抽样误差的随机性,两样本平均数就不一定是,11,kg/10m,2,和,9.2,kg/10m,2,,其差值也不一定是,1.8,kg/10m,2,。造成这种差异可能有两种原因,一是,品种造成的差异,,即是甲与乙品种本质不同所致,另一可能是,试验误差,(或抽样误差)。,牛牛文库文档分享,能否仅凭这两个平均数的差值 -=1,2,对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。,两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。因此,不得不采用另一种方法,即研究样,牛牛文库文档分享,对两个样本进行比较时,必须判断样本间差异是抽样,3,样本,通过样本研究其所代表的总体。例如,设甲品种产量的总体平均数为 ,乙品种产量的总体平均数为 ,试验研究的目的,就是要给 、是否相同做出推断。由于总体平均数 、未知,在进行显著性检验时只能以样本平均数 、作为检验对象,更确切地说,是以(,-,)作为检验对象。一方面我们有依据由 样本平均数 和 的差异来推断总体平均数 、相同与否,另一方面又不能仅据样本平均数表面上的差异直接作出结论,其根本原因在于,试验误差(或抽样误差)的不可避免性,。,牛牛文库文档分享,样本,通过样本研究其所代表的总体。例如,设甲品种产量的总体平,4,对(,-,)进行显著性检验就是要分析:,试验的表面效应(,-,)主要由处理效应(,-,)引起的,还是主要由试验误差所造成。,虽然处理效应(,-,)未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可,从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。,牛牛文库文档分享,对(-)进行显著性检验就是要分析:,5,二、显著性检验的基本步骤,(一)提出假设,牛牛文库文档分享, 牛牛文库文档分享,6,这里假设,=,或,-=0,,即,假设,甲品种和乙品种产量的,总体平均数相等,,其意义是,试验的表面效应,:,-=1.8,kg/10m,2,是试验误差,,,处理无效,,这种假设称为,无效假设,(,null hypothesis,),记作 :,=,或 。,无效假设是被检验的假设,通过检验可能被接受,也可能被否定。提出 :,=,或,-=0,的同时,相应地提出一对应假设,称为,备择假设,(,alternative hypothesis,),记作 。备择假设是,在无效假设被否定时准备接受的假设,。,牛牛文库文档分享,这里假设 =或 -=0,7,本例的备择假设是 :或,-0,,即假设甲与乙两品种产量的总体平均数 与 不相等或 与 之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。,(二)确定显著水平,接受或否定 的概率标准叫显著水平,记为,是人为规定的小概率的数量界限在生物研究中取 和 两个等级,牛牛文库文档分享,本例的备择假设是 :或 -,8,(三)在无效假设成立的前提下,计算无效假设正确的概率,对于上述例子,研究在无效假设 :,=,成立的前提下,统计量(,-,)的抽样分布。经统计学研究,得到一个统计量,t,:,其中,=,叫做,均数差异标准误,(,样本平均数差数的标准误,),;,n,1,、,n,2,为两样本的含量。,牛牛文库文档分享,(三)在无效假设成立的前提下,计算无效假设正确的概率 ww,9,所得的统计量,t,服从自由度,df,=,(,n,1,-1,),+(,n,2,-1),的,t,分布。,根据两个样本的数据,计算得:,-=11-9.2=1.8,;,牛牛文库文档分享,所得的统计量 t服从自由度 df=(n1-1,10,我们需进一步估计出,|,t,|2.426,的两尾概率,即估计,P,(,|,t,|2.426,)是多少?,查附表,4,,在,df,=,(,n,1,-1,),+(,n,2,-1)=,(,10-1,),+,(,10-1,),=18,时,两尾概率为,0.05,的临界值:,=2.101,,两尾概率为,0.01,的临界,t,值:,=2.878,,即:,P,(,|,t,|2.101,),=,P,(,t,2.101,),+,P,(,t,2.878,),=,P,(,t,2.878,),+,P,(,t,-2.878,),=0.01,牛牛文库文档分享,我们需进一步估计出|t|2.426的两尾概率,,11,由于根据两样本数据计算所得的,t,值 为,2.426,,介于两个临界,t,值之间,即:,t,0.05,2.426,t,0.01,所以,,|,t,|2.426,的概率,P,介于,0.01,和,0.05,之间,即:,0.01,P,1.96,结论是与原来品种不相同。,牛牛文库文档分享,【例】有一小麦品种产量总体平均数 是360kg,标准差,28,方法,2,总体方差未知(一),提出无效假设与备择假设 ,其中 为样本所在总体平均数,为已知总体平均数;,(二),计算,t,值 计算公式为:,式中,,n,为样本含量,为样本平均数的标准误。,(三),查临界,t,值,作出统计推断 由 查附表,4,得临界值,t,0.05,,,t,0.01,。将计算所得的,t,值的绝对值与其比较:,牛牛文库文档分享,方法2总体方差未知(一)提出无效假设与备择假设,29,若,|,t,|0.05,,不 能 否定 ,表明样本平均数 与总体平均数 差异不显著,可以认为样本是取自该总体;,若,t,0.05,|,t,|,t,0.01,,则,0.01,P,0.05,,否定 ,接受 ,表明样本平均数 与总体平均数 差异显著,有,95%,的把握认为样本不是取自该总体;,牛牛文库文档分享,若|t|t0.05 ,则,30,若,|,t,|,t,0.01,,则,P0.01,,表明样本平均数与 总体平均数 差异极显著,有,99%,的把握认为样本不是取自该总体。,若在,0.05,水平上进行一尾检验,只要将计算所得,t,值的绝对值,|,t,|,与由附表,4,查得,a=0.10,的临界,t,值,t,0.10,比较,即可作出统计推断。,牛牛文库文档分享,若|t|t0.01,则P0.01,表明样本,31,【,例,】,某品种的生育期为,114,天,今抽测,10,个点生育期分别为,116,、,115,、,113,、,112,、,114,、,117,、,115,、,116,、,114,、,113,(天),试检验所得样本的平均数与总体平均数,114,天有无显著差异?,根据题意,本例应进行双侧,t,检验。,1,、提出无效假设与备择假设,,,牛牛文库文档分享, 牛牛文库文档分享,32,2,、计算,t,值,经计算得:,=114.5,,,S,=1.581,所以,=,=,=1.000,牛牛文库文档分享,2、计算t值 牛牛文库文,33,3,、查临界,t,值,作出统计推断,由,=9,,查,t,值表(附表,4,)得,t,0.05,(,9,),=2.262,,因为,|,t,|0.05,,故不能否定,H,0,:,=114,,表明样本平均数与总体平均数差异不显著,可以认为该样本取自品种生育期为,114,天的总体。,牛牛文库文档分享,3、查临界t值,作出统计推断www.niuwk,34,二、二个样本平均数的假设测验,1,、,成组数据的假设测验,当样本容量,n30,时平均数间相比较采用,u,测验,当样本容量,n,30,时平均数间相比较采用,t,测验,例甲乙两品种比较,在甲品种区内取,7,点,乙品种区内也取,7,点,甲品种,:,12.5 11.2 13.1 10.0 13.5 12.7 12.3,乙品种,:,9.5 12.3 11.7 10.0 10.5 12.0 8.5,牛牛文库文档分享,二、二个样本平均数的假设测验 牛牛,35,1,、,提出统计假设,H,0,1,=,2,或,1,-,2,=0,H,A,1,2,或,1,-,2,0,2,、,测验计算,S,x1-x2,=,=0.49,t=3.1632,查表 当,df=n,1,n,2,2=7,7,2=12,时,,,t,0.05,=2.107,、,t,0.01,=2.878,今计算,t=3.1632,t,0.05,故,P,0.05,3,、推断,否定,H,0,:,1,=,2,,,接受,H,A,1,2,,,甲、乙两品种的产量达到极显著差异。,牛牛文库文档分享,1、提出统计假设 牛牛文库文档分,36,2,、成对数据的假设测验,在成对数据中,由于同一配对内两个供试单位的试验条件很接近,而不同配对间的条件差异又可通过各个配对差数予以消除,因而可以控制试验误差,具有较高的精确度,。,例试验某玉米品种各选,10,个点分成两半,一半去雄,另一半不去雄。调查结果列于表,1,2,3,4,5,6,7,8,9,10,去雄,14.0,16.0,15.0,18.5,17.0,17.0,15.0,14.0,17.0,16.0,不去雄,13.0,15.0,15.0,17.0,16.0,12.5,15.5,12.5,16.0,14.0,d,i,1,1,0,1.5,1,4.5,-0.5,1.5,1,2,牛牛文库文档分享,2、成对数据的假设测验12345678910去雄14.016,37,解:设两个样本的观察值分别为,x,1,和,x,2,,共配成,n,对,则有,d=x,1,x,2,共有,n,个,d,S,d,=,t=H,0,牛牛文库文档分享,解:设两个样本的观察值分别为x1和x2,共配成n对,则有ww,38,1,、提出统计假设,H,0,1,=,2,,,d,=0,H,A,1,2,,,d,0,2,、测验计算:,=0.423,t=3.07,查,t,值表,当,df=n,1=9,时,t,0.05,=2.262,,,t,0.01,=3.250,今计算,t=3.07,t,0.05,=2.262,故,P,0.05,3,、推断否定,H,0,,接受,H,A,牛牛文库文档分享,1、提出统计假设 牛牛文库,39,统计假设测验方法总结,单个样本平均数的假设测验,这是测验样本平均数与某一指定的总体平均数的差异是否属实,。,在为已知时和样本容量,n30,时用,u,测验,临界值,1.96,,,2.58,若总体方差未知样本容量,n,30,则需要用,t,测验,两个样本平均数的假设测验,成组数据的假设测验,牛牛文库文档分享,统计假设测验方法总结 牛牛文库文档,40,成对数据的假设测验,牛牛文库文档分享,成对数据的假设测验 牛牛文库文档分,41,牛牛文库文档分享, 牛牛文库文档分享,42,牛牛文库文档分享, 牛牛文库文档分享,43,牛牛文库文档分享, 牛牛文库文档分享,44,
展开阅读全文