资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第四章 均数的抽样误差与,t,分布,第1,节 均数的抽样误差,一、抽样与抽样误差,抽样:从总体中随机抽取样本进行研究来推论总体。,抽样误差,sampling error:,由个体变异产生的,抽样造成的样本统计量与总体参数间差异,称。抽样研究中不可避免,但可估计其大小。而系统误差可以避免。,统计推断,statistical inference:,在总体中随机抽取一定数量的观察单位作为样本进行抽样研究,通过样本指标来说明总体特征,这种从样本获取总体信息的过程,称,二、均数的标准误,数理统计推论和中心极限定理,central limit theorem,表明,:,(1),从正态总体,N(,),中,随机抽取例数为,n,的样本,样本均数 也服从正态分布;,(2),从均数为,标准差为,的正态或偏,态总体,抽取例数为,n,的样本,样本均数 的总体均数也为,,标准差用,表示。通常将样本统计量的标准差称为标准误,standard error,SE,样本均数的标准差即均数标准误,standard error of mean,SEM。,SE:,反映了样本均数间的离散程度,也反映了样本均数与总体均数间的差异,说明均数抽样误差的大小。,均数标准误的计算:,为了说明均数的可靠程度,常在均数后面附上标准误的数值,(,常为标准误的估计值,),,表示为:,第2,节 总体均数的可信区间与,t,分布,一、大样本资料均数的可信区间,从均数为,标准差为,的正态总体中,随机抽取许多个样本量为,n,的样本,则这样本均数近似地以总体均数为中心呈正态分布。故,95%,的样本均数在 的范围内。,故:,因此,总体均数,95%,的可信区间,confidence interval,为:,:,指这个范围内包括总体均数,的可能性有,95%,。用各样本计算得到的可信区间并不是固定不变。,若仅知样本均数及标准误的估计值,且样本较小时,用标准误的估计值来代替标准误,误差较大,需要改用,t,值来推算可信区间。,二、,t,值与,t,分布,样本均数与总体均数间的差如以均数标准误 的估计值的倍数来表示,此倍数即为,t,值,从正态分布总体中抽取若干个样本含量相同的样本,每个样本各计算一个,t,值,如抽取的样本很多时,可发现,t,值的分布是以,0,为中心,两侧对称的类似正态分布的一种分布。即,t distribution。,t,分布曲线的峰度,kurtosis:,受,n,的影响。当,n,小时,曲线低平;,n,越大越接近正态分布。即,t,分布曲线是随自由度的大小而有规律地变动的。,degree of freedom:,=n-,1 (,读:,nu,),t,分布曲线不是一条曲线而是一簇曲线,t,分布曲线与横轴间的面积有规律:,两侧外部面积为,5%及1%,的界限的,t,值常用,t,0.05(,)、,t,0.01(,),表示,自由度趋于,时,,t,分布趋向于均数为,0,,标准差为,1,的标准正态分布。一般情况下,t,分布曲线较正态分布低平,因而,t,0.05(,),1.96,t,0.01(,),2.58,t,值与,P,值呈反向关系:,t,越大,则,P,越小;反之亦然。,|,t|t,0.05(,),,P0.05,三、小样本资料均数的可信区间,小样本时,t,0,.,05(,),和,t,0.01(,),与1.96、2.58,相差很大,因此计算总体均数,95,和,99,可信区间时,要改用:,见,P39,例,
展开阅读全文