资源描述
3.抽样误差和t分布,Samplingerrorandtdistribution,抽样误差的概念,由抽样引起的样本统计量与总体参数间的差异两种表现形式样本统计量与总体参数间的差异样本统计量间的差异,抽样研究个体变异,抽样误差产生的条件,均数的抽样误差及标准误,表现一:样本均数与总体均数之差值表现二:多个样本均数间的离散度,中心极限定理(centrallimittheorem),从均数为、标准差为的总体中独立随机抽样,当样本含量n增加时,样本均数的分布将趋于正态分布,此分布的均数为,标准差为,标准误(standarderror,SE),样本统计量的标准差称为标准误,用来衡量抽样误差的大小。样本均数的标准差称为标准误。此标准误与个体变异成正比,与样本含量n的平方根成反比。,实际工作中,往往是未知的,一般可用样本标准差s代替:因为标准差s随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差。,中心极限定理表明,即使从非正态总体中随机抽样,只要样本含量足够大,样本均数的分布也趋于正态分布,见图3.1。,四个非正态分布的总体抽样结果(A偏三角分布、B均匀分布、C指数分布、D双峰分布),图3.1描述了来自不同总体的样本均数之抽样误差和抽样分布规律。事实上,任何一个样本统计量均有其分布。统计量的抽样分布规律是进行统计推断的理论基础。,标准差与标准误的联系和区别,联系都是变异指标。S反映个体观察值的变异;反映统计量的变异。当n不变时,标准差,标准误,t分布,设从正态分布N(,)中随机抽取含量为n的样本,样本均数和标准差分别为和s,设:则t值服从自由度为n-1的t分布(t-distribution)。Gosset于1908年在生物统计杂志上发表该论文时用的是笔名“Student”,故t分布又称Studentt分布。,图3.2自由度分别为1、5、时的t分布,t分布的特征,t分布为一簇单峰分布曲线t分布以0为中心,左右对称t分布与自由度有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高,;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。,t分布的特征,每一自由度下的t分布曲线都有其自身分布规律t分布表明,从正态分布总体中随机抽取的样本,由样本计算的t值接近0的可能性较大,远离0的可能性较小。t0.05,102.228,表明,从正态分布总体中抽取样本含量为n=11的样本,则由该样本计算的t值大于等于2.228的概率为0.025,小于等于-2.228的概率亦为0.025。P(t-2.228)+P(t2.228)0.05或:P(-2.228t2.228)=1-0.05=0.95。,-2.2282.228,
展开阅读全文