资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,第四章 抽样及抽样分布,1.,抽样及抽样估计的概念,1.1,抽样,即,抽样调查,,是指在总体中选取部分单位组成样本并收集样本单位的数据资料的过程。在抽样中不可能获得全部样本,在实践中则是仅抽取一部分样本或对小的有限总体进行有放回的抽样。,1.2 抽样估计,是在抽样调查的基础上,,利用,样本的数据资料计算,样本指标,,以样本特征值,对总体特征值,做出具有一定可靠程度的,估计和判断,。,2.抽样误差,2.1 抽样误差,2,.2,与抽样误差有关的三个概念,(1)抽样实际误差:,指某一次具体抽样中,样本指标值与总体参数真实值之间的偏差。,(2)抽样平均误差:,是指所有可能的样本指标与总体指标之间的平均差异程度,即,样本估计值的标准差,。,(3)抽样极限/允许误差,:又称,置信区间,,是指一定概率下,抽样误差的可能范围,,说明样本估计量在总体参数周围变动的范围,记作。,抽样误差是指不包括登记性误差和系统性误差在内的随机误差,它衡量了抽样估计的精确度。,3.无偏估计,在统计上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值。,总体标准差,已知,时的平均数的分布,因为从原总体中可抽出很多含量为n的样本,由这些样本算出的平均数有大有小,设有一N=3的近似正态总体,具有变量3,4,5,根据平均数,方差和标准差的计算公式可求的 =4,=0.6667,=0.8165.现以n=2作独立的有放回抽样,总共可得 =,9个样本,其抽样结果列于表:,由表中资料可求出:,样本平均数 的平均数 =36/9=4=,样本方差 的平均数 =6/9=0.6667=,样本标准差 的平均数 =5.6568/9=0.6285,根据上述计算结果可得:,样本平均数是总体平均数的无偏估计值;,样本方差是总体方差的无偏估计值;,样本标准差不是总体标准差的无偏估计值。,4.样本平均数的分布,将上述试验所得的9个样本平均数整理成次数分布表:,样本平均数的分布与其它分布一样,有两个重要参数,一个是样本平均数的平均数,记作,另一个是样本平均数的标准差,记作 ,,由以上抽样试验,可得出样本平均数分布有以下基本性质:,样本平均数分布的平均数等于总体平均数,,样本平均数分布的方差等于总体方差除以样本容量。,实际抽样推断中采用的公式,重复,简单随机抽样:,不重复,简单随机抽样:,其中,为总体方差;,为不重复抽样的修正因子。,5.抽样分布的概念和种类,5.1 概念,精确分布小样本分布:,大多数是在正态,分布总体条件下得到的,但应用不广泛,5.2 种类,渐近分布大样本分布,:样本容量无限增,大时统计量的极限分布,可看作是抽样,分布的一种近似,抽样分布是样本统计量的概率分布,。从一个总体中随机抽取容量相等的样本,根据样本资料计算某一统计量所有可能的概率分布,称为这个统计量的抽样分布。,6.常见的抽样分布,6.1,t分布,前面在计算样本平均数分布概率时,需要总体方差为已知,或者总体方差未知但样本容量较大,用样本方差估计总体方差。但实际研究中,经常遇到总体方差未知且样本容量不大的情况,如果仍用样本方差来估计,此时标准离差 就不正态分布了,,而是服从自由度为 的t分布。,式中 为样本平均数的标准误,为 的估计值。,t分布的密度函数曲线的特点:,t,分布表怎么查,第一,要知道自己的实验的自由度。第二,要确定下自己的,置信度,。比如,置信度,在95%,自由度为6的一组数据,查阅,t分布,表的时候就是查阅=0.05(双侧),n=6的一个数字。,6.2 分布,设 是独立同分布的随机变量,且每个随机变量都服从标准正态分布,即 ,N,(0,1),则随机变量,=的分布称为自由度为 的 分布,,记作:,(),当 时,分布趋近于正态分布,,即 (),N,(n ,2 n )。,定理:,6.3,两个样本方差比的分布F分布,F分布的密度函数曲线的特点:,查F表表中横向为大方差数据的自由度;纵向为小方差数据的自由度(横是处理自由度;纵为误差自由度),将自己计算出来的F值与查表得到的F表值比较,如果F F表 表明两组数据没有显著差异;F F表 表明两组数据存在显著差异,
展开阅读全文