资源描述
Click to edit Master title,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,6-,*,统计学,STATISTICS,(第四版),作者:贾俊平,中国人民大学统计学院,第 6 章 统计量及其抽样分布,作者:中国人民大学统计学院,贾俊平,PowerPoint,统计学,第 6 章 统计量及其抽样分布,6.1 统计量,6.2 关于分布的几个概念,6.3 由正态分布导出的几个重要分布,6.4 样本均值的分布与中心极限定理,6.5 样本比例的抽样分布,6.6 两个样本平均值之差的分布,6.7 关于样本方差的分布,学习目标,了解统计量及其分布的几个概念,了解由正态分布导出的几个重要分布,理解样本均值的分布与中心极限定理,掌握单样本比例和样本方差的抽样分布,6.1,统计量,6.1.1 统计量的概念,6.1.2 常用统计量,6.1.3 次序统计量,6.1.4 充分统计量,统计量,(,statistic,),设X1,X2,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,Xn),不依赖于任何未知参数,那么称函数T(X1,X2,Xn)是一个统计量,样本均值、样本比例、样本方差等都是统计量,统计量是样本的一个函数,统计量是统计推断的根底,次序统计量,一组样本观测值X1,X2,Xn由小到大的排序,X1X2 Xi Xn,后,称X1,X2,Xn为次序统计量,中位数、分位数、四分位数等都是次序统计量,6.2,关于分布的几个概念,6.2.1 抽样分布,6.2.2 渐进分布,6.2.3 随机模拟获得的近似分布,样本统计量的概率分布,是一种理论分布,在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布,随机变量是 样本统计量,样本均值,样本比例,样本方差等,结果来自容量相同的所有可能样本,提供了样本统计量长远而稳定的信息,是进行推断的理论根底,也是抽样推断科学性的重要依据,抽样分布,(,sampling distribution,),6.3,由正态分布导出的几个重要分布,6.3.1,2,分布,6.3.2,t,分布,6.3.3,F,分布,2,分布,由阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson)分别于1875年和1900年推导出来,设 ,那么,令 ,那么 Y 服从自由度为1的2分布,即,当总体 ,从中抽取容量为n的样本,那么,2,分布,(,2,distribution,),分布的变量值始终为正,分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称,期望为:E(2)=n,方差为:D(2)=2n(n为自由度),可加性:假设U和V为两个独立的2分布随机变量,U2(n1),V2(n2),那么U+V这一随机变量服从自由度为n1+n2的2分布,2,分布,(,性质和特点,),c,2,分布,(图示),不同容量样本的抽样分布,c,2,n,=1,n,=4,n,=10,n,=20,t,分布,t,分布,高塞特()于1908年在一篇以“Student(学生)为笔名的论文中首次提出,t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散,一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布,t,分布图示,x,t,分布与标准正态分布的比较,t,分布,标准正态分布,t,不同自由度的,t,分布,标准正态分布,t,(,df,=13),t,(,df,=5),z,F,分布,由统计学家费希尔()提出的,以其姓氏的第一个字母来命名,设假设U为服从自由度为n1的2分布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,那么称F为服从自由度n1和n2的F分布,记为,F,分布,(,F,distribution,),F,分布,(,图示,),不同自由度的,F,分布,F,(1,10),(5,10),(10,10),6.4,样本均值的分布与中心极限定理,在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布,一种理论概率分布,推断总体均值的理论根底,样本均值的抽样分布,样本均值的抽样分布与中心极限定理,=50,=10,X,总体分布,n,=4,抽样分布,x,n,=16,当总体服从正态分布,N,(,2,),时,来自该总体的所有容量为,n,的样本的均值,x,也服从正态分布,,x,的数学期望为,,方差为,2,/,n,。即,x,N,(,2,/,n,),中心极限定理,(,central limit theorem,),当样本容量足够大时(,n,30),样本均值的抽样分布逐渐趋于正态分布,从均值为,,方差为,2,的一个任意总体中抽取容量为,n,的样本,当,n,充分大时,样本均值的抽样分布近似服从均值为,、方差为,2,/,n,的正态分布,一个任意分布的总体,x,中心极限定理,(,central limit theorem,),x,的分布趋于正态分布的过程,6.5,样本比例的抽样分布,总体,(,或样本,),中具有某种属性的单位与全部单位总数之比,不同性别的人与全部人数之比,合格品,(,或不合格品,),与全部产品总数之比,总体比例可表示为,样本比例可表示为,比例,(proportion),在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布,一种理论概率分布,当样本容量很大时,样本比例的抽样分布可用正态分布近似,推断总体比例的理论根底,样本比例的抽样分布,样本比例的数学期望,样本比例的方差,重复抽样,不重复抽样,样本比例的抽样分布,(数学期望与方差),6.6 两个,样本均值之差的抽样分布,两个总体都为正态分布,即 ,,两个样本均值之差 的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差,方差为各自的方差之和,两个样本均值之差的抽样分布,6.7 关于,样本方差的分布,6.7.1 样本方差的分布,6.7.2 两个样本方差比的分布,样本方差的分布,在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布,对于来自正态总体的简单随机样本,那么比值,的抽样分布服从自由度为(n-1)的2分布,即,两个样本方差比的分布,两,个总体都为正态分布,,即,X,1,N,(,1,1,2,),,,X,2,N,(,2,2,2,),从两,个总体中分别抽取容量为,n,1,和,n,2,的独立样本,两,个样本方差比的抽样分布,服从分子自由度为,(,n,1,-1),,,分母自由度为,(,n,2,-1),的,F,分布,即,本章小结,统计量及其分布,由正态分布导出的几个重要分布,样本均值的分布与中心极限定理,样本比例的抽样分布,两个样本平均值之差的分布,关于样本方差的分布,结 束,THANKS,
展开阅读全文