资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,Click to edit Master title,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,6-,1,本资料来源,第,6,章 统计量及其抽样分布,6.1,统计量,6.2,关于分布的几个概念,6.3,由正态分布导出的几个重要分布,6.4,样本均值的分布与中心极限定理,6.5,样本比例的抽样分布,学习目标,了解统计量及其分布的几个概念,了解由正态分布导出的几个重要分布,理解样本均值的分布与中心极限定理,掌握样本比例的抽样分布,6.1,统计量,6.1.1,统计量的概念,6.1.2,常用统计量,6.1.3,次序统计量,6.1.4,充分统计量,统计量,(,statistic,),设,X,1,X,2,X,n,是从总体,X,中抽取的容量为,n,的一个样本,如果由此样本构造一个函数,T,(,X,1,X,2,X,n,),,不依赖于任何未知参数,则称函数,T,(,X,1,X,2,X,n,),是一个统计量,,其作用是把样本中有关总体的信息汇集起来。,样本均值、样本比例、样本方差等都是统计量,统计量是样本的一个函数,统计量是统计推断的基础,常用统计量,样本均值、样本方差、样本变异系数等,矩,:在统计学中,矩是指以期望值为基础而定义的数字特征。矩可以分为原点矩和中心距两种。,样本均值为一阶原点矩;,样本方差为二阶中心距。,次序统计量(顺序统计量),一,组样本观测值,X,1,X,2,X,n,由小到大的排序,X,(,1,),X,(,2,),X,(,i,),X,(,n,),后,称,X,(,1,),,,X,(,2,),,,,,X,(,n,),为次序统计量,中位数、分位数、四分位数等都是次序统计量,充分统计量,定义:统计量加工过程中一点信息都不损失的统计量通常称为充分统计量,例:,P159,6.2,关于分布的几个概念,6.2.1,总体分布,6.2.2,样本分布,6.2.3,抽样分布,6.2.4,渐进分布,6.2.5,随机模拟获得的近似分布,总体:是我们所关心的若干个元素(个体)的集合。总体中每个元素的取值是不同的,这些观察值所形成的分布就是总体分布。,总体分布,:总体中各元素的观察值所形成的相对频数分布,称为总体分布。,总体分布,(,population distribution,),总体:是我,们,们所关心的,若,若干个元素,(,(个体)的,集,集合。总体,中,中每个元素,的,的取值是不,同,同的,这些,观,观察值所形,成,成的分布就,是,是总体分布,。,。,总体分布:总体中各,元,元素的观察,值,值所形成的,相,相对频数分,布,布,称为总,体,体分布。,总体分布,(,populationdistribution,),样本,:,是从总体中,所,所抽取的部,分,分元素的集,合,合,样本分布:从总体中,抽,抽取一个容,量,量为,n,的样本,由,这,这,n,个观察值形,成,成的相对频,数,数分布,称,为,为样本分布,。,。,注意,:样本来自,总,总体,其中,包,包含着总体,的,的一些信息,和,和特征,因,此,此样本分布,也,也称为经验,分,分布。注意,与,与抽样分布,是,是不同的概,念,念。,样本分布,(,sample distribution,),抽样分布:,某,某个样本统,计,计量的抽样,分,分布,从理,论,论上说就是,在,在重复选取,容,容量为,n,的样本时,,由,由该统计量,的,的所有可能,取,取值形成的,相,相对频数分,布,布。,从一般意义,上,上,抽样分,布,布就是指样,本,本统计量的,概,概率分布。,例,例如,样本,均,均值的分布,、,、样本比例,的,的分布、样,本,本方差的分,布,布等都称为,抽,抽样分布。,下,下面重点介,绍,绍样本均值,的,的抽样分布,。,。,抽样分布,(,sampling distribution,),渐近分布,P160,近似分布,P160,(,了解,),6.3,由正态分布,导,导出的几个,重,重要分布,6.3.1,2,分布,6.3.2,t,分布,6.3.3,F,分布,2,分布,由阿贝,(,Abbe,),于,1863,年首先给出,,,,后来由海,尔,尔墨特,(,Hermert,),和卡,皮尔逊,(,KPearson,),分别于,1875,年和,1900,年推导出来,设,,,,,则,则,令,,,,,则,则,Y,服从自由度,为,为,1,的,2,分布,即,当总体,,,,从中,抽,抽取容量为,n,的样本,则,2,分布,(,2,distribution,),分布的变量,值,值始终为正,分布的形状,取,取决于其自,由,由度,n,的大小,通,常,常为不对称,的,的正偏分布,,,,但随着自,由,由度的增大,逐,逐渐趋于对,称,称,期望为:,E,(,2,)=,n,,方差为:,D,(,2,)=2,n,(,n,为自由度,),可加性:若,U,和,V,为两个独立,的,的,2,分布随机变,量,量,,U,2,(n,1,),,,V,2,(,n,2,),则,U,+,V,这一随机变,量,量服从自由,度,度为,n,1,+,n,2,的,2,分布,2,分布,(,性质和特点,),c,2,分布,(,图示,),不同容量样本的抽样分布,c,2,n,=1,n,=4,n,=10,n,=20,t,分布,t,分布,高塞特,(W.S.Gosset),于,1908,年在一篇以,“,“,Student”(,学生,),为笔名的论,文,文中首次提,出,出,t,分布是类似,正,正态分布的,一,一种对称分,布,布,它通常,要,要比正态分,布,布平坦和分,散,散,一个特定的,分,分布依赖于,称,称之为自由,度,度的参数。,随,随着自由度,的,的增大,分,布,布也逐渐趋,于,于正态分布,t,分布图示,x,t,分布与标准正态分布的比较,t,分布,标准正态分布,t,不同自由度的,t,分布,标准正态分布,t,(,df,=13),t,(,df,=5),z,F,分布,由统计学家,费,费希尔,(,R.A.Fisher,),提出,的,的,,以,以其,姓,姓氏,的,的第,一,一个,字,字母,来,来命,名,名,设若,U,为服,从,从自,由,由度,为,为,n,1,的,2,分布,,,,即,U,2,(,n,1,),,,V,为服,从,从自,由,由度,为,为,n,2,的,2,分布,,,,即,V,2,(,n,2,),且,U,和,V,相互,独,独立,,,,则,称,称,F,为服,从,从自,由,由度,n,1,和,n,2,的,F,分布,,,,记,为,为,F,分布,(,F,distribution,),F,分布,(,图示,),不同,自,自由,度,度的,F,分布,F,(,1,10),(5,10),(10,10),6.4,样本,均,均值,的,的分,布,布与,中,中心,极,极限,定,定理,在重,复,复选,取,取容,量,量为,n,的样,本,本时,,,,由,样,样本,均,均值,的,的所,有,有可,能,能取,值,值形,成,成的,相,相对,频,频数,分,分布,一种,理,理论,概,概率,分,分布,推断,总,总体,均,均值,的理,论,论基,础,础,样本,均,均值,的,的抽,样,样分,布,布,样本,均,均值,的,的抽,样,样分,布,布,(,例题,分,分析,),【,例,】,设一,个,个总,体,体,,含有,4,个元,素,素,(,个体,),,即,总,总体,单,单位,数,数,N,=,4,。,4,个个,体,体分,别,别为,x,1,=1,,,x,2,=2,,,x,3,=3,,,x,4,=4,。总,体,体的,均,均值,、,、方,差,差及,分,分布,如,如下,总体分布,1,4,2,3,0,.1,.2,.3,均值,和,和方,差,差,样本,均,均值,的,的抽,样,样分,布,布,(,例题,分,分析,),现从,总,总体,中,中抽,取,取,n,2,的简,单,单随,机,机样,本,本,,在,在重,复,复抽,样,样条,件,件下,,,,共,有,有,4,2,=16,个样,本,本。,所,所有,样,样本,的,的结,果,果为,3,4,3,3,3,2,3,1,3,2,4,2,3,2,2,2,1,2,4,4,4,3,4,2,4,1,4,1,4,4,1,3,3,2,1,1,2,1,1,1,第二个观察值,第一个,观察值,所有可能的,n,=2,的样本(共,16,个),样本,均,均值,的,的抽,样,样分,布,布,(,例题,分,分析,),计算,出,出各,样,样本,的,的均,值,值,,如,如下,表,表。,并,并给,出,出样,本,本均,值,值的,抽,抽样,分,分布,3.5,3.0,2.5,2.0,3,3.0,2.5,2.0,1.5,2,4.0,3.5,3.0,2.5,4,2.5,4,2.0,3,2,1,1.5,1.0,1,第二个观察值,第一个,观察值,16,个样本的均值(,x,),x,样本均值的抽样分布,1.0,0,0.1,0.2,0.3,P,(,x,),1.5,3.0,4.0,3.5,2.0,2.5,样本,均,均值,的,的分,布,布与,总,总体,分,分布,的,的比,较,较,(,例题,分,分析,),=2.5,2,=1.25,总体,分,分布,1,4,2,3,0,.1,.2,.3,抽样分布,P,(,x,),1.0,0,.1,.2,.3,1.5,3.0,4.0,3.5,2.0,2.5,x,样本,均,均值,的,的抽,样,样分,布,布,与,与中,心,心极,限,限定,理,理,=50,=10,X,总体分布,n,=4,抽样分布,x,n,=16,当总,体,体服,从,从正,态,态分,布,布,N,(,2,),时,,来,来自,该,该总,体,体的,所,所有,容,容量,为,为,n,的样,本,本的,均,均值,x,也服,从,从正,态,态分,布,布,,x,的数,学,学期,望,望为,,方,差,差为,2,/,n,。即,x,N,(,2,/,n,),中心,极,极限,定,定理,(,centrallimittheorem,),当样本容量足够大时,(,n,30),,样本均值的抽样分布逐渐趋于正态分布,中心,极,极限,定,定理,:,:设,从,从均,值,值为,,方,差,差为,2,的一,个,个任,意,意总,体,体中,抽,抽取,容,容量,为,为,n,的样,本,本,,当,当,n,充分,大,大时,,,,样,本,本均,值,值的,抽,抽样,分,分布,近,近似,服,服从,均,均值,为,为,、方,差,差为,2,/,n,的正,态,态分,布,布,一个任意分布的总体,x,中心,极,极限,定,定理,(,centrallimittheorem,),x,的分,布,布趋,于,于正,态,态分,布,布的,过,过程,抽样,分,分布,与,与总,体,体分,布,布的,关,关系,总体分布,正态分布,非正态分布,大样本,小样本,正态分布,正态分布,非正态分布,样本,样本,均,均值,的,的抽,样,样分,布,布,(,数学,期,期望,与,与方,差,差,),样本,均,均值,的,的数,学,学期,望,望,样本,均,均值,的,的方,差,差,重复,抽,抽样,不重,复,复抽,样,样,样本,均,均值,的,的抽,样,样分,布,布,(,数学,期,期望,与,与方,差,差,),比较,及,及结,论,论:,1.,样本,均,均值,的,的均,值,值,(,数学,期,期望,),等于,总,总体,均,均值,2.,样本,均,均值,的,的方,差,差等,于,于总,体,体方,差,差的,1/,n,均值,的,的抽,样,样标,准,准误,差,差,所有,可,可能,的,的样,本,本均,值,值的,标,标准,差,差,,测,测度,所,所有,样,样本,均,均值,的,的离,散,散程,度,度,也称,标,标准,误,误差,小于,总,总体,标,标准,差,差,计算,公,公式,为,为,样本,比,比例,的,的抽,样,样分,布
展开阅读全文