资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,11/7/2009,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,总体,选择个体,样本,观测样本,样本观察值,(数据),数据处理,样本有关结论,推断总体性质,统计量,统计的一般步骤,这种,不含任何未知参数的样本的函数称为统计量,.它是完全由样本决定的量.,总体选择个体样本观测样本样本观察值(数据)数据处理样本有关结,6.2 统计量与抽样分布,6.2.1 统计量,定义6.2,设,X,1,,,X,2,,,X,n,为来自总体,X,的样本,称,不含未知参数的样本的函数,g,(,X,1,,,X,2,,,X,n,),为,统计量,若,x,1,,,x,2,,.,,x,n,为样本观测值,则称,g,(,x,1,,,x,2,,.,,x,n,)为统计量,g,(,X,1,,,X,2,,,X,n,)的观测值.,统计量是处理、分析数据的主要工具对统计量的一个最基本的要求就是可以将样本观测值代入进行计算,因而不能含有任何未知的参数,6.2,统计量与抽样分布,6.2 统计量与抽样分布 6.2 统计量与抽样分布,【例6.4】,设,X,1,,,X,2,,,X,n,是来自总体,X,的样本,,X,N,(,,,2,),其中,、,2,为未知参数,则,X,1,,min,X,1,,,X,2,,,X,n,均为统计量,,但诸如,等均不是统计量,因它含有未知参数,或,常用的统计量有如下几种:,6.2.1,统计量,【例6.4】设X1,X2,Xn是来自总体X的样本,XN,1.有关一维总体的统计量,设,X,1,,,X,2,,,X,n,为总体,X,的样本,,x,1,,,x,2,,.,,x,n,为样本观测值,,(1),样本均值,常用来作为总体期望(均值)的估计量,其观测值为,6.2.1,统计量,1.有关一维总体的统计量 6.2.1 统计量,(2),样本方差,(3),样本标准差,样本方差和样本标准差刻画了样本数据的分散程度,常用来作为总体方差和标准差的估计量.,观测值分别为,6.2.1,统计量,(2)样本方差 6.2.1 统计量,(4),样本,k,阶原点矩(简称样本k阶矩),,(,k,=1,2,),(5),样本,k,阶中心矩,,(,k,=2,3,),显然,A,k,和,B,k,的观测值分别记为,6.2.1,统计量,(4)样本k阶原点矩(简称样本k阶矩)6.2.,设(X,1,X,2,X,n,)是来自总体X的一个样本,则,设(X1,X2,Xn)是来自总体X的一个样本,则,定理6.1,设总体,X,的期望,E,(,X,)=,方差,D,(,X,)=,2,,,X,1,,,X,2,,,X,n,为总体,X,的样本,,S,2,分别为样本均值和样本方差,则,6.2.1,统计量,定理6.1 设总体X的期望E(X)=,方差D(X),由辛钦大数定理和依概率收敛的性质可以证明,定理6.2,设总体,X,的,k,阶原点矩,E,(,X,k,)=,k,存在(,k,=1,2,,m,),,X,1,,,X,2,,,X,n,为总体,X,的样本,,g,(,t,1,,,t,2,,,t,m,)是,m,元连续函数,则,特别有,6.2.1,统计量,由辛钦大数定理和依概率收敛的性质可以证明 6.2.1 统,2.有关二维总体的统计量,设(,X,1,,,Y,1,),(,X,2,,,Y,2,),(,X,n,,,Y,n,)为二维总体(,X,,,Y,)的样本,其观测值为(,x,1,,,y,1,),(,x,2,,,y,2,),(,x,n,,,y,n,),则下列各量为统计量:,(1),样本协方差,(2),样本相关系数,其中,S,XY,和,R,XY,常分别用来作为总体,X,和,Y,的协方差,Cov,(,X,,,Y,)与相关系数,XY,的估计量,6.2.1,统计量,2.有关二维总体的统计量 6.2.1 统计量,6.2 统计量与抽样分布,6.2.2 抽样分布,统计量的分布称为,抽样分布,为了研究抽样分布,先研究数理统计中三种重要的分布,6.2 统计量与抽样分布6.2.2 抽样分布,1.,2,分布,定义6.3,设,X,1,,,X,2,,,X,n,为相互独立的随机变量,它们都服从标准正态,N,(0,1)分布,则称随机变量,服从,自由度,为,n,的,2,分布,,记为,2,2,(,n,),此处自由度指,2,中包含独立变量的个数,可以证明,,2,(,n,)的概率密度为,其中,(,)称为伽马函数,,6.2.2 抽样分布,1.2分布 6.2.2 抽样分布,2,分布概率密度,图6-9,2,(,n,)分布的概率密度曲线,可以看出,随着,n,的增大,的图形趋于“平缓”,其图形下区域的重心亦逐渐往右下移动,6.2.2 抽样分布,2分布概率密度 6.2.2 抽样分布,2,分布具有下面性质:,(1)(可加性)设 是两个相互独立的随机变量,且,(2)设,证明,(1)由,2,分布的定义易得证明,(2)因为 存在相互独立、同分布于,N,(0,1)的随机变量,X,1,,,X,2,,,X,n,,使,则,6.2.2 抽样分布,2分布具有下面性质:6.2.2 抽样分布,由于,X,i,独立,且注意到,N,(0,1)的四阶矩为3,可得,英国统计学家费歇(R.A.Fisher)曾证明,当,n,较大时,近似服从,6.2.2 抽样分布,由于Xi独立,且注意到N(0,1)的四阶矩为3,可得 6.2,2.,t,分布,定义6.4,设,X,N,(0,1),,Y,2,(,n,),,X,与,Y,独立,则称随机变量 服从自由度为的,t,分布,,又称为学生氏分布(Student distribution),,记为,T,t,(,n,),可以证明,t,(,n,)的概率密度为,图6-10,t,分布的概率密度曲线,6.2.2 抽样分布,2.t分布 6.2.2 抽样分布,图6-10,t,分布的概率密度曲线,显然,t,分布的概率密度,是,x,的偶函数,图6-10描绘了,n,=1,3,7时,t,(,n,)的概率密度曲线作为比较,还描绘了,N,(0,1)的概率密度曲线,6.2.2 抽样分布,6.2.2 抽样分布,可看出,随着n的增大,,t,(,n,)的概率密度曲线与,N,(0,1)的概率密度曲线越来,越接近,可以证明,t,分布具有下面性质:,即当,n,趋向无穷时,t,(,n,)近似于标准正态分布,N,(0,1),一般地,若,n,30,就可认为,t,(,n,)基本与,N,(0,1)相差无几了,6.2.2 抽样分布,可看出,随着n的增大,t(n)的概率密度曲线与 6.2.2,3.F分布,定义6.5,设,X,2,(,n,1,),,Y,2,(,n,2,),且,X,与,Y,独立,称随机变量 服从自由度为(,n,1,,,n,2,)的,F,分布,,记为,F,F,(,n,1,,,n,2,),可以证明的概率密度函数为,6.2.2 抽样分布,3.F分布 6.2.2 抽样分布,6.2.2,抽样分布,图6-11,F,分布的概率密度曲线,由,F,分布的定义,容易看出,若,F,F,(,n,1,,,n,2,),则1/,F,F,(,n,2,,,n,1,),6.2.2 抽样分布,4.正态总体的抽样分布定理,在数理统计问题中,正态分布占据着十分重要的位置,一方面因为在应用中,许多随机变量的分布或者是正态分布,或者接近于正态分布;另一方面,正态分布有许多优良性质,便于进行较深入的理论研究因此,我们着重讨论正态总体下的抽样分布,给出有关最重要的统计量样本均值和样本方差,S,2,的抽样分布定理,6.2.2,抽样分布,4.正态总体的抽样分布定理 6.2.2 抽样分布,定理6.3,设,X,1,,,X,2,,,X,n,为来自总体,N,(,,,2,)的样本,,S,2,分别为样本均值和样本方差,则有,(1),(2),(3)与,S,2,相互独立;,(4),证明:,由正态分布的性质容易得到(1),略去(2)和(3)的证明,下面仅证明4.,6.2.2,抽样分布,定理6.3 设X1,X2,Xn为来自总体N(,2,证明(4):,由(1)知 ,从而,由(2)(3)知,根据,t,分布的定义,6.2.2,抽样分布,【例6.5】,某厂生产的灯泡寿命近似服从正态分布,N,(800,40,2,),抽取16个灯泡的样本,求平均寿命小于775小时的概率.,解:,设灯泡寿命总体为,X,,,因为,X,N,(800,40,2,),n,=16,所以样本均值,故,6.2.2,抽样分布,【例6.5】某厂生产的灯泡寿命近似服从正态分布N(800,4,【例6.6】,设总体,X,N,(,,10,2,),抽取容量为,n,的样本,样本均值记为 欲使 与 的偏差小于5的概率大于0.95,样本容量,n,至少应该取多大?,解:,依题令 ,即,因为总体 ,从而,所以,即,查表知 ,由于 单调不减,应有,故,n,至少应该取为16,6.2.2,抽样分布,【例6.6】设总体XN(,102),抽取容量为n的样本,,【例6.7】,设,X,1,,,X,2,,,X,n,为总体,X,N,(,,,2,)的样本,求样本方差,的均值和方差,解:,本题可以通过,2,分布的均值和方差简单求出由定理6.3,所以有,于是,6.2.2,抽样分布,【例6.7】设X1,X2,Xn为总体X N(,,6.2.3 分位数,设,X,为一随机变量,我们知道对于给定的实数,x,,,P,X,x,是事件,X,x,的概率在统计中,我们常常需要对给定事件,X,x,的概率,由此确定的,x,取是一个临界点,称为分位数(点),有如下定义:,定义6.6,设,X,为随机变量,若对给定的,(0,1),存在,x,满足,P,X,x,=,,,则称,x,为,X,的,上,分位数(点),6.2 统计量与抽样分布,6.2.3 分位数 6.2 统计量与抽样分布,若,X,具有密度,f,(,x,),,P,X,x,=,说明分位数,x,右边的一块阴影面积为,,,即,容易看出,,X,的上,分位数,x,是,关于,的减函数,即,增大时,x,减少.,下面给出几种常用分布的上,分位数的求法:,6.2.3 分位数,若X具有密度f(x),6.2.3 分位数,1.设,Z,N,(0,1),记,N,(0,1)的上,分位数为,z,,即有,P,Z,z,=,.,由于,(,z,)=,P,Z,z,=1,P,Z,z,=1,,,由标准正态分布函数表(附表2)反过来查,即可以得到,z,的值.,为使用方便,表6-1列出了标准正态分布的几个常用分位数,z,的值,表6-1 常用的标准正态分布的分位数,0.001,0.005,0.01,0.025,0.05,0.10,z,3.090,2.576,2.326,1.960,1.645,1.282,6.2.3 分位数,1.设Z N(0,1),记N(0,1)的上分位数为z,由,N,(0,1)的概率密度的对称性(见图6-13)可知,所以,z,1-,=,z,图6-13,z,1-,与,z,6.2.3 分位数,由N(0,1)的概率密度的对称性(见图6-13)可知 6.2,2.设,2,2,(,n,),记,2,(,n,)的上,分位数为,2,(,n,),即有,P,2,2,(,n,)=,.,附表3中给出了时,2,(,n,)的值,当,n,40时,由,2,(,n,)的渐近性质,有,6.2.3 分位数,2.设2 2(n),记2(n)的上分位数为,3.设,T,t,(,n,),记,t,(,n,)的上,分位数为,t,(,n,),即有,P,T,t,(,n,)=,;,由,t,(,n,)的概率密度的对称性,t,1-,(,n,)=,t,(,n,),图6-14,t,1-,(,n,)与,t,(,n,),附表4中给出了 时,t,(,n,)的值,当,n,40 时,由于,t,(,n,)近似,N,(0,1),所以,t,(,n,),z,6.2.3 分位数,3.设T t(n),记t(n)的上分位数为t(n),
展开阅读全文