资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,Probability Theory and Mathematical Statistics,概率论与数理统计,30 十一月 2024,2,第六章 样本与抽样分布,本章主要内容,1,总体与个体,2,直方图与经验分布函数,3,统计量及其分布,30 十一月 2024,3,1.,定义,1,:,一,个统计问题总有它明确的研究对象,.,一,.,总体与个体,研究某批灯泡的质量,研究对象的全体称为,总体,(,母体,),,,总体中每个成员称为,个体,.,总体,6.1,总体与个体,30 十一月 2024,4,2.,有限总体和无限总体,定义,2,:样本中所包含的个体数目,n,称为,样本容量。,注:,当有限总体包含的个体的总数很大时,可近似地将它看成是无限总体,.,总体容量,有限的成为,有限总体,总体容量,无限的称为,无限总体,6.1,总体与个体,30 十一月 2024,5,然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项,(,或几项,),数量指标,和该数量指标在总体中的,分布情况,.,这时,每个个体具有的数量指标的全体就是总体,.,某批,灯泡的寿命,该批灯泡寿命的全体就是总体,国产轿车每公里,的耗油量,国产轿车每公里耗油量的全体就是总体,6.1,总体与个体,30 十一月 2024,6,由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性,.,从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布,.,这样,,总体就可以用一个随机变量及其分布来描述,.,统称总体,X,。,6.1,总体与个体,注意,30 十一月 2024,7,而,概率分布,正是刻划这种集体性质的适当工具,.,因此在理论上可以把总体与概率分布等同起来,.,统计的任务,是根据从总体中抽取的样本,,,去推断总体的性质,.,由于我们关心的是总体中的个体的某项指标,(,如人的身高、体重,灯泡的寿命,汽车的耗油量,),,,所谓总体的性质,,,无非就是这些指标值的集体的性质,.,6.1,总体与个体,30 十一月 2024,8,例如,:,研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量,X,表示,或用其分布函数,F,(,x,),表示,.,某批,灯泡的寿命,总体,寿命,X,可用一概,率分布来刻划,鉴于此,常用随机变量的记号,或用其分布函数表示总体,.,如,说,总体,X,或总体,F,(,x,),.,F,(,x,),6.1,总体与个体,30 十一月 2024,9,类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用,X,和,Y,分别表示身高和体重,那么此总体就可用二维随机变量,(,X,Y,),或其联合分布函数,F,(,x,y,),来表示,.,统计中,总体这个概念,的要旨是:,总体就是一个,概率分布,.,6.1,总体与个体,30 十一月 2024,10,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为,“,抽样,”,所抽取的部分个体称为,样本,.,样本中所包含的个体数目称为,样本容量,.,二,.,样本,从国产轿车中抽,5,辆进行耗油量试验,样本容量为,5,6.1,总体与个体,30 十一月 2024,11,但是,一旦取定一组样本,得到的是,n,个具体的数,(,x,1,x,2,x,n,),,称为样本的,一次观察值,,简称,样本值,.,样本是随机变量,.,抽到哪,5,辆是随机的,容量为,n,的样本可以看作,n,维随机变量,.,6.1,总体与个体,30 十一月 2024,12,2.,独立性,:,X,1,X,2,X,n,是相互独立的随机变量,.,由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法,.,最常用的一种抽样方法叫作“,简单随机抽样,”,它要求抽取的样本,满足下面两点,:,1.,代表性,:,X,1,X,2,X,n,中每一个与所考察,的总体有相同的分布,.,6.1,总体与个体,30 十一月 2024,13,由简单随机抽样得到的样本称为,简单随机样本,,它可以用与总体独立同分布的,n,个相互独立的随机变量,X,1,X,2,X,n,表示,.,若总体的分布函数为,F,(,x,),,则其简单随机样本的联合分布函数为,三,.,样本的概率分布,6.1,总体与个体,30 十一月 2024,14,今后,若不特别说明,就指简单随机样本,.,若连续总体的概率密度函数为,f,(,x,),,则其样本的联合概率密度函数为,6.1,总体与个体,离散时,概率函数是指分布率,p,(,x,),则其样本的联合分布率为,注意,30 十一月 2024,15,事实上我们抽样后得到的资料都是具体的、确定的值,.,如我们从某班大学生中抽取,10,人测量身高,得到,10,个数,它们是样本取到的值而不是样本,.,我们只能观察到随机变量取的值,.,四,.,总体、样本、样本值的关系,6.1,总体与个体,30 十一月 2024,16,总体(理论分布),?,样本,样本值,统计是从手中已有的资料,-,样本值,去推断总体的情况,-,总体分布,F,(,x,),的性质,.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以,由样本值去推断总体,.,样本是联系二者的桥梁,6.1,总体与个体,30 十一月 2024,17,例,1-1,:,已知总体,X,服从参数为 的泊松分布,求样本的联合分布律,6.1,总体与个体,30 十一月 2024,18,6.1,总体与个体,30 十一月 2024,19,一、直方,图,(自学),当取得一组样本值后,一般先根据样本的取值作出频率直方图对总体的分布情况作一个几何直观上的粗略了解,然后再进行进一步的分析推断直方图是频数分布的图形表示,它的横坐标表示所关心变量的取值区间,纵坐标有三种表示方法:,频数,频率,,最准确的是,频率,/,组距,,它可使得诸长条矩形面积和为,1,。凡此三种直方图的差别仅在于纵轴刻度的选择,直方图本身并无变化。,6.2,直方图与经验分布函,数,30 十一月 2024,20,6.2,直方图与经验分布函数,30 十一月 2024,21,6.2,直方图与经验分布函数,30 十一月 2024,22,6.2,直方图与经验分布函数,30 十一月 2024,23,例,2-1,某工厂用自动包装机包装产品,为了考察每袋产品重量的波动情况,选取,100,袋产品测得其重量如下:,(,单位:,kg),,根据测得的数据作出频率直方图,97.8,94.698.9100.999.8102.797.9 98.7 97.1,95.599.0101.199.6102.997.795.7 99.3 102.1,99.5101.299.9103.198.295.899.1 100.3 98.8,101.3100.0103.898.196.099.0101.4 99.9 98.9,100.198.396.399.2101.5100.2104.5 99.8 100.9,98.596.699.3101.4100.397.898.4,102.2,99.8,96.799.4101.1100.496.999.5,101.0,98.8,102.4,100.198.597.099.1101.2100.2,98.0,100.7,99.7,97.299.2101.6100.298.197.499.0 98.6,100.1,101.6100.498.197.599.4101.8100.5 102.3 100.6,102.0100.298.999.7100.6102.1 100.8 99.6 98.8,100.4,6.2,直方图与经验分布函数,30 十一月 2024,24,6.2,直方图与经验分布函数,30 十一月 2024,25,6.2,直方图与经验分布函数,30 十一月 2024,26,6.2,直方图与经验分布函数,30 十一月 2024,27,二、经验分布函数,6.2,直方图与经验分布函数,30 十一月 2024,28,为由,x,1,x,2,x,n,确定的,经验分布函数,.,定义,6,设,x,1,x,2,x,n,是总体,X,的样本值,称函数,6.2,直方图与经验分布函数,30 十一月 2024,29,经验分布函数与理论分布函数的关系,6.2,直方图与经验分布函数,30 十一月 2024,30,因此,我们可以用,来近似,这也是利用样本来估计和判断总体的基本理论和依据,6.2,直方图与经验分布函数,例,2-2,从某总体中抽取容量为,5,的样本,其观测值依次为,-1.2,,,2.6,,,1.8,,,-0.7,,,1.8,求经验分布函数,并画出的图形,解,将数据由小到大排列得:,-1.2,,,-0.7,,,1.8,,,1.8,,,2.6,30 十一月 2024,31,则经验分布函数为:,6.2,直方图与经验分布函数,30 十一月 2024,32,的图形见下图,6.2,直方图与经验分布函数,30 十一月 2024,33,由样本值去推断总体情况,需要对样本值进行“,加工,”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来,.,一、样本统计量,定义,;,设,x,1,x,2,x,n,为取自某总体的样本,若样本函数,T,=,g,(,x,1,x,2,x,n,),中,不含有任何未知参数,。则称,T,为,统计量,。它是完全由样本决定的量,.,统计量的分布称为抽样分布,。,6.3,统计量及其分布,30 十一月 2024,34,为什么,要引进统计量?为什么统计量中不能含有未知参数?,答,:,引进,统计量的目的是为了将杂乱无序的样本值归结为一个便于进行统计推断和研究分析的形式,集中样本所含信息,使之更易揭示问题实质,从而解决问题。,如果统计量中仍含有未知参数,就无法依靠样本观测值求出未知参数的估计值,因而失去利用统计量估计未知参数的意义,这是违背我们引进统计量的初衷的。,6.3,统计量及其分布,30 十一月 2024,35,6.3,统计量及其分布,30 十一月 2024,36,几个常见统计量,样本均值,样本方差,它反映了总体均值,的信息,它反映了总体方差,的信息,样本标准差,6.3,统计量及其分布,30 十一月 2024,37,样本,k,阶原点矩,样本,k,阶中心矩,k,=1,2,它反映了总体,k,阶矩,的信息,它反映了总体,k,阶,中心矩的信息,6.3,统计量及其分布,30 十一月 2024,38,6.3,统计量及其分布,30 十一月 2024,39,上述,五种统计量可统称为,矩统计量,,简称,样本矩,,他们都是样本的显函数,它们的观测值仍分别称为样本均值、样本方差、样本标准差、样本,k,阶,(,原点,),矩、样本,k,阶中心矩,6.3,统计量及其分布,30 十一月 2024,40,顺序统计量,将样本中的各分量按由小到大的次序排列成,6.3,统计量及其分布,30 十一月 2024,41,二、统计量的分布,统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做统计量的“,抽样分布,”,.,6.3,统计量及其分布,30 十一月 2024,42,抽样分布就是通常的随机变量函数的分布,.,只是强调这一分布是由一个统计量所产生的,.,研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质,.,抽样分布,精确抽样分布,渐近分布,(小样本问题中使用),(大样本问题中使用,),6.3,统计量及其分布,30 十一月 2024,43,记为,分布,1,、,定义,:,设 相互独立,都服从正态,分布,N,(0,1),则称随机变量:,所服从的分布为,自由度为,n,的 分布,.,分布是由正态分布派生出来的一种分布,.,6.3,统计量及其分布,30 十一月 2024,44,卡方分布,是,由英国统计学家,Karl Pearson,(1857-1936),于,1900,年提出来的。,6.3,统计量及其分布,30 十一月 2024,45,自由度,(degree of freedom, df),在数学中是指能够自由取值的随机变量的个数,如有,3,个变量,x,、,y,、,z,,但,x+y+z=18,,因此其自由度等于,2,。在统计学中,自由度指的是计算某一统计量时,取值不受限制的变量个数。通常,df=n-k,。其中,n,为样本含量,,k,为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。自由度通常用于抽样分布中。,6.3,统计量及其分布,30 十一月 2024,46,分布的密度函数为,来定义,.,其中伽玛函数 通过积分,6.3,统计量及其分布,30 十一月 2024,47,该密度函数的图像是一只取非负值的偏态分布,6.3,统计量及其分布,30 十一月 2024,48,性质,1,(,此性质可以推广到多个随机变量的情形,),6.3,统计量及其分布,30 十一月 2024,49,性质,2,证明,事实上,因,,故,6.3,统计量及其分布,30 十一月 2024,50,6.3,统计量及其分布,30 十一月 2024,51,P304,附表,5,= 0.25,0.10,0.05,0.025,0.01,0.005,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,1.323,2.773,4.108,5.385,6.626,7.841,9.037,10.219,11.389,12.549,13.701,14.845,15.984,17.117,18.245,19.369,2.706,4.605,6.251,7.779,9.236,10.645,12.017,13.362,14.684,15.987,17.275,18.549,19.812,20.064,22.307,23.542,3.841,5.991,7.815,9.488,11.071,12.592,14.067,15.507,16.919,18.307,19.675,21.026,22.362,23.685,24.996,26.296,5.024,7.378,9.348,11.143,12.833,14.449,16.013,17.535,19.023,20.483,21.920,23.337,24.736,26.119,27.488,28.845,6.635,9.210,11.345,13.277,15.086,16.812,18.475,20.090,21.666,23.209,24.725,26.217,27.688,29.141,30.578,32.000,7.879,10.597,12.838,14.860,16.750,18.548,20.278,21.955,23.589,25.188,26.757,28.299,29.891,31.319,32.801,34.267,分布表,6.3,统计量及其分布,30 十一月 2024,52,=0.995,0.99,0.975,0.95,0.90,0.75,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,0.010,0.072,0.207,0.412,0.676,0.989,1.344,1.735,2.156,2.603,3.074,3.565,4.075,4.601,5.142,0.020,0.115,0.297,0.554,0.872,1.239,1.646,2.088,2.558,3.053,3.571,4.107,4.660,5.229,5.812,0.001,0.051,0.216,0.484,0.831,1.237,1.690,2.180,2.700,3.247,3.816,4.404,5.009,5.629,6.262,6.908,0.004,0.103,0.352,0.711,1.145,1.635,2.167,2.733,3.325,3.940,4.575,5.226,5.892,6.571,7.261,7.962,0.016,0.211,0.584,1.064,1.610,2.204,2.833,3.490,4.168,4.865,5.578,6.304,7.042,7.790,8.547,9.312,0.102,0.575,1.213,1.923,2.675,3.455,4.255,5.071,5.899,6.737,7.584,8.438,9.299,10.165,11.037,11.912,?,=3.816,P304,附表,5,分布表,6.3,统计量及其分布,30 十一月 2024,53,=0.25,0.10,0.05,0.025,0.01,0.005,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,20.489,21.605,22.718,23.828,24.935,26.039,27.141,28.241,29.339,30.435,31.528,32.620,33.711,34.800,35.887,36.973,24.769,25.989,27.204,28.412,29.615,30.813,32.007,33.196,34.382,35.563,36.741,37.916,39.087,40.256,41.422,42.585,27.587,28.869,30.144,31.410,32.671,33.924,35.172,36.415,37.652,38.885,40.113,41.337,42.557,43.773,44.985,46.194,30.191,31.526,32.852,34.170,35.479,36.781,38.076,39.364,40.646,41.923,43.194,44.461,45.712,46.979,48.232,49.480,33.409,34.805,36.191,37.566,38.932,40.289,41.638,42.980,44.314,45.642,46.963,48.278,49.588,50.892,52.191,53.486,35.718,37.156,38.582,39.997,41.401,42.796,44.181,45.559,46.928,48.290,49.645,50.993,52.336,53.672,55.003,56.328,?=36.741,分布表,6.3,统计量及其分布,P304,附表,5,30 十一月 2024,54,应用中心极限定理可得,若,,,则当,n,充分大时,,若,的分布,近似标准正态分布,.,则,可以求得,,E,(,X,)=,n,D,(,X,)=2,n,若,6.3,统计量及其分布,30 十一月 2024,55,t,的,密度函数为:,记,为,t,t,(,n,).,所服从的分布为,自由度为,n,的,t,分布,.,2,、,t,分布,定义,:,设,X,N,(0,1) ,Y,且,X,与,Y,相互独立,则称变量,),(,2,n,c,6.3,统计量及其分布,30 十一月 2024,56,6.3,统计量及其分布,学生,t-,分布可简称为,t,分布。其推导由威廉,戈塞(,William Sealy Gosset,,,1876.6.13,1937.10.16,)于,1908,年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了,Student,这一笔名。之后,t,检验以及相关理论经由罗纳德,费雪(,Sir Ronald Aylmer Fisher, FRS,,,1890.2.17,1962.7.29,)的工作发扬光大,而正是他将此分布称为学生分布。,(,http,:/, 十一月 2024,57,具有自由度为,n,的,t,分布的随机变,量,t,的,数学期望和方差为,:,E,(,t,)=,0;,D,(,t,)=,n,/ (,n,-2) , (,当,n,2,时,),当,n,充分大时,其图形类似于标准正态分布密度函数的图形,.,t,分布的密度函数关于,x,=0,对称,且,6.3,统计量及其分布,30 十一月 2024,58,当,n,充分大时,其图形类似于标准正态变量概率密度的图形,.,6.3,统计量及其分布,30 十一月 2024,59,性质,1,设,则当,n2,时有,性质,2,设 , 是,t,的分布密度,,则,此性质说明,当 时,,t,分布的极限分布是标准正态分布,。,t,分布,具有下列性质:,6.3,统计量及其分布,30 十一月 2024,60,由分布的对称性知,6.3,统计量及其分布,30 十一月 2024,61,=0.25,0.10,0.05,0.025,0.01,0.005,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,1.0000,0.8165,0.7649,0.7407,0.7267,0.7176,0.7111,0.7064,0.7027,0.6998,0.6974,0.6955,0.6938,0.6924,0.6912,0.6901,3.0777,1.8856,1.6377,1.5332,1.4759,1.4398,1.4149,1.3968,1.3830,1.3722,1.3634,1.3562,1.3502,1.3450,1.3406,1.3368,6.3138,2.9200,2.3534,2.1318,2.0150,1.9432,1.8946,1.8595,1.8331,1.8125,1.7959,1.7823,1.7709,1.7613,1.7531,1.7459,12.7062,4.3027,3.1824,2.7764,2.5706,2.4469,2.3646,2.3060,2.2622,2.2281,2.2010,2.1788,2.1604,2.1448,2.1315,2.1199,31.8207,6.9646,4.5407,3.7469,3.3649,3.1427,2.9980,2.8965,2.8214,2.7638,2.7181,2.6810,2.6503,2.6245,2.6025,2.5835,63.6574,9.9248,5.8409,4.6041,4.0322,3.7074,3.4995,3.3554,3.2498,3.1693,3.1058,3.0545,3.0123,2.9768,2.9467,2.9208,分布表,6.3,统计量及其分布,P303,附表,4,30 十一月 2024,62,P303,附表,4,=0.25,0.10,0.05,0.025,0.01,0.005,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,1.0000,0.8165,0.7649,0.7407,0.7267,0.7176,0.7111,0.7064,0.7027,0.6998,0.6974,0.6955,0.6938,0.6924,0.6912,0.6901,3.0777,1.8856,1.6377,1.5332,1.4759,1.4398,1.4149,1.3968,1.3830,1.3722,1.3634,1.3562,1.3502,1.3450,1.3406,1.3368,6.3138,2.9200,2.3534,2.1318,2.0150,1.9432,1.8946,1.8595,1.8331,1.8125,1.7959,1.7823,1.7709,1.7613,1.7531,1.7459,12.7062,4.3027,3.1824,2.7764,2.5706,2.4469,2.3646,2.3060,2.2622,2.2281,2.2010,2.1788,2.1604,2.1448,2.1315,2.1199,31.8207,6.9646,4.5407,3.7469,3.3649,3.1427,2.9980,2.8965,2.8214,2.7638,2.7181,2.6810,2.6503,2.6245,2.6025,2.5835,63.6574,9.9248,5.8409,4.6041,4.0322,3.7074,3.4995,3.3554,3.2498,3.1693,3.1058,3.0545,3.0123,2.9768,2.9467,2.9208,?=2.1315,分布表,6.3,统计量及其分布,30 十一月 2024,63,由定义可见,,3,、,F,分布,定义,:,设,X,与,Y,相互独立,则称统计量,服从自由度为,n,1,及,n,2,的,F,分布,,,n,1,称为,第一自由度,,,n,2,称为,第二自由度,,记作,F,F,(,n,1,n,2,) .,6.3,统计量及其分布,30 十一月 2024,64,为了彰显英国统计学家費雪对统计的贡献,美国统计学家斯內德克(,George Snedecor,1881-1974,)提出以費雪名字开头的字母,当作,分布的名称。,6.3,统计量及其分布,30 十一月 2024,65,即它的数学期望并不依赖于第一自由度,n,1.,X,的,数学期望,为,:,若,n,2,2,若,X,F,(,n,1,n,2,),,,X,的概率密度为,6.3,统计量及其分布,30 十一月 2024,66,(1),(2),6.3,统计量及其分布,30 十一月 2024,67,6.3,统计量及其分布,30 十一月 2024,68,分布表,6.3,统计量及其分布,n,1,n,2,1,2,3,4,5,6,7,8,9,10,1,161.4,199.5,215.7,224.6,230.2,234.0,236.8,238.9,240.5,241.9,2,18.51,19.00,19.16,19.25,19.30,19.33,19.35,19.37,19.38,19.40,3,10.13,9.55,9.28,9.12,9.01,8.94,8.89,8.85,8.81,8.79,4,7.71,6.94,6.59,6.39,6.26,6.16,6.09,6.04,6.00,5.96,5,6.61,5.79,5.41,5.19,5.05,4.95,4.88,4.82,4.77,4.74,6,5.99,5.14,4.76,4.53,4.39,4.28,4.21,4.15,4.10,4.06,7,5.59,4.74,4.35,4.12,3.97,3.87,3.79,3.73,3.68,3.64,8,5.32,4.46,4.07,3.84,3.69,3.58,3.50,3.44,3.39,3.35,9,5.12,4.26,3.86,3.63,3.48,3.37,3.29,3.23,3.18,3.14,10,4.96,4.10,3.71,3.48,3.33,3.22,3.14,3.07,3.02,2.98,11,4.84,3.98,3.59,3.36,3.20,3.09,3.01,2.95,2.90,2.85,12,4.75,3.89,3.49,3.26,3.11,3.00,2.91,2.85,2.80,2.75,13,4.67,3.81,3.41,3.18,3.03,2.92,2.83,2.77,2.71,2.67,P305,附表,5,30 十一月 2024,69,分布表,6.3,统计量及其分布,n,1,n,2,1,2,3,4,5,6,7,8,9,10,1,161.4,199.5,215.7,224.6,230.2,234.0,236.8,238.9,240.5,241.9,2,18.51,19.00,19.16,19.25,19.30,19.33,19.35,19.37,19.38,19.40,3,10.13,9.55,9.28,9.12,9.01,8.94,8.89,8.85,8.81,8.79,4,7.71,6.94,6.59,6.39,6.26,6.16,6.09,6.04,6.00,5.96,5,6.61,5.79,5.41,5.19,5.05,4.95,4.88,4.82,4.77,4.74,6,5.99,5.14,4.76,4.53,4.39,4.28,4.21,4.15,4.10,4.06,7,5.59,4.74,4.35,4.12,3.97,3.87,3.79,3.73,3.68,3.64,8,5.32,4.46,4.07,3.84,3.69,3.58,3.50,3.44,3.39,3.35,9,5.12,4.26,3.86,3.63,3.48,3.37,3.29,3.23,3.18,3.14,10,4.96,4.10,3.71,3.48,3.33,3.22,3.14,3.07,3.02,2.98,11,4.84,3.98,3.59,3.36,3.20,3.09,3.01,2.95,2.90,2.85,12,4.75,3.89,3.49,3.26,3.11,3.00,2.91,2.85,2.80,2.75,13,4.67,3.81,3.41,3.18,3.03,2.92,2.83,2.77,2.71,2.67,P305,附表,5,30 十一月 2024,70,当,总体为,正态分布,时,教材上给出了几个重要的抽样分布定理,.,这,4,个,抽样分布定理很重要,,要,牢固,掌握。,三,、正,态总体样本均值与方差的分布,6.3,统计量及其分布,30 十一月 2024,71,定理,1 (,样本均值的分布,),设,X,1,X,2,X,n,是取自正态总体,的样本,则有,6.3,统计量及其分布,30 十一月 2024,72,n,取不同值时样本均值 的分布,6.3,统计量及其分布,30 十一月 2024,73,定理,2 (,样本方差的分布,),设,X,1,X,2,X,n,是取自正态总体,的样本,分别为样本均值和样本方差,则有,6.3,统计量及其分布,30 十一月 2024,74,n,取不同值时 的分布,6.3,统计量及其分布,30 十一月 2024,75,定理,3,设,X,1,X,2,X,n,是取自正态总体,的样本,分别为样本均值和样本方差,则有,6.3,统计量及其分布,30 十一月 2024,76,定理,3,证明:,6.3,统计量及其分布,30 十一月 2024,77,定理,4.1,(,两总体样本方差比的分布,),分别是这两个样本的,且,X,与,Y,独立,X,1,X,2,是取自,X,的样本,取自,Y,的样本,分别是这两个样本的样本方差,均值,,则有,Y,1,Y,2,是,样本,6.3,统计量及其分布,30 十一月 2024,78,定理,4.1,的证明:,由定理,2,,,由假设 相互独立,按照,F,分布的定义有,6.3,统计量及其分布,30 十一月 2024,79,定理,4.2,(,两总体样本均值差的分布,),分别是这两个样本的,且,X,与,Y,独立,X,1,X,2,是取自,X,的样本,取自,Y,的样本,分别是这两个样本的样本方差,均值,则有,Y,1,Y,2,是,样本,6.3,统计量及其分布,30 十一月 2024,80,定理,4.2,的证明:由第四章,,6.3,统计量及其分布,30 十一月 2024,81,上面的定理说明了当方差相等时抽样分布服从自由度为,n1+n2-2,的,t,分布。但是,当方差未知且不等时,抽样分布近似服从自由度为,DF,的,t,分布:,6.3,统计量及其分布,30 十一月 2024,82,例,1,设随机变量 和 相互独立,且都服从 ,而 和,为分别来自总体,X,和总体,Y,的样本,试分析下面的统计量服从什么分布?,6.3,统计量及其分布,30 十一月 2024,83,解:由,TH1,,,又,Y,的标准化变量,根据,t,分布的定义有,6.3,统计量及其分布,30 十一月 2024,84,例,2,设 ,试分析下面的随机变量服从什么分布?,解:,6.3,统计量及其分布,30 十一月 2024,85,例,3,设 ,现从两总体中分别抽样,有 ,,。试求概率,的值。,解:根据题意,由定理,4,有,6.3,统计量及其分布,
展开阅读全文