随机变量的数字特征教学课件

资源描述

第三章第三章随机变量的数字特征随机变量的数字特征v在前面关于随机变量及其分布的讨论中，我们较仔细地讨论了随机变量的概率分布，我们看到随机变量的概率分布(分布函数或分布列和概率密度)是随机变量的概率性质最完整的刻划，是能够完整地描述随机变量的统计规律的.v但是在许多实际问题中，求概率分布不是一件容易的事；另一方面，有时不需要知道随机变量的概率分布，而只需要知道它的某一方面的性质.1v例如，考察某种大批生产的元件的寿命，如果知道了它的概率分布，就可以知道寿命在任一指定的界限内的元件的百分率有多少，这对该种元件的寿命状况提供了一幅完整的图景.v下面我们将看到，根据这一分布我们可以算出元件的平均寿命值m，这个数m虽然不能对元件的寿命状况提供一个完整的刻划，但却在一个重要方面，且往往是人们最为关心的一个方面，刻划了元件寿命的状况，因而在应用上有极重要的意义.v类似的情况很多，比如我们在了解某一个行业的经济状况时，我们首先关心的恐怕会是其平均收入，这给了我们一个总的印象；至于收入的分布状况，除非为了特殊的研究目的，倒反而不一定是最重要的了.2v另一类重要的数字特征，是衡量一个随机变量(或其分布)取值的散布程度.v例如，两个行业工人的平均收入大体相近，但一个行业中工人收入的分配较平均，即大多数工人的收入都在平均值上下不远处，其“散布”小；另一个行业则相反，其收入远离平均值者很多，“散布”较大，这二者的实际意义当然很不同.v又如生产同一种产品的两个工厂，各自的产品平均说来都能达到规格要求，但一个工厂的波动小，较为稳定，另一个工厂则波动大，有时质量超标准，有时则低于标准不少，这二者的实际后果当然也不同.3v上面提到的平均值和散布程度，是刻划随机变量性质的两类最重要的数字特征.v对于多维随机变量而言，则还有一类刻划各分量之间的关系的数字特征.v在本章中，我们将要介绍的数字特征有：数学期望、方差、协方差、相关系数和矩.4v引例考试的平均成绩问题v假设有n名同学参加了某种考试，考试后的成绩是：第一个同学得了a1分，第二个同学得了a2分，第n个同学得了an分，那么他们这种考试的平均成绩5v引例考试的平均成绩问题v假设有n名同学参加了某种考试，考试后的成绩是：第一个同学得了a1分，第二个同学得了a2分，第n个同学得了an分.v将他们的成绩进行了汇总，发觉得x1分的人有n1个，得x2分的人有n2个，得xk分的人有nk个，其中n1+n2+nk=n，那么他们这种考试的平均成绩67第三章第三章随机变量的数字特征随机变量的数字特征v3 3.1.1 随机变量的数学期望随机变量的数学期望 v3.1.13.1.1 离散型随机变量的数学期望离散型随机变量的数学期望 8v定定义3.13.1 设离散型随机变量X的分布列为P(X=xk)=pk，k=1,2,若级数v绝对收敛，即 v则称该级数为离散型随机变量X的数学期望数学期望或均值均值，记为EX或E(X)，即9v当 v发散时，则称X的数学期望不存在.v定义中的绝对收敛条件是为了保证式v不受求和的次序的改变而影响其和的值.10v如果把x1,x2,xk,看成是x轴上质点的坐标，而把p1,p2,pk,看成是相应质点的质量，质量总和为 v则式 v表示质点系的重心坐标.11v常用的离散型随机变量的数学期望 v例例1 1(0101分布分布)设随机变量X的分布列为X01P1ppv求EX.v解解 EX=0(1p)+1p=p.12v由前面可知，事件A的示性函数IA服从01分布：IA01P1P(A)P(A)v故EIA=P(A)，即任意事件的概率等于它的示性函数的数学期望.13v例例2 2(二二项分布分布)设随机变量X的分布列为 v求EX.v解解141516v例例3 3(泊松泊松分布分布)设随机变量X的分布列为 v求EX.v解解17v由此看出，泊松分布的参数就是相应随机变量X的数学期望.18第三章第三章随机变量的数字特征随机变量的数字特征v3 3.1.1 随机变量的数学期望随机变量的数学期望 v3.1.23.1.2 连续型随机变量的数学期望连续型随机变量的数学期望 v对以f(x)为概率密度的连续型随机变量X而言，值x和f(x)dx分别相当于离散型随机变量情况下的“xk”和“pk”，故由离散型随机变量的数学期望的定义可知，连续型随机变量的数学期望可定义如下：19v定定义3.23.2 设连续型随机变量X的概率密度为f(x)，若积分v绝对收敛，即 v则称该广义积分为连续型随机变量X的数学期望数学期望或均值均值，记为EX或E(X)，即20vEX的物理意义可理解为以f(x)为质量密度的一维连续质点系的重心坐标.21v常用的连续型随机变量的数学期望 v例例4 4(均匀均匀分布分布)设连续型随机变量X的概率密度为v求EX.22v解解v这个结果是可以预料的，因为X在 a,b 上服从均匀分布，它取值的平均值当然应该是 a,b 的中点.23v例例5 5(指数分布指数分布)设连续型随机变量X的概率密度为v其中是正常数，求EX.24v解解25v例例6 6(正态正态分布分布)设连续型随机变量XN(,2)，求EX.v解解 EX=.v正态分布中的参数，表示相应随机变量X的数学期望.262728v例例7 7(柯西柯西分布分布)设连续型随机变量X的概率密度为v求EX.v解解由于 v故X的数学期望不存在.29第三章第三章随机变量的数字特征随机变量的数字特征v3 3.1.1 随机变量的数学期望随机变量的数学期望 v3.1.33.1.3 随机变量函数的数学期望随机变量函数的数学期望 30v3.1.33.1.3 随机变量函数的数学期望随机变量函数的数学期望v关于一维随机变量函数的数学期望，有下面的定理 v定理定理3.13.1 设Y=g(X)，g(x)是连续函数.v()若X是离散型随机变量，分布列为P(X=xk)=pk，k=1,2,，且 v则有 31v()若X是连续型的随机变量，概率密度为fX(x)，且 v则有 v根据上面的这个定理5.1可知，当求Y=g(X)的数学期望时，不必知道Y的分布，只需知道X的分布就可以了.32v例例8 8 设随机变量X的概率密度为 v求E(sinX).v当然，我们可以先求出Y=sinX的概率密度fY(y)，再由连续型随机变量的数学期望的定义求出 E(sinX).v不过，这样计算要麻烦得多.33v解解 34v例例9 9 设在国际市场上每年对我国某种出口商品的需求量是随机变量X(单位为吨)，它在 2000,4000 上服从均匀分布的，又设每售出这种商品一吨，可为国家挣得外汇3万元，但假如销售不出去而囤积于仓库，则每吨需要浪费保养费1万元，问需要组织多少货源，才能使国家的收益最大.v解解设y为预备出口的该种商品的数量，由已知条件X在 2000,4000 上服从均匀分布可知，这个数量y可以只考虑介于2000与4000之间的情况.v用Z表示国家的收益(单位为万元)，则由题设可得 35v下面求EZ，并求使EZ达到最大的y值.36v故当y=3500时，EZ达到最大值8250.因此，组织3500吨这种商品是最佳的决策.37v定理3.1还可以推广到二维及二维以上的随机变量函数的情况.以二维随机变量函数Z=g(X,Y)为例，有下面的定理.v定理定理3.23.2 设Z=g(X,Y)，g(x,y)是连续函数v()若(X,Y)是二维离散型随机变量，分布列为pij=P(X=xi,Y=yj)，i,j=1,2,v且 v则有 38v()若(X,Y)是二维连续型随机变量，概率密度为f(x,y)，且 v则有 39v从式v可以得到由(X,Y)的概率密度f(x,y)求X与Y的数学期望的公式：40v例例10 10 设随机变量X、Y相互独立，且都服从N(0,2)分布，求 v解解由二维随机变量函数的数学期望的公式，有 4142434445v例例10 10 设(X,Y)在区域A上服从均匀分布，其中A为x轴、y轴和直线x+y+1=0所围城的区域(图5.1)，求EX，E(3X+2Y)，E(XY).xyOx+y+1=0A图5.146v解解(X,Y)的概率密度为v于是 474849v3.1.43.1.4 随机变量的数学期望的性质随机变量的数学期望的性质 v()EC=C，C为常数；v()E(CX)=CEX，C为常数；v()E(X1+X2+Xn)=EX1+EX2+EXn；v()若X1,X2,Xn相互独立，则E(X1X2Xn)=EX1EX2EXn.v在上面的性质中，均假设数学期望是存在的.v证()将C看成一个离散型随机变量，有分布列P(C=C)=1.于是EC=CP(C=C)=C1=C.50v()设X为连续型随机变量，概率密度为f(x).令Y=g(X)=CEXv则由上面的定理5.1得 v故E(CX)=CEX.v离散型随机变量的情况，可类似证明.51v()对n=2的情况给出证明，一般的情况不难用数学归纳法推得.v先考虑连续型随机变量的情况v设(X,Y)是二维连续型随机变量，概率密度为f(x,y)，则由上面的定理5.2立即可得 52v下面考虑离散型随机变量的情况v设(X,Y)是二维离散型随机变量，分布列为 pij=P(X=xi,Y=yj)，i,j=1,2,v则由上面的定理5.2立即可得 53v()对两个连续型随机变量的情况给出证明，离散型随机变量的情况，可类似证明；一般的情况不难用数学归纳法推得.v设X，Y是两个连续型随机变量，概率密度分别fX(x)和fY(y)，于是由X与Y相互独立得(X,Y)的概率密度f(x,y)可由fX(x)和fY(y)的乘积来表达，从而54v例例1212 设XB(n,p)，求EX.v解解在前面的例2中，我们已经直接用数学期望的定义求得了EX=np.现在利用数学期望的的性质()来作.v设在n重伯努利试验中，成功的次数为Y，而在每次试验成功的概率为p，则Y与X有相同的分布，从而有相同的数学期望.v若设Xi表示在第i次试验成功的次数，i=1,2,n，则Xi的分布列为 Xi01P1pp55v且 v由Xi的分布列得，EXi=p，于是由数学期望的的性质()得到 v与例2的作法比较可见，本例的作法要简单得多.56v例例1313 设r个人在楼的底层进入电梯，楼上有n层，每个乘客在楼的任一层下电梯的概率是相同的.如果到楼的某一层无乘客下电梯，电梯就不停车，求直到乘客都下完时电梯停车的次数X的数学期望.v解解设Xi表示在第i层电梯停车的次数，i=1,2,n，则 v易见 57v下面求Xi的分布列(i=1,2,n)v由于每个人在楼的任一层下电梯的概率均为1/n，故他不在楼的某一层下电梯的概率均为v故r个人同时不在第i层下电梯的概率为 v即 58v从而 v于是 59v因此 v在这个例子中，若r=10，n=10，则EX=6.5，即电梯平均停车6.5次.v在上面的例子中，把一个比较复杂的随机变量X拆成n个比较简单的随机变量Xi的和，然后通过这些比较简单的随机变量的数学期望，根据数学期望的性质()求得了X的数学期望，这样的方法是概率论中常采用的方法.60v例例同时掷四颗匀质的骰子，求所得点数之和的数学期望？v解解设X表示四颗骰子的点数之和，则X是一个离散型的随机变量，它的取值是4,5,24.v设Xi表示第i颗骰子的点数，i=1,2,3,4,，则 61v例例1313 设N个人进行验血，有两种方案：v(1)对每个人的血液逐个化验，共需进行N次化验；v(2)将采集的每个人的血液分成两份，按k个人一组混合后进行化验(设N为k的倍数)，若呈阴性反应，则认为k个人的血都是阴性反应；如果混合后血液呈阳性反应，则需要对k个人的另一份血液逐个进行化验，这时k个人的血总共要化验k+1次.v假设所有人的血液呈阳性反应的概率都是p，且各次的化验结果是相互独立的，试说明适当选取k可使第二个方案减少化验次数.v解解设X表示第二个方案下的总化验次数 62v解解设X表示第二个方案下的总化验次数，Xi为第i个分组的化验次数(i=1,2,N/k)，则vEX表示第二个方案下的总的平均化验次数，EXi表示第i个分组的平均化验次数(i=1,2,N/k).v下面先求EXi.v按照第二个方案的规定，Xi可能取两个值：混合血液呈阴性时，Xi=1；血液呈阳性，Xi=k+1.63v因为“Xi=1”表示“组内k个人的血都是阴性”这个事件，又由于各次的化验结果是相互独立的，所以 v于是 64v因此 v这就是第二个方案下的总的平均化验次数，由此可知，只要选k使 v即 65v就可以使第二个方案减少化验次数.v当q已知时，若选k使 v取最小值，就可以使化验次数最少.v例如，当q=0.9时，可以证明，选k=4可以使f(k)最小，这时 v故当q=0.9，k=4时，第二个方案的化验次数比第一个方案平均减少40%.66v例例设XN(4,9)，YU 0,4，Z=2XY5，求EZ?v解解 EZ=E(2XY5)=2EXY5.v若X,Y相互独立，则EZ=E(2XY5)=2EXY5=2EXEY5.v由于XN(4,9)，YU 0,4，故EZ=E(2XY5)=2EXY5=2EXEY5=11.67v引例考试的平均成绩问题yOEXEYx68第三章第三章随机变量的数字特征随机变量的数字特征v3 3.2.2 方差方差 v3.2.13.2.1 方差的概念方差的概念 v数学期望反映了随机变量的平均值，它是一个很重要的数字特征.但是，在某些场合下只知道平均值是不够的.v例如研究灯泡的质量时，人们不仅要知道灯泡寿命X的平均值EX的大小，而且还要知道这些灯泡的寿命X离开EX的平均偏离程度如何.69v如果平均偏离较小，那么说明这批灯泡的寿命大部分接近它的均值，这也说明灯泡厂的生产是稳定的；这时，如果EX比较大，那么灯泡的质量就是比较好的.相反，如果X离开EX的平均偏离较大，那么即使均值较大，生产质量也是有问题的.v再如在打靶比赛中，不但要求射击准确，而且还要求稳定.如果某射手射击10次，虽然有7次正中靶心，但是另外3次却打歪了，弹孔离靶心很远，甚至子弹射到了靶外打伤了人，这也说明此人的射击技术是成问题的.70v那么，用什么量来衡量这种平均偏离程度呢？v人们自然会想到采用|XEX|的平均值E|XEX|.v但是式E|XEX|带有绝对值号，运算不便,故采用(XEX)2的平均值E(XEX)2来代替E|XEX|.v显然，E(XEX)2的大小完全能够反映X离开EX的平均偏离大小的，这个值就称为X的方差.v定义如下：71v定定义3.33.3 设X是一个随机变量，若E(XEX)2存在，则称E(XEX)2是X的方差方差，记作DX，即DX=E(XEX)2.v同时，称方差的平方根是X的标准差准差或根根方差方差，记作X，即v由于X与X具有相同的量纲，故在实际问题中经常被采用.72v根据一维随机变量函数的数学期望公式，对于离散型和连续型随机变量的方差可以分别得到如下的表达式：v()离散型随机变量的情况 v其中P(X=xk)=pk，k=1,2,.v()连续型随机变量的情况 v其中fX(x)为随机变量X的概率密度.73v关于方差的计算，常利用如下的公式 DX=EX2(EX)2.v这个公式可用的数学期望的性质来证明.v证证 74v常用的离散型、连续型随机变量的方差.v例例1 1(0101分布分布)设随机变量X的分布列为(q=1p)X01P1ppv求DX.v解解 EX=0(1p)+1p=p EX2=02(1p)+12p=pvDX=p2p=p(1p)=pq.75v例例2 2(二二项分布分布)设随机变量X的分布列为 v求DX.v解解76v解解 777879v例例3 3(泊松泊松分布分布)设随机变量的分布列为 v求DX.v解解808182v由此看出，泊松分布的参数既是相应随机变量X的数学期望又是它的方差.83v例例4 4(均匀均匀分布分布)设XU a,b，求DX.v解解 EX=(a+b)/2，而 84v故 v由此看出，在 a,b 上服从均匀分布的随机变量的方差与区间长度的平方成正比.85v例例5 5(指数分布指数分布)设XE()，即连续型随机变量X的概率密度为v其中是正常数，求DX.v解解 EX=1/，而 868788v例例6 6(正态正态分布分布)设连续型随机变量XN(,2)，求EX.v解解 EX=，DX=2.v正态分布N(,2)中的参数和2分别表示相应随机变量X的数学期望和方差.8990v3.2.23.2.2 随机变量的方差的性质随机变量的方差的性质 v()DC=0，C为常数；v()D(CX)=C2DX，C为常数；v()若X1,X2,Xn相互独立，则D(X1+X2+Xn)=DX1+DX2+DXn；v()DX=0的充要条件是X取某一常数值a的概率为1，即 P(X=a)=1，a=EX.v在上面的性质中，均假设方差是存在的.v证()DC=E(CEC)2=E(CC)2.91v证()DC=E(CEC)2=E(CC)2.v()D(CX)=E(CX)2 E(CX)2 =C2EX2C2(EX)2 =C2 EX2C2(EX)2 =C2DXv()对n=2的情况给出证明，一般的情况，证法相同 v()证明略.92v又 93v因为X与Y相互独立，故 v于是 v从而 94v应用方差的性质计算方差，常常能使运算简化，见下例v例例6 6 设 XB(n,p)，求DX.v解解设在n重伯努利试验中，成功的次数为Y，而在每次试验成功的概率为p，则Y与X有相同的分布，从而有相同的方差(0p0、DY0，则称 v为X与Y的相关系数相关系数，记作XY，即111v下面研究相关系数XY到底表示X与Y之间的什么联系？v为此，介绍下面的定理.v定理定理3 3.3.3 设是X与Y的相关系数，则v()|1；v()|=1的充分必要条件是P(Y=a+bX)=1，其中a、b为常数.112v 35设X与Y为具有二阶矩的随机变量，且设v求a,b使Q(a,b)达到最小值Qmin，并证明113v解114v解方程组v得v此时115116v下面研究相关系数XY到底表示X与Y之间的什么联系？v为此，介绍下面的定理.v定理定理3 3.3.3 设是X与Y的相关系数，则v()|1；v()|=1的充分必要条件是P(Y=a+bX)=1，其中a、b为常数.117v证()为了证明|1，只需证明 2Cov(X,Y)24 4DXDY.v利用初等代数中的典型方法，只要说明以DX、2Cov(X,Y)、DY为系数的二次三项式非负即可.v事实上，对任意的实数t，有t2DX2Cov(X,Y)t+DY=D(tXY)0.v可见，上式左端的二次三项式没有两个相异的实数根，故判别式非正，即 2Cov(X,Y)24 4DX DY Cov(X,Y)2DX DYv从而()得证.118v()|=1，即式 2Cov(X,Y)24 4DXDY 中等号成立的充分必要条件是式t2DX2Cov(X,Y)t+DY=D(tXY)0v左端的二次三项式有重根t=b，即存在实数b，使D(bXY)=0.v由方差的性质()知式D(bXY)=0成立的充分必要条件是P(YbX=a)=1，v其中a为常数.从而()得证.119v由定理3.3可知，当|=1时，Y与X之间存在着线性关系，这个事件的概率为1.v由本章的习题35可以看出，的绝对值越接近于1，Y与X之间越近似的有线性关系.vY与X之间的相关系数是刻画X与Y之间线性相关程度的一个数字特征.120v定定义3.6 3.6 若X与Y的相关系数=0，则称X与Y不相关不相关.v定理定理3.43.4 随机变量X与Y不相关与下面的每一个结论都是等价的.v()Cov(X,Y)=0；v()D(XY)=DX+DY；v()E(XY)=EXEY.v证明证明()因为 v故=0与Cov(X,Y)=0等价.121v()由D(XY)=DX+DY2Cov(X,Y)v可知Cov(X,Y)=0与D(XY)=DX+DY 是等价的.v()由Cov(X,Y)=E(XY)EXEYv可知Cov(X,Y)=0与E(XY)=EXEY 是等价的.122v注意，随机变量X与Y的不相关和X与Y相互独立是两个不相同的概念.vX与Y的不相关是指X与Y之间不存在线性关系，不是说它们之间不存在其它关系.即由X与Y的不相关，推不出X与Y相互独立.v但是反过来，若X与Y相互独立，则X与Y一定不相关，这是因为v由Cov(X,Y)=E(XY)EXEY 可以看出，若X与Y相互独立，则Cov(X,Y)=0 必然成立.123v例例1 1设连续型随机变量XN(0,1)，Y=X2，求X与Y的相关系数XY.v解解因XN(0,1)，故EX=0，于是由Cov(X,Y)=E(XY)EXEYv得Cov(X,Y)=E(XY)=EX3v而EX3=0.v故Cov(X,Y)=0即XY=0.124125126127v在例1中，虽然X与Y是不相关的，但是X与Y并不独立.v事实上，因X21X2=v且0P(X21)10P(X2)0有 v成立.132v证证设X是一个连续型随机变量，概率密度为f(x)，则133v当X是离散型随机变量时，只需在上述的证明中把概率密度换成分布列，把积分好换成求和号即可.v由于 v故 v与 v等价.134v式 v和式 v都称为切比雪夫不等式切比雪夫不等式.v切比雪夫不等式给出了在随机变量X的分布未知的情况下，利用EX、DX对X的概率分布进行估计的一种方法.135v例如，由式 v可以断言，不管X的分布是什么，对于任意的正整数k都有 v当k=3时，有136v由3.5节例1知，当XN(,2)时，有v比较上面的两个式子可知，切比雪夫不等式给出的估计比较粗糙；但要注意，切比雪夫不等式只利用了数学期望和方差.137v例例1 1设EX=2，DX=0.4，试用切比雪夫不等式估计P(1X3)?v解解138v例例2 2设随机变量X、Y的数学期望都是2，方差分别为1和4，而相关系数为0.5，则根据切比雪夫不等式估计v解解139140v3.5.23.5.2 大数定律大数定律 v定理定理3.6(3.6(伯努利大数定律伯努利大数定律)设在n重伯努利试验中，成功的次数为Yn，而在每次试验中成功的概率为p(0p0有v证证由于YnB(n,p)v故EYn=np，DYn=npq(q=1p)v由此得 141v代入切比雪夫不等式 v得 142v故 v利用式 v显然可得式 v的等价形式 143v在式 v中，Yn/n是在n重伯努利试验中成功的频率，而p是成功的概率.v因此伯努利大数定律告诉我们：当试验次数n足够大时，成功的频率与成功的概率之差的绝对值不小于任一指定的正数的概率可以小于任何预先指定的正数，这就是频率稳定性的一种较确切的解释.v利用式 v可以得到相应的等价解释.144v根据伯努利大数定律，在实际应用中，当试验次数n很大时，可以用事件的频率来近似代替事件的概率.v定义定义5.85.8 称随机变量序列X1,X2,Xn,(或简记为Xn)是相互独立的，如果对任意的n2，X1,X2,Xnv是相互独立的.此时，若所有Xi又有相同的分布函数，则称X1,X2,Xn,是独立同分布的随机变量序列独立同分布的随机变量序列.145v定理定理3.73.7(切比雪夫切比雪夫大数定律大数定律)设X1,X2,Xn,是相互独立的随机变量序列，若有常数C，使DXiC，i=1,2,，则对任意的0有v或 146v证因为 v由切比雪夫不等式 v得 147v令n，则得 v若利用式 v则可以推得式 148v在概率论中我们称满足式 v或式 v的随机变量序列X1,X2,Xn,服从服从大数定律大数定律.149v推论推论设X1,X2,Xn,是独立同分布的随机变量序列，具有有限的数学期望和方差，EXi=，DXi=2，i=1,2,，则对任意的0有v或 v这是因为 v故由切比雪夫大数定律立即可得上面的两个式子.150v容易验证伯努利大数定律的结论可以由此推论得出.v在上述的推论中，假设所讨论的随机变量的方差是存在的，但实际上，方差存在这个条件并不是必要的，现不加证明地介绍下面的定理.v定理定理3.83.8(辛钦辛钦Khintchine大数定律大数定律)设X1,X2,Xn,是独立同分布的随机变量序列，具有有限的数学期望，EXi=，i=1,2,，则对任意的0有v或 151v在式 v中 v可以被看作随机变量X在n次重复独立试验中n个观察值的算术平均值，而=EX.v因此，辛钦大数定律告诉我们：当试验次数n足够大时，152v因此，辛钦大数定律告诉我们：当试验次数n足够大时，平均值v与数学期望之差的绝对值不小于任一指定的正数的概率可以小于任何预先指定的正数，这就是算术平均值稳定性的一种较确切的解释.v所以，在测量中常用多次重复测得的值的算术平均值来作为被测量的近似值.153v一般地，设Z1,Z2,Zn,是一个随机变量序列，a是一个常数，若对任意的0有v则称随机变量序列Z1,Z2,Zn,依概率收敛依概率收敛于a.记为 154v按照依概率收敛的定义，伯努利大数定律表明了频率Yn/n依概率收敛于p，即 v式 v所表示的关系为 155v式v所表示的关系为 156第三章第三章随机变量的数字特征与极限定理随机变量的数字特征与极限定理 v3 3.6 6 中心极限定理中心极限定理 v在前面3.5节大数定律中，我们讨论了独立随机变量的平均值v序列的依概率收敛问题，现在我们来讨论独立随机变量和 157v在随机变量的各种分布中，正态分布占有特殊重要的地位.v早在19世纪，德国数学家高斯(Gauss)在研究测量误差时，就引进了正态分布.v其后，人们又发现在实际问题中，许多随机变量都近似服从正态分布.v为什么正态分布如此广泛地存在，从而在概率论中占有如此重要的地位？v数学家从关于独立随机变量和的极限分布的研究中找到了答案.158v20世纪前半期，概率论研究的中心课题之一，就是寻求独立随机变量和的极限分布是正态分布的条件.因此，把这一方面的定理统称为中心极限定理.v较一般的中心极限定理表明：如果被研究的随机变量是大量的独立随机变量的和，其中每一个别随机变量对于总和只起微小作用，则可以认为这个随机变量近似服从正态分布.v这就揭示了正态分布的重要性.因为现实中许多随机变量都具有上述的性质，例如测量误差、射击弹着点的横坐标或纵坐标、人的身高或体重等都是由大量的随机因素综合影响的结果，因而是近似服从正态分布的.159v以下叙述一个常用的中心极限定理 v定理定理3.93.9(独立同分布的中心极限定理独立同分布的中心极限定理)如果随机变量序列X1,X2,Xn,独立同分布，并且具有有限的数学期望和方差，EXi=，DXi=20，i=1,2,，则对一切x，有v证明需要用到随机变量的特征函数，略.160v从式 v可以看出，不管Xi(i=1,2,)服从什么分布，只要n充分大，随机变量 v就近似地服从N(0,1)，而161v随机变量v近似地服从N(n,n2).v此时，我们称 v渐近地服从渐近地服从N(0,1).v定理5.9又被称为列维林德伯格(LevyLindeberg)中心极限定理.162v例例1 1 计算机在进行加法时，对每个被加数取整(取为最接近于它的整数)，设所有的取整误差是相互独立的，且它们均在(0.5,0.5)上服从均匀分布.若将1500个数相加，问误差总和的绝对值不超过15的概率是多少？v解解设Xi表示第i个被加数的取整误差，i=1,2,1500，则XiU(0.5,0.5)v且X1,X2,X1500相互独立，故=EXi=0 2=DXi=1/12.163v令Z=X1+X2+X1500，由列维林德伯格中心极限定理v得 164v于是，所求的概率为 165166v定理定理3.10 3.10 德莫弗德莫弗拉普拉斯拉普拉斯(De(De MoivreMoivreLaplaceLaplace)定理定理设在n重伯努利试验中，成功的次数为Yn，而在每次试验中成功的概率为p(0p1)，q=1p，则对一切x，有167v证明明设Xi表示在第i次试验成功的次数，i=1,2,n，则Xi的分布列为 Xi01Pqpv且v由于X1,X2,Xn是独立同分布的随机变量序列分布列，且EXi=p，DXi=pq(i=1,2,n)有限，故满足定理5.9(独立同分布的中心极限定理)的条件，168v于是由式 v得 169v定理3.10表明二项分布以正态分布为极限分布 v推论推论对定理3.10中的n重伯努利试验，n充分大时，有v证证从 v由定理3.10(德莫弗拉普拉斯定理)即得结论.170v由推论可知，当n很大时，二项分布的概率计算问题，可以转化为正态分布来计算，这将使计算量大大减小.v例如，当n很大时，若要计算v工作量是惊人的.但是，用式 v只要查一下正态分布函数表就可以轻松地求出它的相当精确的近似值.171v例例2 2 重复投掷硬币100次，设每次出现正面的概率均为0.5，问“出现正面次数大于50，小于61”的概率是多少？v解解设出现正面的次数为Yn，现在v由式 v得 172173v应该指出：定理3.10及其推论中的Ynv是仅取非负整数值0,1,2,n的随机变量，注意到正态分布是连续型的分布，所以在求概率P(Ynm)(m为正整数)v时，为了得到较好的近似值，可以用下面的近似公式 174v例例3 3 以X表示将一枚匀称的硬币重复投掷40次中出现正面次数，试用正态分布求P(X=20)的近似值，再与精确值比较.v解解这里n=40，p=1/2，q=1/2，故 175v而精确解为v当然，求例3这样的概率还有德莫弗拉普拉斯局部极限定理可用，这里就不予以论述了.176v由前面的讨论可见，对二项分布，当n充分大，以致npq较大时，正态近似是相当好的近似.v进一步的分析表明，当接近于0或1时，用正态近似效果不好，这时就要用到泊松近似了.v由定理2.10(二项概率的泊松逼近定理)，当p(或q)很小，而np(或nq)大小适中时，泊松近似是较好的.v在实际中，一般当0.1p9时，用正态近似；当p0.1(或p0.9)且n10时，用泊松近似.177v例1 一生产线生产的产品成箱包装，每箱的重量是随机的.假设每箱的平均重量为50千克，标准差为5千克.若用最大载重量为5吨的汽车承运，试利用中心极限定理说明，每辆车最多可以装多少箱，才能保证不超载的概率大于0.977.(2)=0.977，其中(x)是标准正态分布函数.)v解设Xi(i=1,2,n)是装运的第i箱的重量(单位：千克)，n是所求的箱数.v由条件可以把X1,X2,Xn视为独立同分布的随机变量，而n箱的总重量Tn=X1+X2+Xnv是独立同分布随机变量之和.178v由条件知v根据列维林德伯格(独立同分布的独立同分布的)中心极限定理，Tn近似服从正态分布N(50n,25n).v箱数n决定于条件179v由此可见180v从而n98.02，即每辆车最多可以装98箱，才能保证不超载的概率大于0.977.181v 48某保险公司多年的资料表明，在索赔户中，被盗索赔户占20%，以表示在随机抽查100个索赔户中因被盗而向保险公司索赔的户数，求 v解 182v 48某保险公司多年的资料表明，在索赔户中，被盗索赔户占20%，以表示在随机抽查100个索赔户中因被盗而向保险公司索赔的户数，求 v解 183END

展开阅读全文

随机变量的数字特征教学课件

最新文档