资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第四章 随机变量的数字特征、极限定理,数学期望,方差,协方差和相关系数,大数定律与中心极限定理,4.1,数学期望,一、离散型随机变量的数学期望,例,4.1,甲、乙两射手进行射击训练,已知在,100,次射击中命中环数与次数记录如下:,环数,8,9,10,次数,30,10,60,环数,8,9,10,次数,20,50,30,甲,乙,试问如何评定甲、乙射手的技术优劣?,甲平均射中的环数为:,乙平均射中的环数为:,(8,30+910+1060)100=80.3+90.1+100.6=9.3(,环,),(8,20+950+1030)100=80.2+90.5+100.3=9.1(,环,),因此从平均射中的环数看,甲的技术优于乙。,在例,4.1,中,,30/100=0.3,、,10/100=0.1,、,60/100=0.6,等,是事件,(,X=k,),在,100,次试验中发生的频率,(,X,为命中的环数,),,当射击次数相当大时,这个频率接近于事件,(,X=k,),在一次试验中发生的概率,p,k,。上述平均环数的计算可表示为,我们称之为随机变量,X,的,数学期望,,或均值。,数学期望,描述随机变量取值的,平均特征,定义,4.1,设,X,是离散型随机变量,其分布律为,X,P,(,X,=,x,i,)=,p,i,i,=1,2,n,,,如果级数,绝对收敛,,,并称级数,的和为随机变量,X,的数学期望,记作,则称,X,的数学期望存在,,,E,(,X,),,,即,则称随机变量,X,的数学期望,不存在,。,注意:随机变量,X,的数学期望,E,(,X,),完全是由,X,的分布律确定的,而不应受,X,的可能取值的排列次序的影响,因此要求级数,绝对收敛。若级数,不绝对收敛,,,例如,设离散型随机变量,X,的分布律为,X,-2,-1,0,1,2,P,k,1/16,2/16,3/16,2/16,8/16,则,X,的数学期望为,例,4.2,掷一颗均匀的骰子,以,X,表示掷得的点数,求,X,的数学期望。,解,X,的分布律为,X,1,2,3,4,5,6,P,k,1/6,1/6,1/6,1/6,1/6,1/6,例,4.4,设,X,取,(,k,=1,2,),对应的概率为,,证明,E,(,X,),不存在。,证明,且,但级数,发散,所以,E,(,X,),不存在,但级数,(,交错级数满足,Leibniz,条件,)(,收敛,),要注意数学期望的条件:,“,绝对收敛,”,。,定义,4.2,设,X,是连续型随机变量,概率密度函数为,f,(,x,),二、连续型随机变量的数学期望,若积分,绝对收敛,则称,X,的,数学期望存在,,,且称积分,为随机变量,X,的数学期望,记为,E,(,X,),即,数学期望简称,期望或均值,。,例,6,:,几种重要分布的数学期望,三、随机变量函数的数学期望,定理,4.1,设随机变量,Y,是随机变量,X,的函数,,Y=g,(,X,)(,g,(,),为连续函数,),(1),设,X,为离散型随机变量,其分布律,P,(,X=x,i,)=,p,i,i,=1,2,若级数,绝对收敛,,则,Y,的数学期望存在,且,(2),设,X,为连续型随机变量,其概率密度为,f,(,x,),,,若积分,绝对收敛,,则,Y,的数学期望存在,且,此定理说明,在求随机变量,X,的函数,Y=g,(,X,),的期望时,不必知道,Y,的分布而,只需知道,X,的分布,即可。,推广:设,(,X,Y,),是二维随机变量,,Z,=,g,(,X,Y,),,,g,(,),是连续函数。,(1),设,(,X,Y,),是离散型随机变量,分布律为,P,(,X=x,i,Y=y,j,)=,p,ij,,,i,j,=1,2,则当,绝对收敛时,,Z,的数学期望存在,且,(2),设,(,X,Y,),是连续型随机变量,概率密度为,f,(,x,y,),,则当,绝对收敛时,,Z,的数学期望存在,且,二维随机变量的数学期望,离散,r.v.,连续,r.v.,例,4.7,设随机变量,X,B,(,n,p,),,,求,E,(,Y,),解,X,B,(,n,p,),,分布律为,其中,p+q,=1,例,4.8,设二维随机变量,(,X,Y,),具有概率密度,设,Z,=,XY,,试求,Z,的数学期望。,解,O,1,x,y,1,y=x,1,、设,C,是常数,则,E,(,C,)=,C,;,2,、设,C,是常数,,X,为随机变量,则,E,(,CX,)=,CE,(,X,);,四,.,数学期望的性质,3,、设,X,Y,为任意两个随机变量,则有,E,(,X+Y,)=,E,(,X,)+,E,(,Y,);,推广:,X,i,为随机变量,,C,i,为常数,,i,=1,2,n,E,(,C,1,X,1,+ C,2,X,2,+,+,C,n,X,n,)=,C,1,E,(,X,1,)+,C,2,E,(,X,2,)+,C,n,E,(,X,n,),4,、若,X,,,Y,是,相互独立的,随机变量,则,E,(,XY,)=,E,(,X,),E,(,Y,),。,推广:,X,1,X,2,X,n,相互独立,,则,E,(,X,1,X,2,X,n,)=,E,(,X,1,),E,(,X,2,),E,(,X,n,),反之不然,即由,E,(,XY,)=,E,(,X,),E,(,Y,),不能推出,它们独立。,例,1,:已知甲乙两箱中装有同种产品,其中甲箱中装有,3,件合格品和,3,件次品,乙箱中仅装有,3,件合格品。从甲箱中任取,3,件产品放入乙箱中,求乙箱中次品件数的数学期望。,例,2,:已知,0,,其它,求随机变量的数学期望,E(X),.,例,3,:设随机变量,X,的分布列为:,求:,X,-2,0,2,P,0.4,0.3,0.3,例,4,:设随机变量,X,的密度函数:,f(x)=,0,其它,对随机变量,X,独立地重复观察,4,次,用,Y,表示观察值大于 的次数,,求,EY,例,5,:设(,X,Y,)分布列为:,(1),求,E(X),E(Y);(2),设,Z=X/Y,,求,E(Z);(3),设 ,求,E(Z),X Y,1,2,3,-1,0.2,0.1,0,0,0.1,0,0.3,1,0.1,0.1,0.1,例,6,:设(,X,Y,)的密度函数:,f(x,y)=,0,其它,求:,E(X),E(Y),E(XY),4.2,方差,一、方差的概念,例,4.13,甲乙两部机床生产同一种机轴,轴的直径为,10mm,,公差为,0.2mm,,即直径在,9.8mm,到,10.2mm,的为合格品,超出范围的均为废品。现从甲乙两机床的产品中各随机地抽取,6,件进行测试,机轴的直径的测试尺寸如下:,(mm),甲,9.89.910.010.010.110.2,乙,9.09.29.410.610.811.0,易知,甲乙两组产品的直径的均值都为,10.0mm,,但两组的质量显然差异很大,甲组全为合格品,乙组全为废品。这里光看均值无差别,质量的差异的原因在于两组产品关于均值的离散程度不同。甲组,离散程度小,,,质量较稳定,,乙组的,离散程度大,,,质量不稳定,。,为衡量一个随机变量,X,关于均值的,离散程度,,可用,|,X,-,EX|,的,均值,来表示,称为,X,的绝对离差,用,E,|,X,-,EX|,记,这在实际统计中有一定的作用。但由于绝对值的均值不易计算,常用,随机变量与均值差的平方的均值,来描述离散程度。,定义 设,X,是随机变量,若,E,X,-,EX,2,存在,则称,E,X,-,EX,2,为随机变量,X,的,方差,,记为,D,(,X,),或,Var(,X,),,即,D,(,X,)=,E,X,-,EX,2,在应用上,常用与随机变量,X,具有相同量纲的量,,称为随机变量,X,的,均方差,或,标准差,。,方差,是衡量随机变量取值,波动 程度,的一个数字特征。,由方差的定义可知,,D,(,X,)0,。,当,X,为离散型随机变量,且分布律为,P,(,X=x,k,)=,p,k,时,则,当,X,为连续型随机变量时,且密度函数为,f,(,x,),,则,在实际计算中,通常使用如下公式,即方差是“随机变量,平方的期望减去,随机变量,期望的平方,”。,例,4.14,已知随机变量,X,的分布律如下,求,D,(,X,),。,X,-2,-1,0,1,2,P,k,1/16,2/16,3/16,2/16,8/16,解 数学期望,E,(,X,)=7/8,,,例,4.15,设随机变量,求,D,(,X,),解,二、方差的性质,1,、设,C,是常数,则,D,(,C,)=0,,且,D,(,X+C,)=,D,(,X,);,2,、设,C,是常数,,X,为随机变量,则,D,(,CX,)=,C,2,D,(,X,);,3,、设,X,Y,为任意两个随机变量,则有,特别地,当,X,Y,相互独立,时,,E,(,XY,)=,E,(,X,),E,(,Y,),所以,D,(,X+Y,)=,D,(,X,)+,D,(,Y,),推论:若随机变量,X,1,X,2,X,n,相互独立,则,D,(,X,1,+,X,2,+,X,n,)=,D,(,X,1,)+,D,(,X,2,)+,D,(,X,n,),又,X,Y,相互独立,,C,1,,,C,2,为常数,则,D,(,C,1,X+C,2,Y,)=,C,1,2,D,(,X,)+,C,2,2,D,(,Y,),特别注意:,D,(,X,-,Y,)=,D,(,X,)+,D,(,Y,),(,当,X,Y,独立,),4,、,D,(,X,)=0,的充分必要条件是,X,以概率,1,为常数,即,P,(,X=C,)=1,4.3,几个重要分布的数学期望和方差,一、,01,分布,XB,(1,p,),,,P,(,X,=1)=,p,,,P,(,X,=0)=1,-,p,=,q,E,(,X,)=1,p,+0,(1,-,p,)=,p,,,E,(,X,2,)=1,2,p,+0,2,(1,-,p,)=,p,D,(,X,)=,E,(,X,2,),-,(,E,(,X,),2,=,p,-,p,2,=,pq=,p,(1,-,p,),二、二项分布,XB,(,n,p,),分布律为,P,(,X=k,)=,C,n,k,p,k,q,n,-,k,,,(,p+q,=1),,,k,=0,1,2,n,其中,随机变量函数的数学期望,在计算时,若将,X,表示成若干个相互独立的,01,分布变量之和,计算就极为简便。,在,n,重,Bernoulli,试验中,,A,发生的概率为,p,,不发生的概率为,q,=1,-,p,。设,则,A,发生的次数,XB,(,n,p,),三、,Poisson,分布,X,P,(,),,,五、均匀分布,XU,a,b,六、正态分布,N,(,2,),中,两个参数,和,2,,分别是正态分布的数学,期望,和,方差,。,七、指数分布,某些常用分布的数学期望及方差,(,1,)若,则,(,2,)若,则,(,3,)若,则,(,4,)若,则,(,5,)若,则,(,6,)若,则,课 堂 练 习,1.,设,X,求下列,X,的函数的数学期望,.,(1)2X-1, (2)(X-2),2,2.,设,X,求,E(X),D(X).,3. X,Y,独立,,D(X)=6,,,D(Y)=3,,则,D(2X-Y)=,( )。,4.3,协方差,相关系数,定义 设,(,X,Y,),是二维随机变量,如果,E,X,E,(,X,),Y,E,(,Y,),存在,则称它是,X,与,Y,的,协方差,,记为,cov(,X,Y,),即,cov(,X,Y,)=,E,X,E,(,X,),Y,E,(,Y,),。,当,D(X)0,D(Y)0,时称,一、概念,为,X,与,Y,的,相关系数,,或称,X,与,Y,的,标准协方差,。,XY,是一个无量纲的量。,当,X,与,Y,是离散型随机变量时,分布律,P,(,X,=,x,i,Y,=,y,j,)=,p,ij,当,X,与,Y,是连续型随机变量时,密度函数,f,(,x,y,),由协方差定义可得,对任意的随机变量,X,、,Y,,有,cov(,X,Y,)=,E,X,E,(,X,),Y,E,(,Y,)=,E,(,XY,),E,(,X,),E,(,Y,),协方差的一个计算公式。,又有,D,(,X,+,Y,)=,D,(,X,)+,D,(,Y,)+,2,cov(,X,Y,),D,(,X,-,Y,)=,D,(,X,)+,D,(,Y,),-,2,cov(,X,Y,),二、协方差的性质,(1) cov(,X,Y,)=cov(,Y,X,);,(2) cov(,X,X,)=,D,(,X,),,,cov(,X,C,)=0,;,(3) cov(,aX,bY,)=,ab,cov(,X,Y,),,,其中,a,b,为常数;,(4) cov(,X+Y,Z,)=cov(,X,Z,)+cov(,Y,Z,),;,(5)X, Y,相互独立,,cov(,X,Y,)=0,称,为,X,的,标准化变量,,即“随机变量与期望之差除以均方差”,若记,则,E,(,X,*,)=0,,,D,(,X,*,)=1,三、相关系数的性质,1,、,|,XY,|,1,,,即“相关系数的绝对值小于等于,1”,。,证明,方差的非负性,|,XY,|,1,2,、,|,XY,|=1,的充分必要条件是,X,与,Y,以概率,1,存在线性关系,,即,P,(,Y=aX+b,)=1,,,a,0,,,a,b,为常数。,证明(充分性),(p108),设,Y=aX+b,,则,E,(,Y,),=aE,(,X,),+b,,,D,(,Y,),=a,2,D,(,X,),Cov(,X,Y,)=,E,X,E,(,X,),Y,E,(,Y,),=,E,X,E,(,X,),aX+b,aE,(,X,),b,=,a,E,X,E,(,X,),2,=,aD,(,X,),即,|,XY,|=1,(必要性)设,XY,=1,,则,性质,1,方差性质,其中,即,X,与,Y,以概率,1,存在线性关系,此时称,X,,,Y,正相关,。,当,XY,=,-,1,时,其中,即,X,与,Y,以概率,1,存在线性关系,此时称,X,,,Y,负相关,。,定义 若,XY,=0,,则,称,X,与,Y,不相关,。,3,、若,X,与,Y,相互独立,则必有,X,与,Y,不相关。,证明,X,与,Y,相互独立,有,E,(,XY,)=,E,(,X,),E,(,Y,),cov(,X,Y,)=,E,(,XY,),E,(,X,),E,(,Y,)=0,所以,XY,=0,即,X,与,Y,不相关。,注意:,X,与,Y,不相关,,X,与,Y,未必相互独立,。,所谓不相关只是就线性关系而言,而相互独立是就一般关系而言的。,二维正态随机变量,(,X,Y,),,,X,与,Y,独立,例,4.18,设二维随机变量,则可求得协方差,cov(,X,Y,)=,1,2,且相关系数,XY,=,二维正态变量,(,X,Y,),,,X,与,Y,相互独立的充分必要条件是,=0(P78,例,7),;,而,XY,=,=0,表示,X,与,Y,不相关,,可见,,X,与,Y,独立的,充分必要条件是,X,与,Y,不相关,。,X,与,Y,不相关,等价于,矩、协方差矩阵,1,、若,E,(,X,k,),存在,则称,A,k,=,E,(,X,k,),为随机变量,X,的,k,阶原点矩,,简称,k,阶矩,(,k,=1,2,),,而,E,(|,X,|,k,),称为,X,的,k,阶绝对原点矩;,2,、若,E,X,-,E,(,X,),k,存在,则称,B,k,=,E,X,-,E,(,X,),k,为随机变量,X,的,k,阶中心矩,(,k,=1,2,),,而,E,|,X,-,E,(,X,)|,k,称为,X,的,k,阶绝对中心矩;,3,、若,E,(,X,k,Y,l,),存在,则称,E,(,X,k,Y,l,),为随机变量,X,、,Y,的,k,+,l,阶,混合,原点矩,(,k,l,=1,2,),;,4,、若,E,X,E,(,X,),k,Y,E,(,Y,),l,存在,则称,E,X,E,(,X,),k,Y,E,(,Y,),l,维随机变量的,k,+,l,阶,混合,中心矩,(,k,l,=1,2,),。,由矩的概念,数学期望,E,(,X,),即为,X,的一阶原点矩;,方差,D,(,X,),即为,X,的二阶中心矩。,设,X,1,X,2,X,n,为,n,个随机变量,记,c,ij,=Cov(,X,i,X,j,),,,i,j,=1,2,n,。则称由,c,ij,组成的矩阵为随机变量,X,1,X,2,X,n,的协方差矩阵,C,。即,或,定理:(切比雪夫不等式),设随机变量,X,有数学期望,对任意,不等式,成立,,称此式为切比雪夫不等式,.,4.4,大数定理,证明,:设,X,为连续性(离散型类似),其密度为,切比雪夫不等式,说明,(,1,)证明切,比雪夫,大数定律;,(,2,)表明,D,(,X,)描述了,X,偏离,E,(,X,)的离散程度;,(,3,)给出,X,的分布未知时,事件,|X-E,(,X,),|,的概率的一个,大致估计,。,对未知分布,X,,取,例,1,估计,的概率,解,练 习,例,1,设随机变量,X,的方差为,2,,则根据切比雪夫不等式,有,例,2,设随机变量,X,和,Y,的数学期望分别为,-2,和,2,,方,差分别为,1,和,4,,而相关系数为,0.5,, 则根据切比雪,夫不等式有,例,3,已知随机变量,X,的概率分布为,X,1 2 3,p,0.2 0.3 0.5,试利用切比雪夫不等式估计事件,的概率,.,大数定理,设随机变量序列,X,1,X,2,X,n,,若存在随机变量,Y,,使得对于任意正数,,均有,则称随机变量序列,X,n,依概率收敛,于随机变量,Y,,并记为,一、依概率收敛,若存在常数,a,,任意的,正数,,使得,则称,随机变量序列,X,n,依概率收敛于常数,a,,并记为,意思是:当,a,而,意思是:,时,,X,n,落在,内的概率越来越大。,当,与,的区别,辛钦大数定理(弱大数定理),设,X,1,X,2,X,n,为独立、同分布的随机变量,且有相同的数学期望,E,(,X,i,),=,(,i,=1,2,),,则对,0,,有,以概率收敛于,辛钦大数定律表明,若,X,k,,,k,=1,2,.,为独立同分布随机变量序列,EX,k,=,0)(,i=,1,2,),,记前,n,个变量的和的标准化变量为,一、,独立同分布的中心极限定理,(Lindeberg- Levy,林德贝格,-,列维,)(P117,定理,3 ),则,Y,n,的分布函数,F,n,(,x,),对任意的,x,(,-,+),都有,该定理说明,当,n,充分大时,,Y,n,近似地服从标准正态分布,,Y,n,N,(0,1),,,随机变量,近似地服从于正态分布,中心极限定理可以解释如下:,假设被研究的随机变量可以表示为,大量独立的随机变量的和,,其中每个随机变量对于总和的作用都很微小,则可以认为这个随机变量实际上是,服从正态分布,的。,在实际工作中,,只要,n,足够大,便可把独立同分布的随机变量之和当作正态变量,。,例,4.19,将一颗骰子连掷,100,次,则点数之和不少于,500,的概率是多少?,解 设,X,k,为第,k,次掷出的点数,,k,=1,2,100,,则,X,1,X,2,X,100,独立同分布,而且,由中心极限定理,二、德莫佛,-,拉普拉斯定理,(De Moivre-Laplace),在,n,重贝努里试验中,每次试验中事件,A,发生的概率为,p,(0,p,1),,记,Y,n,为,n,次试验中事件,A,发生的次数,则对任何区间,a,b,(,a,b,),,有,其中,q,=1-,p,即,Y,n,B,(,n,p,),,则,此定理表明,,正态分布是二项分布的极限分布,。当,n,充分大时,服从二项分布的随机变量的概率计算可以转化为正态随机变量的概率计算。,一般地,若,X,B,(,n,p,),,则当,n,较大,而,p,较小时,即近似地,,X,N,(,np,n,pq,),,从而,例,4.21,在一家保险公司里有,10000,个人参加寿命保险,每人每年付,12,元保险费。在一年内一个人死亡的概率为,0.6%,,死亡时其家属可向保险公司领得,1000,元,问:,(1),保险公司亏本的概率有多大?,(2),其他条件不变,为使保险公司一年的利润有,99%,的概率不少于,60000,元,赔偿金至多可设为多少?,解 设,X,表示一年内死亡的人数,则,X,B,(,n,p,),,,其中,n,= 10000,,,p,=0.6%,,,np,=60,,,npq,=59.64,近似地有,XN,(,np,npq,),,即,XN,(60,59.64),设,Y,表示保险公司一年的利润,则,Y,=10000,12,-,1000,X,于是由中心极限定理,(1),P,(,Y,0)=,P,(10000,12,-,1000,X,0),=1,P,(,X,120),1,(7.769)=0;,(2),设赔偿金为,a,元,则,P,(,Y,60000)=,P,(10000,12,-,aX,60000),=,P,(,X,60000/,a,)0.99,由中心极限定理,上式等价于,标准正态分布表,
展开阅读全文