资源描述
*,连续型随机变量几种常见分布,1,三.几种常见的连续型随机变量的分布,若连续型随机变量,X,具有概率密度,f,(,x,)为:,1.,均匀分布,则,称,X,在区间(,a,b,)上服从,均匀分布,(或等概率分布)记作,X,U,(,a,b,),注:,易证,满足:,2,0,的图形:,X,落在区间(,a,b,)中任意等长度的子区间的可能性是相同的,即它落在子区间的概率只依赖于子区间的长度而与子区间的位置无关.,均匀分布的概率意义:,3,证:,即,X,落在(,c,d,)内的概率只与(,c,d,)的长度有关,而与(,c,d,)在(,a,b,)中的位置无关.,均匀分布常见于下列情形:,比如:在数值计算中,由于四舍五 入,小数点后某一位小数引入的误差;公交线路上两辆公共汽车前后通过某汽车停车站的时间,即乘客的候车时间等.,4,由分布函数,定义,可得:若,X,服从均匀分布,则,X,的分布函数为:,图形:,5,某公共汽车站从上午7时起,每15分钟来一班,车,即,7:00,7:15,7:30,7:45,等时刻有汽车,到达此站,如果乘客到达此站时间,X,是7:00,到 7:30 之间的,均匀,随机变量,(1),乘客候车时间少于 5 分钟的概率,(2)乘客候车时间超过10分钟的概率,例1.,试求:,6,解:,X,U,(0,30),设以,7:00,为,起点0,以分为单位,为使候车时间,X,少于 5 分钟,,乘客必须在 7:10 到 7:15 之间,或在7:25 到 7:30,之间到达车站.,从上午7时起,每15分钟来一班车,即,7:00,7:15,7:30,等时刻有汽车到达汽站,故所求概率为:,依题意,,7,候车时间超过10分钟,则乘客必须在7:00到7:05或,7:15到7:20之间到达车间,8,2.指数分布,若连续型随机变量,X,具有概率密度,f,(,x,)为:,注:,易证,满足:,为常数,其中,则,称,X,服从参数为 的,指数分布,9,由分布函数,定义,可得:若,X,服从指数分布,则X 的分布函数为:,指数分布的性质(,无记忆性,),若,X,服从指数分布,则:,对任意的,有:,若设,X,是某一元件的寿命,则上式表明:元件,对它已使用过 小时没有记忆。,指数分布的图形特点,10,某仪器装有3只独立工作的同型号电子元件,其寿命(单位:,h,)都服从同一指数分布,概率密度为,仪器在使用的最初200,h,内,至少有一个元件损坏的概率,例2.,试求:,11,正态分布是应用最广泛的一种连续型分布,.,正态分布在十九世纪前叶由数学家高斯加以推广,所以通常也称为高斯分布.,德莫佛,数学家德莫佛最早发现了二项分布的一个近似公式,这一公式被认为是,正态分布的首次露面.,3.正态分布,高斯,12,(1).正态分布的定义,若随机变量,X,的,概率密度为:,记作:,f,(,x,),所确定的曲线叫作,正态曲线,.,和 都是常数,任意,0,,则,称,X,服从参数为 和 的正态分布.,其中:,13,(2).正态分布 的图形特点,正态分布的密度曲线是一条关于 对称的钟形曲线,,特点,是“,两头小,中间大,左右对称,”,14,决定了图形的中心位置,决定了图形,中峰的陡峭程度.,正态分布 的图形特点,15,由密度函数的表达式,,分析,正态分布的,图形特点,即整个概率密度曲线都在,x,轴的上方,.,(3),显然:,以,为对称轴,并在,处达到最,大值:,16,令:,x,=,+,c,x,=,-,c,(,c,0),f,(,+,c,)=,f,(,-,c,),且,f,(,+,c,),f,(,),f,(,-,c,),f,(,),证明:,分别代入 可得:,以,为对称轴,并在,处,达到最大值,故得:,这说明:,曲线,f,(,x,),向左右伸展时,越来越贴近,x,轴。即,f,(,x,),以,x,轴为渐近线。,因为当,x,时,,f,(,x,),0,f,(,x,),以,x,轴为渐近线,17,(,对,f,(,x,),求导即可求得),为,f,(,x,),的两个拐点的横坐标,x=,(4).,正态分布的分布函数,由分布函数定义得出正态分布,若,则 分布函数是,其图形为:,18,正态分布由它的两个参数,和,唯一确定,当,和,不同时,对应的是不同的正态分布。,19,下图是用某大学男大学生的身高的数据画出的频率直方图:,红线,是拟,合的,正态,密度,曲线,可见,某大学男大学生的身高应服从正态分布。,20,人的身高高低不等,但中等身材的占大多数,特高和特矮的只是少数,而且较高和较矮的人数大致相近,这从一个方面反映了服从正态分布的随机变量的特点。,21,除了前面介绍的身高外,在正常条件下年降雨量;各种产品的质量指标,如零件的尺寸;纤维的强度和张力;农作物的产量,如小麦的穗长、株高;测量误差,如射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布.,22,标准正态分布,下面介绍一种最重要的正态分布,(5).,标准正态分布,其密度函数和分布函数常用,和,表示:,的正态分布为,标准正态分布.,称,其图形为:,23,密度函数,分布函数,24,(一般正态分布与标准正态分布的关系,),引理:,证明:,作一个线性变换,标准正态分布的,重要性,任何一个一般的正态分布都可以通过线性变换,转化为标准正态分布.,25,由此可得:若,即证得:,则其分布函数,26,关于正态分布表,表中给出的是 时,(,x,),的值.,当 时有:,书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表.,27,28,N,(0,1),若,则有:,若,X,N,(0,1),则有:,29,对,任意区间,则有:,30,由标准正态分布的查表计算可以求得,,这说明:,X,的取值几乎全部集中在 -,3,3,区间,内,超出这个范围的可能性仅占不到,0.3%,当,X,N,(0,1)时,,P,(|,X,|1)=2,(,1,)-,1,=,0.6826,P,(|,X,|2)=2,(,2,)-,1,=,0.9544,P,(|,X,|3)=2,(,3,)-,1,=,0.9974,(6),3,原则,31,将上述结论,推广到,一般的正态分布,有:,时,,,可以认为:,Y,的取值几乎全部集中在,区间内。这在统计学上称作“,3 准则,”,(三倍标准差原则),32,已知自动车床生产的零件的长度,X,(毫米)服从正,态分布,如果规定零件的长度在,毫米之间为合格品.,求:,生产零件是合格品的概率,解:,例3,.,所求的概率为:,33,例4.,从旅馆到飞机场沿 A 路走(路程短,交通拥挤),所需时间(分钟),沿 B 路走(路程,长,阻塞少),所需时间(分钟),若现在只有 30分钟.,问:,分别选择哪一条路为好?,解:,依题意,选择所需时间超过规定时间的概率较,小的路线为好.,当只有30分钟可用时:,A 路:,34,B 路:,结论:此时应选择A路,液体的温度X,(以计)是一个随机变量,且,将一温度调节器放置在贮存着某种液体的,容器内,调节器调整在,例5.,(1),若,求,X,小于89的概率.,(2),若要求保持液体的温度至少为80的概率,不低于0.99,,问,d,至少为多少?,35,解:,(2)按题意需求d满足:,36,反查正态分布表,由于表中无0.01的,的值,故采用如下方法处理:,查表可知:,由此可得:,故得:,现,37,公共汽车车门的高度是按男子与车门顶,碰头机会在,0.01,以下来设计的.设男子身高,X,N,(,170,6,2,),设车门高度为,h,cm,P,(,X h,)0.01,或,P,(,X,h,),0.99,,,的最小的,h,例6.,问:,应如何确定车门高度,解:,按设计要求即求,满足,:,38,因为:,X,N,(,170,6,2,),故:,查表得:,所以:,即:,h,=170+13.98 184,结论:,设计车门,高度为,184,厘米,时,可使男子与,车门碰头机会不,超过,0.01,.,P(,X,h,)0.99,求满足,的最小的,h.,所以:,39,设电池的寿命,X,(单位:,h,)服从正态分布,N,(300,35,2,),求,这种电池的寿命在,250,h,以上的概率,求一个最小的正整数,x,,使电池寿命,X,在区间,(300-,x,300+,x,),内取值的概率不小于,0.901,例7.,40,1.定义,则,称,点 为标准正态分布的,上,分位点.,2.图形:,面 积 为,四.关于 分位点的概念,0,以 点右侧面积总和 它就是所有比 大的概率.,单侧,分位点,41,注:,比如:,反过来可以验证:,用整块面积减去点 以后的那块面积,附表上可查的从 到 的那块面积,从正态分布表上,如何求,的值:,对于给定,的,则:,点,概率,所对应的,值,又比如:,42,(同样可以验证:,则称 为标准正态分布的,双侧 分位点.,图形:,两小面积相加之和=,又比如:,3.,双侧,分位点的定义,若,0,43,比如:,注意:,在后续的统计学中还将介绍,分布,分布,分布,的上 分位点的概念,44,上一讲我们已经看到,当,n,很大,,p,接近0或1时,二项分布近似泊松分布;如果,n,很大,而,p,不接近于0或1,那么可以证明,二项分布近似于正态分布.,下面我们不加证明地介绍有关二项分布近似于正态分布的一个定理,称为,棣莫佛拉普拉斯定理.它是第五章要介绍的中心极限定理的一个最重要的特殊情况.,45,五、二项分布的正态近似,定理,(棣莫佛拉普拉斯定理),设随机变量 服从参数,n,p,(,0,p,1,)的二项分布,则对任意,x,,有,定理表明,当,n,很大,0,p,1,是一个定值时(或者说,,np,(1-,p,),也不太小时),,二项,变量 的,分布近似正态分布,N,(,np,np,(1-,p,).,46,实用中,,n,30,,np,10,时正态近似的效果较好.,47,例,将一枚硬币抛掷10000次,出现正面5800次,认为这枚硬币不均匀是否合理?,试说明理由.,解:,设,X,为10000次试验中出现正面的次数,,采用正态近似,np,=5000,np,(1-,p,)=2500,若硬币是均匀的,,X,B,(10000,0.5),近似正态分布,N,(0,1).,即,48,=1,-,(16),0,此概率接近于0,故认为这枚硬币不均匀是合理的.,P,(,X,5800),=1-,P,(,X,5800),近似正态分布,N,(0,1).,49,
展开阅读全文