随机变量及其分布.ppt

上传人:xin****828 文档编号:15450465 上传时间:2020-08-10 格式:PPT 页数:90 大小:1.11MB
返回 下载 相关 举报
随机变量及其分布.ppt_第1页
第1页 / 共90页
随机变量及其分布.ppt_第2页
第2页 / 共90页
随机变量及其分布.ppt_第3页
第3页 / 共90页
点击查看更多>>
资源描述
第二章 随机变量及其分布,管理统计学,1 随机变量,在概率的研究中为什么需要引入随机变量?,引入随机变量是研究随机现象统计规律性的需要。为了便于数学推理和计算,有必要将随机试验的结果数量化,使得可以用高等数学课程中的理论与方法来研究随机试验,研究和分析其结果的规律性,因此,随机变量是研究随机试验的重要而有效的工具。,如何引入随机变量的概念?,为了全面地研究随机试验的结果,揭示随机现象的统计规律性,我们将随机试验的结果与实数对应起来,将随机试验的结果数量化,引入随机变量的概念。 在随机现象中,有很大一部分问题与数值发生关系,例如在产品检验问题中,我们关心的是抽样中出现的废品数;在车间供电问题中,我们关心的是某时刻正在工作的车床数;在电话问题中关心的是某段时间中的话务量,它与呼叫的次数及各次呼叫占用交换设备的时间长短有关。此外如测量时的误差,气体分子运动的速度,信号接收机所收到的信号(用电压表示或数字表示)的大小,也都与数值有关。,例1:将一枚硬币抛掷3次,我们感兴趣的是三次投掷中,出现H的总次数,而对H,T出现的次序不关心。以X记三次投掷中出现H的总次数,那么对于样本空间S=e中的每一个样本点e,X都有一个值与之对应,即有,我们注意到,随机变量的取值随试验的结果而定,而试验的各个结果出现有一定的概率,因而随机变量的取值有一定的概率。如,当且仅当事件A=HHT,HTH,THH发生时有x=2,而且P(A)=3/8,则Px=2=3/8。,如何引入随机变量的概念?,有些初看起来与数值无关的随机现象,也常常能联系数值来描述,例如在掷硬币问题中,每次出现的结果为正面或反面,与数值没有关系,但是我们能用下面方法使它与数值联系起来,当出现正面时对应数“1”,而出现反面时对应数“0”,为了计算n次投掷中出现的正面数就只须计算其中“1”出现的次数了。,如何引入随机变量的概念?,一般地,如果A为某个随机事件,则一定可以通过如下示性函数使它与数值发生联系: 如果A发生 如果A不发生 这些例子中,试验的结果能用一个数x来表示,这个数x是随着试验的结果的不同而变化的,也即它是样本点的一个函数,这种量以后称为随机变量。下面我们就来考虑应当如何给这种量以严格的数学定义。,如何引入随机变量的概念?,正如对随机事件一样,我们所关心的不仅是试验会出现的结果,更重要的是要知道这些结果将以怎样的概率出现,也即对随机变量我们不但要知道它取什么数值,而且要知道它取这些数值的概率。,本书约定:,大写字母,如:X, Y, Z, W等,表示随机变量; 小写字母,如x, y, z, w等,表示实数;,2 离散型随机变量及其分布律,设随机试验的样本空间为S=e, X=X(e)是定义在样本空间S上的单值实函数,称X=X(e)为随机变量。,随机变量,X 取其各个可能值xk(k1,2,)的概率PXxkpk,称为离散型随机变量X的概率函数(概率分布或分布律)。分布率也可以用表格的形式来表示: 称为随机变量X的分布律。,如果随机变量X的取值是有限个或可列无限多个,则称X为离散型随机变量。,离散型随机变量的概念,离散型随机变量的概率分布,由概率的定义,pk满足如下条件: (1)pk0; (2),例2:设一汽车在开往目的地的道路上需经过四组信号灯,每组信号灯以1/2的概率允许或禁止汽车通过。以X表示汽车首次停下时,它已通过的信号灯的组数(设各组信号灯的工作是相互独立的),求X的分布律。 解 以p表示每组信号灯禁止汽车通过的概率,易知X的分布律为,或写成 PX=k=(1-p)kp, k=0,1,2,3, PX=4=(1-p)4 以p=1/2代入得,(0-1)分布的分布律也可写成,(01)分布,设随机变量X只可能取0与1两个值,它的分布律是 PXkpk(1-p)1-k,k0,1 (0p1), 则称X服从(0-1)分布或两点分布。,关于(01)分布,对于一个随机试验,如果它的样本空间只包含两个元素,即S=e1,e2,我们总能在S上定义一个服从(0-1)分布的随机变量 来描述这个随机试验的结果。 例如,对新生婴儿的性别进行登记,检查产品的质量是否合格,某车间的电力消耗是否超过负荷以及前面多次讨论过的“抛硬币”试验等都可以用(01)分布的随机变量来描述。(0-1)分布是经常遇到的一种分布。,伯努利试验,设试验E只有两个可能结果:A及 ,则称E为伯努利(Bernoulli)试验。,设P(A)p(0p1),此时P( )1-p。将E独立地重复地进行n次,则称这一串重复的独立试验为n重伯努利试验。 这里“重复”是指在每次试验中P(A)p保持不变;“独立是指各次试验的结果互不影响,即若以Ci记第i次试验的结果,Ci为A或 ,i1,2,n“独立”是指 PC1C2CnP(C1)P(C2) P(Cn) n重伯努利试验是一种很重要的数学模型它有广泛的应用,是研究最多的模型之一。,n重伯努利试验,例如,E是抛一枚硬币观察得到正面或反面。A表示得正面,这是一个伯努利试验如将硬币抛n次,就是n重伯努利试验。又如抛一颗骰子,若A表示得到“1点”, 表示得到“非l点”。将骰子抛n次,就是n重伯努利试验。再如在袋中装有a只白球,b只黑球。试验E是在袋中任取一只球,观察其颜色。以A表示“取到白球”,P(A)a(a+b)。若连续取球n次作放回抽样,这就是n重伯努利试验。然而,若作不放回抽样,则每次试验都有P(A)a(a+b),但各次试验不再相互独立,因而不再是n重伯努利试验了。,n重伯努利试验,考虑n重伯努里试验中,事件A恰出现k次的概率。以X表示n重伯努利试验中事件A发生的次数,X是一个随机变量,我们来求它的分布律。X所有可能取的值为0,1,2,n由于各次试验是相互独立的,故在n次试验中,事件A发生k次的概率为,伯努利试验与二项分布,伯努利试验与二项分布,从图中可以看出,对于固定的n及p,当k增加时,b(k;n,p)随之增加并达到某极大值,以后又下降。此外,当概率p越与1/2接近时,分布越接近对称。,固定n和p,当k取何值时,b(n,p)取最大值?,由于对0b(k-1;n,p) 当k=(n+1)p时,b(k;n,p)=b(k-1;n,p) 当k(n+1)p时,b(k;n,p)b(k-1;n,p) 因为(n+1)p不一定是正整数,所以存在正整数m,使得(n+1)p-1m(n+1)P,当k=m时达到极大值。,例:按规定,某种型号电子元件的使用寿命超过1500小时的为一级品.已知某一大批产品的一级品率为0.2,现在从中随机地抽查20只.问20只元件中恰有k只(k=0,1,20)为一级品的概率是多少? 解 这是不放回抽样。但由于这批元件的总数很大,且抽查的元件的数量相对于元件的总数来说又很小,因而可以当作放回抽样来处理,这样做会有一些误差,但误差不大。我们将检查一只元件看它是否为一级品看成是一次试验,检查20只元件相当于做20重伯努利试验。以X记20只元件中一级品的只数,那么,X是一个随机变量,且有Xb(20,0.2)。即得所求概率为,例3:某人进行射击,设每次射击的命中率为0.02,独立射击400次,试求至少击中两次的概率。,解:将一次射击看成是一次试验设击中的次数为X,则Xb(400,0.02)。X的分布律为,例4:设有80台同类型设备,各台工作是相互独立的,发生故障的概率都是0.01,且一台设备的故障能由一个人处理。考虑两种配备维修工人的方法,其一是由4人维护,每人负责20台;其二是由3人共同维护80台试比较这两种方法在设备发生故障时不能及时维修的概率的大小。 解 按第一种方法。以X记“第1人维护的20台中同一时刻发生故障的台数”,以Ai(i1,2,3,4)表示事件“第i人维护的20台中发生故障不能及时维修”,则知80台中发生故障而不能及时维修的概率为 P(A1UA2UA3UA4)P(A1)PX2 而Xb(20,0.01),故有,按第二种方法以Y记80台中同一时刻发生故障的台数。此时,Yb(80,0.01),故80台中发生故障而不能及时维修的概率为 我们发现,在后一种情况尽管任务重了(每人平均维护约27台),但工作效率不仅没有降低,反而提高了。,例8 保险事业是最早使用概率论的部门之一。保险公司为了估计企业的利润,需要计算各种各样的概率,下面是典型问题之一。若一年中某类保险者里面每个人死亡的概率等于0.005,现有10000个这类人参加人寿保险,试求在来来一年中在这些保险者里面,(1)有40个人死亡的概率;(2)死亡人数不超过70个的概率。,解 作为初步近似,可以利用贝努里概型,n=10000, p=0.005,设为未来一年中这些人里面死亡的人数,则所求的概率分别为 (1)b(40;10000,0.005),泊松分布,设随机变量X所有可能取的值为0,1,2,而取各个值的概率为 其中0是常数。则称X服从参数为的泊松分布,记为X丌() 。,易知,PX=k)0,k=0,1,2,且有,关于泊松分布,历史上泊松分布是作为二项分布的近似,于1837年由法国数学家泊松引入的,近数十年来,泊松分布日益显示其重要性,成了概率论中最重要的几个分布之一。 在实际应用中许多随机现象服从泊松分布。这种情况特别集中在两个领域中。一是社会生活,对服务的各种要求:诸如电话交换台中来到的呼叫数,公共汽车站来到的乘客数等等都近似地服从泊松分布,因此在运筹学及管理科学中泊松分布占有很突出的地位;另一领域是物理学,放射性分裂落到某区域的质点数,热电子的发射,显微镜下落在某区域中的血球或微生物的数目等等都服从泊松分布。,例9 对上海某公共汽车站的客流进行调查,统计了某天上午10:30至11:47左右每隔20秒钟来到的乘客批数(每批可能有数人同时来到),共得230个记录,我们分别计算了来到0批,1批,2批,3批,4批及4批以上乘客的时间区间的频数,结果列于下表中,其相应的频率与=0.87的泊松分布符合得很好。 公共汽车客流统计,二项分布的泊松(poisson)逼近(选读),在很多应用问题中,我们常常这样的贝努利试验,其中,相对地说,n大,p小,而乘积=np大小适中。在这种情况下,有一个便于使用的近似公式。 定理 在贝努利试验中,以pn代表事件A在试验中出现的概率,它与试验总数n有关,如果npn ,则当n 时, 在应用中,当p相当小(一般当p0.1)时,我们用下面近似公式,证 记n=npn,则,二项分布的泊松(poisson)逼近,例10 假如生三胞胎的概率为10-4,求在100000次生育中,有0,1,2次生三胞胎的概率。 解 这可以看作贝努利试验;N=100000,P=0.0001,所求的概率直接计算为 b(0;100000,0.0001)=0.000045378 b(1;100000,0.0001)=0.00045382 b(2;100000,0.0001)=0.0022693 这时也可用泊松逼近,=np=10,而 p(0,10)=0.00004540 p(1,10)=0.0004540 p(2,10)=0.002270,2 随机变量的分布函数,离散型随机变量的可能取值可以一个个列出来.但非离散型随机变量却不行,因此,描述非离散型随机变量不能用“随机变量的分布律”来表示. 另一方面,在实际应用中,我们对某些随机变量(如:误差)在某个区间(范围)内的概率更感兴趣. 因此,我们需要研究随机变量所取的值在某一区间的概率.,由于Px1Xx2=PXx2-PXx1,因此,只需求出PXx2及PXx1即可.如:,由于P1X3=PX3-PX1 =1/2 -1/6 =1/3,定义: 设X是一个随机变量, x是任意实数,函数 F(x)=PXx 称为X的分布函数.,引入分布函数后,则有: Px1Xx2=PXx2-PXx1 =F(x2)- F(x1) (*),分布函数的基本性质,分布函数F(x)具有下列性质: F(x)是一个不减函数。即对于任意实数x1,x2(x1x2),有 F(x1) F(x2); F(x)是右连续的。即F(x+0)=F(x),为什么分布函数定义为右连续?,定义左连续或者右连续只是一种习惯。目前,俄罗斯和东欧国家一般定义左连续;西欧和美国一般定义右连续;我国的大多数书籍也采用右连续。左连续和右连续的区别在于计算F(x)时,X=x点的概率是否计算在内。对于连续型随机变量而言,因为一点上的概率等于零,定义左连续和右连续没有什么区别;对于离散型随机变量,如果PX=x0,则左连续和右连续时的F(x)值就不相同了。因此,在阅读关于概率论的参考书时,要注意作者是定义左连续还是右连续的,以免出错。,离散型随机变量分布函数的计算,有了分布律,可以通过下式求得分布函数 显然这时F(x)是一个跳跃函数,我们可以用分布律或分布函数来描述离散型随机变量。,例1 设随机变量X的分布律为 求X的分布函数,并求PX1/2,P3/2X5/2,P2X3. 解,F(X)的图形如下,例2:一个靶子是半径为2米的圆盘,设击中靶上任意同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能击中靶,以X表示弹着点于圆心的距离。试求随机变量X的分布函数。 解 若X2,由题意,有 F(x)=PXx=1. 综合上述,即得X的分布函数为,4 连续型随机变量及其概率密度,考虑连续型随机变量X落在区间(x,x+Dx)内的概率P(x0是区间长度,比值,叫做随机变量X在该区间上的平均概率密度.如果当Dx0时,上述比值的极限存在,则这个极限叫做随机变量X在点x处的概率分布密度(或概率密度),记作f(x):,由于P(xXx+Dx)=F(x+Dx)-F(x), 并根据导数的定义可知,因此,随机变量的概率密度f(x)是分布函数F(x)的导数;也就是说,分布函数F(x)是密度函数f(x)的一个原函数.,由分布函数的定义,并根据牛顿莱布尼兹公式得:,所以,连续型随机变量的分布函数F(x)等于概率密度f(x)在区间(-,x)上的广义积分.,概率密度函数的性质,由分布函数的性质可知,概率密度函数具有以下性质: (1)f(x)0,函数曲线位于x轴上方;,反之,对于定义在(-, )上的可积函数f(x),若它满足性质1和性质2,则由它定义的F(x)是一个分布函数,即它满足分布函数所必须具备的三个性质。,由性质2知道介于曲线y=f(x)与Ox轴之间的面积等于1.,由性质3知,随机变量X落在区间(x1,x2的概率P(x1xx2)等于区间(x1, x2上曲线y=f(x)下的曲边梯形的面积.,连续型随机变量在任何一点的概率,对于连续性随机变量X,X取任一指定实数值a的概率均为0,即PX=a=0。 证明: X的分布函数为F(x),Dx0,则由 Xaa-DxXa 得 0PXaPa-DxXaF(a)一F(a-Dx)。 在上述不等式中令Dx0,并注意到X为连续型随机变量,其分布函数F(x)是连续的。即得 PXa=0,注意 在计算连续型随机变量落在某一区间的概率时,可以不必区分该区间是开区间或闭区间或半闭区间。例如有 PaXbPaXb=PaXb。 在这里,事件X=a并非不可能事件,但有PX=a=0 也就是说,若A是不可能事件,则有P(A)=0; 反之,若P(A)0,并不一定意味着A是不可能事件。 以后当我们提到一个随机变量X的“概率分布”时,指的是它的分布函数;或者,当X是连续型时指的是它的概率密度,当X是离散型时指的是它的分布律。,连续型随机变量的f(x)Dx在概率中的含义,由概率密度f(x)的性质4,有 若不计高阶无穷小,有 PxXx+Dx f(x)Dx 这表示X落在小区间(x,x+Dx上的概率近似地等f(x)Dx 。,例1 设随机变量X具有概率密度 确定常数k;求X的分布函数F(x);求P1X7/2。,相应的分布函数为:,均匀分布,设连续型随机变量X具有概率密度 则称X 在区间(a,b)上服从均匀分布。记为XU(a,b).,分布函数,均匀分布的密度函数与分布函数,例2 设电阻值R是一个随机变量,均匀分布在9001100。求R的概率密度及R落在9501050的概率。 解 按题意, R的概率密度为,指数分布,设连续型随机变量X的概率密度为 其中0为常数,则称X服从参数为的指数分布。,相应的分布函数为:,分布函数,指数分布的无记忆性,正态分布,设连续型随机变量X的概率密度为 其中,(0)为常数,则称X服从参数为,的正态分布或高斯(Gauss)分布,记为XN(,2)。,相应的分布函数为:,分布函数,性质:1.曲线关于x=对称。 2.当x=时取到最大值。 3.固定,改变,曲线沿Ox轴平移;固定,改变(越小),曲线变得越尖,因而X落在附近的概率越大。,正态分布密度函数图示,正态分布分布函数图示,如前所述,对于概率密度有,对于正态分布来说,标准正态分布,当=0,=1时称X服从标准正态分布,记为XN(0,1)。其概率密度和分布函数分别用(x),(x)表示,即有,显然(-x)=1- (x) 另外,有(x)的函数表可查。,设XN(,2),由(x)的函数表得到: P-X+=(1)-(-1)=2(1)-1=68.26 P-2X+2=(2)-(-2)=2(2)-1=95.44 P-3X+3=(3)-(-3)=2(3)-1=99.74 可见,服从正态分布的随机变量虽然取值在(-,+),但其值落在(-3,+3)内几乎是可以肯定的。,例3 将一温度调节器放置在存储着某种液体的容器内,调节器定在d,液体的温度X(以计)是一个随机变量,且XN(d,0.52)。(1)若d=90,求X89的概率;(2)若要求保持液体的温度至少为80的概率不低于0.99,问d至少为多少?,(2)若要求保持液体的温度至少为80的概率不低于0.99,问d至少为多少?,解:按题意需求d满足,设随机变量XN(m,s2), 则随s增大,概率P|x-m|s 应( ) (A)单调增大 (B)单调减少 (C)保持不变 (D)增减不定,设XN(m,s2), F(x)为其分布函数,则对任意实数a,有F(m+a)+F(m-a)=? 解: 因为XN(m,s2),由正态分布的性质知:,从而有:,为什么说正态分布是概率论中最重要的分布?,正态分布表现为其取值具有对称性,极大部分取值集中在以对称点为中心的一个小区间内,只有少量取值落在区间外。在自然现象和社会现象中,大量随机变量都服从或近似服从正态分布。如人的身体特征指标(身高、体重),学习成绩,产品的数量指标等等都服从正态分布。许多较复杂的指标,只要在受到的大量因素作用下每个因素的影响都不显著,且因素相互独立,也可认为近似服从正态分布。又如二项分布、泊松分布在n很大时,也以正态分布为极限分布。因此,可以说正态分布是最重要的分布。,5 随机变量的函数的分布,为什么要讨论随机变量函数的分布?,在实际中,我们常对某些随机变量的函数更感兴趣。例如,在一些试验中,所关心的随机变量往往不能由直接测量得到,而它却是某个能直接测量的随机变量的函数。比如我们能测量圆轴截面的直径d,而关心的却是截面面积Ad2/4。这里,随机变量A是随机变量d的函数。我们将讨论如何由已知的随机变量X的概率分布去求得它的函数Y=g(X) (g()是已知的连续函数)的概率分布。,离散性随机变量函数的分布,若X是离散型随机变量,其分布列为 则Y=g(x)仍为离散型随机变量,其分布律为 yi有相同值时,要合并为一项,对应的概率相加。,例1 设随机变量X具有以下的分布律,试求y=(X一1)2的分布律。,解 Y所有可能的值为0,1,4。由 PY=0=P(X-1)2=0=PX=1=0.1 PY=1=PX=0+PX=2=0.7 PY=4=PX=-1=0.2 即得Y得分布律为,例2 设随机变量X具有概率密度 求随机变量Y=2X+8的概率密度。,例3 设随机变量X具有概率密度fX(x),-x,求Y=X2的概率密度。,连续性随机变量函数的分布,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!