第三章几种常见的概率分布律

上传人:痛*** 文档编号:149869939 上传时间:2022-09-08 格式:PPT 页数:37 大小:460.50KB
返回 下载 相关 举报
第三章几种常见的概率分布律_第1页
第1页 / 共37页
第三章几种常见的概率分布律_第2页
第2页 / 共37页
第三章几种常见的概率分布律_第3页
第3页 / 共37页
点击查看更多>>
资源描述
第三章 几种常见的概率分布律离散型变量离散型变量连续型变量连续型变量二项分布二项分布泊松分布泊松分布超几何分布负二项分布指数分布正态分布正态分布第一节第一节 二项分布二项分布(Binomial Distribution)1.贝努利试验和在什么情形下应用二项分布贝努利贝努利试验试验(Bernoulli trial):试验只有两种可能的结果,并且发生每种结果的概率是一定的。例如:抛一枚硬币,看得到正面还是反面;掷一次骰子,看得到6还是没有得到6;随机抽查一名婴儿的性别,看是男是女 在贝努利试验里,两种结果可分别称为“成功成功”和和“失败失败”,或者“事件A发生”和“事件A没有发生”。什么情形时应用二项分布什么情形时应用二项分布:实验中进行了n次独立的贝努利试验,统计在这n次试验中总共获得了多少次“成功”。“成功”的次数,记为变量Y;Y称为二项分布变量,Y的概率分布称为二项分布。(1)连续抛硬币100次,统计总共出现正面的次数。次数Y服从二项分布。Y的可能取值为0,1,2,n。所以Y是个离散型变量。二项分布变量的一些例子:二项分布变量的一些例子:(2)调查250名新生婴儿的性别,记男婴的总数为Y,则Y服从二项分布。(3)调查n枚种蛋的出雏数,出雏数Y服从二项分布。(4)n头病畜治疗后的治愈数Y,Y服从二项分布。(5)n尾鱼苗的成活数Y,Y服从二项分布。2.二项分布的常用符号样本含量)贝努利试验的次数(或:n的取值布变量出现的次数,即二项分次试验中事件在YAn:y)(A:每次试验都是恒定的发生的概率事件发生的概率事件A:1)yY(PY:)y(p的概率函数即yyi)y(p)yY(P)(Fiy3.二项分布的概率函数P(y)v怎样得到P(y)?种:次成功的方式有次贝努利试验里,获得在2424C以以n4,y2为例,欲求为例,欲求P(y2)?。ffss fsfs fssf sffs sfsf ssff612121234!2!2!4 ,)!y(!y!24y24依据计算公式位置的组合方式。是从四个位置选取两个:注意CnnCCn每种方式发生的概率为:22)1()(1)(1f)P(f)P(s)P(s)P(P(ssff)乘法法则其它5种方式发生的概率也是如此。24224)1()2(2y4CPn次成功的概率为次试验中取得因此,在yyy)1()y(y *nnCPn次成功的概率是得此贝努利试验中,共获在由此类推到一般情形,的讨论:关于yyy)1()y(nnCP”这个名称。项,所以有“二项分布的第展开是二项式)从形式上来说,(1y)1()1(1yyynnnC0yyy11100)1()1()1()1()1(nnnnnnnnnnCCCCnnnnnnCP0y0yyyy11)1()1()y(2)(例一,纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子二代中白猪与黑猪的比率为3:1。求窝产仔10头,有7头白猪的概率。,视白猪为成功,有个二项分布的问题,解:根据题意,这是一7y75.043 ,10 n7107710)75.01(75.0)7()7y(CPP2503.025.075.0!3!7!1037所以,窝产仔10头,有7头白猪的概率是0.2503。例二,有一批玉米种子,出苗率为0.67。现任取6粒种子种1穴中,问这穴至少有1粒种子出苗的概率是多少?服从二项分布。则设出苗的种子数为。视出苗为成功,有个二项分布的问题。解:根据题意,这是一y,y67.0 ,6 n)6y()2y()1y()1y()1(PPPPP粒出苗至少有9987.00905.00799.00157.033.067.033.067.033.067.0066642265116CCC这说明每穴种6粒种子,几乎肯定出苗。9987.00013.0133.067.01 )0y(1)(1)1(6006CPPP没有出苗粒出苗至少有另外一种方法:4 二项分布的概率分布表和概率分布图除以P(y)表示,二项分布也可通过表或图来直观显示。YP(y)00.06210.25020.37530.25040.062例如,抛硬币4次,获得的正面数记为Y,则Y服从二项分布。Y的概率分布表为062.05.05.0)0(,5.0,44004CPn时,分布偏斜:时,分布对称;5.05.0Y的概率分布图为注意:时,负偏时,正偏5.05.05 二项分布变量的平均数和标准差v平均数)1()(2nXVarnE)Y(v方差和标准差)1(n例三,某树种幼苗成材率为70,现种植2000株,问成材幼苗数的平均值和标准差是多少?服从二项分布。则株幼苗的成材数为解:设Y,Y2000。根据题意,70.0 ,2000n140070.02000n平均数49.203.07.02000)1(n标准差二项分布(实例)【例】【例】已知100件产品中有5件次品,现从中任取一件,有放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的概率 解:解:设 Y 为所抽取的3件产品中的次品数,则根据二项分布公式有二项分布的程序计算方法v二项分布函数Binomdist(k,n,p,false/true)v某数阶乘的计算函数Factv从给定元素数目m的集合中抽取若干n元素的排列组合数 计算函数Combin(m,n)nmC第二节第二节 泊松分布泊松分布(Poisson Distribution)1.在什么情形下应用泊松分布泊松分布是一种用来描述一定的空间或时间里稀有事件发生次一定的空间或时间里稀有事件发生次数数的概率分布。服从泊松分布的变量的一些例子:一定畜群中某中患病率很低的非传染性疾病患病数或死亡数。畜群中遗传的畸形怪胎数 单位空间内某些野生动物或昆虫数 每升饮水中的大肠杆菌数2.泊松分布的概率函数与特征数泊松分布变量Y只取零和正整数:0,1,2,其概率函数为eP!y)y(y是自然对数底数。其中7182.2 ,0e页。证明见情形下的情形来近似。在这种布可以用二项分布在怎么得到的呢?泊松分注意:46,!y)1(,0,)y(yyyyeCnnPnnv泊松分布的平均数)(XEv泊松分布的方差和标准差)(2XVar例一,显微镜下观察一种悬浮液中的某种颗粒,据前人报告,平均每张样片可以观察到3个微粒,问在一次观察中看到3个微粒的概率是多大?少于3个微粒的概率是多少?若观察100张片子,大约有多少张片子看到的微粒数少于3个?。松分布,且有事件数,所以它服从泊里的稀有,可以看成是一定空间微粒数解:一张片子里看到的3Y2240.0!33!y)3Y(33yeeP4232.0 !23!13!03 )2()1()0()3Y(323130eeeYPYPYPP)(32.424232.0100)3(100张大约有XP程序计算vPoisson(y,true or false)超几何分布v适用范围:多次完全相同并且相互独立的重复试验,如果在有限总体中不重复抽样,抽样成功的次数Y的概率分布服从超几何分布,如福利彩票v数学期望与方差v计算程序:P(Y)=hypgeomdist(y,n,M,N)例子v四川卧龙大熊猫自然保护区共有野生大熊猫100只,其中10只做了标记。某小组去调查研究大熊猫的生活习性,随机观察了15只大熊猫,问这15只大熊猫中有5只做了标记的概率?v解:依题意有N=100,M=10,n=15,y=5,求p(5)vp(5)=hypgeomdist(y,n,M,N)=hypgeomdist(5,15,10,100)=0.00569第三节第三节 正态分布正态分布(Normal Distribution)正态分布是一种最重要的连续型变量的概率分布。在生物科学研究里,有许多变量是服从或近似服从正态分布的,如水稻产量、小麦株高、玉米百粒重等;许多统计分析方法是以正态分布为基础的。不少随机变量的概率分布在样本容量增大时趋于正态分布。因此,在统计学里,正态分布无论在理论研究上还是在实际应用中均占有重要的地位。1 正态分布的定义与主要特征v定义:若变量Y的概率分布的密度函数为222)y(21)y(ef。服从正态分布,记为为方差,则称变量为平均数,其中,),(YY22Nf(y)的曲线为 Y的分布函数y21y)y()yY()y(y2)y(y22dedfPF没有更简化的形式v正态分布曲线的主要特征:(1)曲线是单峰、对称的“悬钟”形曲线,对称轴是x=(2)曲线是非负函数,以x轴为渐近线,分布从到(3)曲线在x=处各有一个拐点,即在-,+范围内是上凸,其余是下凸。(4)曲线有两个参数:和。代表平均数,代表标准差,和一起决定曲线的位置和形状。越大,则曲线沿x轴越向右移动;反之向左。是变异度参数,愈大则曲线愈“胖”;反之则愈瘦。(5)曲线下和x轴所夹的总面积为1=0.5=1=22 标准正态分布v定义:=0,=1时的正态分布称为标准正态分布。标准正态分布变量记为U,写作 UN(0,1)。2221)(ueu密度函数:y21)()(2/y2deuUPuu分布函数:的曲线:密度函数)(u3 标准正态分布的概率计算v查表法:附表2(325页)列出了标准正态变量的累积分布函数值,即U小于某个值u的概率:P(Uu)左边的面积即为表中列出的数值uu)(关系式:)()()()()(abaUPbUPbUaP)()(ccUP)()(1)(1)(dddUPdUP)53.134.0()4(),56.2|(|)3(),58.2()2(),64.1()1(),1,0(UPUPUPUPNU试求:例一,已知05050.0)64.1(1查表)解:(UP00494.099506.01)58.2(1)58.2()2(查表UPUP01046.000523.02)56.2(2U2)56.2|(|)3()(UP30392.063307.093699.0)34.0()53.1()53.134.0()4(UPUPUP定理:4 一般正态分布的概率计算通过如下定理,将一般正态分布变量转化成标准正态分布变量来求。)1,0(Y),(Y2NN,则假设变量baPbaPY)Y(因此,baPU定理abcPcPY)Y(同理,ccUPdPdPY)Y(dUPddUP11。求下列概率:例二,如果变量)40Y26()3();40Y()2();26Y()1()5,30(Y2PPPN21186.0)8.0(53026530Y)26Y()1(查表解:UPPP02275.097725.01)2(1 53040530Y1)40Y(1)40Y()2(查表UPPPP76539.021186.097725.0)8.0()2()28.0(53040530Y53026)40Y26()3(查表UPUPUPPP关于一般的正态分布,以下的一些概率经常用到:变量Y落在的不同倍数区间的概率。6826.0)Y(P9545.0)2Y2(P9973.0)3Y3(P95.0)96.1Y96.1(P99.0)58.2Y58.2(P这些结论可以用一个实例来印证:以第一章里的120头母羊的体重资料为例:41.5 ,9.51ys由表可见,实际频率与理论概率相当接近,说明120头基础母羊体重资料的频率分布接近正态分布,从而可推断基础母羊体重这一随机变量很可能是服从正态分布的。5 正态分布的单侧、双侧临界值(分位数)附表2列出了概率的数值,即对于给定的u,列出了曲线下u左边的面积。,已知面积为在以后的统计推断中,我们经常需要做与上面相反的工作:即已知曲线下右侧尾区的一定面积,求对应的临界值u?u的值。页)给出了(附表。上侧临界值的称为uu328 3,已知面积为uu。下侧临界值的称为。;同时,我们有因此,uuUPuUP )()(。双侧,也可以记为双侧临界值的称为那么平均分配到两侧,即如果将面积下侧。全部放在曲线的上侧或的单侧临界值是将面积)(,)|(|2/2/uuuUP的上侧临界值的双侧临界值注意:22/2/2/u界值和双侧临界值。的上侧临界值、下侧临和例三,求01.005.0;645.105.0)1(305.0查表时,上侧临界值解:u;645.105.0 u所以,下侧临界值96.1)(3025.005.0查表双侧双侧临界值uu;326.201.0)2(301.0查表时,上侧临界值u;326.201.0u所以,下侧临界值576.2)(3005.001.0查表双侧双侧临界值uu注意:这些临界值在第五章假设检验时经常用到
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 成人自考


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!