第二章 概率与分布

上传人:ll****x 文档编号:145357025 上传时间:2022-08-29 格式:DOC 页数:6 大小:309.50KB
返回 下载 相关 举报
第二章 概率与分布_第1页
第1页 / 共6页
第二章 概率与分布_第2页
第2页 / 共6页
第二章 概率与分布_第3页
第3页 / 共6页
点击查看更多>>
资源描述
第二章 概率与分布(35)(骆福添)联系:对象在离散点或区间上分布分布特征数样本数据频数分布表频数分布图描述指标 () (p)随机变量概率分布表概率分布图总体参数 () (p)2。 二项分布一、概率函数 (概率分布表)名词解释:观察结果二项、概率等于二项展开式有放回地独立重复摸球5次后黑球出现总次数X的概率函数。x 表2。1 例2。3中离散型随机变量X的概率函数(n=)X的可能取值黑球数0345 概率P(x)0。00030640.05120.208.49.327这个概率函数值恰好对应于下列二项展开式的各个项:(0.2+0。)5 (0.) +(08)(02)+(08)2 (0。) +(.8)3 (0.2) +(08)4 (0.2)+(0.8)5一般地,阳性概率为p,次独立、重复试验后该事件出现阳性数为次的概率为, x=0, 1, , n(。1) 其中, 0!=1, k!=k(k1)(2)(1),k0 (2。3)式称为二项分布的概率函数,称相应的随机变量X服从二项分布(binoildistribution), 记为X(p, n)至多出现x次数的概率为P=P()+P()P(x),简记为(2。) 这就是二项分布变量X的分布函数.例23 现有5只动物注射了半数致死量的毒物,试分别计算死亡动物数X0, , 2, 3, 4, 的概率。(提示:p0)解 (0)=(0.5)5 (0.5) .12 P(1)(0.5) (05)1015625 P(2)(。5)3(0)2 0。3250 P(3)=(0.5)2 (05) =0350 P(4)(0.)1(0.5) 0.1562 P(5)=(05)0(0.5)5 。0125二、分布图形的特征 (概率分布图)图2.1p0。5时,在横轴的正方向拖一长尾呈正偏峰(a)p0.时, 在横轴的负方向拖一长尾呈负偏峰()p=0。5时, 呈对称(c)n相当大,np和n(-p)都大于5,p=?,图形也接近对称(d)Pois01234500.10.20.30.40.5(a) p0.50 (负偏峰)图2.1 若干二项分布的概率函数直条图13012345678910111200.10.20.30.4 (d) p0.50, n相当大 (对称、正态)01234500.10.20.30.40.5(c) p=0.50 (对称)三、总体均数与总体标准差 (平均水平与变异程度-分布参数)推导过程:(下述黑体字公式,可忽略)(2。15)=(。6)(2。17)(218)(2。19)(2.20)=(.21)样本频率的总体均数、总体方差和总体标准差mx=np, mp=p ,(。22), 四、实例讨论(略)第四节 Poissn分布一、概率函数Pisn分布是()罕见的独立事件阳性数目的随机分布(2)也可视为n很大,p很小时二项分布(p,n)的极限情形以放射性脉冲计数为例,sson分布的前提条件:() (n足够大),区间足够小,以致每个区间阳性数2(平稳性)() 每个区间阳性概率都是(重复、小概率)(3) 不同区间是否发生是统计独立的(独立性)数学上可以证明,当n时P(x)的极限为(2.3)应用:许多发病率很低的疾病(如肿瘤,不具传染性、无永久免疫、无遗传性),发病人数X近似地服从Poisson分布,其中二、分布图形的特征例4 据报导,新生儿染色体异常率为,试用两种方法计算10名新生儿发生0, 1, 2例染色体异常的概率。解 利用二项分布和Poiss分布计算的结果如表。所示表2。2 用二项分布和PISSON分布计算染色体异常概率的比较P(x)(1, 00)(1)0(0。99)10 (。0)0=0。660e ()0 /0!036791(099)00- (0。01)10.369-1 ()1 !=0。3(0。99)00-2 (0。01)0。491 ()2 /!=0。189oisson分布图形:呈正偏峰不可能出现负偏峰的图形f_3a三、总体均数和总体方差二项分布的总体均数和总体方差为 和ison分布的总体均数和总体方差为 和 即总体均数等于总体方差。这是oissn分布独有的性质,可通过考察样本均数是否接近样本方差, 来判断是否为Poisson分布四、可加性设X1(), 2 (2), 且互相独立, 则X1X2 (1 +) 例如,假定每10分钟内记录到的放射性脉冲数服从(),独立、重复2次,测定值为X1和X2 , 则它们之和服从(2).但须注意,设X(), 则2X并不服从(2),X/也不服从(2)。例如, 0分钟内测定的放射性脉冲数乘2后并不等于0分钟内的测定资料, 不能用(2)来描述; 10分钟的测定值除以2后也不等于5分钟内的测定值, 也不能用(/2)来描述。第五节 正态分布一、概率密度函数实践中许多连续型随机变量的频率密度直方图形状是中间高、两边低、左右对称的, 为便于研究相应的总体规律, 人们用概率密度函数(.24) f2_3 来描述这类随机变量,并称这样的变量服从正态分布(nomal distributio)或高斯分布(Gauian dstbtion)。 正态分布有两个参数和。是总体均数;是总体标准差(永远大于零)。这两个参数可完全决定一个正态分布,故常简记为N(, 2)。当0,1时,概率密度函数和分布函数分别为密度函数 分布函数 (25)这样的正态分布称为标准正态分布, 简记为(0, 1)。正态概率密度曲线图性质:(1)关于对称;(2)在处曲线最高;(3) 在处各有一个拐点;(4) 曲线下面积为1;() 若固定, 随值不同, 曲线位置不同, 故称为位置参数;(6) 若固定, 大时,曲线矮而胖;小时, 曲线瘦而高,故称为形状参数。 m-2s m-s m m+s m+2s -2 -1 0 1 2 xz (a) (b)图2.3 正态概率密度图 (a)一般形状 (b)与m和s关系 m1 m2s2s1 s1t23正态曲线要点:外观(对称 吊钟)、参数(位置m 形状s)、面积(1。45,1.9,58)t23二、正态概率密度曲线下的面积标准化变换:(22) 变换后的Z称为标准化正态离差或称值(Zve)正态变量的Z值服从标准正态分布N(0, 1)标准正态分布尾部面积a:f2_3表23 标准正态分布几个重要的临界值 双侧临界值Za单侧尾部面积双侧尾部面积1.6450。5011。960.050。2.5760。050.01三、参考范围的确定方法:95参考值范围(9%CI)(错误概率a=.,把握度095)(16s, 1.96s) 或 9参考值范围(5I)(错误概率a0.0,把握度=0。)(2.58s, 2.58) 或 四、二项分布和Psn分布的正态近似。 连续性校正离散型变量只能在, 1, 2, 等正整数取值,为了借用连续型变量的分布函数来计算概率,首先要把概率函数“连续化”,把概率函数图中的“直条”改造成“直方” (a) 概率函数直条图 (b) 连续性校正直方图 (c) 正态近似图图2.4 二项分布连续性校正和正态近似示意图表2.4二项分布概率的连续性校正和正态近似(1)(2)(3)(4)二项分布概率连续性校正后概率函数图上长方形所在的区间近似正态分布概率密度图上曲线下图形所在区间 概率近似公式:在相应的区间上,近似正态分布概率密度曲线下图形的面积(Xk)(-0, k+0.5)(k-05, k0.5)P(X)(0, k+5)(,+.5)(X)(k-0。, )(-0。5, +)P(Xk2)(k10。, 2+。5)(k05,k2+0)2。 正态近似 理论上可以证明()二项分布X(p,n) XN(np, p(1p)近似 并且P= N(p, p(1-p)/) (2)Poisson分布则X N(, )例25 假定人群中某病患病概率为0.00,现对该人群中的1000人体检, 试求检出人数不少于5人的概率。解 可认为检出人数服从二项分布二项分布资料用oisn分布近似与正态近似比较直接计算正态近似相对误差二项分布。2572。26161。7Poisson分布0。570。262。8%相对误差0.3 计算过程:P(55)=0.57或据Poison分布,令参数10000。05=50,P(55)=0。57 计算繁杂.现采用正态近似,np=50,np(p)=500。995=49。5 利用二项分布正态近似公式P(x55)=0.2616 利用oiso分布的正态近似公式P(55)=。2624两者与0。572的相对误差均小于2%.结语:对象在离散点或区间上分布分布特征数样本数据频数分布表频数分布图描述指标 () (p)随机变量(误差)概率分布表概率分布图总体参数 () (p)文中如有不足,请您见谅!6 / 6
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!