常用概率分布

上传人:lx****y 文档编号:243354214 上传时间:2024-09-21 格式:PPT 页数:84 大小:1.22MB
返回 下载 相关 举报
常用概率分布_第1页
第1页 / 共84页
常用概率分布_第2页
第2页 / 共84页
常用概率分布_第3页
第3页 / 共84页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,医学统计学,流行病与卫生统计学系,1,随机事件的观察结果称之为随机变量,随机变量,连续型随机变量,某区间概率,离散型随机变量,某取值概率,概率密度函数,概率分布,2,一、正态分布的概念和特征,常用概率分布,第一节 正态分布,正态分布是自然界最常见的一种分布,,若指标,X的频率密度曲线对应于数学上的正态分布曲线,,则称该指标服从正态分布。,3,概率密度,4,5,正态分布的,密度函数,,即,正态曲线的方程为,-X+,6,均数为0,标准差为1的正态分布,这种正态分布称为,标准正态分布,。,-Z+,标准正态分布的密度函数:,为标准正态分布的密度函数,即纵坐标的高度,。,对于任意一个服从正态分布N(,2,)的随机变量,可作如下的,标准化变换,,也称,Z变换,,(教材57),7,正态分布的特征,1. 关于 对称。即正态分布以均数为中心,左右对称。,2.,在 处取得概率密度函数的最大值,在 处有,拐点,,表现为 钟形曲线。即,正态曲线在横轴上方均数处最高。,8,3.,正态分布有两个参数,即均数和标准差。,是,位置参数,,是,变异度参数(形状参数),。常用,N(,2,),表示均数为,,标准差为的正态分布;用,N(0,1),表示标准正态分布。 4. 正态曲线下面积分布有一定规律。横轴上,正态曲线下的面积等于100%或1。,9,二、正态曲线下面积的分布规律,正态方程的积分式(分布函数):,F(X)为正态变量X的累计分布函数,反映正态曲线下,横轴尺度自到X的面积,即下侧累计面积 。,标准正态分布方程积分式(分布函数):,(Z)为标准正态变量 u的累计分布函数,反映标准正态曲线下,横轴尺度自到Z的面积,即下侧累计面积 。,10,11,在实际工作中为了方便用查表代替计算,(教材432页),1)表中曲线下面积为到Z的面积。 2),当,和X已知时,,先求出Z值,再用Z值查表,得所求区间占总面积的比例。,当和未知时,,要用样本均数和样本标准差S来估计Z值。 3)曲线下对称于0的区间,面积相等。 4)曲线下横轴上的面积为100%或1。,三、标准正态分布表,12,正态分布是一种对称分布,其对称轴为直线X=,即均数位置,理论上: 1范围内曲线下的面积占总面积的68.27% 1.96范围内曲线下的面积占总面积的95% 2.58范围内曲线下的面积占总面积的99%,实际应用中,: 1 S范围内曲线下的面积占总面积的68.27% 1.96 S范围内曲线下的面积占总面积的95% 2.58 S范围内曲线下的面积占总面积的99%,13,14,标准正态分布的=0,=1,则,相当于区间(-1,1),,1.96相当于区间(-1.96,1.96),2.58的区间相当于区间(-2.58,2.58)。,区间(-1,1)的面积:1-2(-1)=1-20.1587=0.6826=68.26%区间(-1.96,1.96)的面积:1-2(-1.96)=1-20.0250=0.9500=95%区间(-2.58,2.58)的面积:1-2(-2.58)=1-20.0049=0.9902=99.02%,15,正态曲线下面积对称,则区间(1.96,)的面积也是0.025。Z取值于(-1.96,1.96)的概率为1-20.025=0.95,即X取值在区间 上的概率为95%。,例 4-10 X服从均数为,,标准差为 的正态分布,试估计,(1)X取值在区间,上的概率;(2),X取值在区间,上的概率;,先做标准化变化:,16,例 4-11 已知某地1986年120名8岁男童身高数 ,S=4.79 cm ,估计(1)该地8岁男孩身高在130 cm以上者占该地8岁男孩总数的百分比;(2)身高界于120cm128cm者占该地8岁男孩总数的比例;(3)该地80%男孩身高集中在哪个范围?,先做标准化变化:,理论上该地8岁男孩身高在130 cm以上者占该地8岁男孩,总数的7.21%。,17,(2),18,(3),查附表1,标准正态分布曲线下左侧面积为0.10所对应的Z值为-1.28,所以80%的8岁男孩身高值集中在,区间内,即116.9cm129.2cm,19,(一)制定医学参考值范围,参考值范围:指特定的“正常”人群的解剖、生理、生化、免疫等各种数据的波动范围。,制定参考值范围的步骤:,1.,选择“正常”人作为调查对象。,2.,样本含量足够大。,3.,确定取单侧还是取双侧正常值范围。,4.,选择适当的百分界限。,5.,选择适当的方法。,四、,正态分布的应用,20,估计医学参考值范围的方法:,1.,正态近似法,:适用于正态分布或近似正态分布的资料,。,2,.,百分位数法,:适用于偏态分布资料。,过低异常,过低异常,过高异常,过高异常,21,例4-12 某地调查120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,得均数为117.4g/L,标准差为10.2g/L ,试估计该地正常女性血红蛋白的95%医学参考值范围。,分析:,正常人的血红蛋白过高过低均为异常,要制定双侧正常值范围。,该指标的95%医学参考值范围为,22,例3.6 某地调查110名正常成年男子的第一秒肺通气量,得均数为4.2 L,标准差为0.7 L ,试估计该地正常成年男子第一秒肺通气量的95%参考值范围。,该地正常成年男子第一秒肺通气量的95%参考值范围为:不低于3.052L。,分析:,正常人的第一秒肺通气量近似正态分布,且只以过低为异常,要制定单侧下限。,23,例 3 某年某市调查了 200例正常成人血铅含量(,g/100g),如下,试估计该市成人血铅含量的95%医学参考值范围。,24,分析:血铅的分布为偏态分布,且血铅含量只以过高为异常,要用百分位数法制定单侧上限。,25,二、质量控制,为了控制实验中的检测误差,常用 2S作上下警戒线,以 3S作为上下控制线。这里的2S和3S可视为1.96S 和2.58S的约数。其依据是正常情况下检测误差是服从正态分布的。,但影响某一指标的随机因素很多,如果该指标的随机波动属于随机误差,则往往符合正态分布,如果不服从正态分布,则有可能存在,系统误差,7条线分别表示的意义,26,判断异常的8种情况是:,有一个点距中心线的距离超过,3,个标准差(,控制限,以外),在中心线的一侧连续有,9,个点,连续,6,个点稳定地增加或减少,连续,14,个点交替上下,连续,3,个点中有两个点距中心线距离超过,2,个标准差(,警戒限,以外),连续,5,个点中有,4,个点距中心线距离超过,1,个标准差,中心线一侧或两侧连续,15,个点距中心线距离都超出,1,个标准差以内,中心线一侧或两侧连续,8,个点距中心线距离都超出,1,个标准差范围。,27,三、统计处理方法的理论基础,如 统计描述中计算算术平均数、标准差、,统计推断中进行总体均数置信区间估计、,t 检验、F 检验、相关与回归等分析,28,(一)成败型实验,(Bernoulli实验),在医学卫生领域的许多实验或观察中,人们感兴趣的是某事件是否发生。如用白鼠做某药物的毒性实验,关心的是白鼠是否死亡;某种新疗法临床实验观察患者是否治愈;观察某指标的化验结果是否呈阳性等,。,将我们关心的事件A出现称为成功,不出现称为失败,这类试验就称为成-败型实验。指定性资料中的二项分类实验。,第二节 二项分布,(,教材48页和60页,),一、二项分布的概念与特征,29,成-败型,(Bernoulli),实验序列:,满足以下三个条件的n次实验构成的序列称为成-败型实验序列。,1)每次实验结果,只能是两个互斥的结果之一(A或非A)。,2) 相同的实验条件下,每次实验中事件A的发生具有相同的概率。,3) 各次实验独立。各次的实验结果互不影响。,30,(二)二项分布的概率函数,二项分布是指在只能产生两种可能结果(如“阳性”或“阴性”)之一的,n,次独立重复实验中,当每次试验的“阳性”概率保持不变时,出现“阳性”的次数X=0,1,2,n的一种概率分布。,若从阳性率为的总体中随机抽取大小为,n,的样本,则出现“阳性”数为X的概率分布即呈现二项分布,,记作,B,(X;,n,)或B(,n,),。,31,举例,设实验白鼠共3只,要求它们同种属、同性别、体重相近,且他们有相同的死亡概率,即事件“,白鼠用药后死亡,”为A,相应死亡概率为。记事件“白鼠用药后不死亡”为 ,相应不死亡概率为1-。设实验后3只白鼠中死亡的白鼠数为X,则X的可能取值为0,1,2和3,则死亡鼠数为X的概率分布即表现为二项,分,布。,32,独立事件的乘法定理,互不相容事件的加法定理,33,构成成-败型实验序列的,n,次实验中,事件A出现,的次数X的概率分布为:,其中X=0,1,2,,n,。,n,,是二项分布的两个参数,。,对于任何二项分布,总有,34,例4-2 临床上用针灸治疗某型头疼,有效的概率为60%,现以该疗法治疗3例,其中2例有效的概率是多大?,分析:治疗结果为有效和无效两类,每个患者是否有效不受其他病例的影响,有效概率均为0.6,符合二项分布的条件。,2例有效的概率是0.432,35,一例以上有效的概率为:,或,36,(三)二项分布的特征,1. 二项分布的图形特征,n,是二项分布的两个参数,所以二项分布的形状取决于n,。可以看出,当 =0.5时分布对称,近似对称分布。当 0.5时,分布呈偏态,特别是n较小时, 偏离0.5越远,分布的对称性越差,但只要不接近1和0时,随着n 的增大,分布逐渐逼近正态。因此,,或1- 不太小,而n足够大,我们常用正态近似的原理来处理二项分布的问题。,37,38,39,2. 二项分布的均数和标准差,对于任何一个二项分布B(X;n,),如果每次试验出现“阳性”结果的概率均为 ,则在n次独立重复实验中,出现阳性次数,X的总体均数为,方差为,标准差为,40,例 实验白鼠3只,白鼠用药后死亡的死亡概率=0.6,则3只白鼠中死亡鼠数X的总体均数,=30.6=1.8(只),方差为,标准差为,41,如果以率表示,将阳性结果的频率记为 , 则P的总体均数,总体方差为,总体标准差为,式中 是频率,p的标准误,,,反映阳性频率的抽样误差的大小。,42,二、二项分布的应用,概率估计,例4-5 如果某地钩虫感染率为13%,随机观察当地150人,其中有10人感染钩虫的概率有多大?,43,单侧累计概率估计,二项分布出现阳性次数,至少,为K次的概率为,阳性次数,至多,为K次的概率为,44,例4-6 如果某地钩虫感染率为13%,随机观察当地150人,其中,至多,有2人感染钩虫的概率有多大?,至少,有2人感染钩虫的概率有多大?,至少,有20人感染钩虫的概率有多大?,至多有2名感染的概率为:,45,至少有2名感染的概率为:,至少有20名感染的概率为:,46,第三节 Poisson分布的概念与特征,一、,Poisson分布的概念,Poisson分布也是一种离散型分布,用以描述,罕见事件,发生次数的概率分布。Poisson分布也可用于研究单位时间内(或单位空间、容积内)某罕见事件发生次数的分布,如分析在单位面积或容积内细菌数的分布,在单位空间中某种昆虫或野生动物数的分布,粉尘在观察容积内的分布,放射性物质在单位时间内放射出质点数的分布等。Poisson分布一般记作 。,47,Poisson分布可以看作是发生的概率,很小,而观察例数很大时的二项分布。除要符合二项分布的三个基本条件外,,Poisson分布还要求,或1-,接近于0和1,。有些情况,和n都难以确定,只能以观察单位(时间、空间、容积、面积)内某种稀有事件的发生数X等来表示,如每毫升水中大肠杆菌数,每个观察单位中粉尘的记数,单位时间内放射性质点数等,只要细菌、粉尘、放射性脉冲在观察时间内满足以上条件,就可以近似看为Poisson分布。,Poisson,分布作为二项分布的一种极限情况,48,二、Poisson分布的函数式和特征,1.Poisson分布的概率函数为:,式中 为Poisson分布的总体均数,X为观察单位时间内某稀有事件的发生次数;e为自然对数的底,为常数,约等于2.71828。,49,如某地20年间共出生短肢畸形儿10名,平均每年0.5名。就可用 代入Poisson分布的概率函数来估计该地每年出生此类短肢畸形儿的人数为0,1,2的概率P(X)。,50,51,2.Poisson分布的特性:,(1)Poisson分布的的总体,均数,与总体,方差,相等,均为 。,(2),Poisson分布的观察结果有,可加性,。即对于服从Poisson分布的m个互相独立的随机变量X,1,X,2,X,M,,它们之和也服从Poisson分布,其,均数为这m个随机变量的均数之和。,52,Poisson分布的这些性质还可以推广到多个Poisson分布的情形。例如,从同一水源独立地取水样5次,进行细菌培养,每次水样中的菌落数分别为 ,均服从Poisson分布,分别记 为 ,把5份水样混合,其合计菌落,数 也服从Poisson分布,记为 ,其均数为 。,医学研究中常利用Poisson分布的可加性,将小的观察单位合并以增大发生次数X,以便用正态近似法进行统计推断。,53,三、,Poisson分布,的应用,(一),概率估计,例4-7 如果某地新生儿先天性心脏病的发病概率为8,0,/,00,,那么该地120名新生儿中有4人患先天性心脏病的概率有多大?,54,(,二)单侧累计概率计算,Poisson,分布出现阳性次数,至多,为K次的概率为,阳性次数,至少,为K次的概率为,55,例4-8 如果某地新生儿先天性心脏病的发病概,率为8,0,/,00,,那么该地120名新生儿中,至多,有4人患先,天性心脏病的概率有多大?,至少,有5人患先天性心脏,病的概率有多大?,至多有4人患先天性心脏病的概率:,至少有5人患先天性心脏病的概率,56,二项分布、Poisson分布的的正态近似,1.二项分布的正态近似,二项分布的形状取决于n,,当,=0.5时分布对称,当,0.5时,分布呈偏态,特别是n较小时,,偏离0.5越远,分布的对称性越差,随着n的增大,分布逐渐趋向于对称。理论上可以证明,不管如何,当n相当大时,只要,不接近1和0时,,特别是当n,和,n(1-,)都大于5时,,二项分布B(X;n,)近似正态分布N(n,n,(1-,)。,57,二项分布累积概率的正态近似公式为:,为标准正态分布的分布函数,教材61页,58,例4-14 如果某地钩虫感染率为13%,随机观察当地150人, 其中,至少,有20人感染钩虫的概率有多大?,n,=1500.13=19.5,n(1-,)=150(1-0.13)=130.5,至少有20人感染钩虫的概率为50%。,59,2.,Poisson分布的正态近似,Poisson分布,当总体均数 小于5时, 越小,分布越呈偏态,随着 的增大,分布逐渐趋向于对称。理论上可以证明,随着,Poisson分布也渐近为正态分布。,当 时,Poisson分布资料可按正态分布处理。,60,Poisson,分布累积概率的正态近似公式为:,为标准正态分布的分布函数,见教材62页,61,例4-15 实验显示某放射性物质,半小时,内发出的脉冲数服从,Poisson,分布,平均为360个,试估计该放射性物质,半小时,内发出的脉冲数大于400个的概率。,试估计该放射性物质半小时内发出的脉冲数大于,400个的概率为1.66%。,62,小结,掌握内容:,掌握三个常用概率分布的概念、特征及应用、参考值范围的估计,熟悉内容:,二项分布、Poisson分布的概率函数,正态分布的正态曲线下面积分布规律,了解内容:,二项分布、Poisson分布的的正态近似性及近似正态分布的条件,63,软件操作,SPSS,(Statistical Package for the Social Science, Statistical Product and Service Solutions),SAS,(Statistical Analysis System),STATA,(Statistic Data),64,标准正态转换,65,66,67,68,正态性检验,69,70,71,72,73,74,75,案例讨论,P,62,76,习 题,77,1.标准正态分布的均数与标准差是( ),A 0,1 B 1,0 C 0,0 D 1,1,2.正态分布的两个参数与 ,( )对应的正态曲线愈趋扁平。,A 愈大 B 愈小 C 愈大 D 愈小,3.正态分布的两个参数与 ,( )对应的正态曲线平行右移。,A 增大 B 减小 C 增大 D 减小,78,4. 随机变量X服从正态分布N(,1,1,2,),随机变量Y服从正态分布N(,2,2,2,),X与Y独立,则X-Y服从( ),A N(,1,+ ,2,1,2,- ,2,2,) B N(,1,- ,2,1,2,- ,2,2,) C N(,1,-,2,1,2,+,2,2,) D N(0,1,2,+,2,2,),5. 二项分布的概率分布图在( )条件下为对称图形。,A n50 B =0.5 C =1 D n5,6. ( )的均数等于方差。,A 正态分布 B 二项分布,C Poisson分布 D 对称分布,79,7. 设X,1,X,2,分别服从以,1,2,为均数的Poisson分布,且X1,X2独立,则X,1,+,X,2,服从以( )为方差的Poisson分布。,A ,1,2,+,2,2,B ,1,+,2,C (,1,+,2,),2,D (,1,+,2,),-1/2,8. 满足( )时,二项分布B(n ,)近似正态分布。,A n 和n(1-) 均大于等于5 B n 或n(1-) 均大于等于5,C n50 D n足够大,9. 满足( )时,Poisson分布P()近似正态分布。,A 无限大 B 20,C =1 D =0.5,80,10. 满足()时,二项分布B(n ,)近似Poisson分布。,A n 和n(1-) 均大于等于5,B n,C n很大且接近0.5 D n很大且接近0,11. 观察某地100名12岁男孩身高,均数为138.00cm,标准差为4.12cm,Z=(128.00-138.00)/4.12。(Z)是标准正态分布的分布函数,1- (Z)=1- (-2.43)=0.9925,结论是( ),A 理论上身高低于138.00cm的12岁男孩占99.25%,B 理论上身高高于138.00cm的12岁男孩占99.25%,C 理论上身高低于128.00cm的12岁男孩占99.25%,D 理论上身高高于128.00cm的12岁男孩占99.25%,81,作 业,1 根据1999年某地某单位的体检资料,116名正常成年女子的血清甘油三酯(mmol/L)测量结果如下表,请据此资料:,描述集中趋势应选择何指标?并计算之。,描述离散趋势应选择何指标?并计算之。,求该地正常成年女子血清甘油三酯的95%参考值范围。,试估计该地正常成年女子血清甘油三酯在0.8 mmol/L以下者及1.5mmol/L以下者各占正常女子总人数的百分比。,82,83,谦受益,满招损,84,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!