雷静卫生统计学-第五章-常用概率分布-课件

上传人:沈*** 文档编号:241843674 上传时间:2024-07-29 格式:PPT 页数:44 大小:617KB
返回 下载 相关 举报
雷静卫生统计学-第五章-常用概率分布-课件_第1页
第1页 / 共44页
雷静卫生统计学-第五章-常用概率分布-课件_第2页
第2页 / 共44页
雷静卫生统计学-第五章-常用概率分布-课件_第3页
第3页 / 共44页
点击查看更多>>
资源描述
第五章第五章 常用概率分布常用概率分布二项分布二项分布泊松分布泊松分布正态分布正态分布二项分布及其应用二项分布及其应用二项分布的概念与特征二项分布的概念与特征 二项分布的应用二项分布的应用二项分布的概念二项分布的概念u在医学领域中,有一些随机事件是只具有两在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分种互斥结果的离散型随机事件,称为二项分类变量(类变量(dichotomous variable),如),如对病人治疗结果的有效与无效,某种化验结对病人治疗结果的有效与无效,某种化验结果的阳性与阴性,接触某传染源的感染与未果的阳性与阴性,接触某传染源的感染与未感染等。感染等。u二项分布(二项分布(binomial distribution)就是)就是对这类只具有两种互斥结果的离散型随机事对这类只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。件的规律性进行描述的一种概率分布。u只有两种可能结果的随机试验,当成功的概率只有两种可能结果的随机试验,当成功的概率()是恒定的,且各次试验相互独立,这种)是恒定的,且各次试验相互独立,这种试验在统计学上称为试验在统计学上称为贝努里贝努里试验(试验(Bernoulli Bernoulli trialtrial)。如果进行)。如果进行n n 次贝努里试验,取得成功次贝努里试验,取得成功次数为次数为X X(X X=0,1,=0,1,n n)的概率可用下面的二项)的概率可用下面的二项分布概率公式来描述:分布概率公式来描述:二项分布的概念二项分布的概念二项分布的概念二项分布的概念二项分布的概率函数:二项分布的概率函数:式中的式中的n为独立试验的次数,为独立试验的次数,为成功的概率,(为成功的概率,(1-)为失败的概率,)为失败的概率,X为在为在n次试验中出现成功的次数,次试验中出现成功的次数,二项系数:表示在二项系数:表示在n次试验中出现次试验中出现X的各种组合情况。的各种组合情况。该式含义为:该式含义为:含量为含量为n的样本中,恰好有的样本中,恰好有X例阳性的概率。例阳性的概率。P63P63例例5-15-1、5-25-2二项分布的概念二项分布的概念二项分布的应用条件:二项分布的应用条件:u各观察单位只能具有相互对立的一种结果(互斥各观察单位只能具有相互对立的一种结果(互斥的两分类资料)的两分类资料)u已知发生某一结果的概率为已知发生某一结果的概率为,其对立结果的概,其对立结果的概率为率为1-,实际工作中要求,实际工作中要求是从大量观察中获是从大量观察中获得比较稳定的数值。得比较稳定的数值。un次试验在相同条件下进行,且观察结果相互独次试验在相同条件下进行,且观察结果相互独立。如要求疾病无传染性、无家族性等。立。如要求疾病无传染性、无家族性等。二项分布的特征二项分布的特征二项分布的图形及其正态近似性:二项分布的图形及其正态近似性:u已知已知和和n,就能按公式计算,就能按公式计算X=0,1,n时时的的P(X)值。以)值。以X为横坐标,以为横坐标,以P(X)为纵坐)为纵坐标作图,即可绘出二项分布的图形,如图标作图,即可绘出二项分布的图形,如图5-1,图图 5-2;u二项分布的高峰在二项分布的高峰在=n 处。当处。当 接近接近0.5时,图时,图形是对称的;形是对称的;离离0.5愈远,对称性愈差,但随着愈远,对称性愈差,但随着n的增大,分布趋于对称。的增大,分布趋于对称。u当当n较大,较大,nP和和n(1P)都大于都大于5时,二项分布时,二项分布近似于正态分布近似于正态分布。二项分布的特征二项分布的特征二项分布的均数和标准差:二项分布的均数和标准差:=n =(原理见原理见P64P64例例5-35-3)用率表示时,即上式分别除以用率表示时,即上式分别除以n,得,得 p=p=sp=二项分布的应用二项分布的应用从阳性率为从阳性率为的总体中随机抽取含量为的总体中随机抽取含量为n的样本,则的样本,则有:有:u概率估计:可计算恰好有概率估计:可计算恰好有X例阳性的概率例阳性的概率u累积概率的计算:累积概率的计算:(1)最多有)最多有k例阳性的概率例阳性的概率其中,其中,X=0,1,2,k,n。(2)最少有)最少有k例阳性的概率例阳性的概率P63P63例例5-25-2P81 P81 思考与练习思考与练习4.54.5小结小结u二项分布的特征二项分布的特征u二项分布的均数和标准差二项分布的均数和标准差u二项分布的正态近似条件二项分布的正态近似条件泊松分布泊松分布泊松分布的概念与特征泊松分布的概念与特征 泊松分布的应用泊松分布的应用Poisson分布,用于研究单位时间、单位人分布,用于研究单位时间、单位人群、单位空间内,某罕见事件发生次数的概群、单位空间内,某罕见事件发生次数的概率分布。是描述小概率事件出现规律性的一率分布。是描述小概率事件出现规律性的一种重要的离散型分布。种重要的离散型分布。如某种细菌在单位容积空气或水中出现的情如某种细菌在单位容积空气或水中出现的情况,某段时间特定人群中某种恶性肿瘤患者况,某段时间特定人群中某种恶性肿瘤患者的分布或出生缺陷的发病情况,放射性物质的分布或出生缺陷的发病情况,放射性物质在单位时间内的放射次数,单位空间某种昆在单位时间内的放射次数,单位空间某种昆虫数的分布等等。虫数的分布等等。Poisson分布的概念分布的概念Poisson分布的应用条件:分布的应用条件:事件发生的概率事件发生的概率不变不变每个事件的发生是相互独立的每个事件的发生是相互独立的Poisson分布的概念分布的概念Poisson分布的概率函数:分布的概率函数:X=1,2,3 意义:意义:单位时间(单位人群、单位空间内,单位单位时间(单位人群、单位空间内,单位容积)内,某罕见事件发生次数的概率分布容积)内,某罕见事件发生次数的概率分布 Poisson分布的特征由参数分布的特征由参数确定。确定。Poisson分布的特征分布的特征Poisson分布的图形:分布的图形:已知已知,就可按公式计算得,就可按公式计算得出出X=0,1,2,时的时的P(X)值,以)值,以X为横为横坐标,以坐标,以P(X)为纵坐标作图,即可绘出)为纵坐标作图,即可绘出Poisson分布的图形,如图分布的图形,如图5-3。Poisson分布的特征分布的特征Poisson分布的形状取决于分布的形状取决于的大小。的大小。值越小,分布越偏,随着值越小,分布越偏,随着的增大,的增大,分布越趋于对称,当分布越趋于对称,当=20时,分布时,分布接近正态分布。接近正态分布。1.Poisson分布是一种单参数的离散型分布,其参数分布是一种单参数的离散型分布,其参数为为,它表示单位时间或空间内某事件平均发生的次,它表示单位时间或空间内某事件平均发生的次数,又称强度参数。数,又称强度参数。2.Poisson分布的总体方差分布的总体方差2与总体均数与总体均数相等,即相等,即2=。3.Poisson分布的观察结果有可加性。若从总体均分布的观察结果有可加性。若从总体均数为数为1的的Poisson分布总体中随机抽出一份样本,分布总体中随机抽出一份样本,其中稀有事件的发生次数为其中稀有事件的发生次数为X1,再独立地从总体均,再独立地从总体均数为数为2的的Poisson分布总体中随机抽出另一份样本,分布总体中随机抽出另一份样本,其中稀有事件的发生次数为其中稀有事件的发生次数为X2,则它们的合计发生,则它们的合计发生数数T=(X1+X2)也服从)也服从Poisson分布,总体均分布,总体均数为(数为(1+2)。Poisson分布的特性:分布的特性:上述性质还可以推广到多个上述性质还可以推广到多个Poisson分布的情形。分布的情形。例如,从同一水源独立地取水样例如,从同一水源独立地取水样5次,进行细菌培次,进行细菌培养,每次水样中的菌落数分别为养,每次水样中的菌落数分别为Xi,i=1,5,均服从均服从Poisson分布,分别记为分布,分别记为(i i i i),i=1,5,那么把,那么把5份水样混合,其合计菌落数份水样混合,其合计菌落数 也也服从服从Poisson分布,记为分布,记为(1 1 1 1+2 2 2 2+5 5 5 5)医学研究中常利用其可加性,将小的观察单位合并,医学研究中常利用其可加性,将小的观察单位合并,来增大发生次数来增大发生次数X,以便用后面讲到的正态近似法,以便用后面讲到的正态近似法作统计推断。作统计推断。1.概率估计:可求出单位时间(单位人群、概率估计:可求出单位时间(单位人群、单位空间内,单位容积)内,某罕见事单位空间内,单位容积)内,某罕见事件发生次数为件发生次数为X的概率大小的概率大小 X=1,2,3 Poisson分布的应用分布的应用P68:例:例5-7、例、例5-82.累积概率的计算:累积概率的计算:单位时间或空间内事件发生的次数最多单位时间或空间内事件发生的次数最多为为k次的概率:次的概率:X=0,1,2,3k Poisson分布的应用分布的应用P68:例:例5-9、例、例5-102.累积概率的计算:累积概率的计算:单位时间或空间内事件发生的次数最少单位时间或空间内事件发生的次数最少为为k次的概率:次的概率:Poisson分布的应用分布的应用P69:例:例5-10P81 思考与练习思考与练习6.小结小结泊松分布的均数和标准差泊松分布的均数和标准差泊松分布的正态近似条件泊松分布的正态近似条件正态分布正态分布正态分布的概念与特征正态分布的概念与特征 正态分布的应用正态分布的应用图图5.1 频数分布逐渐接近正态分布示意图频数分布逐渐接近正态分布示意图正态分布的概念与特征正态分布的概念与特征正态分布的概念与特征正态分布的概念与特征1.1.正态分布的图形:正态分布的图形:正态分布密度函数方程正态分布密度函数方程当方程中的两个参数确定后,即可绘出正态分布的图形当方程中的两个参数确定后,即可绘出正态分布的图形正态分布的概念与特征正态分布的概念与特征2.2.正态分布的特征正态分布的特征 1 1)正态曲线在横轴上方,均数处最高;)正态曲线在横轴上方,均数处最高;2 2)以均数为中心,左右对称。对称轴)以均数为中心,左右对称。对称轴 3 3)正态分布由两个参数决定,即均数和标准差。)正态分布由两个参数决定,即均数和标准差。均数为位置参数,标准差为变异参数。当标准差均数为位置参数,标准差为变异参数。当标准差恒定时,均数越大,曲线沿横轴越向右移;反之恒定时,均数越大,曲线沿横轴越向右移;反之则向左移。当均数恒定时,标准差越大,数据越则向左移。当均数恒定时,标准差越大,数据越分散,曲线最高点越向下分散,曲线最高点越向下.4 4)正态曲线下的面积分布有一定的规律。)正态曲线下的面积分布有一定的规律。正态曲线下面积的分布规律:正态曲线下面积的分布规律:标准正态分布标准正态分布 将正态分布的方程作如下变量变换将正态分布的方程作如下变量变换即将原正态分布曲线图的原点移到即将原正态分布曲线图的原点移到的位置,横轴尺度以的位置,横轴尺度以为为单位,就可将正态分布变换为标准正态分布单位,就可将正态分布变换为标准正态分布(standard normal(standard normal distribution)distribution),用,用 N(0,1)N(0,1)表示,表示,称为标准正态变量或标称为标准正态变量或标准正态(离)差(准正态(离)差(standard normal deviatestandard normal deviate)。其密度函数)。其密度函数为:为:实际工作中,常需要了解正态曲线下横轴上某一区间实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或估计观察值落在该区总例数的百分数(频数分布)或估计观察值落在该区间的概率。间的概率。正态曲线下一定区间的面积可以通过正态曲线下一定区间的面积可以通过P P466466附表附表1 1求得。求得。表内所示数据表示表内所示数据表示取不同值时取不同值时值左侧标准正态曲值左侧标准正态曲线下面积,记作线下面积,记作(),),()称为标准正态分)称为标准正态分布的分布函数。布的分布函数。对于正态或近似正态分布的资料,已知均数和标准差,对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概率估计。就可对其频数分布作出概率估计。正态曲线下面积的分布规律正态曲线下面积的分布规律正态曲线下面积的分布规律正态曲线下面积的分布规律例:已知成年男子红细胞数服从正态分布,例:已知成年男子红细胞数服从正态分布,其总体均数为其总体均数为4.781012/L,标准差为,标准差为0.341012/L,求红细胞数在,求红细胞数在41012/L以下的人所占的比例。以下的人所占的比例。1.1.不少医学现象服从正态分布或近似正态分布,不少医学现象服从正态分布或近似正态分布,可用来估计正态分布资料的频数分布。可用来估计正态分布资料的频数分布。如:如:同性别同年龄儿童的身高;实验中的随机误同性别同年龄儿童的身高;实验中的随机误差;差;同性别健康成人的红细胞数、血红蛋白、血同性别健康成人的红细胞数、血红蛋白、血小板计数;小板计数;很多呈偏态分布的医学资料,经变量变换可很多呈偏态分布的医学资料,经变量变换可转换为正态分布。转换为正态分布。正态分布的应用正态分布的应用2.2.估计医学参考值范围:估计医学参考值范围:“医学参考值范围医学参考值范围”,它是指特定的,它是指特定的“正常正常”人群人群的解剖、生理、生化等指标的波动范围。的解剖、生理、生化等指标的波动范围。制定参考值范围时,首先要确定一批样本含量足够制定参考值范围时,首先要确定一批样本含量足够大的大的“正常人正常人”,所谓,所谓“正常人正常人”不是指不是指“健康人健康人”,而是指排除了对所研究指标有影响的疾病和有,而是指排除了对所研究指标有影响的疾病和有关因素的同质人群;关因素的同质人群;其次需根据研究目的和使用要求选定适当的百分界其次需根据研究目的和使用要求选定适当的百分界值,如值,如80%80%,90%90%,95%95%和和99%99%,常用,常用95%95%;根据指标的;根据指标的实际用途确定单侧或双侧界值。实际用途确定单侧或双侧界值。还要根据资料的分布特点,选用恰当的计算方法。还要根据资料的分布特点,选用恰当的计算方法。正态分布的应用正态分布的应用常用方法有:(以常用方法有:(以95%95%参考值范围为例)参考值范围为例)正态分布法:适用于正态或近似正态分布的资料正态分布法:适用于正态或近似正态分布的资料l双侧界值:双侧界值:l单侧上界:单侧上界:l或单侧下界:或单侧下界:例例1:某地某地200例正常成人血铅含量的频数分布如下表。例正常成人血铅含量的频数分布如下表。(1)简述该资料的分布特征。)简述该资料的分布特征。(2)若资料近似呈对数正态分布,试估计该地正常成人血)若资料近似呈对数正态分布,试估计该地正常成人血铅值的铅值的95%参考值范围。参考值范围。血血铅含量含量频 数数累累积频数数0.000.007 77 70.240.24494956560.480.484545101 101 0.720.723232133 133 0.960.9628281611611.201.2013131741741.441.4414141881881.681.684 41921921.921.924 41961962.162.161 11971972.402.402 21991992.642.641 1200200表表1.某地某地200例正常成人血铅含量例正常成人血铅含量(mol/L)的频数分布的频数分布例例2.某地某地144例例3045岁正常成年男子的血清总胆岁正常成年男子的血清总胆固醇测量值近似服从均数为固醇测量值近似服从均数为4.95mmol/L,标准差,标准差为为0.85mmol/L的正态分布。的正态分布。试估计该地试估计该地3045岁成年男子血清总胆固醇的岁成年男子血清总胆固醇的95%参考值范围;参考值范围;血清总胆固醇大于血清总胆固醇大于5.72mmol/L的正常成年男子约的正常成年男子约占其总体的百分之多少?占其总体的百分之多少?百分位数法:常用于偏态分布资料以及百分位数法:常用于偏态分布资料以及 资料中一端或两端无确切数值的资料资料中一端或两端无确切数值的资料l双侧范围:(双侧范围:(P P2.52.5,P P97.597.5)l单侧上界:单侧上界:P P9595以下以下(如血铅、血汞等有害物质)(如血铅、血汞等有害物质)l或单侧下界:或单侧下界:P P5 5以上以上(如肺活量)(如肺活量)3.3.质量控制:随机测量误差及随机抽样误差虽可引质量控制:随机测量误差及随机抽样误差虽可引起某项指标的波动,但往往服从正态分布,此时起某项指标的波动,但往往服从正态分布,此时若出现系统误差,则观察结果不再服从正态分布。若出现系统误差,则观察结果不再服从正态分布。据此原理,通过绘制控制图,可以及时发现系统据此原理,通过绘制控制图,可以及时发现系统误差的出现。误差的出现。常以常以 作为上下警戒值,作为上下警戒值,以以 作为上下控制值。如图作为上下控制值。如图5-5-1010正态分布的应用正态分布的应用4.4.二项分布、泊松分布的正态分布近似二项分布、泊松分布的正态分布近似 1)当)当n较大,较大,n和和n(1-)都大于都大于5时,二项时,二项分布近似于正态分布;分布近似于正态分布;2)当当20时,时,Poisson分布接近正态分布。分布接近正态分布。此时可利用正态近似原理计算累积概率此时可利用正态近似原理计算累积概率 正态分布的应用正态分布的应用小结小结医学参考值范围的计算方法医学参考值范围的计算方法二项分布、泊松分布及正态分布二项分布、泊松分布及正态分布之间的关系之间的关系P81 思考与练习思考与练习7.docin/sanshengshiyuandoc88/sanshenglu 更多精品资源请访问更多精品资源请访问
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!