统计学二项分布与泊松分布-课件

上传人:痛*** 文档编号:241705333 上传时间:2024-07-17 格式:PPT 页数:108 大小:2.58MB
返回 下载 相关 举报
统计学二项分布与泊松分布-课件_第1页
第1页 / 共108页
统计学二项分布与泊松分布-课件_第2页
第2页 / 共108页
统计学二项分布与泊松分布-课件_第3页
第3页 / 共108页
点击查看更多>>
资源描述
简简 历历结束结束返回章目录返回总目录医医 学学 统统 计计 学学医学本科生用医学本科生用1统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录The teaching planfor medical studentsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege2统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录 医学统计学教授,硕士生导师。男,医学统计学教授,硕士生导师。男,19591959年年6 6月出生。汉族,无党派。月出生。汉族,无党派。19821982年年1212月,山东医学院公共卫生专业五年本科毕业,获医学学士学位。月,山东医学院公共卫生专业五年本科毕业,获医学学士学位。19941994年年7 7月,上海医科大学公共卫生学院研究生毕业,获医学硕士学位。月,上海医科大学公共卫生学院研究生毕业,获医学硕士学位。20032003年年1212月晋升教授。现任预防医学教研室副主任。主要从事医学统月晋升教授。现任预防医学教研室副主任。主要从事医学统计学、预防医学,医学人口统计学等课程的教学及科研工作,计学、预防医学,医学人口统计学等课程的教学及科研工作,每年听课学生每年听课学生600-1000600-1000人。自人。自20002000年起连续年起连续1010年,为硕士研究生开设年,为硕士研究生开设医学统计学、医学统计学、SPSSSPSS统计分析教程、卫生经济学等课程,同统计分析教程、卫生经济学等课程,同时指导研究生的科研设计、开题报告及科研资料的统计处理与分析。发时指导研究生的科研设计、开题报告及科研资料的统计处理与分析。发表医学统计学及预防医学的科研论文表医学统计学及预防医学的科研论文5050多篇。代表作有多篇。代表作有“锌对乳癌细胞锌对乳癌细胞生长、增殖与基因表达的影响生长、增殖与基因表达的影响”,“行列相关的测度行列相关的测度”等。主编、副等。主编、副主编各类教材及专著主编各类教材及专著1010部,代表作有医学统计学部,代表作有医学统计学、SPSSSPSS统计分析统计分析教程。获得院级科研论文及科技进步奖教程。获得院级科研论文及科技进步奖8 8项,院第四届教学能手比赛二项,院第四届教学能手比赛二等奖一项,院教学评建先进工作者一项。获等奖一项,院教学评建先进工作者一项。获20042004年泰山医学院首届十大年泰山医学院首届十大教学名师奖。医学统计学为校级和省级精品课程。教学名师奖。医学统计学为校级和省级精品课程。程琮教授简介程琮教授简介3统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录医学统计学目录医学统计学目录u第第1章章 绪论绪论u第第2章章 定量资料的统计描述定量资料的统计描述u第第3章章 总体均数的区间估计和假设检验总体均数的区间估计和假设检验u第第4章章 方差分析方差分析u第第5章章 定性资料的统计描述定性资料的统计描述u第第6章章 总体率的区间估计和假设检验总体率的区间估计和假设检验u第第7章章 二项分布与二项分布与Poisson分布分布u第第8章章 秩和检验秩和检验 u第第9章章 直线相关与回归直线相关与回归u第第10章章 实验设计实验设计u第第11章章 调查设计调查设计u第第12章章 统计表与统计图统计表与统计图4统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录第第7章二项分布与泊松分布章二项分布与泊松分布 目录目录q第二节第二节泊泊松分布及其应用松分布及其应用q第三节第三节两种分布的拟两种分布的拟合优度检验合优度检验q 第一节第一节 二二项分布及其应用项分布及其应用5统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录第第7 7章章 二项分布与泊松分布二项分布与泊松分布 学习要求学习要求1.1.掌握:二项分布的概念及意义。掌握:二项分布的概念及意义。2.2.熟悉:二项分布的适用条件及计算方法。熟悉:二项分布的适用条件及计算方法。3.3.了解:二项分布的概率函数、性质及医学应用。了解:二项分布的概率函数、性质及医学应用。4.4.掌握:掌握:PoissonPoisson分布的概念及意义。分布的概念及意义。5.5.熟悉:熟悉:PoissonPoisson分布的适用条件、医学应用及计算方分布的适用条件、医学应用及计算方法。法。6.6.了解:了解:PoissonPoisson分布的概率函数及性质。分布的概率函数及性质。7.7.了解:二项分布与了解:二项分布与PoissonPoisson分布的拟合优度检验的概分布的拟合优度检验的概念及意义。念及意义。8.8.了解:常用的拟合优度检验方法。了解:常用的拟合优度检验方法。6统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录第一节第一节 二项分布及其应用二项分布及其应用 1.1.二项分布(二项分布(binominal distributionbinominal distribution)是一种重要的离散型分布,在医学上常遇到属是一种重要的离散型分布,在医学上常遇到属于两分类的资料,每一观察单位只具有相互独于两分类的资料,每一观察单位只具有相互独立的一种结果,如检查结果的阳性或阴性,动立的一种结果,如检查结果的阳性或阴性,动物试验的生存或死亡,对病人治疗的有效或无物试验的生存或死亡,对病人治疗的有效或无效等。效等。一、二项分布的概念及应用条件一、二项分布的概念及应用条件7统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录 2.2.二项分布定义:二项分布定义:如果已知发生某一结果(如如果已知发生某一结果(如阳性)的概率为阳性)的概率为,其对立结果(阴性)的概率,其对立结果(阴性)的概率为(为(1-1-),且各观察单位的观察结果相互独立,),且各观察单位的观察结果相互独立,互不影响,则从该总体中随机抽取互不影响,则从该总体中随机抽取n n例,其中出例,其中出现阳性数为现阳性数为X(X=0,1,2,3,X(X=0,1,2,3,,n)n)的概率服从二的概率服从二项分布。项分布。3.3.二项分布名称二项分布名称:也称为贝努里分布也称为贝努里分布(Bernoulli distributionBernoulli distribution)或贝努里模型,是)或贝努里模型,是由法国数学家由法国数学家J.BernoulliJ.Bernoulli于于17131713年首先阐述的年首先阐述的概率分布。概率分布。8统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录贝努里模型应具备下列三个基本条件。贝努里模型应具备下列三个基本条件。1.1.试验结果只出现对立事件试验结果只出现对立事件A A或或 ,两者只能,两者只能出现其中之一。这种事件也称为互斥事件。出现其中之一。这种事件也称为互斥事件。2.2.试验结果是相互独立,互不影响的。例如,试验结果是相互独立,互不影响的。例如,一个妇女生育男孩或女孩,并不影响另一个一个妇女生育男孩或女孩,并不影响另一个妇女生育男孩或女孩等。妇女生育男孩或女孩等。3.3.每次试验中,出现事件每次试验中,出现事件A A的概率为的概率为p p,而出现,而出现对立事件对立事件 的概率为的概率为-p-p。则有总概率。则有总概率p+p+(1-p1-p)=1=1。注意:注意:1-p=q1-p=q9统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录二、二、二项分布的概率函数二项分布的概率函数 1.1.根据贝努里模型进行试验的三个基本条根据贝努里模型进行试验的三个基本条件,可以求出在件,可以求出在n n 次独立试验下,事件次独立试验下,事件A A出现的次数出现的次数X X的概率分布。的概率分布。X X为离散型为离散型随机变量,其可以取值为随机变量,其可以取值为0,1,2,n0,1,2,n。10统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录2.2.则则X X的概率函数为:的概率函数为:X X=0,1,2,=0,1,2,n n (7.1)(7.1)式中:式中:0101,为组合数,公式(为组合数,公式(7.17.1)称随机变量)称随机变量X X服从参数为服从参数为n,n,的二项分布,则记为的二项分布,则记为X XB(n,)B(n,)。11统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录三、三、二项分布的性质二项分布的性质 1.1.二项分布是概率分布,因此它就具备概率分布的各种性二项分布是概率分布,因此它就具备概率分布的各种性质。质。2.2.二项分布的每种组合的概率符合二项展开式,其总概率二项分布的每种组合的概率符合二项展开式,其总概率等于等于1 1。(7.27.2)12统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录 二项式展开式实例二项式展开式实例 将二项式将二项式(a+ba+b)n n 展开展开13统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录由公式(由公式(7.27.2)可看出二项展开式有以下特点:)可看出二项展开式有以下特点:(1 1)展开式的项数为展开式的项数为n+1n+1。(2 2)展开式每项展开式每项和(和(1-1-)指数之和为)指数之和为n n。(3 3)展开式每项的指数从展开式每项的指数从0 0到到n n;(;(1-1-)的)的指数从指数从n n到到0 0。14统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录由公式(由公式(7.27.2)可看出二项展开式有以下特点:)可看出二项展开式有以下特点:(4 4)二项分布的区间累积概率)二项分布的区间累积概率 设设m m1 1XmXm2 2,m,m1 1m m2 2),则则X X在在m m1 1至至m m2 2区间区间的累积概率有:的累积概率有:15统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录 至多有至多有x x例阳性的概率为:例阳性的概率为:至少有至少有x x例阳性的概率为:例阳性的概率为:X=0,1,2,x (7.4)X=x,x+1,n (7.5)公式(公式(7.47.4)为下侧累计概率,公式()为下侧累计概率,公式(7.57.5)为上侧累计概率。)为上侧累计概率。16统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录3.3.二项分布的概率分布图形二项分布的概率分布图形1.1.以以X X为横坐标,为横坐标,P P(X X)为纵坐标,在坐标为纵坐标,在坐标纸上可绘出二项分布的图形纸上可绘出二项分布的图形,由于由于X X为离为离散型随机变量,二项分布图形由横坐标散型随机变量,二项分布图形由横坐标上孤立点的垂直线条组成。上孤立点的垂直线条组成。2.2.二项分布的图形取决于二项分布的图形取决于与与n n的大小。当的大小。当n n充分大时,二项分布趋向对称,可以证充分大时,二项分布趋向对称,可以证明其趋向正态分布。明其趋向正态分布。17统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录3.3.二项分布的概率分布图形二项分布的概率分布图形3.3.n n的大小与分布类型的大小与分布类型:当当nn之积大于之积大于5 5时,分布接近正态分布;时,分布接近正态分布;当当n5n5时,图形呈偏态分布。时,图形呈偏态分布。当当=0.5=0.5时,图形分布对称,近似正态。时,图形分布对称,近似正态。如果如果0.50.5或距或距0.50.5较远时,分布呈偏态。较远时,分布呈偏态。见图见图7-17-1。18统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录图图7-1 7-1 二项分布示意图二项分布示意图 19统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录4.4.二项分布的数字特征二项分布的数字特征这里的数字特征主要指这里的数字特征主要指总体均数总体均数、方差方差、标准差标准差等参数。等参数。随机变量随机变量X X的数学期望的数学期望 E E(X X)。即指总体均数。即指总体均数。nn 20统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录随机变量随机变量X X的方差的方差 D D(X X)2 2随机变量随机变量X X的标准差为的标准差为:随机变量随机变量X X的方差及标准差的方差及标准差21统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录若若X X的总体均数和标准差用率来表示,则的总体均数和标准差用率来表示,则将公式除以将公式除以n,n,得:得:22统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录四、二项分布展开式各项的系数四、二项分布展开式各项的系数 二项分布展开式的各项之前均有一个系数,用组二项分布展开式的各项之前均有一个系数,用组合公式来表示。计算公式为:合公式来表示。计算公式为:23统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录1.1.杨辉三角:杨辉三角:可用来表示二项式各项展开可用来表示二项式各项展开式的系数。见图式的系数。见图7-27-2。国外参考书习惯。国外参考书习惯称之为称之为巴斯噶三角巴斯噶三角。2.2.当试验次数当试验次数n n较小时,可直接利用杨辉较小时,可直接利用杨辉三角将二项分布展开式各项的系数写出三角将二项分布展开式各项的系数写出来,应用十分方便。来,应用十分方便。杨辉三角杨辉三角24统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录图图7-2 7-2 杨辉三角模式图杨辉三角模式图 25统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录杨辉三角的意义:杨辉三角的意义:1.1.杨辉三角中每行有几个数字,表示展开式有几项。杨辉三角中每行有几个数字,表示展开式有几项。当试验次数为当试验次数为n n 时,有时,有n+1n+1项。项。2.2.杨辉三角中每行中的数字表示展开式中每项的系杨辉三角中每行中的数字表示展开式中每项的系数大小。数大小。3.3.杨辉三角中的各数字项及其数字的排列很有规律。杨辉三角中的各数字项及其数字的排列很有规律。可依照规律继续写下去。第一行的第一、第二项可依照规律继续写下去。第一行的第一、第二项均为数字,以后每下一行的首项及末项均为,均为数字,以后每下一行的首项及末项均为,中间各项为上一行相邻两项数字之和。中间各项为上一行相邻两项数字之和。26统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录五、二项分布的应用五、二项分布的应用 二项分布在生物学及医学领域中,主要应用在下二项分布在生物学及医学领域中,主要应用在下列几个方面:列几个方面:总体率的可信区间估计,总体率的可信区间估计,率的率的u u检验:单样本及两样本比较。检验:单样本及两样本比较。样本率与总体率比较的直接计算概率法。样本率与总体率比较的直接计算概率法。27统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(一)应用二项分布计算概率(一)应用二项分布计算概率 1.1.【例例7.1 7.1】如出生男孩的概率如出生男孩的概率P=0.5P=0.5,出生女孩的,出生女孩的概率为(概率为(1-P1-P)=0.5=0.5。在一个妇产医院里有。在一个妇产医院里有3 3名产名产妇分娩妇分娩3 3名新生儿,其中男孩为名新生儿,其中男孩为X=0,1,2,3X=0,1,2,3的概率的概率按公式(按公式(7.17.1)计算的结果列于表)计算的结果列于表7-17-1的第(的第(3 3)栏)栏中。中。2.2.分析:根据题意,已知生育男孩为分析:根据题意,已知生育男孩为事件事件A A,其概率其概率P(A)=0.5P(A)=0.5(即(即=0.5=0.5);生育女孩为生育女孩为事件事件B B ,其,其概率为概率为P(B)=1-P(A)=1-0.5P(B)=1-P(A)=1-0.50.50.5(即即1-=0.51-=0.5)。)。28统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录生男生女的概率生男生女的概率 29统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录 三个妇女生育一个男孩,两个女孩的概率为:三个妇女生育一个男孩,两个女孩的概率为:三个妇女生育均为女孩(即无男孩)的概率为:三个妇女生育均为女孩(即无男孩)的概率为:余类推,见表余类推,见表7-17-1第(第(3 3)栏。表)栏。表7-17-1第(第(5 5)栏为至)栏为至少生育少生育X X个男孩的累积概率。个男孩的累积概率。30统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(二二)样本率与总体率比较的直接概率法样本率与总体率比较的直接概率法 此法适用此法适用nPnP和和n(1-P)n(1-P)均小于均小于5 5的情形。的情形。应注意:应注意:当样本率大于总体率时,当样本率大于总体率时,应计算大于等于阳应计算大于等于阳性人数的累积概率。即上侧概率。性人数的累积概率。即上侧概率。当样本率小于总体率时,当样本率小于总体率时,应计算小于等于阳应计算小于等于阳性人数的累积概率。即下侧概率。性人数的累积概率。即下侧概率。31统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录 【例【例7.2 7.2】A A药治疗某病的有效率为药治疗某病的有效率为8080。对对A A药进行改进后,用改进型药进行改进后,用改进型A A药继续治疗病药继续治疗病人,观察疗效。人,观察疗效。如果用改进型如果用改进型A A药治疗药治疗2020例病人,例病人,1919例有效。例有效。如果用改进型如果用改进型A A药治疗药治疗3030例病人,例病人,2929例有效。例有效。试分析:试分析:上述二种情形下,改进型上述二种情形下,改进型A A药是否药是否疗效更好。疗效更好。32统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录【分析分析】A A药有效率为药有效率为8080,可以作为总体可以作为总体率,即率,即000.8 0.8。治疗治疗2020例病人的样本有效率为(例病人的样本有效率为(19192020)1001009595;治疗治疗3030例病人的样本有效率为(例病人的样本有效率为(29293030)10010096.6796.67。两个样本率均大于总体率两个样本率均大于总体率8080,故应计算,故应计算大于等于有效例数的单侧累积概率大于等于有效例数的单侧累积概率(上侧)(上侧)。33统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录情形一:治疗情形一:治疗2020例病人的疗效分析例病人的疗效分析 (1 1)建立检验假设)建立检验假设 H H0 0:0 00.800.80;H H1 1:0 0 0.800.80 单侧单侧0.050.05(2 2)计算概率值)计算概率值 根据二项分布有:根据二项分布有:=0.0548+0.0115=0.0663=0.0548+0.0115=0.0663 34统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(3 3)推断结论)推断结论 本例本例P P0.0663,0.0663,在在0.050.05水准上水准上,不拒不拒绝绝H H0 0。尚不能认为改进型。尚不能认为改进型A A药的疗效优于药的疗效优于原原A A药。药。35统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录 治疗治疗3030例病人的疗效分析例病人的疗效分析(1 1)检验假设同情形一。)检验假设同情形一。(2 2)计算单侧累积概率有:)计算单侧累积概率有:=0.008975+0.001238=0.0102=0.008975+0.001238=0.0102 情形二:治疗情形二:治疗3030例病人的疗效分析例病人的疗效分析 36统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(3 3)推断结论)推断结论 本例本例P P0.0102,0.0102,在在0.050.05水准水准上上,拒绝拒绝H H0 0,接受接受H H1 1。可以认为改进型。可以认为改进型A A药的疗效药的疗效优于原优于原A A药。药。注意:注意:治疗治疗2020例病人的有效率为例病人的有效率为9595,治疗,治疗3030例病人例病人的有效率为的有效率为96.6796.67,两个样本有效率很接近。,两个样本有效率很接近。但最终得出的结论却不相同。但最终得出的结论却不相同。临床上观察疗效,样本含量不能太小。样本含临床上观察疗效,样本含量不能太小。样本含量大,疗效稳定性及可靠性相应增加,受到偶量大,疗效稳定性及可靠性相应增加,受到偶然因素影响的机会变得较小。然因素影响的机会变得较小。37统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录【分析分析】:本例总体率本例总体率1 1。调查人群样本。调查人群样本反应率为反应率为P=P=(1 1300300)1001000.330.33。由于。由于样本率小于总体率,故应计算样本率小于总体率,故应计算小于等于小于等于阳性人数阳性人数的累积概率。的累积概率。【例例7.3 7.3】一般人群对一般人群对B B药的副作用反应率为药的副作用反应率为1 1。调查使用调查使用B B药者药者300300人,其中只有人,其中只有1 1人出现副作人出现副作用。问该调查人群对用。问该调查人群对B B药的副作用反应率是否药的副作用反应率是否低于一般人群。低于一般人群。38统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(1 1)建立检验假设)建立检验假设 H H0 0:调查人群反应率与一般人群相同,:调查人群反应率与一般人群相同,0 00.010.01H H1 1:调查人群反应率低于一般人群,调查人群反应率低于一般人群,0 0 0.010.01 单侧单侧 0.050.0539统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(2 2)计算单侧累积概率)计算单侧累积概率:(3 3)推断结论)推断结论 本例本例 P P0.1976,0.1976,在在0.050.05水准水准上上,不拒绝不拒绝H H0 0。尚不能认为调查人群的。尚不能认为调查人群的B B药副作用药副作用反应率低于一般人群。反应率低于一般人群。40统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录第二节第二节 Poisson Poisson分布及其应用分布及其应用(一一)Poisson)Poisson分布的概念分布的概念1.1.PoissonPoisson分布由法国数学家分布由法国数学家S.D.PoissonS.D.Poisson在在18371837年提出。年提出。2.2.该分布也称为该分布也称为稀有事件模型稀有事件模型,或,或空间散布点子模型空间散布点子模型。在生物学及医学领域中,某些现象或事件出现的机会在生物学及医学领域中,某些现象或事件出现的机会或概率很小,这种事件称为稀有事件或罕见事件。或概率很小,这种事件称为稀有事件或罕见事件。3.3.稀有事件出现的概率分布服从稀有事件出现的概率分布服从PoissonPoisson分布。分布。一、一、PoissonPoisson分布的概念及应用条件分布的概念及应用条件41统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录 如果稀有事件如果稀有事件A A在每个单元(设想为在每个单元(设想为n n次试次试验)内平均出现验)内平均出现次,那么在一个单元次,那么在一个单元(n n次)的试验中,稀有事件次)的试验中,稀有事件A A出现次数出现次数X X的概率分布服从的概率分布服从PoissonPoisson分布。分布。PoissonPoisson分布的直观描述分布的直观描述42统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录1.1.PoissonPoisson分布属于离散型分布。在分布属于离散型分布。在PoissonPoisson分布分布中,中,一个单元可以定义为是单位时间,单位面积,一个单元可以定义为是单位时间,单位面积,单位体积或单位容积等。单位体积或单位容积等。2.2.如每天如每天8 8小时的工作时间,一个足球场的面积,小时的工作时间,一个足球场的面积,一个一个立方米的空气体积立方米的空气体积,1 1升或升或1 1毫升的液体体积毫升的液体体积,培养细菌的培养细菌的一个平皿一个平皿,一瓶矿泉水一瓶矿泉水等都可以认为等都可以认为是一个单元。是一个单元。3.3.一个单元的大小往往是根据实际情况或经验而确一个单元的大小往往是根据实际情况或经验而确定的。若干个小单元亦可以合并为一个大单元。定的。若干个小单元亦可以合并为一个大单元。43统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(二二)常见常见PoissonPoisson分布的资料(牢记)分布的资料(牢记)实际工作中,判定一个变量是否服从实际工作中,判定一个变量是否服从PoissonPoisson分布分布 仍然仍然主要依靠经验以及以往累积的资料主要依靠经验以及以往累积的资料。常见常见PoissonPoisson分布资料有:分布资料有:1.1.产品抽样中极坏品出现的次数;产品抽样中极坏品出现的次数;2.2.枪打飞机击中的次数;枪打飞机击中的次数;3.3.患病率较低的非传染性疾病在人群中的分布;患病率较低的非传染性疾病在人群中的分布;4.4.奶中或饮料中的病菌个数;奶中或饮料中的病菌个数;5.5.自来水中的细菌个数;自来水中的细菌个数;6.6.空气中的细菌个数及真菌饱子数;空气中的细菌个数及真菌饱子数;7.7.自然环境下放射的粒子个数;自然环境下放射的粒子个数;44统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录8.8.布朗颗粒数;布朗颗粒数;9.9.三胞胎出生次数;三胞胎出生次数;10.10.正式印刷品中错误符号的个数;正式印刷品中错误符号的个数;11.11.通讯中错误符号的个数;通讯中错误符号的个数;12.12.人的自然死亡数;人的自然死亡数;13.13.环境污染中畸形生物的出现情况;环境污染中畸形生物的出现情况;14.14.连体婴儿的出现次数;连体婴儿的出现次数;15.15.野外单位面积某些昆虫的随机分布;野外单位面积某些昆虫的随机分布;16.16.单位容积内细胞的个数;单位容积内细胞的个数;17.17.单位空气中的灰尘个数;单位空气中的灰尘个数;18.18.平皿中培养的细菌菌落数等。平皿中培养的细菌菌落数等。45统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录二、二、PoissonPoisson分布的概率函数及性质分布的概率函数及性质 定义定义 若变量若变量X X的概率函数为的概率函数为 其中其中0 0,则称,则称X X服从参数服从参数为为的的PoissonPoisson分布。分布。记为记为X XP()P()。式中:。式中:为总体均数,为总体均数,nn或或=np=np;X X为稀有事件发生次数;为稀有事件发生次数;e e为自然底数,即为自然底数,即e e=2.71828=2.71828。(X=0,1,2,)46统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录亦可用下列公式计算亦可用下列公式计算 47统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(二二)Poisson)Poisson分布的性质分布的性质1.1.所有概率函数值(无穷多个)之和等于所有概率函数值(无穷多个)之和等于1 1,即,即2.2.分布函数分布函数 (X X=0,1,2,=0,1,2,x x)48统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(00 x x1 1x x2 2)3.3.累积概率累积概率 4.4.其它性质其它性质总体均数总体均数:方差:方差:标准差:标准差:n(或或np)249统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(三)(三)PoissonPoisson分布的图形分布的图形 PoissonPoisson分布的图形:分布的图形:取决于取决于值的大小。值的大小。值值愈小,分布愈偏;愈小,分布愈偏;值愈大,分布愈趋于对称。值愈大,分布愈趋于对称。当当2020时,分布接近正态分布。此时可按正时,分布接近正态分布。此时可按正态分布处理资料。当态分布处理资料。当5050时,分布呈正态分时,分布呈正态分布。见图布。见图7-37-3。这里通过计算一个具体实例来。这里通过计算一个具体实例来观察观察PoissonPoisson分布的概率分布趋势。分布的概率分布趋势。50统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录图图7-3 Poisson7-3 Poisson分布的概率分布图分布的概率分布图 51统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录【例例7.4 7.4】计算计算PoissonPoisson分布分布X XP(3.5)P(3.5)的概率。的概率。52统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录余类推。经计算得到一系列数据,见表余类推。经计算得到一系列数据,见表7-27-2。53统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(四)(四)PoissonPoisson分布的可加性分布的可加性1.1.从同一个服从从同一个服从PoissonPoisson分布的总体中抽取若干个分布的总体中抽取若干个样本或观察单元,分别取得样本计数值样本或观察单元,分别取得样本计数值X1X1,X2X2,X3X3,XnXn,则则Xi Xi 仍然服从仍然服从PoissonPoisson分布。分布。2.2.根据此性质,若抽样时的样本计数根据此性质,若抽样时的样本计数X X值较小时,值较小时,可以多抽取几个观察单元,取得计数可以多抽取几个观察单元,取得计数Xi,Xi,将其合将其合并以增大并以增大X X计数值。计数值。54统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录三、三、PoissonPoisson分布与二项分布的比较分布与二项分布的比较 1.1.PoissonPoisson分布也是以贝努里模型为基础的。实际上,分布也是以贝努里模型为基础的。实际上,PoissonPoisson分布是二项分布的一种特殊情形,即稀有事例分布是二项分布的一种特殊情形,即稀有事例A A出现的概率很小,而试验次数出现的概率很小,而试验次数n n很大,也可将试验次数很大,也可将试验次数n n看作是一个单元。此时,看作是一个单元。此时,n n或或npnp=为一个常数,二项为一个常数,二项分布就非常近似分布就非常近似PoissonPoisson分布。分布。p p愈小,愈小,n n愈大,近似程愈大,近似程度愈好。度愈好。2.2.设设1 1。当。当n n=100,=100,=0.01=0.01时,及时,及n=1000,n=1000,=0.001=0.001时,按照二项分布及时,按照二项分布及PoissonPoisson分布计算概率分布计算概率P P(X X)。)。计计算结果见表算结果见表7-37-3。55统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录二项分布与二项分布与PoissonPoisson分布计算的概率值比较分布计算的概率值比较 56统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录余类推。余类推。1.1.按二项分布计算按二项分布计算已知:已知:n=100,=0.01,1 n=100,=0.01,1=0.99=0.99,代入公式有:,代入公式有:57统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录2.2.按按PoissonPoisson分布计算分布计算 代入公式有:代入公式有:余类推。余类推。58统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录四、四、PoissonPoisson分布的应用分布的应用 PoissonPoisson分布有多种用途分布有多种用途。1.1.主要包括总体均数可信区间的估计,主要包括总体均数可信区间的估计,2.2.样本均数与总体均数的比较,样本均数与总体均数的比较,3.3.两样本均数的比较等。两样本均数的比较等。4.4.应用应用PoissonPoisson分布处理医学资料时,一定要注分布处理医学资料时,一定要注意所处理资料的特点和性质,资料是否服从意所处理资料的特点和性质,资料是否服从PoissonPoisson分布。分布。59统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(一)总体均数的估计(一)总体均数的估计 总体均数的估计包括点估计和区间估计。总体均数的估计包括点估计和区间估计。1.1.点估计:点估计:是指由样本获得的稀有事件是指由样本获得的稀有事件A A出现的次出现的次数数X X值,作为总体均数的估计值。该法的优点是值,作为总体均数的估计值。该法的优点是计算简便,但缺点是无法得知样本代表总体均数计算简便,但缺点是无法得知样本代表总体均数的可信程度。的可信程度。2.2.区间估计:区间估计:可以确切获知总体均数落入一个区域可以确切获知总体均数落入一个区域的可信度,一般可信度取的可信度,一般可信度取9595或或9999。60统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录 估计总体均数可信区间一般分为小样本估计总体均数可信区间一般分为小样本法和大样本法。法和大样本法。1.1.1.1.小样本法小样本法 当样本均数或样本计数值当样本均数或样本计数值X50X50时,可直接查附表时,可直接查附表9 9,“PoissonPoisson分布的可信区间分布的可信区间”表,得到可信区间。表,得到可信区间。2.2.当样本均数当样本均数X X5050时时,PoissonPoisson分布近似分布近似正态分布,可按正态分布处理资料。正态分布,可按正态分布处理资料。61统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录【例例7.5 7.5】在在20ml20ml的当归浸液中含某种颗粒的当归浸液中含某种颗粒3030个。个。试分析该单元浸液中总体颗粒数的试分析该单元浸液中总体颗粒数的9595和和9999的可的可信区间。信区间。【分析分析】将将20ml20ml当归浸液看作一个单元,该单元的样本均当归浸液看作一个单元,该单元的样本均数数X X3030,小于,小于5050。可查附表。可查附表9 9,求出总体均数,求出总体均数的可信的可信区间。区间。用查表法:用查表法:查附表查附表9(2059(205页页)得:得:总体均数总体均数9595的可信区间为:的可信区间为:(20.2,42.820.2,42.8)总体均数总体均数9999的可信区间为:的可信区间为:(17.7,47.217.7,47.2)62统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录2.2.正态近似法正态近似法当样本均数或计数当样本均数或计数X X5050时,可按正态分布法处理。时,可按正态分布法处理。总体均数总体均数9595和和99%99%的可信区间为的可信区间为 63统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录【例例7.6 7.6】某防疫站检测某天然水库中的细菌总某防疫站检测某天然水库中的细菌总数。平均每毫升数。平均每毫升288288个细菌菌落。求该水体每毫个细菌菌落。求该水体每毫升细菌菌落的升细菌菌落的9595和和9999的可信区间。的可信区间。95的可信区间的可信区间 99的可信区间的可信区间64统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(1)(1)发病人数的发病人数的9595可信区间为:可信区间为:【例例7.7 7.7】调查调查19851985年某市某区年某市某区3030万人,流行性万人,流行性出血热发病人数为出血热发病人数为204204人。求该市发病人数及发人。求该市发病人数及发病率(病率(1 11010万)万)9595的可信区间。的可信区间。【分析分析】已知样本均数已知样本均数X X为为204204人,观察单元人,观察单元n n3030万人。先计算出发病人数的可信区间,再按照万人。先计算出发病人数的可信区间,再按照发病率的要求以发病率的要求以1010万人作为观察单元,计算发万人作为观察单元,计算发病率可信区间的上下限值。病率可信区间的上下限值。65统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录 发病率的发病率的9595可信区间为:可信区间为:下限值:下限值:上限值:上限值:66统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(二)样本均数与总体均数的比较(二)样本均数与总体均数的比较 常用的方法有两种。常用的方法有两种。直接计算概率法:直接计算概率法:与二项分布的计算思与二项分布的计算思路基本相同。即当路基本相同。即当2020时,按时,按PoissonPoisson分分布直接计算概率值。布直接计算概率值。正态近似法:正态近似法:当当2020时,时,PoissonPoisson分布分布接近正态分布。按正态分布使用接近正态分布。按正态分布使用u u检验处理检验处理资料。资料。67统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录1.1.直接计算概率法直接计算概率法 【例【例7.8 7.8】某地区以往胃癌发病率为某地区以往胃癌发病率为1 1万。现在调万。现在调查查1010万人,发现万人,发现3 3例胃癌病人。试分析该地区现在例胃癌病人。试分析该地区现在的胃癌发病率是否低于以往的发病率。的胃癌发病率是否低于以往的发病率。H H0 0:现在胃癌发病率与以往相同,现在胃癌发病率与以往相同,0 0=0.0001=0.0001 H H1 1:现在胃癌发病率低于以往,:现在胃癌发病率低于以往,0 0 单侧单侧0.050.0568统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(2 2)计算概率值)计算概率值 已知:已知:n=100000n=100000,=0.0001=0.0001,0 0nn0 0=1000000.0001=10=1000000.0001=10。根据题意,应计算小于等于根据题意,应计算小于等于3 3人发病的概率人发病的概率 P P(X3X3),),即:即:P P(X3X3)P(0)P(0)P(1)+P(2)+P(3)P(1)+P(2)+P(3)应用公式(应用公式(7.147.14)及()及(7.157.15)有:)有:69统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录计算结果计算结果 70统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(3 3)推断结论)推断结论 本例本例P P0.01030.0103,小于,小于P P0.050.05。在。在0.050.05水准上拒绝水准上拒绝H H0 0,接受,接受H H1 1。可以认为现在该地区胃癌发病率低于以往发可以认为现在该地区胃癌发病率低于以往发病率。病率。71统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录2 2正态近似法正态近似法 当当2020时,用时,用u u检验法。检验法。72统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录实例分析(实例分析(1 1)【例【例7.9 7.9】根据医院消毒卫生标准,细菌总数按根据医院消毒卫生标准,细菌总数按每立方米菌落形成单位(每立方米菌落形成单位(CFUCFUm3m3)表示。无菌)表示。无菌间的卫生标准为细菌菌落数应不大于间的卫生标准为细菌菌落数应不大于200200(CFUCFUm3m3)。某医院引进三氧消毒机,每天自动对无菌)。某医院引进三氧消毒机,每天自动对无菌间进行间进行2 2小时消毒。对无菌间抽样调查显示,细小时消毒。对无菌间抽样调查显示,细菌总数为菌总数为121CFU121CFUm3m3。试问该医院无菌间的细菌。试问该医院无菌间的细菌总数是否符合国家卫生标准。总数是否符合国家卫生标准。【分析】若【分析】若低于国家标准即符合标准,达到要求。低于国家标准即符合标准,达到要求。73统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录 (1)(1)建立检验假设建立检验假设H H0 0:无菌间的细菌总数符合国家卫生标准,无菌间的细菌总数符合国家卫生标准,=0 0=200=200H H1 1:无菌间的细菌总数低于国家卫生标准,无菌间的细菌总数低于国家卫生标准,1.64,u 1.64,故故P0.05P0.05。推断结论推断结论 因因P0.05P 1.96,u 1.96,故故P0.05P0.05。推断结论推断结论 因因P0.05P5.99=126.67 5.99,则,则P P0.050.05。(6)(6)推断结论推断结论 在在0.050.05水准上拒绝水准上拒绝H H0 0,接,接受受H H1 1,差异有统计学意义。,差异有统计学意义。结论:结论:可以认为三个病房的细菌总数不全相可以认为三个病房的细菌总数不全相同,同,即三个病房的细菌污染状况不同。即三个病房的细菌污染状况不同。101统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录(五)应用(五)应用PoissonPoisson分布的注意事项分布的注意事项1.Poisson1.Poisson分布的观察单元具有可加性。分布的观察单元具有可加性。当样本均数当样本均数X X或样本计数值或样本计数值X X 2020时,时,可通过增加或合并观察单元以增大样本可通过增加或合并观察单元以增大样本均数或样本计数值。均数或样本计数值。当当X X2020时时,PoissonPoisson分布近似正态分布,分布近似正态分布,可按正态分布进行可按正态分布进行PoissonPoisson分布均数比分布均数比较的较的u u检验。检验。102统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录2.Poisson2.Poisson分布的观察单元可以由大缩小分布的观察单元可以由大缩小,而不,而不可以由小扩大。例如,实际观察可以由小扩大。例如,实际观察1 1个平皿中的个平皿中的细菌菌落数为细菌菌落数为3434个,不能据此将其扩大而认为个,不能据此将其扩大而认为1010个平皿的菌落数为个平皿的菌落数为340340个。如果实际观察了个。如果实际观察了1010个平皿的菌落数为个平皿的菌落数为340340个,可以将其缩小而个,可以将其缩小而认为认为2 2个平皿有个平皿有6868个菌落数。个菌落数。3 3判断一组数据或一个资料判断一组数据或一个资料是否服从是否服从PoissonPoisson分分布,主要是依靠以往积累的经验或专业知识。布,主要是依靠以往积累的经验或专业知识。必要时也可进行拟合优度检验以确定资料分布必要时也可进行拟合优度检验以确定资料分布类型。类型。103统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录第三节第三节二项分布与二项分布与PoissonPoisson分布的拟合优度检验分布的拟合优度检验在实际工作中,科研人员经常需要了解取得的数据的在实际工作中,科研人员经常需要了解取得的数据的分布特征。了解数据的分布特征一般有两种方法。分布特征。了解数据的分布特征一般有两种方法。根据以往积累的经验来判断。根据以往积累的经验来判断。由公式进行检验由公式进行检验。后者常用的方法为拟合优度检。后者常用的方法为拟合优度检验(验(goodness of fit testgoodness of fit test),),也称为配合适度也称为配合适度检验。其目的是检验数据的频数分布与一个已知检验。其目的是检验数据的频数分布与一个已知分布是否相符合。常用的拟合优度检验为检验。分布是否相符合。常用的拟合优度检验为检验。基本方法与步骤基本方法与步骤 :此处省略。此处省略。104统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录课后作业及思考题(课后作业及思考题(1 1)一、作业一、作业1.1.教材本上的例题:认真做教材本上的例题:认真做2-32-3遍。或练习直到熟遍。或练习直到熟练为止。练为止。2.2.对概念及公式:数人一个小组进行讨论。对概念及公式:数人一个小组进行讨论。3.3.查阅中华系列杂志:找到查阅中华系列杂志:找到5-105-10个二项分布及泊个二项分布及泊松分布的科研设计及数据处理方法,仔细分析松分布的科研设计及数据处理方法,仔细分析及讨论。及讨论。105统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录课后作业及思考题(课后作业及思考题(2 2)二、思考题二、思考题1.1.解释名词:二项分布解释名词:二项分布 泊松分布泊松分布 杨辉三角杨辉三角2.2.常见泊松分布的资料有哪些?常见泊松分布的资料有哪些?3.3.写出二项分布的概率函数及展开式,其意义是写出二项分布的概率函数及展开式,其意义是 什么?性质及特点有哪些?什么?性质及特点有哪些?4.4.泊松分布的性质及特点有哪些?意义是什么?泊松分布的性质及特点有哪些?意义是什么?106统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录课后作业及思考题(课后作业及思考题(2 2)5.5.二项分布和泊松分布的异同点有哪些?二项分布和泊松分布的异同点有哪些?其意义是什么?其意义是什么?6.6.泊松分布可加性的意义是什么?泊松分布可加性的意义是什么?7.7.熟练写出熟练写出n=10n=10的杨辉三角?的杨辉三角?8.8.二项分布和泊松分布的应用有哪些?其二项分布和泊松分布的应用有哪些?其适用条件是什么?适用条件是什么?107统计学二项分布与泊松分布简简 历历结束结束返回章目录返回总目录Thank You for Listening!108统计学二项分布与泊松分布
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!