资源描述
1,二项分布及其应用 Binomial Distribution and Its Applications,2,主要内容,预备知识 二项分布的概率 二项分布的性质 二项分布的图形 二项分布的应用 率的区间估计 两个样本率的比较 样本率与总体率的比较 二项分布的应用条件,3,预备知识,随机试验 随机事件 独立事件 乘法法则 互不相容事件 加法法则 二项展开式,4,随机试验,任何一个试验,满足: 可在相同条件下重复进行; 每次试验得到多个结果; 每次试验前不能肯定这次试验将得到什么结果,随机事件随机试验的结果叫做随机事件,5,互不相容事件,在一次随机试验中,两个事件不可能同时发生称互不相容事件。P(A+B)=P(A)+P(B) 加法法则A、B为互不相容事件 “A+B” 表示A发生/B发生P(A+B)表示A发生/B发生的概率,6,独立事件,一个事件发生的概率不受另外一个事件发生与否的影响。P(AB)=P(A) P(B) 乘法法则P(AB)A发生并且B发生,7,二项展开式,8,在医学上一些事物,其结局只有两种互相对立的结果。如:在毒理试验中,动物的生存与死亡;在动物诱癌试验中,动物的发癌与不发癌;在流行病学观察中,接触某危险因素的个体发病与不发病;在临床治疗中,病人的治愈与未愈;理化检验结果的阴性与阳性等等,均表现为两种互相对立的结果,每个个体的观察结果只能取其中之一。对这类事物常用二项分布(binomial distribution)进行描述。,9,设小白鼠接受某种毒物一定剂量时,其死亡率为=80,则对于每只小白鼠而言,其死亡概率为=0.8,生存概率为1-=0.2。若每组各用三只小白鼠(分别计为甲、乙、丙),对每只鼠独立做实验,故各鼠的实验结果(生存或死亡)是互不影响的。观察每组小白鼠存亡情况,如果计算生与死的顺序,则共有8种排列方式;如果只计生存与死亡的数目,则只有4种组合方式。,10,三只小白鼠存亡的排列和组合方式及其概率的计算,11,( 0.2 +0.8 )3 = (0.2)3+3(0.2)2(0.8)+3(0.2)(0.8)2+(0.8)3三生 二生一死 一生二死 三死,12,1. 二项分布的概率,从阳性率为的总体中随机抽取含量为n的样本,恰有X例阳性的概率为:X=0,1,2,n 则称X服从参数为n和的二项分布(Binomial Distribution),记为:XB(n,)。其中参数 n由实验者确定,而常常是未知的。,13,2.1 二项分布的性质:均数和标准差,若XB(n,),则,14,若均数与标准差不用绝对数而用率表示时,15,2.2 二项分布的性质 :累积概率,累计概率(cumulative probability) 从阳性率为的总体中随机抽取n个个体,则 最多有k例阳性的概率:最少有k例阳性的概率: =0,1,2,k,n。,16,递推公式,17,例 据以往经验,用某药治疗小儿上呼吸道感染、支气管炎,有效率为85,今有5个患者用该药治疗,问: 至少3人有效的概率为多少? 最多1人有效的概率为多少?本例 =0.85,l- =0.15,n =5, 至少3人有效的概率 P(X3)=P(3)+P(4)+P(5) =0.1381781250.3915046880.443705313 =0.973388126,18, 最多1人有效的概率为:,P(X1),19,2.3 二项分布性质,在n足够大时,样本率近似服从正态分布; 样本率p的均数等于; 样本率p的标准差(率的标准误),20,3. 二项分布的图形,正态分布或其它连续性分布中,常用分布曲线下的面积表示某区间的概率; 在二项分布中,则用线段的长短表示取某变量值时的概率; 以X为横坐标,以P(X)为纵坐标作图,即可绘出二项分布的图形; 由图可见,给定n后,二项分布的形状取决参数的大小。,21,3. 二项分布的图形,22,二项分布的图形,当=0.5时,分布对称;当 0.5,分布呈偏态;当0.5时分布呈负偏态;特别是当n值不是很大时,偏离0.5愈远,分布愈偏。 随着n的增大,二项分布逐渐逼近正态分布。如 =0.30,n=5和n=10时,图形呈偏态,当n=30时,图形已接近正态分布。一般地说,如果n或n(1-)大于5时,常可用正态近似原理处理二项分布问题。,23,4.1 二项分布的应用:区间估计,精确概率法,查表法,适用于n50时; 正态近似法,适用于n较大,p和1-p均不太小,如np和n(1-p)均大于5时。此时总体率的1-可信区间如下,24,二项分布的应用:区间估计,总体率的可信区间是不对称的,除非0.5; 随着样本含量n的增加,不对称性逐渐改善; 随着样本含量n的增加,可信区间的宽度逐渐变小; 对于相同的样本含量, 越接近0.5,区间越宽, 越接近0或1,区间越窄。,25,4.2 二项分布的应用:率的假设检验,样本率与总体率的比较 直接计算概率法 样本含量较小时,或样本率较小时,如 np和n(1-p)均小于5 正态近似法,26,二项分布的应用:率的假设检验,新生儿染色体异常率0.01,随机抽取某地400名新生儿中有1名异常,问该地异常率是否低于一般? H0: 0.01; H1: ,不拒绝H0,尚不能认为该地异常率低于一般。,27,二项分布的应用:率的假设检验,两样本率的比较 正态近似法 当n1,n2均较大,p1,p2,(1-p1),(1-p2)均不太小,如n1p1,n2p2,n1(1-p1),n2(1-p2)均大于5时,可用u检验。,28,二项分布的应用:率的假设检验,肺吸虫感染率:男生23(80),女生13(85),二者是否有差别? H0:1 = 2; H1: 1 2; =0.05 n1=80,n1p1=23,n2=85,n2p2=13,pc=(23+13)/(80+85)=0.2182查u界值表,p0.05,不拒绝H0,尚不能认为男女肺吸虫感染率不同,29,5. 二项分布的应用条件,每一次试验必然出现两种互相对立的结果之一; 每种结果都有相同的可能性出现,即某事件出现的概率不变; n次试验的条件完全相同,n个观察对象同质且必须互相独立。,
展开阅读全文