资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,第四章 常用概率分布,第四章 常用概率分布,1,本章内容,第一节 正态分布(,重点,),第二节 二项分布,第三节 泊松分布,第四节 样本平均数的抽样分布(,重点,),第五节,t,分布(,重点,),本章内容第一节 正态分布(重点),2,第一节 正态分布,正态分布是一种很重要的,连续型随机变量的概率分布,。,食品科学研究中有许多变量是服从或近似服从正态分布的。许多统计分析方法都是以,正态分布,为基础的。此外,还有不少随机变量的概率分布在一定条件下以正态分布为其极限分布。因此在统计学中,正态分布无论在理论研究上还是实际应用中,均占有重要的地位。,第一节 正态分布 正态分布是一种很重要的连续,3,概率,在相同的条件下做大量的重复试验,一个事件出现的次数,k,和总的试验次数,n,之比,称为这个事件在这,n,次试验中出现的概率。,一、正态分布的定义及其特征,概率一、正态分布的定义及其特征,4,(一) 正态分布的定义,若,连续型随机变量(,身高、体重、,),x,的概率分布密度函数为,其中,为平均数,,2,为方差,则称随机变量,x,服从正态分布,(normal distribution),, 记为,x,N,(,2,),。相应的概率分布函数为,一、正态分布的定义及其特征,(一) 正态分布的定义 若连续型随机变量(身高、,5,(,二,),正态分布的特征,1,、正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为,x,=,;,2,、,f(x),在,x,=,处达到极大,极大值 ;,3,、,f(x),是非负函数,以,x,轴为渐近线,分布从,-,至,+,;,图,4-1,正态分布密度函数曲线,一、正态分布的定义及其特征,(二) 正态分布的特征 图4-1 正态分布密度函数曲,6,4,、曲线在,x,=,处各有一个拐点,即曲线在,(-,-),和,(+,+),区间上是下凸的,在,-,+,区间内是上凸的;,5,、分布密度曲线与横轴所夹的面积为,1,,即:,一、正态分布的定义及其特征,图,4-1,正态分布密度函数曲线,4、曲线在x=处各有一个拐点,即曲线在(-,-),7,图,4-2,相同,不同的正态总体 图,4-3 ,相同,不同的正态总体,6,、正态分布有两个参数,即平均数,和标准差,。,是位置参数,当,恒定时,,愈大,则曲线沿,x,轴愈向右移动;反之,,愈小,曲线沿,x,轴愈向左移动。,是变异度参数,当,恒定时,,愈大,表示,x,的取值愈分散,曲线愈,“,胖,”,;,愈小,,x,的取值愈集中在,附近,曲线愈,“,瘦,”,。,一、正态分布的定义及其特征,图4-2 相同不同的正态总体 图4-3,8,由上述正态分布的特征可知 ,正态分布是依赖于参数,和,2,(,或,),的一簇 分布, 正态曲线的位置及形态随,和,2,的不同而不同,在研究具体的正态总体时,需将一般的,N,(,,,2,),转换为,= 0,2,=1,的正态分布。,二、标准正态分布,二、标准正态分布,9,符合,=0,2,=1,的正态分布称为标准正态分布,(standard normal distribution),。,标准正态分布的概率密度函数及分布函数分别记作,(u),和,(u),,根据正态分布定义得:,(4-8),(4-9),随机变量,u,服从标准正态分布,记作,u,N,(0,,,1),,分布密度曲线如图所示。,符合=0,2=1的正态分布称为标准正态分布(standa,10,对于任何一个服从正态分布,N,(,2,),的随机变量,x,,都可以通过标准化变换:,u=,(,x-,), (4-10),将其变换为服从标准正态分布的随机变量,u,。,u,称 为 标 准 正 态变量或标准正态离差,(standard normal deviate),。,标准正态分布,二、标准正态分布,对于任何一个服从正态分布N(,2)的随机变,11,(一)标准正态分布的概率计算,设,u,服从标准正态分布,则,u,在,u,1,u,2,)何内取值的概率为:,(,u,2,),(,u,1,) (4-11),而,(,u,1,),与,(,u,2,),可由附表,1,查得。,三、正态分布的概率计算,(一)标准正态分布的概率计算 三、正态分布的概率计,12,试验设计与统计常用概率分布课件,13,由,(4-11),式及正态分布的对称性可推出下列关系式, 再借助附表,1,, 便能很方便地计算有关概率:,P,(0,u,u1,),(,u1,)-0.5,P,(,u,u1,) =(-,u1,),P,(,u,u1,)=2(-,u1,),P,(,u,u1,),1-2(-,u1,),P,(,u1,u,u2,),(,u2,)-(,u1,),三、正态分布的概率计算,由(4-11) 式及正态分布的对称性可推出下列关,14,【,例,】,已知,u,N(0,,,1),,试求:,(1),P,(,u,-1.64),?,(2),P,(,u,2.58)=?,(3),P,(,u,2.56)=?,(4),P,(0.34,u,1.53) =?,三、正态分布的概率计算,【例】 已知uN(0,1),试求:三、正态分布,15,利用,(4-12),式,查附表,1,得:,(1),P,(,u,-1.64)=0.05050,(2),P,(,u,2.58)=(-2.58)=0.024940,(3),P,(,u,2.56),=2(-2.56)=20.005234,=0.010468,(4),P,(0.34,u,1.53),=(1.53)-(0.34),=0.93669-0.6331=0.30389,三、正态分布的概率计算,利用(4-12)式,查附表1得:三、正态分布的概率计算,16,关于标准正态分布,以下几种概率应当熟记:,P,(,-1,u,1,),=0.6826,P,(,-2,u,2,),=,0.9545,P,(,-3,u,3,),=0.9973,P,(,-1.96,u,1.96,),=0.95,P,(-2.58,u,2.58)=0.99,三、正态分布的概率计算,关于标准正态分布,以下几种概率应当熟记:三、正态分布的概,17,u,变量在上述区间以外取值的概率分别为:,P,(,u,1)=2(-1)=1-,P,(-1,u,1),=1-0.6826=0.3174,P,(,u,2)=2(-2),=1-,P,(,-2,u,2,),=1-0.9545=0.0455,P,(,u,3)=1-0.9973=0.0027,P,(,u,1.96)=1-0.95=0.05,P,(,u,2.58)=1-0.99=0.01,三、正态分布的概率计算,u变量在上述区间以外取值的概率分别为:三、正态分布,18,(二)一般正态分布的概率计算,正态分布密度曲线和横轴围成的一个区域,其面积为,1,,这实际上表明了,“,随机变量,x,取值在,-,与,+,之间,”,是一个必然事件,其概率为,1,。,若随机变量,x,服从正态分布,N,(,2,),,则,x,的取值落在任意区间,x,1, x,2,)的概率,记作,P,(,x,1, x,x,2,),,等于图,4,6,中阴影部分曲边梯形面积。即:,(二)一般正态分布的概率计算,19,(4-13),对,(4-13),式作变换,u,=(,x,-),,得,dx,=,du,,故有,其中,20,这表明服从正态分布,N,(,2,),的随机变量,x,在,x,1,,,x,2,内取值的概率,等于服从标准正态分布的随机变量,u,在,(,x,1,-)/, (,x,2,-)/,),内取值的概率。,计算一般正态分布的概率时,只要将区间的上下限作适当变换,(,标准化,),,就可用查标准正态分布的概率表的方法求得概率。,三、正态分布的概率计算,这表明服从正态分布N(,2)的随机变量x 在,21,【,例,】,设,x,服从,=30.26,2,=5.10,2,的正态分布,试求,P,(21.64,x,32.98),。,令,则,u,服从标准正态分布,故,=,P,(-1.69,u,0.53),=(0.53)-(-1.69),=0.7019-0.04551,=0.6564,【例】 设x服从=30.26,2=5.102,22,关于一般正态分布,以下几个概率,(,即随机变量,x,落在,加减不同倍数,区间的概率,),经常用到,P,(-,x,+)=0.6826,P,(-2,x,+2) =0.9545,P,(-3,x,+3) =0.9973,P,(-1.96,x,+1.96) =0.95,P,(-2.58,x,+2.58) =0.99,三、正态分布的概率计算,关于一般正态分布,以下几个概率(即随机变量x落在,23,生物统计中,不仅注意随机变量,x,落在平均数加减不同倍数标准差区间,(-,k,+,k,),之内的概率,而且也很关心,x,落在此区间之外的概率。,把随机变量,x,落在平均数,加减不同倍数标准差,区间之外的概率称为双侧概率,(,两尾概率,),,记作,。,对应于双侧概率可以求得随机变量,x,小于,-,k,或大于,+,k,的概率,称为单侧概率,(,一尾概率,),,记作,2,。,三、正态分布的概率计算,生物统计中,不仅注意随机变量x落在平均数加减不同,24,例,x,落在,(-1.96,+1.96),之外的双侧概率为,0.05,,而单侧概率为,0.025,。即,P,(,x,-1.96,),=,P,(,x,+1.96)=0.025,双侧概率或单侧概率如图,4,7,所示。,x,落在,(-2.58,+2.58),之外的双侧概率为,0.01,,而单侧概率为,P,(,x,-2.58)=,P,(,x,+2.58)=0.005,例 x落在(-1.96,+1.96)之外的双,25,附表,2,给出了满足,P,(,u,)=,的双侧分位 数值。因此, 只要已知双侧概率,的值,由附表,2,就可直接查出对应的双侧分位数 ,查法与附表,1,相同。,例如,已知,u,N,(0,1),试求:,(1),P,(,u,- )+P(,u, )=0.10,的,(2),P,(- ,u,)=0.86,的,因为附表,2,中的,值是:,附表2给出了满足P (u )=,26,所以 (,1),P,(,u,- )+,P,(,u, ),=1-,P,(- ,u,=0.10=,由附表,2,查得:,=1.644854,(2),P,(- ,u,) =0.86,,,=1-,P,(- ,u,)=1-0.86=0.14,由附表,2,查得:,=1.475791,对于,x,N,(,2,),,只要将其转换为,u,N,(0,1),,即可求得相应的双侧分位数。,所以 (1) P(u- )+ P(u,27,【,例,】,已知猪血红蛋白含量,x,服从正态分布,N ( 12.86,,,1.33,2,),,若,P,(,x,) =0.03,P,(,x, )=0.03,,求 , 。,由题意可知,,2=0.03,,,=0.06,,又因为,故,P,(,x,)+,P,(,x, ),=,P,(,u,- ) +,P,(,u, ),=1-,P,(- u,)=0.06=,【例】 已知猪血红蛋白含量x服从正态分布 N,28,由附表,2,查得:,=1.88,所以,( -12.86)/1.33=-1.88,( -12.86)/1.33=1.88,即 ,10.36,, ,15.36,。,试验设计与统计常用概率分布课件,29,正态分布的一个特殊用途,用来找出一组数据中的,异常值,,在统计分析中非常重要;,异常值是指在(,-1.96,+1.96,)范围之外的观测值;,异常值可能来源于样品本身,也有可能来自于操作过程中的误差;,在统计分析中应予以剔除。,正态分布的一个特殊用途用来找出一组数据中的异常值,在统计分析,30,一组牛肉剪切力值,(kg),107.432,162.431,83.05,124.031,72.442,87.308,128.569,64.383,142.976,127.994,81.357,68.068,85.338,64.001,85.343,118.37,82.154,83.823,78.855,76.54,87.282,74.398,119.07,Average=95.88 kg, SD=27.18 kg,一组牛肉剪切力值(kg)107.432162.43183.0,31,第二节 二项分布,一、贝努利试验及其概率公式,在随机试验中,如果每次试验结果出现且只出现对立事件,A,与 之一,在每次试验中出现,A,的概率是常数,p,(0,p,1),,因而出现对立事件 的概率是,1-p=q,,则称这一串重复的独立试验为,n,重贝努利试验,简称贝努利试验,(Bernoulli trials),。,第二节 二项分布 一、贝努利试验及其概率公式,32,适合于离散型随机变量,如抽检的样品是否合格,添加剂含量是否超标等。,在,n,重贝努利试验中,事件,A,可能发生,0,,,1,,,2,,,,,n,次,事件,A,恰好发生,k,(0,k,n,),次的概率,Pn(k),。,先取,n,=4,,,k,=2,来讨论。在,4,次试验中,事件,A,发生,2,次的方式有以下 种:,适合于离散型随机变量,如抽检的样品是否合格,添加,33,一般,在,n,重贝努利试验中,事件,A,恰好发生,k,(0,k,n),次的概率为,k,=0,1,2,n,(4-14),若把,(4-14),式与二项展开式,相比较就可以发现,在,n,重贝努利试验中,事件,A,发生,k,次的概率恰好等于展开式中的第,k,+1,项,所以也把,(4-14),式称作,二项概率公式,。,k,n,k,k,n,n,q,p,C,k,P,-,=,),(,一般,在n重贝努利试验中,事件A 恰好发生k(0,34,二、二项分布的意义及性质,二项分布定义如下:,设随机变量,x,所有可能取的值为零和正整数:,0,1,2,,,n,,且有,=,k,=0,1,2,n,其中,p,0,,,q,0,,,p+q=1,,,则称,随机变量,x,服从参数为,n,和,p,的二项分布,(binomial distribution),,,记为,x,B(n,p),。,二、二项分布的意义及性质二项分布定义如下:,35,二项分布是一种离散型随机变量的概率分布,。参数,n,称为离散参数,只能取正整数;,p,是连续参数,它能取,0,与,1,之间的任何数值,(,q,由,p,确定,故不是另一个独立参数,),。,容易验证,二项分布具有概率分布的一切性质,即:,1,、,P(x=k),=,P,n,(k),(,k=0,1,,,n,),2,、二项分布的概率之和等于,1,,即,3,、,(4-15),4,、,(4-16),5,、,(,m,1,1),(,df,2) (4-27),t,分布密度曲线如图,4-12,所示,其特点是:,67,1,、,t,分布受自由度的制约,每一个自由度都有一条,t,分布密度曲线。,2,、,t,分布密度曲线以纵轴为对称轴,左右对称,且在,t,0,时,分布密度函数取得最大值。,3,、与标准正态分布曲线相比,,t,分布曲线顶部略低,两尾部稍高而平。,df,越小这种趋势越明显。,df,越大,,t,分布越趋近于标准正态分布。当,n ,30,时,,t,分布与标准正态分布的区别很小;,n ,100,时,,t,分布基本与标准正态分布相同;,n,时,,t,分布与标准正态分布完全一致。,1、t 分布受自由度的制约,每一个自由度都有一条,68,t,分布的概率分布函数为:,因而,t,在区间(,t,1,,,+,)取值的概率,右尾概率为,1-,F,t (df),。由于,t,分布左右对称,,t,在区间(,-,,,-,t,1,)取值的概率也为,1-,F,t (df),。,于是,t,分布曲线下由,-,到,-,t,1,和由,t,1,到,+,两个相等的概率之和,两尾概率为,2(1-,F,t (df),),。,(4-28),t 分布的概率分布函数为: (4-28),69,t,分布与,t,检验,t,检验基于,t,分布,常用于单个样本平均数与总体平均数的差异分析、两个样本平均数的差异分析,t分布与t检验t 检验基于 t 分布,70,
展开阅读全文