第三章-概率和概率分布

上传人:su****e 文档编号:243382092 上传时间:2024-09-22 格式:PPT 页数:110 大小:3.70MB
返回 下载 相关 举报
第三章-概率和概率分布_第1页
第1页 / 共110页
第三章-概率和概率分布_第2页
第2页 / 共110页
第三章-概率和概率分布_第3页
第3页 / 共110页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三章概率与概率分布,一、概率的概念,二、概率的计算,三、概率的分布,四、大数定律,第一节 概率基础知识,一、概率的概念,(一)事件,必然事件(,U,):一定条件下必然出现。,不可能事件(,V,):一定条件下必然不出现。,随机事件(,A,):一定条件下可能出现。,生物统计学只讨论随机事件。,(二)频率,设事件,A,在,n,次重复试验中发生了,m,次,其比值,m/n,称为事件,A,发生的频率,(frequency),,记为,:,W(A) =,m/n,(三)概率(,probability, P),事件,A,在,n,次重复试验中,发生了,m,次,当试验次数,n,不断增大时,事件,A,发生的频率,W(A),就越来越接近某一确定值,p,,于是定义,p,为事件发生的概率(,probability,)。,记为,:,P(A) = p,只有当试验次数无限增大时,任一事件的频率趋于稳定,这时频率又称统计概率这时的频率和概率才是一样的,调查株数(,n,),受害株数(,a,),植株受害频率,(,a/n,),0.40,0.48,0.30,0.33,0.36,0.354,0.351,0.350,0.352,例:表,3.1,棉田发生盲椿象的为害情况,表,3.2,抛掷一枚硬币发生正面朝上的试验记录,概率的三个性质:,(,1,)任何事件概率均满足,0,P(A)1,(,2,)必然事件的概率为,1,(,3,)不可能事件的概率为,0,,即,P(V),0,0P(A)1,P(U)=1,P(V),0,二、概率的计算,(一)事件的相互关系,和事件,积事件,互斥事件,对立事件,独立事件,完全事件系,事件,A,和事件,B,中至少有一个发生而构成的新事件称为事件,A,和事件,B,的和事件,记作,A+B,。,n,个事件的和,可表示为,A,1,+A,2,+An,。,和事件,A,B,A,B,事件,A,和事件,B,中同时发生而构成的新事件称为事件,A,和事件,B,的积事件,记作,AB,。,n,个事件的积,可表示为,A,1,A,2,A,n,。,积事件,A,B,AB,A,B,互斥事件,事件,A,和事件,B,不能同时发生,则称这两个事件,A,和,B,互不相容或互斥。,n,个事件两两互不相容,则称这,n,个事件互斥。,事件,A,和事件,B,必有一个发生,但二者不能同时发生,且,A,和,B,的和事件组成整个样本空间。即,A+B=U,,,AB=V,。则事件,B,为事件,A,的对立事件。,B= A,对立事件,互斥事件,对立事件,事件,A,和事件,B,的发生无关,事件,B,的发生与事件,A,的发生无关,则事件,A,和事件,B,为独立事件。,独立事件,完全事件系,如果多个事件,A,1,、,A,2,、,A,3,、,、,A,n,两两互斥,且每次试验结果必然发生其一,则称事件,A,1,、,A,2,、,A,3,、,、,A,n,为完全事件系。,(二)概率的计算法则,1,互斥事件加法定理,若事件,A,与,B,互斥,,则,P(A+B)=P(A)+P(B),推理,1 P(A,1,+A,2,+A,n,)=P(A,1,)+P(A,2,)+,P(A,n,),推理,2 P(A)=1-P(A),推理,3,完全事件系的和事件的概率为,1,。,2,独立事件乘法定理,事件,A,和事件,B,为,独立事件,,则事件,A,与事件,B,同时发生的概率为各自概率的积。,P(AB)=P(A)P(B),推理:,A,1,、,A,2,、,A,n,彼此独立,则,P(A,1,A,2,A,3,A,n,)=P(A,1,)P(A,2,)P(A,3,),P(A,n,),播种玉米时,每穴播两粒种子,种子的发芽率为,90%,,则:,A:,第一粒种子发芽,B:,第二粒种子发芽,C:,两粒种子均发芽,D:,只有一粒种子发芽,E:,两粒种子均不发芽,(一)离散型变量的概率分布,要了解离散型随机变量,x,的统计规律,必须知道它的一切可能值,x,i,及取每种可能值的概率,p,i,。,三、概率分布,列出离散型随机变量,X,的所有可能取值,.,列出随机变量取这些值的概率,.,通常用下面的表格来表示,:,表,3.3,离散型变量的概率分布,变量,(x) x,1,x,2,x,3,x,4,.,x,n,概率,(P) p,1,p,2,p,3,p,4,.,p,n,设离散型变量,x,的一切可能值为,x,i,(i,=1,2,3),取相应值的概率为,p,i,,则,p,i,称为离散型随机变量,x,的概率函数。,表,3.4,某鱼群的年龄组成,年龄,(x) 1 2 3 4 5 6 7,频率,(W) 0.4597 0.3335 0.1254 0.0507 0.0215 0.0080 0.0012,例,鱼群年龄的概率分布,例:掷一次骰子所得点数的概率函数,概率分布列,例:掷二次骰子所得点数之和的概率分布,概率分布图,(二)连续型变量的概率分布,整理成频率分布表,,n,增加、,分组多,组距减少、直方条增加,阶梯形曲线趋于光滑,当,n,无限大时,频率转化为概率,阶梯形曲线也就转化为一条光滑的连续曲线,这时频率分布就转化为概率分布了,此曲线为,总体,的概率密度曲线。曲线函数用,f(x,),表示。,连续型随机变量不能列出每一个值及其相应的概率,,在某一区间内可以有无限种可能的值,定义其取某特定值的概率没有意义,只能定义它在某区间内取值的概率。,概率密度函数,f(x,),与,x,轴所围成的面积为,1,。,连续型随机变量,x,在某一区间的概率:,值,(,值,频数,),频数,f,(,x,),a,b,x,概率密度函数,f,(,x,),f,(,x,),不是概率,概率函数,(probability function),随机变量所取的值,x,的概率写成,x,的函数(离散型随机变量),概率密度函数,(probability density function),随机变量取某一特定值,x,的概率密度的函数(连续型随机变量),概率分布函数或概率累积函数,(probability distribution function),随机变量取值小于或等于某特定值的概率。,频率,W(A),概率,P(A),n,值大,统计数,参 数,四、大数定律,大数定律,:概率论中用来阐述大量随机现象平均结果稳定性的 一系列定律的总称。,设,m,是,n,次独立试验中事件,A,出现的次数,而,p,是事件,A,在每次试验中出现的概率,则对于任意小的正数,1,、贝努,利,大数定律(,Bernoulli theorem,),Jocob,Bernoulli,(,1654-1705,年),:,瑞士数学家,当实验次数足够多时,某一事件出现的频率与概率有较大偏差的可能性很小,设,x,1,x,2,x,3,x,n,是来自同一总体的变量,对于任意小的正数,。,2,、辛钦大数定律(,Khinchine,theorem,),Khinchine,(18941959),苏联数学家,只要从总体中抽取 的随机变量相当多,就可以用样本的统计数来估计总体的参数。,参数,统计数,样本容量越大,样本统计数与总体参数之差越小。,随机变量的分布可用分布函数来表述概率,离散型变量,(discrete random variable),连续型变量,(continuous random variable),二项分布,泊松分布,正态分布,变,量,第二节 几种常见的理论分布,动物,种子,穗子,生物个体,雄性,雌性,发芽,不发芽,有芒,无芒,成活,死亡,对立事件,一、二项分布,贝努利分布,二项总体,二项分布,“,非此即彼”事件所构成的总体,概率分布,二,项,总,体,特,点,1,、,试验只有两个对立结果,概率分别为,p,与,q,(,q=1-p,),2,、,重复性,3,、独立性,(一)二项分布的概率函数,试验的条件不变,即在每次试验中事件,A,出现的概率皆为,p,。,任何一次试验中,事件,A,的出现与其余各次试验中出现的结果无关。,从雌雄各半的,100,只动物中,做一抽样试验。,第一次从这,100,只动物中随机抽取,1,只,记下性别后放回,再做第二次抽样。,不论第一次抽样结果,第二次抽样中,得到雌性或雄性的概率仍是,50,100,。,这两次试验是,独立,的,第一次抽样后不放回,再做第二次抽样。,这两次试验是非独立的,雄性动物,抽到雄性的概率是,49,99,抽到雌性的概率是,50,99,雌性动物,抽到雄性的概率是,50,99,抽到雌性的概率是,49,99,放回式抽样,非放回式抽样,二项分布,超几何分布,x,表示在,n,次试验中事件,A,出现的次数,其概率分布函数为:,P(x,),为随机变量,x,的二项分布,记作,B(n, p),p(x,) =1,二项分布的概率函数,【,例,】,已知一批产品的次品率为,4%,,从中任意有放回地,抽取,5,个。求,5,个产品中:,(1),没有次品的概率是多少?,(2),恰好有,1,个次品的概率是多少?,(3),有,3,个以下次品的概率是多少?,(1),当,p,值较小且,n,不大时,分布是偏倚的。随,n,的增大,分布趋于对称,;,(,2,)对于固定的,n,和,p,,当,x,增加时,,P(x,),先随之增加并达到极大值,以后又下降。,(,3,)当,p,值趋于,0.5,时,分布趋于对称。,二项分布的形状,二项分布,B(n,p,),的参数,二项成数分布:,p,p,应用二项分布时,当试验的次数,n,很大,成,功的概率,p,很小时 ,这时二项分布就变成泊,松分布,,为二项分布的一种特殊类型。,例:,一匹布上发现的疵点个数,一定页数的书刊上出现的错别字个数,抽检大量产品中出现次品的件数,田间小区内出现变异植株的计数,二、泊松分布,(Poisson distribution),(Simeon-Denis Poisson, 1781-1840),法国数学家,n,很大,,p,值很小。,用来描述和分析随机地发生在单位空间或时间里的,稀有事件,的概率分布。,为参数,,np,e = 2.71828,泊松分布概率函数,P(,),的形状由,确定,较小时,泊松分布偏倚。,增大时,泊松分布趋于对称。,无限增大时,泊松分布接近正态分布。,泊松分布形状,对于小概率事件,可用泊松分布描述其概率分布。,二项分布当,p0.1,和,np,5,时,可用泊松分布来近似。,2,1,泊松分布应用,【,例,】,假定某航空公司预订票处平均每小时接到,42,次订票电话,那么,10,分钟内恰好接到,6,次电话的概率是多少?,解,:,设,X,为,10,分钟内航空公司预订票处接到的电话次数,围绕在平均值左右,由平均值到分布的两侧,变量数减少,即,两头少,中间多,两侧对称。,特点,Gauss,1777-1855,三、正态分布(,normal distribution,),N,非常大,p,与,q,接近,大,二项分布,泊松分布,正态分布,p,0.1,,,(,np,),5,(一)正态分布的概率函数,总体平均数,总体标准差,圆周率,,3.14159,e,为自然对数底,,2.71828,记为:,N (,2,),x=,时,,f(x,),值最大,正态分布曲线是以平均数,处为峰值的曲线。,x-,的绝对值相等时,,f(x,),值也相等,正态分布以,为中心向左右两侧对称。,f(x,),是非负函数,以,x,轴为渐近线,,x,的取值区间为,(,-,+),。,1,2,(二)正态分布的特征,3,正态分布曲线由参数,,,决定,,确定正态分布曲线在,x,轴上的中心位置,,减小,曲线左移,,增大,曲线右移;,确定正态分布的展开程度, ,大,曲线展开度越大,数据分散。,小,曲线展开度小,数据集中。,4,的,影响,的,影响,决定曲线在x 轴上的位置,决定曲线的形状,正态分布曲线在,x=,处各有一个拐点,曲线通过拐点时改变弯曲度。,5,曲线与,x,轴围成的全部面积为,1,6,a,b,x,f,(,x,),若一个连续型随机变量,x,取值于区间,(,a,b,),,其概率为,:,(三)标准正态分布,正态分布是依赖于参数,(,2,),的一个曲线系,正态曲线的位置及形态随,(,2,),的不同而不同,需将其标准化。,标准正态分布:,随机变量具有均值,为,0,,方差 为,1,的,正态分布,(u,分布),,记作,N(0,1),。,2,标准正态分布方程:,u,表示标准正态离差,它表示离开平均数,有几个标准差,。,任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布:,令,正态分布标准化实质上做出了座标轴的平移和尺度转换,使正态分布具有平均数为,0,,标准差为,1,。,标准正态分布,u,落在区间,(,a,b,),的概率,:,a b,标准正态分布的概率累积函数,记作,F(u,),:,它是变量,u,小于某一定值,u,i,的概率,这需要计算从,-,到,u,i,的定积分:,原始数值,70 80 90 100 110 120 130,(,均值,),x,f,(,x,),标准化,-3 -2 -1 0 1 2 3,概率值独立于实际的均值和标准差,只与原始数值相对于均值的位置有关,(四)正态分布的概率计算,N,(,0,,,1,),N,(,100,,,100,),1,、标准正态分布表的使用,对于标准正态分布,即,N,(0,1),,有,P,(,u,b,) ,F,u,=,b, ,F,b,P,(ua)1-,F,u,=,a, =1-,F,a,P,(,a,u,b,),F,b, ,F,a,P,(|,u,| ,a,) 2,F,-,a,P,(|,u,| ,a,) 2,F,a, 1,P,(0,u,a,),F(,a,)-0.5,计算:,已知,u,N(0,,,1),,试求:,P(0u1); P(u1.1),;,P(u,0.9),;,P(X2.5,),2,) 查附表,1,1,)先标准化,将正态分布的随机变量,x,取值区间的上下限按照,转换成,u,值取值区间单位上下限,2,、计算一般正态分布的概率,例:假定,x,是一随机变数具有正态分布,平均数,=,30,,标准差,=5,,试计算小于,26,,小于,40,的概率,介于,26,和,40,区间的概率以及大于,40,的概率。,1,:,P,(,x,26)=,F,(26),先将,x,转换成,u,值,u=(,x,-,)/,=,(26-30)/5=,0.8,查附表,2,,当,u=,0.8,时,F,(26)=0.2119,2,:,P,(,x,40)=,F,(40),u=(,x,-,)/,=,(40-30)/5=2.0,查附表,2,,当,u=2.0,时,F,(40)=0.9773,3,:,P (2640)=1-,P,(,x,40)=1-0.973=0.0227,【,例,】,假定某公司职员每周的加班津贴服从均值为,50,元、标准差为,10,元的正态分布,那么全公司中有多少比例的职员每周的加班津贴会超过,70,元,又有多少比例的职员每周的加班津贴在,40,元到,60,元之间呢?,解:,设,=50,,,=10,,,X,N,(50,10,2,),正态曲线下面积分布规律,1.65,:,占全部曲线下面积的,90%,1.96,:,占全部曲线下面积的,95.00%,2.58,:,占全部曲线下面积的,99.00%,-3,-2,-,+,+2,+3,x,68.3%,95.5%,99.7%,P(-,x+,),P(-2x+2),P(-3x+3),= P(-1u1)=0.6826,= P(-2u2)=0.9545,= P(-3u3)=0.9973,=P(-1.96u1.96)=0.95,=P(-2.58,u2.58)=0.99,P(-1.96x+1.96),P(-2.58,1),,,(,df,2,),t,分布密度曲线特点是:,概率密度函数,(),t,分布曲线左右对称,围绕平均数,t,=0,向两侧递降。,(,2,),t,分布受自由度,df,=n-1,制约,每个,df,都有一条,t,分布曲线。,(,3,)和正态分布相比,,t,分布的顶端偏低,尾部偏高,自由,度,df,30,时,其曲线接近正态分布曲线,,df,时则和,正态分布曲线重合。,t,分布曲线与横轴所围成的面积为,1,。,t,分布,双侧分位数表:附表,3,例如,当,df,=15,时,两尾概率,a,=0.05,,,t,=2.131,,其意义是:,P,(-,t,-2.131)+,(2.131,t,+)= 0.05,。,即:,P,(-,t,-2.131) =,P,(2.131,t30,时,卡方分布已接近正态分布。,1,2,3,2,分布,上侧,分位数表:,附表,4,2,分布是不对称的,表中表头的概率,是,2,大于表内所列,2,值的概率。,df,= 2,P,(,2,5.99,),0.05,P,(,2,9.21,),0.01,P,(,2,0.10,),0.95,六、,F,分布,设从一正态总体,N(,2,),中随机抽取样本容量为,n,1,,,n,2,两个独立样本,其样本方差分别为,s,1,2,和,s,2,2,,则定义其比值为,F,:,df,1,=n,1,-1,;,df,2,=n,2,-1,。,样本方差比的分布,分布的概率累积函数,分布的概率密度函数,分布的平均数,F,=1,,的取值区间为,0,+,),分布是随自由度,df1,和,df2,进行变化的一组曲线。分布曲线的形状仅决定于,df,1,和,df,2,。在,df,1,1,或,2,时,分布曲线呈严重倾斜的反向型,当,df,1, 3,时,转为左偏曲线。,1,2,特征:,对于给定的,(01),,,(n,,,),为分布的上,分位点(或临界值点)。,F,分布的,上侧,分位数表:,附表,5,P,(,3.48,),0.05,P,(,5.99,),0.01,概率的基础知识,常见的理论分布,统计数的分布,二项分布,泊松分布,正态分布,概率的概念,概率的计算,概率的分布,大数定律,离散型变量,连续型变量,抽样与无偏估计,1,、在随机变量服从的正态分布中,当,=,,,=,时,则为标准正态分布。,2,、人口调查中,以人口性别所组成的总体是,_,分布。,3,、在试验中,两个事件有一个发生时,另一个就不发生,称这两个事件为,( ),A,、独立事件,B,、相容事件,C,、互斥事件,4,、任何事件(包括必然事件、不可能事件、随机事件)的概率都在( )。,A,、与之间,B,、,0,与之间,C,、与,0,之间,D,、与之间。,练习,5,、正态分布的密度曲线向左、向右无限延伸,以()。,A,、,y,轴为渐近线,B,、,y = a,轴为渐近线,C,、,x = b,轴为渐近线,D,、,x,轴为渐近线,6,、一组数据有,9,个样本,其中某样本的标准差是,0.96,,则样本平均数的标准误是( )。,A,、,0.11 B,、,8.64 C,、,2.88D,、,0.32,7,、在一组数据中,如果一个变数,10,的离均差是,2,,那么该组数据的平均数是,( ),。,A,、,12B,、,10 C,、,8D,、,2,8,、假定我国和美国居民的年龄方差相同。现在各自用重复抽样方法抽取本国人口的,1%,计算平均年龄,则平均年龄的标准误( )。,A,、两者相等,B,、前者比后者大,C,、前者比后者小,D,、不能确定,作业,P3.5-3.8,;,3.11,观察值的标准差与平均数的标准误,标准差,:,对观察,值离散,程度,的度量;观察值与平均数的接近程度。,可,理解为每个观察值与平均数的离差,的平均。,用于,确定总体中大部分观察值所在,的范围。,标准误,反映样本平均数抽样分布的离散程度,估计抽样误差表示样本,平均数估计总体平均数时的,精确程度;该样本平均数与总体平均数的接近程度。,用于,确定,估计总体,平均数,的置信区间。,n,=1,f,y,f,n,=2,y,f,n,=4,y,f,n,=8,y,不同样本容量的平均数的抽样分布形状,中心极限定理,(central limit theorem),在相同的自由度,df,时,,t,值越大,概率,P,越小。,df,增大,,t,分布接近正态分布,即,t,值接近,u,值。,在相同的,P,值下,随,df,的增加,临界,t,值减小。,例,1,, 标准正态分布的两尾概率为,0.28,,求分位数,u,值。,例,2.,设标准正态分布的右尾概率为,0.1587,,,求,u,值。,解:双尾概率,=0.15872=0.3174,,,查表,2,:,当,a=0.31,时,,u=1.015222,当,a=0.32,时,,,u=0.994458,0.310.31740.32,U=0.999 8581,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!