第03章-概率与概率分布课件

上传人:仙*** 文档编号:241626132 上传时间:2024-07-11 格式:PPT 页数:70 大小:3.37MB
返回 下载 相关 举报
第03章-概率与概率分布课件_第1页
第1页 / 共70页
第03章-概率与概率分布课件_第2页
第2页 / 共70页
第03章-概率与概率分布课件_第3页
第3页 / 共70页
点击查看更多>>
资源描述
生物统计学3 概率与概率分布概率与概率分布本章内容概率基础知识几种常见的理论分布统计数的分布2概率基础知识概率的概念概率的计算概率的分布大数定律3概率基本概念事件在一定条件下,某种事物出现与否称为事件自然界和社会生活上发生的现象是各种各样的,分为:确定性事件:在一定条件下必然出现某种结果或必然不出现某种结果(必然事件和不可能事件)随机事件:在一定条件下可能发生也可能不发生为研究随机现象,需要进行大量重复的调查、实验、测试等,统称为试验4概率基本概念频率(frequency)在相同的条件下,进行了n次试验,事件A出现的次数m称为事件A出现的频数,比值m/n称为事件A出现的频率,记为W(A)=m/n0W(A)1种子发芽与否是不能事先确定的,但从表中可以看出,试验随着n值的不同,种子发芽率也不相同,当n充分大时,发芽率在0.92附近摆动 表3-1玉米种子发芽试验结果种子总数(n)1020501002005001000发芽种子数(m)9194791186458921种子发芽率(m/n)0.900.950.940.910.930.920.925概率基本概念概率(probability,P)相同条件下,进行大量重复试验,若事件A的频率稳定地在某一确定值p的附近摆动,称p为事件A出现的概率在一般情况下,随机事件的概率P是不可能准确得到的通常以试验次数n充分大时,随机事件A的频率作为该随机事件概率的近似值6概率的基本概念经典概率某些随机事件,不用进行多次重复试验来确定其概率,而是根据随机事件本身的特性直接计算其概率随机事件若满足试验的所有可能结果只有有限个,即样本空间中的基本事件只有有限个各个试验的可能结果出现的可能性相等,即所有基本事件的发生是等可能的试验的所有可能结果两两互不相容则若样本空间有n个等可能的基本事件所构成,其中事件A包含有m个基本事件,则事件A的概率为m/n,即P(A)=m/n7概率的基本概念经典概率计算例:在编号为110的10个球中有3个红色、7个黄色的球,求下列事件的概率:A抽得一个编号4B=抽得一个编号是2的倍数C=抽得一个红球D=一次取5个球,其中有2个红球的概率10个球中任意取5个,其可能结果有n=个基本事件D=5个球中有2个红球,则D包含的基本事件m=P(D)=n/m=0.4178概率基本概念概率的基本性质概率的基本性质任何事件0P(A)1必然事件P(U)=1不可能事件P(V)0随机事件0P(A)19概率的计算事件的相互关系和事件:二者之一发生,A+B(多个事件)积事件:二者同时发生,AB(多个事件)互斥事件:二者不能同时发生,AB=V(多个事件)对立事件:其一发生但不同时发生,A+B=U,AB=V,B=独立事件:A发生与否与B无关(多个事件)完全事件系:多个事件两两互斥,其一必发生,P(A1A2An)10概率的计算法则互斥事件加法定理互斥事件加法定理若事件A与B互斥,则 P(A+B)=P(A)+P(B)推理1 P(A1+A2+An)=P(A1)+P(A2)+P(An)推理2 P()=1-P(A)推理3 完全事件系的和事件的概率为1独立事件乘法定理独立事件乘法定理事件A和事件B独立,则P(AB)=P(A)P(B)推理:A1、A2、An彼此独立,则 P(A1A2A3An)=P(A1)P(A2)P(A3)P(An)11概率分布随机变量的每一个值都对应一定的概率,其一切可能取值的概率的分布称为变量的概率分布概念分布用函数表示概率分布函数的图像在第一象限表示离散型变量和连续型变量的概率分布不同12离散型变量的概率分布设离散型变量x的所有一切可能值xi(i=1,2,3),其相应值的概率为pi,则P(x=xi)称为离散型随机变量x的概率函数P(x=xi)=pi,i=1,2,3pi0,pi=1变量(x)x1x2x3x4.xn概率(P)p1p2p3p4.pn13连续型变量的概率分布当试验资料为连续型变量,一般通过分组整理成频率分布表如果从总体中抽取样本的容量n相当大,则频率分布就趋于稳定,可将它近似地看成总体概率分布14连续型变量的概率分布当n无限大时,频率转化为概率,频率密度也转化为概率密度,阶梯形曲线也就转化为一条光滑的连续曲线,这时频率分布也就转化为概率分布了,此曲线为总体的概率密度曲线,曲线函数f(x)称为概率密度函数15连续型变量的概率分布ab对于一个连续型随机变量x,取值于区间a,b内的概率为函数f(x)从a到b的积分,即:16大数定律大数定律概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称主要内容样本容量越大,样本统计数与总体参数之差越小贝努里大数定律和辛钦大数定律17大数定律贝努里大数定律试验次数n无限大时,设m是n次独立试验中事件A出现的次数,而p是事件A在每次试验中出现的概率,则对于任意小的正数,有如下关系:辛钦大数定律试验次数n无限大时,对来自同一总体的变量x,对于任意小的正数,有如下关系:18几种常见的理论分布二项分布泊松分布正态分布19随机变量的概率分布正态分布离散型变量连续型变量二项分布泊松分布变量20二项分布(binomialdistribution)离散型随机变量的分布二项总体:对立事件,非此即彼若出现事件A的概率p(0p1),出现对立事件的概率q=1-p,则在n次试验中,事件A出现x次的概率为:21二项分布事件A发生x次的概率等于展开式中含px的项P(x)为随机变量x服从参数n和p的二项分布,记为B(n,p)二项分布的条件重复性:试验条件不变时,事件A出现的概率恒定为p独立性:一次试验中事件A出现与否与其他试验无关22二项分布概率函数理论次数概率累计函数23例题3.4豌豆红花、白花纯合基因型杂交,F2分离比3:1,随机观察4株,求得红花0、1、2、3、4株的概率红花株数F(x)010.7500.254=0.00390.0039140.7510.253=0.04690.0508260.7520.252=0.21090.2617340.7530.251=0.42190.6836410.7540.250=0.31641.0000总和1.000024例题3.5鸡种蛋的孵化率为90%,随机抽取5只,求孵化出小鸡数的各种可能概率孵化出小鸡数F(x)010.9000.105=0.000010.00001150.9010.104=0.000450.000462100.9020.103=0.008100.008563100.9030.102=0.072900.08146450.9040.101=0.328050.40951510.9050.100=0.590491.000025例题3.6小麦田间变异概率为0.0045,求100株出现2株及以上变异的概率有0.99概率获得1株以上变异需调查的株数P(x2)=1-P(0)-P(1)=0.0751欲求P(x1)=0.99,即求P(0)=0.01也即于是0.9955n=0.01n=1021(株)26二项分布的形状和参数形状二项分布B(n,p)的形状由n和p两个参数决定当p值较小且n不大时,分布是偏倚的;随n的增大,分布趋于对称当p值趋于0.5时,分布趋于对称27二项分布的形状和参数参数参数平均数(次数)标准差(次数)平均数(成数)标准差(成数)28泊松分布(Poissondistribution)离散型随机变量的分布,二项分布的一种特殊类型用来描述和分析随机发生的稀有事件的概率分布概率函数,=np,x=0,1,2,可由二项分布概率函数导出参数:=np=,二项分布当p0.1或np5时,可用泊松分布来近似描述29形状P()的形状由确定较小时,泊松分布偏倚增大时,泊松分布趋于对称无限增大时,泊松分布接近正态分布30例题3.8小麦田间变异概率为0.0045,求100株出现2株及以上变异的概率有0.99概率获得1株以上变异需调查的株数=np=1000.045=0.45P(x2)=1-P(0)-P(1)=0.0755(0.0751)欲求P(x1)=0.99,即求P(0)=0.01也即n=1023(1021)(株)31正态分布(normaldistribution)高斯分布(Gaussdistribution)多数变量围绕在平均值左右中间多,两头少,两侧对称多数计量资料近似服从正态分布试验误差的分布一般服从正态分布n很大或p、q接近时,二项分布接近正态分布很大时,泊松分布接近正态分布32正态分布的概率函数连续型随机变量的概率分布用概率密度函数来描述正态分布的概率密度函数为表示x值出现的概率密度函数值,-x参数:N(,2),总体平均数,总体标准差33正态分布的特征x=时f(x)值最大,密度曲线以为中心分布x-绝对值相等时f(x)相等,密度曲线以为中心两侧对称f(x)是非负函数,以x轴为渐近线34正态分布的特征正态分布曲线由参数,决定,确定正态分布曲线在x轴上的中心位置,确定正态分布的变异度正态分布曲线在x=处各有一个拐点,曲线通过拐点时改变弯曲度分布曲线与x轴围成的全部面积为135正态分布的区间概率若一个连续型随机变量x取值于区间a,b,其总概率为ab36标准正态分布正态分布是依赖于参数,2的一个曲线系正态曲线的位置及形态随,2而不同=0,2=1的正态分布称为标准正态分布(u分布)如果令,则N(,2)变为N(0,1)(u分布)概率密度函数为37标准正态分布概率累积函数区间的概率ui38正态分布表为了计算方便,对于不同的u值,计算出不同的F(x),编成的函数表可以查到u任意一个区间内取值的概率附表1Page325-32739正态分布的概率计算a b-a40正态分布的概率计算一般正态分布的概率,需将区间的上下限作适当变换(标准化),才可用正态分布表的方法求其概率服从正态分布N(,2)的随机变量,x的取值落在区间x1,x2的概率P(x1xx2),等于服从标准正态分布的随机变量u在(x1-)/,(x2-)/内取值的概率41正态分布的概率计算P(|x|+)=P(|u|1)=0.6826P(|x|+2)=P(|u|2)=0.9545P(|x|+3)=P(|u|3)=0.9973P(|x|+1.96)=P|u|1.96)=0.95P(|x|+2.58)=P(|u|2.58)=0.99P(|x|+1.96)=P(|u|1.96)=0.05P(|x|+2.58)=P(|u|2.58)=0.01P(x+1.64)=P(u1.64)=0.0542正态分布的应用参数估计总体平均数和标准差未知,可以用样本平均数和标准差s来估计和质量控制正态分布的变量在2及3的概率为95.45%和99.73%,试验中误差控制以x2s为警戒线,以x3s为控制线正态分布是很多统计方法的基础二项分布、泊松分布在极限均为正态分布,可按正态分布处理t检验、方差分析、相关回归分析等均要求指标服从正态分布非正态分布资料可作变量转换,使其成近似正态分布,然后按正态分布作统计处理43统计数的分布抽样试验与无偏估计样本平均数的分布样本平均数差数的分布t 分布x2分布F 分布44抽样试验与无偏估计根据样本对总体做出估计和推断,并不是直接用样本本身,而是用样本的统计量来对总体做出估计和判断由于从总体中抽取的样本提供的信息仅是总体的一部分,因此它不能提供完全准确的信息,必然存在着一定的误差对于样本容量相同的多次随机抽样,得到样本函数的观察值也是不同的,且其取值有一定的概率统计数也是随机变量,也有它的分布,称为抽样分布抽取一部分样本进行研究,或对小的有限总体进行放回式的抽样,这种部分抽样比较接近实际45抽样试验与无偏估计N=3的近似正态总体,具有变量3,4,5可计算出:=4,20.6667,0.8165以n=2作独立的有放回式抽样总共可得到Nn329个样本46抽样试验与无偏估计样本编号 样本值 x s2 s 1 3,3 3.0 0.0 0.0000 2 3,4 3.5 0.5 0.7071 3 3,5 4.0 2.0 1.4142 4 4,3 3.5 0.5 0.7071 5 4,4 4.0 0.0 0.0000 6 4,5 4.5 0.5 0.7071 7 5,3 4.0 2.0 1.4142 8 5,4 4.5 0.5 0.7071 9 5,5 5.0 0.0 0.0000 36.0 6.0 5.656847抽样试验与无偏估计N=3的近似正态总体,具有变量3,4,5可计算出:=4,20.6667,0.8165以n=2作独立的有放回式抽样总共可得到Nn329个样本可计算出平均数:,s2=0.6667,s=0.625848抽样试验与无偏估计如果所有可能样本统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值样本平均数是总体平均数的无偏估计值样本方差是总体方差的无偏估计值样本标准差不是总体标准差的无偏估计值49样本平均数的分布从总体中抽出的样本为所有可能样本,且每个样本中的变量均为随机变量,所以样本平均数为随机变量,形成一定的理论分布,称为样本平均数的分布50样本平均数分布的参数样本平均数分布的平均数样本平均数分布的方差样本平均数的标准误从总体N(,2)进行的抽样,其样本平均数是的分布为N(,2/n)具有平均数和方差2的非正态总体,只要样本容量足够大,样本平均数的分布也接近N(,2/n)(中心极限定理)51样本平均数的标准误标准误反映了样本平均数x的抽样误差,即精确性的高低标准误大,各样本平均数间差异程度大,样本平均数的精确性低标准误小,各样本平均数间差异程度小,样本平均数的精确性高标准误的大小与原总体的标准差成正比,与样本含量n的平方根成反比从某特定总体抽样,因为是一定值,增大样本容量能降低样本平均数的抽样误差实际工作中,总体标准差往往是未知的,当样本容量足够大时,可用样本标准差s估计总体标准差:52样本平均数差数分布的参数样本平均数差数的平均数样本平均数差数的方差样本平均数差数的标准误两个独立正态分布总体中抽出的样本平均数差数的分布是 的正态分布总体方差未知但样本数量足够大时可用样本方差估计53样本平均数差数分布的方差计算1=2=n1=n2=n1=2=,n1=n2=n54t分布2已知当2未知且n30当2未知且n3055t分布概率密度平均数方差56t分布的特征t分布曲线是左右对称的,围绕平均数t=0向两侧递降t分布受自由度df=n-1的制约,每个自由度都有一条t分布曲线和正态分布相比,t分布顶端偏低,尾部偏高df30时,接近正态分布曲线,df时和正态分布曲线重合57t分布的特征t分布曲线与横轴所围成的面积为1同标准正态分布曲线一样,统计应用中最为关心的是t分布曲线下的面积(即概率)与横轴t值间关系不同自由度df下的t值表58-2.7762.776在自由度df相同时,t值越大,概率P越小df增大时,t分布接近正态分布(t值接近u)在t值相同时,双尾概率P为单尾概率P的两倍59-2.7762.776不同自由度的t分布概率df=10P(|t|2.228)=0.05P(|t|1.812)=0.05,P(|t|-1.812)=0.05df=4P(|t|2.776)=0.05t0.05(4)=2.776P(|t|4.604)=0.01t0.01(4)=4.604t落于-t0.05,+t0.05内的概率为0.95t落于-t0.01,+t0.01内的概率为0.9960 x2 分布为研究样本方差的分布,从方差为2的正态总体中,随机抽取k个独立样本,得到k个正态离差定义对一正态总体进行一系列确定样本数k随机独立抽样,则所有可能的x2值就构成一个x2分布,自由度为df=k-161x2分布的概率密度和概率累计函数概率密度函数概率累积函数62x2 分布的特征x2分布是连续型变量的分布x2分布于区间0,),并且呈反J型的偏斜分布x2分布的偏斜度随自由度df减小而增大,当自由度df=1时,曲线以纵轴为渐近线随自由度df的增大,x2分布曲线渐趋左右对称,当df30时,接近正态分布6364x2 分布的概率对于给定的(01),称满足条件的点为自由度为df的x2分布的分位点(右尾概率临界值)65F分布从一正态总体N(,2)中随机抽取样本容量为n1、n2的两个独立样本,其方差分别为,定义其比值为F:则值具有的自由度df1=n1-1和的自由度df2=n2-1对一正态总体在特定的df1和df2进行一系列随机独立抽样,则所有可能的值就构成一个分布66F分布的概率密度和概率累计函数概率密度函数概率累积函数分布是随自由度df1和df2进行变化的一组曲线67F分布的特征的取值区间为0,)分布的平均数F=1分布曲线的形状决定于df1和df2:在df11或2时,曲线呈严重倾斜的反向型当df13时,曲线转为左偏曲线68F分布的概率对于给定的(01),称满足条件的点为F分布的上分位点(右尾概率临界值)69P(3.48)0.05 F0.05(4,10)=3.48 P(5.99)0.01 F0.01(4,10)=5.9970
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!