《概率和理论分布》PPT课件.ppt

上传人:tia****nde 文档编号:12734658 上传时间:2020-05-20 格式:PPT 页数:64 大小:586.50KB
返回 下载 相关 举报
《概率和理论分布》PPT课件.ppt_第1页
第1页 / 共64页
《概率和理论分布》PPT课件.ppt_第2页
第2页 / 共64页
《概率和理论分布》PPT课件.ppt_第3页
第3页 / 共64页
点击查看更多>>
资源描述
第四章概率和理论分布,本章主要复习现象、事件、概率、频率等概念介绍小概率原理二项分布、泊松分布、正态分布等各类理论分布的概念和性质标准正态分布的概念和性质抽样和抽样分布标准误的概念和作用与下面统计假设检验有密切关系的t-分布、x2-分布和F分布,数理统计与经典数学最大的不同之处在于:经典数学只要计算结果,计算结果就是其目的数理统计也要计算,但得到计算结果不是目的,数理统计的目的是用计算结果来进行估计、推断在数理统计中这种估计有两样东西是必备的:样本概率即我们必须计算样本的统计量,在一定的概率保证下,用所得统计量来估计相应总体的参数,即用样本来推断总体:用一个试验的结果来得出更广义的、一般意义上的结论,例如:收获季节到了,我们从一个果园中随机采摘100个苹果,我们很容易就可以知道这100个苹果每个苹果的平均重量,这是小学算术但作为一个果农来说,他不仅仅希望知道这100个苹果的平均重量,他更希望通过这100个苹果的平均重量和大小差异(变异)知道整个果园的产量,知道这些苹果的均匀程度对他的销售的影响,甚至通过这些差异追溯以往的果园管理情况,这里,100个苹果就是样本,整个果园就是总体;100个苹果的平均重量就是样本平均数,大小差异就是标准差,计算这100个苹果的平均值和标准差就是统计;从100个苹果知道整个果园的情况(估产),就是推断;整个过程就是统计推断推断过程中,必须有概率保证,即有多大的把握,同样,在畜牧上、兽医上、水产上,都有类似的问题:我们作了一个试验,总希望通过这一试验得到一个一般性的结论期间,有以下工作要作:抽样试验记录数据整理统计推断结论其中,推断是需要有概率保证的因为我们希望知道,这种推断是否可靠、可信度有多大、会不会犯错误、犯错的可能性又有多大,因此,可以说,统计学的基础就是概率,没有概率和概率保证,统计和统计推断就成了无根之木,无源之水事实上,概率在一般生活中也无处不在,第一节概率论初步,一、随机现象和随机事件(一)现象必然现象(inevitablephenomenon)不可能现象(impossiblephenomenon)随机现象(randomphenomenon),(二)随机试验(randomexperiment)对随机现象进行观测,就是试验,满足以下三个条件的试验即为随机试验(随机试验简称试验):1、允许在相同条件下重复2、每次试验其结果不一定相同3、试验前并不知道试验会产生什么样的结果,(三)随机事件(randomevent)试验所产生的中间或终了结果就称为事件随机试验的结果就是随机事件(简称事件)用大写的拉丁字母A、B、C等来表示事件必然事件用U表示;不可能事件用V表示,二、事件间的关系和事件、积事件互斥事件、对立事件完全事件系、事件的独立性,三、随机事件的概率(probability)随机事件的出现,带有很大的偶然性;但这种偶然性也有一定的规律:有些随机事件出现的可能性大一些,有些则小一些因此需要用一个数值来表示这种可能性,这一数值就是概率即随机事件的概率就是对随机事件可能性大小的度量对某一试验进行n次重复,试验中事件A出现a次,事件A出现的频率(frequency)为:,当n无限增大,f将趋向于一个定值p,p即为随机事件的概率:事实上,由于n总是无限大的,因此p一般不可能得到,因此在实际工作中,总是将n充分大时的f值近似地作为p值,即n足够大时的频率就是近似的概率,或用频率值来估计概率概率也可以是一个理论值,抛一个均质硬币,其落地时,正面朝上和反面朝上具有同等的机会,即同样的例子还有:,显然,即,必然事件的概率为1,不可能事件的概率为0概率与频率的区别和联系:1、频率的稳定就是概率2、随机事件发生的频率是一个变量,而概率是一个常量,一个定值,或一个理论值3、频率是概率的随机表现4、每一次试验可以得到一个频率,但希望通过一次试验就得到概率是不可能的,5、如果已经知道随机事件A发生的概率,就可以预测事件A在将要进行的试验中出现的可能性6、可以通过一个大样本的频率,或多个样本的频率来估计或预测概率,小概率原理:表示随机事件A是不可能事件;若很小,如或等等,表示随机事件A在某一次试验中出现的概率很小,即不可能出现的概率很大,以至于可以这样认为,在一次试验中事件A实际上是不可能事件,即,这就是概率论中的小概率事件实际不可能性原理,简称为小概率原理小概率原理是统计学中进行假设检验的基本原理,在以后的学习中经常会碰到,也经常应用,四、随机变量作一次试验,试验的可能结果可以是多样的:*有些试验结果是几个确定的结果,这些确定的结果可以一一列出#有些试验结果是一个范围如用x表示变量,那么x的取值的表示:或者可用一实数来表示(*者:x=0 x=1etc.)或者可用一个范围来表示(#者:1.5x2.1etc.),1、当随机变量x的取值是一个确定的实数,且每一实数发生的概率也是确定的,这种类型的变量就称为离散型随机变量(discreterandomvariable)如:设生男孩为,生女孩为,则其含义是:生男孩的概率为0.52,生女孩的概率为0.48又如:为猪丹毒治愈,为未治愈,则,设一个布袋里装有1个白球、2个红球、3个黑球、4个黄球,充分混匀,为取得白球,为取得红球,为取得黑球,为取得黄球,则将随机变量x所有可能取值及其对应的概率一一列出,可形成离散型随机变量的概率分布列:变量x:x1x2x3xn概率p1p2p3pn,上例中:从布袋中取得各色球x:0123概率0.10.20.30.4,2、当变量x的取值是一个范围,且x在这一范围内的概率是确定的,这种类型的变量就称为连续型随机变量(continuousrandomvariable)对于连续型随机变量,研究其取某一定值的概率是没有意义的对于随机变量x,若存在非负可积函数f(x),(-x5时接近正态分布,当n时,服从正态分布即正态分布是二项分布的极限,例1:用某一常规药物治疗猪瘟病,其正常治愈率为0.7,对20头罹患猪瘟的种猪用该种药物进行常规性治疗,问其中16头病猪被治愈的概率是多少?此例中,p=0.7,n=20,m=16该例中,200.714,2200.70.34.22.05例2:某药物对体外寄生虫的正常杀灭率为0.9,人工培养该种寄生虫50头,用该药物进行常规性杀灭试验,问希望一次杀灭48头的概率?此例中,p=0.9,n=50,m=48该例中,500.945,2500.90.14.52.12,二、泊松分布(poissondistribution)当二项分布中的n、而p0时,二项分布将成为另一种新的分布:泊松分布(普哇松分布)即试验(或称观察)次数很大、而某事件出现的概率很小,则离散型随机变量x服从于泊松分布若随机变量x的分布列为:012mp0p1p2pm,其中:(0,且np,m=0,1,2,)而泊松分布只有一个参数:,np既是泊松分布的平均值,又是其方差标准差为即,当随机变量x服从于参数为的泊松分布时记为泊松分布的图形决定于,1时,P(x=0)为最大,12时,P(x=1)为最大,27000.00710.639902451.0090.00,首先计算每一视野内的破伤风杆菌平均值,并将其暂作为值:将值代入中各式,得各个P(x),见上表的第四列,将各个P(x)与总频数相乘,即得理论频数,即上表的最后一列如依此类推每个视野中破伤风杆菌数大于7个的也应计算理论频数,即上表中的最后一行镜检视野内破伤风杆菌的分布图见下一页,频数破伤风杆菌数01234567,三、正态分布(normaldistribution)连续型随机变量是日常工作中最多见的一种变量,这一类变量为可加、或呈线性时,一般服从正态分布将这一类资料整理成直方图或折线图时,其图形总呈中间多、两边少的钟型(bell-shape)分布特征假设将样本容量n无限扩大,分组更细,即n组距0,则每一组的频数将趋向于一个定值,即一概率值,此时,呈现在我们面前的将是一条中间高、向两边均匀对称下降的光滑曲线;这一类资料的概率分布就称为正态分布,和正态分布相对应的曲线称为正态分布密度曲线用来描述这条曲线的函数称为正态分布密度函数正态分布是数理统计中最重要的一种理论分布呈正态分布的随机变量x其密度函数f(x)为:上式中,为随机变量x的平均值,2为方差,为标准差,任何一个正态分布均由参数和2所决定,一个随机变量x服从平均值为、方差2为的正态分布时,记为正态分布的特点是:1、正态分布曲线以直线x为对称,且在该处达到顶峰,x时为最大值2、曲线有两个拐点:在这两个拐点处,曲线改变方向3、正态分布曲线在x轴上的的位置由决定,而曲线高矮、胖瘦的形状由决定4、正态分布密度曲线向-、+无限延伸,正态分布密度曲线与x轴所包围的面积恒为1,即服从正态分布的随机变量x在(-,+)间内取值的概率为1而随机变量x在区间(a,b)内取值的概率也可以看成是一块面积,这块面积由x=a、x=b、y=0及曲线所围成的曲边梯形所组成即求随机变量x在某一区段内的概率就转化成了求由该区段与相应曲线所围成的曲边梯形面积的定积分:,而在讨论标准差的性质时,曾提到随机变量x的分布状况与标准差的关系,这里我们可以用面积来表示之:,而其两边的概率(即面积)则相应分别为(括弧内的为一边面积):0.3173(0.1584)0.0455(0.02258)0.0027(0.0014)0.05(0.025)0.01(0.005),标准正态分布不同的值和值,决定了不同的正态分布密度曲线,这在实际使用中很不方便因此可将不同正态分布中的随机变量x作一变换:令这一变换过程称为随机变量的标准化过程(这也是称为标准差的由来)x是随机变量,因此u也是随机变量,变换后的正态分布密度函数为称为标准正态分布密度函数,经过变换,0,21随机变量u服从标准正态分布,记为,且,任何一本统计学的书上都有标准正态分布表,表内的数字都是u左边的面积,也就是-到某一u值的概率,因此我们可以利用这一张表来计算任何区段的面积,即任何区段的概率值,标准正态分布的几个特殊取值:标准化随机变量的取值:,在大多数情况下,和往往是未知的,因此可以用大样本的平均值和标准差s来近似地代替和(大数定律),即标准化过程就成了数据标准化是一个非常重要的概念,在前面,我们几次碰到了0.95和0.99这两个概率其两尾概率为0.051-0.95,0.011-0.99:在标准正态分布中:这两个概率值称为两尾概率值,以后一直会用到(*),待续,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!