56 节 概率论与数理统计

上传人:沈*** 文档编号:253075148 上传时间:2024-11-28 格式:PPT 页数:38 大小:217.50KB
返回 下载 相关 举报
56 节 概率论与数理统计_第1页
第1页 / 共38页
56 节 概率论与数理统计_第2页
第2页 / 共38页
56 节 概率论与数理统计_第3页
第3页 / 共38页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,5.6,节 概率论与数理统计,一 各种统计分布函数,表,5-6-1,中列出了,20,种分布函数,统计工具箱提供了包括分布函数,cdf,(Cumulattive,Distribution Function),、概率密度函数,pdf,(Probability,Distribution Function),、分布函数的逆函数,inv,(Inverse,Cumulattive,Distribution Function),以及这些分布的理论统计特性(均值和方差)计算函数,stat,。,表,5-6-1 MATLAB,中表示各种概率分布的前缀文字,连续(数据),连续(统计量),离散(数据),贝塔分布,(beta),2,分布,(Chi2),二项式分布,(,bino,).,指数分布,(exp),非中心,2,分布,(ncx2),离散均匀分布,(,unid,),-,分布,(,gam,),F-,分布,(f).,几何分布,(geo).,对数正态分布,(,logn,),非中心,F-,分布,(,ncf,),超几何分布,(,hyge,),正态分布,(norm),T-,分布,(t).,负二项式分布,(,nbin,),瑞利分布,(,rayl,),非中心,T,分布,-(,nct,),泊松分布,(,poiss,),均匀分布,(,unif,),韦伯,.,分布,(,weib,),表,5-6-1,的使用方法,把表中不同分布后面括号中的文字作为前缀,把所需计算的特性作为后缀,就可以组合成一个函数。例如,离散类,的二项式分布有,binopdf,binocdf,binoinv,binostat,四个函数,,连续类,数据的标准正态分布有,normpdf,normcdf,norminv,normstat,四个函数,,连续类统计量,的,2,分布有,chi2pdf,chi2cdf,chi2inv,chi2stat,四个函数,,等等,,20,种分布就有,80,个函数。由于各种分布函数的解析形式都是已知的,这些子程序的编写并不困难。,【,例,5-6-1】,概率分布曲线的绘制,【,例,5-6-1】(a),求标准正态分布,N(0,1),,自由度,V=10,的,2,分布和,N=10,p=0.2,的二项式分布,B(10,0.2),的分布函数,并画出其概率密度曲线和分布曲线;,(b),。求出分布函数为,0.05,和,0.95,处的随机变量值;,(c),。求出这几个分布的均值和方差。,解:分别键入,help,normpdf,help,binopdf,help chi2pdf,以了解它们的用法,特别是了解输入变元的意义,得知:,f=,normpdf(x,mu,sigma,),其中,x,为随机变量数组,,mu,为均值,,sigma,为标准差。,f=chi2pdf(x,V),其中,x,为随机变量数组,,V,为自由度数(整数),,f=,binopdf(x,N,p,),其中,x,为随机变量整数数组,,N,为次数,,0p1,为成功概率,概率分布参数的选择,题目中给出的变元参数应足以用来调用这些概率密度函数,只有随机变量,x,的取值及范围,需要事先对该分布的特性有所了解。首先要弄清它是离散量还是连续量,其次要取适当的范围。范围取小了不能显示分布的全局,取大了又可能显示不出细节。正确的取法应该使该范围内分布函数,F(x,),的左边界值略小于,0.025,,右边界值略大于,0.975,,这就可以基本涵盖随机变量以概率,95%,存在的主要区域,又不致涉及关系不大的区域。初学者往往要作几次试探才能做到。好在在计算机上改几个参数、作几次试探是很简便的事。,绘制概率分布函数的程序,exn561,x1=-3:0.1:3;%,标准正态随机变量取值范围,f1=normpdf(x1,0,1);%,标准正态分布的概率密度函数,F1=normcdf(x1,0,1);%,标准正态分布的分布函数,subplot(2,2,1),plot(x1,f1,:,x1,F1,-),grid on%,绘曲线,line(-4,4,0.025,0.025),line(-4,4,0.975,0.975)%,画横线,x2=0:0.1:20;%,试探得出的范围,f2=chi2pdf(x2,10);%2,分布的概率密度函数,F2=chi2cdf(x2,10);%2,分布的分布函数,subplot(2,2,2),plot(x2,f2,:,x2,F2,-),grid on%,绘曲线,line(0,20,0.025,0.025),line(0,20,0.975,0.975)%,画横线,);,.,运行程序得出图,5-40,,其中实线是分布函数的曲线,虚线则是密度函数的曲线。上下两根横线分别为,0.975,和,0.025,,,三种分布的概率密度和分布曲线,对分布函数图形的改进,第三个子图中,随机变量是离散取值的,在两个相邻的取值点之间的概率不会变化,所以它的分布函数表现为阶梯形。密度函数是分布函数的导数,所以在阶梯突变处导数为无穷大,宽度又为无穷小,面积等于阶梯的高度,通常用一个脉冲表示。脉冲的高度表示它所包含的面积,也就等于阶梯波形的高度。而,plot,函数画图是把各离散点之间用直线联接,所得的曲线是不对的。应该要用,stairs,命令画阶梯图,用,stem,命令画脉冲图。改正后的程序如下:,subplot(2,2,4),stairs(x3,F3,-),stem(x3,f3,:),图中第四子图给出了改正后的结果,可见其概率密度函数是离散的脉冲。从中还可以判断,,x3,的取值范围不必为,0:10,,取,0:5,就够了。另外,第二子图上的密度函数波形太小,如果对,f,和,F,取不同的纵坐标,那样可以得出更好的图形。,分布函数逆函数的用途,(b),给定分布函数,F=,(,1,)求出的,x,,简称,下分位点,习惯上用,表示。这和已知,x,求,cdf,恰好是逆函数的关系,即输入变元与输出变元恰好调换了位置,对正态分布情况,逆函数,norminv,的调用格式为,X=NORMINV(F,MU,SIGMA),其中,F,为给定的分布函数值,而,X,为对应的随机变量边界值。,题目中给定了的两个边界值,Fb,=0.05,0.95,,即,求对应的随机变量,x,的边界值,xb,。,随机变量在上下两个边界值,xb,(,即,/2,,,1-/2,),之间取值的置信度等于,1-,,其他参数与,normpdf,和,normcdf,中的相同。对于其他分布,可依此类推,不再赘述。,用逆函数求上下分位点,将边界值,Fb,作为输入变元,可求得相应的分位点。:,alpha=0.1;%,取双边,90%,的置信区间,Fb,=alpha/2,1-alpha/2%,输入变元,%,三种分布的双侧,分位点,lambda1=norminv(Fb,0,1),lambda2=chi2inv(Fb,10),lambda3=binoinv(Fb,10,0.2),程序运行后得到,lambda1=-1.6449 1.6449,lambda2=3.9403 18.3070,lambda3=,0 4,这就是三种分布函数下的双边,90%,置信区间,改变,alpha,的值,可得到各种不同置信度下的置信区间。,各种分布理论统计特性的计算,(c),。对以上,3,种分布,,MATLAB,还给出了它们的理论统计参数,即理论均值,Mu,和方差值,var,的计算方法,所用的命令为,stat,。例如,:,Mu1,var1=normstat(0,1),Mu2,var2=chi2stat(10),Mu3,var3=binostat(10,.2),运行结果为:,Mu1=0,,,var1=1,Mu2=10,,,var2=20,Mu3=2,,,var3=1.6000,本题虽然只给出了,3,种分布的计算,这些概念和方法可以类推到表,5-6-1,中,20,种分布的理论计算中。,概率分布演示工具,disttool,键入,disttool,就会出现一个图形界面,(,右图,),,其中有分布曲线,周围有各种参数和类型的选择窗。可以很方便地用鼠标操作改变参数和选择类型,得到相应的曲线。,二 随机样本数据的生成,stats,工具箱同时也提供了这,20,种分布的随机数生成程序,rnd,。均匀分布随机数的计算机生成本身就是一个研究了几十年的专题,其他分布的随机数通常又由均匀分布随机数进行变换而得。本书将不讨论它们的编程,只着重于它们的应用。下面的例子将说明这类函数的调用方法。,【,例,5-6-2】,按,例,5-6-1,的三种分布,分别生成,10000,个随机数,画出它们的直方图(分布图),并计算各自的数学期望和方差。,随机数生成及其直方图绘制,各种分布的随机数生成函数名为,rnd,。其中表示分布类型的前缀,由表,5-6-1,给出。绘制统计数据,Y,直方图的命令为,hist(Y,N,),,其中,N,为直方图的分区数目,其缺省值为,10,。例如:,Y1=normrnd(0,1,1,10000);,subplot(2,2,1),hist(Y1,50),Y2=chi2rnd(10,1,10000);,subplot(2,2,2),hist(Y2,50),Y3=binornd(10,0.2,1,10000);,subplot(2,2,3),hist(Y3,50),subplot(2,2,4),hist(Y3,8),得出的图,5-42,。,三种分布的随机数统计分布图,实际统计参数的计算,其中第三个分图的直方图各条宽度不均匀,这是由于二项式分布是离散数据,它的取值最大只可能到,10,。在目前实际数据中,最大只到,8,。因此,可改用以下的命令:,subplot(2,2,4),hist(Y3,8),得到符合一般直方图要求的第四个分图。把这些图与图,5-40,中的密度分布曲线相比,可见是非常相似的。,实际随机变量的样本均值,Xbar,样本的标准差,sigma,和样本方差,s2(,标准差的平方,),可用以下命令计算,Xbar1=mean(Y1),sigma1=std(Y1),s21=var(Y1),得出,Xbar1=0.0246,sigma1=1.0059,s21=1.0119,Xbar2=mean(Y2),sigma2=std(Y2),s22=var(Y2),得出,Xbar2=9.9947,sigma2=4.4453,s22=19.7605,Xbar3=mean(Y3),sigma3=std(Y3),s23=var(Y3),得出,Xbar3=1.9745,sigma3=1.2520,s23=1.5676,演示工具,randtool,生成的图形界面,键入,randtool,也会出现一个图形界面,如右图。其中有实际生成的随机数样本分布的曲线,周围有各种参数和类型的选择窗。可以方便地用鼠标和键盘改变参数,得到相应的曲线。,三 用样本推断总体的统计量,由实际样本值算出的统计量与例,5-6-1,中的理论值之间存在误差,而且样本统计量也是随机量。计算机每运行一次,所得到一组观察值,Yi,的统计量也会不同。它们也有各自的分布规律,比如对于,2,相同的正态分布总体,各样本组的标准化均值按,Z-,分布,各样本组的标准化方差按,2,分布。,当样本数取得很大时,根据中心极限定理,分布的误差就很小。这样得出的是总体统计量的一个(有误差的)估值,称为点估计法。如果样本数小,点估计法误差就会很大,甚至对人们造成误导。这时较好的方法是给出总体统计量一个取值区间(置信区间),并给出它在此区间取值的概率(置信度)。,在实际工程中,做试验往往是很费时费钱的。通常希望用最小的试验样本集来推断总体的统计量所取的数值范围,并且希望有相当的精度和可信度。,正态分布样本与总体统计量的关系,(a),。已知总体方差,2,,但均值,未知。要由样本均值 和方差,S,2,推断总体均值,。这时,样本均值标准化后的,Z,值满足正态分布:,(,5.6.1,),(b
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!