概率论与数理统计第二讲随机数的产生数据的统计描述

上传人:tian****1990 文档编号:253068743 上传时间:2024-11-28 格式:PPT 页数:48 大小:393KB
返回 下载 相关 举报
概率论与数理统计第二讲随机数的产生数据的统计描述_第1页
第1页 / 共48页
概率论与数理统计第二讲随机数的产生数据的统计描述_第2页
第2页 / 共48页
概率论与数理统计第二讲随机数的产生数据的统计描述_第3页
第3页 / 共48页
点击查看更多>>
资源描述
,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,概率论与数理统计实验,实验2,随机数的产生,数据的统计描述,实验目的,实验内容,学习随机数的产生方法,直观了解统计描述的基本内容。,2、统计的基本概念。,4、计算实例。,3、计算统计描述的命令。,1、随机数的产生,在Matlab软件中,可以直接产生满足各种常用分布的随机数,命令如下:,一、随机数的产生,1,0,常用分布随机数的产生,定义:设随机变量,XF(x),则称随机变量,X,的抽样序列,X,i,为分布,F(x),的随机数,函数名,对应分布的随机数,binornd,二项分布的随机数,chi2rnd,卡方分布的随机数,exprnd,指数分布的随机数,frnd,f分布的随机数,gamrnd,伽玛分布的随机数,geornd,几何分布的随机数,hygernd,超几何分布的随机数,normrnd,正态分布的随机数,poissrnd,泊松分布的随机数,trnd,学生氏t分布的随机数,unidrnd,离散均匀分布的随机数,unifrnd,连续均匀分布的随机数,调用格式:,1、y=random(name,A1,A2,A3,m,n),其中:name为相应分布的名称,A1,A2,A3为分布,参数,m为产生随机数的行数,n为列数。,2、直接调用。,如:y=,binornd(n,p,1,10),产生参数位n,p的1行10,列的二项分布随机数,当只知道一个随机变量取值在,(,a,,,b,),内,但不知道(也没理由假设)它在何处取值的概率大,在何处取值的概率小,就只好用,U,(,a,b,),来模拟它。,1、均匀分布,U(a,b),1)unifrnd(a,b)产生一个a,b 均匀分布的随机数,2)unifrnd(a,b,m,n)产生m行n列的均匀分布随机数矩阵,例1、产生U(2,8)上的一个随机数,10个随机数,,2行5列的随机数。,命令:,(,1)y1=unifrnd(2,8),(2)y2=unifrnd(2,8,1,10),(3)y3=unifrnd(2,8,2,5),y1=7.7008,y2=3.3868 5.6411 4.9159 7.3478 6.5726,4.7388 2.1110 6.9284 4.6682 5.6926,y3=6.7516 6.4292 4.4342 7.5014 7.3619;,7.5309 3.0576 7.6128 4.4616 2.3473,2、正态分布随机数,例2、产生N(10,4)上的一个随机数,10个随机数,,2行5列的随机数.,命令,(,1)y1=normrnd(10,2),(2)y2=normrnd(10,2,1,10),(3)y3=normrnd(10,2,2,5),1),R=normrnd(,),:,产生一个正态分布随机数,2)R=normrnd(,m,n),产生,m,行,n,列的正态分布随机数,当研究对象视为大量相互独立的随机变量之和,且其中每一种变量对总和的影响都很小时,可以认为该对象服从正态分布。,机械加工得到的零件尺寸的偏差、射击命中点与目标的偏差、各种测量误差、人的身高、体重等,都可近似看成服从正态分布。,3、指数分布随机数,例3、产生E(0.1)上的一个随机数,20个随机数,,2行6列的随机数。,命令,(,1)y1=exprnd(0.1),(2)y2=exprnd(0.1,1,20),(3)y3=exprnd(0.1,2,6),1)R=exprnd(,),:产生一个指数分布随机数,2)R=exprnd(,m,n),产生,m,行,n,列的指数分布随机数,结果,(,1)y1=0.0051,(2)y2=0.1465 0.0499 0.0722 0.0115 0.0272,0.0784 0.3990 0.0197 0.0810 0.0485 0.0233,(3),y3=0.1042 0.4619 0.1596 0.0505 0.1615 0.0292;,0.0207 0.1974 0.1616 0.1301 0.4182 0.0809,排队服务系统中顾客到达率为常数时的到达间隔、故障率为常数时零件的寿命都服从指数分布。,指数分布在排队论、可靠性分析中有广泛应用。,例 顾客到达某商店的间隔时间服从参数为,0.1,的指数分布,指数分布的均值为,1/0.1=10。,指两个顾客到达商店的平均间隔时间是,10,个单位时间.即平均,10,个单位时间到达1个顾客.顾客到达的间隔时间可用,exprnd(10),模拟。,4、二项分布随机数,例4、产生B(10,0.8)上的一个随机数,15个随机数,,3行6列的随机数。,命令,(,1)y1=binornd(10,0.8),(2)y2=binornd(10,0.8,1,15),(3)y3=binornd(10,0.8,3,6),R=binornd(n,p),:产生一个二项分布随机数,2)R=binornd(n,p,m,n),产生,m,行,n,列的二项分布随机数,2,0,、其他分布随机数的产生方法,定理,设,X,的分布函数为,F(x),,连续且严格单调上升,,它的反函数存在,且记为,F,-1,(x),,则,F(X)U(0,1),若随机变量UU(0,1),则,F,-1,(U)的分布函数为,F(x),。,此定理给出的构造分布函数为,F,(,x,)的随机数的产生方法为:,取U(0,1)随机数U,i,(i=1,2),令X,i,=F,-1,(U,i,),则X,i,(i=1,2),就是F(x)随机数,如果U,i,独立,则X,i,也互相独立。,(一)直接抽样法(反函数法),(1)连续分布的直接抽样法,设连续型随机变量,X,的分布函数为,F(x),,则产生随机数的方法为:,取U(0,1)随机数U,i,(i=1,2),令X,i,=F(U,i,),则X,i,(i=1,2),就是F(x)随机数,如果U,i,独立,则X,i,也互相独立。,设分布律为,P,(,X,=,x,i,)=,p,i,i,=1,2,.,其分布函数为,F(x),(2)离散分布的直接抽样法,产生均匀随机数,R,,即,R,U,(0,1),则,XF(x),(二)变换抽样法,(三)值序抽样法,(四)舍选抽样法,(五)复合抽样法(合成法),(六)近似抽样法,详见:高惠璇 北京大学出版社统计计算,例5、,设,X,分布,函数为,解:,Y,的分布函数为,其反函数为,生成,n=20,的,1,行10列随机数,命令:,U=unifrnd(0,1,1,10);,Y=1-(1-U).(1/20);,设,则,例,6,生成单位圆上均匀分布的,1,行,10000,列随机数,并画经验分布函数曲线。,Randnum=unifrnd(0,2*pi,1,10000);,%(0,2pi)上均匀分布随机数,xRandnum=cos(Randnum);%横坐标,yRandnum=sin(Randnum);%丛坐标,plot(xRandnum,yRandnum);,例,6,频率的稳定性,1、,事件的频率,在一组不变的条件下,重复作,n,次试验,,,记,m,是,n,次试验中事件,A,发生的次数。,频率,f=m/n,2.,频率的稳定性,在重复试验中,事件,A,的频率总在一个定值附近摆动,,而且,随着重复试验次数的增加,频率的摆动幅度,越来越小,呈现出一定的稳定性.,掷一枚硬币,记录掷硬币试验中频率,P*,的波动情况。,(1)模拟产生,n,个,0,-,1,分布随机数,randnum,(,n,),(2)对模拟产生的随机数,,xrandnum,(,i,)表示,第,i,次试验的结果,,1,表示正面向上,0表示反,面向上。,(3)统计前,i,次试验中正面向上的次数,,并计算频率,(4)作图(关于频率和试验次数的图像),p,为,正面向上的概率,,n,为试验次数,在,Matlab,中编辑,.m,文件输入以下命令:,function binomoni(p,n),pro=zeros(1,n);%频率向量,randnum=binornd(1,p,1,n);%产生二项分布随机数,a=0;,for i=1:n,a=a+randnum(1,i);%频数,pro(i)=a/i;%频率,end,pro=pro;,num=1:n;,plot(num,pro,num,p),在,Matlab,命令行中输入以下命令:,binomoni(0.5,1000),在,Matlab,命令行中输入以下命令:,binomoni(0.5,10000),在,Matlab,命令行中输入以下命令:,binomoni(0.3,1000),1、表示位置的统计量平均值和中位数,平均值(或均值,数学期望):,中位数:将数据由小到大排序后位于中间位置,的那个数值.,二、常用统计量,平均值:,mean(,x,),中位数:median(x),若x为矢量,返回平均值和中位数,若x为矩阵,结果为行向量,每个元素对应x中列元素的平均值和中位数,2、表示变异(离散)程度的统计量,方差、标准差、极差,样本方差:,它是各个数据与均值偏离程度的度量,标准差:是方差的开方,极差:样本中最大值与最小值之差.,标准差:std(,x,),方差:var(,x,),极差:range(,x,),例7:产生5组正态分布随机数,每组100个,计算均值、中位数、标准差、极差、方差。,x=normrnd(0,1,100,5);,mean1=mean(x),median1=median(x),std1=std(x),var1=var(x),rang1=range(x),3.,表示分布形状的量偏度和峰度,分布偏度:,其估计量为:,其中,命令:y=skewness(x),若x为矢量,返回样本偏度,若x为矩阵,结果为行向量,每个元素对应x中列元素的样本偏度。,正态分布偏度为0,偏度反映分布的对称性,g,1,0称为右偏态,此时数据位于均值右边的比位于左边的多;g,1,0称为左偏态,情况相反;而g,1,接近0则可认为分布是对称的.,分布峰度,其估计量为:,其中,命令:y=kurtosis(x),若x为矢量,返回x的样本峰度,若x为矩阵,结果为行向量,每个元素对应x中列元素的样本峰度。,峰度是分布形状的另一种度量,正态分布的峰度为3,若g,2,比3大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数据,因而峰度可用作衡量偏离正态分布的尺度之一,例8:产生5组正态分布随机数,每组100个,计算样本偏度和峰度。,x=normrnd(0,1,100,5);,skewness1=skewness(x),kurtosis1=kurtosis(x),例9:产生5组指数分布随机数,每组100个,计算样本偏度和峰度。,x=exprnd(10,100,5,);,skewness1=skewness(x),kurtosis1=kurtosis(x),三、分布函数的近似求法(直方图),1、经验分布函数(累计频率直方图),Empirical Cumulative Distribution Function,定义:,设,x,1,,,x,2,,,x,n,是总体的容量为,n,的样,本值,将其按由小到大的顺序排列,并,重新编号,记为,则经验分布函数为:,总体分布函数的近似,2、频率直方图近似概率密度函数,下面介绍频率直方图和经验分布函数的做法,1、整理资料:把样本值,x,1,,,x,2,,,x,n,进行分组,先将它们依大小次序排列,得,在包含,的区间,a,,,b,内插入,m,-1个等分点:,注意要使每一个区间,(,i=1,,2,,m,),内都有样本观测值,x,i,(,i,=1,2,,n,-1)落入其中.,记,t,0,=,a,t,m,=,b,。第,i,个小区间为,2、求出各组的频数和频率:,统计出样本观测值在每个区间,中出现的次数,它就是这区间或这组的频数,,计算频率,累计频数为,累计频率为,3、作图:,记:,其中,d,为区间长度,,以小区间,为底,,以,为高作长方形(,i=1,2,m,),这样画出一排竖着的长方形极为频
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!