matlab数据的统计分析

上传人:xu****iu 文档编号:245170286 上传时间:2024-10-07 格式:PPT 页数:35 大小:325.99KB
返回 下载 相关 举报
matlab数据的统计分析_第1页
第1页 / 共35页
matlab数据的统计分析_第2页
第2页 / 共35页
matlab数据的统计分析_第3页
第3页 / 共35页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,*,现实生活中的许多数据都是随机产生的,如考试分数、月降雨量、灯泡寿命等。,从数理统计角度来看,这些数据其实都是符合某种分布的,这种规律就是统计规律。,本实验主要通过对概率密度函数曲线的直观认识和数据分布的形态猜测,以及密度函数的参数估计,进行简单的正态假设检验,揭示日常生活中随机数据的一些统计规律。,问题背景和实验目的,Matlab,相关命令介绍,pdf,概率密度函数,y,=,pdf,(name,x,A),y,=,pdf,(name,x,A,B),或,y,=,pdf,(name,x,A,B,C),返回由,name,指定的单参数分布的概率密度,,x,为样本数据,name,用来指定分布类型,其取值可以是:,beta,、,bino,、,chi2,、,exp,、,ev,、,f,、,gam,、,gev,、,gp,、,geo,、,hyge,、,logn,、,nbin,、,ncf,、,nct,、,ncx2,、,norm,、,poiss,、,rayl,、,t,、,unif,、,unid,、,wbl,。,返回由,name,指定的双参数或三参数分布的概率密度,Matlab,相关命令介绍,例:,x=-8:0.1:8;,y,=,pdf,(norm,x,0,1);,y1,=,pdf,(norm,x,1,2);,plot(x,y,x,y1,:),注:,y,=,pdf,(norm,x,0,1),y,=,normpdf,(x,0,1),相类似地,,y,=,pdf,(beta,x,A,B),y,=,betapdf,(x,A,B),y,=,pdf,(bino,x,N,p),y,=,binopdf,(x,N,p),Matlab,相关命令介绍,normfit,正态分布中的参数估计,muhat,sigmahat,muci,sigmaci=normfit(x,alpha),对样本数据,x,进行参数估计,并计算置信度为,1-alpha,的置信区间,alpha,可以省略,缺省值为,0.05,,即置信度为,95%,load,从,matlab,数据文件中载入数据,S,=,load(,数据文件名,),hist,绘制给定数据的直方图,hist(x,m),Matlab,相关命令介绍,table,=,tabulate,(x),绘制频数表,返回值,table,中,第一列为,x,的值,第二列为该值出现的次数,最后一列包含每个值的百分比。,ttest,(x,m,alpha,),假设检验函数。此函数对样本数据,x,进行显著性水平为,alpha,的,t,假设检验,以检验正态分布样本,x,(标准差未知)的均值是否为,m,。,Matlab,相关命令介绍,normplot,(x,),统计绘图函数,进行正态分布检验。研究表明:,如果数据是来自一个正态分布,则该线为一直线形态;如果它是来自其他分布,则为曲线形态。,wblplot,(x,),统计绘图函数,进行,Weibull,分布检验。,Matlab,相关命令介绍,其它函数,cdf,系列函数:累积分布函数,inv,系列函数:逆累积分布函数,rnd,系列函数:随机数发生函数,stat,系列函数:均值与方差函数,例:,p=,normcdf,(-2:2,0,1),x=,norminv,(0.025 0.975,0,1),n=,normrnd,(0,1,1 5),n=1:5;,m,v=,normstat,(n*n,n*n),常见的概率分布,二项式分布,Binomial,bino,卡方分布,Chisquare,chi2,指数分布,Exponential,exp,F,分布,F,f,几何分布,Geometric,geo,正态分布,Normal,norm,泊松分布,Poisson,poiss,T,分布,T,t,均匀分布,Uniform,unif,离散均匀分布,Discrete Uniform,unid,连续分布:正态分布,正态分布,(连续分布),如果随机变量,X,的密度函数为:,则称,X,服从正态分布。记做:,标准正态分布:,N,(0,1),正态分布也称高斯分布,是概率论中最重要的一个分布。,如果,一个变量,是,大量微小、独立的随机因素,的,叠加,那么,它,一定,满足,正态,分布。,如测量误差、产品质量、月降雨量等,正态分布举例,x=-8:0.1:8;,y,=,normpdf,(x,0,1);,y1,=,normpdf,(x,1,2);,plot(x,y,x,y1,:),例:,标准正态分布和非标准正态分布密度函数图形,连续分布:均匀分布,均匀分布,(连续分布),如果随机变量,X,的密度函数为:,则称,X,服从均匀分布。记做:,均匀分布在实际中经常使用,譬如一个半径为,r,的汽车轮胎,因为轮胎上的任一点接触地面的可能性是相同的,所以轮胎圆周接触地面的位置,X,是服从,0,2,r,上的均匀分布,。,均匀分布举例,x=-10:0.01:10;,r=1;,y=,unifpdf,(x,0,2*pi*r);,plot(x,y);,连续分布:指数分布,指数分布,(连续分布),如果随机变量,X,的密度函数为:,则称,X,服从参数为,的指数分布。记做:,在实际应用问题中,等待某特定事物发生所需要的时间往往服从指数分布,。,如某些元件的寿命;随机服务系统中的服务时间;动物的寿命等都常,常,假定服从指数分布,。,指数分布具有无记忆性:,指数分布举例,x=0:0.1:30;,y=,exppdf,(x,4);,plot(x,y),例:,=4,时的指数分布密度函数图,离散分布:几何分布,几何分布,是一种常见的,离散分布,在贝努里实验中,每次试验成功的概率为,p,,设试验进行到第,次才出现成功,则,的分布满足:,其右端项,是几何级数,的一般项,于是人们称它为几何分布,。,x=0:30;y=,geopdf,(x,0.5);plot(x,y),例:,p,=0.5,时的几何分布密度函数图,离散分布:二项式分布,二项式分布,属于离散分布,如果随机变量,X,的分布列为:,则称这种分布为二项式分布。记做:,x=0:50;,y=binopdf(x,500,0.05);,plot(x,y),例:,n=500,,,p=0.05,时的二项式分布密度函数图,离散分布:,Poisson,分布,泊松分布,也属于离散分布,是,1837,年由发个数学家,Poisson,首次提出,其概率分布列为:,记做:,泊松分布是一种常用的离散分布,它与单位时间(或单位面积、单位产品等)上的计数过程相联系,。,如:单位时间内,电话总机接到用户呼唤次数;1,平方米内,玻璃上的气泡数等,。,Poisson,分布举例,x=0:50;,y=poisspdf(x,25);,plot(x,y),例:,=25,时的泊松分布密度函数图,离散分布:均匀分布,如果随机变量,X,的分布列为:,则称这种分布为,离散均匀分布,。记做:,n=20;,x=1:n;,y=unidpdf(x,n);,plot(x,y,o-),例:,n=20,时的离散均匀分布密度函数图,抽样分布:,2,分布,设随机变量,X,1,X,2,X,n,相互独立,且同服从正态分布,N,(0,1),,则称随机变量,n,2,=,X,1,2,+,X,2,2,+,X,n,2,服从自由度为,n,的,2,分布,记作 ,亦称随机变量,n,2,为,2,变量。,x=0:0.1:20;,y=chi2pdf(x,4);,plot(x,y),例:,n=4,和,n=10,时的,2,分布密度函数图,x=0:0.1:20;,y=chi2pdf(x,10);,plot(x,y),抽样分布:,F,分布,设随机变量,,且,X,与,Y,相互独立,则称随机变量,x=0.01:0.1:8.01;,y=fpdf(x,4,10);,plot(x,y),例:,F,(4,10),的分布密度函数图,为服从自由度,(,m,n,),的,F,分布。记做:,抽样分布:,t,分布,设随机变量,,且,X,与,Y,相互独立,则称随机变量,x=-6:0.01:6;,y=tpdf(x,4);,plot(x,y),例:,t,(4),的分布密度函数图,为服从自由度,n,的,t,分布。记做:,频数直方图或频数表,对于给定的数据集,假设它们满足以上十种分布之一,如何确定属于哪种分布?,x=load(data1.txt);x=x(:);,hist(x),例,1,:,某次,笔试的分数见,data1.txt,,试画出频数直方图,绘制,频数,直方图,或列出频数表,从图形上看,笔试成绩较为接近正态分布,频数直方图或频数表,x=load(data2.txt);x=x(:);,hist(x),例,2,:,某次,上机考试的分数见,data2.txt,,试画出频数直方图,从图形上看,上机考试成绩较为接近离散均匀分布,x=load(data3.txt);x=x(:);,hist(x),例,3,:,上海1998年来的月降雨量的数据,见,data3.txt,,试画出频数直方图,从图形上看,月降雨量较为接近,2,分布,频数直方图或频数表,在重复数据较多的情况下,我们也可以利用,Matlab,自带的,tabulate,函数生成频数表,并以频数表的形式来发掘数据分布的规律。,x=load(data4.txt);x=x(:);,tabulate(x),hist(x),例,4,:,给出数据,data4.txt,,试画出其直方图,并生成频数表,频数直方图或频数表,x=load(data5.txt);,x=x(:);,hist(x),fiugre,histfit(x),%,加入较接近的正态分布密度曲线,例,5,:,现累积有100次刀具故障记录,当故障出现时该批刀具完成的零件数,见,data5.txt,,试画出其直方图。,从图形上看,较为接近正态分布,参数估计,当我们可以基本确定数据集,X,符合某种分布后,我们还需要确定这个分布的参数。,由于正态分布情况发生的比较多,故我们主要考虑正态分布的情形。,对于未知参数的估计,可分两种情况:,点估计,区间估计,参数估计:点估计,构造样本,X,与某个统计量有关的一个函数,作为该统计量的一个估计,称为,点估计,。,Matlab,统计工具箱中,一般采用最大似然估计法给出参数的点估计。,泊松分布,P,(,),的,最大似然估计是,指数分布,Exp,(,),的,最大似然估计是,点估计举例,正态分布,N,(,2,),中,,最大似然估计是 ,,2,的最大似然估计是,x=load(data1.txt);,x=x(:);,mu,sigma=normfit(x),例,6,:,已知例,1,中的数据服从正态分布,N,(,2,),,试求其参数,和,的值。,使用,normfit,函数,参数估计:区间估计,构造样本,X,与某个统计量有关的两个函数,作为该统计量的下限估计与上限估计,下限与上限构成一个区间,这个区间作为该统计量的估计,称为,区间估计,。,Matlab,统计工具箱中,一般也采用最大似然估计法给出参数的区间估计。,区间估计举例,x=load(data1.txt);x=x(:);,mu,sigma,muci,sigmaci=normfit(x),例,7,:,已知例,1,中的数据服从正态分布,N,(,2,),,试求出,和,2,的置信度为,95%,的区间估计。,x=load(data6.txt);x=x(:);,mu,sigma,muci,sigmaci=normfit(x,0.01),例,8,:,从自动机床加工的同类零件中抽取,16,件,测得长度值见,data6.txt,,已知零件长度服从正态分布,N,(,2,),,试求零件长度均值,和标准差,的置信度为,99%,的置信区间。,假设检验,对总体的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设,这就是,假设检验,问题。,以正态假设检验为例,来说明假设检验的基本过程,。,正态假设检验,正态假设检验的一般过程:,假设
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!