资源描述
概率与统计基本运算,(,Matlab,),、问题,期望与方差问题。,某公司年损失金额的概率分布列为:,试用,Matlab,计算该公司的期望值和标准差。,二、实验目的,了解使用,Matlab,软件在概率、随机变量分布、,数字特征、参数估计、假设检验、线性回归等,方面的功能与应用。,三、预备知识,1,、概率统计中的古典概率、随机变量及其分布、数学期望与方差、参数估计、假设检验、,线性回归等方面的知识。,2,、本实验中所用,Matlab,命令提示:,p=zuhe(n1,k1)*zuhe(n2,k2)/zuhe(n,k),%,random,函数,%,随机数的产生,分布名称 函数名称 函数调用格式,离散均匀分布,unidrnd R=unidrnd(N,m,n),二项分布,binornd R=binornd(N,P,m,n),泊松分布,poissrnd R=poissrnd(LAMBDA,m,n),连续均匀分布,unifrnd R=unifrnd(N,m,n),指数分布,exprnd R=exprnd(MU,m,n),正态分布,normrnd R=normrnd(MU,SIGMA,m,n),对数正态分布,lognrnd R=lognrnd(MU,SIGMA,m,n),几个常用离散、连续型分布密度函数(,pdf,),累积分布函数(,pdf,),分布名称 函数名称 函数调用格式,离散均匀分布,unidcdf Y=unidcdf(X,N),二项分布,binocdf Y=binocdf(X,N,P),泊松分布,poisscdf Y=poisscdf(X,LAMBDA),连续均匀分布,unifcdf Y=unifcdf(X,A,B),指数分布,expcdf Y=expcdf(X,MU),正态分布,normcdf Y=normcdf(X,MU,SIGMA),EX=,symsum(xi,*pi,0,inf)%,数学期望,EX=X*P,/,X=x1 x2,xn;P,=p1,pn,%,数学期望,DX=X.2*P-EX2%,方差,常见分布的期望与方差函数,分布类型名称,函数名称,函数调用格式,离散均匀分布,unidstat,E,,,D=unidstat(N,),二项分布,binosnt,E,,,D=binostat(N,,,P),泊松分布,E,,,D=poissstat,(,LAMBDA,),polssstat,连续均匀分布,unifstat,E,,,D=unifstat(N),指数分布,expstat,E,,,D=expstat(MU),正态分布,normstat,E,,,D=normstat(MU,SIGMA),对数正态分布,lognstat,E,,,D=lognstat(MU,SIGMA),M=mcan(X)%,样本均值,M=var(X)%,样本方差,M=std(X)%,标准差,C=cov(X)%,协方差矩阵,C=cov(X,Y)%,协方差矩阵,R=corrcoef(X)%,相关系数,注:矩阵,R,的元素,R(i,j),与协方差矩阵,C=cov(X),关系,点估计与区间估计,分布类型名称,函数名,函数调用格式,二项分布,binofit,phat,,,pci=binofit,(,x,,,n,alpha,),泊松分布,poissfit,phat,,,pci=poissfit,(,x,,,alpha,),均匀分布,unifit,phat,,,pci=unifitx,(,x,,,alpha,),指数分布,expfit,phat,,,pci=expfit,(,x,,,alpha,),正态分布,normfit,muhat,,,sigmahat,,,muci,,,sigmaci,=normfit(x,alpha),最大似然估计,mle,phat,,,pci=mle(dist,,,data,,,alpha,,,pl),注:,phat,为返回点估计值;,pci,为返回置信区间;,alpha,为置信度;,data,为数据,假设检验函数,ztest(,方差已知,),调用格式:,H=ztest(X,mu,sigma),H,ztest(X,mu,sigma,alpha),H,sig,ci=ztest(X,m,sigma,alpha,tail),说明:,H=ztest(X,mu,sigma),是在默认的,0.05,显著性水平下检,验正态分布总体的样本,X,是否具有,=0,,若,H,0,则接,受零假设,H0,;若,H,1,则拒绝,H0,。,H,ztest(X,mu,sigma,alpha),是在给定的显著性水平,alpha,的值下做假设检验。,H,sig,ci=ztest(X,m,sigma,alpha,tail),提供了由,tail,标记的不同对立假设情形的,Z,检验:,ta11=0,(缺省),0,;,tail=l ,0,;,tail=-1 ,0,。,sig,是与统计量有关,是在假设下统计量的观测值较大,的概率。,ci,为均值的,1-,的置信区间。,假设检验函数,ttest(,方差未知,),调用格式,:H=ttest(X,mu),H=ttcst(X,mu,alpha),H=ttcst(X,mu,alpha,tail),说明,:,与,ztest,相同。,多元线性回归函数,regress(),调用格式,:b=regress(y,X),b,bint,r,rint,stats=regress(y,X),b,bint,r,rint,stats=regress(y,X,alpha,),说明,:,(1)b,regress,(,y,X,)返回基于观测,y,和回归矩阵,X,的最小,二乘拟合系数的结果;,(2)b,bint,r,rint,stats,regress,(,y,X,)则给出系数,的估计值,b,;系数估计值的置信度为,95%,的置信区间,bint,;残差,r,;各残差的置信区间,rint,;向量,stats,给,出回归的,R2,统计量和,F,以及,P,值;,(3)b,bint,r,rint,stats=regress(y,X,alpha),给出置,信度为,1-alpha,其他同上。,四、实验内容与要求,1,、某公司年损失金额的概率分布列为:,试计算该公司的期望值和标准差。,2,、已知某保险公司发现索赔要求中有,25%,是因被盗而提,出的。某年该公司收到,10,个索赔要求,试求其中包含,不多于,4,个被盗索赔的概率。,3,、假设一年中,某类保险者里面每个人死亡概率为,0.05,,现有,1000,人参加这类保险,试求在未来一年里,,被保险者中有,10,人死亡的概率,并画泊松分布图。,4,、下表给出了,4000,份保单的赔款情况:,赔款次数 被观察的保单数,0 3288,1 642,2 66,3 4,其中每一保单承担风险期为一年,假定每一保单经历赔款,的次数服从泊松分布的随机变量,试估计参数,和置信度,=0.05,时的区间估计。,5,、某随机变量,X,服从正态分布,N,(,20,,,1,),今抽查,8,个样,本,测得数据为,19,、,19.5,、,19,、,20,、,20.5,、,20.3,、,19.7,、,19.6,,问情况是否正常?,总和,4000,6,、化肥厂用自动打包机打包,其包重服从正态分布,,每包标准重量为,100,公斤。要检验打包机工作是否正,常,开工后测得,10,包重量(单位:公斤)如下:,100.2,、,108.5,、,98.0,、,100.6,、,107.1,、,96.5,、,109.6,、,109.7,、,112.1,、,100.6,,试问该日打包机工作是否正常?,7,、某商场一年内每月的销售收入,X,(万元)与销售费用,Y,(万元)统计如下:,X 187.1 179.5 157.0 197.0 239.4 217.8 227.1,233.4 242.0 251.9 230.0 271.8,Y 25.4 22.8 20.6 21.8 32.4 24.4 29.3,27.9 27.8 34.2 29.2 30.0,试求销售费用,Y,关于销售收入,X,的线性回归方程。,五、思考与练习,1,、某保险公司,1990,年,1996,年的保费收入如下表,,求:均值;中位数;几何平均数;调和平均数。,2,、公司生产了一大批产品,为测算产品废品率,质检员,随机抽取了,n=50,件产品进行质量检验,求参数,p,的极大,似然估计。,3,、编制的程序中,由上题增加或减少样本容量,n,观察极,大似然估计及其分布的变化;在概率统计教材中,找几,道极大似然估计习题,用上面方法完成它。,年度,1990 1991 1992 1993 1994 1995 1996,保费收入,(,万元,)104 162 188 264 320 400 442,4,、下表给出了一家保险公司汽车碰撞险的素赔频率数据,,经分析认为,影响汽车碰撞险素赔频率的因素可能包括各,月的白昼时数、阴雨天数、失业率和工作日数。试建立,Y,与,X,1,、,X,2,、,X,3,、,X,4,之间的线性回归方程。,时间 白昼时数 阴雨天数 失业率 工作日数 素赔频率,%,1995.1 10.39 8.23 4.76 23 13.54,1995.2 10.97 7.6 4.82 20 11.99,1995.3 11.62 5.63 4.91 22 12.63,1995.4 12.46 8.62 4.92 21 12.92,1995.5 13.16 11.76 5.15 21 12.23,1995.6 14.01 10.92 5.52 21 11.33,1995.7 14.02 9.05 5.89 20 10.69,1995.8 13.48 6.82 6.35 19 9.43,1995.9 12.71 10.44 6.39 23 13.64,1995.10 11.92 8.81 6.19 19 10.88,1995.11 11.19 4.93 6.18 21 12.78,1995.12 10.39 7.03 6.32 21 12.83,六、操作提示,计算过程:,(,1,),X=500 1000 1500 2000;,P=0.82 0.15 0.02 0.01;,EX=X*P,DX=X.2*P-EX2,=DX0.5,(2),易知,X,服从二项分布,b(10,0.25),所求为,P(X4),P=binocdf(4,10,0.25),(3)x=0:20;,y=poisspdf(x,5),plot(y,-*r),(4)x=0 1 2 3;,phat,pci=poissfit(x,0.05),(5),程序如下:,X=19 19.5 19 20 20.5 20.3 19.7 19.6,H=ztest(X,20,1),(6)X=100.2 108.5 98.0 100.6 107.1 96.5 109.6,109.7 112.1 100.6;,H=ttest(X,100),X1=187.1 179.5 157.0 197.0 239.4 217.8 227.1,233.4 242.0 251.9 230.0 271.8;,Y=25.4 22.8 20.6 21.8 32.4 24.4 29.3 27.9 27.8,34.2 29.2 30.0;,X=ones(12,1)X1;,b,bint,r,rint,stats=regress(Y,X),(8)x=104 162 188 264 320 400 442;,M=mean(x)%,均值,M=median(x)%,中位数,M=geomean(x)%,几何平均数,M=harmmean(x)%,调和平均数,(9),设,X,服从两点分布,即,P(X=1)=p,P(X=0)=1-p,作似然函数:,(7),首先建立回归模型,其中:,syms p%,未知参数为,p,,所以作为符号变量处理,,用,syms,指令说明,clear,clf,n=50;%,产生,50,个样本,p=0.04;%,设定真实参数,x=zeros(1
展开阅读全文