北京科技大学概率论与数理统计上机报告.doc

资源描述

专业：信息与计算科学班级：信计1502（35组）学生姓名：吕瑞杰陈炎睿何芝芝指导教师：张志刚完成时间： 2020年2月21日概率论与数理统计第三次上机报告 Matlab 概率论与数理统计上机练习（3）五、假设检验【例】（离散型分布检验）某工厂近五年发生了63起事故，按星期几可以分为9 10 11 8 13 12，问该厂发生的事故数是有与星期几有关？clear allmi=9 10 11 8 13 12; % 周一到周六的事故数n=sum(mi); % 总的事故数r=0; % 总体中没有未知参数k=length(mi); % 天数pii=1/6; % 事故的概率kai2=0;kai2=sum(mi-n*pii).2)./(n*pii); % k2统计量的值alpha1=0.05; % 显著性水平alpha2=0.01; % 显著性水平alpha3=0.001; % 显著性水平la1=chi2inv(1-alpha1,k-r-1); % kai2分布的累计概率，即临界值la2=chi2inv(1-alpha2,k-r-1); % kai2分布的累计概率，即临界值la3=chi2inv(1-alpha3,k-r-1); % kai2分布的累计概率，即临界值pz=1-chi2cdf(kai2,k-r-1);%右侧概率if kai2la2 xzx=*;elseif kai2la1 xzx=*;else xzx=-;endx=0:0.1:la3;y=chi2pdf(x,k-r-1);plot(x,y);x1=kai2:0.1:la3;y1=chi2pdf(x1,k-r-1);hold onif kai2=60);se6=length(find(se=60);%及格人数sy7=length(find(sy=80);se7=length(find(se=80);%优秀人数sy8=sy6/sy1;se8=se6/se1;%及格率sy9=sy7/sy1;se9=se7/se1;%优秀率fprintf(t人数t 平均分t 最小值t 最大值 t极差tt标准差tt及格人数及格率t优秀人数优秀率n);fprintf( -n);fprintf(数学 %4dt%10.4ft%4dtt%4dtt%4dtt%10.4ft%4dt %10.4ft%4dt%10.4fn,sy1,sy4,sy2min,sy2max,sy3,sy5,sy6,sy8,sy7,sy9)fprintf(信计 %4dt%10.4ft%4dtt%4dtt%4dtt%10.4ft%4dt %10.4ft%4dt%10.4fn,se1,se4,se2min,se2max,se3,se5,sy6,sy8,se7,se9)fprintf(n);%方法一fprintf(检验数学和信计的方差是否相等n);h1,p1,varci1,stats1=vartest2(sy,se,alpha,both);if(h1=0) disp(结果：方差相等);else disp(结果：方差不相等);endfprintf(n);% %方法二% F=sy52/se52;%统计量F，满足F分布% alpha=0.05; %取显著水平为0.05% Fla1=finv(alpha/2,sy1-1,se1-1);Fla2=finv(1-alpha/2,sy1-1,se1-1);%求F的临界值% if (FFla1 & FFla2)% MM=数学分析1和数学分析2的方差无显著差异;% else% MM=数学分析1和数学分析2的方差有显著差异;% end% fprintf(检验数学分析1和数学分析2的方差是否相等n);% fprintf(统计量F的值ttt显著性水平tt临界值ttttt检验结果n);% fprintf( %.4ftttt%.4fttt%.4fttt%15sn,F,alpha,Fla1,MM);% fprintf(nn);%方法一fprintf(检验数学和信计的平均分是否相等n);h2,p2,muci2,stats2=ttest2(sy,se,alpha,both);if(h2=0) disp(结果：平均分相等);else disp(结果：平均分不相等);endfprintf(n);%方法二% %方法三% sw=(sy1-1)*sy52+(se1-1)*se52)/(sy1+se1-2);% T=(sy4-se4)/sw/sqrt(1/sy1+1/se1);%统计量T，满T分布% Tla1=tinv(alpha/2,sy1+se1-2);Tla2=tinv(1-alpha/2,sy1+se1-2);%求出T的临界值% if (abs(T)Ua) disp(优秀率无显著差异);else disp(优秀率有显著差异);endp=(sy6+se6)/(sy1+se1);U=(sy8-se8)/sqrt(sy8+se8)*p*(1-p);Ua=norminv(1-alpha/2);if(abs(U)Ua) disp(及格率无显著差异);else disp(及格率有显著差异);endh3,p3,kstat3,critval3=lillietest(sy,alpha);if(h3=1) disp(数学不是正态分布)else disp(数学是正态分布)endh4,p4,kstat4,critval4=lillietest(se,alpha);if(h4=1) disp(信计不是正态分布)else disp(信计是正态分布)end%hist(sy)%直方图%h5,p5,stats5=chi2gof(sy)%可以检验分布%cdf=sy,normcdf(sy,sy4,sy5)%h5,p5,ksstat,cv5=kstest(sy,cdf)% a=0:1:100;% a=a;% CDF=a,cdf(a,sy4,sy5);% h = kstest(sy,CDF,0.05);S=656568817476686982777466737277606281666876607480906960636867696260606067607767606060717260666186646060897374434061956970626663627874605076626584706983734371707371697460616070747848936461797153606052636061656278606560858589696660;h,p,jbstat,critval=jbtest(S,alpha);if(h=0) disp(服从正态分布);else disp(不服从正态分布);endsavg=mean(S);svar=var(S);x=20:130;y=normpdf(x,savg,sqrt(svar);d=5;a=20:d:130;pdf=hist(S,a)./length(S)./d;plot(x,y,r);hold onscatter(a,pdf,filled);hold off输出： lx3_1_lrj_41521335人数平均分最小值最大值极差标准差及格人数及格率优秀人数优秀率 -数学 54 70.6667 40 95 55 10.0885 53 0.9815 9 0.1667信计 60 65.5167 43 89 46 9.2313 53 0.9815 5 0.0833检验数学和信计的方差是否相等结果：方差相等检验数学和信计的平均分是否相等结果：平均分不相等优秀率有显著差异及格率有显著差异数学不是正态分布Warning: P is less than the smallest tabulated value, returning 0.001. In lillietest (line 206) In lx3_1_lrj_41521335 (line 99) 信计不是正态分布服从正态分布六、方差分析【例1】（单因素方差分析）考虑温度对某化工产品得率的影响，选择五种不同温度进行试验，每一温度各做三次试验。方法一：自编程序clear allX=90,92,88;97,93,92;96,96,93;84,83,88;84,86,82;a=5;ni=3,3,3,3,3; %每个因素的样本数n=sum(ni); %样本总数%T=sum(sum(X); %先求每列的和，再求总和%求所有样本的和T，平方和，及ST,SA,SET=0; ST=0; SA=0; SE=0;for i=1:a Ti=0; for j=1:ni(i) T=T+X(i,j); Ti=Ti+X(i,j); ST=ST+X(i,j)2; end SA=SA+Ti2/ni(i);endST=ST-T2/n; % 总偏差平方和SA=SA-T2/n; % 效应平方和SE=ST-SA; % 误差平方和 F=(SA/(a-1)/(SE/(n-a); % F比alpha1=0.05; % 显著性水平la1=finv(1-alpha1,a-1,n-a); %由F分布的累积概率，求临界值，PFla=1-alphaalpha2=0.01; % 显著性水平la2=finv(1-alpha2,a-1,n-a); %由F分布的累积概率，求临界值，PFla=1-alphap=1-fcdf(F,a-1,n-a); %计算F比值做为临界点的右侧概率 p=1-PXla2 xzx=*;elseif Fla1 xzx=*;else xzx=-;endfprintf( 来源tt平方和tt自由度tt均方和ttF比tt显著性n);fprintf( 效应Att%.2ftt%4dtt%.2ftt%.2ftt%.4fn,SA,a-1,SA/(a-1),F,p);fprintf( 误差tt%.2ftt%4dtt%.2ftttt%4sn,SE,n-a,SE/(n-a),xzx);fprintf( 总和tt%.2ftt%4dtt临界值=%.2f(%.2f),%.2f(%.2f)n,ST,n-1,la1,alpha1,la2,alpha2);fprintf(nn);运行结果为：来源平方和自由度均方和F比显著性效应A303.60 475.9015.18 *误差50.00 105.000.000299- 总和353.60 14临界值=3.48(0.05),5.99(0.01)-方法二：调用matlab工具anova1(X)，其中矩阵X表示X的转置，即该函数每一列为一个因素。运行结果为【例7.2】（没有交互作用的多因素方差分析）一火箭使用了四种燃料，三种推进器，作射程试验。X=58.2,56.2,65.3;49.1,54.1,51.6;60.1,70.9,39.2;75.8,58.2,48.7;方法一：自编程序，运行结果为 58.2000 56.2000 65.3000 49.1000 54.1000 51.6000 60.1000 70.9000 39.2000 75.8000 58.2000 48.7000 来源平方和自由度均方和F比显著性效应A157.59 352.530.4306(0.738747)效应B223.85 2111.920.9174(0.449118)误差731.98 6122.00总和1113.42 11临界值=4.76(0.05),5.14(0.05)-方法二：调用matlab工具anova2(X)【练习3.2】单因素方差分析（1）对四个班的 “数学分析一”进行方差分析；（2）对全体学生的数学类的课进行方差分析。Matlab程序实现：X=60,60,63,63,40,69,65,60,72,67,62,78,82,90,69,60,72,76,78,93,69,68,95,71,83,60; 73,73,60,74,77,71,85,70,89,60,61,77,62,68,60,70,66,84,74,69,61,60,86,73,69,74; 50,81,67,65,77,71,76,62,89,65,65,62,62,60,78,81,66,70,80,53,69,66,61,48,66,69;68,60,74,60,62,43,61,60,60,64,70,74,65,73,79,60,43,76,66,63,60,60,68,60,60,60;anova1(X)a=4;ni=26,26,26,26; %每个因素的样本数n=sum(ni); %样本总数%T=sum(sum(X); %先求每列的和，再求总和%求所有样本的和T，平方和，及ST,SA,SET=0; ST=0; SA=0; SE=0;for i=1:a n Ti=0; for j=1:ni(i) T=T+X(i,j); Ti=Ti+X(i,j); ST=ST+X(i,j)2; end SA=SA+Ti2/ni(i);endST=ST-T2/n; % 总偏差平方和SA=SA-T2/n; % 效应平方和SE=ST-SA; % 误差平方和 F=(SA/(a-1)/(SE/(n-a); % F比alpha1=0.05; % 显著性水平la1=finv(1-alpha1,a-1,n-a); %由F分布的累积概率，求临界值，PFla=1-alphaalpha2=0.01; % 显著性水平la2=finv(1-alpha2,a-1,n-a); %由F分布的累积概率，求临界值，PFla=1-alphap=1-fcdf(F,a-1,n-a); %计算F比值做为临界点的右侧概率 p=1-PXla2 xzx=*;elseif Fla1 xzx=*;else xzx=-;endfprintf(ttt对四个班的数学分析一nn)fprintf( 来源tt平方和ttt自由度ttt均方和tttF比tt显著性n);fprintf( 效应Att%.2ftttt%4dtt%.2ftt%.2ftt%.4fn,SA,a-1,SA/(a-1),F,p);fprintf( 误差tt%.2ftt%4dtt%.2fttttt%4sn,SE,n-a,SE/(n-a),xzx);fprintf( 总和tt%.2ftt%4dtt临界值=%.2f(%.2f),%.2f(%.2f)n,ST,n-1,la1,alpha1,la2,alpha2);fprintf(nn);x=606074727564816076737678739563738184859585634866746050744040324625543969969884779193656172706060736076738975806772878987949794678584908594936280786467807878100969392979782898880909092908794859397856976796981868560618274607165727181706667787660838063518478858378849283939997849085966960757767727268616372748585959984918795897194938194879683777775859086606377686879857392887582887973858487889096607878807688897499918790929277969290919496717287878580888599989695949770848783818389899182909191966069778960738261728185759288778084758685916271777366808768888282898189606066696650737060718072929066647086717893841008487909594748781859184816981818288789261646063708173606565736166748610098879690887364778186839269607273757878747486859590917173758382807874717877767693506267706878748190948691909167909185888590655243566562767799939090959671456472638366767393889274906285777787878989949393919295655239856882606561408576746862374553645571628563917791886049396850714978928091937892819998889591996687839382859170718283788790809989929694965366757469627869817891917594667785828495796160446160616648346364416660665036726071636963637266607161493272537860606063796070816071678983688285868080608265523645534648526871896961868360454583397560746080838890816087758993908962503073647671436065686270606168697276797760646786707779608678757583836460677146736070696779647780746976666580686579808783808573928984868496797483827485906060628373877343606783809070767796899691966660707261747263778988779287604868566871716061636665606368768275818477605163673973696067828378868660647379728186678789878788977473698690959564626482799185;X=x;a=7;ni=114,114,114,114,114,114,114; %每个因素的样本数n=sum(ni); %样本总数%T=sum(sum(X); %先求每列的和，再求总和%求所有样本的和T，平方和，及ST,SA,SET=0; ST=0; SA=0; SE=0;for i=1:a Ti=0; for j=1:ni(i) T=T+X(i,j); Ti=Ti+X(i,j); ST=ST+X(i,j)2; end SA=SA+Ti2/ni(i);endST=ST-T2/n; % 总偏差平方和SA=SA-T2/n; % 效应平方和SE=ST-SA; % 误差平方和 F=(SA/(a-1)/(SE/(n-a); % F比alpha1=0.05; % 显著性水平la1=finv(1-alpha1,a-1,n-a); %由F分布的累积概率，求临界值，PFla=1-alphaalpha2=0.01; % 显著性水平la2=finv(1-alpha2,a-1,n-a); %由F分布的累积概率，求临界值，PFla=1-alphap=1-fcdf(F,a-1,n-a); %计算F比值做为临界点的右侧概率 p=1-PXla2 xzx=*;elseif Fla1 xzx=*;else xzx=-;endfprintf(ttt全体数学课程nn)fprintf( 来源tt平方和ttt自由度tt均方和tttF比tt显著性n);fprintf( 效应Att%.2ftt%4dtt%.2ftt%.2ftt%.4fn,SA,a-1,SA/(a-1),F,p);fprintf( 误差tt%.2ftt%4dtt%.2fttttt%4sn,SE,n-a,SE/(n-a),xzx);fprintf( 总和tt%.2ftt%4dtt临界值=%.2f(%.2f),%.2f(%.2f)n,ST,n-1,la1,alpha1,la2,alpha2);fprintf(nn);输出：方法一：对四个班的数学分析一来源平方和自由度均方和F比显著性效应A906.26 3 302.09 3.130.0289 误差9636.27 100 96.36 * 总和10542.53 103 临界值=2.70(0.05),3.98(0.01)全体数学课程来源平方和自由度均方和F比显著性效应A15804.93 6 2634.15 15.340.0000 误差135824.95 791171.71 * 总和151629.87 797临界值=2.11(0.05),2.82(0.01)方法二：七、回归分析【例1】（一元线性回归）以三口之家为单位，某食品在某年中平均月消费量(kg)与其价格(元/kg)之间的关系。方法一：自编程序clear allx=2,2,2.4,2.7,3,3,3.5,3.6,3.8,4,4.5,5;y=3,3.6,2.8,2.8,2.3,2.9,1.9,2.1,1.9,1.3,1.5,1;运行结果为回归直线方程为 y=4.8256+-0.7799 x来源平方和自由度均方和F比显著性回归R6.0400 16.040090.2608 *误差0.6692 100.06690.000003总和6.7092 11临界值=4.9646(0.05),10.0443(0.01)【练习3.3】回归分析（1）对全体学生的 “基础外语一”和“基础外语二”进行回归分析；（2）对全体学生的 “数学分析一”和“体育一”进行回归分析。“基础外语一”和“基础外语二”回归直线方程为 y=(11.8263)+(0.8605)x -来源平方和自由度均方和 F比显著性-回归R6613.4800 1 6613.4800249.1623 *-误差2972.8007 112 26.5429 p=0.000000-总和9586.2807 113临界值=3.9258(0.05),6.8667(0.01)回归直线方程为 y=(92.6417)+(-0.0551)x -来源平方和自由度均方和 F比显著性-回归R34.5457 1 34.54570.5277 -误差7332.1911 112 65.4660p=0.469095-总和7366.7368 113 临界值=3.9258(0.05),6.8667(0.01)-Matlab程序实现：基础外语I和基础外语IIx=778378877581836774838182747494658177808783768587767983758987699580656984747087607089837160556671736369706752737172826964626865697167537270646867866473647877787873787968687268768983668175738772728160698460706076806574867885637258;y=807672897787846679898081798093758788898481778692808581758994719070576788797887616988856863566575776872737060796169837366706672727670607381726173868075768481708266757869677078758982656364789475748262628563686271776969828687697756;n=length(x);X=ones(n,1) x;alpha=0.05;b,bint,r,rint,stats=regress(y,X,alpha);ahat=b(1);bhat=b(2);hold ontitle($haty=hat11.8263+hat 0.8605x$,interpreter,latex,fontsize,20)yhat=b(1)+b(2).*x;scatter(x,y,filled);plot(x,yhat,k);for i=1:n; a=x(i) x(i); c=yhat(i) y(i); plot(a,c,r-);endsxx=sum(x.2)-(sum(x)2/n;t=bhat*sqrt(sxx)/sqrt(stats(4);p=(1-tcdf(abs(t),n-2)*2;se1=stats(4);sr=sum(yhat-mean(y).2);st=sum(y-mean(y).2);se=sum(yhat-y).2);disp(stats(4);for i=1:n; y1(i)=yhat(i)-(-tinv(0.025,n-2)*sqrt(1+1/n+(x(i)-mean(x).2/sxx)*sqrt(se/(n-2); y2(i)=yhat(i)+(-tinv(0.025,n-2)*sqrt(1+1/n+(x(i)-mean(x).2/sxx)*sqrt(se/(n-2);endyleft=y1;yright=y2;Y=yleft yright;plot(x,yleft,g,x,yright,g)hold offf=sr/(se/(n-2);lamda1=finv(0.95,1,n-2);lamda2=finv(0.99,1,n-2);p=1-fcdf(f,2-1,n-2); %计算F比值做为临界点的右侧概率 p=1-PXlamda1) a=*;end if(flamda2&flamda1) a=*;endif(flamda2) a=-;endfprintf(来源tt平方和tt自由度tt均方和ttF比tt显著性n)fprintf(回归tt%.4ft%.ftt%.4ft%.4ftt%sn,sr,1,sr,f,a)fprintf(误差tt%.4ft%.ftt%.4ftp=%.8fn,se,n-2,se/(n-2),p)fprintf(总和tt%.4ft%.f 临界值=%.4f(0.05),%.4f(0.01)n,st,n-1,lamda1,lamda2)%-输出：来源平方和自由度均方和F比显著性回归6613.480016613.4800249.1623*误差2972.800711226.5429 p=0.00000000总和9586.2807113 临界值=3.9258(0.05),6.8667(0.01)数学分析I和体育Ix=656568817476686982777466737277606281666876607480906960636867696260606067607767606060717260666186646060897374434061956970626663627874605076626584706983734371707371697460616070747848936461797153606052636061656278606560858589696660;y=8683707880779098958010010085928582989885888410083669591879591867995961008289898790100899482987782887694888699829091909896828685979881708890878794849994989882858363

展开阅读全文

北京科技大学概率论与数理统计上机报告.doc

最新文档