数据的统计描述及其分析课件

上传人:2127513****773577... 文档编号:250942824 上传时间:2024-11-04 格式:PPT 页数:83 大小:1.43MB
返回 下载 相关 举报
数据的统计描述及其分析课件_第1页
第1页 / 共83页
数据的统计描述及其分析课件_第2页
第2页 / 共83页
数据的统计描述及其分析课件_第3页
第3页 / 共83页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,一个有趣的现象,在全球最大的零售业巨头沃尔玛连锁商店里,就有这么一个有趣的现象,啤酒与婴幼儿尿布是摆设在一块的。这是什么原因呢?原来美国太太们总是要求其先生下班后给儿女们买尿布,而美国男士们又特爱喝啤酒,下班时总忘不了要到商店中买几罐啤酒,而这两样东西放在一块,既提醒做父亲的不要忘了买尿布同时又顺便把自己喜爱的啤酒带回了家。沃尔玛连锁商店通过周密的调查与细心的统计发现这两样看似毫无关系的东西却有着如此神奇的联系,从而把这两样表面看似毫不搭界的东西摆在了一起,结果,啤酒与尿布的销量双双大增。可见,在细微之处入手,是会有意想不到的效果的。,04.11.2024,1,数理系 袁国军,一个有趣的现象 在全球最大的零售业巨头沃尔玛连锁商,数据的统计描述和分析,04.11.2024,2,数理系 袁国军,数据的统计描述和分析29.09.20232数理系 袁国军,一、统计量,统计的基本概念,04.11.2024,3,数理系 袁国军,一、统计量统计的基本概念29.09.20233数理系 袁国,04.11.2024,4,数理系 袁国军,29.09.20234数理系 袁国军,二、分布函数的近似求法,04.11.2024,5,数理系 袁国军,二、分布函数的近似求法29.09.20235数理系 袁国军,三、几个在统计中常用的概率分布,-4,-2,0,2,4,6,0,0.05,0.1,0.15,0.2,0.25,0.3,0.35,0.4,1,正态分布,),(,2,s,m,N,密度函数:,2,2,2,),(,2,1,),(,s,m,s,p,-,-,=,x,e,x,p,分布函数:,dy,e,x,F,y,x,2,2,2,),(,2,1,),(,s,m,s,p,-,-,-,=,其中,m,为均值,,2,s,为方差,,+,-,x,.,标准正态分布:,N,(,0,,,1,),密度函数,2,2,2,1,),(,x,e,x,-,=,p,j,dy,e,x,y,x,2,2,2,1,),(,-,-,=,F,p,,,分布函数,04.11.2024,6,数理系 袁国军,三、几个在统计中常用的概率分布-4-2024600.050.,04.11.2024,7,数理系 袁国军,29.09.20237数理系 袁国军,04.11.2024,8,数理系 袁国军,29.09.20238数理系 袁国军,F,分布,F,(,10,,,50,)的密度函数曲线,04.11.2024,9,数理系 袁国军,F分布F(10,50)的密度函数曲线29.09.20239数,参数估计,04.11.2024,10,数理系 袁国军,参数估计29.09.202310数理系 袁国军,一、点估计的求法,(,一)矩估计法,04.11.2024,11,数理系 袁国军,一、点估计的求法(一)矩估计法29.09.202311数理系,(,二)极大似然估计法,04.11.2024,12,数理系 袁国军,(二)极大似然估计法29.09.202312数理系 袁国军,二、区间估计的求法,04.11.2024,13,数理系 袁国军,二、区间估计的求法29.09.202313数理系 袁国军,1,、已知,DX,,求,EX,的置信区间,2, 未知方差,DX,,求,EX,的置信区间,(,一,),数学期望的置信区间,(二)方差的区间估计,04.11.2024,14,数理系 袁国军,1、已知DX,求EX的置信区间2 未知方差DX,求EX的置,Matlab,统计工具箱的使用之一,一、常见统计量的,Matlab,命令,1.,输出频数表,:,n,y=hist(x,k),k,为等分区间数,,n,为频数行向量,,x,为原始数据行向量。,2.,输出直方图:,hist(x,k),,,k,为等分区间数,默认值为,10,。,3.,基本统计量:,对随机变量,x,,计算其基本统计量,的命令如下:,均值:,mean(x),中位数:,median(x),标准差:,std(x),方差:,var(x),偏度:,skewness(x),峰度:,kurtosis(x),k,阶中心矩:,monment(x,order),,,order,是阶数,04.11.2024,15,数理系 袁国军,Matlab统计工具箱的使用之一一、常见统计量的Matlab,二,、,常见概率分布的函数,Matlab,工具箱对每一种分布都提供五类函数,其命令字符为:,概率密度:,pdf,概率分布:,cdf,逆概率分布:,inv,均值与方差:,stat,随机数生成:,rnd,(当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可,.,),04.11.2024,16,数理系 袁国军,二、常见概率分布的函数Matlab工具箱对每一种分布都提供五,如对均值为,mu,、标准差为,sigma,的正态分布,举例如下:,1,、密度函数,:,p=normpdf(x,mu,sigma) (,当,mu=0,sigma=1,时可缺省,),例 求正态分布,N(1,2,2,),x=1.8,处的密度函数值,y=normpdf(1.8,1,2),,得,y=0.1841,在,Matlab,中输入以下命令:,x=-6:0.01:6;,y=normpdf(x); z=normpdf(x,0,2);,plot(x,y,x,z),04.11.2024,17,数理系 袁国军,如对均值为mu、标准差为sigma的正态分布,举例如下:1、,04.11.2024,18,数理系 袁国军,29.09.202318数理系 袁国军,2,、概率分布(分布函数),:,P=normcdf(x,mu,sigma),求正态分布,N(0,2,2,),x=1.2,处的分布函数值,即,F,(,1.2,)的值,P=normcdf(1.2,0,2),,得,p=0.7257,求二项分布,B(20,0.3),x=6,处的分布函数值,P=binocdf(6,20,0.3),,得,p=0.6080,04.11.2024,19,数理系 袁国军,2、概率分布(分布函数):P=normcdf(x,mu,si,3,、逆概率分布,:,x=norminv(P,mu,sigma).,即求出,x,,使得,PXx=P.,此命令可用来求分位数(下侧),求,p=0.999,的,tf,分布(自由度,n=10,)的分位数,y=tinv(0.999,10),,得,y =4.1437,04.11.2024,20,数理系 袁国军,3、逆概率分布:x=norminv(P,mu,sigma).,4,、均值与方差:,例,5,求正态分布,N(3,5,2,),的均值与方差,.,命令为:,m,v=normstat(3,5),结果为:,m=3,v=25,计算,F(2,5),的期望与方差,命令:,m,v=fstat(2,5),结果为:,m=,1.6667,v=,13.8889,04.11.2024,21,数理系 袁国军,4、均值与方差:例5 求正态分布N(3,52)的均值与方差,5,、随机数生成:,normrnd(mu,sigma,m,n).,产生,m,n,阶的正态分布随机数矩阵,.,例,6,命令:,M=normrnd(1 2 3;4 5 6,0.1,2,3),结果为:,M=0.9567 2.0125 2.8854,3.8334 5.0288 6.1191,此命令产生了,2,3,的正态分布随机数矩阵,各数分别服从,N(1,0.1,2,), N(2,2,2,), N(3, 3,2,), N(4,0.1,2,), N(5, 2,2,),N(6, 3,2,),M=normrnd(1 2 3;4 5 6,0.1 2 3;2 4 6),请思考此命令生成的是什么样的随机矩阵呢?,04.11.2024,22,数理系 袁国军,5、随机数生成:normrnd(mu,sigma,m,n).,二、参数估计,1,、,正态总体的参数估计,设总体服从正态分布,则其点估计和区间估计可同时由以下命令获得:,muhat,sigmahat,muci,sigmaci = normfit(X,alpha),此命令在显著性水平,alpha,下估计数据,X,的参数(,alpha,缺省时设定为,0.05,),返回值,muhat,是,X,的均值的点估计值,,sigmahat,是标准差的点估计值, muci,是均值的区间估计,sigmaci,是标准差的区间估计,.,04.11.2024,23,数理系 袁国军,二、参数估计1、正态总体的参数估计 设总体服从正,例如:有一批糖果,从中随机的取,16,袋,称得重量如下:,506 508 499 503 504 510 497 512 514 505 493 496 506 502,509 496,,假设糖果的重量近似服从正态分布,求总体均值,、标准差的估计值和置信水平为,0.95,的置信区间。,x=506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496;,mu,sigma,muci,sigmaci=normfit(x,0.05),得到,mu =503.7500 sigma =6.2022,muci =500.4451,507.0549,sigmaci =4.5816,9.5990,04.11.2024,24,数理系 袁国军,例如:有一批糖果,从中随机的取16袋,称得重量如下:得到mu,2.,常见的几种分布数据的点估计和区间估计,的,matlab,命令格式,1.,均匀分布:,ahat,bhat,aci,bci=,unifit,(x,alpha),,,在,显著性水平,alpha,下,求,均匀分布的数据,X,的,均值,的点估计及其区间估计,.,2.,指数分布:,muhat,,,muci,=,expfit,(x,alpha),在显著性,水平,alpha,下,求,指数分布的数据,X,的,均值的点估,计及其区间估计,.,3.,正态分布:,mu,,,sigma,muci,sigmaci=,normfit,(x,alpha),,,在显著性水平,alpha,下,求,正态分布的数据,X,的,均值,的点估计及其区间估计,.,04.11.2024,25,数理系 袁国军,2.常见的几种分布数据的点估计和区间估计1.均匀分布:ah,4.,泊松分布:,lambdahat,lambdaci=,poissfit,(x,alpha),在显著性水平,alpha,下,求,正态分布的数据,X,的,均值的点估计及其区间估计,.,5.,二项分布:,phat,pci=,binofit,(x,n,alpha),在显著性水平,alpha,下,求,正态分布的数据,X,的,均值,的点估计及其区间估计,.,其中,x,是样本数组,,alpha,是显著性水平,输出有关参数的点估计和区间估计。,04.11.2024,26,数理系 袁国军,4.泊松分布:lambdahat,lambdaci=po,例如,假设下面的数据近似服从泊松分布,请求出分布,的参数及,0.95,的置信区间。,10 6 5 3 3 10 5 3 5 7 3 8,6 5 7 5 8 5 5,x=6 10 6 5 3 3 10 5 3 5 7 3 8 6 5 7 5 8 5 5;,muhat,muci=poissfit(x,0.05),04.11.2024,27,数理系 袁国军,例如 假设下面的数据近似服从泊松分布,请求出分布29.09.,练习,:,某校,60,名学生的一次考试成绩如下,:,93 75 83 93 91 85 84 82 77 76 77 95 94 89 91 88 86 83 96 81 79 97 78 75 67 69 68 84 83 81 75 66 85 70 94 84 83 82 80 78 74 73 76 70 86 76 90 89 71 66 86 73 80 94 79 78 77 63 53 55,1),计算均值、标准差、极差、偏度、峰度,画出直方图;,2),若成绩近似服从正态分布,估计正态分布的参数,.,04.11.2024,28,数理系 袁国军,练习:某校60名学生的一次考试成绩如下:1)计算均值、标准差,1,.,参数检验,:如果观测的分布函数类型已知,这时构造出的,统计量依赖于总体的分布函数,这种检验称为参数检验,.,参数检验的目的往往是对总体的参数及其有关性质作出明,确的判断,.,对总体,X,的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设,.,2.,非参数检验,:如果所检验的假设并非是对某个参数作出明,确的判断,因而必须要求构造出的检验统计量的分布函数,不依赖于观测值的分布函数类型,这种检验叫非参数检验,.,如要求判断总体分布类型的检验就是非参数检验,.,假设检验,04.11.2024,29,数理系 袁国军,1.参数检验:如果观测的分布函数类型已知,这时构造出的,假设检验的一般步骤是,:,04.11.2024,30,数理系 袁国军,假设检验的一般步骤是:29.09.202330数理系 袁国,(一)单个正态总体均值检验,一、参数检验,04.11.2024,31,数理系 袁国军,(一)单个正态总体均值检验一、参数检验29.09.20233,04.11.2024,32,数理系 袁国军,29.09.202332数理系 袁国军,(二)单个正态总体方差检验,04.11.2024,33,数理系 袁国军,(二)单个正态总体方差检验29.09.202333数理系,(三)两个正态总体均值检验,04.11.2024,34,数理系 袁国军,(三)两个正态总体均值检验29.09.202334数理系,(四)两个正态总体方差检验,04.11.2024,35,数理系 袁国军,(四)两个正态总体方差检验29.09.202335数理系,二、非参数检验,前面讨论的是分布已知时的参数假设检验问题,称为参数假设,检验。一般说来,在进行参数假设检验之前,要对总体的分布,进行推断,即为总体分布的拟合检验问题,它属于非参数检验。,已知总体,X,的样本分布函数,F,n,(x),,若选用某个分布函数,F,0,(x),去拟合,则无论选择,,F,0,(x),与,F,n,(x),之间总会存在差异。这些,差异是由于试验的有限性而导致的随机性产生的呢,还是所选择,的分布函数,F,0,(x),与样本函数,F,n,(x,之间存在实质性差异而产生的呢?,04.11.2024,36,数理系 袁国军,二、非参数检验 前面讨论的是分布已知时的参数假设检验,此种方法主要是通过各组试验数据频数与理论频数差异性的大小,来推断经验分布是否服从任何一个预先给定的理论分布。其理论,依据就是用各组试验数据频数与理论频数的差异构造一个服从,分布的统计量,并用次统计量来进行假设检验。使用此法时要求,样本容量较大,并且在进行分组时,每组的理论频数不小于,5,。,具体的内容请参见有关概率论与数理统计教材,04.11.2024,37,数理系 袁国军,此种方法主要是通过各组试验数据频数与理论频数差异性的大小29,概率纸是一种判断总体分布的简便工具,.,使用它们,可以很快地判断总体分布的类型,.,概率纸的种类很多,以正态概率纸最为常见。正态概率纸的横坐标是均匀刻度,纵坐标是按正态分布律刻度,表示概率。,(二)概率纸检验法,04.11.2024,38,数理系 袁国军,概率纸是一种判断总体分布的简便工具.使用它们,统计工具箱中的基本统计命令,1.,数据的录入、保存和调用,2.,基本统计量,3.,常见概率分布的函数,4.,频 数 直 方 图 的 描 绘,5.,参数估计,6.,假设检验,7.,综合实例,04.11.2024,39,数理系 袁国军,统计工具箱中的基本统计命令1.数据的录入、保存和调用2.基本,一、数据的录入、保存和调用,例,1,上海市区社会商品零售总额和全民所有制职工工资总额的数据如下,04.11.2024,40,数理系 袁国军,一、数据的录入、保存和调用 例1 上海市区社会,1,、,年份数据以,1,为增量,用产生向量的方法输入。,命令格式:,x=a:h:b,t=78:87,2,、,分别以,x,和,y,代表变量职工工资总额和商品零售总额。,x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;,y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0;,3,、将变量,t,、,x,、,y,的数据保存在文件,data,中。,save data t x y,4,、进行统计分析时,调用数据文件,data,中的数据。,load data,To,MATLAB,(txy),方法,1,04.11.2024,41,数理系 袁国军,1、年份数据以1为增量,用产生向量的方法输入。2、分别以x和,1,、,输入矩阵:,data=78,79,80,81,82,83,84,85,86,87;,23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;,41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0,2,、将矩阵,data,的数据保存在文件,data1,中:,save data1 data,3,、进行统计分析时,先用命令:,load data1,调用数据文件,data1,中的数据,再用以下命令分别将矩阵,data,的第一、二、三行的数据赋给变量,t,、,x,、,y,:,t=data(1,:),x=data(2,:),y=data(3,:),若要调用矩阵,data,的第,j,列的数据,可用命令:,data(:,j),方法,2,To,MATLAB,(data),04.11.2024,42,数理系 袁国军,1、输入矩阵:2、将矩阵data的数据保存在文件data1中,二、基本统计量,对随机变量,x,,计算其基本统计量的命令如下:,均值:,mean(x),中位数:,median(x),标准差:,std(x),方差:,var(x),偏度:,skewness(x),峰度:,kurtosis(x),例,对例,1,中的职工工资总额,x,,可计算上述基本统计量。,To,MATLAB,(tjl),04.11.2024,43,数理系 袁国军,二、基本统计量对随机变量x,计算其基本统计量的命令如下:例,三,、,常见概率分布的函数,Matlab,工具箱对每一种分布都提供五类函数,其命令字符为:,概率密度:,pdf,概率分布:,cdf,逆概率分布:,inv,均值与方差:,stat,随机数生成:,rnd,(当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可,.,),04.11.2024,44,数理系 袁国军,三、常见概率分布的函数Matlab工具箱对每一种分布都提供五,在,Matlab,中输入以下命令:,x=-6:0.01:6;,y=normpdf(x); z=normpdf(x,0,2);,plot(x,y,x,z),1,、密度函数,:,p=normpdf(x,mu,sigma) (,当,mu=0,sigma=1,时可缺省,),To,MATLAB(liti2),如对均值为,mu,、标准差为,sigma,的正态分布,举例如下:,04.11.2024,45,数理系 袁国军,在Matlab中输入以下命令:1、密度函数:p=normpd,04.11.2024,46,数理系 袁国军,29.09.202346数理系 袁国军,x=-6:0.01:6;,y=normpdf(x); z=normpdf(x,1,2);,plot(x,y,x,z),04.11.2024,47,数理系 袁国军,x=-6:0.01:6; 29.09.202347数理系,To,MATLAB(liti3),3,、逆概率分布,:,x=norminv(P,mu,sigma).,即求出,x,,使得,PX50,),按中心极限定理,它近似地,服从正态分布;,二,.,使用,Matlab,工具箱中具有特定分布总体的估计命令,.,(,1,),muhat, muci = expfit(,X,alpha)-,在显著性水平,alpha,下,求,指数分布的数据,X,的,均值的点估计及其区间估计,.,(,2,),lambdahat, lambdaci = poissfit(,X,alpha)-,在显著性水平,alpha,下,求,泊松分布的数据,X,的参数的点估计及其区间估计,.,(,3,),phat, pci = weibfit(,X,alpha)-,在显著性水平,alpha,下,求,Weibull,分布的数据,X,的参数的点估计及其区间估计,.,04.11.2024,53,数理系 袁国军,2、其它分布的参数估计 有两种处理办法:(1)muha,六、假设检验,在总体服从正态分布的情况下,可用以下命令进行假设检验,.,1,、,总体方差,sigma,2,已知时,总体均值的检验使用,z-,检验,h,sig,ci = ztest(x,m,sigma,alpha,tail),检验数据,x,的关于均值的某一假设是否成立,其中,sigma,为已知方差,,alpha,为显著性水平,究竟检验什么假设取决于,tail,的取值:,tail = 0,,检验假设“,x,的均值等于,m ”,tail = 1,,检验假设“,x,的均值大于,m ”,tail =-1,,检验假设“,x,的均值小于,m ”,tail,的缺省值为,0,,,alpha,的缺省值为,0.05.,返回值,h,为一个布尔值,,h=1,表示可以拒绝,原假设,,,h=0,表示不可以拒绝,原假设,,,sig,为假设成立的概率,,ci,为均值的,1-alpha,置信区间,.,04.11.2024,54,数理系 袁国军,六、假设检验 在总体服从正态分布的情况下,可用以,例,7,Matlab,统计工具箱中的数据文件,gas.mat.,中提供了美国,1993,年一月份和二月份的汽油平均价格(,price1,price2,分别是一,二月份的油价,单位为美分),它是容量为,20,的双样本,.,假设一月份油价的标准偏差是一加仑四分币(,=4,),试检验一月份油价的均值是否等于,115.,解,作假设:,m = 115.,首先取出数据,用以下命令:,load gas,然后用以下命令检验,h,sig,ci = ztest(price1,115,4),返回:,h = 0,,,sig = 0.8668,,,ci = 113.3970 116.9030.,检验结果,: 1.,布尔变量,h=0,表示不拒绝零假设,.,说明提出的假设均值,115,是合理的,.,2. sig-,值为,0.8668,远超过,0.05,不能拒绝零假设,3. 95%,的置信区间为,113.4, 116.9,它完全包括,115,且精度很,高,.,.,To,MATLAB,(,liti7,),04.11.2024,55,数理系 袁国军,例7 Matlab统计工具箱中的数据文件gas.mat.,练习,1,有一批糖果,从中随机的取,16,袋,称得重量如下:,506 508 499 503 504 510 497 512 514 505 493,496 506 502 509 496,,假设糖果的重量近似服从正态,分布、标准差为,4,,请问该批糖果每袋的平均重量是否,为,500,?,(,置信水平为,0.05),x= ,506 508 499 503 504 510 497 512 514 505 493,496 506 502 509 496;,h,sig,muci=ztest(x,500,4,0.05,0),得到,h =1,,,sig =1.7683e-004,muci =501.7900,505.7100,h=1,因此拒绝原假设,即平均重量不等于,500,04.11.2024,56,数理系 袁国军,练习1x= 506 508 499 503 504 510,2,、,总体方差,sigma,2,未知时,总体均值的检验使用,t-,检验,h,sig,ci = ttest(x,m,alpha,tail),检验数据,x,的关于均值的某一假设是否成立,其中,alpha,为显著性水平,究竟检验什么假设取决于,tail,的取值:,tail = 0,,检验假设“,x,的均值等于,m ”,tail = 1,,检验假设“,x,的均值大于,m ”,tail =-1,,检验假设“,x,的均值小于,m ”,tail,的缺省值为,0,,,alpha,的缺省值为,0.05.,返回值,h,为一个布尔值,,h=1,表示可以拒绝假设,,h=0,表示不可以拒绝假设,,sig,为假设成立的概率,,ci,为均值的,1-alpha,置信区间,.,04.11.2024,57,数理系 袁国军,2、总体方差sigma2未知时,总体均值的检验使用t-检验,返回:,h = 1,,,sig =,4.9517e-004,,,ci =,116.8 120.2,.,检验结果,: 1.,布尔变量,h=1,表示拒绝零假设,.,说明提出的假,设油价均值,115,是不合理的,.,2. 95%,的置信区间为,116.8 120.2,它不包括,115,故不能接受假设,.,3. sig-,值为,4.9517e-004,远小于,0.05,不能接受零,假设,.,To,MATLAB,(,liti8,),例,8,试检验例,8,中二月份油价,Price2,的均值是否等于,115.,解,作假设:,m = 115,,,price2,为二月份的油价,不知其方差,故用以下命令检验,h,sig,ci = ttest( price2 ,115),04.11.2024,58,数理系 袁国军,返回:h = 1,sig = 4.9517e-004,ci,练习,正常人的脉搏为每分钟,72,次,测得,10,例,慢性中毒者的脉搏为:,54 67 65 68 78 70,66 70 69 67,设中毒者的脉搏为正态分布,,问中毒者和正常人的脉搏有无显著性差异?,04.11.2024,59,数理系 袁国军,练习29.09.202359数理系 袁国军,3,、,两总体均值的假设检验,使用,t-,检验,h,sig,ci = ttest2(x,y,alpha,tail),检验数据,x,,,y,的关于均值的某一假设是否成立,其中,alpha,为显著性水平,究竟检验什么假设取决于,tail,的取值:,tail = 0,,检验假设“,x,的均值等于,y,的均值 ”,tail = 1,,检验假设“,x,的均值大于,y,的均值 ”,tail =-1,,检验假设“,x,的均值小于,y,的均值 ”,tail,的缺省值为,0,,,alpha,的缺省值为,0.05.,返回值,h,为一个布尔值,,h=1,表示可以拒绝假设,,h=0,表示不可以拒绝假设,,sig,为假设成立的概率,,ci,为与,x,与,y,均值差的的,1-alpha,置信区间,.,04.11.2024,60,数理系 袁国军,3、两总体均值的假设检验使用 t-检验 h,sig,ci,返回:,h = 1,,,sig = 0.0083,,,ci =-5.8,-0.9.,检验结果,:1.,布尔变量,h=1,表示拒绝零假设,.,说明提出的,假设“油价均值相同”是不合理的,.,2. 95%,的置信区间为,-5.8,-0.9,说明一月份油,价比二月份油价约低,1,至,6,分,.,3. sig-,值为,0.0083,远小于,0.5,不能接受“油价均,相同”假设,.,To,MATLAB,(,liti9,),例,9,试检验例,8,中一月份油价,Price1,与二月份的油价,Price2,均值是否相同,.,解,用以下命令检验,h,sig,ci = ttest2(price1,price2),04.11.2024,61,数理系 袁国军,返回:h = 1,sig = 0.0083,ci =-5.,练习,1,04.11.2024,62,数理系 袁国军,练习129.09.202362数理系 袁国军,练习,2,设某产品的生产工艺发生了变化,在改变前后分别测得,若干产品的技术指标:,改变前:,21.6 22.8 22.1 21.2 20.5 21.9 21.4,改变后:,24.1 23.8 24.7 24.0 23.7 24.3 24.5 23.9,设技术指标数服从正态分布,方差未知且在改变前后不变,。工艺改变前后对该指标有无显著性影响(显著性水平为,0.05,);试估计工艺改变后,该技术指标的置信水平为,0.95,的平均值的变化范围。,【,23.8328 24.4172,】,04.11.2024,63,数理系 袁国军,练习229.09.202363数理系 袁国军,4.,单正态总体方差的假设检验,M,文件,function chi21,chi2,chi22=chi2test(x,sigma,alpha),n=length(x);,xbar,S=normfit(x);,chi2=(n-1)*S2/sigma2;,chi21=chi2inv(alpha/2,n-1);,chi22=chi2inv(1-alpha/2,n-1);,fprintf(chi21=%.4f chi2=%.4f,chi22=%.4f,chi21,chi2,chi22);,04.11.2024,64,数理系 袁国军,4.单正态总体方差的假设检验29.09.202364数理系,function h,sig,ci=chi23test(x,sigma,alpha),n=length(x);,xbar,S=normfit(x);,chi20=(n-1)*S2/sigma2;,chi21=chi2inv(alpha/2,n-1);,chi22=chi2inv(1-alpha/2,n-1);,if chi21chi20chi2,或,chi22 chi2,则拒绝原假设,否则,不能拒绝原假设,例 从某一批保险丝中随机抽取,10,根,测试其融化时间,,得如下数据:,42 65 75 78 71 59 57 68 55 54,假设保险丝的融化时间服从正态分布,检验总体方差是,否等于,12,2,。,04.11.2024,66,数理系 袁国军,命令格式:例 从某一批保险丝中随机抽取10根,测试其融化时间,5.,双正态总体方差的假设检验 (,F,检验),M,文件,function F1,F,F2=ftest(x,y,alpha),m=length(x);n=length(y);,xbar,Sx=normfit(x);ybar,Sy=normfit(y);,F=Sx2/Sy2;,F1=finv(alpha/2,m-1,n-1);,F2=finv(1-alpha/2,m-1,n-1);,fprintf(F1=%.4fF=%.4f,F2=%.4f,F1,F,F2);,04.11.2024,67,数理系 袁国军,5.双正态总体方差的假设检验 (F检验)M文件29.09.,function h,sig,ci=ftest2(x,y,alpha),m=length(x);n=length(y);,xbar,Sx=normfit(x);ybar,Sy=normfit(y);,F=Sx2/Sy2;,F1=finv(alpha/2,m-1,n-1);,F2=finv(1-alpha/2,m-1,n-1);,if F1Falpha,时,,h=0,,代表检验的结果接受原假设,即两个,总体不是同分布的。,04.11.2024,75,数理系 袁国军,5.双样本同分布的Wilcoxon秩和检验29.09.202,例,10,一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障,.,故障是完全随机的,并假定生产任一零件时出现故障机会均相同,.,工作人员是通过检查零件来确定工序是否出现故障的,.,现积累有,100,次故障纪录,故障出现时该刀具完成的零件数如下:,459 362 624 542 509 584 433 748 815 505,612 452 434 982 640 742 565 706 593 680,926 653 164 487 734 608 428 1153 593 844,527 552 513 781 474 388 824 538 862 659,775 859 755 49 697 515 628 954 771 609,402 960 885 610 292 837 473 677 358 638,699 634 555 570 84 416 606 1062 484 120,447 654 564 339 280 246 687 539 790 581,621 724 531 512 577 496 468 499 544 645,764 558 378 765 666 763 217 715 310 851,试观察该刀具出现故障时完成的零件数属于哪种分布,.,04.11.2024,76,数理系 袁国军,29.09.202376数理系 袁国军,解,1,、数据输入,To,liti101.m,MATLAB,(,liti101,),2,、作频数直方图,hist(x,10),3,、分布的正态性检验,normplot(x),4,、参数估计:,muhat,sigmahat,muci,sigmaci = normfit(x),(看起来刀具寿命服从正态分布),(刀具寿命近似服从正态分布),估计出该刀具的均值为,594,,方差,204,,均值的,0.95,置信区间为, 553.4962,,,634.5038,,方差的,0.95,置信区间为, 179.2276,,,237.1329.,To,MATLAB,(,liti104,),To,MATLAB,(,liti102,),To,MATLAB,(,liti103,),04.11.2024,77,数理系 袁国军,解 1、数据输入To liti101.mMATLAB(li,2,、作频数直方图,hist(x,10),04.11.2024,78,数理系 袁国军,29.09.202378数理系 袁国军,3,、分布的正态性检验,normplot(x),04.11.2024,79,数理系 袁国军,3、分布的正态性检验29.09.202379数理系 袁国,4,、参数估计:,muhat,sigmahat,muci,sigmaci = normfit(x),muhat=594,sigmahat=204.1301,muci=553.4962,634.5038,(muhat95%,的置信区间,),Sigmaci=179.2276,237.1329,(sigmahat 95%,的置信区间,),04.11.2024,80,数理系 袁国军,4、参数估计:muhat,sigmahat,muci,s,5,、假设检验,To,MATLAB,(,liti105,),已知刀具的寿命服从正态分布,现在方差未知的情况下,检验其均值,m,是否等于,600.,h,sig,ci=ttest(x,600),结果:,h = 0,,,sig = 0.7694,,,ci =553.4962,,,634.5038,.,检验结果,: 1.,布尔变量,h=0,表示不拒绝零假设,.,说,明提出的假设寿命均值,600,是合理的,.,2. 95%,的置信区间为,553.5,,,634.5,它,完全包括,594,且精度很高,.,3. sig-,值为,1,远超过,0.05,不能拒绝零假 设,.,04.11.2024,81,数理系 袁国军,5、假设检验To MATLAB(liti105) 已知刀,1,、,某校,60,名学生的一次考试成绩如下,:,93 75 83 93 91 85 84 82 77 76 77 95 94 89 91 88 86 83 96 81 79 97 78 75 67 69 68 84 83 81 75 66 85 70 94 84 83 82 80 78 74 73 76 70 86 76 90 89 71 66 86 73 80 94 79 78 77 63 53 55,1),计算均值、标准差、极差、偏度、峰度,画出直方图;,2),检验分布的正态性;,3),若检验符合正态分布,估计正态分布的参数并检验参数,.,综 合 练 习,04.11.2024,82,数理系 袁国军,1、某校60名学生的一次考试成绩如下:1)计算均值、标准差、,2,、,据说某地汽油的价格是每加仑,115,美分,为了验证这种说法,一位学者开车随机选择了一些加油站,得到某年一月和二月的数据如下:,一月:,119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118,二月:,118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 125,1,),分别用两个月的数据验证这种说法的可靠性;,2,),分别给出,1,月和,2,月汽油价格的置信区间;,3,)给出,1,月和,2,月汽油价格差的置信区间,.,04.11.2024,83,数理系 袁国军,2、据说某地汽油的价格是每加仑115美分,为了验证这种说法,,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!