参数估计与假设检验课件

上传人:阳*** 文档编号:119777649 上传时间:2022-07-16 格式:PPT 页数:122 大小:1.13MB
返回 下载 相关 举报
参数估计与假设检验课件_第1页
第1页 / 共122页
参数估计与假设检验课件_第2页
第2页 / 共122页
参数估计与假设检验课件_第3页
第3页 / 共122页
点击查看更多>>
资源描述
2022-7-14参数估计与假设检验课件1参数估计与假设检验参数估计与假设检验Parameter Estimation&Hypothesis Testing2022-7-14参数估计与假设检验课件2第五章第五章 参数估计与假设检验参数估计与假设检验 5.1 参数估计参数估计 5.2 假设检验假设检验 5.3 非参数检验非参数检验 2022-7-14参数估计与假设检验课件3什么是参数估计?什么是参数估计?参数是刻画总体某方面概率特性的数量参数是刻画总体某方面概率特性的数量.当此数量未知时当此数量未知时,从总体抽出一个样本,从总体抽出一个样本,用某种方法对这个未知参数进行估计就用某种方法对这个未知参数进行估计就是参数估计是参数估计.例如,例如,X N(,2),点估计点估计区间估计区间估计若若,2未知未知,通过构造样本的函数通过构造样本的函数,给出给出它们的估计值或取值范围就是参数估计它们的估计值或取值范围就是参数估计的内容的内容.2022-7-14参数估计与假设检验课件4参数估计在统计方法中的地位参数估计在统计方法中的地位参数估计参数估计假设检验假设检验v统计方法描述统计描述统计推断统计推断统计2022-7-14参数估计与假设检验课件5参数估计的类型参数估计的类型点估计点估计 估计未知参数的值估计未知参数的值区间估计区间估计 估计未知参数的取值范围,估计未知参数的取值范围,并使此范围包含未知参数并使此范围包含未知参数 真值的概率为给定的值真值的概率为给定的值.2022-7-14参数估计与假设检验课件6点估计的思想方法点估计的思想方法设总体X 的分布函数的形式已知,但含有一个或多个未知参数:1,2,k设 X1,X2,Xn为总体的一个样本构造 k 个统计量:),(),(),(21212211nknnXXXXXXXXX随机变量点估计方法点估计方法2022-7-14参数估计与假设检验课件7当测得样本值(x1,x2,xn)时,代入上述方程组,即可得到 k 个数:),(),(),(21212211nknnxxxxxxxxx数 值称数1,k为未知参数1,k的估计值7-6对应统计量 为未知参数的估计量1,k并建立k个方程。2022-7-14参数估计与假设检验课件8q 频率替换法频率替换法利用事件A 在 n 次试验中发生的频率/An n作为事件A 发生的概率 p 的估计量pnnpA7-7三种常用的点估计方法三种常用的点估计方法2022-7-14参数估计与假设检验课件9 方法方法用样本 k 阶矩作为总体 k 阶矩的估计量,建立含有待估参数的方程,从而解出待估参数7-9一般,不论总体服从什么分布,总体期望 与方差 2 存在,则它们的矩估计量分别为11niiXXn2122)(1nniiSXXnq 矩法矩法 2022-7-14参数估计与假设检验课件107-10事实上,按矩法原理,令niiXnX11)(12122XEXnAniiX)()(222XEXE22 A2211niiXXn212)(1nniiSXXn2022-7-14参数估计与假设检验课件117-11设待估计的参数为k,21设总体的 r 阶矩存在,记为),()(21krrXE样本 X1,X2,Xn 的 r 阶矩为nirirXnB11kr,2,1令),(21krniriXn11 含未知参数 1,2,k 的方程组2022-7-14参数估计与假设检验课件127-12解方程组,得 k 个统计量:11212(,)(,)nknX XXX XX 未知参数 1,k 的矩估计量111212(,)(,)nkknx xxx xx 代入一组样本值得 k 个数:未知参数 1,k 的矩估计值2022-7-14参数估计与假设检验课件13q 极大似然估计法极大似然估计法 思想方法思想方法:一次试验就出现的 事件有较大的概率 例如:有两外形相同的箱子,各装100个球 一箱 99个白球 1 个红球 一箱 1 个白球 99个红球现从两箱中任取一箱,并从箱中任取一球,结果所取得的球是白球.答答:第一箱.7-17问问:所取的球来自哪一箱?2022-7-14参数估计与假设检验课件14一般,设 X 为离散型随机变量,其分布律为,),()(21uuxxfxXP则样本 X1,X2,Xn的概率分布为),(2211nnxXxXxXP),(),(),(21nxfxfxf12,1,2,ixu uin7-21)(),(21LxxxLn记为或称 L()为样本的似然函数2022-7-14参数估计与假设检验课件15),(21nxxxL),(),(),(max21nxfxfxf称这样得到的 ),(21nxxxg为参数 的极大似然估计值极大似然估计值称统计量),(21nXXXg为参数 的极大似然估计量极大似然估计量7-22MLE简记mle简记选择适当的=,使 取最大值,即L()极大似然法的思想2022-7-14参数估计与假设检验课件16若 X 连续,取 f(xi,)为Xi 的密度函数niixfL1),()(似然函数为注注1 1注注2 2 未知参数可以不止一个,如1,k 设X 的密度(或分布)为1(,)kf x则定义似然函数为111(,)(,)nkikiLf x,1,2,ixin1(,)k11(,;,)nkL xx2022-7-14参数估计与假设检验课件17若11(,;,)nkLxx关于1,k可微,则称0),;,(2121knrxxxL为似然方程组kr,2,1若对于某组给定的样本值 x1,x2,xn,参数 使似然函数取得最大值,即k,2111(,;,)nkL xx),;,(max2121),(21knxxxLk则称1,k为1,k 的极大似然估计值2022-7-14参数估计与假设检验课件18显然,),(21nrxxxgkr,2,1称统计量),(21nrXXXgkr,2,1为1,2,k 的极大似然估计量极大似然估计量7-252022-7-14参数估计与假设检验课件19极大似然估计方法极大似然估计方法1)写出似然函数 L2)求出k,21,使得),;,(2121knxxxL),;,(max2121),(21knxxxLk7-282022-7-14参数估计与假设检验课件200),;,(2121knrxxxLkr,2,1可得未知参数的极大似然估计值k,21然后,再求得极大似然估计量.7-29 L是 的可微函数,解似然方程组1,k若若 L不是 的可微函数,需用其它方法求极大似然估计值.1,k若若2022-7-14参数估计与假设检验课件21引例引例 已知 X N(,1),不同样本算得的 的估计值不同,因此除了给出 的点估计外,还希望根据所给的样本确定一个随机区间,使其包含参数真值的概率达到指定的要求.的无偏、有效点估计为X随机变量常数区间估计区间估计2022-7-14参数估计与假设检验课件22如引例中,要找一个区间,使其包含 的真值的概率为0.95.(设 n=5)51,NX1,051NX取05.0查表得96.12/z2022-7-14参数估计与假设检验课件23这说明即称随机区间为未知参数 的置信度为0.95的置信区间.95.05196.15196.1XXP05.096.151XP5196.1,5196.1XX2022-7-14参数估计与假设检验课件24 反复抽取容量为5的样本,都可得一个区间,此区间不一定包含未知参数 的真值,而包含真值的区间占95%.若测得 一组样本值,它可能包含也可能不包含 的真值,反复则得一区间(1.86 0.877,1.86+0.877)抽样得到的区间中有95%包含 的真值.86.1x算得置信区间的意义置信区间的意义2022-7-14参数估计与假设检验课件25)51,51(22zXzX当置信区间为时区间的长度为5122z 达到最短?2/z为何要取2022-7-14参数估计与假设检验课件2697.3)13.2(84.13321zz92.3)96.1(96.1221zz32z31z-2-1120.10.20.30.4取 =0.052z21z-2-1120.10.20.30.42022-7-14参数估计与假设检验课件27设 为待估参数,是一给定的数,(0 50,的置信区间的置信区间2121的置信区间为因此mSnSmn22212221)7(2022-7-14参数估计与假设检验课件42令 Zi=Xi-Yi,i=1,2,n,可以将它们看成来自正态总体 Z N(1 2,12+22)的样本仿单个正态总体公式(2)的置信区间为21niiiZYXYXnS122)()(112221,(4)未知未知,但但 n=m,的置信区间的置信区间21nSntYXZ)1()(2)8(,YXZ2022-7-14参数估计与假设检验课件43取枢轴量(5)方差比方差比2221的置信区间的置信区间(1,2 未知未知)1,1(/2221222122222121mnFSSSSF因此,方差比2221的置信区间为)1,1(1,)1,1(121222122221mnFSSmnFSS)9(2022-7-14参数估计与假设检验课件44取枢轴量),()()()(1)(122211221212212221121mnFYXnmYmXnFmjjniimjjnii(6)方差比方差比2221的置信区间的置信区间(1,2 已知已知)2022-7-14参数估计与假设检验课件45因此,方差比2221 的置信区间为),()()(,),()()(221122121122121mnFYXnmmnFYXnmmjjniimjjnii)10(2022-7-14参数估计与假设检验课件46(三三)单侧置信区间单侧置信区间定义定义 对于给定的 (0 p,pci=mle(bino,X,0.05,20)%求概率的估计值和置信区间,置信度为95%p=0.85利用mle函数进行参数估计pci=0.62107 0.967932022-7-14参数估计与假设检验课件52常用分布的参数估计函数 2022-7-14参数估计与假设检验课件53【例【例5.1.2】我院某年级信息专业数学分析成绩的平均值和我院某年级信息专业数学分析成绩的平均值和标准差计算标准差计算我院学生的数据为我院学生的数据为excel文件:文件:2022-7-14参数估计与假设检验课件54%我院某年级信息专业数学分析成绩的平均值和标准差计算我院某年级信息专业数学分析成绩的平均值和标准差计算C=load(e:dataAA);B=C.A;mu_cul,sigma_cul=normfit(B(:,3)Score_max=max(B(:,3)Score_min=min(B(:,3)mu_cul=77.037sigma_cul=13.902Score_max=100Score_min=36利用上例估计出的均值和标准差,作出利用上例估计出的均值和标准差,作出正态分布的密度图和分布图形。分布函正态分布的密度图和分布图形。分布函数数cdf和密度函数和密度函数pdf的语法分别为:的语法分别为:2022-7-14参数估计与假设检验课件55X=linspace(0,150,100);P=normcdf(X,mu_cul,sigma_cul);p=normpdf(X,mu_cul,sigma_cul);subplot(1,2,1),plot(X,P),title(成绩分布图成绩分布图)subplot(1,2,2),plot(X,p),title(成绩密度图成绩密度图)2022-7-14参数估计与假设检验课件56第五章第五章 参数估计与假设检验参数估计与假设检验 5.1 参数估计参数估计 5.2 假设检验假设检验 5.3 非参数检验非参数检验 2022-7-14参数估计与假设检验课件57若对若对参数参数有所有所了解了解但有怀但有怀疑猜测疑猜测需要证需要证实之时实之时用假设用假设检验的检验的方法来方法来 处理处理若对参数若对参数一无所知一无所知用参数估计用参数估计的方法处理的方法处理假设检验的基本概念假设检验的基本概念2022-7-14参数估计与假设检验课件58 假设检验是指施加于一个或多个假设检验是指施加于一个或多个总体的概率分布或参数的假设总体的概率分布或参数的假设.所作所作假设可以是正确的假设可以是正确的,也可以是错误的也可以是错误的.为判断所作的假设是否正确为判断所作的假设是否正确,从从总体中抽取样本总体中抽取样本,根据样本的取值根据样本的取值,按按一定原则进行检验一定原则进行检验,然后作出接受或然后作出接受或拒绝所作假设的决定拒绝所作假设的决定.何为假设检验何为假设检验?2022-7-14参数估计与假设检验课件59实际统计推断原理:实际统计推断原理:小概率事件实际不可能发生小概率事件实际不可能发生。即事件发生可能性很小时,实际上我们认为不可能发生。例如:即事件发生可能性很小时,实际上我们认为不可能发生。例如:1)设姚明在罚球线投篮进与不进是一随机变量)设姚明在罚球线投篮进与不进是一随机变量X,进的可能性是,进的可能性是95%,不进的可能性是,不进的可能性是5%。则在一次投篮时不进这一事件是一个。则在一次投篮时不进这一事件是一个小概率事件,则我们认为他投篮不会不进。小概率事件,则我们认为他投篮不会不进。2)设每个人上街发生交通事故的可能性为)设每个人上街发生交通事故的可能性为0.01%,这是一个小概,这是一个小概率事件。但实际我们认为不可能发生,周末我们照样逛街购物。率事件。但实际我们认为不可能发生,周末我们照样逛街购物。假设检验的原理假设检验的原理2022-7-14参数估计与假设检验课件60事实上我们并不知道,姚明的命中率。我们是用统计推断的事实上我们并不知道,姚明的命中率。我们是用统计推断的方法来决定的。按以下步骤进行推断:方法来决定的。按以下步骤进行推断:1)H0:进球的概率为:进球的概率为95%2)对)对X进行抽样,即观测投篮结果。进行抽样,即观测投篮结果。3)如果进了接受原假设)如果进了接受原假设H0,进球的概率为,进球的概率为95%。如果没有。如果没有进,按小概率事件实际不可能发生原理,认为不进球不是小进,按小概率事件实际不可能发生原理,认为不进球不是小概率事件。因此推翻原假设。概率事件。因此推翻原假设。对总体对总体X的分布律或分布参数作某种假设,根据抽取的分布律或分布参数作某种假设,根据抽取的样本观察值,运用数理统计的分析方法,检验这种假设的样本观察值,运用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设是否正确,从而决定接受假设或拒绝假设.2022-7-14参数估计与假设检验课件611.参数检验参数检验:如果观测的分布函数类型已知,这时构造出如果观测的分布函数类型已知,这时构造出的的 统计量依赖于总体的分布函数,这种检验称为参数检验统计量依赖于总体的分布函数,这种检验称为参数检验.参数检验的目的往往是对总体的参数及其有关性质作出明参数检验的目的往往是对总体的参数及其有关性质作出明确的判断确的判断.2.非参数检验非参数检验:在很多实际问题中我们得到的样本并不知道其分布特在很多实际问题中我们得到的样本并不知道其分布特性,而是只利用样本本身进行统计推断,这样的参数推断称为非参数统性,而是只利用样本本身进行统计推断,这样的参数推断称为非参数统计推断。计推断。假设检验分类假设检验分类2.分布的拟合优度检验分布的拟合优度检验一组样本:一组样本:我们关心的是它们来自那一种分布,这时首先假定是服从某一分布,然后用我们关心的是它们来自那一种分布,这时首先假定是服从某一分布,然后用样本构造其分布特性,并和假设的理论分布拟合的好坏进行检验,这就是分样本构造其分布特性,并和假设的理论分布拟合的好坏进行检验,这就是分布的拟合优度检验。描述随机变量的分布特性有两种方法,一是随机变量的布的拟合优度检验。描述随机变量的分布特性有两种方法,一是随机变量的分布函数,另一个是随机变量的密度函数,我们可以分别构造不同的统计量分布函数,另一个是随机变量的密度函数,我们可以分别构造不同的统计量进行检验。进行检验。12,nXXX2022-7-14参数估计与假设检验课件62 假设检验步骤(三部曲三部曲)其中)(VVP)()(221VVVV双边检验双边检验)(1VV左边检验左边检验确定拒绝域.q 计算,并作出相应判断.右边检验右边检验)(VV 0Hq 根据实际问题建立 与 .1H0Hq 在 为真时,选择合适统计量 ,V1H由2022-7-14参数估计与假设检验课件63接受域接受域拒绝域拒绝域统计量计算结果统计量计算结果显著性水平显著性水平0.05下下2022-7-14参数估计与假设检验课件64 某厂生产的螺钉某厂生产的螺钉,按标准强度为按标准强度为68/mm68/mm2 2,而实际生产的强度而实际生产的强度X X 服服N N(,3.6,3.62 2).).若若E E(X X)=)=68,=68,则认为这批螺钉符合要求则认为这批螺钉符合要求,否否则认为不符合要求则认为不符合要求.为此提出如下假设为此提出如下假设:H0:=68 称为称为原假设原假设或或零假设零假设 原假设的对立面原假设的对立面:H1:68 称为称为备择假设备择假设【例【例5.2.15.2.1】假设检验假设检验的任务的任务必须在原假设与必须在原假设与备择假设备择假设 之间作一选择之间作一选择2022-7-14参数估计与假设检验课件65若原假设正确若原假设正确,则则)36/6.3,68(2NX因而因而 68)(XE,即即X偏离偏离6868不应该太远不应该太远,故故取较大值是小概率事件取较大值是小概率事件.6/6.368X可以确定一个常数可以确定一个常数c c 使得使得cXP6/6.368因此因此,取取 ,则则05.0 现从整批螺钉中取容量为现从整批螺钉中取容量为3636的样本的样本,其均值为其均值为 ,问原假设是否正确问原假设是否正确?5.68x96.1025.02zzc2022-7-14参数估计与假设检验课件66681.963.6/6X 由由为检验的为检验的接受域接受域(实际上没理由拒绝实际上没理由拒绝),现现5.68x落入接受域落入接受域,则接受原假设则接受原假设824.6618.69XX或即区间即区间(,66.824)与与(69.18,+)为检验的为检验的拒绝域拒绝域称称 的取值区间的取值区间X(66.824,69.18)H H0 0:=682022-7-14参数估计与假设检验课件67在给定在给定 的前提下的前提下,接受还是拒绝原假接受还是拒绝原假设完全取决于样本值设完全取决于样本值,因此所作检验因此所作检验可能导致以下两类错误的产生:可能导致以下两类错误的产生:第一类错误弃真错误第二类错误取伪错误2022-7-14参数估计与假设检验课件68正确正确正确正确 犯第一类错误的概率通常记为犯第一类错误的概率通常记为 犯第二类错误的概率通常记为犯第二类错误的概率通常记为 H0 为真为真H0 为假为假真实情况真实情况所作判断所作判断接受接受 H0拒绝拒绝 H0第一类错误第一类错误(弃真弃真)第二类错误第二类错误(取伪取伪)假设检验的两类错误假设检验的两类错误2022-7-14参数估计与假设检验课件69 任何检验方法都不能完全排除犯错任何检验方法都不能完全排除犯错 假设检验的指导思想是控制犯第一类假设检验的指导思想是控制犯第一类误的可能性误的可能性.理想的检验方法应使犯两类理想的检验方法应使犯两类错误的概率都很小错误的概率都很小,但在样本容量给定的但在样本容量给定的情形下情形下,不可能使两者都很小不可能使两者都很小,降低一个降低一个,往往使另一个增大往往使另一个增大.错误的概率不超过错误的概率不超过,然后然后,若有必要若有必要,通通过增大样本容量的方法来减少过增大样本容量的方法来减少 .2022-7-14参数估计与假设检验课件70P P(拒绝拒绝H H0 0|H H0 0为真为真)若若H H0 0为真为真,则则 2(68,3.6/36)XN所以所以,拒绝拒绝 H H0 0 的概率为的概率为,又称为又称为显显著性水平著性水平,越大越大,犯第一类错误的概犯第一类错误的概率越大率越大,即越显著即越显著.前例前例 中,中,犯第一类错误的概率犯第一类错误的概率0.05 0853.09147.01)37.1()3.5(2022-7-14参数估计与假设检验课件71H H0 0不真不真,即即 68,68,可能小于可能小于68,68,也可能大于也可能大于68,68,的大小取决于的大小取决于 的真值的大小的真值的大小.6.06682.666.06618.69下面计算犯第二类错误的概率 设设 =P P(接受接受H H0 0|H H0 0不真不真)6618.6982.66(66XP266,36,(66,3.6/36)nXN6177.00002.06179.0)63.3()3.0(6.06982.666.06918.69)6918.6982.66(69XP2022-7-14参数估计与假设检验课件72若若26 9,3 6,(6 9,3.6/3 6)n X N取伪的概率较大取伪的概率较大.6062.56567.57072.5750.020.040.060.080.10.122022-7-14参数估计与假设检验课件7367.5 70 72.5 75 77.5 80 82.50.020.040.060.080.10.1296.1025.02 zzc/2/2H0 真真H0 不真不真2022-7-14参数估计与假设检验课件74仍取仍取=0.05,=0.05,则则6 81.9 63.6/8X2(6 6,3.6/6 4)XN由由可以确定拒绝域为可以确定拒绝域为 (,67.118)与与(68.882,+)因此,接受域为因此,接受域为(67.118,68.882)(67.118,68.882)现增大样本容量现增大样本容量,取取n=n=64,64,=66,=66,则则0853.00064.09936.01)49.2()4.6(2022-7-14参数估计与假设检验课件756177.03936.0)6988.6812.67(69XP)1,(045.06612.6745.06688.68)66882.68118.67(66XPNoImage2022-7-14参数估计与假设检验课件76 一般一般,作假设检验时作假设检验时,先控制犯第一先控制犯第一类错误的概率类错误的概率,在此基础上使在此基础上使 尽量尽量地小地小.要降低要降低 一般要增大样本容量一般要增大样本容量.当当H H0 0不真时不真时,参数值越接近真值参数值越接近真值,越大越大.备择假设可以是单侧备择假设可以是单侧,也可以双侧也可以双侧.H0:=68;H1:68注注 1 1 注注 2 2 引例引例2 2中的备择假设是双侧的中的备择假设是双侧的.若根据以若根据以往生产情况往生产情况,0 0=68.=68.现采用了新工艺现采用了新工艺,关关心的是新工艺能否提高螺钉强度心的是新工艺能否提高螺钉强度,越大越大越好越好.此时可作如下的右边假设检验此时可作如下的右边假设检验:2022-7-14参数估计与假设检验课件77关于原假设与备择假设的选取关于原假设与备择假设的选取H H0 0与与H H1 1地位应平等地位应平等,但在控制犯第一类但在控制犯第一类错误的概率错误的概率 的原则下的原则下,使得采取拒使得采取拒绝绝H H0 0 的决策变得较慎重的决策变得较慎重,即即H H0 0 得到特得到特别的保护别的保护.因而因而,通常把有把握的、有经验的结论通常把有把握的、有经验的结论作为原假设作为原假设,或者尽可能使后果严重的或者尽可能使后果严重的错误成为第一类错误错误成为第一类错误.注注 3 3 2022-7-14参数估计与假设检验课件78设取出一容量为 n 的样本,得到均值X和标准差 s,现要对总体均值是否等于某给定值0进行检验.记00:H;01:H称 H0为原原假假设设,H1为备备择择假假设设,两者择其一:接受 H0;拒绝 H0,即接受 H1.单个正态总体均值检验单个正态总体均值检验2022-7-14参数估计与假设检验课件79 用 u检检验验,检验的拒绝域为21uzW 即 2121uzuzW或 用样本方差2s代替总体方差2,这种检验叫 t检检验验.总体方差2已知统计量 z=nX0总体方差2未知统计量tnsX0H0H1在显著水平下拒绝 H0,若0021 uz)1(21ntt001uz)1(1ntt001uz)1(1ntt1、总总体体方方差差2已已知知2总总体体方方差差2未未知知2022-7-14参数估计与假设检验课件80设 X1,X2,Xn是来自正态总体),(2N的样本,欲检验假设:2020:H 2021:H(或 202 或 202)这叫2检检验验.均值已知统计量212202)(1niiX均值未知统计量212202)(1XXniiH0H1在显著水平下拒绝 H0,若202202)(222n或)(2212n)1(222n或)1(2212n202202)(212n)1(212n202202)(22n)1(22n单个正态总体方差检验单个正态总体方差检验2022-7-14参数估计与假设检验课件81构造统计量 222121nnYXz.1、21与与22已已知知时时2、21与与22未未知知但但相相等等时时构造统计量212121222211)2()1()1(nnnnnnsnsnYXt,方差2221,已知统计量 z方差2221,未知但相等统计量tH0H1在显著水平下拒绝 H0,若212121 uz)2(2121nntt21211uz)2(211nntt21211uz)2(211nntt两个正态总体均值检验两个正态总体均值检验2022-7-14参数估计与假设检验课件82设样本 X1,X2,Xn1与 Y1,Y2,Yn2分别来自正态总体),(211N与),(222N,检验假设:22210:H 22211:H(或2221或2221)均值21,已知统计量0F均值21,未知统计量FH0H1在显著水平下拒绝 H0,若22212221),(21210nnFF或),(112210nnFF)1,1(2121nnFF或)1,1(11221nnFF22212221),(2110nnFF)1,1(211nnFF22212221),(11210nnFF)1,1(1121nnFF21122212110)(1)(1niiniiYnXnF,2221ssF(设2221ss)两个正态总体方差检验两个正态总体方差检验2022-7-14参数估计与假设检验课件83 在总体服从正态分布的情况下,可用以下命令进行假设检验在总体服从正态分布的情况下,可用以下命令进行假设检验.1、总体方差总体方差 2已知时,总体均值的检验使用已知时,总体均值的检验使用 z-检验检验h=ztest(x,m,sigma)%x为正态总体的样本,为正态总体的样本,m为均值为均值 0,sigma为标准差,显著性水平为为标准差,显著性水平为0.05(默认值默认值)h=ztest(x,m,sigma,alpha)%显著性水平为显著性水平为alpha h,sig,ci,zval=ztest(x,m,sigma,alpha,tail)%sig为观察值的概率,为观察值的概率,当当sig为小概率时则对原假设提出质疑,为小概率时则对原假设提出质疑,ci为真正均值为真正均值的的1-alpha置信区间,置信区间,zval为统计量的值。为统计量的值。参数假设检验参数假设检验Matlab实现实现说明说明 若若h=0,表示在显著性水平,表示在显著性水平alpha下,不能拒绝原假设;下,不能拒绝原假设;若若h=1,表示在显著性水平,表示在显著性水平alpha下,可以拒绝原假设。下,可以拒绝原假设。原假设:,原假设:,H0:=0=m若若tail=0,表示备择假设:,表示备择假设:H1:0=m(默认,双边检);(默认,双边检);tail=1,表示备择假设:,表示备择假设:H1:0=m(单边检验);(单边检验);tail=-1,表示备择假设:,表示备择假设:H1:V(right-tailed test)v left -x=-1:1:5;y=randn(20,1);h,p,k=kstest2(x,y)h=1 p=0.0444 k=0.5643 说明 h=1表示可以认为向量x与y的分布不相同,相同的概率只有4.4%2022-7-14参数估计与假设检验课件101正态分布的拟合优度测试v 函数函数 jbtest v 格式格式 H=jbtest(X)%对输入向量对输入向量X进行进行Jarque-Bera测试,显测试,显著性水平为著性水平为0.05。v H=jbtest(X,alpha)%在水平在水平alpha而非而非5%下施行下施行 Jarque-Bera 测试,测试,alpha在在0和和1之间。之间。v H,P,JBSTAT,CV=jbtest(X,alpha)%P为接受假设的概率值,为接受假设的概率值,P越接近于越接近于0,则可以拒绝是正态分布的原假设;,则可以拒绝是正态分布的原假设;JBSTAT为测为测试统计量的值,试统计量的值,CV为是否拒绝原假设的临界值。为是否拒绝原假设的临界值。v 说明说明 H为测试结果,若为测试结果,若H=0,则可以认为,则可以认为X是服从正态分布的;是服从正态分布的;若若H=1,则可以否定,则可以否定X服从正态分布。服从正态分布。X为大样本,对于小样为大样本,对于小样本用本用lillietest函数。函数。2022-7-14参数估计与假设检验课件102【例5.3.2】调用调用MATLAB中关于汽车重量的数据,测试中关于汽车重量的数据,测试该数据是否服从正态分布该数据是否服从正态分布 load carsmall h,p,j,cv=jbtest(Weight)说明说明 p=2.67%表示应该拒绝服从正态分布的假设;表示应该拒绝服从正态分布的假设;h=1也可也可否定服从正态分布;统计量的值否定服从正态分布;统计量的值j=7.2448大于接受假设的临大于接受假设的临界值界值cv=5.9915,因而拒绝假设,因而拒绝假设(测试水平为测试水平为5%)。h=1 p=0.0267 j=7.2448 cv=5.9915 2022-7-14参数估计与假设检验课件103正态分布的拟合优度测试正态分布的拟合优度测试lillietest v格式格式 H=lillietest(X)%对输入向量对输入向量X进行进行Lilliefors测试,显著性水平为测试,显著性水平为0.05。vH=lillietest(X,alpha)%在水平在水平alpha而非而非5%下施行下施行Lilliefors测试,测试,alpha在在0.01和和0.2之间。之间。vH,P,LSTAT,CV=lillietest(X,alpha)%P为接受假为接受假设的概率值,设的概率值,P越接近于越接近于0,则可以拒绝是正态分布,则可以拒绝是正态分布的原假设;的原假设;LSTAT为测试统计量的值,为测试统计量的值,CV为是否为是否拒绝原假设的临界值。拒绝原假设的临界值。v说明说明 H为测试结果,若为测试结果,若H=0,则可以认为,则可以认为X是服从是服从正态分布的;若正态分布的;若H=1,则可以否定,则可以否定X服从正态分布。服从正态分布。2022-7-14参数估计与假设检验课件104【例5.3.4】Y=chi2rnd(10,100,1);h,p,l,cv=lillietest(Y)h=1 p=0.0175 l=0.1062 cv=0.0886说明说明 h=1表示拒绝正态分布的假设;表示拒绝正态分布的假设;p=0.0175表示服从正态分表示服从正态分布的概率很小;统计量的值布的概率很小;统计量的值l=0.1062大于接受假设的临界值大于接受假设的临界值cv=0.0886,因而拒绝假设,因而拒绝假设(测试水平为测试水平为5%)。hist(Y)从图中看出,数据Y不服从正态分布。0510152025051015202530Probability Greater than Lower Bound is 0.88493DensityCritical Value2022-7-14参数估计与假设检验课件105)1(2n统计量检验随机数的密度函数拟合优度检验统计量检验随机数的密度函数拟合优度检验 将样本将样本 定义域分为定义域分为k个相等的区间,记个相等的区间,记i区间的区间的观测频数为观测频数为ni(i=1,,k),若随机变量),若随机变量X落于第落于第i区间的概率为区间的概率为Pi,则得理论频数,则得理论频数mi=N Pi,由,由ni,mi构造统计量。构造统计量。nXXX,2112kkiiiimnm12)(=渐近服从自由度为渐近服从自由度为k-1的卡方分布,简记为的卡方分布,简记为 。一般。一般要求样本数要求样本数N30。12k2022-7-14参数估计与假设检验课件106【例例5.3.5】抽标准正态分布机数】抽标准正态分布机数200个,对密度函数进行个,对密度函数进行统计推断统计推断X=normrnd(0,1,200,1)%抽抽200个正态分布随机数个正态分布随机数histfit(X,8);%作示意图作示意图%构造卡方统计量构造卡方统计量k=8;kk=linspace(-3,3,k+1);%对区间分成对区间分成8个等区间个等区间P=normcdf(kk,0,1);%计算每个区间的概率计算每个区间的概率n=(P(2:k+1)-P(1:k)*200%计算每个区间的理论频计算每个区间的理论频数数m=hist(X,k)%计算每个区间的观测频数计算每个区间的观测频数kf_7=sum(n-m).2)./m)%计算卡方统计量计算卡方统计量%进行统计推断进行统计推断chi2_p=chi2cdf(kf_8,k-1)%计算下侧概率计算下侧概率2022-7-14参数估计与假设检验课件107if chi2_p0.95chi2_str=接受接受;else chi2_str=拒绝拒绝;endchi2_str结果为接受原假设结果为接受原假设2022-7-14参数估计与假设检验课件108我们计算出的理论频率与样本频率见表我们计算出的理论频率与样本频率见表5-3-1表表5-3-1 理论频率与样本频率计算结果理论频率与样本频率计算结果自由度为自由度为7的卡方统计量结果为:的卡方统计量结果为:kf_7=9.8806最后的检验结果为接受原假设,样本来自标准正态密度函数。最后的检验结果为接受原假设,样本来自标准正态密度函数。2022-7-14参数估计与假设检验课件109【例【例5.3.6】一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障.故障是完全随机的,并假定生产任一零件时出现故障机会均相同.工作人员是通过检查零件来确定工序是否出现故障的.现积累有100次故障纪录,故障出现时该刀具完成的零件数如下:459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851试观察该刀具出现故障时完成的零件数属于哪种分布.2022-7-14参数估计与假设检验课件110解解 1、数据输入保存在文件daex3_4_12.txt2、作频数直方图 hist(x,10)(看起来刀具寿命服从正态分布)02004006008001000120005101520252022-7-14参数估计与假设检验课件111 3、作正态概率图 normplot(x)(刀具寿命近似服从正态分布)1002003004005006007008009001000 11000.0030.01 0.02 0.05 0.10 0.25 0.50 0.75 0.90 0.95 0.98 0.99 0.997DataProbabilityNormal Probability Plot2022-7-14参数估计与假设检验课件112JB正态分布检验正态分布检验h,p,j,cv=jbtest(X)h=0p=0.69129j=0.7384cv=5.99152022-7-14参数估计与假设检验课件1134、参数估计:muhat,sigmahat,muci,sigmaci=normfit(x)muhat=594sigmahat=204.13muci=553.5 634.5sigmaci=179.23 237.132022-7-14参数估计与假设检验课件1145、假设检验 已知刀具的寿命服从正态分布,现在方差未知的情况下,检验其均值 m 是否等于594.结果:h=0,sig=1,ci=553.4962,634.5038.检验结果:1.布尔变量h=0,表示不拒绝零假设.说 明提出的假设寿命均值594是合理的.2.95%的置信区间为553.5,634.5,它 完全包括594,且精度很高.3.sig-值为1,远超过0.5,不能拒绝零假 设.2022-7-14参数估计与假设检验课件115非参数统计推断 在参数统计推断中,我们是在知道样本服从某分布的前提下进在参数统计推断中,我们是在知道样本服从某分布的前提下进行的,例如在知道总体为正态分布的情况下,构造行的,例如在知道总体为正态分布的情况下,构造T统计量具有良统计量具有良好的估计性质。高但在很多实际问题中我们得到的样本并不知道其好的估计性质。高但在很多实际问题中我们得到的样本并不知道其分布特性,而是只利用样本本身进行统计推断,这样的参数推断称分布特性,而是只利用样本本身进行统计推断,这样的参数推断称为非参数统计推断。由于非参数统计推断不需要预先知道样本的分为非参数统计推断。由于非参数统计推断不需要预先知道样本的分布,虽不能达到最优的统计性质,方法却具有简单、稳定的特点,布,虽不能达到最优的统计性质,方法却具有简单、稳定的特点,因此广泛使用于生物、化学、医学和社会科学各领域。因此广泛使用于生物、化学、医学和社会科学各领域。MATLAB提提供的非参数检验命令见下表供的非参数检验命令见下表2022-7-14参数估计与假设检验课件116两种处理方法好坏比较的两种处理方法好坏比较的Wilcoxon秩和检验秩和检验秩的定义为:设有两种样本,秩的定义为:设有两种样本,1,21nxxx2,21nyyy将它们放在一起进行排序,得由小到大的顺序序列:将它们放在一起进行排序,得由小到大的顺序序列:(5.3.1)如果如果xi位于数据(位于数据(5.4.1)的第五个位置,则称它的秩为)的第五个位置,则称它的秩为5,这样数,这样数据,中的每一个元素都对应一个秩。据,中的每一个元素都对应一个秩。秩和的定义为:将第一组数据的每个元素的秩相加得秩和的定义为:将第一组数据的每个元素的秩相加得R1,将第二组,将第二组数据每个元素的秩相加得数据每个元素的秩相加得R2,R1和和R2就分别是各组的秩和,显然就分别是各组的秩和,显然它们是统计量。如果两组数据来自一个总体,那么我们计算出的秩它们是统计量。如果两组数据来自一个总体,那么我们计算出的秩和统计量和就不应该相差太大。我们可以构造统计量和统计量和就不应该相差太大。我们可以构造统计量T。21,21nnzzz212121210),min(),min(n ,0nnRRnnnnRTn2022-7-14参数估计与假设检验课件117T 与平均秩和应相差不大,在大样本的情况下根据中心极限定理可与平均秩和应相差不大,在大样本的情况下根据中心极限定理可以构造标准正态分布统计量。以构造标准正态分布统计量。0121212/2/12TnnnUn nnn Wilcoxon秩和检验秩和检验H0:设两独立样本来自等中位数的分布。:设两独立样本来自等中位数的分布。H1:中位数不同。:中位数不同。根据上面计算出的统计量就可以进行统计推断了。根据上面计算出的统计量就可以进行统计推断了。2022-7-14参数估计与假设检验课件118【例【例5.3.7】某运动队引进新的训练方法,从队中抽一批队员用新】某运动队引进新的训练方法,从队中抽一批队员用新方法训练,留一批使用老方法。一个月后进行测试,问两方法训练方法训练,留一批使用老方法。一个月后进行测试,问两方法训练结果有无明显区别,见表结果有无明显区别,见表%例例5.3.7 两组运动成绩样本的两组运动成绩样本的wilcoxon 检验检验X=41 38 35 45 32;Y=56 49 60 43 39 58;p,h=ranksum(X,Y)计算结果为:计算结果为:p=0.0303h=1拒绝原假设,即新方法与老方法训练出的结果有明显的差别的。拒绝原假设,即新方法与老方法训练出的结果有明显的差别的。2022-7-14参数估计与假设检验课件119(2)Wilcoxon符号秩和检验符号秩和检验signrank 设样本设样本X,Y个数相同,个数相同,C=X-Y,则,则C中的元素或为正或为负。中的元素或为正或为负。对对C的绝对值进行排序得顺序序列,再按正负号进行分组并分别计的绝对值进行排序得顺序序列,再按正负号进行分组并分别计算两组的秩和,按上面的方法构造统计量,然后进行检验。例如训算两组的秩和,按上面的方法构造统计量,然后进行检验。例如训练方法的另一组数据,某跳水队前后两种方法测试的数据。见表练方法的另一组数据,某跳水队前后两种方法测试的数据。见表 其中秩栏加负号表示第二组,正表示第一组。秩和其中秩栏加负号表示第二组,正表示第一组。秩和R1=3,R2=33,统计量统计量T=32022-7-14参数估计与假设检验课件120【例【例5.3.8】对跳水队的数据,编程计算。】对跳水队的数据,编程计算。%例例5.6.7 跳水数据的跳水数据的wilcoxon 符号检验符号检验X=26 24 28 30 35 24 27 21;Y=30 34 36 28 40 35 33 20;p h=signrank(X,Y)计算结果计算结果p=0.0391h=1否定原假设,新老方法训练结果有明显的区别。否定原假设,新老方法训练结果有明显的区别。2022-7-14参数估计与假设检验课件121(3)多种处理方法好坏比较的)多种处理方法好坏比较的kruskal-wallis秩和检验秩和检验 对于多组资料比较,如果不满足方差分析的条件,即每组均来对于多组资料比较,如果不满足方差分析的条件,即每组均来自正态分布总体,我们可以构造自正态分布总体,我们可以构造F统计量进行统计推断,放松这一统计量进行统计推断,放松这一条件,可采用条件,可采用Kruskal-Wallis秩和检验。此法的基本思想与秩和检验。此法的基本思想与Wilcoxon-Mann-Whitney法相近:如果各组处理效应相同,混法相近:如果各组处理效应相同,混合编秩号后,各组的秩和应近似相等。合编秩号后,各组的秩和应近似相等。【例【例5.3.9】利用三种不同的合金材料制造出型材,并对型材进行】利用三种不同的合金材料制造出型材,并对型材进行破坏性拉力实验。破坏性拉力实验。2022-7-14参数估计与假设检验课件122%例例5.3.10 三组不同材料的型材强度样本的三组不同材料的型材强度样本的kruskal-wallis检验检验strength=82 86 79 83 84 85 86 87 74 82 78 75 76 77 79.79 77 78 82 79;%alloy=st,st,st,st,st,st,st,st,.al1,al1,al1,al1,al1,al1,.al2,al2,al2,al2,al2,al2;p=kruskalwallis(strength,alloy,off)计算结果为计算结果为p=0.0018统计量落入了拒绝域,即不同材料的型材强度具有明显的区别。统计量落入了拒绝域,即不同材料的型材强度具有明显的区别。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!