数理统计与随机过程ch7

上传人:无*** 文档编号:190269298 上传时间:2023-02-27 格式:PPT 页数:104 大小:1.71MB
返回 下载 相关 举报
数理统计与随机过程ch7_第1页
第1页 / 共104页
数理统计与随机过程ch7_第2页
第2页 / 共104页
数理统计与随机过程ch7_第3页
第3页 / 共104页
点击查看更多>>
资源描述
数理统计与随机过程数理统计与随机过程第第七七章章主讲教师:李学京主讲教师:李学京北京工业大学应用数理学院北京工业大学应用数理学院第七章第七章:参数估计参数估计数理统计的任务:数理统计的任务:总体分布类型的判断;总体分布类型的判断;总体分布中未知参数的推断总体分布中未知参数的推断(参数估计参数估计与与 假设检验假设检验)。参数估计问题的一般提法参数估计问题的一般提法 设总体设总体 X 的分布函数为的分布函数为 F(x,),其中其中为为未知参数或参数向量,现从该总体中抽样未知参数或参数向量,现从该总体中抽样,得得到样本到样本X1,X2,Xn.依样本对参数依样本对参数做出估计,做出估计,或估计参数或估计参数的的某个已知函数某个已知函数 g()。这类问题称为参数估计。这类问题称为参数估计。参数估计包括:参数估计包括:点估计点估计和和区间估计区间估计。称该计算称该计算值为值为 的一个点估计。的一个点估计。为估计参数为估计参数,需要构造适当的统计量,需要构造适当的统计量 T(X1,X2,Xn),一旦当有了样本,就将样本值代入到该统计一旦当有了样本,就将样本值代入到该统计量中,算出一个值作为量中,算出一个值作为 的估计,的估计,寻求估计量的方法寻求估计量的方法1.矩估计法矩估计法2.极大似然法极大似然法3.最小二乘法最小二乘法4.贝叶斯方法贝叶斯方法 我们仅介绍前面的两种参数估计法我们仅介绍前面的两种参数估计法。其思想是其思想是:用同阶、同类用同阶、同类的样本矩来估计总体矩。的样本矩来估计总体矩。矩估计是基于矩估计是基于“替换替换”思想建立起来的思想建立起来的一种参数估计方法一种参数估计方法。最早由英国统计学家最早由英国统计学家 K.皮尔逊皮尔逊 提出。提出。7.1 矩估计矩估计矩估计就是用相应的样本矩去估计总体矩。矩估计就是用相应的样本矩去估计总体矩。),(kkXEak阶阶原原点点矩矩总总体体,1 1nikikXnAk 阶阶原原点点距距样样本本,kkEXXEbk)(阶阶中中心心矩矩总总体体,1 1kniikXXnBk)(阶阶中中心心距距样样本本设总体设总体 X 的分布函数中含的分布函数中含 k 个未知参数个未知参数.,21k步骤一:步骤一:记总体记总体 X 的的 m 阶原点矩阶原点矩 E(Xm)为为 am ,m =1,2,1,2,k.am(1,2,k),m=1,2,k.一般地一般地,am(m=1,2,K)是总体分布是总体分布中参数或参数向量中参数或参数向量(1,2,k)的函数。的函数。故故,am(m=1,2,k)应记成应记成:步骤二:步骤二:算出样本的算出样本的 m 阶原点矩阶原点矩.,2,1 ,11kmXnAnimim步骤三:步骤三:令令 得到得到关于关于 1 1,2 2,k k 的方程组的方程组(L Lk)。一般要求方程组一般要求方程组(1)(1)中有中有 k 个独立方程。个独立方程。(1).),(,),(,),(2122121211LkLkkAaAaAa步骤四:步骤四:解方程组解方程组(1),(1),并记其解为并记其解为.,2,1),(21kmXXXnmm,),(),(2121的的矩矩估估计计。就就是是则则kk 这种参数估计法称为参数的矩估计法,这种参数估计法称为参数的矩估计法,简称矩法。简称矩法。解:解:先求总体的期望先求总体的期望xxxXE d )1()(10.21 d )1(101xx例例1 1:设总体设总体 X 的概率密度为的概率密度为.,0,10 ,)1()(其他其他xxxf的的矩矩估估计计。求求为为未未知知参参数数。其其中中 1 由矩法,令由矩法,令21 X样本矩样本矩总体矩总体矩解得解得XX112为为 的矩估计。的矩估计。注意:要在参数上边加上注意:要在参数上边加上“”,表示参数的估计。它是统计量。表示参数的估计。它是统计量。解解:先求总体的均值和先求总体的均值和 2 阶原点矩。阶原点矩。例例2:设设 X1,X2,Xn 是取自总体是取自总体 X 的简单样本的简单样本,X 有概率密度函数有概率密度函数的的矩矩估估计计。求求。为为未未知知参参数数,其其中中其其他他 ,0 ,.,0 ,1)()(xexfxxexXEx d 1)()(yeyy d )(0.xexXEx d 1)()(22,)(22 d )2(d )(2222022202yeyyyeyyy 用样本矩用样本矩估计总体矩估计总体矩的的矩矩估估计计。为为参参数数,niiXnX1222.1)(,令令得.)(1,)(111212122niiniiniiXXnXXXnXnXn列出方程组列出方程组:.)(),(,)(),(2222221XEaXEa.1),(,),(122221niiXnaXaniiXnX1222.1,即即例例3:设总体设总体X的均值为的均值为,方差为,方差为 2,求求 和和 2 的的矩估计。矩估计。解:解:由由 故,均值,方差2的矩估计为.)(1,212XXnXniiniiXXnX122 )1,(.12Snn即求解,得求解,得如:如:正态总体正态总体N(,2)中中 和和 2 2的矩估计为的矩估计为.)1,122niiXXnX(又如:又如:若总体若总体 X U(a,b),求,求a,b的矩估计。的矩估计。解:解:列出方程组列出方程组 .)(,)(2XDXEniiXXnX122.)1,(其中因因 .12)()(,2)(2abXDbaXE解上述方程组,得到解上述方程组,得到 a,b 的矩估计的矩估计:.12)(,2 22abXba得.3,3XbXa.)112niiXXn(其中 矩估计的矩估计的优点是:优点是:简单易行简单易行,不需要事不需要事先知道总体是什么分布。先知道总体是什么分布。缺点是:缺点是:当总体的分布类型已知时,未当总体的分布类型已知时,未充分利用分布所提供的信息充分利用分布所提供的信息;此外,一般情此外,一般情形下,矩估计不具有唯一性形下,矩估计不具有唯一性 。7.2 极大似然估计极大似然估计 极大似然估计法是在总体的分布类型已极大似然估计法是在总体的分布类型已知前提下,使用的一种参数估计法知前提下,使用的一种参数估计法。该方法首先由德国数学家该方法首先由德国数学家高斯高斯于于 1821年年提出,其后英国统计学家提出,其后英国统计学家费歇费歇于于 1922年发现年发现了这一方法,研究了方法的一些性质,并给了这一方法,研究了方法的一些性质,并给出了求参数极大似然估计一般方法出了求参数极大似然估计一般方法极大极大似然估计原理似然估计原理。I.极大似然估计原理极大似然估计原理 设总体设总体 X 的分布的分布(连续型时为概率密度,连续型时为概率密度,离散型时为概率分布离散型时为概率分布)为为 f(x,),X1,X2,Xn 是抽自总体是抽自总体 X 的简单样本。于是,样本的联合的简单样本。于是,样本的联合概率函数概率函数(连续型时为联合概率密度,离散型连续型时为联合概率密度,离散型时为联合概率分布时为联合概率分布)为为.),(),(121niinxfxxxL 被看作固定,被看作固定,但未知的参数但未知的参数视为变量视为变量将上式简记为将上式简记为 L(),即,即称称 L()为为的似然函数。的似然函数。),(),(121niinxfxxxL视为变量视为变量视为固定值视为固定值,),()(1niixfL).(max)(LL 假定我们观测到一组样本假定我们观测到一组样本X1,X2,Xn,要去估计未知参数要去估计未知参数。称称 为为的极大似然估计的极大似然估计(MLE)。一种直观的想法是:哪个参数一种直观的想法是:哪个参数(多个参数多个参数时是哪组参数时是哪组参数)使得这组样本出现的可能性使得这组样本出现的可能性(概率概率)最大,就用那个参数最大,就用那个参数(或哪组参数或哪组参数)作作为参数的估计。为参数的估计。这就是极大似然估计原理。这就是极大似然估计原理。即,如果即,如果可能变化空间可能变化空间,称为参数空间。称为参数空间。(4).在最大值点的表达式中,代入样本值,在最大值点的表达式中,代入样本值,就得参数就得参数的极大似然估计。的极大似然估计。II.求极大似然估计求极大似然估计(MLE)的一般步骤的一般步骤(1).由总体分布导出样本的联合概率函数由总体分布导出样本的联合概率函数(连连 续型时为联合概率密度续型时为联合概率密度,离散型时为联合离散型时为联合 概率分布概率分布);(2).把样本的联合概率函数中的自变量看成把样本的联合概率函数中的自变量看成 已知常数已知常数,参数参数看成自变量看成自变量,得到似然得到似然 函数函数 L();(3).求似然函数求似然函数 L()的最大值点的最大值点(常常转化常常转化 为求为求ln L()的最大值点的最大值点),即,即的的MLE;两点说明:两点说明:,0)(lndLd 求似然函数求似然函数 L()的最大值点,可应用微积的最大值点,可应用微积分中的技巧。由于分中的技巧。由于 ln(x)是是 x 的增函数,所的增函数,所以以 ln L()与与 L()在在的同一点处达到各自的的同一点处达到各自的最大值。假定最大值。假定是一实数是一实数,ln L()是是的一个的一个可微函数。通过求解似然方程可微函数。通过求解似然方程可以得到可以得到的的MLE。用上述方法求参数的极大似然估计有时行用上述方法求参数的极大似然估计有时行不通,这时要用极大似然原理来求不通,这时要用极大似然原理来求。若若是向量,上述似然方程需用似然方程组是向量,上述似然方程需用似然方程组0),(ln,0),(ln,0),(ln21221121kkkkLLL代替代替。III.下面举例说明如何求参数的下面举例说明如何求参数的MLE例例1:设设X1,X2,Xn是取自总体是取自总体 XB(1,p)的的一个样本,求参数一个样本,求参数 p 的极大似然估计。的极大似然估计。nixxiipp11)1(解:解:似然函数为似然函数为,)1(11niiniixnxppniipxfpL1),()(),1ln()()ln()(ln11pxnpxpLniinii对数似然函数为:对数似然函数为:对对 p 求导,并令其等于零,得求导,并令其等于零,得.0)(111)(ln11niiniixnpxpdppLd xn上式等价上式等价于于.11pxpx解上述方程,得解上述方程,得.11pxpx.xp 换成换成 X换成换成p 的的极极大大似似然然估估计计。为为得得 pXp 例例2 2:求正态总体求正态总体 N(,2)参数参数 和和 2 2 的极大的极大似然估计似然估计(注注:我们把我们把 2 2 看作一个参数看作一个参数)。解:解:似然函数为似然函数为,)2(21),(12222)(212212)(2niiixnnixeeL,)(21ln2)2ln(2),(ln12222niixnnL对数似然函数对数似然函数为为 似然方程组为似然方程组为由第一个方程,得到由第一个方程,得到.0)(212),(ln,0)(1),(ln124222122niiniixnLxL;11xxnnii代入第二方程,得到代入第二方程,得到.)(1122niixxn 是是L L(,2 2)的的最最大值点,大值点,即即 和和 2 2 的极大似然估计。的极大似然估计。,)2(),(122)(2122niixneL由由.0),(lim ,0),(lim ,0),(lim 202222LLL知知及及微微积积分分知知识识,niiXXnX122)(1 ,从从而而 下面验证:下面验证:似然方程组的唯一解似然方程组的唯一解是似然是似然函数的最大值点。函数的最大值点。例例3:设总体设总体 X 服从泊松分布服从泊松分布 P(),求参数,求参数 的极大似然估计。的极大似然估计。,2 ,1 ,0 ,!),(xexxfx !),()(11niixniiexxfLi解:解:由由 X 的概率分布函数为的概率分布函数为得得 的似然函的似然函数数,!11niixnxenii.11xxnnii.01)(ln1niixnLdd似然方程为似然方程为对数似然函数对数似然函数为为niiniixxnL11),!ln()(ln)(ln其解为其解为,01)(ln 1222niixL因因又又是是最最大大值值点点。它它,的的唯唯一一极极大大值值点点。所所以以是是知知 )(ln Lx换成换成 X换成换成.11xxnnii得得 的极大似然估计的极大似然估计.X例例 4:设设 X U(a,b),求,求 a,b 的极大似然估计。的极大似然估计。解:解:因因,0 ,1),(baxbaxabbaxf.,0 ,2 ,1 ,)(1 ),(),(1其其他他nibaxabbaxfbaLinnii所以所以.0,maxmin,)(1 ,0 ,2 ,1 ,)(1),(11其其他他其其他他bxxaabnibaxabbaLiniininin.0,maxmin,)(1),(11其其他他bxxaabbaLiniinin 由上式看到:由上式看到:L L(a,b)作为作为a和和b的二元函数的二元函数是不连续的,是不连续的,所以所以我们不能用似然方程组来求我们不能用似然方程组来求极大似然估计,而必须从极大似然估计的定义极大似然估计,而必须从极大似然估计的定义出发,求出发,求L(a,b)的最大值。的最大值。为使为使 L(a,b)达到最大,达到最大,b-a 应该尽量地小。应该尽量地小。但但 b不能小于不能小于 max x1 1,x2 2,xn n。否则,。否则,L(a,b)=0 0。类似地,。类似地,a 不能大于不能大于min x1 1,x2 2,xn n。因此,因此,a 和和 b b 的极大似然估计为的极大似然估计为.max ,min11iniinixb xa解:解:似然函数为似然函数为.,0 n,2,1,i ),1 ,0(,)(11其其他他iniixxL例例5:设设 X1,X2,Xn 是抽自总体是抽自总体 X 的一个样的一个样本,本,X 有如下概率密度函数有如下概率密度函数.,0,10 ,),(1其其他他xxxf其中其中 0为未知常数。为未知常数。求求的极大似然估计。的极大似然估计。也可写成也可写成,ln)1(ln)(ln1niixnL.,0 1,maxmin0,)(1111其其他他iniininiinxxxL对对数数似似然然函函数数为为时时,当当 1maxmin0 11iniinixx求导并令其导数等于零,得求导并令其导数等于零,得.0ln)(ln1niixndLd解上述方程,得解上述方程,得.ln1niixn的的极极大大似似然然估估计计。为为所所以以,ln1niiXn 从前面两节的讨论中可以看到从前面两节的讨论中可以看到:同一参数可以有几种不同的估计,这时就需同一参数可以有几种不同的估计,这时就需 要判断采用哪一种估计为好的问题。要判断采用哪一种估计为好的问题。另一方面,对于同一个参数,用矩法和极大另一方面,对于同一个参数,用矩法和极大 似然法即使得到的是同一个估计似然法即使得到的是同一个估计,也存在衡也存在衡 量这个估计优劣的问题。量这个估计优劣的问题。估计量的优良性准则就是:估计量的优良性准则就是:评价一个估计评价一个估计量量“好好”与与“坏坏”的标准。的标准。7.3 估计量的优良性准则估计量的优良性准则 设总体的分布参数为设总体的分布参数为,对一切可能的对一切可能的成立成立,则称则称 为为 的无偏估计。的无偏估计。7.3.1 无偏性无偏性 对于样本对于样本 X1 1,X2 2,Xn n的的不同取值,不同取值,取不同的值取不同的值 )。),(21nXXX 如果如果 的的均均值等于值等于,即,即,),(21nXXXE 简记为简记为 是是 的一个估计的一个估计(注意注意!它是一个统它是一个统计量,是随机变量。计量,是随机变量。参数参数,有时可能估计偏高,有时可能偏低,有时可能估计偏高,有时可能偏低,但是平均来说它等于但是平均来说它等于。“一切可能的一切可能的 ”是指:在参数估计问题是指:在参数估计问题中,参数中,参数 一切可能的取值。一切可能的取值。我们之所以要求对一切可能的我们之所以要求对一切可能的 都成立,都成立,是因为在参数估计问题中是因为在参数估计问题中,我们并不知道参数我们并不知道参数 的真实取值。自然要求它在参数的真实取值。自然要求它在参数 的一切可的一切可能取值的范围内都成立能取值的范围内都成立说明:说明:无偏性的意义是:用估计量无偏性的意义是:用估计量 估计估计 .),(21nXXXE例例1:设设 X1,X2,Xn 为抽自均值为为抽自均值为 的总体的总体X的随机样本,考虑的随机样本,考虑 的如下几个估计量:的如下几个估计量:例如:例如:若若 指的指的是正态总体是正态总体N(,2)的均值的均值,则其一切可能取值范围是则其一切可能取值范围是(-(-,)。若。若 指的指的是方差是方差 2 2,则其一切可能取值范围是,则其一切可能取值范围是(0,(0,)。的的无无偏偏估估计计。是是所所以以,因因 ,)()(11111XEEX的的无无偏偏估估计计。是是所所以以因因 ,)(2 22212EXX的的无无偏偏估估计计。是是)4(41213nXXXXnn是是有有偏偏估估计计。214X是有偏估计。是有偏估计。3215XX 定理定理1:设总体设总体 X 的均值为的均值为,方差为方差为 2 2,X1 1,X2 2,Xn n 为来自总体为来自总体 X 的随机样本,记的随机样本,记 与与 分别为样本均值与样本方差,即分别为样本均值与样本方差,即 即即样本均值和样本方差分别是样本均值和样本方差分别是 总体均值总体均值 和总体方差和总体方差 的无偏估计的无偏估计。.)(11 ,12121XXnSXnXniinii.)(,)(22SEXE则则X2S证明:证明:因为因为 X1,X2,Xn 独立同分布,且独立同分布,且E(Xi)=,所以所以;nnXEnXnEXEniinii1)(11)(11另一方面,另一方面,因因,)(2)(212211221XnXXnXXXXXniininiiinii,)()()(,)()()(22222222iiiXEXDXEnXEXDXE于是,有于是,有.)(11 )()(11)(222222122nnnnXnEXEnSEnii注意到注意到的无偏估计。也未必是无偏估计,的是是:即使的估计。但必须注意的作为用的一个估计,我们通常是参数如果)()()()(gggg 前面两节中,我们曾用矩法和极大似然法前面两节中,我们曾用矩法和极大似然法分别求得了正态总体分别求得了正态总体 N(,2)中参数中参数 2 的估计的估计,均为均为.)(1212XXnnii很显然,它不是很显然,它不是 2 的无偏估计。这正是我们为的无偏估计。这正是我们为什么要将其分母修正为什么要将其分母修正为 n-1,获得样本方差,获得样本方差 S2来估计来估计 2 的理由。的理由。例例2:求证:样本标准差求证:样本标准差 S 不是总体标准差不是总体标准差 的无偏估计。的无偏估计。证明:证明:因因 E(E(S2 2)=)=2 2,所以,所以,D(D(S)+E(S)+E(S)2 2=2 2,由由 D(D(S)0 0,知,知 E(E(S)2 2=2 2-D(-D(S S)2 2.所以,所以,E(E(S S).故,故,S S 不是不是 的无偏估计。的无偏估计。例例3:设总体设总体 X的的 k阶原点距为阶原点距为 ak=E(Xk),X1,X2,Xn是是X 的随机样本,样本的随机样本,样本 k 阶原点距为阶原点距为Ak,则则Ak是是 ak的无偏估计,的无偏估计,k=1,2,。证明:证明:因因X1,X2,Xn独立,且与独立,且与 X 同分布同分布,故,故.,2,1,1)(11)(11kananXEnXnEAEkknikinikik 即,即,Ak是是 ak的无偏估计。的无偏估计。这就是人们为什么常用样本这就是人们为什么常用样本 k 阶矩估计总阶矩估计总体体 k 阶矩的主要原因之一。阶矩的主要原因之一。例例4:设总体设总体 X 服从参数为服从参数为 的指数分布的指数分布,即其,即其概率密度函数为概率密度函数为 证明:证明:设设Z的分布函数为的分布函数为 FZ(z,),先求分布函,先求分布函数,然后导出数,然后导出 Z 的概率密度函数及的概率密度函数及 E(nZ)。.0,0,0,),(/1xxexfx 若若 X1,X2,Xn 是是 X 的随机样本的随机样本,记,记),min(21nXXXZ则则 nZ 为为 的无偏估计。的无偏估计。因因X1,X2,Xn独立,且与独立,且与 X 同分布同分布,所以,对,所以,对任意给定的任意给定的 Z0,有有.1)(11,1),min(11),(/212121nznznnnZeezXPzXPzXPzXzXzXPzXXXPzZPzZPzF 于是于是,E(Z)=/n,E(nZ)=,即即 nZ 为为 的无偏估计。的无偏估计。.0,0,0,)/(),()/(zzenzfznZ 用估计量用估计量 估计估计,估计误差估计误差7.3.2 均方误差准则均方误差准则),(21nXXX 是随机变量,通常用其均值是随机变量,通常用其均值衡量估计误差的大小。衡量估计误差的大小。要注意要注意:为了防止求均值时正、负误差相为了防止求均值时正、负误差相互抵消,我们先将其平方后再求均值,并称其互抵消,我们先将其平方后再求均值,并称其为均方误差,记成为均方误差,记成 ,即,即),(21nXXX.)()(2 EMSE)(MSE 哪个估计的均方哪个估计的均方误差小,就称哪个估计比较优,这种判定估计误差小,就称哪个估计比较优,这种判定估计优劣的准则为优劣的准则为“均方误差准则均方误差准则”。注意:注意:均方误差可分解成两部分均方误差可分解成两部分:,21和和的两个估计的两个估计对对证明:证明:.)()()(2EDMSE)()(2 )()()()()()(2222EEEEEEEEEEMSE.)()(2ED 上式表明,均方误差由两部分构成:第一上式表明,均方误差由两部分构成:第一部分是估计量的方差,部分是估计量的方差,第二部分是估计量的第二部分是估计量的偏偏差的平方和。差的平方和。注意:注意:如果一个估计量是无偏的,则第二如果一个估计量是无偏的,则第二部分是零,则有部分是零,则有:2)()()(EDMSE 如果两个估计都是无偏估计,这时哪个估如果两个估计都是无偏估计,这时哪个估计的方差小,哪个估计就较优。这种判定估计计的方差小,哪个估计就较优。这种判定估计量优劣的准则称为方差准则。量优劣的准则称为方差准则。)()(DMSE例例5 5:设设 X1,X2,Xn 为抽自均值为为抽自均值为 的总体的总体,考虑考虑 的如下两个估计的优劣:的如下两个估计的优劣:我们看到我们看到:显然两个估计都是显然两个估计都是 的无偏的无偏估计。计算二者的方差:估计。计算二者的方差:.11 ,1nijjjiXnX,)()(2nXDD.1)(11)(212nXDnDnijjji。优优于于方方差差小小,比比于于是是,iiXX这表明:当用样本均值去估计总体均值时,这表明:当用样本均值去估计总体均值时,使用全样本总比不使用全样本要好。使用全样本总比不使用全样本要好。前面讨论了参数的点估计。点估计就是前面讨论了参数的点估计。点估计就是利用样本计算出的值利用样本计算出的值(即实轴上点即实轴上点)来估计未来估计未知参数。知参数。7.4 区间估计区间估计 其优点是:其优点是:可直地告诉人们可直地告诉人们 “未知未知参数大致是多少参数大致是多少”;缺点是:缺点是:并未反映出估并未反映出估计的误差范围计的误差范围(精度精度)。故,在使用上还有不故,在使用上还有不尽如人意之处。尽如人意之处。而区间估计正好弥补了点估而区间估计正好弥补了点估计的这一不足之处计的这一不足之处。例如:例如:在估计正态总体均值在估计正态总体均值 的的问题中问题中,若根据一组实际样本,得到若根据一组实际样本,得到 的极大似然估的极大似然估计为计为 10.12。一个可以想到的估计办法是:给出一个一个可以想到的估计办法是:给出一个区间,并告诉人们该区间包含未知参数区间,并告诉人们该区间包含未知参数 的的可靠度可靠度(也称置信系数也称置信系数)。实际上,实际上,的真值可能大于的真值可能大于10.12,也可,也可能小于能小于10.12。也就是说,给出一个区间,使我们能以也就是说,给出一个区间,使我们能以一定的可靠度相信区间包含参数一定的可靠度相信区间包含参数 。这里的这里的“可靠度可靠度”是用概率来度量的,是用概率来度量的,称为置信系数,常用称为置信系数,常用 表示表示1。)10(置信系数的大小常根据实际需要来确定,置信系数的大小常根据实际需要来确定,通常取通常取0.95或或0.99,即,即.1)(21P。或或 0.01 05.0 根据实际样本,由给定的置信系数,可根据实际样本,由给定的置信系数,可求出一个尽可能短的区间求出一个尽可能短的区间 ,使,使,21。完完全全确确定定的的已已知知函函数数,由由样样本本为为两两个个统统计计量量与与置置信信区区间间。其其中中的的的的置置信信系系数数为为为为称称区区间间212121 (1 ,为确定置信区间,我们先回顾前面给出为确定置信区间,我们先回顾前面给出的随机变量的上的随机变量的上 分位点的概念。分位点的概念。分分位位点点。的的上上为为的的点点,称称满满足足对对随随机机变变量量,设设 )(10 XxxXPXz1.96.z 1.645z 0.0250.05,例例如如:.216.0)975.0(348.9)025.0(2323,例例如如:书末附有书末附有2分布、分布、t 分布、分布、F分布的上侧分布的上侧分位数表可供使用。需要注意的地方在教材分位数表可供使用。需要注意的地方在教材上均有说明。上均有说明。现在回到寻找置信区间问题上来。现在回到寻找置信区间问题上来。区间估计的定义区间估计的定义满满足足确确定定的的两两个个统统计计量量若若由由样样本本,是是未未知知常常数数,给给定定设设2121,10 n,X,XX。为为两两个个统统计计量量,与与其其中中信信区区间间,的的置置的的置置信信系系数数为为为为则则称称区区间间212121 1 ,定义定义1:(1).121P信信上上限限。分分别别称称为为置置信信下下限限和和置置与与21。的的概概率率是是它它包包含含,区区间间的的置置信信对对置置信信系系数数为为式式表表明明:但但1 ,1 (1)21(1).121P ,2121也也可可能能不不包包含含。,这这个个区区间间可可能能包包含含,对对于于一一个个给给定定的的样样本本随随机机区区间间,是是一一个个间间需需要要特特别别强强调调的的是是:区区nXXX实际应用上,一般取实际应用上,一般取 =0.05 或或 0.01。7.5 正态总体参数的区间估计正态总体参数的区间估计的区间估计的区间估计已知时已知时 I.2已已知知。的的一一个个简简单单样样本本,是是正正态态总总体体设设2221 ),(,NXXXn 根据基本定理根据基本定理(见定理见定理6.4.1),知知).1,0(/)/,(2NnXnNX或或则则,令令 nXU7.5.1 单正态总体参数的区间估计单正态总体参数的区间估计则则,令令 nXU.1 2/2/zUzP,就就是是而而/2/2/2/2/znXzzUz.2/2/znXznX等等价价于于.1 21P)1(.22znXznX,也可简记为也可简记为.2znX 于是,于是,的的置信区间为置信区间为例例1:某厂生产的零件长度某厂生产的零件长度 X 服从服从 N(,0.04),现从该厂生产的零件中随机抽取现从该厂生产的零件中随机抽取6个,长度个,长度测量值如下测量值如下(单位单位:毫米毫米):):14.6,15.l,14.9,14.8,15.2,15.1.求求:的置信系数为的置信系数为0.950.95的区间估计。的区间估计。解:解:n=6,=0.05,z/2=z0.025=1.96,2 2=0.22.,95.14 X通过计算,得通过计算,得.11.15 ,79.14 ,22znXznX所求置信区间为所求置信区间为当方差未知时,取当方差未知时,取均均未未知知时时和和2 II.的区间估计的区间估计./1nttnSXt则则,),2/(,1 1nt 取取分分位位数数对对给给定定的的置置信信系系数数.)2/()2/()2/(|1 111nnntnSXtnSXPttP使使得得于是,于是,的置信系数为的置信系数为1-的区间估计为的区间估计为(2).)2/(),2/(11nntnSXtnSX也可简记为也可简记为.)2/(1ntnSX)2/1()1()2/()1()2/()1()2/1(12122212212221nnnnSnSnPSnP,对对给给定定的的置置信信系系数数,由由1 )1(2122nSn 2 的区间估计的区间估计使使得得,与与确确定定分分位位数数 )2/()2/1(2121nn的区间估计为的置信系数为所以,1 2例例2:为估计一物体的重量为估计一物体的重量,将其称量,将其称量10次次,得到重量的测量值得到重量的测量值(单位单位:千克千克)如下如下:10.l,10.0,9.8,10.5,9.7,l0.l,9.9,10.2,10.3,9.9.设它们服从正态分布设它们服从正态分布 N(,2)。求。求 的置信系的置信系数为数为0.95的置信区间。的置信区间。(3).)2/1()1()2/()1(212212nnSnSn,解解:n=10,=0.05,t9(0.025)=2.2622,2415.0 ,0583.0 ,05.10 2SSX经经计计算算,得得的的置置信信区区间间。的的置置信信系系数数为为为为,0.95 10.22 9.87 2.2622100.241510.05 2.2622100.241510.05)2/(),2/(11nntnSXtnSX例例3(续例续例2):求求 2的置信系数为的置信系数为0.95的置信区间。的置信区间。解:解:n=10,=0.05,S2=0.0583,查附表得查附表得,.023.19)025.0()2/(,70.2)975.0()2/1(29212921nn 0.194 0.028 2.70.05839 ,19.0230.05839 )2/1()1(,)2/()1(212212,nnSnSn于是,的的区区间间估估计计。的的置置信信水水平平为为为为 1 27.5.2 两个正态总体的情况两个正态总体的情况 在实际应用中,我们经常会遇到两个正在实际应用中,我们经常会遇到两个正态总体均值差和方差之比的区间估计问题。态总体均值差和方差之比的区间估计问题。于是于是,评价新技术的效果问题,就归结评价新技术的效果问题,就归结为研究两个正态总体均值之差为研究两个正态总体均值之差 1-2 与与方差与与方差之比之比 12/22的问题。的问题。例如例如:考察一项新技术对提高产品某项质量考察一项新技术对提高产品某项质量指标的作用指标的作用,将实施将实施新技术前产品质量指标新技术前产品质量指标看成正态总体看成正态总体 N(1,12),实施,实施新技术后产品新技术后产品质量指标看成正态总体质量指标看成正态总体 N(2,22)。定理定理1:设设 X1,X2,Xm是抽自正态总体是抽自正态总体X 的简单样本,的简单样本,XN(1,12),样本均值与样,样本均值与样本方差分别为本方差分别为Y1,Y2,Yn 是抽自正态总体是抽自正态总体 Y 的简单样本,的简单样本,Y N(2,22),样本均值与样本方差分别为,样本均值与样本方差分别为;,21211)(11 1XXmSXmXmiimii.)(11 ,121221YYnSYnYmiiniiI.I.两个正态总体均值差的区间估计两个正态总体均值差的区间估计)(1).4,222121;nmNYX)(221225.)()().2112221nmtnmSYX未知时,当.2)1()1(22212nmSnSmS其其中中当两样本相互独立时,有当两样本相互独立时,有估计,由基本定理,得的都是与时,当2222 2)SS212221.证明证明:.)/,()/,(222211nNYmNX,也相互独立。与知由两样本相互独立,YX1).1).由基本定理由基本定理(见定理见定理6.4.1),知,知 故,故,(4)式成立;式成立;且二者相互独立。且二者相互独立。)1()1(2122221221,nmSnSm式,得由时,另一方面,当)4(22221分分布布的的可可加加性性,有有根根据据2 且且(6)式与式与(7)式中的随机变量相互独立。由式中的随机变量相互独立。由 t 分布的定义,有分布的定义,有 )()()(2611222221;nmSnSm)(1 7,0)(1121,NnmYX1121)()(nmSYX22221112112)1()1()()(nmSnSmnmYX)2()1()1()()(222211121nmSnSmnmYXN(0,1)2m+n-2221121)()(SnmYX换形式换形式 t m+n-2-2 .分母互换分母互换 利用该定理,我们可以得到利用该定理,我们可以得到 1 1-2 的的置信置信系数为系数为 1-1-的置信区间。的置信区间。的置信区间为:系数为的置信,得式由时,均已知和当 1 )(2122214(8);)/()/(22212/nmzYX的置信区间为:信系数为的置,得式由时,但未知当 1 )(2122215,(9),112)2/(nmStYXnm(10).2)1()1(2221nmSnSmS例例4(比较棉花品种的优劣比较棉花品种的优劣):假设用甲、乙两假设用甲、乙两种棉花纺出的棉纱强度分别为种棉花纺出的棉纱强度分别为 XN(1,2.182)和和Y N(2,1.762)。试验者从这两种棉纱中分。试验者从这两种棉纱中分别抽取样本别抽取样本 X1,X2,X200 和和 Y1,Y2,Y100,样本均值分别为样本均值分别为:求求 1 1-2 2 的置信系数为的置信系数为 0.95 的区间估计。的区间估计。,76.5 32.5YX解解:1=2.18,2=1.76,m=200,n=100,=0.05,由由(8)式,得式,得 1-2 的置信系数为的置信系数为 1-的置信的置信区间为区间为.0.019 899.0)/()/(22212/,nmzYX例例5:某公司利用两条自动化流水线灌装矿泉某公司利用两条自动化流水线灌装矿泉水。设这两条流水线所装矿泉水的体积水。设这两条流水线所装矿泉水的体积(单位单位:毫升毫升)XN(1,2)和和 YN(2,2)。现从生产。现从生产线上分别抽取线上分别抽取 X1,X2,X12 和和 Y1,Y2,Y17,样本均值与样本方差分别为样本均值与样本方差分别为:求求 1 1-2 2 的置信系数为的置信系数为0.95的区间估计。的区间估计。.7.4 7.499 4.2 ,1.5012221SYSX,;解:解:m=12,n=17,=0.05,再,再由其他已知条由其他已知条件及件及(10)式,可算出式,可算出.94.1 217127.4)117(4.2)112(S查查 t 分布表分布表,得得 tm+n-2(/2)=t27(0.025)=2.05.再由再由(9)式,得式,得 1-2 的置信系数为的置信系数为 1-的置的置信区间信区间.2.901 0.101)2/(112,nmStYXnm 在这两个例子中,在这两个例子中,1-2 的置信区间都包的置信区间都包含了零,也就是说:含了零,也就是说:1可能大于可能大于 2,也可能小也可能小于于 2。这时我们认为二者没有显著差异。这时我们认为二者没有显著差异。II.II.两个正态总体方差比的区间估两个正态总体方差比的区间估计计 定理定理2:设设 X1,X2,Xm是抽自正态总体是抽自正态总体X 的简单样本,的简单样本,XN(1,12),样本均值与样,样本均值与样本方差分别为本方差分别为;,21211)(11 1XXmSXmXmiimiiY1,Y2,Yn 是抽自正态总体是抽自正态总体 Y 的简单样本,的简单样本,Y N(2,22),样本均值与样本方差为,样本均值与样本方差为.)(11 ,121221YYnSYnYmiinii./则1,22212221nmFSS 1 由定理由定理2,易得到两个正态总体方差之比,易得到两个正态总体方差之比的置信系数为的置信系数为1-1-置信置信区间为:区间为:)11()2/1(1)2/(11,122211,12221 .nmnmFSSFSS,22212221/例例5:研究机器研究机器A和机器和机器B生产的钢管的内径生产的钢管的内径,随机抽取随机抽取A生产的钢管生产的钢管18根根,测得样本方差测得样本方差0.34(mm2);随机抽取随机抽取B生产的钢管生产的钢管13根根,测得样本测得样本方差为方差为0.29(mm2)。设两样本相互独立。设两样本相互独立,且机器且机器A和机器和机器B生产的钢管的内径分别服从正态分生产的钢管的内径分别服从正态分布布N(1,2)与与 N(2,2)。求。求 的置信水平的置信水平为为0.900.90的置信区间。的置信区间。解解:由由 m=18,n=13,S12=0.34,S22=0.29,=0.10 及及(11)式,得式,得 的置信系数为的置信系数为 0.90 的的置信区间为置信区间为2221/.79.2,45.038.229.034.059.2129.034.0 ,7.6 非正态总体的区间估计非正态总体的区间估计 前面两节讨论了正态总体分布参数的区间前面两节讨论了正态总体分布参数的区间估计。但是在实际应用中,我们有时不能判断估计。但是在实际应用中,我们有时不能判断手中的数据是否服从正态分布,或者有足够理手中的数据是否服从正态分布,或者有足够理由认为它们不服从正态分布。这时,只要样本由认为它们不服从正态分布。这时,只要样本大小大小 n 比较大,总体均值比较大,总体均值 的置信区间仍可用的置信区间仍可用正态总体情形的公式正态总体情形的公式 或或,znXznX22 ,.,2/2/znSXznSX2已知时已知时2未知时未知时所不同的是:所不同的是:这时的置信区间是近似的。这时的置信区间是近似的。这是求一般总体均值的一种简单有效的这是求一般总体均值的一种简单有效的方法,其理论依据是中心极限定理,它要求方法,其理论依据是中心极限定理,它要求样本大小样本大小 n 比较大。因此,这个方法称为大比较大。因此,这个方法称为大样本方法。样本方法。设总体均值为设总体均值为,方差为方差为2,X1,X2,Xn 为来自总体的样本。因为这些样本独立同为来自总体的样本。因为这些样本独立同分布的,根据中心极限定理,对充分大的分布的,根据中心极限定理,对充分大的 n,下式近似成立下式近似成立(1),)1 ,0(/1NnnXnXnii因而,因而,近似地近似地有有 于是,于是,的置信系数约为的置信系数约为1-的置信的置信区间为区间为.1/2/znXP.22znXznX,当2未知时,用未知时,用2的的某个估计,如某个估计,如 S2 来代替,来代替,得到得到(2).22znSXznSX,只要只要 n 很大,很大,(2)式所提供的置信区间在应用式所提供的置信区间在应用上是令人满意的。上是令人满意的。那么,那么,n 究竟多大才算很究竟多大才算很大呢?大呢?显然,对于相同的显然,对于相同的 n,(2)式所给出的置式所给出的置信区间的近似程度随总体分布与正态分布的信区间的近似程度随总体分布与正态分布的接近程度而变化接近程度而变化,因此,理论上很难给出因此,理论上很难给出 n 很大的一个界限。很大的一个界限。但许多应用实践表明:当但许多应用实践表明:当 n30时,时,近近似程度似程度是是可以接受可以接受的;当的;当 n50时,时,近似程近似程度度是是很好很好的。的。例例1:某公司欲估计自己生产的电池寿命某公司欲估计自己生产的电池寿命。现。现从其产品中随机抽取从其产品中随机抽取 50 只电池做寿命试验。只电池做寿命试验。这些电池寿命的平均值为这些电池寿命的平均值为 2.261 (单位:单位:100小小时时),标准差,标准差 S=1.935。求该公司生产的电池平。求该公司生产的电池平均寿命的置信系数为均寿命的置信系数为 95%的置信区间。的置信区间。解:解:查正态分布表,得查正态分布表,得 z/2=z0.025=1.96,由公,由公式式(2),得电池平均寿命的置信系数为,得电池平均寿命的置信系数为 95%的的置信区间为置信区间为2.802.1.730 96.150935.1261.2 96.150935.1261.2 ,设事件设事件 A 在一次试验中发生的概率为在一次试验中发生的概率为 p,现在做现在做 n 次试验,以次试验,以Yn记事件记事件 A 发生的次数发生的次数,则则 Yn B(n,p)。依中心极限定理,对充分大。依中心极限定理,对充分大的的 n,近似地有,近似地有 7.6.1 二项分布二项分布 (3).1 ,0()1(/)1(NpnpnpYnpppXn(3)式是式是(1)式的特殊情形。式的特殊情形。式式变变为为对对现现在在的的情情形形,记记(2)/nYXpn(4).)/(1)/(122nppzpnppzp,(4)式就是二项分布参数式就是二项分布参数 p 的置信系数约的置信系数约为为1-的置信区间。的置信区间。例例2:商品检验部门随机抽查了某公司生产的商品检验部门随机抽查了某公司生产的产品产品100件,发现其中合格产品为件,发现其中合格产品为84件,试求件,试求该产品合格率的置信系数为该产品合格率的置信系数为0.95的置信区间。的置信区间。解:解:n=100,Yn=84,=0.05,z/2=1.96,将这些将这些结果代入到结果代入到(4)式,得式,得 p 的置信系数为的置信系数为0.95的的近似置信区间为近似置信区间为 0.77,0.91。例例3:在环境保护问题中在环境保护问题中,饮水质量研究占有饮水质量研究占有重要地位,重要地位,其中一项工作是检查饮用水中是其中一项工作是检查饮用水中是否存在某种类型的微生物。假设在随机抽取否存在某种类型的微生物。假设在随机抽取的的100份一定容积的水样品中有份一定容积的水样品中有20份含有这种份含有这种类型的微生物。试求同样容积的这种水含有类型的微生物。试求同样容积的这种水含有这种微生物的概率这种微生物的概率 p 的置信系数为的置信系数为0.90的置信的置信区间。区间。解:解:n=100,Yn=20,=0.10,z/2=1.645,将这将这些结果代入到些结果代入到(4)式,得式,得 p 的置信系数为的置信系数为0.90的近似置信区间为的近似置信区间为 0.134,0.226。7.6.2 泊松分布泊松分布 的置信区间的置信区间为为的置信系数约的置信系数约得到参数得到参数,估计估计 1 X 设设 X1,X2,Xn 为抽自具有泊松分布为抽自具有泊松分布P()的总体的样本,因为的总体的样本,因为 E(X)=D(X)=,应用应用(2)式,并用式,并用(5)./22nXzXnXzX,例例4:公共汽车站在一单位时间内公共汽车站在一单位时间内(如半小时如半小时,或或1小时小时,或一天等或一天等)到达的乘客数服从泊松分到达的乘客数服从泊松分布布 P(),对不同的车站对不同的车站,不同的仅是参数不同的仅是参数 的的取值不同。现对某城市某公共汽车站进行取值不同。现对某城市某公共汽车站进行100个单位时间的调查。这里单位时间是个单位时间的调查。这里单位时间是20分钟。分钟。计算得到每计算得到每 20 分钟内来到该车站的乘客数平分钟内来到该车站的乘客数平均值为均值为 15.2 人。试求参数人。试求参数 的置信系数为的置信系数为95%的置信区间。的置信区间。解解:n=100,=0.05,z/2=1.96,将这将这些结果代入到些结果代入到(5)式式,得得 的置信系数为的置信系数为0.95的近似置信区间为的近似置信区间为 14.44,15.96。,2.15X
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 基础医学


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!