资源描述
第七章 参数估计关键词:矩估计法 极大似然估计法 置信区间 置信度点估计区间估计1第七章 参数估计关键词:点估计区间估计1221 参数的点估计31 参数的点估计3主要内容主要内容:一一.矩估计法矩估计法二二.极大似然估计极大似然估计三三.估计量的评选标准估计量的评选标准一一.矩估计法矩估计法矩思想矩思想:利用样本矩作为相应总体矩的估计量利用样本矩作为相应总体矩的估计量估计估计矩估计法矩估计法:4主要内容:一.矩估计法矩思想:利用样本矩作为相应总体矩55 6 6 7 7二、二、极大似然估计法极大似然估计法 极极大大似似然然估估计计法法是是在在总总体体的的分分布布类类型型已已知知的的条件下所使用的一种参数估计方法条件下所使用的一种参数估计方法.它首先是由德国数学家它首先是由德国数学家高斯高斯在在1821年提出的年提出的.GaussFisher然而,这个方法常归功于然而,这个方法常归功于英国统计学家英国统计学家费歇费歇.费歇费歇在在1922年重新发现了这一方法,年重新发现了这一方法,并首先研究了这种方法的一些性质并首先研究了这种方法的一些性质.8二、极大似然估计法 极大似然估计法是在总体的分布类型极大似然原理:极大似然原理:一个随机试验有若干个可能结一个随机试验有若干个可能结果果A,B,C,。若在一次试验中,结果。若在一次试验中,结果A发生,发生,则一般认为试验条件对则一般认为试验条件对A最有利最有利,即,即A发生的发生的概率概率 最大最大条件条件自然,认自然,认为从甲箱取更合理为从甲箱取更合理9极大似然原理:一个随机试验有若干个可能结条件自然,认为从甲箱极大似然估计法:极大似然估计法:又如,兔龟赛跑,得第一名的最有可能是谁?又如,兔龟赛跑,得第一名的最有可能是谁?(1)X-离散型,离散型,已知已知 X的分布的分布样本样本 取到观测值取到观测值事件事件A独立独立10极大似然估计法:又如,兔龟赛跑,得第一名的最有可能是谁?(1Xi与与X 同分布同分布对给定对给定的的样本本值是参数是参数 的函数,称为的函数,称为似然函数似然函数,记做,记做11Xi与X 同分布对给定的样本值是参数 的函数,称为改改结构:结构:n 项连乘,总体分布项连乘,总体分布A已经发生,由极大已经发生,由极大似然原理,似然原理,达到最大,所以达到最大,所以 的最合理的最合理估计值估计值 应满足:应满足:定义定义 对给定的样本值对给定的样本值 ,若,若12改结构:n 项连乘,总体分布A已经发生,由极大似然原理,如何求如何求?即求?即求 的最大值点问题的最大值点问题方法一方法一:若若 为可导函数为可导函数13如何求?即求 的最大值点问题方法回忆:回忆:(1)单调性相同,从而单调性相同,从而最大值最大值点相同点相同.n项连乘项连乘,求导麻烦求导麻烦n项项相加,求导简单相加,求导简单方法二:方法二:从而,从而,对数似然函数对数似然函数14回忆:n项连乘,求导麻烦n项相加,求导简单方法二:从而,(2)连续型总体似然函数的求法)连续型总体似然函数的求法设设X为连续型总体,其概率密度为:为连续型总体,其概率密度为:对来自总体的样本对来自总体的样本 ,其观测值其观测值为为 ,作为与总体,作为与总体X同分布且相互独同分布且相互独立的立的n维随机变量,样本维随机变量,样本的联合概率密度为的联合概率密度为:其中其中 未知未知15(2)连续型总体似然函数的求法设X为连续型总体,其概率密度为于是,样本于是,样本 落入点落入点邻域内的概率为邻域内的概率为 ,由极大似然原,由极大似然原理,最合理的理,最合理的 的估计值的估计值 应该是使应该是使达到最大,由于达到最大,由于 是不依赖于是不依赖于的增量,所以我们只需求使的增量,所以我们只需求使似然函数似然函数达到最大达到最大16于是,样本 落入求求 的步骤:的步骤:17求 的步骤:17例例1:设总体设总体X的分布律为:的分布律为:0p1,p未知未知,求参数求参数p 的极大似然估计量的极大似然估计量.X01pk1-pp解解:总体总体X的分布律为:的分布律为:设设(X1,X2,Xn)是来自总体是来自总体X的样本。的样本。18例1:设总体X的分布律为:0p1,p未知,求似然函数为:似然函数为:19似然函数为:19解得解得p的极大似然估计量为:的极大似然估计量为:说明:说明:p的极大似然估计值为:的极大似然估计值为:20解得p的极大似然估计量为:说明:p的极大似然估计值为:20解:解:的似然函数为:的似然函数为:取对数取对数例例2:设设(X1,X2,Xn)是来自总体是来自总体X的一个样本的一个样本,求求的极大似然估计量的极大似然估计量21解:的似然函数为:取对数例2:设(X1,X2,Xn求导并令其为求导并令其为0从中解得从中解得 即为即为的极大似然估计量。的极大似然估计量。22求导并令其为0从中解得 即为的极大似然估计量。22推广:推广:23推广:23例例3:的极大似然估计量的极大似然估计量给定一组样本给定一组样本 ,求求 解解24例3:的极大似然估计量给定一组样本 2525 26 26 27 27三、三、衡量估计量好坏的标准衡量估计量好坏的标准的点估计量的点估计量 一般是不唯一的一般是不唯一的,如何选择好如何选择好的的?首先我们要对估计量提出衡量其好坏首先我们要对估计量提出衡量其好坏的标准的标准.标准标准:无偏性无偏性,有效性有效性,一致性一致性1、无偏性、无偏性28三、衡量估计量好坏的标准的点估计量 一般是不唯一的即即 取值在真值取值在真值 附近来回摆动附近来回摆动证明证明:(1)629即 取值在真值 附近来回摆动证明:(1)630303131 32 32是是的两个的两个无偏估计量无偏估计量,若,若2、有效性、有效性33是的两个无偏估计量,若2、有效性33 34 34相合性相合性(一致性一致性)35相合性(一致性)35 36 3637373838393940404141424243432010年数学1442010年数学144作业题P120:5,1145作业题P120:5,1145跳转到第一页3 区间估计区间估计点估计点估计:的真值的真值的真值的真值缺点:无法确定误差。缺点:无法确定误差。区间估计:区间估计:估计估计的真值所在的区间。的真值所在的区间。()()()()()()()()()()最大误差:最大误差:463 区间估计点估计:的真值的真值缺点:无法确定误差。跳转到第一页成立,那么称随机区间成立,那么称随机区间 为参数为参数 的置信度为的置信度为 1 的(双侧)置信区间。的(双侧)置信区间。设设 为总体分布的一个未知参数,为总体分布的一个未知参数,X1,X2,Xn是来自是来自总体的一个样本,如果对于给定的总体的一个样本,如果对于给定的1(0 1)能由样本确定出两个统计量:能由样本确定出两个统计量:(双侧)置信下限(双侧)置信下限(双侧)(双侧)置信上限置信上限 置信度置信度1、定义、定义使使的真值的真值()一、区间估计的基本概念一、区间估计的基本概念47成立,那么称随机区间 为参数的置跳转到第一页2.说明说明通常通常取得很小,因而取得很小,因而落在区间落在区间 内的概率很大。一般地,内的概率很大。一般地,越小,则越小,则落在区间落在区间 内的可靠程度越大,但在样本容量相同的内的可靠程度越大,但在样本容量相同的情况下,这个区间长度也就越大,从而估计的误差也就越大。情况下,这个区间长度也就越大,从而估计的误差也就越大。置信区间的意义:当样本容量置信区间的意义:当样本容量n固定时,做固定时,做N次抽样,得到次抽样,得到N组样本组样本观察值,从而得到观察值,从而得到N个置信区间。这个置信区间。这N个置信区间中,包含个置信区间中,包含的真值在的真值在其内部的约占其内部的约占100(1-100(1-),例如,例如,N=1000,N=1000,=0.05,=0.05,则则10001000个置信区间个置信区间中大约有中大约有950950个包含个包含的真值。的真值。问题问题如何确定?如何确定?一般从一般从的点估计量出发,减去某个量构成,加上某个量的点估计量出发,减去某个量构成,加上某个量构成。构成。的真值的真值482.说明通常取得很小,因而落在区间 内的概率很跳转到第一页 单侧置信区间单侧置信区间49 单侧置信区间49跳转到第一页复习:复习:常用的统计量分布常用的统计量分布n 50复习:常用的统计量分布 50跳转到第一页 t分布的极限分布是标准正态分布51 t分布的极限分布是标准正态分布51跳转到第一页 52 52复习四个定理:正态总体统计量的分布复习四个定理:正态总体统计量的分布定理定理1 设总体设总体标准化,得到标准化,得到53复习四个定理:正态总体统计量的分布定理1 设总体标准化跳转到第一页受到受到1个约束,独立的变量个数为个约束,独立的变量个数为n-1独独54受到1个约束,独立的变量个数为n-1独54跳转到第一页5555跳转到第一页二、正态总体未知参数的区间估计二、正态总体未知参数的区间估计1.一个正态总体的情况一个正态总体的情况1)均值均值的置信区间的置信区间 2 已知已知,的置信区间的置信区间的真值的真值的一个无偏估计量是什么?的一个无偏估计量是什么?前面遇到过的哪个统计量既含有又含有前面遇到过的哪个统计量既含有又含有且分布已且分布已知?知?56二、正态总体未知参数的区间估计1.一个正态总体的情况1)跳转到第一页(x)(x)所以,所以,的的1置信区间为置信区间为57(x)所以,的1置信区间为57跳转到第一页得置信区间得置信区间置信度为置信度为1-的置信区间不是唯一的!的置信区间不是唯一的!在置信度相同的情况下,置信区间的区间长度越小越好!在置信度相同的情况下,置信区间的区间长度越小越好!注注可以证明,当总体的概率密度函数为偶函数时,采用对可以证明,当总体的概率密度函数为偶函数时,采用对称的上称的上分位点所得的置信区间长度最小。分位点所得的置信区间长度最小。58得置信区间置信度为1-的置信区间不是唯一的!跳转到第一页 2 未知,未知,的置信区间的置信区间当当 2 2未知时未知时,用用 2 2的无偏、一致估计量的无偏、一致估计量样本方差样本方差来代替来代替 2 2,从而得一新的统计量从而得一新的统计量.这样就得到了置信度为这样就得到了置信度为1 的置信区间的置信区间59 2 未知,的置信区间当 2未知时,用 2的无偏跳转到第一页2)方差方差2 的置信区间的置信区间若若 已知已知,可用可用 未知时未知时,可用可用可得可得 2 的置信度为的置信度为(1-)的的置信区间为置信区间为:602)方差2 的置信区间若已知,可用未知时,可用可得跳转到第一页单个总体的情形总结:单个总体的情形总结:2 2已知已知,估计估计 2 2未知未知,估计估计 用用用用 未知未知,估计估计 2 2用用3)求求 的置信度为的置信度为(1)的置信区间的步骤的置信区间的步骤:根据根据Z的分布的上的分布的上 分位点分位点,解出解出 的置信区间的置信区间寻求一个含有寻求一个含有(而不含其它未知参数而不含其它未知参数)的样本函数的样本函数Z=Z(X1,X2Xn),),且且Z的分布已知的分布已知;61单个总体的情形总结:2已知,估计2未知,估计用用跳转到第一页例例例例1 1 1 1 已知样本值为已知样本值为(3.3,-0.3,-0.6,-0.9)(3.3,-0.3,-0.6,-0.9),求,求 (1)(1)当当=3=3时,正态总体均值时,正态总体均值 的置信度为的置信度为9595的的置信区间;置信区间;(2)(2)当当 未知时,正态总体均值未知时,正态总体均值 的置信度为的置信度为9595的的置信区间。置信区间。解解:由样本值计算可得由样本值计算可得(1)(1)当当=3=3时,时,因为因为故故所以,均值所以,均值 的置信度为的置信度为9595的的置信区间为置信区间为代入代入样本值可得样本值可得请您注意学习解题过程的写法请您注意学习解题过程的写法!请准备好计算器和练习本请准备好计算器和练习本4)4)4)4)应用举例应用举例应用举例应用举例62例1 已知样本值为(3.3,-0.3,-0.6,-0.9跳转到第一页(2)(2)当当 未知时,未知时,由由知知所以,均值所以,均值 的置信度为的置信度为9595的的置信区间为置信区间为代入代入样本值可得样本值可得查表查表可得可得63(2)当未知时,由知所以,均值的置信度为95的置信区间跳转到第一页例例2:用某仪器间接测量温度用某仪器间接测量温度,重复测量重复测量5次次,所得温所得温度值为度值为1250。,1265。,1245。,1260。,1275。试问真值在什么范围内试问真值在什么范围内?(置信度为置信度为95%)分析分析:用随机变量用随机变量X表示温度的测量值表示温度的测量值,它通常是一个它通常是一个正态变量正态变量.假定仪器无系统误差假定仪器无系统误差,则则E(X)=就是温度就是温度的真值的真值.设设XN(,2),问题即为估计问题即为估计 的范围的范围(未知未知)查查t分布表分布表(=0.05,自由度是自由度是n-1=4得得64例2:用某仪器间接测量温度,重复测量5次,所得温度值为12跳转到第一页n温度真值的置信度为温度真值的置信度为95%的置信区间为的置信区间为n(1244.2,1273.8)65温度真值的置信度为95%的置信区间为65跳转到第一页6666跳转到第一页2.2.两个总体的情形两个总体的情形1)两个正态总体均值差)两个正态总体均值差1-2的置信区间的置信区间样本分别为样本分别为(X1,X2 Xn1),(Y1,Y2 Yn2)1 1 2 2,2 2 2 2已知已知已知已知,估计估计估计估计 1-2672.两个总体的情形1)两个正态总体均值差1-2的置信区间跳转到第一页6868跳转到第一页 1 2,2 2 都未知都未知,但但 1 2=2 2=2,均值差均值差 1-2 区间估计区间估计 1 2,2 2都未知的一般情都未知的一般情况况此时,当此时,当n1,n2 都很大时(实用中大于都很大时(实用中大于50)均值差均值差 1-2 区间估计为区间估计为69 1 2,2 2 都未知,但1 2=2 2=跳转到第一页 2)两个正态总体方差比)两个正态总体方差比 的置信区间的置信区间:一样一样第二个稳定第二个稳定第一个稳定第一个稳定现需找一个包含现需找一个包含,且分布为已知的统计量且分布为已知的统计量.方差比的意义方差比的意义:如比较两个灯泡厂如比较两个灯泡厂(寿命均值相等寿命均值相等)的质量哪个稳定的质量哪个稳定.70 2)两个正态总体方差比 的置信区间:一样跳转到第一页7171跳转到第一页要求要求:掌握方法掌握方法,而不是死记硬背而不是死记硬背明确置信区间的实际意义明确置信区间的实际意义,能结合能结合到实际问题中去到实际问题中去72要求:72跳转到第一页例例例例3 3 3 3 设有两个工厂独立地生产同一种产品,其质量指设有两个工厂独立地生产同一种产品,其质量指标均服从正态分布。现从它们某天的产品中随机抽取标均服从正态分布。现从它们某天的产品中随机抽取6060只,只,测得其样本均值分别为测得其样本均值分别为10.310.3和和9.99.9,样本方差,样本方差S S2 2依次为依次为0.840.84和和1.251.25。试以。试以9595的可靠性判断两工厂生产质量水平的可靠性判断两工厂生产质量水平的差异?的差异?分析:分析:要判断两工厂生产质量水平的差异,首先需要比较两总体的要判断两工厂生产质量水平的差异,首先需要比较两总体的均值的大小,以反映平均质量水平的高低;其次还可以比较总体方差均值的大小,以反映平均质量水平的高低;其次还可以比较总体方差的大小,以反映质量水平波动的程度。的大小,以反映质量水平波动的程度。先估计总体均值差先估计总体均值差 1 1-2 2的大小:的大小:因样本容量较大,故近似地有因样本容量较大,故近似地有由此可得由此可得 1 1-2 2置信区间:置信区间:73例3 设有两个工厂独立地生产同一种产品,其质量指标均服跳转到第一页代入样本值可得代入样本值可得:再估计总体方差比再估计总体方差比 1 12 2/2 22 2的大小:的大小:由由知知这一结果说明什么?这一结果说明什么?由此可得由此可得 1 12 2/2 22 2的置信区间:的置信区间:代入样本值可得代入样本值可得:这一结果又说明什么这一结果又说明什么?74代入样本值可得:再估计总体方差比12/22的大小:由知这 待估待估 参数参数 其他其他 参数参数W W 的的 分分 布布置信区间置信区间单侧置信限单侧置信限 一个正态总体一个正态总体 两个正态总体两个正态总体正态总体均值、方差的置信区间与单侧置信限 待估 其他 W 的 分 布置信区间单侧置信限 一实际应用实际应用7676实际应用76(1)用金球测定观察值为:6.683 6.681 6.676 6.678 6.679 6.672(2)用铂球测定观察值为:6.661 6.661 6.667 6.667 6.664设测定值总体为,和为未知。对(1)、(2)两种情况分别求和的置信度为0.9的置信区间。X=6.683 6.681 6.676 6.678 6.679 6.672;Y=6.661 6.661 6.667 6.667 6.664;mu,sigma,muci,sigmaci=normfit(X,0.1)%金球测定的估计MU,SIGMA,MUCI,SIGMACI=normfit(Y,0.1)%铂球测定的估计mu=6.6782 sigma=0.0039muci=6.6750 6.6813sigmaci=0.0026 0.0081MU=6.6640 SIGMA=0.0030MUCI=6.6611 6.6669SIGMACI=0.0019 0.00717777(1)用金球测定观察值为:6.683 6.681 6.6787878作业题nP120:27979作业题P120:279课件结束!6/29/2024课件结束!8/11/2023
展开阅读全文