资源描述
, , , , , ,*,.,*, , , , , , ,*,.,*,单击此处编辑母版标题样式,*,.,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,.,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,跳转到第一页,*,.,*,第七章 参数估计,关键词:,矩估计法,极大似然估计法,置信区间,置信度,点估计,区间估计,1,.,第七章 参数估计关键词:点估计区间估计1.,2,.,2.,1,参数的点估计,3,.,1 参数的点估计3.,主要内容:,一. 矩估计法,二.极大似然估计,三.估计量的评选标准,一. 矩估计法,矩思想,: 利用样本矩作为相应总体矩的估计量,估计,矩估计法,:,4,.,主要内容:一. 矩估计法矩思想: 利用样本矩作为相应总体矩,5,.,5.,6,.,6.,7,.,7.,二、 极大似然估计法,极大似然估计法是在,总体的分布类型已知,的条件下所使用的一种参数估计方法.,它首先是由德国数学家,高斯,在1821年提出的 .,Gauss,Fisher,然而,这个方法常归功于,英国统计学家,费歇,.,费歇,在1922年重新发现了这一方法,并首先研究了这种方法的一些性质 .,8,.,二、 极大似然估计法 极大似然估计法是在总体的分布类型,极大似然原理:,一个随机试验有若干个可能结,果A,B,C,。若在一次试验中,结果A发生,,则一般认为试验条件对A最有利,,即A发生的,概率 最大,条件,自然,认,为从甲箱取更合理,9,.,极大似然原理:一个随机试验有若干个可能结条件自然,认为从甲箱,极大似然估计法:,又如,兔龟赛跑,得第一名的最有可能是谁?,(1)X-离散型,,已知 X的分布,样本 取到观测值,事件A,独立,10,.,极大似然估计法:又如,兔龟赛跑,得第一名的最有可能是谁?(1,Xi与X 同分布,对给定的样本值,是参数 的函数,称为,似然函数,,记做,11,.,Xi与X 同分布对给定的样本值是参数 的函数,称为,改,结构:n 项连乘,总体分布,A已经发生,由极大,似然原理, 达到最大,所以 的最合理,估计值 应满足:,定义,对给定的样本值 ,若,12,.,改结构:n 项连乘,总体分布A已经发生,由极大似然原理,,如何求 ?即求 的最大值点问题,方法一:,若 为可导函数,13,.,如何求 ?即求 的最大值点问题方法,回忆:,(1),单调性相同,从而,最大值点相同.,n项连乘, 求导麻烦,n项,相加,求导简单,方法二:,从而,,对数似然函数,14,.,回忆:n项连乘, 求导麻烦n项相加,求导简单方法二:从而,,(2)连续型总体似然函数的求法,设X为连续型总体,其概率密度为:,对来自总体的样本 , 其观测值为 ,作为与总体X同分布且相互独立的,n,维随机变量,样本,的联合概率密度为:,其中 未知,15,.,(2)连续型总体似然函数的求法设X为连续型总体,其概率密度为,于是,样本 落入点,邻域内的概率为 ,由极大似然原,理,最合理的 的估计值 应该是使,达到最大,由于 是不依赖于,的增量,所以我们只需求使,似然函数,达到最大,16,.,于是,样本 落入,求 的步骤:,17,.,求 的步骤:17.,例1 :,设总体,X的分布律为:,0p1, p,未知 , 求参数p 的极大似然估计量.,X,0,1,p,k,1-p,p,解:,总体X,的分布律为:,设(,X,1,X,2,X,n,)是来自总体X的样本。,18,.,例1 : 设总体X的分布律为:0p1, p未知 , 求,似然函数为:,19,.,似然函数为:19.,解得,p的极大似然估计量为:,说明:,p的极大似然估计值为:,20,.,解得p的极大似然估计量为:说明:p的极大似然估计值为:20.,解:,的似然函数为:,取对数,例2:,设(,X,1,X,2,X,n,),是来自总体,X,的一个样本,求,的极大似然估计量,21,.,解: 的似然函数为:取对数例2: 设(X1,X2,Xn,求导并令其为0,从中解得,即为,的极大似然估计量。,22,.,求导并令其为0从中解得 即为的极大似然估计量。22.,推广:,23,.,推广:23.,例3:,的极大似然估计量,给定一组样本 , 求,解,24,.,例3:的极大似然估计量给定一组样本,25,.,25.,26,.,26.,27,.,27.,三、 衡量估计量好坏的标准,的点估计量 一般是不唯一的, 如何选择好的 ? 首先我们要对估计量提出衡量其好坏的标准.,标准:,无偏性, 有效性, 一致性,1、无偏性,28,.,三、 衡量估计量好坏的标准的点估计量 一般是不唯一的,即 取值在真值 附近来回摆动,证明:,(1),6,29,.,即 取值在真值 附近来回摆动证明: (1)6,30,.,30.,31,.,31.,32,.,32.,是的两个,无偏估计量,,若,2、有效性,33,.,是的两个无偏估计量,若2、有效性33.,34,.,34.,相合性(一致性),35,.,相合性(一致性)35.,36,.,36.,37,.,37.,38,.,38.,39,.,39.,40,.,40.,41,.,41.,42,.,42.,43,.,43.,2010年数学1,44,.,2010年数学144.,作业题,P120 :5,11,45,.,作业题P120 :5,1145.,3 区间估计,点估计:,的真值,的真值,缺点:无法确定误差。,区间估计:,估计的真值所在的区间。,(,),(,),(,),(,),(,),(,),(,),(,),(,),(,),最大误差:,46,.,3 区间估计点估计:的真值的真值缺点:无法确定误差。,成立,那么称随机区间 为参数的置信度为 1 的(双侧)置信区间。,设,为总体分布的一个未知参数,X,1,X,2,X,n,是来自总体的一个样本,如果对于给定的1(0 1)能由样本确定出两个统计量:,(双侧)置信下限,(双侧),置信上限 置信度,1、定义,使,的真值,(,),一、区间估计的基本概念,47,.,成立,那么称随机区间 为参数的置,2.说明,通常,取得很小,因而,落在区间 内的概率很大。一般地,,越小,则,落在区间 内的可靠程度越大,但在样本容量相同的情况下,这个区间长度也就越大,从而估计的误差也就越大。,置信区间的意义:当样本容量,n固定时,做N次抽样,得到N组样本观察值,从而得到N个置信区间。这N个置信区间中,包含,的真值在其内部的约占,100(1-,),例如,,N=1000,=0.05,则1000个置信区间中大约有950个包含,的真值。,问题,如何确定?,一般从,的点估计量出发,减去某个量构成,加上某个量构成。,的真值,48,.,2.说明通常取得很小,因而落在区间 内的概率很,单侧置信区间,49,.,单侧置信区间49.,复习:,常用的统计量分布,50,.,复习:常用的统计量分布 50.,t,分布的极限分布是标准正态分布,51,.,t分布的极限分布是标准正态分布51.,52,.,52.,复习四个定理:正态总体统计量的分布,定理1,设总体,标准化,得到,53,.,复习四个定理:正态总体统计量的分布定理1 设总体标准化,受到1个约束,独立的变量个数为n-1,独,54,.,受到1个约束,独立的变量个数为n-1独54.,55,.,55.,二、正态总体未知参数的区间估计,1.一个正态总体的情况,1) 均值,的置信区间, ,2,已知 ,的置信区间,的真值,的一个无偏估计量是什么?,前面遇到过的哪个统计量既含有又含有且分布已知?,56,.,二、正态总体未知参数的区间估计1.一个正态总体的情况1),(x),所以,的1置信区间为,57,.,(x)所以,的1置信区间为57.,得置信区间,置信度为1-的置信区间不是唯一的!,在置信度相同的情况下,置信区间的区间长度越小越好!,注,可以证明,当总体的概率密度函数为偶函数时,采用对称的上分位点所得的置信区间长度最小。,58,.,得置信区间置信度为1-的置信区间不是唯一的!, ,2,未知,的置信区间,当,2,未知时,用,2,的无偏、一致估计量样本方差,来代替,2, 从而得一新的统计量.,这样就得到了置信度为1,的置信区间,59,., 2 未知,的置信区间当 2未知时,用 2的无偏,2) 方差,2,的置信区间,若,已知,可用,未知时,可用,可得,2,的置信度为(1-,)的,置信区间为:,60,.,2) 方差2 的置信区间若已知,可用未知时,可用可得,单个总体的情形总结:,2,已知,估计,2,未知,估计,用,用,未知,估计,2,用,3)求,的置信度为(1)的置信区间的步骤:,根据Z的分布的上分位点,解出的置信区间,寻求一个含有,(而不含其它未知参数)的样本函数Z=Z(X,1,,X,2,Xn),),且Z的分布已知;,61,.,单个总体的情形总结: 2已知,估计2未知,估计用用,例,1,已知样本值为(3.3,-0.3,-0.6,-0.9),,求,(1) 当,=3时,正态总体均值的置信度为95的,置信区间;,(2) 当,未知时,正态总体均值的置信度为95的,置信区间。,解,:,由样本值计算可得,(1) 当,=3时,,因为,故,所以,均值,的置信度为95的,置信区间为,代入,样本值可得,请您注意学习解题过程的写法,!,请准备好计算器和练习本,4)应用举例,62,.,例1 已知样本值为(3.3,-0.3,-0.6,-0.9,(2)当,未知时,,由,知,所以,均值,的置信度为95的,置信区间为,代入,样本值可得,查表,可得,63,.,(2)当未知时,由知所以,均值的置信度为95的置信区间,例2: 用某仪器间接测量温度,重复测量5次,所得温度值为1250,。, 1265,。, 1245,。, 1260,。, 1275,。,试问真值在什么范围内?(置信度为95%),分析:用随机变量X表示温度的测量值,它通常是一个正态变量.假定仪器无系统误差,则E(X)=,就是温度的真值.设XN(,2,),问题即为估计,的范围(未知),查t分布表(,=0.05,自由度是n-1=4得,64,.,例2: 用某仪器间接测量温度,重复测量5次,所得温度值为12,温度真值的置信度为95%的置信区间为,(1244.2, 1273.8),65,.,温度真值的置信度为95%的置信区间为65.,66,.,66.,2.两个总体的情形,1)两个正态总体均值差,1,-,2,的置信区间,样本分别为,(X,1,,X,2,Xn,1,), (Y,1,,Y,2,Yn,2,),1,2, ,2,2,已知,估计,1,- ,2,67,.,2.两个总体的情形1)两个正态总体均值差1-2的置信区间,68,.,68., ,1,2, ,2,2,都未知,但,1,2,=,2,2,=,2,均值差,1,- ,2,区间估计,1,2, ,2,2,都未知的一般情况,此时,当n,1, n,2,都很大时(实用中大于50),均值差,1,- ,2,区间估计为,69,., 1 2, 2 2 都未知,但1 2=2 2=,2)两个正态总体方差比 的置信区间:,一样,第二个稳定,第一个稳定,现需找一个包含,且分布为已知的统计量.,方差比的意义:如比较两个灯泡厂(寿命均值相等)的质量哪个稳定.,70,.,2)两个正态总体方差比 的置信区间:一样,71,.,71.,要求:,掌握方法,而不是死记硬背,明确置信区间的实际意义,能结合到实际问题中去,72,.,要求:72.,例3,设有两个工厂独立地生产同一种产品,其质量指标均服从正态分布。现从它们某天的产品中随机抽取60只,测得其样本均值分别为10.3和9.9,样本方差S,2,依次为0.84和1.25。试以,95,的可靠性判断两工厂生产质量水平的差异?,分析:,要判断两工厂生产质量水平的差异,首先需要比较两总体的均值的大小,以反映平均质量水平的高低;其次还可以比较总体方差的大小,以反映质量水平波动的程度。,先估计总体均值差,1,-,2,的大小:,因样本容量较大,故近似地有,由此可得,1,-,2,置信区间:,73,.,例3 设有两个工厂独立地生产同一种产品,其质量指标均服,代入样本值可得,:,再估计总体方差比,1,2,/,2,2,的大小:,由,知,这一结果说明什么?,由此可得,1,2,/,2,2,的置信区间:,代入样本值可得,:,这一结果又说明什么?,74,.,代入样本值可得:再估计总体方差比12/22的大小:由知这,待估,参数,其他,参数,W 的 分 布,置信区间,单侧置信限,一个正态总体,两个正态总体,正态总体均值、方差的置信区间与单侧置信限,.,待估 其他 W 的 分 布置信区间单侧置信限 一,实际应用,76,.,实际应用76.,(1)用金球测定观察值为:6.683 6.681 6.676 6.678 6.679 6.672,(2)用铂球测定观察值为:6.661 6.661 6.667 6.667 6.664,设测定值总体为,,和为未知。对(1)、(2)两种情况分别求和的置信度为0.9的置信区间。,X=6.683 6.681 6.676 6.678 6.679 6.672;,Y=6.661 6.661 6.667 6.667 6.664;,mu,sigma,muci,sigmaci=normfit(X,0.1) %金球测定的估计,MU,SIGMA,MUCI,SIGMACI=normfit(Y,0.1) %铂球测定的估计,mu = 6.6782 sigma =0.0039,muci = 6.6750 6.6813,sigmaci =0.0026 0.0081,MU = 6.6640 SIGMA =,0.0030,MUCI =6.6611 6.6669,SIGMACI =0.0019 0.0071,77,.,(1)用金球测定观察值为:6.683 6.681 6.6,78,.,78.,作业题,P120 :2,79,.,作业题P120 :279.,课件结束!,.,10/1/2024,课件结束!.10/3/2022,
展开阅读全文