概率论第5章-参数估计与假设检验课件

上传人:痛*** 文档编号:241543760 上传时间:2024-07-03 格式:PPT 页数:59 大小:1.25MB
返回 下载 相关 举报
概率论第5章-参数估计与假设检验课件_第1页
第1页 / 共59页
概率论第5章-参数估计与假设检验课件_第2页
第2页 / 共59页
概率论第5章-参数估计与假设检验课件_第3页
第3页 / 共59页
点击查看更多>>
资源描述
第第5章章 参数估计与假设检验参数估计与假设检验 根据样本数据来推断总体分布的数字特征称根据样本数据来推断总体分布的数字特征称为统计推断,它是数理统计学的核心。为统计推断,它是数理统计学的核心。当已经知道一个总体的分布函数形式当已经知道一个总体的分布函数形式,但是其但是其中一个或几个参数尚未知中一个或几个参数尚未知,利用样本数据对总体的利用样本数据对总体的参数作出估计,称为参数作出估计,称为 参数估计参数估计 参数估计通常分成两类:参数估计通常分成两类:点估计和区间估计点估计和区间估计 点估计点估计:用样本的某个函数值作为总体中未知:用样本的某个函数值作为总体中未知参数的估计值;参数的估计值;区间估计:区间估计:把总体的未知参数确定在某个区间内把总体的未知参数确定在某个区间内。设样本设样本的一组值为的一组值为:1.65 1.67 1.68 1.78 1.69假如我们要估计某学院男生的平均身高假如我们要估计某学院男生的平均身高.现从该总体选取容量为现从该总体选取容量为5的样本,的样本,根据选取出的这根据选取出的这5个数,个数,估计估计m m 为为1.68,这是点估计,这是点估计.估计估计m m 在区间在区间1.57,1.84内,这是区间估计内,这是区间估计.5.1 参数的点估计参数的点估计 q q 是一是一元或多元待估参数元或多元待估参数,设总体设总体x x 的分布函数的形式的分布函数的形式F(x;q q )为已知为已知,X1,X2,Xn 是是x x 的一个样本的一个样本,点估计问题就是要利用样本构造一个适当的统计量点估计问题就是要利用样本构造一个适当的统计量x1,x2,xn 为相应的一个样本值为相应的一个样本值.1.求估计量的常用方法求估计量的常用方法(1)矩估计法矩估计法用样本用样本k 阶原点矩阶原点矩a a k 作为总体的作为总体的k阶矩阶矩v k的估计量的估计量若总体若总体x x 的分布中包含的分布中包含k个未知参数个未知参数q q1 1,q q2 2,q qk,联列前联列前k 个矩估计的方程个矩估计的方程这个估计量称为这个估计量称为矩估计量矩估计量,其观察值称为其观察值称为矩估计值矩估计值.解联立方程解联立方程解解例例1 设总体设总体x x 的均值的均值m m 和方差和方差s s 2均为未知均为未知,21是是一个样本一个样本,又设又设 nXXX求求m m 和和s s 2的矩估计量的矩估计量.例例2设总体设总体x x在在0,0,q q 上上服从均匀分布服从均匀分布,的估计量的估计量.求求q q得得q q 的估计量的估计量2q qX=其中其中q q解:解:1个未知参数个未知参数,根据矩估计法根据矩估计法,列出列出1个方程个方程(q q 0)未知未知,(X1,X2,Xn)是来自总体是来自总体 x x 的样本的样本,求求a,b的估计量的估计量.),(21是来自总体是来自总体x x 的样本的样本,XXXn例例(习题习题2)设总体设总体x x 在在 a,b 上上服从均匀分布服从均匀分布,其中其中a,b未知未知,解解得到得到a,b的矩估计量分别为的矩估计量分别为例例(习题习题5)设总体的概率密度为设总体的概率密度为解解(2)极大似然法极大似然法通过两个例子了解其基本思想通过两个例子了解其基本思想例例1 两人同时向同一目标各射一发子弹两人同时向同一目标各射一发子弹,只有一发只有一发中的中的,例例2 某事件发生的概率可能为某事件发生的概率可能为0.01或或0.4,在一次试在一次试验中该事件发生了验中该事件发生了,极大似然估计法的基本思想就是极大似然估计法的基本思想就是“在一次试验中概在一次试验中概率最大的事件最可能发生率最大的事件最可能发生”“似然似然”用通俗的话说就是用通俗的话说就是 “可能性可能性”。一般都认为是成绩较好的打中的可能性大。一般都认为是成绩较好的打中的可能性大。可以认为其概率是可以认为其概率是0.4而不是而不是0.01似然函数似然函数极大似然估计值极大似然估计值极大似然估计量极大似然估计量 由极大似由极大似然估计法的基本思想然估计法的基本思想,上式应该取最大值上式应该取最大值即在一次抽取中得到的概率或概率密度,即在一次抽取中得到的概率或概率密度,求极大似然估计量的方法与步骤求极大似然估计量的方法与步骤第一步第一步:构造似然函数构造似然函数第二步第二步:求出对数似然函数求出对数似然函数得极大似然估计量得极大似然估计量由对数函数的单调性及极值点的求法,由对数函数的单调性及极值点的求法,解解 总体总体x x P(l l),例例(习题习题9)求泊松分布中参数求泊松分布中参数l l 的极大似然估计量的极大似然估计量例例(习题习题5)设总体的概率密度为设总体的概率密度为例设总体例设总体x x 的的 概率密度为概率密度为解解2.估计量的评价标准估计量的评价标准(1)无偏性无偏性(2)有效性有效性(3)相合性相合性(一致性一致性)常用的几条标准是:常用的几条标准是:估计量是随机变量,对于不同的样本值会得到估计量是随机变量,对于不同的样本值会得到不同的估计值不同的估计值.(1)无偏性无偏性.真值真值则称则称q q 为为q q 的无偏估计的无偏估计.定义定义:我们希望估计值在未知参数真值附我们希望估计值在未知参数真值附近摆动,而它的近摆动,而它的期望值等于未知参数的真值期望值等于未知参数的真值.这就导出了这就导出了无偏性无偏性这个标准这个标准.例例5 数学期望数学期望m m和方差和方差s s 2的无偏估计量的无偏估计量 设总体设总体x x 的均值为的均值为m m,方差为方差为s s 2(不管服从什不管服从什么分布么分布,只要均值和方差存在只要均值和方差存在),X1,X2,Xn是是来自来自x x 的一个样本的一个样本,由于由于因此因此 是是m m 的无偏估计量的无偏估计量对于样本方差对于样本方差如果设如果设则则ES2=s s 2,即即S2是是 s s 2 的无偏估计量的无偏估计量(称为称为 修正样本方差修正样本方差)(2)有效性有效性.都是参数都是参数q q 的无偏估计量,的无偏估计量,.绿色是采用估计量绿色是采用估计量q q1,红色是采用估计量,红色是采用估计量q q2q q1 较较q q2 有效有效定义定义:例例6 验证样本的加权平均值验证样本的加权平均值:证证也也是数学期望是数学期望m m 的一个无偏估计量的一个无偏估计量,但它不如但它不如 有效有效.因此因此 是是m m 的无偏估计量的无偏估计量 由施瓦茨由施瓦茨(Schwarz)不等式不等式,练习练习(习题习题13)试证下列统计量均为总体期望的无偏估计量,并说明其中试证下列统计量均为总体期望的无偏估计量,并说明其中哪一个最有效:哪一个最有效:(3)相合性相合性(一致性一致性)除除无偏性无偏性和和有效性有效性外外,评价一个估计量是否优评价一个估计量是否优良的第三条称为良的第三条称为一致性一致性.定义定义:例例7 由独立同分布大数定律由独立同分布大数定律 矩估计法的优点是简单易行矩估计法的优点是简单易行,并不需要事先知并不需要事先知道总体是什么分布道总体是什么分布.矩估计具有相合性,经过简单修正也可以做矩估计具有相合性,经过简单修正也可以做到无偏性,但对于高于到无偏性,但对于高于2阶的矩则不能保证有效阶的矩则不能保证有效性,因而矩估计法不一定是性,因而矩估计法不一定是“最佳最佳”的,这是其的,这是其缺点。缺点。作业P111 习题习题5 4(求矩估计量求矩估计量),5,6,13 例例(习题习题6)设总体设总体x x E(l l),概率密度为概率密度为解解5.2 参数的假设检验与区间估计参数的假设检验与区间估计 数理统计的主要任务是从样本出发,对总体的分数理统计的主要任务是从样本出发,对总体的分布作出推断。布作出推断。例例 某厂生产合金钢,其抗拉强度某厂生产合金钢,其抗拉强度X(单位:单位:kg/mm2)可以认为服从正态分布可以认为服从正态分布N(m m,s s 2)。这相当于先提出了一个假设这相当于先提出了一个假设 H0:m m=48,然后要求从样本观测值出发,检验它是否成立。然后要求从样本观测值出发,检验它是否成立。作推断的方法,主要有两种,一种是上作推断的方法,主要有两种,一种是上一节讲的参数估计,另一种是假设检验。一节讲的参数估计,另一种是假设检验。据厂方说,抗拉强据厂方说,抗拉强度的平均值度的平均值m m=48。现抽查现抽查5件样品,测得抗拉强度为件样品,测得抗拉强度为46.8 45.0 48.3 45.1 44.7问厂方的说法是否可信?问厂方的说法是否可信?例例 为了研究饮酒对工作能力的影响,任选为了研究饮酒对工作能力的影响,任选19名工人分名工人分成两组,成两组,一组工人工作前饮一杯酒,一组工人工作前一组工人工作前饮一杯酒,一组工人工作前不饮酒,不饮酒,让他们每人做一件同样的工作,让他们每人做一件同样的工作,测得他们的测得他们的完工时间完工时间(单位:分钟单位:分钟)如下:如下:饮酒者饮酒者 30 46 51 34 48 45 39 61 58 67未饮酒者未饮酒者 28 22 55 45 39 35 42 38 20问饮酒对工作能力是否有显著的影响?问饮酒对工作能力是否有显著的影响?两组工人完成工作的时间,可以分别看作是两个服两组工人完成工作的时间,可以分别看作是两个服从正态分布的总体从正态分布的总体XN(m m1,s s12)和和YN(m m2,s s22),如,如果饮酒对工作能力没有影响,两个总体的均值应该相果饮酒对工作能力没有影响,两个总体的均值应该相等。等。这相当于先提出了一个假设这相当于先提出了一个假设 H0:m m1 =m m2,然后要求从样本观测值出发,检验它是否成立。然后要求从样本观测值出发,检验它是否成立。前前2例有一个共同的特点,例有一个共同的特点,就是先提出一个就是先提出一个假假设设,然后根据样本对所提出的假设作出判断:是然后根据样本对所提出的假设作出判断:是接接受受还是还是拒绝拒绝。我们称这样的问题为我们称这样的问题为假设检验假设检验问题。问题。备择假设:备择假设:原假设不成立时要接的假设,记为原假设不成立时要接的假设,记为H1。判断假设的依据判断假设的依据:实际推断原理实际推断原理 “小概率事件在一次试验中通小概率事件在一次试验中通常是不会发生的常是不会发生的”原假设原假设或或零假设零假设:提出要求检验的假设提出要求检验的假设,记为记为H0例如例如例如例如 H0:m m1=m m2假设检验的方法就是依照上面原理假设检验的方法就是依照上面原理提出待检验的假设;提出待检验的假设;确定在假设成立条件下的确定在假设成立条件下的一个小概率事件;一个小概率事件;由一次试验(抽样)的结果看由一次试验(抽样)的结果看此小概率事件是否发生了,此小概率事件是否发生了,若发生了若发生了,则拒绝假设则拒绝假设,否则接受假设否则接受假设.实际推断原理实际推断原理 “小概率事件在一次试验中通小概率事件在一次试验中通常是不会发生的常是不会发生的”例例1 某自动包装机在正常工作时,每包重量服从某自动包装机在正常工作时,每包重量服从N(105,1.52).104,106,109,104,105,108,108,102,109 今从一批产品中随机检测今从一批产品中随机检测9包结果如下包结果如下:由长期实践可知由长期实践可知,标准差较稳定标准差较稳定,如果标准差保持常数如果标准差保持常数1.5,问机器工作是否正常问机器工作是否正常?问题问题:根据样本值判断根据样本值判断m m=105还是还是m m 1 105.H0:m m=m m0 =105,(H1:m m m m0)先提出待检验的假设先提出待检验的假设定一个定一个“标准标准”,给定,给定a a,0 a a ua a /2=1.96,在显著性水平在显著性水平a a=0.01时时,|u|u1/2=1.96,拒绝拒绝H0,现在求现在求m m的的置信度为置信度为1-a a=0.95的置信区间的置信区间.m m 的的 置信度为置信度为0.95 的置信区间为的置信区间为:今抽今抽9件测量其长度件测量其长度,得数据如下得数据如下(单位单位:mm):例例 设某工件的长度设某工件的长度X服从正态分布服从正态分布N(m m,16),试求参数试求参数m m 的置信水平为的置信水平为95%的置信区间的置信区间.m m 的置信水平为的置信水平为1-a a 的置信区间为的置信区间为得知得知由由n=9,=147.333x m m 的置信水平为的置信水平为0.95的置信区间为的置信区间为(144.720,149.946).142,138,150,165,156,148,132,135,160.u0.05/2=1.96,s s=4,a a=0.05,解解 采用采用检验统计量检验统计量/0nSXtm m-=设总体设总体x x N(m m,s s 2),其中其中m m,s s 2为未知为未知,X1,X2,Xn为来自总体为来自总体x x 的样本的样本,显著性水平为显著性水平为a a要求检验假设要求检验假设 H0:m m=m m02.s s 2 2为未知为未知 ,关于关于m m 的假设检验和区间的假设检验和区间估计估计(1)假设检验假设检验,t-检验法检验法根据根据本章定理本章定理4.3知知,),1(/,00-ntnSXHm m为真时为真时 当当 ,/00Hnsxt过分大时就拒绝过分大时就拒绝 当观察值当观察值 m m-=a a/0m m -ta a/2(n-1)nSXPP|t|ta a/2(n-1)=给定显著性水平给定显著性水平a a,查查t 分布分位数表得分布分位数表得ua a/2(n-1),使使确定拒绝域确定拒绝域接受域接受域拒绝域拒绝域拒绝域拒绝域上述利用上述利用 t 统计统计量得出的检验法量得出的检验法称为称为t 检验法检验法.例例4 在正常工作下在正常工作下,设产品的重量服从正态分布设产品的重量服从正态分布,其数学其数学期望值等于期望值等于14.2,从某批产品中抽取从某批产品中抽取7件件,称得重量分另为称得重量分另为:以显著性水平以显著性水平a a=5%,检验这批产品质量是否合适检验这批产品质量是否合适(指这指这批产品均重为批产品均重为m m=14.2)14.5,14.1,14,13.2,13.8,14.5,13.5解解:(1)H0:m m=14.214.2(3)给定给定a a =0.05,查表查表得得(4)计算计算例例 从某年的新生儿中随机抽取从某年的新生儿中随机抽取20个,测得其平均体重为个,测得其平均体重为3160克,样本标准差为克,样本标准差为300克。据过去统计资料,新生儿体重服克。据过去统计资料,新生儿体重服从正态分布,平均体重为从正态分布,平均体重为3140克。问该年与过去的新生儿体克。问该年与过去的新生儿体重有无显著差异?重有无显著差异?(a a=0.01)解解:(1)H0:m m=m m 0=31403140(3)给定给定a a =0.01,查表查表得得(4)计算计算该年与过去的新生儿体重无显著差异该年与过去的新生儿体重无显著差异(a a=0.01)(2)区间估计区间估计对给定的置信水平对给定的置信水平1-a a,确定分确定分位数位数 t a a/2(n-1)从中解得从中解得于是得于是得m m 的置信度为的置信度为1a a的的置信区间为置信区间为例例4 在正常工作下在正常工作下,设产品的重量服从正态分布设产品的重量服从正态分布,其数学其数学期望值等于期望值等于14.2,从某批产品中抽取从某批产品中抽取7件件,称得重量分别为称得重量分别为:求产品重量数学期望的置信度为求产品重量数学期望的置信度为1-1-a a=95%的置信区间的置信区间14.5,14.1,14,13.2,13.8,14.5,13.5解解:m m 的的 置信度为置信度为1-a a 的置信区间为的置信区间为:例例 假定出生婴儿体重服从正态分布,随机抽取假定出生婴儿体重服从正态分布,随机抽取5名婴儿,名婴儿,测其体重为测其体重为3100,2520,3000,3160,3560,试以,试以95的的置信系数估计婴儿平均体重的区间。置信系数估计婴儿平均体重的区间。故婴儿平均体重的故婴儿平均体重的95%置信区间为:置信区间为:作业P112 习题习题5 14、15、19
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!