(精品)统计学复习

上传人:无*** 文档编号:246571803 上传时间:2024-10-14 格式:PPT 页数:38 大小:559KB
返回 下载 相关 举报
(精品)统计学复习_第1页
第1页 / 共38页
(精品)统计学复习_第2页
第2页 / 共38页
(精品)统计学复习_第3页
第3页 / 共38页
点击查看更多>>
资源描述
,应用统计学,2.4,参数估计,一、点估计,点估计是根据样本构造一个统计量作为对总体的未知参数,的估计量 ,其观察值称为总体未知参数,的估计值。,在实际中应用的比较多的是用样本均值,估计总体均值,E,(,X,),用样本方差估计总体方差。,用样本均值表示观察现象的平均水平,用样本方差表示数据的分散程度。,二、估计量优劣的评选标准,1,)无偏性,:,2,)有效性,:,比 更为有效。(对两个无偏估计),3,)一致性:当,n,时,未知参数,的估计量 (,X,1,,,X,2,,,X,n,)依概率收敛于,。即对于任意的正数,0,,有,4,)均方误差:,均方误差通常用,MSE,表示,估计量的误差(偏离真值)的平方的均值称为均方误差,其表达式为:,当估计值是未知参数的无偏估计时,该项为零,例题:样本均值 是总体期望值,E,(,X,)的一致估计量,解:因为 ,由大数定理,对于任意的,0,,有,即证得结论。,三、区间估计,区间估计是根据样本数据来估计总体未知参数,所在的区间,.,置信区间的表达式:,P,L,U,=1-,称(,L,,,U,)为参数,的置信水平为,1-,的置信区间,.,其中,L,和,U,分别称为置信下限和置信上限,都是样本的函数。,1,、总体,X,N,(,,2,),当已知时,的置信水平为,1-,的置信区间由下面得出:,由此得 的置信水平为,1-,的置信区间为,(一)正态总体均值,的区间估计,2,、未知时,根据定理知,由公式,的置信度为,1-,的置信区间为,(二)总体比例的区间估计,在大样本的情况下,样本比例,p,的分布近似地服从正态分布。即,p,N(P,P(1-P)/n),对于给定的的置信度,1-,,总体比例,P,的,1-,的置信区间为,式中,总体比例用样本比例来估计,且,例:,某厂对一批产品的质量进行抽样检验,采用重复抽样方法抽取样品,200,只,样本的优质品率为,85,,并计算当把握程度为,90,时优质品率的区间范围。,解:已知,n=200,,,p=0.85,,,1,-=0.90,,,Z,/2,=1.645,总体优质品率,P,的置信度为,90,的置信区间为:(,85,4.15,),即:,80.85,P,89.15,若这批产品有,2000,只,则优质品数大约在,2000,80.85,到,2000,89.15,,即,1617,到,1783,只之间。,(三)正态总体方差,2,的置信区间,均值,未知时,利用定理得 ,由概率公式,则可得,2,的置信度为,1-,的置信区间为,2.5,假设检验,一、假设检验的一般思想,例题:一台包装机包得糖重是一个服从正态分布的随机变量,若某日开工后为检验包装机工作是否正常,随机抽取,9,袋,得到样本的平均值为,0.510,(包装机工作正常时,其均值,=0.5,,且根据经验知糖重的标准差,=0.015,),问机器是否工作正常?,为了检验一个假设(如,p0.01,)是否成立,先假定这个假设成立,如果不合理的现象出现,就否定原来的假设。这里的”不合理”,是基于人们在实践中广泛采用的一个原则,小概率事件在一次观察中基本上不会发生。假设检验包括,参数检验;总体分布的检验等;,假设检验用,反证法的思想,可以设想:当包装机工作正常,样本均值,与总体均值,的差异 不会太大,,否则有理由认为包装机的工作不正常。,差异到底多大才足以使我们对原假设产生怀疑呢?因为 是一个随机变量,如果,H,0,为真,即原假设成立,有,|,解:假设包装机工作正常,即假设,H,0,:,=,0,=0.5,;,H,1,:,0,如果取,比较小,当,H,0,为真时,有,由于小概率事件在一般的情况下不会发生,所以如果发生了,则有理由认为原假设不成立。即拒绝原假设,H,0,,接受备择假设,H,1,,认为包装机的工作不正常。,二、双边检验和单边检验,在上面的例题中的拒绝域是双边的,备择假设:,0,。而有时考虑的问题是总体的均值是否增大(或减小),这是个单边检验检验的问题,即备择假设:,0,(,或,0,左侧检验:原假设,H,0,:,0,:备择假设,H,1,:,0,2,、检验的显著性水平,显著性水平在假设检验中起着非常重要的作用,临界值的确定与之有很大的关系,直接影响到检验的结论。,/2,/2,临界值,临界值,接受区域,拒绝区域,拒绝区域,双侧检验的接受区域和拒绝区域图,临界值,接受区域,拒绝区域,右侧检验的接受区域和拒绝区域图,1,-,临界值,接受区域,拒绝区域,左侧检验的接受区域和拒绝区域图,1,-,三、假设检验的两类错误,2,、第二类错误,第二类错误是指当,H,0,不真时,接受,H,0,,也称“取伪错误”(使用者风险率)。犯第二类错误的概率可以表示为:,P,接受,H,0,|H,0,不真,=,两类错误是不可避免的,当样本容量确定时,减少一类错误的概率就要增加另一类错误的概率,只有在样本容量增加时才能使两类错误同时减少。,1,、第一类错误,第一类错误是指当,H,0,为真时,拒绝,H,0,。也称“弃真错误”。(生产者风险率)。犯第一类错误的概率可以表示为:,P,拒绝,H,0,|H,0,为真,=,不能同时降低,两类错误,!,与,的逆向关系,:,H,0,为真,H,0,为假,接受原假设,H,0,正确决策,第二类错误(概率为,),拒绝原假设,H,0,第一类错误(概率为,),正确决策,假设检验中的四种可能情况,犯第一类错误的原因是,小概率事件一般在一次,试验中不可能发生,,所以否定了原假设;,;,犯第二类错误的原因是在一次试验中没有发生小概率事件,也就不能否定原假设。,提出零,(,原,),假设,H,0,与备择(对立)假设,H,1,选择统计量,T=T(X,1,X,2,X,n,),在原假设成立与对立假设成立两种不同情况下,统计量取值范围应有较大不同,对给定的,值,(,通常为,0.05,,,0.01,等,称为显著水平,),确定拒绝,H,0,区域,(,简称拒绝域,),,使得在,H,0,成立情况下,,T,值落入该区域的概率为,检验方法 利用样本计算统计量值,若该值落入拒绝域,则作出拒绝,H,0,结论,否则就作出接受,H,0,结论,.,根据假设和检验水平确定临界值,根据统计量值检验假设是否成立?,四、假设检验的具体步骤,补充内容:总体均值、比例和方差的假设检验,一、,总体方差已知的正态总体均值,的假设检验(,Z,检验),根据概率知识,若 ,则对总体均值的检验过程为:,总体方差已知正态总体均值的检验表,原假设,H,0,(,已知),备择假设,H,1,检验统计量,H,0,为真时统计量的分布,H,0,的拒绝域,=,0,0,(双侧检验),N(0,1),=,0,或(,0,),0,(右侧检验),同上,同上,原假设,H,0,(,未知),备择假设,H,1,检验统计量,H,0,为真时统计量的分布,H,0,的,拒绝域,=,0,0,(双侧检验),t(n-1),=,0,或(,0,),0,(右侧检验),同上,同上,二、总体方差未知的正态总体均值的假设检验(,t,检验),总体方差未知时对总体均值的检验表(小样本),原假设,H,0,(,未知),备择假设,H,1,检验统计量,H,0,为真时统计量的分布,H,0,的,拒绝域,=,0,0,(双侧检验),N(0,1),=,0,或(,0,),0,(右侧检验),同上,同上,总体方差未知时对总体均值的检验表(大样本),当,n,很大时,,t,分布趋于标准正态分布。一般大于,30,,就可以用标准正态分布近似地代替,t,分布。,原假设,H,0,备择假设,H,1,检验统计量,H,0,为真时统计量的分布,H,0,的,拒绝域,P,=,P,0,P,P,0,(双侧检验),N(0,1),P,=,P,0,或(,P,P,0,),P,P,0,(右侧检验),同上,同上,三、总体比例的假设检验,由于样本比例的分布服从二项分布,在大样本的情况下,二项分布近似地服从正态分布,得出检验表如下:,总体比例的检验表(大样本),四、总体方差的假设检验(,2,检验),方差是衡量随机变量的离散程度,主要用于研究或分析生产过程或工作过程的稳定性、均衡性,是在生产过程中质量控制中常用的假设检验问题。常用的分布是正态总体。,原假设,H,0,(,未知),备选假设,H,1,检验统计量,H,0,为真时统计量的分布,H,0,拒绝域,2,=,0,2,2,0,2,(双边检验),2,(n-1),2,=,0,2,或,(,2,0,2,),2,0,2,(右侧检验),同上,同上,正态总体方差的检验表,临界值,接受区域,拒绝区域,右侧检验的,P,值图示,五、假设检验中的,P,值,假设检验的结论依赖,给定的显著性水平,,由检验水平决定接受原假设的临界值。,从另一角度来说,在检验中根据样本计算出,统计量值,C,,在原假设成立的情况下,计算相应的统计量,大于,C,(右侧检验时)的概率值,P,C,,这个值称为假设检验的,P,值。,P,值,统计量的计算值,C,双侧检验:,计算,2P,C,;,当,P,时,,接受零假设。,左侧检验:,计算,P,时,,接受零假设。,右侧检验:,计算,P,C,;,当,P,时,,接受零假设。,P,值与显著性水平,进行比较,,显然,假设检验的,P,值依赖于检验统计量及其计算值,检验方式(双边或单边)。在实际应用时比较方便,不用查表就可以根据显著性水平作出判断,在统计软件的应用中,给出假设检验的,P,值作为显著性检验值,(,sig,).,例:根据过去资料,某厂生产的产品寿命服从正态分布,N,(,1020,,,100,2,)。现从最近生产的产品中随机抽取,16,件,测得样本的平均寿命为,1080,小时,试在,0.05,的显著性判断这批产品的使用寿命是否有显著提高?,解:,H,0,:,=1020,;,H,1,:,1020,(右边检验),检验统计量:,由,=0.05,,查表得临界值,Z,=Z,0.05,=1.6452.4=0.0082,当,P,值时,必有,2.4,落入原假设的拒绝域中,故拒绝原假设,H,0,,接受备选 假设,H,1,。所以,P,值称为拒绝原假设的最小显著性水平。,P,值,临界值,注意:临界值与显著性水平 有关,而,P,值只与样本数据有关。,临界值,临界值,/2,/2,未知参数的置信区间,假设检验的接受区域,假设检验的拒绝区域,假设检验的拒绝区域,区间估计与假设检验的比较,补充复习,方差分析,方差分析用于多个总体(大于两个总体)均值的比较问题。,一、方差分析的基本概念,因子:影响研究对象(某些指标)的因素,一般用大写英文字母表示;如,A,、,B,、,C,等。,水平:反映因子所处的状态,指是可以控制的状态。如因子,A,的状态一般用,A,1,,,A,2,等表示;,单因子试验:在试验中所考察的因素只有一个;,假定条件:,1,、在每个水平,i,下,,x,ij,N(,,,);,2,、,每个水平下的试验次数是任意的;,3,、假设所有总体的方差都是相等;,4,、在原假设下,所有数据都来自同一个正态总体;,5,、所考察的指标是一个随机变量。,二、单因子方差分析原理,单因子方差分析:在一个试验中只考察一个因子,它有,r,个水平,在每一个水平下进行,n,j,次重复试验,其结果列在下表中。,观察值,因 素 水 平,A,1,A,2,A,r,1,2,n,j,x,11,x,12,x,1r,x,21,x,22,x,2r,因素,A,第,j,个水平的平均,如果因子,A,的水平间没有显著差异,则这,n,个数据可以看成是来自于一个正态总体。反之则来自不同的正态总体。设第,i,个水平下的样本平均值为,i,,,i=1,2,r,则,检验因子,A,的水平之间是否有显著差异的问题就是一次假设检验的问题。,方差分析原理,:利用试验数据和总平均差距的离差平方和进行分析,将水平间的偏差平方和和水平内的偏差平方和加以区别,通过比较两类偏差平方和的大小,构造,F,统计量,达到检验的目的。,检验假设:,H,0,:,1,=,2,=,r H,1,:,1,2,r,不全相等,当,H,0,不真时,表示不同水平下的指标有显著差异,或者说因子的作用是非常显著的。,三、离差平方和,若,记总的,数据
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!