参数估计与假设检验课件

上传人:沈*** 文档编号:241779949 上传时间:2024-07-23 格式:PPT 页数:105 大小:9.33MB
返回 下载 相关 举报
参数估计与假设检验课件_第1页
第1页 / 共105页
参数估计与假设检验课件_第2页
第2页 / 共105页
参数估计与假设检验课件_第3页
第3页 / 共105页
点击查看更多>>
资源描述
2024/7/231第五章参数估计与假设检验2024/7/232学习目标l掌握估计量的优良标准l参数区间估计的思想与方法l参数假设检验的临界值法与P值法l一定条件下,样本容量确定的方法2024/7/233重点与难点l参数区间估计的统计思想l估计的可靠程度、平均误差及极限误差的关系l临界值检验法的统计思想lP值的计算方法及其含义的理解l参数抽样检验中的两类错误及其关系2024/7/234 第一节 总体参数估计一、点估计l点估计的定义l点估计量的优良标准二、区间估计l区间估计的定义l总体均值的区间估计三、样本容量的确定2024/7/235一、点估计参数估计按是否考虑估计误差的大小及发生的概率,估计方参数估计按是否考虑估计误差的大小及发生的概率,估计方法分为法分为点估计点估计和和区间估计区间估计两大类。两大类。参数估计参数估计点估计点估计区间估计区间估计(一)点估计的定义 2024/7/236l点估计就是根据总体参数点估计就是根据总体参数 与样本统计量与样本统计量 之间的内在联之间的内在联系,直接用系,直接用 作为总体相应参数作为总体相应参数 的估计量,用样本统的估计量,用样本统 计计量量 的某个取值作为总体参数的某个取值作为总体参数 的估计值的估计值 。l点估计不考虑估计误差的大小,故不需确定估计量的概率点估计不考虑估计误差的大小,故不需确定估计量的概率分布。点估计的主要作用是寻找参数的估计量。分布。点估计的主要作用是寻找参数的估计量。l点估计有很多具体方法,其中矩估计法、最大似然估计法点估计有很多具体方法,其中矩估计法、最大似然估计法是最经典的方法是最经典的方法。l l矩估计法是用样本矩来估计总体矩的方法,如用样本一阶原点矩矩估计法是用样本矩来估计总体矩的方法,如用样本一阶原点矩矩估计法是用样本矩来估计总体矩的方法,如用样本一阶原点矩矩估计法是用样本矩来估计总体矩的方法,如用样本一阶原点矩(样本均值)估计总体一阶原点矩(总体均值)。(样本均值)估计总体一阶原点矩(总体均值)。(样本均值)估计总体一阶原点矩(总体均值)。(样本均值)估计总体一阶原点矩(总体均值)。l l最大似然估计法是利用总体分布信息构造出似然函数,然后对似然最大似然估计法是利用总体分布信息构造出似然函数,然后对似然最大似然估计法是利用总体分布信息构造出似然函数,然后对似然最大似然估计法是利用总体分布信息构造出似然函数,然后对似然函数求解,估计出总体参数的方法。函数求解,估计出总体参数的方法。函数求解,估计出总体参数的方法。函数求解,估计出总体参数的方法。2024/7/237(二)估计量的评价标准无偏性 P()B B B B B BA A A A A A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏对于参数对于参数 ,若有估计量,若有估计量 满足:满足:,则称则称 为为的无偏估计量。的无偏估计量。2024/7/238(二)估计量的评价标准有效性若有若有 ,且,且 ,则,则 相对相对 来来说,是说,是 的有效估计量。的有效估计量。AB 的抽样分布的抽样分布P()2024/7/239(二)估计量的评价标准一致性l当任意给定当任意给定 时,有时,有l即当即当 时,时,依概率收敛于依概率收敛于 ,则称则称 为为 的一致的一致估计量,估计量,具有一致性。具有一致性。l对经常使用的点估计量对经常使用的点估计量 来说,可以证明,它们来说,可以证明,它们分别是总体分别是总体 的无偏、有效且满足一致性要求的优的无偏、有效且满足一致性要求的优良估计量。良估计量。(一)区间估计的含义(二)总体均值的区间估计(三)总体成数的区间估计(四)总体方差的区间估计二、区间估计2024/7/2311(一)区间估计的含义 l在概率意义下计算参数的变化范围,即在概率意义下计算参数的变化范围,即l区间估计中的两个基本要求区间估计中的两个基本要求:l l置信度置信度置信度置信度:表明估计结果的可靠性,我们自然希望随机区间包含被估:表明估计结果的可靠性,我们自然希望随机区间包含被估参数参数 的概率的概率 越大越好,即随机区间越大越好,即随机区间 的平均长度越长越好的平均长度越长越好。l l精确度精确度精确度精确度:表明估计结果的误差大小。我们自然希望包含被估计参数:表明估计结果的误差大小。我们自然希望包含被估计参数 的随机区间的随机区间 的平均长度越短越好。的平均长度越短越好。(一)区间估计的含义 2024/7/2312lNeyman原则原则l即在保证置信度的前提下,尽可能提高估计的精确度。即在保证置信度的前提下,尽可能提高估计的精确度。l区间估计中的一些概念(对于区间估计中的一些概念(对于 )l置信区间:置信区间:l置信限:置信限:l显著性水平:显著性水平:l置信水平:置信水平:l区间估计时应考虑的一些具体问题区间估计时应考虑的一些具体问题,在对总体均值进行区间估在对总体均值进行区间估计时,常常需要考虑总体是否为正态总体、总体方差是否已计时,常常需要考虑总体是否为正态总体、总体方差是否已知、用于构造估计量的样本是大样本知、用于构造估计量的样本是大样本(n30)还是小样本还是小样本(n30)等几种情况。等几种情况。l正正态总体、体、总体方差已知;或非正体方差已知;或非正态总体、体、大大样本条件本条件 l正态总体、总体方差未知、小样本条件正态总体、总体方差未知、小样本条件 (二)总体均值的区间估计2024/7/23141.正态总体、总体方差已知;或非正态总体、大样本条件正态总体、总体方差已知;或非正态总体、大样本条件 l当当总体服从正体服从正态分布分布 时(已知已知),来自,来自该总体体的所有容量的所有容量为n的的样本的均本的均值 也服从正也服从正态分布,分布,的数学的数学期望期望为 ,方差,方差为 ,即,即 l使用正使用正态分布分布统计量量z标准化准化2024/7/2315总体均体均值 在在 置信水平下的置信水平下的置信区置信区间为 总体体标准差未知准差未知时,可用,可用样本本标准差代替准差代替1.正态总体、总体方差已知;或非正态总体、大样本条件正态总体、总体方差已知;或非正态总体、大样本条件 抽抽样样平平均均误误差差抽抽样样极极限限误误差差2024/7/2316000临界值临界值临界值临界值-z-z值值值值/2/2/2 /2/2 统计量统计量统计量统计量1-1-置信水平置信水平置信水平置信水平1.正态总体、总体方差已知;或非正态总体、大样本条件正态总体、总体方差已知;或非正态总体、大样本条件 置信区间图解置信区间图解置信区间图解置信区间图解2024/7/231790%的样本的样本-1.65+1.6599%的样本的样本-2.58+2.58 95%的样本的样本-1.96 x+1.96xx1.正态总体、总体方差已知;或非正态总体、大样本条件正态总体、总体方差已知;或非正态总体、大样本条件 样本均值分布图样本均值分布图样本均值分布图样本均值分布图2024/7/2318【例例】某某审计人人员对一家一家货运公司运公司8042张收款收款账单进行抽行抽样,从而估从而估计这批批账单的平均的平均账面金面金额,该审计人人员随机抽取随机抽取100份份账单,得,得样本平均本平均账面金面金额为500元,方差元,方差为100,给定定显著著性水平性水平 ,检验这批批账单的的账面金面金额均均值的置信区的置信区间。【解解】已知已知 ,置信度置信度 ,查标准正准正态分布表,得分布表,得即有即有95%的把握的把握认为区区间(498.04,501.96)包含)包含总体均体均值。1.正态总体、总体方差已知;或非正态总体、大样本条件正态总体、总体方差已知;或非正态总体、大样本条件 2.正态总体、总体方差未知、小样本2024/7/2319l使用使用 t t 分布统计量估计总体均值分布统计量估计总体均值 l总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间为置信区间为l重复抽样重复抽样 l不重复抽样不重复抽样2024/7/2320【例例】某时装专卖店的管理人员想估计其顾客的平某时装专卖店的管理人员想估计其顾客的平均年龄,随机抽取了均年龄,随机抽取了1616位顾客进行调查,得到样本位顾客进行调查,得到样本均值均值 岁,样本标准差岁,样本标准差S=8S=8岁。假定顾客的年岁。假定顾客的年龄近似服从正态分布,试求该店全部顾客平均年龄龄近似服从正态分布,试求该店全部顾客平均年龄置信度为置信度为95%95%的置信区间。的置信区间。2.正态总体、总体方差未知、小样本2024/7/2321【解解】因为总体因为总体X X近似服从正态分布,未知且近似服从正态分布,未知且n=16n=16,为小样,为小样本,对本,对 进行区间估计须构造进行区间估计须构造t t统计量。根据统计量。根据 ,查,查t t分布表得分布表得 ,故总体均值的故总体均值的95%95%的置信区间为:的置信区间为:即有即有95%95%的把握估计顾客的平均年龄在(的把握估计顾客的平均年龄在(2828,3737)之中。)之中。2.正态总体、总体方差未知、小样本2024/7/2322(三)总体成数的区间估计在大样本条件下(在大样本条件下(或或 大于等于大于等于5),),有:有:则可利用正态统计量则可利用正态统计量 估计总体成数的置信区间。估计总体成数的置信区间。版权所有 BY 统计学课程组(重复抽样)(重复抽样)(不重复抽样)(不重复抽样)(重复抽样)(重复抽样)2024/7/2323(三)总体成数的区间估计l总体比例总体比例 在在1-1-置信水平下置信水平下的置信区间为:的置信区间为:l重复抽样时:重复抽样时:l不重复抽样时:不重复抽样时:版权所有 BY 统计学课程组2024/7/2324(三)总体成数的区间估计【例例】一所大学的保健医生想了解学生戴眼睛的成数,随机一所大学的保健医生想了解学生戴眼睛的成数,随机抽选抽选100100名学生,调查发现其中名学生,调查发现其中3131名戴眼睛,试求全校学生戴名戴眼睛,试求全校学生戴眼镜成数的置信度为眼镜成数的置信度为90%90%的置信区间。的置信区间。【解解】已知已知 ,为大样本,由中,为大样本,由中心极限定理知:心极限定理知:(三)总体成数的区间估计2024/7/2325l总体成数总体成数 未知,样本方差未知,样本方差P P代替,根据代替,根据 ,查标准,查标准正态概率分布表,得正态概率分布表,得 ,则有,则有l即有即有90%90%的把握估计全校学生戴眼镜的成数在的把握估计全校学生戴眼镜的成数在 (23.4%23.4%,38.6%38.6%)之间。)之间。2024/7/2326(四)总体方差的区间估计l估计一个总体的方差或标准差估计一个总体的方差或标准差l假设总体服从正态分布假设总体服从正态分布l总体方差总体方差 的点估计量为的点估计量为 ,且,且l总体方差在总体方差在1-置信水平下的置信区间为置信水平下的置信区间为版权所有 BY 统计学课程组2024/7/2327总体方差的区间估计(图示)1-1-1-1-总体方差总体方差总体方差总体方差1-1-的置信区间的置信区间的置信区间的置信区间自由度为自由度为n-1的的 2024/7/2328【例例】假定假定A品牌品牌25公斤袋装大米的重量服从正公斤袋装大米的重量服从正态分布。分布。现随机抽取随机抽取13袋大米,袋大米,测得重量分得重量分别为24.0、24.2、24.4、24.6、24.7、24.8、25.0、25.1、25.1、25.2、25.3、25.4、25.6公斤,公斤,试以以95%的的置信度估置信度估计该品牌袋装大米重量的品牌袋装大米重量的标准差。准差。版权所有 BY 统计学课程组总体方差的区间估计(例题)2024/7/2329l【解解】由于由于n-1=12,查自由度为,查自由度为12的的 分布表得:分布表得:则有:则有:l由原始数据可计算得到由原始数据可计算得到 ,代入上式便有:,代入上式便有:l即以即以95%的置信度估计该品牌袋装大米重量的标准差的置信度估计该品牌袋装大米重量的标准差 在在0.34-0.79公斤之间。公斤之间。或或总体方差的区间估计(例题)2024/7/2330(五)单侧置信区间l在某些在某些实际问题中,人中,人们可能可能仅仅关心参数的下限或上限,就提关心参数的下限或上限,就提出了出了单侧置信区置信区间的的问题。l单侧置信区置信区间就均就均值而言,有两种表示,即:而言,有两种表示,即:;l单侧置信区置信区间就成数而言,有两种表示,即:就成数而言,有两种表示,即:;l单侧置信区置信区间就方差而言,有两种表示,即:就方差而言,有两种表示,即:;l将双将双侧置信区置信区间的上限与下限的上限与下限对应的分位的分位值按按 或或 确定后,确定后,计算出下限或上限,即可算出下限或上限,即可获得得单侧置信区置信区间的估的估计。2024/7/2331 (六)区间估计的基本步骤?根据上述例子,区根据上述例子,区间估估计的步的步骤可可归纳为:l依依题意确定待估参数;意确定待估参数;l依依题设条件构造与待估参数相条件构造与待估参数相对应的估的估计量;量;l确定估确定估计量的抽量的抽样分布;分布;l依估依估计量的抽量的抽样分布,由分布,由给定的置信度定的置信度计算待估参数置算待估参数置信区信区间的上、下限。的上、下限。2024/7/2332三、样本容量的确定(一)问题的提出(二)处理问题的原则(三)样本容量确定的方法l从推断来看,要达到估计所要求的精确程度,自然要求样从推断来看,要达到估计所要求的精确程度,自然要求样本容量越大越好;本容量越大越好;l从抽样来看,增大样本容量,势必增加人力、物力,从而从抽样来看,增大样本容量,势必增加人力、物力,从而导致调查成本增大,这无疑是不经济的做法。导致调查成本增大,这无疑是不经济的做法。l在抽样推断中,势必要在统计推断的精确度与调查成本这在抽样推断中,势必要在统计推断的精确度与调查成本这一对矛盾间进行权衡一对矛盾间进行权衡。(一)问题的提出2024/7/2334(二)处理问题的原则 1.从抽从抽样角度来看,角度来看,处理推断目理推断目标实现的精确度与的精确度与调查成本成本间矛盾的原矛盾的原则是:在保是:在保证达到推断目达到推断目标的要求下,尽量使的要求下,尽量使调查成本最低。成本最低。2.从推断角度来看,从推断角度来看,处理理统计推断精确度与推断精确度与调查成本成本间矛盾矛盾的原的原则是:在是:在调查成本一定的情况下,尽量使推断目成本一定的情况下,尽量使推断目标实现的效果好,即估的效果好,即估计的精度更高。的精度更高。版权所有 BY 统计学课程组2024/7/2335(三)样本容量的确定(简单随机抽样)l在费用既定的条件下,从精度要求出发,考虑样本容量的大小。l总体要求是,抽样极限误差不能超过给定的允许误差。l样本容量的确定,根据抽样推断的目的不同,有估计总体均值与估计总体成数时的不同的估计公式。2024/7/23361、估计总体均值时,样本容量的确定l抽样极限误差不能超过给定的允许误差的要求,在置信水平抽样极限误差不能超过给定的允许误差的要求,在置信水平 的条件下,有:的条件下,有:l由于由于 或或 ,将其代入上式有:将其代入上式有:(重复抽样重复抽样)(不重复抽样)(不重复抽样)【例例】一家塑料公司想估一家塑料公司想估计其其产品的平均抗拉品的平均抗拉强度,要求以度,要求以95%的置信度使估的置信度使估计值在真在真值附近附近1公斤公斤/平方厘米的范平方厘米的范围内。内。问该公公司司应抽多少个抽多少个样品?品?经验表明,表明,的估的估计值可取可取12.25。1、估计总体均值时,样本容量的确定2024/7/2337【解解】已知已知 根据估计式有:根据估计式有:则该公司至少应抽取则该公司至少应抽取48个样品作试验。个样品作试验。2024/7/2338版权所有 BY 统计学课程组2024/7/23382、估计总体成数时,样本容量的确定l抽样极限误差不能超过给定的允许误差的要求,在置信水平抽样极限误差不能超过给定的允许误差的要求,在置信水平 的条件下,有:的条件下,有:l由于由于 或或 ,将其代入上式有:,将其代入上式有:(不重复抽样不重复抽样)(重复抽样重复抽样)2、估计总体成数时,样本容量的确定【例例】一家市场调查公司欲估计某地区有小汽车的家庭所占一家市场调查公司欲估计某地区有小汽车的家庭所占的比重。要求估计误差不超过的比重。要求估计误差不超过0.05,置信度取,置信度取95%,问应抽,问应抽取多大容量的样本?公司调查人员认为实际的比重不可能大取多大容量的样本?公司调查人员认为实际的比重不可能大于于20%。2024/7/2339【解解】由于由于 ,故有,故有,即该市场调查公司应至少抽取即该市场调查公司应至少抽取246户。户。2024/7/2340 第二节 总体参数检验一、假设检验的一般性问题二、几种常用、具体的参数检验方法版权所有 BY 统计学课程组2024/7/2341一、假设检验的一般性问题l问题的提出 l解决问题的统计思想l单、双侧检验问题l统计结论的两类错误l如何确定原假设与备择假设lP值检验法 l统计检验的显著性l假设检验的步骤2024/7/2342 1、问题的提出l在许多情况下,总体的分布形式可能是已知的,总体在许多情况下,总体的分布形式可能是已知的,总体参数却是未知的,如果欲知道总体参数的取值状态,参数却是未知的,如果欲知道总体参数的取值状态,可对其进行参数估计;可对其进行参数估计;l如果欲知道总体参数是否大于或小于某个假定或给定如果欲知道总体参数是否大于或小于某个假定或给定的值,如食品中农药残留物是否超过标准等类似问题,的值,如食品中农药残留物是否超过标准等类似问题,可运用假设检验的方法进行推断。可运用假设检验的方法进行推断。l实际上,假设检验是从另外一个角度对总体参数进行实际上,假设检验是从另外一个角度对总体参数进行估计。估计。2024/7/23432.假设的建立l所所谓假假设,就是就是对总体参数的具体数体参数的具体数值所作的所作的陈述。假述。假设检验就是运用就是运用样本信息判断假本信息判断假设是否成立的是否成立的过程。程。l假假设检验中需要建立原假中需要建立原假设和和备择假假设。l原假原假设通常是研究者想搜集通常是研究者想搜集证据予以反据予以反对的假的假设,也称零,也称零假假设,用,用 表示。表示。l备择假假设通常是研究者想搜集通常是研究者想搜集证据予以支持的假据予以支持的假设,也称,也称研究假研究假设或替或替换假假设、对立假立假设,用,用 表示。表示。2024/7/23442.假设的建立l原假设与备择假设是对立的。在假设的命题中,需要使原假设与备择假设是对立的。在假设的命题中,需要使用数学关系符号用数学关系符号“,”。l规定:规定:l,或或用在原假设上;用在原假设上;l,或用在备择假设上。,或用在备择假设上。l示例:示例:2024/7/23452.假设的建立【例例】一种零件的生一种零件的生产标准是直径准是直径应为10cm,为对生生产过程程进行控制,行控制,质量量监测人人员定期定期对一台加工机床一台加工机床检查,确定,确定这台机床生台机床生产的零件是否符合的零件是否符合标准要求。如果零件的平均直径准要求。如果零件的平均直径大于或小于大于或小于10cm,则表明生表明生产过程不正常,必程不正常,必须进行行调整。整。试陈述用来述用来检验生生产过程是否正常的原假程是否正常的原假设和被和被择假假设。【解解】:研究者想收集证据予以证明的假设应该是研究者想收集证据予以证明的假设应该是研究者想收集证据予以证明的假设应该是研究者想收集证据予以证明的假设应该是“生产过生产过生产过生产过 程不正常程不正常程不正常程不正常”。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为 H HH0 0 0:10cm 10cm 10cm H HH1 1 1:10cm 10cm 10cm 2024/7/23462.假设的建立【例例】某品牌洗某品牌洗涤剂在它的在它的产品品说明明书中声称:平均中声称:平均净含量含量不少于不少于500克。从消克。从消费者的利益出者的利益出发,有关研究人,有关研究人员要通要通过抽抽检其中的一批其中的一批产品来品来验证该产品制造商的品制造商的说明是否属明是否属实。试陈述用于述用于检验的原假的原假设与与备择假假设。【解解解】:研研研研究究究究者者者者抽抽抽抽检检检检的的的的意意意意图图图图是是是是倾倾倾倾向向向向于于于于证证证证实实实实这这这这种种种种洗洗洗洗涤涤涤涤剂剂剂剂的的的的平平平平均均均均净净净净含含含含量量量量并并并并不不不不符符符符合合合合说说说说明明明明书书书书中中中中的的的的陈陈陈陈述述述述 。建建建建立立立立的的的的原原原原假假假假设设设设和和和和备备备备择择择择假假假假设设设设为为为为 H H0 0:500 500 H H1 1:500”或或“”的假的假设检验,称,称为单侧检验或或单尾尾检验(one-tailed test)l备择假假设的方向的方向为“”,称,称为右右侧检验 2024/7/2357双侧检验与单侧检验的假设形式假假设双双侧检验单侧检验左左侧检验右右侧检验原假原假设H0:=0H0:0H0:0备择假假设H1:0H1:0注:注:研究者感兴趣的是备择假设,单侧假设的方向是按备择假设的研究者感兴趣的是备择假设,单侧假设的方向是按备择假设的方向来说的。方向来说的。2024/7/23585.统计结论的两类错误l第第类错误(弃真弃真错误)l原假原假设为真真时拒拒绝原假原假设l第第类错误的概率的概率记为 ,被称被称为显著性水平著性水平l第第类错误(纳伪错误)l原假原假设为假假时未拒未拒绝原假原假设l第第类错误的概率的概率记为 2024/7/2359假设检验中的两类错误的决策结果陪审团审判陪审团审判H H0 0 检验检验裁决裁决实际情况情况决策决策实际情况情况无罪无罪有罪有罪H0为真真H0为假假无罪无罪正确正确错误未拒未拒绝H0正确决策正确决策第第类错误()有罪有罪错误正确正确拒拒绝H0第第类错误()正确决策正确决策2024/7/2360 错误和 错误的关系同时减少两类错误惟一办法增加样本容量!和和 的关系就像翘的关系就像翘翘板,翘板,小小 就大,就大,大大 就小就小2024/7/2361 5.统计结论的两类错误l 两类错误的关系两类错误的关系1.当其他条件不变时,当其他条件不变时,大则大则小;反之,小;反之,小必导致小必导致大。换句大。换句话说,在其他条件不变的情况下,要同时减小犯两类错误的话说,在其他条件不变的情况下,要同时减小犯两类错误的概率是不可能的。概率是不可能的。2.在规定的显著性在规定的显著性下,单侧检验犯第二类错误的可能性小于双侧检下,单侧检验犯第二类错误的可能性小于双侧检验。故统计检验中,凡能进行单侧检验时就不做双侧检验,以便控验。故统计检验中,凡能进行单侧检验时就不做双侧检验,以便控制制。3.其他情况不变时,增加样本容量其他情况不变时,增加样本容量n,值将有效地的减小。值将有效地的减小。4.其他情况不变,假设下的其他情况不变,假设下的0与与1之间的距离将直接影响之间的距离将直接影响值。值。版权所有 BY 统计学课程组2024/7/2362 5.统计结论的两类错误l两类错误的控制原则两类错误的控制原则 通过以上分析,我们应该在合适的通过以上分析,我们应该在合适的及及的要求下进行统计的要求下进行统计 检验。通常检验。通常值控制在值控制在1%-5%之间,之间,值多控制在值多控制在10%-30%之间。统计学家之间。统计学家Neyman和和Pearson提出的原则是:提出的原则是:版权所有 BY 统计学课程组2024/7/23635.统计结论的两类错误 在控制犯第一在控制犯第一类错误的概率的概率的条件下,使犯第二的条件下,使犯第二类错误的概率的概率尽量减小,其含尽量减小,其含义是:原假是:原假设要受到要受到维护,使它,使它不至于不至于轻易被否定(因易被否定(因为假假设检验时从不利于原假从不利于原假设的角的角度来度来对原假原假设作决策的);若作决策的);若检验结果否定了原假果否定了原假设,则说明否定的理由是充分的;同明否定的理由是充分的;同时,犯第一,犯第一类错误的概率的概率受受到控制,亦即作出否定判断的可靠程度(到控制,亦即作出否定判断的可靠程度(1-)得到了保)得到了保证。版权所有 BY 统计学课程组2024/7/23645.统计结论的两类错误版权所有 BY 统计学课程组本书中的假设检验问题只对犯第一类错误的概率本书中的假设检验问题只对犯第一类错误的概率加以限制,加以限制,而不考虑犯第二类错误的概率而不考虑犯第二类错误的概率,这种方式的假设检验又称,这种方式的假设检验又称为显著性检验,犯第一类错误的概率为显著性检验,犯第一类错误的概率称为显著性水平,其称为显著性水平,其取值通常需考虑:对原假设的信心,以及对原假设作出决策取值通常需考虑:对原假设的信心,以及对原假设作出决策后可能造成的损失,实际运用中,后可能造成的损失,实际运用中,通常取一些标准化的值,通常取一些标准化的值,如:如:0.01、0.05、0.10等。等。2024/7/2365 6.P值检验法(概率值检验法)l在原假设为真的条件下,检验统计量的观察值大于或等在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率于其计算值的概率l双侧检验为分布中两侧面积的总和双侧检验为分布中两侧面积的总和l反映实际观测到的数据与原假设反映实际观测到的数据与原假设 之间不一致的程度之间不一致的程度被称为观察到的被称为观察到的(或实测的或实测的)显著性水平显著性水平l决策规则:决策规则:l若若p值值,则接受则接受H0,拒绝,拒绝H1。版权所有 BY 统计学课程组2024/7/2371 7.统计检验的显著性“显著显著”一词的一般意思不是一词的一般意思不是“重要的重要的”,而,而是是“非偶然非偶然”;但在同级检验中,该词的意;但在同级检验中,该词的意思是思是“只靠抽样的随机性不容易出现这样的只靠抽样的随机性不容易出现这样的结果结果”,其中的,其中的“不容易不容易”用显著性水平来用显著性水平来具体描述,可见显著性水平是用来评估检验具体描述,可见显著性水平是用来评估检验结果的显著性的,结果的显著性的,拒绝原假设,意指检验结拒绝原假设,意指检验结果是显著的;接受原假设,意指检验结果是果是显著的;接受原假设,意指检验结果是不显著的。不显著的。版权所有 BY 统计学课程组2024/7/2372显著性水平和拒绝域(双侧检验)000临界值临界值临界值临界值临界值临界值临界值临界值临界值临界值临界值临界值/2/2 /2/2/2 样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量拒绝拒绝拒绝拒绝HHH000拒绝拒绝拒绝拒绝HHH0001-1-1-置信水平置信水平置信水平置信水平H0:=0,H1:02024/7/2373显著性水平和拒绝域(左侧检验)0 0临界值临界值 样本统计量样本统计量拒绝拒绝H H0 01-1-置信水平置信水平H0:0 0,H1:0 02024/7/2374显著性水平和拒绝域(右侧检验)0 00临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 001-1-1-置信水平置信水平置信水平H0:0,H1:02024/7/2375 8.假设检验的步骤1.根据实际情况,建立原假设根据实际情况,建立原假设H0和备择假设和备择假设H1;2.根据备择假设根据备择假设H1的设定情况,确定检验时单侧检验还是双的设定情况,确定检验时单侧检验还是双侧检验;侧检验;3.确定样本量和显著性水平的大小;确定样本量和显著性水平的大小;4.选择一个合适的统计量做检验量,要求有两个:一是与原选择一个合适的统计量做检验量,要求有两个:一是与原假设假设H0有关;二是能确定其抽样分布;有关;二是能确定其抽样分布;5.根据给定的显著性水平根据给定的显著性水平,在原假设,在原假设H0成立时,通过查表得成立时,通过查表得到到H0的临界值,给出的临界值,给出H0的拒绝域;的拒绝域;8.假设检验的步骤6.抽取样本,收集数据,并依样本观察值计算检验量抽取样本,收集数据,并依样本观察值计算检验量w的的值(用值(用w表示);表示);7.根据根据w计算原假设计算原假设H0的的P值;值;8.作出是否拒绝作出是否拒绝H0的决策。的决策。如果是用临界值法进行检验,则不需要做第(如果是用临界值法进行检验,则不需要做第(7)步)步的工作,接受或拒绝原假设的规则是:若的工作,接受或拒绝原假设的规则是:若w落入落入H0的拒的拒绝域内,则拒绝绝域内,则拒绝H0。如果用。如果用P值法,则不需要做第(值法,则不需要做第(5)步的工作,接受或拒绝原假设的规则是:若步的工作,接受或拒绝原假设的规则是:若P值小于认定值小于认定的显著性水平,则拒绝原假设。的显著性水平,则拒绝原假设。762024/7/232024/7/2377 二、几种常用的参数检验方法版权所有 BY 统计学课程组l统计上假设检验的方法很多,若按检验量服从的分布来划统计上假设检验的方法很多,若按检验量服从的分布来划分,最基本的检验方法有四种,即分,最基本的检验方法有四种,即Z检验(或检验(或U检验)、检验)、t检检验法、验法、检验法和检验法和F检验法。检验法。l考虑到手工计算考虑到手工计算P值的麻烦,以及绝大部分统计软件在输出值的麻烦,以及绝大部分统计软件在输出检验结果时都有检验结果时都有P值,故这里主要介绍临界值检验法。值,故这里主要介绍临界值检验法。2024/7/2378(一)Z 检验法l Z检验法是指以服从正法是指以服从正态分布的分布的统计量构造量构造检验统计量的量的检验方法。方法。l主要主要应用用场合:合:l已知已知总体分布的方差体分布的方差时,对一个正一个正态总体的均体的均值或两个正或两个正态总体体均均值的关系(均的关系(均值之差)之差)进行行检验。l大大样本下(本下(n50)只有只有轻微偏斜的非正微偏斜的非正态总体均体均值和成数和成数检验。l大大样本下未知本下未知总体方差体方差时的均的均值和成数和成数检验。版权所有 BY 统计学课程组2024/7/2379假设形式假设形式:所构造的检验量为:所构造的检验量为:1一个正态总体均值的检验 应用条件:正态总体,方差已知;或大样本下的非正态总体;应用条件:正态总体,方差已知;或大样本下的非正态总体;或大样本下方差未知的正态总体或大样本下方差未知的正态总体2024/7/2380版权所有 BY 统计学课程组【例例5.7】完成生产线上某件工作的平均时间不少于完成生产线上某件工作的平均时间不少于15.5分分钟,标准差为钟,标准差为3分钟。随机抽选的分钟。随机抽选的9名职工讲授一中心方法,名职工讲授一中心方法,训练期结束后这训练期结束后这9名职工完成此项工作的平均时间为名职工完成此项工作的平均时间为13.5分分钟。这个结果是否说明用新方法所需时间比用老方法所需时钟。这个结果是否说明用新方法所需时间比用老方法所需时间短?设间短?设=0.05,并假定完成这项工作的时间服从正态分布。,并假定完成这项工作的时间服从正态分布。1一个正态总体均值的检验 1一个正态总体均值的检验 2024/7/2381【解解】根题意,要检验的假设为:根题意,要检验的假设为:H0:15.5,H1:15.5由于总体服从正态分布且总体方差已知,所以选取检验统计量由于总体服从正态分布且总体方差已知,所以选取检验统计量检验统计量的值为:检验统计量的值为:查表得查表得Z0.05=1.65,由于由于ZZ0.025,所以拒绝原假设所以拒绝原假设H0,即认为这两种,即认为这两种方法不能生产出抗拉强度相同的产品。方法不能生产出抗拉强度相同的产品。2024/7/2385假设形式假设形式构造的检验统计量:构造的检验统计量:3大样本下总体成数的检验 应用条件:总体服从二项分布,大样本应用条件:总体服从二项分布,大样本3大样本下总体成数的检验 【例例5.9】某公司负责人发现开出去的发票有大量笔误,而且某公司负责人发现开出去的发票有大量笔误,而且断定这些发票中,错误的发票占断定这些发票中,错误的发票占20%以上。随机抽取以上。随机抽取400张张检查,发现错误的发票有检查,发现错误的发票有100张,即占张,即占25%,这是否可以证,这是否可以证明负责人的判断正确(明负责人的判断正确(=0.05)?)?3大样本下总体成数的检验 2024/7/2387l【解解】按题意建立假设:按题意建立假设:l选取检验统计量为:选取检验统计量为:l其观测值为:其观测值为:l查表得查表得Z0.05=1.65,由于由于ZZ0.05,所以拒绝,所以拒绝H0,也即认为这些数据可以,也即认为这些数据可以证明负责人的判断是正确的。证明负责人的判断是正确的。2024/7/2388(二)t 检验法t 检验法是在未知法是在未知总体方差而且小体方差而且小样本本时,对一个正一个正态总体体的均的均值或两个正或两个正态总体均体均值的关系(均的关系(均值之差)之差)进行行检验的的方法。方法。2024/7/2389假设形式假设形式:所构造的检验量所构造的检验量1一个正态总体均值的检验应用条件:正态总体,方差未知,小样本应用条件:正态总体,方差未知,小样本2024/7/2390【例例5.10】某汽车轮胎厂声称,该厂一等品轮胎的平均寿命某汽车轮胎厂声称,该厂一等品轮胎的平均寿命在一定的重量和正常行驶条件下,高于在一定的重量和正常行驶条件下,高于25000公里的国家标公里的国家标准。厂家对一个由准。厂家对一个由15个轮胎组成的随机样本进行试验,得到个轮胎组成的随机样本进行试验,得到的平均值和标准差分别为的平均值和标准差分别为27000公里和公里和5000公里。假定轮胎公里。假定轮胎寿命近似服从正态分布,试问可否相信产品质量同厂家所说寿命近似服从正态分布,试问可否相信产品质量同厂家所说的情况相符?(的情况相符?(=0.05)1一个正态总体均值的检验1一个正态总体均值的检验2024/7/2391l【解解】依题意,建立假设依题意,建立假设 H0:25000,H1:25000l由于总体近似服从正态分布,总体方差未知,且为小样本;由于总体近似服从正态分布,总体方差未知,且为小样本;所以选取检验统计量:所以选取检验统计量:l其观测值为:其观测值为:l 查自由度为(查自由度为(n-1)=14的的t分布表得分布表得t0.05(14)=1.7613,由于,由于tt0.05(14),所以只能接受,所以只能接受H0。2两个正态总体均值之差的检验应用条件:两个总体均为正态总体,方差未知但相等,两个小应用条件:两个总体均为正态总体,方差未知但相等,两个小样本样本2024/7/2392假设形式假设形式 所构造的检验量所构造的检验量2两个正态总体均值之差的检验2024/7/2393【例例5.11】有甲、乙两台机床加工同样的产品。从它们所生产的产品中有甲、乙两台机床加工同样的产品。从它们所生产的产品中分别抽取分别抽取8件和件和6件。件。,假定两个总体都服从正态分布,且方差相等,试问甲、乙两台机床加工假定两个总体都服从正态分布,且方差相等,试问甲、乙两台机床加工的产品平均直径有无显著差异?(的产品平均直径有无显著差异?(=0.05)2两个正态总体均值之差的检验2024/7/2394l【解】按题意建立假设:按题意建立假设:H0:1=2,H1:12l根据题意,选取检验统计量根据题意,选取检验统计量l其观测值为:其观测值为:l 查查t分布表得分布表得t0.025(12)=2.1788。由于。由于t0.012l选择检验统计量选择检验统计量l其观测值为:其观测值为:l显著性水平显著性水平=0.01,查自由度为,查自由度为n-1=19的卡方分布表,由于是单侧检的卡方分布表,由于是单侧检验,其临界值为验,其临界值为 因为因为 ,所以拒绝原假设,所以拒绝原假设H0,即这批玻璃杯折射率的标准差显著地超过了标准,该超市应该拒,即这批玻璃杯折射率的标准差显著地超过了标准,该超市应该拒绝接受这批玻璃杯。绝接受这批玻璃杯。(四)F 检验法应用条件应用条件:两个总体均为正态总体,两个小样本。对两个正态:两个总体均为正态总体,两个小样本。对两个正态总体方差间的关系(方差之比)进行检验的方法。总体方差间的关系(方差之比)进行检验的方法。2024/7/2399l假设:l所构造的检验量2024/7/23100【例例5.135.13】在本章例在本章例5.115.11中,我们假定甲、乙两台加工产品中,我们假定甲、乙两台加工产品的直径服从正态分布,且方差相等。但从样本(的直径服从正态分布,且方差相等。但从样本(n n1 1=8,n=8,n2 2=6=6)测得的数据是测得的数据是S S1 12 2=0.17=0.17和和S S2 22 2=0.14=0.14,即两个样本方差存在着一,即两个样本方差存在着一定的差异,因而需要检验这两个总体的方差是否真的相等定的差异,因而需要检验这两个总体的方差是否真的相等(=0.10)?=0.10)?(四)F 检验法2024/7/23101l【解解】由由题意可意可见了假了假设:H0:12=22,H1:1222l要要检验原假原假设是否成立,可是否成立,可选择 为检验统计量,本例量,本例的的观测值为:F=0.17/0.14=1.214;l在在显著性水平著性水平=0.10的条件下,的条件下,查自由度自由度为n1-1=7,n2-1=5的的F分布,其分布,其临界界值为:F0.05(7,5)=4.88,F0.95(7,5)=1/3.97=0.25l因因为4.881.2140.25,F0.05(7,5)FF0.95(5,7),所以接受原假所以接受原假设H0,即即虽然然这两个两个样本的方差存在一定的差异,但本的方差存在一定的差异,但这种差异并不种差异并不显著。著。(四)F 检验法注:注:2024/7/23102 检验法与 F 检验法的总结 检验法和检验法和 F 检验法都是针对方差的检验法,检验法都是针对方差的检验法,检验检验法检验一个正态总体的方差,法检验一个正态总体的方差,F 检验法检验两个正态总检验法检验两个正态总体的方差之比。体的方差之比。版权所有 BY 统计学课程组2024/7/23103 本章小结版权所有 BY 统计学课程组l参数估计是统计推断的重要内容,分为点估计和区间估计两参数估计是统计推断的重要内容,分为点估计和区间估计两 种形式。在求点估计时,要注意估计的优良性要求,即无偏种形式。在求点估计时,要注意估计的优良性要求,即无偏 性、有效性和一致性。性、有效性和一致性。l在对总体均值进行区间估计时,常常需要考虑总体是否为正在对总体均值进行区间估计时,常常需要考虑总体是否为正 态总体、总体方差是否已知、用于构造估计量的样本是大样态总体、总体方差是否已知、用于构造估计量的样本是大样 本(本(n30)还是小样本()还是小样本(n30)等几种情况。)等几种情况。l确定最佳样本容量有着深刻的经济意义,确定最佳样本容量有着深刻的经济意义,n从从 中求解。中求解。2024/7/23104l假设检验也是统计推断的重要内容,检验的统计思想运用假设检验也是统计推断的重要内容,检验的统计思想运用了概率意义上的反证法,基础是样本数据,依据是小概率了概率意义上的反证法,基础是样本数据,依据是小概率原理。由于检验是从不利于原假设的角度来设计的,故对原理。由于检验是从不利于原假设的角度来设计的,故对原假设按一定的检验规则作决策,只有拒绝与否的问题,原假设按一定的检验规则作决策,只有拒绝与否的问题,而无原假设本身对错的问题。而无原假设本身对错的问题。lZ Z检验法与检验法与t t检验法都针对均值进行检验,正态分布总体下,检验法都针对均值进行检验,正态分布总体下,已知总体方差时用已知总体方差时用Z Z检验法;未知总体方差时用检验法;未知总体方差时用t t检验法;检验法;大样本非整天分布总体下的成数检验用大样本非整天分布总体下的成数检验用Z Z检验法。检验法。版权所有 BY 统计学课程组2024/7/23105 本章结束!版权所有 BY 统计学课程组
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!