统计学(第7章)资料课件

上传人:沈*** 文档编号:241718900 上传时间:2024-07-18 格式:PPT 页数:103 大小:1,021.50KB
返回 下载 相关 举报
统计学(第7章)资料课件_第1页
第1页 / 共103页
统计学(第7章)资料课件_第2页
第2页 / 共103页
统计学(第7章)资料课件_第3页
第3页 / 共103页
点击查看更多>>
资源描述
统计学统计学第七章第七章 推断统计推断统计统计抽样统计抽样参数估计参数估计假设检验假设检验统计学统计学2024/7/18第七章 推断统计2第一节第一节 抽样推断的基本概念抽样推断的基本概念一、一、抽样推断的含义抽样推断的含义u抽抽样样推推断断,也也称称统统计计抽抽样样,是是在在抽抽样样调调查查的的基基础础上上,利利用用样样本本的的实实际际资资料料计计算算样样本本指指标标,并并据据此此推推算算总总体体相相应应数数量量特特征征的的一一种统计分析方法。种统计分析方法。u抽抽样样推推断断就就是是根根据据样样本本的的平平均均数数、成成数数(也也称称比比率率)来来推推断断经经济济社社会会现现象象指指标标总总体的平均数和相对数(成数)。体的平均数和相对数(成数)。统计学统计学2024/7/18第七章 推断统计3二、抽样推断的特点二、抽样推断的特点抽样推断是由部分(样本)来推断总体的抽样推断是由部分(样本)来推断总体的一种认识方法一种认识方法抽样推断是建立在科学原则(随机原则抽抽样推断是建立在科学原则(随机原则抽样)基础上的样)基础上的抽样推断运用的是概率估计的方法抽样推断运用的是概率估计的方法抽样推断的误差是可以事先计算并加以控抽样推断的误差是可以事先计算并加以控制的制的统计学统计学2024/7/18第七章 推断统计4三、抽样推断的作用三、抽样推断的作用u用用更更少少的的人人力力、时时间间、费费用用来来达达到到对对总总体的认识体的认识u解决不能进行全面调查的检验问题解决不能进行全面调查的检验问题u对对普普查查质质量量进进行行检检查查和和修修正正:主主要要是是修修正登记性误差正登记性误差u应应用用于于时时间间紧紧迫迫不不可可能能取取得得全全面面资资料料时时的分析研究的分析研究统计学统计学2024/7/18第七章 推断统计5四、抽样推断的内容四、抽样推断的内容u参数估计:依据所获得的样本观察资料,参数估计:依据所获得的样本观察资料,对所研究对象总体的水平、结构、规模等对所研究对象总体的水平、结构、规模等数量特征进行估计数量特征进行估计。u假设检验:依据样本观察资料对总体综合假设检验:依据样本观察资料对总体综合指标的某种假设检验,来判断这种假设的指标的某种假设检验,来判断这种假设的真伪。真伪。统计学统计学2024/7/18第七章 推断统计6第二节第二节 有关抽样的基本概念有关抽样的基本概念一、总体的相关概念一、总体的相关概念(一)(一)总体总体(母体、全及总体)(母体、全及总体)u一般用一般用 N 表示总体的单位数。表示总体的单位数。u一个总体的指标数值是确定的、唯一的,一个总体的指标数值是确定的、唯一的,所以称为参数。所以称为参数。统计学统计学2024/7/18第七章 推断统计7(二)总体参数(二)总体参数1 1、总体的平均数与方差、总体的平均数与方差u总体平均数总体平均数对未整理资料:对未整理资料:对经过整理的资料:对经过整理的资料:是唯一的、是唯一的、确定的。确定的。统计学统计学2024/7/18第七章 推断统计8对未整理资料:对未整理资料:或或对经过整理的资料:对经过整理的资料:或或总体的方差总体的方差(或标准差)(或标准差):无法直接求得无法直接求得统计学统计学2024/7/18第七章 推断统计92 2、总体的成数和方差:、总体的成数和方差:统计学统计学2024/7/18第七章 推断统计10二、样本的相关概念二、样本的相关概念1 1、样本容量与样本个数、样本容量与样本个数u样本容量:样本容量是指一个样本包含的样本容量:样本容量是指一个样本包含的单位数。一般用单位数。一般用 n 表示。表示。u样本个数:又称样本可能数目,是指从一样本个数:又称样本可能数目,是指从一个总体可能抽取的样本个数。样本个数的个总体可能抽取的样本个数。样本个数的多少与抽样方法有关。多少与抽样方法有关。统计学统计学2024/7/18第七章 推断统计112 2、样本统计量、样本统计量u样本总体的指标数值是个随机变量,样本总体的指标数值是个随机变量,所以称为样本统计量或样本估计量。所以称为样本统计量或样本估计量。u样本统计量是样本的一个函数。样本统计量是样本的一个函数。可通过样本资可通过样本资料求得。料求得。统计学统计学2024/7/18第七章 推断统计12(1 1)样本的均值与修正方差)样本的均值与修正方差或或 或或 统计学统计学2024/7/18第七章 推断统计13(2 2)样本的成数与方差:)样本的成数与方差:统计学统计学2024/7/18第七章 推断统计14三、抽样的组织方式三、抽样的组织方式(一)简单随机抽样(纯随机抽样)(一)简单随机抽样(纯随机抽样)1 1、重复抽样、重复抽样u也称回置抽样,它是指每次抽取一个样本登记后再将也称回置抽样,它是指每次抽取一个样本登记后再将它放回总体中参加下一次抽取。它放回总体中参加下一次抽取。u重复抽样的特点是:每次抽取样本是在完全相同的条重复抽样的特点是:每次抽取样本是在完全相同的条件下进行的,总体中每个单位中选的机会在各次都完件下进行的,总体中每个单位中选的机会在各次都完全相等。全相等。u从总体从总体 N 个单位中,用重复抽样的方法,随机抽取个单位中,用重复抽样的方法,随机抽取一个容量为一个容量为 n 的样本,则我们共可抽取的样本,则我们共可抽取 A=Nn/n!个不个不同的样本。同的样本。统计学统计学2024/7/18第七章 推断统计152 2、不重复抽样、不重复抽样u也称不回置抽样,它是指每次抽取一个样本登记也称不回置抽样,它是指每次抽取一个样本登记后不再放回总体中参加下一次抽取。后不再放回总体中参加下一次抽取。u每一个样本单位只有一次被抽取的可能。每一个样本单位只有一次被抽取的可能。u特点:样本由连续特点:样本由连续 n 次抽取的结果构成,实质上次抽取的结果构成,实质上等于一次同时从总体中抽取等于一次同时从总体中抽取 n 个样本单位。个样本单位。u从总体从总体 N 个单位中,全部可能抽取的不同样本数个单位中,全部可能抽取的不同样本数目为目为 A=N!/(N-n)!n!。统计学统计学2024/7/18第七章 推断统计16(二)等距抽样(二)等距抽样(又称机械抽样、系统抽样)(又称机械抽样、系统抽样)u先根据某一标志对总体各单位进行排队,先根据某一标志对总体各单位进行排队,然后按一定顺序和间隔来抽取样本单位的然后按一定顺序和间隔来抽取样本单位的一种抽样组织方式。一种抽样组织方式。u等距抽样一般都是不重复抽样。等距抽样一般都是不重复抽样。u等距抽样时总体各单位排序的标志,可以等距抽样时总体各单位排序的标志,可以是无关标志,也可以是有关标志。(见下是无关标志,也可以是有关标志。(见下页)页)统计学统计学2024/7/18第七章 推断统计171 1、无序等距抽样、无序等距抽样u按无关标志排队进行等距抽样。按无关标志排队进行等距抽样。u抽样距离:抽样距离:k=N/n所谓无关标志,是指和单位标志值的大小无所谓无关标志,是指和单位标志值的大小无关或不起主要作用的标志。如时间顺序或地关或不起主要作用的标志。如时间顺序或地理位置。理位置。所谓有关标志,就是作为排序的标志与单位所谓有关标志,就是作为排序的标志与单位标志值的大小有密切的关系。如工资收入、标志值的大小有密切的关系。如工资收入、学生成绩。学生成绩。第一组随机抽取第一组随机抽取一个,以后每隔一个,以后每隔k个抽取一个个抽取一个。统计学统计学2024/7/18第七章 推断统计182 2、有序等距抽样、有序等距抽样u按有关标志排队进行等距抽样。按有关标志排队进行等距抽样。u可分为:可分为:半距起点等距抽样:半距起点等距抽样:对称等距抽样(常用):假定第对称等距抽样(常用):假定第一一组随机抽组随机抽取第取第 a 个,则第二组起分别为:个,则第二组起分别为:2k-a,2k+a,4k-a,4k+a,6k-a,6k+a,第一组抽第第一组抽第k/2个,以后个,以后每隔每隔k个抽个抽取一个取一个。统计学统计学2024/7/18第七章 推断统计19(三)类型抽样(三)类型抽样(又称分层抽样)(又称分层抽样)u类型抽样:是将总体各单位按主要标志进行分组,类型抽样:是将总体各单位按主要标志进行分组,然后再从各组中按随机原则抽取一定比例的单位然后再从各组中按随机原则抽取一定比例的单位构成样本。构成样本。u类型抽样的特点是把分类法和随机原则结合起来。类型抽样的特点是把分类法和随机原则结合起来。由于它是按一定比例在每一组中抽样,所以不存由于它是按一定比例在每一组中抽样,所以不存在组间误差。在分组时应尽量将变异较小的同类在组间误差。在分组时应尽量将变异较小的同类单位归入一组,通过扩大组间差异来达到缩小组单位归入一组,通过扩大组间差异来达到缩小组内差异的目的,所以其抽样误差一般小于简单随内差异的目的,所以其抽样误差一般小于简单随机抽样的误差。机抽样的误差。统计学统计学2024/7/18第七章 推断统计20续前:续前:u类型抽样分组时,各组单位数可多可少,类型抽样分组时,各组单位数可多可少,但各组的抽样比例最好保持相同,以避免但各组的抽样比例最好保持相同,以避免各组抽样比例不同而引起的误差。各组抽样比例不同而引起的误差。u式中:式中:Ni 表示各组单位数;表示各组单位数;ni 表示分配到各组的表示分配到各组的抽样单位数目。抽样单位数目。统计学统计学2024/7/18第七章 推断统计21(四)整群抽样(四)整群抽样u整群抽样也称整组抽样,它是将总体各整群抽样也称整组抽样,它是将总体各单位划分成若干群,然后从中随机抽取单位划分成若干群,然后从中随机抽取部分群,并对选中群的所有单位进行全部分群,并对选中群的所有单位进行全面调查的抽样组织方式。面调查的抽样组织方式。统计学统计学2024/7/18第七章 推断统计22(五)方便抽样(五)方便抽样u是一种非随机抽样组织方式。是一种非随机抽样组织方式。u具有相对容易选择样本和收集数据的优具有相对容易选择样本和收集数据的优点。点。u一个方便抽样可能得到好的结论,也可一个方便抽样可能得到好的结论,也可能不能。能不能。u没有公认的程序可对其结果的质量进行没有公认的程序可对其结果的质量进行分析和推断。分析和推断。u如:教师以所授课的班级作为样本。如:教师以所授课的班级作为样本。统计学统计学2024/7/18第七章 推断统计23(六)判断抽样(六)判断抽样u另一种非随机抽样组织方式。另一种非随机抽样组织方式。u选择总体中认为最具代表性的单位作为选择总体中认为最具代表性的单位作为样本。样本。u判断抽样的质量依赖于人们判断的好坏。判断抽样的质量依赖于人们判断的好坏。统计学统计学2024/7/18第七章 推断统计24四四、样样本本平平均均数数的的分分布布规规律律及及和和总总体分布的关系体分布的关系1 1、样本平均数的分布规律、样本平均数的分布规律u以相同的样本容量以相同的样本容量 n,从总体中重复地抽,从总体中重复地抽取很多样本,每个样本有一个平均数,这取很多样本,每个样本有一个平均数,这一系列平均数:一系列平均数:就组成了一就组成了一个样本平均数的总体。个样本平均数的总体。思考一下:思考一下:有多少个?有多少个?统计学统计学2024/7/18第七章 推断统计25续前:续前:u根据中心极限定理,如果总体为根据中心极限定理,如果总体为N()时,样本平均数)时,样本平均数 准确地服从准确地服从N()正态分布,)正态分布,而不论样本容量而不论样本容量 n 的大小,的大小,都是如此。都是如此。u如果不知道原来的总体是否为正态分布,如果不知道原来的总体是否为正态分布,只要样本容量只要样本容量 n 的足够大(一般不小于的足够大(一般不小于30),则样本平均数),则样本平均数 近似地服从近似地服从 N()正态分布正态分布。统计学统计学2024/7/18第七章 推断统计26续前:续前:u样本分布平均数:样本分布平均数:u式中:式中:为样本平均数,为样本平均数,A 为总体中抽出的所为总体中抽出的所有样本可能数目。有样本可能数目。统计学统计学2024/7/18第七章 推断统计272 2、数学性质、数学性质(1 1)所有样本平均数的平均数等于总)所有样本平均数的平均数等于总体平均数:体平均数:统计学统计学2024/7/18第七章 推断统计28(2 2)样本平均数的标准误差)样本平均数的标准误差 (有别于总体分布在标准差的叫法)(有别于总体分布在标准差的叫法)u重复抽样情况:重复抽样情况:u不重复抽样情况:不重复抽样情况:u注:不重复抽样排除了注:不重复抽样排除了“每次抽出都是极端值每次抽出都是极端值”的可能,的可能,因此平均误差要比重复抽样小。但当因此平均误差要比重复抽样小。但当N远大于远大于n时,可以时,可以都按重复抽样处理。都按重复抽样处理。不重复抽样:不重复抽样:修正系数修正系数 实际上是无实际上是无法计算的法计算的 统计学统计学2024/7/18第七章 推断统计29五、样本成数的分布规律五、样本成数的分布规律1 1、样本成数、样本成数 p 的分布的分布u离散型的二项分布离散型的二项分布u当同时满足:当同时满足:n p 5 和和 n(1-p)5时u可用正可用正态分布近似。分布近似。统计学统计学2024/7/18第七章 推断统计302、样本成数的平均数、样本成数的平均数u样本成数的平均数等于总体成数。样本成数的平均数等于总体成数。统计学统计学2024/7/18第七章 推断统计313 3、样本成数的标准误差、样本成数的标准误差u重复抽样情况:重复抽样情况:u不重复抽样情况:不重复抽样情况:统计学统计学2024/7/18第七章 推断统计32第三节第三节 抽样误差抽样误差一、抽样误差的含义一、抽样误差的含义1、抽样误差(、抽样误差()u是指由于随机抽样的偶然因素使样本各单位的结构不足是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标以代表总体各单位的结构,而引起抽样指标和全及指标的绝对离差。的绝对离差。u抽样误差不是由调查失误所引起的,而是随机抽样所特抽样误差不是由调查失误所引起的,而是随机抽样所特有的误差。有的误差。u抽样误差是一种代表性误差。抽样误差是一种代表性误差。u抽样误差是不可能计算的,但可以通过抽样设计,把它抽样误差是不可能计算的,但可以通过抽样设计,把它缩小到最低限度,或控制在调查要求的允许范围之内。缩小到最低限度,或控制在调查要求的允许范围之内。统计学统计学2024/7/18第七章 推断统计332 2、影响抽样误差大小的因素、影响抽样误差大小的因素u总体各单位标志值的变异程度总体各单位标志值的变异程度u样本单位数样本单位数u抽样方法和抽样组织方式抽样方法和抽样组织方式统计学统计学2024/7/18第七章 推断统计34二、简单随机抽样的平均误差二、简单随机抽样的平均误差u抽样平均误差是反映抽样误差一般水平的抽样平均误差是反映抽样误差一般水平的指标。是所有可能抽取的样本平均数或成指标。是所有可能抽取的样本平均数或成数的标准差。数的标准差。u由于所有样本平均数的平均数正好等于总由于所有样本平均数的平均数正好等于总体平均数,而所有样本成数的平均数正好体平均数,而所有样本成数的平均数正好等于总体成数,因此,抽样平均数或成数等于总体成数,因此,抽样平均数或成数的标准差恰好反映了抽样平均数或成数与的标准差恰好反映了抽样平均数或成数与总体平均数或成数的平均离差程度。总体平均数或成数的平均离差程度。统计学统计学2024/7/18第七章 推断统计35(一)重复抽样条件下(一)重复抽样条件下 平均数的抽样平均误差平均数的抽样平均误差u式中:式中:表示平均数的抽样平均误差,与前述的表示平均数的抽样平均误差,与前述的标准误差标准误差()同义。)同义。2已知已知的情况的情况S为样本均值的为样本均值的修正标准差修正标准差统计学统计学2024/7/18第七章 推断统计36(二二)不不重重复复抽抽样样条条件件下下平平均均数数的的抽抽样平均误差样平均误差u注意上式中方差的应用:注意上式中方差的应用:(1)当小样本条件下()当小样本条件下(n 30):):(2)当大样本条件下:)当大样本条件下:修正方差修正方差N很大时很大时统计学统计学2024/7/18第七章 推断统计37(三)成数的抽样平均误差(三)成数的抽样平均误差1、重复抽样情况:重复抽样情况:2、不重复抽样情况:、不重复抽样情况:N很大时很大时示例示例统计学统计学2024/7/18第七章 推断统计38三、等距抽样的平均误差三、等距抽样的平均误差u一般按简单不重复随机抽样的抽样平均误一般按简单不重复随机抽样的抽样平均误差公式来代替。差公式来代替。统计学统计学2024/7/18第七章 推断统计39四、分类抽样的平均误差四、分类抽样的平均误差u分类抽样是在每一组中按一定的比例抽取分类抽样是在每一组中按一定的比例抽取样本,所以,不存在组与组之间的抽样误样本,所以,不存在组与组之间的抽样误差。差。u但每组内是按简单随机抽样进行的,所以但每组内是按简单随机抽样进行的,所以存在组内的抽样误差。存在组内的抽样误差。统计学统计学2024/7/18第七章 推断统计401 1、变量与组内方差的均值计算、变量与组内方差的均值计算u式中:式中:f 表示各组内抽取的单位数;表示各组内抽取的单位数;f=n 表表示样本容量,示样本容量,S2 样本各组的组内方差。样本各组的组内方差。统计学统计学2024/7/18第七章 推断统计412、在重复抽样条件下,分类抽样平均、在重复抽样条件下,分类抽样平均误差的计算公式:误差的计算公式:统计学统计学2024/7/18第七章 推断统计423、不重复抽样条件下,分类抽样平均、不重复抽样条件下,分类抽样平均误差的计算公式:误差的计算公式:示例示例统计学统计学2024/7/18第七章 推断统计43五、整群抽样的平均误差五、整群抽样的平均误差u整群抽样实质整群抽样实质是以各群代替各单位之后的是以各群代替各单位之后的简单随简单随机抽样。所以它只存在群间方差,不存在群内方机抽样。所以它只存在群间方差,不存在群内方差。差。u整群抽样对整群作了全面调查,并以群平均数作整群抽样对整群作了全面调查,并以群平均数作为每一群的标志值,而各群平均数的方差正是群为每一群的标志值,而各群平均数的方差正是群间方差。间方差。u我们只讨论各群单位数相同的情况。这样各群平我们只讨论各群单位数相同的情况。这样各群平均数的平均数、各群平均数的方差,只需用简单均数的平均数、各群平均数的方差,只需用简单算术平均法计算就可以了。算术平均法计算就可以了。统计学统计学2024/7/18第七章 推断统计441 1、样本平均数计算、样本平均数计算u设将总体的全部单位设将总体的全部单位N划分成划分成R群,每群包群,每群包括括m个单位。再从个单位。再从R群中随机抽取群中随机抽取 r 群构成群构成一个样本。一个样本。u整群抽样都是采用不重复抽样方法整群抽样都是采用不重复抽样方法,则:,则:式中:式中:表示样本各群的平均数;表示样本各群的平均数;表示各群平均数的平均数。表示各群平均数的平均数。统计学统计学2024/7/18第七章 推断统计452 2、样本群间方差、样本群间方差2 的计算的计算 u小样本情形(小样本情形(n 30):):用此代替总用此代替总体方差体方差2 u大样本情形大样本情形(n 30):):统计学统计学2024/7/18第七章 推断统计463 3、整群抽样平均误差计算、整群抽样平均误差计算u用总体群数用总体群数R来替代总体单位数来替代总体单位数N,用样,用样本群数本群数 r 来替代样本单位数来替代样本单位数 n。u计算公式:计算公式:不重复抽样:不重复抽样:修正系数修正系数 示例示例统计学统计学2024/7/18第七章 推断统计474、成数的样本群平均数和样本群间方差、成数的样本群平均数和样本群间方差u或:或:统计学统计学2024/7/18第七章 推断统计485 5、成数的整群抽样平均误差、成数的整群抽样平均误差示例示例统计学统计学2024/7/18第七章 推断统计49第四节第四节 参数估计参数估计u参数估计就是指利用实际调查计算的样本参数估计就是指利用实际调查计算的样本指标值来估计相应的总体指标的数值。指标值来估计相应的总体指标的数值。u总体指标是表明总体数量特征的参数,所总体指标是表明总体数量特征的参数,所以称为参数估计。以称为参数估计。u总体参数估计有点估计和区间估计两种,总体参数估计有点估计和区间估计两种,其中区间估计是体现抽样估计科学性的主其中区间估计是体现抽样估计科学性的主要参数估计方法。要参数估计方法。统计学统计学2024/7/18第七章 推断统计50一、优良估计标准一、优良估计标准1 1、无偏性、无偏性 u要求在总体中所有可能抽取的样本统计量的平要求在总体中所有可能抽取的样本统计量的平均数应等于被估计的总体参数。均数应等于被估计的总体参数。2 2、一致性、一致性u就是要求当样本容量就是要求当样本容量 n充分大时,样本统计量充分大时,样本统计量也充分靠近总体参数。也充分靠近总体参数。3 3、有效性、有效性u就是要求作为优良估计量的方差应该比其他估就是要求作为优良估计量的方差应该比其他估计量的方差小。计量的方差小。统计学统计学2024/7/18第七章 推断统计51二、总体参数的点估计二、总体参数的点估计u点估计又称定值估计、直接估计,它是直点估计又称定值估计、直接估计,它是直接以样本统计量作为相应总体参数的估计接以样本统计量作为相应总体参数的估计量。量。u即用即用 表示总体的估计值,则:表示总体的估计值,则:示例示例统计学统计学2024/7/18第七章 推断统计52三、总体参数的区间估计三、总体参数的区间估计u一般形式一般形式:点估计点估计抽样极限误差抽样极限误差u区间估计的目的:提供点估计与总体区间估计的目的:提供点估计与总体参数的接近程度的信息。参数的接近程度的信息。统计学统计学2024/7/18第七章 推断统计53(一)抽样极限误差的概念(一)抽样极限误差的概念 u抽样极限误差是指在一定概率条件下抽样抽样极限误差是指在一定概率条件下抽样误差的可能范围,也称允许误差。误差的可能范围,也称允许误差。u用用 、分别表示平均数和成数的抽分别表示平均数和成数的抽样极限误差。即:样极限误差。即:和和统计学统计学2024/7/18第七章 推断统计54(二)置信度:(二)置信度:1-u抽样极限误差的抽样误差的可能范围而不抽样极限误差的抽样误差的可能范围而不是完全肯定的范围,且这个可能范围的大是完全肯定的范围,且这个可能范围的大小是与可能性的大小即概率紧密联系的。小是与可能性的大小即概率紧密联系的。u抽样极限误差抽样极限误差越大,总体参数落在估计越大,总体参数落在估计区间的概率就越大;区间的概率就越大;越小,总体参数越小,总体参数落在估计区间的概率就越小。这个概率叫落在估计区间的概率就越小。这个概率叫置信度置信度,用,用1-表示,其是表示,其是被称为估计误被称为估计误差的显著性水平,简称显著性水平。差的显著性水平,简称显著性水平。统计学统计学2024/7/18第七章 推断统计55(三)概率度与概率之间的数学关系(三)概率度与概率之间的数学关系u概率度:是一个确定估计区间的度量值。概率度:是一个确定估计区间的度量值。u正态分布条件下,正态分布条件下,概率度与概率概率度与概率之间的关系:之间的关系:概率度(概率度(t)概率概率F(t)=1-1.001.962.003.000.68270.95000.95450.9973统计学统计学2024/7/18第七章 推断统计56(四)区间估计的基本公式(四)区间估计的基本公式1 1、大样本条件下、大样本条件下u在大样本的条件下,样本平均数的分布接近于在大样本的条件下,样本平均数的分布接近于 N()的正态分布。因此,若给()的正态分布。因此,若给(1),),可以由正态分布表求得概率度可以由正态分布表求得概率度 t,使,使 在区间(在区间()的概率为()的概率为(1)。即:)。即:统计学统计学2024/7/18第七章 推断统计57所以:所以:u给定概率(给定概率(1),抽样极限误差),抽样极限误差 的计算的计算公式为:公式为:示例示例统计学统计学2024/7/18第七章 推断统计582 2、小样本条件下、小样本条件下u计算公式同上。计算公式同上。u但是,给定概率(但是,给定概率(1-)应通过自由度为)应通过自由度为(n-1)的)的 t 分布中来确定概率度分布中来确定概率度 t。统计学统计学2024/7/18第七章 推断统计59(五)应用中的建议(五)应用中的建议u如果总体服从正态分布,区间估计是精确如果总体服从正态分布,区间估计是精确的。如果总体不服从正态分布,区间估计的。如果总体不服从正态分布,区间估计是近似的。是近似的。u但当但当n 30时,估计精度已经足够了。如时,估计精度已经足够了。如果总体不是正态分布但是大致对称,则果总体不是正态分布但是大致对称,则n 15时才能得到较好的近似。时才能得到较好的近似。区间估计图示区间估计图示统计学统计学2024/7/18第七章 推断统计60(六)区间估计的方法(六)区间估计的方法1、给定概率保证程度求抽样极限误差、给定概率保证程度求抽样极限误差u即:在给定概率保证程度(即:在给定概率保证程度(1)条件下,)条件下,已知已知 t、,求抽样极限误差,求抽样极限误差 。练习题练习题1统计学统计学2024/7/18第七章 推断统计612 2、给定抽样极限误差求概率保证程度、给定抽样极限误差求概率保证程度u即在公式即在公式 中,已知中,已知、,求,求 t。练习题练习题2统计学统计学2024/7/18第七章 推断统计623 3、给定抽样极限误差和概率保证度、给定抽样极限误差和概率保证度推算必要的样本容量推算必要的样本容量u给定抽样极限误差和概率保证程度推算给定抽样极限误差和概率保证程度推算样本容量,就是在公式样本容量,就是在公式 中,中,已知已知、t,求,求 计算公式中所包含的计算公式中所包含的 n。u以下都以简单随机抽样为例。以下都以简单随机抽样为例。统计学统计学2024/7/18第七章 推断统计63(1)(1)在重复抽样条件下在重复抽样条件下u平均数的抽样极限误差平均数的抽样极限误差 :u 则必要的样本容量为:则必要的样本容量为:示例示例注意各符号注意各符号单位的应用单位的应用 统计学统计学2024/7/18第七章 推断统计64(2)(2)在不重复抽样条件下在不重复抽样条件下u平均数的抽样极限误差平均数的抽样极限误差 :u 则必要的样本容量为:则必要的样本容量为:注意各符号注意各符号单位的应用单位的应用 统计学统计学2024/7/18第七章 推断统计65(3)(3)成数样本必要单位数成数样本必要单位数u重复抽样:重复抽样:u不重复抽样:不重复抽样:注意各符号注意各符号单位的应用单位的应用 统计学统计学2024/7/18第七章 推断统计66(4 4)的确定方法的确定方法u用以前研究中的数据进行估计用以前研究中的数据进行估计u用试验样本的标准差(取最大值)进行用试验样本的标准差(取最大值)进行估计估计u粗略估计粗略估计统计学统计学2024/7/18第七章 推断统计67(4 4)P 的确定方法的确定方法u用以前研究中的相同或相似的用以前研究中的相同或相似的P 来代替来代替u用初始样本的用初始样本的P 来代替来代替u主观判断与猜测主观判断与猜测u以上方法都不适用时,取以上方法都不适用时,取P 0.5练习题练习题3准则:使准则:使P(1P)取最大值取最大值 统计学统计学2024/7/18第七章 推断统计68分析:分析:u从上式可以看出,样本必要单位数受允许从上式可以看出,样本必要单位数受允许误差范围的制约,允许误差范围愈小,则误差范围的制约,允许误差范围愈小,则要求样本容量愈多。要求样本容量愈多。u以重复抽样来说,若其他条件不变,允许以重复抽样来说,若其他条件不变,允许误差范围缩小一半,则样本容量必须增至误差范围缩小一半,则样本容量必须增至原来的四倍;允许误差范围扩大一倍,则原来的四倍;允许误差范围扩大一倍,则样本容量只需为原来的四分之一。样本容量只需为原来的四分之一。统计学统计学2024/7/18第七章 推断统计69第五节第五节 假设检验假设检验一、假设检验的含义一、假设检验的含义u依据样本的观察资料来检验事先对总依据样本的观察资料来检验事先对总体的某些数量特征所作的假设是否可体的某些数量特征所作的假设是否可信的一种统计分析方法。信的一种统计分析方法。u是推断统计的重要内容。是推断统计的重要内容。u假设检验的实例假设检验的实例统计学统计学2024/7/18第七章 推断统计70二、假设检验的思想和原理二、假设检验的思想和原理u假设检验的目的是判断总体参数是否发生显著性假设检验的目的是判断总体参数是否发生显著性变化(假设零件长度为变化(假设零件长度为20cm)。)。u但总体参数是未知的,我们只能用样本的统计量但总体参数是未知的,我们只能用样本的统计量来代替总体参数进行检验。来代替总体参数进行检验。u样本的统计量几乎不会真正等于总体参数。但是,样本的统计量几乎不会真正等于总体参数。但是,由于随机误差的原因,统计量会以很大的概率落由于随机误差的原因,统计量会以很大的概率落在总体参数(假设为在总体参数(假设为20cm)附近一定的范围内,)附近一定的范围内,而远离总体参数的概率会很小。而远离总体参数的概率会很小。统计学统计学2024/7/18第七章 推断统计71(续前)(续前)u小概率原理:一个小概率事件在一次试验中不太小概率原理:一个小概率事件在一次试验中不太可能发生。可能发生。u如果一个样本的统计量实际上远离了如果一个样本的统计量实际上远离了20cm而使得而使得小概率事件发生了,也就是说不太可能的事件发小概率事件发生了,也就是说不太可能的事件发生了,我们自然有充足的理由认为总体参数发生生了,我们自然有充足的理由认为总体参数发生了显著性变化。了显著性变化。u相反,如果相反,如果样本的统计量落在样本的统计量落在20cm附近,我们就附近,我们就没有理由认为总体参数发生了显著性变化,因为没有理由认为总体参数发生了显著性变化,因为由于样本随机性造成合理的偏差是正常的。由于样本随机性造成合理的偏差是正常的。统计学统计学2024/7/18第七章 推断统计72三、假设检验的一般步骤三、假设检验的一般步骤u建立假设建立假设u构建检验统计量构建检验统计量u确定显著性水平及相应的拒绝域确定显著性水平及相应的拒绝域u用样本数据进行检验,并作出结论用样本数据进行检验,并作出结论统计学统计学2024/7/18第七章 推断统计73四、假设的建立四、假设的建立1、原假设和备择假设原假设和备择假设u原假设(原假设(H0):对总体参数所做的尝):对总体参数所做的尝试性的假设,也称零假设。试性的假设,也称零假设。u备择假设(备择假设(H1):原假设对立假设。):原假设对立假设。通常将检验试图建立的结果设为备择通常将检验试图建立的结果设为备择假设。假设。统计学统计学2024/7/18第七章 推断统计742 2、总体均值假设检验的三种情况、总体均值假设检验的三种情况uH0:0;H1:0uH0:0;H1:0uH0:=0;H1:0双侧检验双侧检验 左侧检验左侧检验 右侧检验右侧检验 注意:等号部分总注意:等号部分总是出现在原假设中是出现在原假设中 统计学统计学2024/7/18第七章 推断统计753 3、原假设与备择假设的选择、原假设与备择假设的选择u研究问题:将研究中的假设作为备择假设。研究问题:将研究中的假设作为备择假设。u声明问题:原假设通常是假定该声明为真。声明问题:原假设通常是假定该声明为真。u决策问题:将认为是正确的或有利的假定决策问题:将认为是正确的或有利的假定作为原假设。作为原假设。思考题思考题注:对于研究和声明问题,只有注:对于研究和声明问题,只有H0 被拒绝时,被拒绝时,才需采取措施。而对于决策问题,不论是否拒才需采取措施。而对于决策问题,不论是否拒绝绝H H0 0 ,都必须采取相应的措施。,都必须采取相应的措施。统计学统计学2024/7/18第七章 推断统计76五、显著性水平与拒绝域五、显著性水平与拒绝域1 1、显著性水平、显著性水平:小概率标准:小概率标准u:一般取:一般取0.010.01、0.050.05。u:是统计意义上的显著,并不意味:是统计意义上的显著,并不意味着一定会对经济活动产生重大的影响。着一定会对经济活动产生重大的影响。u:是人为设定的,其大小取决于问:是人为设定的,其大小取决于问题的性质与人们的意愿。题的性质与人们的意愿。统计学统计学2024/7/18第七章 推断统计772 2、拒绝域、拒绝域u左侧检验:左侧检验:z z 为检验统计量。为检验统计量。接受域接受域(1)拒绝域拒绝域 拒绝域拒绝域z z统计学统计学2024/7/18第七章 推断统计782 2、拒绝域、拒绝域u右侧检验右侧检验接受域(接受域(1)拒绝域拒绝域 拒绝域拒绝域z z统计学统计学2024/7/18第七章 推断统计792 2、拒绝域、拒绝域u双侧检验双侧检验 接受域(接受域(1)拒绝域拒绝域/2拒绝域拒绝域/2拒绝域拒绝域拒绝域拒绝域z z统计学统计学2024/7/18第七章 推断统计80六、总体均值的检验六、总体均值的检验(一)单侧检验(一)单侧检验1 1、单侧检验的形式、单侧检验的形式 左侧检验左侧检验 右侧检验右侧检验 H0:0;H0:0 H1:0;H1:0统计学统计学2024/7/18第七章 推断统计812 2、检验统计量、检验统计量u z z 服从:服从:N(0 0,1 1)或)或 t(n1)分布分布统计学统计学2024/7/18第七章 推断统计823 3、检验规则(临界值法)、检验规则(临界值法)u左侧检验:左侧检验:z z -z z,则拒绝,则拒绝 H0u右侧检验:右侧检验:z z z z,则拒绝,则拒绝 H0u否则:不能拒绝(或接受)。否则:不能拒绝(或接受)。u特别注意:通常表述为特别注意:通常表述为“拒绝或接受拒绝或接受H0(或(或 H1)”,不能表述为,不能表述为“H0(或(或 H1)是真或假)是真或假”。示例一示例一统计学统计学2024/7/18第七章 推断统计83(二)双侧检验(二)双侧检验uH0:0;H1:0u检验统计量(同前)检验统计量(同前)u检验规则:检验规则:z z z z/2 ,则拒绝则拒绝 H0。示例二示例二统计学统计学2024/7/18第七章 推断统计84(三)两类错误(三)两类错误u第一类错误(弃真):否定了真实的第一类错误(弃真):否定了真实的原假设。原假设。u第二类错误(取伪):接受了不真实第二类错误(取伪):接受了不真实的原假设。的原假设。统计学统计学2024/7/18第七章 推断统计851 1、犯两类错误的概率、犯两类错误的概率u对于给定的样本容量,对于给定的样本容量,与与具有反向关系。具有反向关系。u对于给定的对于给定的,增大样本容量将会减少,增大样本容量将会减少。u在假设检验中,在假设检验中,并不是越小越好。并不是越小越好。判判 决决H0为真为真H0为假为假拒绝拒绝 H0第一类错误第一类错误()正确(正确(1-)接受接受 H0正确(正确(1-)第二类错误第二类错误()统计学统计学2024/7/18第七章 推断统计862 2、的计算的计算u对于决策问题,当检验结果表明不能拒绝对于决策问题,当检验结果表明不能拒绝H0时,我们选择并采取相应措施,这时时,我们选择并采取相应措施,这时决策者将承担发生第二类错误的风险。决策者将承担发生第二类错误的风险。u在这种情况下,对第二类错误的概率在这种情况下,对第二类错误的概率进进行控制就很有必要。行控制就很有必要。的计算的计算统计学统计学2024/7/18第七章 推断统计87(四)(四)p-值方法值方法up-值:是一个概率值,通过检验统计值:是一个概率值,通过检验统计量得到,用来测量样本对原假设的量得到,用来测量样本对原假设的支持(缺乏支持)的程度。支持(缺乏支持)的程度。u在实际应用中,在实际应用中,p-值方法已成为是值方法已成为是否拒绝原假设的优先方法,特别是否拒绝原假设的优先方法,特别是在运用软件分析时。在运用软件分析时。统计学统计学2024/7/18第七章 推断统计881 1、p-值的计算值的计算u左侧检验:左侧检验:p-值是小于或等于样本所值是小于或等于样本所给出的检验统计量的值的概率。给出的检验统计量的值的概率。u右侧检验:右侧检验:p-值是大于或等于样本所值是大于或等于样本所给出的检验统计量的值的概率。给出的检验统计量的值的概率。u双侧检验:双侧检验:p-值是大于或等于样本所值是大于或等于样本所给出的检验统计量的绝对值的概率。给出的检验统计量的绝对值的概率。p-值计算值计算统计学统计学2024/7/18第七章 推断统计892 2、p-值方法的拒绝规则值方法的拒绝规则u如果如果 p-值值,则拒绝,则拒绝 H0u如果如果 p-值值,则接受,则接受 H0统计学统计学2024/7/18第七章 推断统计90(五)总体均值的假设检验的总结(五)总体均值的假设检验的总结左侧检验左侧检验右侧检验右侧检验双侧检验双侧检验假假 设设H0:0H1:0 H0:0H1:0H0:0H1:0拒绝规则拒绝规则p-值法值法p-值值则拒绝则拒绝H0p-值值则拒绝则拒绝H0p-值值则拒绝则拒绝H0拒绝规则拒绝规则临界值临界值法法z z -z z则拒绝则拒绝H0z z z z则拒绝则拒绝H0|z z|z z/2则拒绝则拒绝H0统计学统计学2024/7/18第七章 推断统计91七、总体成数的检验七、总体成数的检验1 1、三种形式、三种形式uH0:p p0;H1:p p0uH0:p p0;H1:p p0uH0:p p0;H1:p p0统计学统计学2024/7/18第七章 推断统计922 2、总体成数的检验统计量、总体成数的检验统计量u如果如果 np 5,且且 n(1-p)5,则,则 p 的的抽样分布近似地服从正态分布。抽样分布近似地服从正态分布。统计学统计学2024/7/18第七章 推断统计933 3、总体成数的检验规则、总体成数的检验规则u总体成数的检验规则与总体均值的检总体成数的检验规则与总体均值的检验规则一致。验规则一致。统计学统计学2024/7/18第七章 推断统计944 4、总体成数的假设检验的总结、总体成数的假设检验的总结左侧检验左侧检验右侧检验右侧检验双侧检验双侧检验假假 设设H0:p p0H1:p p0 H0:p p0H1:p p0H0:pp0H1:pp0拒绝规则拒绝规则p-值法值法p-值值则拒绝则拒绝H0p-值值则拒绝则拒绝H0p-值值则拒绝则拒绝H0拒绝规则拒绝规则临界值临界值法法z z -z z则拒绝则拒绝H0z z z z则拒绝则拒绝H0|z z|z z/2则拒绝则拒绝H0统计学统计学2024/7/18第七章 推断统计95第六节第六节 两总体均值和成数的统计推断两总体均值和成数的统计推断一、两总体均值之差的推断一、两总体均值之差的推断(一)(一)1 1和和2 2 已知的情形已知的情形u独立简单随机抽样:从总体独立简单随机抽样:从总体1中中简单简单随机随机抽取抽取n1 个单位,个单位,从总体从总体1中中简单简单随机随机抽取抽取n2 个单位。个单位。u两个样本的均值:两个样本的均值:统计学统计学2024/7/18第七章 推断统计96X1-X2 的区间估计:的区间估计:u两个总体均值之差的点估计:两个总体均值之差的点估计:统计学统计学2024/7/18第七章 推断统计97两个总体均值之差的抽样平均误差两个总体均值之差的抽样平均误差u如果两个总体都服从正态分布或如果两个总体都服从正态分布或n1和和n2足够大,则两个总体均值之差的分足够大,则两个总体均值之差的分布也服从正态分布。布也服从正态分布。统计学统计学2024/7/18第七章 推断统计98两个总体均值之差的区间估计:两个总体均值之差的区间估计:t 是置信度为是置信度为1-的概率度的概率度 示例示例统计学统计学2024/7/18第七章 推断统计99(二)(二)1 1和和2 2 未知的情形未知的情形u用样本的用样本的s1 和和s2 个来估计未知总体的标准个来估计未知总体的标准差。差。u区间估计将建立在区间估计将建立在 t 分布的基础上而不是分布的基础上而不是正态分布。自由度为:正态分布。自由度为:统计学统计学2024/7/18第七章 推断统计100X1-X2 的区间估计:的区间估计:统计学统计学2024/7/18第七章 推断统计101二、两总体成数之差的推断二、两总体成数之差的推断u当当n1 p1 5、n1(1-p1)5、n2 p2 5 和和 n2(1-p2)5 时,抽抽样分布可由正分布可由正态分布来逼近。分布来逼近。u两个总体的成数之差(两个总体的成数之差(P1P2)的点)的点估计:估计:统计学统计学2024/7/18第七章 推断统计102两个总体成数之差的区间估计:两个总体成数之差的区间估计:t 是置信度为是置信度为1-的概率度的概率度 示例示例统计学统计学2024/7/18第七章 推断统计103本章主要问答题本章主要问答题1.什么是抽样推断?它有哪些基本特征?什么是抽样推断?它有哪些基本特征?2.什么是抽样误差?影响抽样平均误差的因素有哪些什么是抽样误差?影响抽样平均误差的因素有哪些?3.类型抽样和整群抽样在分组时有什么不同的要求?类型抽样和整群抽样在分组时有什么不同的要求?4.抽样组织方式主要有哪几种?比较各种抽样组织方抽样组织方式主要有哪几种?比较各种抽样组织方式的抽样平均误差大小。式的抽样平均误差大小。5.在一定的置信度和误差范围条件下,如果确定样本在一定的置信度和误差范围条件下,如果确定样本容量?容量?6.假设检验的步骤。假设检验的步骤。7.如何建立原假设和备择假设?如何建立原假设和备择假设?
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!