资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,#,第五章 抽样与参数估计,重点:抽样推断的概念、抽样误差、抽样平均误差、参数估计的基本方法、样本容量的确定,1,第一节,抽,抽,样,样推断,的,的一般,问,问题,抽样推,断,断的意,义,义,抽样推,断,断是在,抽,抽样调,查,查的基,础,础上,,利,利用样,本,本的实,际,际资料,计,计算样,本,本指标,,,,并据,以,以推算,总,总体相,应,应数量,特,特征的,一,一种统,计,计方法,。,。,抽样推,断,断具有,以,以下特,点,点:,抽样推,断,断是由,部,部分推,算,算整体,的,的一种,认,认识方,法,法。,抽样推,断,断是建,立,立在随,机,机取样,的,的基础,上,上。,抽样推,断,断是运,用,用概率,估,估计的,方,方法。,抽样推,断,断的误,差,差可以,事,事先计,算,算并加,以,以控制,。,。,2,抽样推,断,断的内,容,容,推断的,前,前提是,我,我们对,总,总体的,数,数量特,征,征不了,解,解或了,解,解很少,,,,但是,利,利用抽,样,样推断,的,的方法,去,去解决,这,这类问,题,题,可,以,以有两,种,种途径,,,,因此,,,,抽样,推,推断的,内,内容就,有,有两个,方,方面,,即,即参数估,计,计和假,设,设检验。这两,方,方面的,内,内容虽,然,然,都,都是利,用,用样本,观,观察值,所,所提供,的,的信息,,,,对总,体,体做出,估,估计或,判,判断,,但,但它们,所,所解决,问,问题的,着,着重点,是,是不同,的,的。,3,一、参,数,数估计。由于,我,我们不,知,知道总,体,体数量,特,特征,,可,可以这,样,样考虑,即,即依据,所,所获得,的,的样本,观,观察资,料,料,对,所,所研究,对,对象总,体,体的水,平,平、结,构,构、规,模,模等数,量,量特征,进,进行估,计,计,这,种,种推断,方,方法称,为,为总体,参,参数估,计,计。,二、假,设,设检验。由于,我,我们对,总,总体的,变,变化情,况,况不了,解,解,不,妨,妨先对,总,总体的,状,状况作,某,某种假,设,设,然,后,后在根,据,据抽样,推,推断的,原,原理,,根,根据样,本,本观察,对,对所作,假,假设进,行,行检验,,,,来判,断,断这种,假,假设的,真,真伪,,以,以决定,我,我们行,动,动的取,舍,舍,这,种,种推断,方,方法称,为,为总体,参,参数的,假,假设检,验,验。,4,有关抽,样,样的基,本,本概念,一、总,体,体和样,本,本。总,体,体也称全,及,及总体,,,,指所,要,要认识,研,研究对,象,象的全,体,体。它,是,是由所,研,研究范,围,围内具,有,有某种,共,共同性,质,质的全,体,体单位,所,所组成,的,的集合,体,体。总,体,体的单,位,位数通,常,常是很,大,大的,,甚,甚至是,无,无限的,,,,一般,用,用N表,示,示总体,的,的单位,数,数。,样本又称子,样,样,它,是,是从全,及,及总体,中,中随机,抽,抽取出,来,来的们,作,作为代,表,表这一,总,总体的,哪,哪部分,单,单位组,成,成的集,合,合体,,样,样本的,单,单位数,是,是有限,的,的,相,对,对值或,标,标志属,性,性决定,的,的。一,个,个全及,指,指标的,指,指标数,值,值是确,定,定的、,唯,唯一的,,,,所以,称,称为参,数,数。,5,二、总,体,体参数,何,何样本,统,统计量,。,。对于,总,总体中,的,的数量,标,标志,,常,常用的,总,总体参,数,数有总,体,体平均,数,数和总,体,体方差,,,,用,和,和,表,表示。,总体参数,样本统计量,平均数,成数,方差,标准差,6,三、样,本,本容量,和,和样本,个,个数,样本容,量,量是指,一,一个样,本,本包含,的,的单位,数,数。样,本,本个数,又,又称样,本,本可能,数,数目,,是,是指从,一,一个总,体,体中可,能,能抽取,多,多少样,本,本。和,样,样本容,量,量以及,抽,抽样方,法,法有关,。,。,7,四、重,复,复抽样,和,和不重,复,复抽样,重复抽,样,样也称置,回,回抽样,,,,它是,指,指每次,抽,抽取一,个,个样本,登,登记后,在,在放回,总,总体中,参,参加下,一,一次抽,取,取。也,就,就是说,每,每一个,样,样本单,位,位都有,被,被重复,抽,抽取的,可,可能。,从,从总体N个单,位,位中,,用,用重复,抽,抽样的,方,方法,,随,随机n,个,个单位,构,构成一,个,个样本,则,则共可,抽,抽取,个,个样本。,8,例如:,总,总体有A、B,、,、C、D四个,单,单位,,要,要从中,以,以重复,抽,抽样的,方,方法抽,取,取两个,单,单位构,成,成样本,,,,先从,四,四个单,位,位中取1,个,有,四,四种取,法,法,结,果,果登记,后,后再放,回,回,然,后,后再从,四,四个单,位,位中,取1个,,,,也有,四,四种取,法,法,前,后,后取两,个,个构成,样,样本,,全,全部可,能,能抽取,的,的样本,数,数目为44,=,=16,个,个。,9,不重复,抽,抽样也称置,回,回抽样,,,,它是,指,指每次,抽,抽取一,个,个样本,登,登记后,不,不放回,总,总体中,参,参加下,一,一次抽,取,取。也,就,就是说,每,每一个,样,样本单,位,位只有,一,一次被,抽,抽取的,可,可能。,从总体N个单,位,位中,,用,用不重,复,复抽样,的,的方法,,,,随机n个单,位,位构成,一,一个样,本,本则共,可,可抽取N(N,-,-1),(,(N-2),(,(N-n+1,),)个样,本,本。,10,不重复,抽,抽样P93,考虑顺,序,序的不,重,重复抽,样,样,不考虑,顺,顺序的,不,不重复,抽,抽样,11,例如:,总,总体有A、B,、,、C、D四个,单,单位,,要,要从中,以,以不重,复,复抽样,的,的方法,抽,抽取两,个,个单位,构,构成样,本,本,先,从,从四个,单,单位中,取,取1个,,,,有四,种,种取法,,,,然后,再,再从三,个,个单位,中,中取1,个,个,有3种取,法,法,前,后,后取两,个,个构成,样,样本,,全,全部可,能,能抽取,的,的样本,为,为43=12个。,12,第二节,抽,抽,样,样误差,(1),抽,抽样误,差,差,概念,是指在,遵,遵守随,机,机原则,的,的条件,下,下,用,抽,抽样总,体,体指标,估,估计或,推,推断全,及,及总体,指,指标所,不,不可避,免,免的误,差,差。,具体,内,内容,特点,a.是,抽,抽样调,查,查所固,有,有的,,不,不可避,免,免,b.它,是,是个随,机,机变量,c.它,是,是实际,误,误差(,理,理论误,差,差),,无,无法计,算,算,13,(2)抽样平,均,均误差,(,(可以,计,计算),概念简称平,均,均误差,,,,是指,所,所有可,能,能组成,的,的样本,的,的抽样,平,平均数,或,或抽样,成,成数与,总,总体平,均,均数或,总,总体成,数,数的平,均,均误差,。,。,注意:,抽,抽样误,差,差的平,均,均数不,是,是算术,平,平均,,而,而是标,准,准差式,的,的平均,。,。,意义,抽样平,均,均误差,越,越大,,则,则表示,样,样本的,代,代表性,低,低,抽样平,均,均误差,越,越小,,则,则表示,样,样本的,代,代表性,高,高,计算,14,抽样平,均,均误差分反映,抽,抽样误,差,差一般,水,水平的,指,指标。,抽,抽样平,均,均误差,是,是抽样,平,平均数,或,或抽样,成,成数的标准差。抽样,平,平均数,(,(或成,数,数)的,标,标准差,是,是按抽,样,样平均,数,数(或,成,成数),与,与其全,及,及总体,平,平均数,(,(或成,数,数)离,差,差平方,和,和计算,的,的。但,由,由于抽,样,样平均,数,数的平,均,均数等,于,于总体,平,平均数,,,,而抽,样,样成数,的,的平均,数,数等于,总,总体成,数,数,抽,样,样指标,的,的标准,差,差恰好,反,反映了,抽,抽样指,标,标和总,体,体指标,的,的平均,离,离差程,度,度。,15,样本,平,平均数,的,的数学,期,期望值,即,即样本,平,平均数,的,的平均,数,数a,.,.定义,式,式,16,b.推,导,导式,样本,平,平均数,的,的方差,(,(,),),或标准,差,差(,),),17,样本平,均,均数的,标,标准差,即,即为平,均,均数的,抽,抽样平,均,均误差,(,(抽样,标,标准误,差,差)。,所,所以,,,,平均,数,数抽样,平,平均误,差,差的计,算,算为:,18,影响抽,样,样误差,大,大小的,因,因素主,要,要有:,1、总,体,体各单,位,位标志,值,值的差,异,异程度,。,。抽样,误,误差的,大,大小和,总,总体标,准,准差的,大,大小成,正,正比例,关,关系。,2、样,本,本单位,数,数。抽,取,取样本,单,单位数,越,越多,,抽,抽样误,差,差越小,;,;抽取,样,样本单,位,位数越,少,少,抽,样,样误差,越,越大。,抽,抽样误,差,差的大,小,小和样,本,本单位,数,数的平,方,方根成,反,反比例,关,关系。,3、抽,样,样方法,。,。不重,复,复抽样,误,误差比,重,重复抽,样,样误差,小,小。,4、抽,样,样调查,的,的组织,形,形式。,选,选曲不,同,同的抽,样,样组织,形,形式,,也,也会有,不,不同的,抽,抽样误,差,差。,19,简单随,机,机抽样,下,下的抽,样,样平均,误,误差的,计,计算,一、抽,样,样平均,数,数的抽,样,样误差,(1)重复抽,样,样条件下,抽,样,样平均,误,误差和,总,总体的,变,变异程,度,度以及,样,样本容,量,量大小,两,两个因,素,素有关,,,,它们,的,的具体,关,关系如,下,下:,从这一,公,公式可,以,以看出,,,,抽样,平,平均误,差,差的大,小,小和总,体,体标准,差,差成正,比,比变化,。,。,20,(二),在,在不重,复,复抽样,的,的条件,下,下,抽,样,样平均,数,数的平,均,均误差,不,不但和,总,总体变,异,异程度,、,、样本,容,容量有,关,关,而,且,且还要,考,考虑总,体,体单位,数,数的多,少,少。它,们,们的关,系,系如下,:,:,21,总体方,差,差是未,知,知的,,解,解决方,法,法,1.用,估,估计的,材,材料,2.用,过,过去的,差,差所得,到,到的材,料,料。如,果,果有几,个,个不同,的,的总体,方,方差的,材,材料,,则,则应该,用,用数值,较,较大的,。,。,3.用,样,样本方,差,差材料,代,代替总,体,体方差,4.如,果,果既没,有,有过去,的,的材料,,,,又需,要,要在调,查,查之前,就,就估计,出,出抽样,误,误差,,可,可以在,大,大规模,调,调查之,前,前,组,织,织一次,小,小规模,的,的试验,性,性调查,22,二、抽,样,样成数,的,的平均,误,误差。,抽样成,数,数的平,均,均误差,表,表明各,样,样本成,数,数和总,体,体成数,绝,绝对离,差,差的一,般,般水平,。,。由于,总,总体成,数,数可以,表,表现为,总,总体,是非标,志,志的(0,1,),)分布,的,的平均,数,数,而,且,且它的,方,方差也,可,可以从,总,总体成,数,数推算,出,出来,,即,即:P,与,与P(1-P,),)。,因,因此容,易,易从抽,样,样平均,数,数的抽,样,样平均,误,误差和,总,总体标,准,准差的,关,关系推,算,算出来,。,。,23,(一),在,在重复,抽,抽样条,件,件下:,24,(二),在,在不重,复,复抽样,条,条件下,:,:,25,以上计,算,算过程,中,中如无,总,总体方,差,差时,,可,可用样,本,本方差,代,代替。,总体成,数,数一般,是,是不知,道,道的,,用,用过去,资,资料代,替,替,选,用,用最大,的,的方差,。,。,成数方,差,差的最,大,大值是0.5,(,(10.5,),)0,.,.25,,,,当两,类,类总体,各,各占一,半,半时,,它,它的变,动,动程度,最,最大。,因,因此选,用,用最大,值,值,也,就,就是选,用,用最接,近,近0.25的,方,方差值,。,。,26,例,已知总,体,体方差,为,为1000元,,,, 总,体,体单位,数,数为4,个,个,样,本,本单位,数,数为2,个,个,用,不,不重复,抽,抽样的,方,方法计,算,算抽样,平,平均误,差,差。,27,例:要,估,估计某,地,地区10000名儿,童,童的入,学,学率,,随,随机抽,取,取400名,,检,检查有320,名,名儿童,入,入学,,求,求抽样,入,入学率,的,的平均,误,误差。,根据已,知,知条件,:,:,1、在,重,重复抽,样,样,条件下,:,:,28,2、在,不,不重复,抽,抽样条,件,件下:,29,三、抽,样,样极限,误,误差,抽样极,限,限误差,(,(抽样,允,允许误,差,差)是,从,从另一,个,个角度,考,考虑抽,样,样误差,问,问题。,以,以样本,的,的抽样,指,指标来,估,估计总,体,体指标,,,,要达,到,到完全,准,准确毫,无,无误差,,,,这几,乎,乎是不,可,可能的,,,,所以,,,,在估,计,计总体,指,指标的,同,同时就,必,必须考,虑,虑估计,误,误差的,大,大小。,我,我们不,希,希望误,差,差太大,,,,误差,愈,愈大样,本,本的价,值,值愈小,。,。但也,不,不是误,差,差愈小,愈,愈好,,因,因为在,一,一定限,度,度之后,减,减少抽,样,样误差,势,势必增,加,加很多,费,费用。,所,所以,,在,在作抽,样,样估计,时,时,应,该,该根据,所,所研究,的,的变异,程,程度和,分,分析任,务,务的要,求,求确定,可,可允许,误,误差的,范,范围,,在,在这个,范,范围内,的,的数字,都,都算是,有,有效的。,30,概念,允许误,差,差:指样,本,本和总,体,体指标,之,之间误,差,差的可,能,能范围,。,。,由于总,体,体指标,是,是一个,确,确定的,数,数(未,知,知的常,数,数),,而,而样本,指,指标(,随,随机变,量,量)则,是,是围绕,总,总体指,标,标上下,波,波动的,,,,它与,总,总体指,标,标之间,既,既有正,离,离差,,也,也有负,离,离差,,样,样本指,标,标变动,的,的上限,或,或下限,与,与总体,指,指标之,差,差的绝,对,对值就,可,可以表,示,示抽样,误,误差的,可,可能范,围,围,我,们,们将这,种,种以绝,对,对值形,式,式表示,的,的抽样,误,误差的,可,可能范,围,围称为,抽,抽样极,限,限误差,。,。,31,用,表示抽,样,样平均,数,数极限,误,误差和,抽,抽样成,数,数极限,误,误差。,32,根据数,理,理统计,证,证明:,33,概率度t与置,信,信度F,(,(t),置信度,:,:是指总,体,体指标,落,落在某,一,一区间,内,内的概,率,率保证,程,程度,,常,常用概,率,率函数F(t,),)表示,。,。,概率度,:,:用抽样,极,极限误,差,差除以,相,相应抽,样,样平均,误,误差得,出,出的相,对,对数称,为,为概率,度,度,它,表,表示抽,样,样极限,误,误差的,范,范围为,抽,抽样平,均,均误差,的,的若干,倍,倍。,34,t(概率度),置信度(概率),抽样误差范围,0.5,0.3829,0.5,1.0,0.6827,1.0,1.5,0.8664,1.5,1.96,0.9500,1.96,2.00,0.9545,2.00,3.00,0.9973,3.00,35,第三节,参,参数,估,估计,一、参,数,数估计,需,需要解,决,决的问,题,题,参数估,计,计就是,以,以所计,算,算的样,本,本指标,来,来估计,相,相应的,总,总体指,标,标,需,要,要解决,下,下面三,个,个问题,:,:,1.针,对,对待估,的,的总体,指,指标,,根,根据样,本,本构造,一,一个合,适,适的统,计,计量,,作,作为该,总,总体指,标,标的估,计,计量。,2.对,所,所构造,的,的估计,量,量的优,良,良性作,出,出判断,,,,并在,必,必要时,进,进行修,正,正。(,无,无偏性,、,、一致,性,性、有,效,效性),3.在,给,给定的,可,可靠程,度,度下,,求,求出抽,样,样估计,的,的极限,误,误差。,36,二、参,数,数估计,的,的形式,1.点,估,估计(,定,定值估,计,计),对于总,体,体的未,知,知参数,,,,由,样,样本构,造,造统计,量,量,对,对,其,其作出,估,估计,,则,则称,为,为,的,的估计,量,量。即,不,不考虑,抽,抽样误,差,差,直,接,接从样,本,本指标,来,来推断,全,全及总,体,体指标,。,。,在多个,估,估计量,中,中,由,于,于估计,量,量是水,机,机变量,,,,选择,一,一个优,良,良性估,计,计量,,需,需要明,确,确优良,性,性估计,量,量的标,准,准:无,偏,偏性、,有,有效性,、,、一致,性,性。,37,2.区,间,间估计,(1),总,总体平,均,均数的,区,区间估,计,计,由,得,得,38,如果估,计,计区间,越,越大,,则,则可靠,程,程度(,概,概率保,证,证程度,),),越,越大;,估,估计区,间,间越小,,,,则可,靠,靠程度,越,越小。,而估计,区,区间又,与,与抽样,极,极限误,差,差有关,,,,在一,定,定的抽,样,样方式,下,下,抽,样,样极限,误,误差又,是,是由概,率,率度t,决,决定的,。,。因而,可,可靠程,度,度与t,之,之间有,一,一定正,比,比关系,。,。,39,(2)总体成,数,数的区,间,间估计,由,40,例:,某灯泡,厂,厂某月,生,生产5000000,个,个灯泡,,,,在进,行,行质量,检,检查中,,,,随机,抽,抽取500个,进,进行检,验,验,这500,个,个灯泡,的,的耐用,时,时间见,下,下表:,试求:,该厂,全,全部灯,泡,泡平均,耐,耐用时,间,间的取,值,值范围,(,(概率,保,保证程,度,度0.9973),检查500,个,个灯泡,中,中不合,格,格产品,占,占0.4%,,试,试在0,.,.6827概,率,率保证,下,下,估,计,计全部,产,产品中,不,不合格,率,率的取,值,值范围,。,。,(3),如,如果耐,用,用时间,在,在1000小,时,时以上,为,为优等,品,品,估,计,计优等,品,品率在95.45%,的,的概率,保,保证下,的,的范围,41,耐用时间(小时),灯泡数,f,组中值,x,xf,800850,35,850900,127,900950,185,9501000,103,10001050,42,10501100,8,合计,42,由概率,保,保证程,度,度0.9973,查,表,表得概,率,率度t,=,=3,43,p=0,.,.4%概率保,证,证程度,为,为0.6827时,t=1,44,优等品,率,率P=50/500,=,=0.1,总体总,量,量指标,的,的推算,即用样,本,本指标,或,或总体,指,指标(,总,总体平,均,均数和,总,总体成,数,数)的,区,区间估,计,计值乘,以,以总体,单,单位数,来,来推算,总,总体总,量,量指标,45,测试题:,财经名,录,录共有400,页,页,现,随,随手翻,看,看(可,重,重复)40页,发现,其,其有2,页,页印刷,不,不良,试,试求全,书,书印刷,不,不良页,数,数的95%信,赖,赖区间,.,.,p=0,.,.05t,=,=1.96,-0.0184P,0,.,.1184,0 P 0.1184,0400P,4000.1184,0 400P 47,46,小结:,在,在作区,间,间估计,时,时,同,时,时要作,两,两方面,的,的判断,第一,,误,误差范,围,围的判,断,断,即总体,指,指标在,哪,哪两个,数,数值范,围,围之间,。,。这个,判,判断说,明,明的是,区,区间估,计,计的准,确,确程度,。,。,第二,,把,把握程,度,度的判,断,断,表现,为,为概率,值,值。它,说,说明的,是,是作上,述,述范围,判,判断的,可,可靠性,。,。,两个判,断,断的关,系,系:,准确程,度,度高(,即,即误差,范,范围小,),),则,把,把握程,度,度低;,准确程,度,度低(,即,即误差,范,范围大,),),则,把,把握程,度,度高。,47,一对矛,盾,盾,48,第四节,样,样本,容,容量的,确,确定,影响,必,必要样,本,本容量,的,的因素,总体,各,各单位,标,标志变,异,异程度,即总体,方,方差或p(1,-,-p),的,的大小,。,。总体,标,标志变,异,异程度,大,大,要,求,求样本,容,容量大,一,一些;,反,反之,,总,总体标,志,志变异,程,程度小,,,,样本,容,容量可,以,以小些,。,。,允许,的,的极限,误,误差,或,或,的,的大,小,小,允许的,极,极限误,差,差越大,,,,样本,容,容量越,小,小;反,之,之,极,限,限误差,越,越小,,样,样本容,量,量越大,。,。,49,抽样,方,方法,在其它,条,条件相,同,同的情,况,况下,,重,重置抽,样,样比不,重,重置抽,样,样要抽,取,取多一,些,些样本,单,单位。,抽样,方,方式,例如,,采,采用类,型,型抽样,的,的样本,容,容量要,小,小于简,单,单随机,抽,抽样的,样,样本容,量,量。,抽样推,断,断的可,靠,靠程度,即,即概率,度,度F(t,),)的大小,推断的,可,可靠程,度,度要求,越,越高即F(t,),)越大,,样,样本容,量,量越多,;,;反之,,,,推断,的,的可靠,程,程度要,求,求越低,,,,样本,容,容量越,少,少。,50,必要,样,样本容,量,量的计,算,算公式,重置,抽,抽样的,必,必要样,本,本容量,平均,数,数的必,要,要样本,容,容量,由,由,51,成数,的,的必要,样,样本容,量,量,由,52,不重,置,置抽样,的,的必要,样,样本容,量,量,平,平均数,的,的必要,样,样本容,量,量,由,53,成数,的,的必要,样,样本容,量,量,由,54,有几个,样,样本容,量,量怎样,选,选择?,应该采,取,取样本,单,单位数,较,较大的,方,方案,55,本章小,节,节与作,业,业,统计学,原,原理学,习,习指导,:,:P7880,第14题,、,、15,题,题。,56,
展开阅读全文