资源描述
,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,统计学,从数据到结论,第五章总体参数的估计,估计就是根据你拥有的信息来对现实世界进行某种判断。,你可以根据一个人的衣着、言谈和举止判断其身份,你可以根据一个人的脸色,猜出其心情和身体状况,统计中的估计也不例外,它是完全根据数据做出的。,如果我们想知道北京人认可某饮料的比例,人们只有在北京人中进行抽样调查以得到样本,并用样本中认可该饮料的比例来估计真实的比例。,从不同的样本得到的结论也不会完全一样。虽然真实的比例在这种抽样过程中永远也不知道;但可以知道估计出来的比例和真实的比例大致差多少。,从数据得到关于现实世界的结论的过程就叫做,统计推断(statistical inference),。,上面调查例子是估计总体参数(某种意见的比例)的一个过程。,估计(estimation),是统计推断的重要内容之一。,统计推断的另一个主要内容是下一章要引进的,假设检验(hypothesis testing),。,5.1 用估计量估计总体参数,人们往往先假定某数据来自一个特定的总体族(比如正态分布族)。,而要确定是总体族的哪个成员则需要知道总体参数值(比如总体均值和总体方差)。,人们于是可以用相应的样本统计量(比如样本均值和样本方差)来估计相应的总体参数,5.1 用估计量估计总体参数,一些常见的涉及总体的参数包括总体均值(,m,)、总体标准差(,s,)或方差(,s,2,)和(Bernoulli试验中)成功概率,p,等(总体中含有某种特征的个体之比例)。,正态分布族中的成员被(总体)均值和标准差完全确定;,Bernoulli分布族的成员被概率(或比例),p,完全决定。,因此如果能够对这些参数进行估计,总体分布也就估计出来了。,5.1 用估计量估计总体参数,估计的根据为总体抽取的样本。,样本的(不包含未知总体参数的)函数称为统计量;而用于估计的统计量称为,估计量(estimator),。,由于一个统计量对于不同的样本取值不同,所以,估计量也是随机变量,并有其分布。,如果样本已经得到,把数据带入之后,估计量就有了一个数值,称为该估计量的一个,实现(realization),或取值,也称为一个,估计值(estimate),。,5.1 用估计量估计总体参数,这里介绍两种估计,一种是,点估计(point estimation),,即用估计量的实现值来近似相应的总体参数。,另一种是,区间估计(interval estimation),;它是包括估计量在内(有时是以估计量为中心)的一个区间;该区间被认为很可能包含总体参数。,点估计给出一个数字,用起来很方便;而区间估计给出一个区间,说起来留有余地;不像点估计那么绝对。,5.2 点估计,用什么样的估计量来估计参数呢?,实际上没有硬性限制。任何统计量,只要人们觉得合适就可以当成估计量。,当然,统计学家想出了许多标准来衡量一个估计量的好坏。每个标准一般都仅反映估计量的某个方面。,这样就出现了按照这些标准定义的各种名目的估计量(如无偏估计量等)。,另一些估计量则是由它们的计算方式来命名的(如最大似然估计和矩估计等)。,5.2,点,点,估,估计,最常,用,用的,估,估计,量,量就,是,是我,们,们熟,悉,悉的,样,样本,均,均值,、,、样,本,本标,准,准差(,s,)和(Bernoulli,试,试验,的,的),成,成功,比,比例(,x,/,n,);,人们,用,用它,们,们来,分,分别,估,估计,总,总体,均,均值(,m,)、,总,总体,标,标准,差,差(,s,)和,成,成功,概,概率(或,总,总体,中,中的,比,比例),p,。这,些,些在,前,前面,都,都已,经,经介,绍,绍过,,,,大,家,家也,知,知道,如,如何,通,通过,计,计算,机,机(,或,或公,式,式),来,来计,算,算它,们,们。,5.2,点,点,估,估计,那么,,,,什,么,么是,好,好估,计,计量,的,的标,准,准呢,?,?,一种,统,统计,量,量称,为,为无偏,估,估计,量,量(unbiasedestimator)。,所谓,的,的无偏,性,性(unbiasedness)就是,:,:虽,然,然每,个,个样,本,本产,生,生的,估,估计,量,量的,取,取值,不,不一,定,定等,于,于参,数,数,,但,但当,抽,抽取,大,大量,样,样本,时,时,,那,那些,样,样本,产,产生,的,的估,计,计量,的,的均,值,值会,接,接近,真,真正,要,要估,计,计的,参,参数,。,。,5.2,点,点,估,估计,由于,一,一般,仅,仅仅,抽,抽取,一,一个,样,样本,,,,并,且,且用,该,该样,本,本的,这,这个,估,估计,量,量的,实,实现,来,来估,计,计对,应,应的,参,参数,,,,人,们,们并,不,不知,道,道这,个,个估,计,计值,和,和要,估,估计,的,的参,数,数差,多,多少,。,。,因此,,,,无,偏,偏性,仅,仅仅,是,是非,常,常多,次,次重,复,复抽,样,样时,的,的一,个,个渐,近,近概,念,念。,随机,样,样本,产,产生,的,的样,本,本均,值,值、,样,样本,标,标准,差,差和Bernoulli试,验,验的,成,成功,比,比例,分,分别,都,都是,相,相应,的,的总,体,体均,值,值、,总,总体,标,标准,差,差和,总,总体,比,比例,的,的无,偏,偏估,计,计。,5.2,点,点,估,估计,在无,偏,偏估,计,计量,的,的类,中,中,,人,人们,还,还希,望,望寻,找,找方,差,差最,小,小的,估,估计,量,量,,称,称为,最,最小,方,方差,无,无偏,估,估计,量,量。,此因,为,为方,差,差小,说,说明,反,反复,抽,抽样,产,产生,的,的许,多,多估,计,计量,差,差别,不,不大,,,,因,此,此更,加,加精,确,确。,评价,一,一个,统,统计,量,量好,坏,坏的,标,标准,很,很多,;,;而,且,且许,多,多都,涉,涉及,一,一些,大,大样,本,本的,极,极限,性,性质,。,。我,们,们不,想,想在,这,这里,涉,涉及,太,太多,此,此方,面,面的,细,细节,。,。,5.3,区,区,间,间估,计,计,当描,述,述一,个,个人,的,的体,重,重时,,,,你,一,一般,可,可能,不,不会,说,说这,个,个人,是,是76.35,公,公斤,你会,说,说这,个,个人,是,是七,八,八十,公,公斤,,,,或,者,者是,在,在70公,斤,斤到80,公,公斤,之,之间,。,。这,个,个范,围,围就,是,是区,间,间估,计,计的,例,例子,。,。,5.3,区,区,间,间估,计,计,在抽,样,样调,查,查例,子,子中,也,也常,用,用点,估,估计,加,加区,间,间估,计,计的,说,说法,。,。,比如,,,,为,了,了估,计,计某,电,电视,节,节目,在,在观,众,众中,的,的支,持,持率,(,(即,总,总体,比,比例,p,),,某,某调,查,查结,果,果会,显,显示,,,,该,节,节目,的,的“,收,收视,率,率为90%,,误,误差,是,是3%,,,,置,信,信度,为,为95%,”,”云,云,云。,这,这这,种,种说,法,法意,味,味着,下,下面,三,三点,5.3 区,间,间估计,1.,样,样本中,的,的支持,率,率为90%,,即,即用样,本,本比例,作,作为对,总,总体比,例,例的点,估,估计,2.,估,估计范,围,围为90%3%(,3%,的,的误差),即,区,区间(93%,,,,87%)。,3.,如,如用类,似,似的方,式,式,重,复,复抽取,大,大量(,样,样本量,相,相同的,),)样本,时,时,产,生,生的大,量,量类似,区,区间中,有,有些会,覆,覆盖真,正,正的,p,,而有,些,些不会,;,;但其,中,中大约,有,有95%会覆,盖,盖真正,的,的总体,比,比例。,5.3 区,间,间估计,这样得,到,到的区,间,间被称,为,为总体,比,比例,p,的置信,度,度(confidencelevel)为95%的,置,置信区,间,间(confidenceinterval)。这里的,置,置信度,又,又称置信水,平,平或置信系,数,数。,显然置,信,信度的,概,概念又,是,是大量,重,重复抽,样,样时的,一,一个渐,近,近概念,。,。,5.3 区,间,间估计,因此说,“,“我们,目,目前得,到,到的区,间,间(比,如,如上面,的,的90%3%)以,概,概率0.95,覆,覆盖真,正,正的比,例,例p”是个错,误,误的说,法,法。,这里的,区,区间,(93%,87%),是固定,的,的,而,总,总体比,例,例p也,是,是固定,的,的值。,因,因此只,有,有两种,可,可能:,或,或者该,区,区间包,含,含总体,比,比例,,或,或者不,包,包含;,在固定,数,数值之,间,间没有,任,任何概,率,率可言,。,。,5.3 区,间,间估计,例5.1(noodle.txt)某厂,家,家生产,的,的挂面,包,包装上,写,写明“,净,净含量450,克,克”。,在,在用天,平,平称量,了,了商场,中,中的48包挂,面,面之后,,,,得到,样,样本量,为,为48,的,的关于,挂,挂面重,量,量(单,位,位:克,),)的一,个,个样本,:,:,用计算,机,机可以,很,很容易,地,地得到,挂,挂面重,量,量的样,本,本均值,、,、总体,均,均值的,置,置信区,间,间等等,。,。下面,是,是SPSS的,输,输出:,该输出,给,给出了,许,许多第,三,三章引,进,进的描,述,述统计,量,量。和,估,估计有,关,关的是,作,作为总,体,体均点,估,估计的,样,样本均,值,值,它,等,等于449.01;,而,而总体,均,均值的95%,置,置信区,间,间为(447.41,,,,450.61),5.3 区,间,间估计,我们还,可,可以构,造,造两个,总,总体的,均,均值(,或,或比例,),)之差,的,的置信,区,区间。,如想知,道,道两个,地,地区学,生,生成绩,的,的差异,,,,可以,建,建造两,个,个地区,成,成绩均,值,值之差,m,1,-,m,2,的置信,区,区间。,如想比,较,较一个,候,候选人,在,在不同,阶,阶段支,持,持率的,差,差异,,那,那就可,构,构造比,例,例之差,p,1,-,p,2,的置信,区,区间。,5.3 区,间,间估计,例5.2有两,个,个地区,大,大学生,的,的高度,数,数据(height2.txt),(a),我,我们想,要,要分别,得,得到这,两,两个总,体,体均值,和,和标准,差,差的点,估,估计(,即,即样本,均,均值和,样,样本标,准,准差),和,和各总,体,体均值,的,的95%置信,区,区间。,(b),求,求两个,均,均值差,m,1,-,m,2,的点估,计,计和95%置,信,信区间,。,。利用,软,软件很,容,容易得,到,到下面,结,结果:,5.3 区,间,间估计,两个总,体,体均值,估,估计量,的,的样本,均,均值分,别,别为170.56和165.60,,,,样本,标,标准差,分,分别为6.97857和7.55659,;,;还得,到,到均值,的,的置信,区,区间分,别,别是(168.5767,172.5433),(163.4524,167.7476)。,可以得,到,到两个,样,样本均,值,值的差(4.9600),,另,另外还,给,给出了,两,两总体,均,均值差,的,的95%置信,区,区间(2.073,7.847),。,。,5.4 关,于,于置信,区,区间的,注,注意点,前面提,到,到,不,要,要认为,由,由某一样,本,本数据得,到,到总体,参,参数的某一个95%,置,置信区,间,间,就,以,以为该区间以0.95的概,率,率覆盖,总,总体参,数,数。,置信度95%,仅,仅仅描,述,述用来,构,构造该,区,区间上,下,下界的统计量(是随,机,机的)覆盖总,体,体参数,的,的概率,;,;,也就是,说,说,无,穷,穷次重,复,复抽样,所,所得到,的,的所有,区,区间中,有,有95%包含,参,参数。,5.4 关,于,于置信,区,区间的,注,注意点,但是把,一,一个样,本,本数据,带,带入统,计,计量的,公,公式所,得,得到的,一,一个区,间,间,只,是,是这些,区,区间中,的,的一个,。,。,这个非,随,随机的,区,区间是,否,否包含,那,那个非,随,随机的,总,总体参,数,数,谁,也,也不可,能,能知道,。,。非随,机,机的数,目,目之间,没,没有概,率,率可言,。,。,5.4 关,于,于置信,区,区间的,注,注意点,置信区,间,间的论,述,述是由,区,区间和,置,置信度,两,两部分,组,组成。,有些新,闻,闻媒体,报,报道一,些,些调查,结,结果只,给,给出百,分,分比和,误,误差(,即,即置信,区,区间),,,,并不,说,说明置,信,信度,,也,也不给,出,出被调,查,查的人,数,数,这,是,是不负,责,责的表,现,现。,因为降,低,低置信,度,度可以,使,使置信,区,区间变,窄,窄(显,得,得“精,确,确”),,,,有误,导,导读者,之,之嫌。,在,在公布,调,调查结,果,果时给,出,出被调,查,查人数,是,是负责,任,任的表,现,现。这,样,样则可,以,以由此,推,推算出,置,置信度,(,(由后,面,面给出,的,的公式,),),反,之,之亦然,。,。,5.4 关,于,于置信,区,区间的,注,注意点,一个描,述,述性例,子,子:有10000个,人,人回答,的,的调查,显,显示,,同,同意某,观,观点人,的,的比例,为,为70%(有7000人同,意,意),,可,可算出,总,总体中,同,同意该,观,观点的,比,比例的95%,置,置信区,间,间为(0.691,0.709),;,;,另一个,调,调查声,称,称有70%的,比,比例反,对,对该种,观,观点,,还,还说总,体,体中反,对,对该观,点,点的置,信,信区间,也,也是(0.691,0.709),。,。,到底相,信,信谁呢,?,?实际,上,上,第,二,二个调,查,查隐瞒,了,了置信,度,度。如,果,果第二,个,个调查,仅,仅仅调,查,查了50个人,,,,有35个人,反,反对该,观,观点。,则,则其置,信,信区间,的,的置信,度,度仅有11%,。,。,演讲完,毕,毕,谢,谢,谢观看,!,!,
展开阅读全文