资源描述
,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,统计学,从数据到结论,第五章总体参数的估计,估计就是根据你拥有的信息来对现实世界进行某种判断。,你可以根据一个人的衣着、言谈和举止判断其身份,你可以根据一个人的脸色,猜出其心情和身体状况,统计中的估计也不例外,它是完全根据数据做出的。,如果我们想知道北京人认可某饮料的比例,人们只有在北京人中进行抽样调查以得到样本,并用样本中认可该饮料的比例来估计真实的比例。,从不同的样本得到的结论也不会完全一样。虽然真实的比例在这种抽样过程中永远也不知道;但可以知道估计出来的比例和真实的比例大致差多少。,从数据得到关于现实世界的结论的过程就叫做,统计推断(statistical inference),。,上面调查例子是估计总体参数(某种意见的比例)的一个过程。,估计(estimation),是统计推断的重要内容之一。,统计推断的另一个主要内容是下一章要引进的,假设检验(hypothesis testing),。,5.1 用估计量估计总体参数,人们往往先假定某数据来自一个特定的总体族(比如正态分布族)。,而要确定是总体族的哪个成员则需要知道总体参数值(比如总体均值和总体方差)。,人们于是可以用相应的样本统计量(比如样本均值和样本方差)来估计相应的总体参数,5.1 用估计量估计总体参数,一些常见的涉及总体的参数包括总体均值(,m,)、总体标准差(,s,)或方差(,s,2,)和(Bernoulli试验中)成功概率,p,等(总体中含有某种特征的个体之比例)。,正态分布族中的成员被(总体)均值和标准差完全确定;,Bernoulli分布族的成员被概率(或比例),p,完全决定。,因此如果能够对这些参数进行估计,总体分布也就估计出来了。,5.1 用估计量估计总体参数,估计的根据为总体抽取的样本。,样本的(不包含未知总体参数的)函数称为统计量;而用于估计的统计量称为,估计量(estimator),。,由于一个统计量对于不同的样本取值不同,所以,估计量也是随机变量,并有其分布。,如果样本已经得到,把数据带入之后,估计量就有了一个数值,称为该估计量的一个,实现(realization),或取值,也称为一个,估计值(estimate),。,5.1 用估计量估计总体参数,这里介绍两种估计,一种是,点估计(point estimation),,即用估计量的实现值来近似相应的总体参数。,另一种是,区间估计(interval estimation),;它是包括估计量在内(有时是以估计量为中心)的一个区间;该区间被认为很可能包含总体参数。,点估计给出一个数字,用起来很方便;而区间估计给出一个区间,说起来留有余地;不像点估计那么绝对。,5.2 点估计,用什么样的估计量来估计参数呢?,实际上没有硬性限制。任何统计量,只要人们觉得合适就可以当成估计量。,当然,统计学家想出了许多标准来衡量一个估计量的好坏。每个标准一般都仅反映估计量的某个方面。,这样就出现了按照这些标准定义的各种名目的估计量(如无偏估计量等)。,另一些估计量则是由它们的计算方式来命名的(如最大似然估计和矩估计等)。,5.2,点,点,估,估计,最常,用,用的,估,估计,量,量就,是,是我,们,们熟,悉,悉的,样,样本,均,均值,、,、样,本,本标,准,准差(,s,)和(Bernoulli,试,试验,的,的),成,成功,比,比例(,x,/,n,);,人们,用,用它,们,们来,分,分别,估,估计,总,总体,均,均值(,m,)、,总,总体,标,标准,差,差(,s,)和,成,成功,概,概率(或,总,总体,中,中的,比,比例),p,。这,些,些在,前,前面,都,都已,经,经介,绍,绍过,,,,大,家,家也,知,知道,如,如何,通,通过,计,计算,机,机(,或,或公,式,式),来,来计,算,算它,们,们。,5.2,点,点,估,估计,那么,,,,什,么,么是,好,好估,计,计量,的,的标,准,准呢,?,?,一种,统,统计,量,量称,为,为无偏,估,估计,量,量(unbiasedestimator)。,所谓,的,的无偏,性,性(unbiasedness)就是,:,:虽,然,然每,个,个样,本,本产,生,生的,估,估计,量,量的,取,取值,不,不一,定,定等,于,于参,数,数,,但,但当,抽,抽取,大,大量,样,样本,时,时,,那,那些,样,样本,产,产生,的,的估,计,计量,的,的均,值,值会,接,接近,真,真正,要,要估,计,计的,参,参数,。,。,5.2,点,点,估,估计,由于,一,一般,仅,仅仅,抽,抽取,一,一个,样,样本,,,,并,且,且用,该,该样,本,本的,这,这个,估,估计,量,量的,实,实现,来,来估,计,计对,应,应的,参,参数,,,,人,们,们并,不,不知,道,道这,个,个估,计,计值,和,和要,估,估计,的,的参,数,数差,多,多少,。,。,因此,,,,无,偏,偏性,仅,仅仅,是,是非,常,常多,次,次重,复,复抽,样,样时,的,的一,个,个渐,近,近概,念,念。,随机,样,样本,产,产生,的,的样,本,本均,值,值、,样,样本,标,标准,差,差和Bernoulli试,验,验的,成,成功,比,比例,分,分别,都,都是,相,相应,的,的总,体,体均,值,值、,总,总体,标,标准,差,差和,总,总体,比,比例,的,的无,偏,偏估,计,计。,5.2,点,点,估,估计,在无,偏,偏估,计,计量,的,的类,中,中,,人,人们,还,还希,望,望寻,找,找方,差,差最,小,小的,估,估计,量,量,,称,称为,最,最小,方,方差,无,无偏,估,估计,量,量。,此因,为,为方,差,差小,说,说明,反,反复,抽,抽样,产,产生,的,的许,多,多估,计,计量,差,差别,不,不大,,,,因,此,此更,加,加精,确,确。,评价,一,一个,统,统计,量,量好,坏,坏的,标,标准,很,很多,;,;而,且,且许,多,多都,涉,涉及,一,一些,大,大样,本,本的,极,极限,性,性质,。,。我,们,们不,想,想在,这,这里,涉,涉及,太,太多,此,此方,面,面的,细,细节,。,。,5.3,区,区间估,计,计,当描述一,个,个人的体,重,重时,你,一,一般可能,不,不会说这,个,个人是76.35,公,公斤,你会说这,个,个人是七,八,八十公斤,,,,或者是,在,在70公,斤,斤到80,公,公斤之间,。,。这个范,围,围就是区,间,间估计的,例,例子。,5.3,区,区间估,计,计,在抽样调,查,查例子中,也,也常用点,估,估计加区,间,间估计的,说,说法。,比如,为,了,了估计某,电,电视节目,在,在观众中,的,的支持率,(,(即总体,比,比例,p,),某调,查,查结果会,显,显示,该,节,节目的“,收,收视率为90%,,误,误差是3%,置,信,信度为95%”云,云,云。这这,种,种说法意,味,味着下面,三,三点,5.3,区,区间估,计,计,1.样,本,本中的支,持,持率为90%,即,用,用样本比,例,例作为对,总,总体比例,的,的点估计,2.估,计,计范围为90%3%(3%的误,差,差),即,区,区间(93%,87%)。,3.如,用,用类似的,方,方式,重,复,复抽取大,量,量(样本,量,量相同的,),)样本时,,,,产生的,大,大量类似,区,区间中有,些,些会覆盖,真,真正的,p,,而有些,不,不会;但,其,其中大约,有,有95%,会,会覆盖真,正,正的总体,比,比例。,5.3,区,区间估,计,计,这样得到,的,的区间被,称,称为总体,比,比例,p,的置信度(confidencelevel)为95%的置,信,信区间(confidence interval),。,。这里的置,信,信度又称置信水平或置信系数,。,。,显然置信,度,度的概念,又,又是大量,重,重复抽样,时,时的一个,渐,渐近概念,。,。,5.3,区,区间估,计,计,因此说“,我,我们目前,得,得到的区,间,间(比如,上,上面的90%3%)以概,率,率0.95覆盖真,正,正的比例p”是个错误,的,的说法。,这里的区,间,间,(93%,,,,87%),是固定的,,,,而总体,比,比例p也,是,是固定的,值,值。因此,只,只有两种,可,可能:或,者,者该区间,包,包含总体,比,比例,或,者,者不包含,;,;,在固定数,值,值之间没,有,有任何概,率,率可言。,5.3,区,区间估,计,计,例5.1(noodle.txt),某,某厂家生,产,产的挂面,包,包装上写,明,明“净含,量,量450,克,克”。在,用,用天平称,量,量了商场,中,中的48,包,包挂面之,后,后,得到,样,样本量为48的关,于,于挂面重,量,量(单位,:,:克)的,一,一个样本,:,:,用计算机,可,可以很容,易,易地得到,挂,挂面重量,的,的样本均,值,值、总体,均,均值的置,信,信区间等,等,等。下面,是,是SPSS的输出,:,:,该输出给,出,出了许多,第,第三章引,进,进的描述,统,统计量。,和,和估计有,关,关的是作,为,为总体均,点,点估计的,样,样本均值,,,,它等于449.01;而,总,总体均值,的,的95%,置,置信区间,为,为(447.41,,,,450.61),5.3,区,区间估,计,计,我们还可,以,以构造两,个,个总体的,均,均值(或,比,比例)之,差,差的置信,区,区间。,如想知道,两,两个地区,学,学生成绩,的,的差异,,可,可以建造,两,两个地区,成,成绩均值,之,之差,m,1,-,m,2,的置信区,间,间。,如想比较,一,一个候选,人,人在不同,阶,阶段支持,率,率的差异,,,,那就可,构,构造比例,之,之差,p,1,-,p,2,的置信区,间,间。,5.3,区,区间估,计,计,例5.2,有,有两个地,区,区大学生,的,的高度数,据,据(height2.txt),(a)我,们,们想要分,别,别得到这,两,两个总体,均,均值和标,准,准差的点,估,估计(即,样,样本均值,和,和样本标,准,准差)和,各,各总体均,值,值的95%置信区,间,间。,(b)求,两,两个均值,差,差,m,1,-,m,2,的点估计,和,和95%,置,置信区间,。,。利用软,件,件很容易,得,得到下面,结,结果:,5.3,区,区间估计,两个总体均,值,值估计量的,样,样本均值分,别,别为170.56和165.60,,,,样本标准,差,差分别为6.97857和7.55659;,还,还得到均值,的,的置信区间,分,分别是(168.5767, 172.5433),(163.4524,167.7476)。,可以得到两,个,个样本均值,的,的差(4.9600),,,,另外还给,出,出了两总体,均,均值差的95%置信区,间,间(2.073,7.847)。,5.4,关,关于置信区,间,间的注意点,前面提到,,不,不要认为由某一样本数据得到总,体,体参数的某一个95%置信,区,区间,就以,为,为该区间以0.95的概率,覆,覆盖总体参,数,数。,置信度95%仅仅描述,用,用来构造该,区,区间上下界,的,的统计量(是,随,随机的)覆盖总体参,数,数的概率;,也就是说,,无,无穷次重复,抽,抽样所得到,的,的所有区间,中,中有95%,包,包含参数。,5.4,关,关于置信区,间,间的注意点,但是把一个,样,样本数据带,入,入统计量的,公,公式所得到,的,的一个区间,,,,只是这些,区,区间中的一,个,个。,这个非随机,的,的区间是否,包,包含那个非,随,随机的总体,参,参数,谁也,不,不可能知道,。,。非随机的,数,数目之间没,有,有概率可言,。,。,5.4,关,关于置信区,间,间的注意点,置信区间的,论,论述是由区,间,间和置信度,两,两部分组成,。,。,有些新闻媒,体,体报道一些,调,调查结果只,给,给出百分比,和,和误差(即,置,置信区间),,,,并不说明,置,置信度,也,不,不给出被调,查,查的人数,,这,这是不负责,的,的表现。,因为降低置,信,信度可以使,置,置信区间变,窄,窄(显得“,精,精确”),,有,有误导读者,之,之嫌。在公,布,布调查结果,时,时给出被调,查,查人数是负,责,责任的表现,。,。这样则可,以,以由此推算,出,出置信度(,由,由后面给出,的,的公式),,反,反之亦然。,5.4,关,关于置信区,间,间的注意点,一个描述性,例,例子:有10000个,人,人回答的调,查,查显示,同,意,意某观点人,的,的比例为70%(有7000人同,意,意),可算,出,出总体中同,意,意该观点的,比,比例的95%置信区间,为,为(0.691,0.709);,另一个调查,声,声称有70%的比例反,对,对该种观点,,,,还说总体,中,中反对该观,点,点的置信区,间,间也是(0.691,0.709,),)。,到底相信谁,呢,呢?实际上,,,,第二个调,查,查隐瞒了置,信,信度。如果,第,第二个调查,仅,仅仅调查了50个人,,有,有35个人,反,反对该观点,。,。则其置信,区,区间的置信,度,度仅有11%。,演讲完毕,,谢,谢谢观看!,
展开阅读全文