资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,卫生统计学,抽样误差和抽样分布,Sampling Error and Sampling Distribution,主要内,容,容,抽样误,差,差,抽样误,差,差的重,要,要性,抽样误,差,差的定,义,义,抽样误,差,差的规,律,律性,标准误,标准误,的,的定义,标准误,的,的计算,标准误,的,的意义,标准误,的,的作用,t分布,t分布,的,的演化,t分布,的,的图形,t分布,的,的性质,F分布,2分布,1.1,抽,抽样,误,误差的,重,重要性,既然有,误,误差,,为,为什么,还,还要抽,样,样?,无限总,体,体的客,观,观存在,试验研,究,究的成,本,本效益,问,问题(cost effect),抽样误,差,差的重,要,要性,总体,同质个,体,体、个,体,体变异,总体参,数,数,未知,样本,代表性,、,、抽样,误,误差,随机,抽样,样本统,计,计量,已知,统计推,断,断,风,险,险,1.2,抽,抽样,误,误差的,定,定义,假如事,先,先知道,某,某地七,岁,岁男童,的,的平均,身,身高为119,.,.41cm。为了,估,估计七,岁,岁男童,的,的平均,身,身高(,总,总体均,数,数),,研,研究者,从,从所有,符,符合要,求,求的七,岁,岁男童,中,中每次,抽,抽取100人,共,计,计抽取,了,了五次,。,。,119.41cm,=4.38cm,抽样误,差,差的定,义,义,五次抽,样,样得到,了,了不同,的,的结果,,,,原因,何,何在?,个体变异,随机抽样,不同男童的身高不同,每次抽到的人几乎不同,抽样误差,抽样误,差,差的定,义,义,【定义】由于个,体,体变异,的,的存在,,,,在抽,样,样研究,中,中产生,样,样本统,计,计量和,总,总体参,数,数之间,的,的差异,,,,称为,抽,抽样误,差,差(samplingerror)。,各种参,数,数都有,抽,抽样误,差,差,这,里,里我们,以,以均数,为,为研究,对,对象,抽样误,差,差的表,现,现,抽样误差的表现,样本均数和总体均数间的差别,样本均数和样本均数间的差别,抽样误,差,差,定义。,只要有,个,个体变,异,异和随,机,机抽样,研,研究,,抽,抽样误,差,差就是不可避,免,免的。,抽样误,差,差有自,己,己的客,观,观规律,统计,学,学就是,拨,拨开抽,样,样误差,之,之雾来,洞,洞察客,观,观规律,的,的利器,。,。,1.3,抽,抽样,误,误差的,规,规律性,既然抽,样,样误差,是,是有规,律,律的,,那,那么到,底,底它的,分,分布规,律,律到底,是,是怎样,的,的?,Let,sEnjoyOur,Experiments!,中心极,限,限定理(central limit theorem,),)的表现,从正态,总,总体中,随,随机抽,样,样,其,样,样本均,数,数服从,正,正态分,布,布;,从任意,总,总体中,随,随机抽,样,样,当,样,样本含,量,量足够,大,大时,,其,其样本,均,均数的,分,分布逐,渐,渐逼近,正,正态分,布,布;,样本均,数,数之均,数,数的位,置,置始终,在,在总体,均,均数的,附,附近;,随着样,本,本含量,的,的增加,,,,样本,均,均数的,离,离散程,度,度越来,越,越小,,表,表现为,样,样本均,数,数的分,布,布范围,越,越来越,窄,窄,其,高,高峰越,来,来越尖,。,。,2.1,标,标准,误,误的定,义,义,样本统,计,计量(,如,如均数,),)也服,从,从一定,的,的分布,;,;,与描述,观,观测值,离,离散趋,势,势的指,标,标类似,,,,我们,使,使用样本统,计,计量的,标,标准差来反映,抽,抽样误,差,差的大,小,小。又,称,称标准误(standarderror,),)。,标准误,(standarderror,),),样本统,计,计量的,标,标准差,称,称为标,准,准误。,样本均,数,数的标准差,称,称为均,数,数的标,准,准误。,样本均,数,数的标,准,准误表,示,示样本,均,均数的,变,变异度,。,。,2.2,标,标准,误,误的计,算,算,计算公,式,式为,其中,为总体,标,标准差,,,,n为抽样,的,的样本,例,例数,在研究工作时,,,,由于总体标,准,准差常常未知,,可,可以利,用,用样本,标,标准差,近,近似估,计,计,标准误,的,的计算,【例】根据7岁男童,的,的身高,资,资料,,在已知,总,总体标,准,准差时,,,,标准,误,误为,4.38/10=0,.,.438cm,而若以,第,第一次,抽,抽样的,样,样本标,准,准差来,代,代替总,体,体标准,差,差,则,标,标准误,为,为,4.45/10=0,.,.445cm,2.3,标,标准,误,误的意,义,义,标准误,的,的意义,反映了,样,样本统,计,计量(,样,样本均,数,数,样,本,本率),分,分布的,离,离散程,度,度,体,现,现了抽,样,样误差,的,的大小,。,。,标准误,越,越大,,说,说明样,本,本统计,量,量(样,本,本均数,,,,样本,率,率)的,离,离散程,度,度越大,,,,即用,样,样本统,计,计量来,直,直接估,计,计总体,参,参数越,不,不可靠,。,。反之,亦,亦然。,标准误,的,的大小,与,与标准,差,差有关,,,,在例,数,数n一定时,,,,从标,准,准差大,的,的总体,中,中抽样,,,,标准,误,误较大,;,;而当,总,总体一,定,定时,,样,样本例,数,数越多,,,,标准,误,误越小,。,。说明,我,我们可,以,以通过,增,增加样,本,本含量,来,来减少,抽,抽样误,差,差的大,小,小。,2.4,标,标准,误,误的作,用,用,标准误,的,的用途,衡量样,本,本统计,量,量代表,总,总体参,数,数的可,靠,靠性;,估计总,体,体参数,的,的可信,区,区间;,进行假,设,设检验,。,。,2.5,标,标准,差,差和标,准,准误的,联,联系与,区,区别,标准差,标准误,对象,个体变异,抽样误差,计算方法,定义,定义,性质,n,越大,标准差越稳定,n,越大,标准误越小,用途,参考值范围,衡量离散程度,可信区间,假设检验,3.1,样,样本,均,均数的,抽,抽样分,布,布规律,中心极,限,限定理,从均数,为,为,标准,差,差为的正态,总,总体中,随,随机抽,样,样,样,本,本均数,服,服从均,数,数为,标准,差,差为,的,的,正,正态分,布,布。,从均数,为,为,标准,差,差为的任意,总,总体中,随,随机抽,样,样,当,样,样本含,量,量足够,大,大时,,样,样本均,数,数近似,服,服从均,数,数为,标准,差,差为,的,的,正,正态分,布,布。,3.2t分,布,布的演,化,化,根据中,心,心极限,定,定理的,内,内容,,当,当样本,含,含量足,够,够大时,,,,对从,均,均数为,标准,差,差为的任意,总,总体中,随,随机抽,样,样所得,的,的样本,均,均数进,行,行标准,化,化变换,,,,有,t分布的,演,演化,由于总,体,体标准,差,差往往,是,是未知,的,的,此,时,时往往,用,用样本,标,标准差,代,代替总,体,体标准,差,差,,这里,为自由,度,度(degreeoffreedom,df),取值,为,为n-1,由W.S,.,.Gosset提出,f,(,t,),=(,标准正态曲线,),=5,=1,0.1,0.2,-4,-3,-2,-1,0,1,2,3,4,0.3,自由度,分,分别为1、5、时的t分布,3.3t分,布,布的图,形,形,由Gosset提出,3.4t分布的,性,性质,t分布为,一,一簇单,峰,峰分布,曲,曲线。,t分布以0为中心,,,,左右,对,对称。,分布的,高,高峰位,置,置比u分布低,,,,尾部,高,高。即,相,相同的,尾,尾部面,积,积对应,的,的界值,,,,比u分布大,。,。例如,:,:P=0.05,u=1.64,而自由度,为,为10的t分布界,值,值,t=1,.,.812。,t分布与,自,自由度有关,,自,自由度,越,越小,t分布的,峰,峰越低,,,,而两,侧,侧尾部,翘,翘得越,高,高;自,由,由度逐,渐,渐增大,时,时,t分布逐,渐,渐逼近,标,标准正,态,态分布,;,;当自,由,由度为,无,无穷大,时,时,t分布就,是,是标准,正,正态分,布,布。,每一自,由,由度下,的,的t分布曲,线,线都有,其,其自身,分,分布规,律,律。t界值表。,t界值表,单侧:,P(t=t,)=,双侧:,P(t=t,)=,即:P(-t,tt,)=1-,例查t界值表,得,得t值表达,式,式,t0.05,10=2.228,(,(双侧),t0.05,10=1.812,(,(单侧),-t,t,0,4,2分布,设从正,态,态分布N(,2)中随,机,机抽取,含,含量为n的样本,,,,样本,均,均数和,标,标准差,分,分别为,和,和s,设,:,:,则2值服从,自,自由度,为,为n-1的2分布(2-distribution),是小写,希,希腊字,母,母,读,作,作chi。可见,,,,2分布是,方,方差的,抽,抽样分,布,布。,2分布的,特,特征,2分布为,一,一簇单,峰,峰正偏,态,态分布,曲,曲线,,自由度,为,为的2分布,,其,其均数,为,为,方差,为,为2。,1时2分布实,际,际上是,标,标准正,态,态分布,变,变量之,平,平方。,自,自由度,为,为的2分布实,际,际上是个标准,正,正态分,布,布变量,之,之平方,和,和。可,表,表示为,:,:,2=u12+u22+,+,+uv2,每一自,由,由度下,的,的2分布曲,线,线都有,其,其自身,分,分布规,律,律,=4,=3,=5,2,0,2,4,6,8,10,12,0.0,0.1,0.2,0.3,0.4,0.5,f(,2,),=1,=2,=6,2分布的,作,作用,方差的,抽,抽样分,布,布研究,样本分,布,布与理,论,论分布,的,的拟合,优,优度检,验,验,率或构,成,成比的,比,比较,5F分布,设从两,个,个方差,相,相等的,正,正态分,布,布N(1,2)和N(2,2)总体,中,中随机,抽,抽取含,量,量分别,为,为n1和n2的样本,,,,样本,均,均数和,标,标准差,分,分别为,、,、s1和,、,、s2。设,:,:,则F值服从,自,自由度,为,为(n1-1,n2-1),的,的F分布(F-distribution)。,F分布的,特,特征,F分布为,一,一簇单,峰,峰正偏,态,态分布,曲,曲线,,与,与两个,自,自由度,有,有关。,若F服从自,由,由度为,(,(1,2)的F分布,,则,则其倒,数,数1/F服从自,由,由度为,(,(2,1)的F分布。,自由度,为,为(1,2)的F分布,,其,其均数,为,为2/(2-2),,,,与第,一,一自由,度,度无关,。,。,第一自,由,由度11时,,,,F分布实,际,际上是t分布之,平,平方;,第,第二自,由,由度2时,,,,F分布实,际,际上等,于,于2分布。,每一对,自,自由度,下,下的F分布曲,线,线下的,面,面积分,布,布规律,。,。,0,1,2,3,4,5,0.0,0.2,0.4,0.6,0.8,1.0,0,1,2,3,4,5,0.0,0.2,0.4,0.6,0.8,1.0,1,5,2,10,1,1,2,10,1,10,2,1,10,2,1,F分布的,应,应用,方差齐,性,性检验,方差分,析,析,小结,抽样误,差,差的定,义,义和表,现,现,抽样误,差,差的规,律,律:中心极,限,限定理,标准误,的,的定义,及,及其意,义,义,t分布,的,的演化,、,、图形,、,、特征,及,及意义,ThankYou,!,!,Contact:86862744,Email:,
展开阅读全文