资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,第四章 理论分布和抽样分布,第一节 事件、概率和随机变量,第二节 二项式分布,第三节 正态分布,第四节 抽样分布,第一节,事,事,件,件、概,率,率和随,机,机变量,一、事,件,件和事,件,件发生,的,的概率,二、事,件,件间的,关,关系,三、计,算,算事件,概,概率的,法,法则,四、随,机,机变量,一、事,件,件和事,件,件发生,的,的概率,事件-,-,-在自,然,然界中,一,一种事,物,物,常,存,存在几,种,种可能,出,出现的,情,情况,,每,每一种,可,可能出,现,现的情,况,况称为,事,事件。,随机事,件,件(random event)-,-,-某特,定,定事件,只,只是可,能,能发生,的,的几种,事,事件中,的,的一种,,,,这种,事,事件称,为,为随机,事,事件。,概率(probability,),)-,-,-每一,个,个事件,出,出现的,可,可能性,称,称为该,事,事件的,概,概率。,必然事,件,件-,-,-对,于,于一类,事,事件来,说,说,在,同,同一组,条,条件的,实,实现之,下,下必然,要,要发生,的,的,称,为,为必然,事,事件;,其,其概率,为,为1。,不可能,事,事件-,-,-对,于,于一类,事,事件来,说,说,在,同,同一组,条,条件的,实,实现之,下,下必然,不,不发生,的,的,称,为,为不可,能,能事件,,,,其概,率,率为0。,事件发,生,生的可,能,能性(,概,概率),是,是在大,量,量的实,验,验中观,察,察得到,的,的,,例如棉,田,田发生,盲,盲蝽象,为,为害的,情,情况,,并,并不是,所,所有的,棉,棉株都,受,受害,,随,随着观,察,察的次,数,数增多,,,,我们,对,对棉株,受,受害可,能,能性程,度,度大小,的,的把握,越,越准确,、,、越稳,定,定。这,里,里将一,个,个调查,结,结果列,于,于表4.1。,表4.1在相同,条,条件下,盲,盲蝽象,在,在某棉,田,田危害,程,程度的,调,调查结,果,果,调查株数(,n,),5,25,50,100,200,500,1000,1500,2000,受害株数(,a,),2,12,15,33,72,177,351,525,704,棉株受害频率(,a,/,n,),0.40,0.48,0.30,0.33,0.36,0.354,0.351,0.350,0.352,由表4.1可以看,到,到:调,查,查5株时,,有,有2株受害,,,,受害,株,株的频,率,率为40%,调,查,查25株时受,害,害频率,为,为48%,调,查,查100株时受,害,害频率,为,为33%。可,以,以看出,三,三次调,查,查结果,有,有差异,,,,说明,受,受害频,率,率有波,动,动、不,稳,稳定。,而,而当进,一,一步扩,大,大调查,的,的单株,数,数时,,发,发现频,率,率比较,稳,稳定了,,,,调查500株到2000株的结,果,果是受,害,害棉株,稳,稳定在35%左右,。,。,现以n代表调,查,查株数,,,,以a代表受,害,害株数,,,,那么,可,可以计,算,算出受,害,害频率p=a/n。从棉,株,株受害,情,情况调,查,查结果,看,看,频,率,率在n取不同,的,的值时,,,,尽管,调,调查田,块,块是相,同,同的,,频,频率p却不同,,,,只有,在,在n很大时,频,频率才,比,比较稳,定,定一致,。,。因而,,,,调查,株,株数n较多时,的,的稳定,频,频率才,能,能较好,地,地代表,棉,棉株受,害,害的可,能,能性,。,统计学,上,上用n较大时,稳,稳定的p近似代,表,表概率,。,。通过,大,大量实,验,验而估,计,计的概,率,率称为,实,实验概,率,率或统,计,计概率,,,,以表,示,示。此,处,处P代表概,率,率,P(A)代表事,件,件A的概率,,,,P(A)变化的,范,范围为01,即0P(A),1。,小概率,原,原理-,-,-,若,若事件A发生的,概,概率较,小,小,如,小,小于0.05或0.01,则认,为,为事件A在一次,试,试验中,不,不太可,能,能发生,,,,这称,为,为小概,率,率事件,实,实际不,可,可能性,原,原理,,简,简称小,概,概率原,理,理。这,里,里的0.05或0.01称为小,概,概率标,准,准,农,业,业试验,研,研究中,通,通常使,用,用这两,个,个小概,率,率标准,。,。,二、事,件,件间的,关,关系,(一),和,和,事,事件,(二),积,积,事,事件,(三),互,互,斥,斥事件,(四),对,对,立,立事件,(五),完,完,全,全事件,系,系,(六),事,事,件,件的独,立,立性,(一),和,和,事,事件,事件A和B至少有,一,一个发,生,生而构,成,成的新,事,事件称,为,为事件A和B的和事件,记为A+B,读作,“,“或A发生,,或,或B发生”,。,。,例如,,有,有一批,种,种子,,包,包含有,能,能发芽,的,的和不,能,能发芽,的,的。若A为“取,到,到能发,芽,芽种子,”,”,B为“取,到,到不能,发,发芽种,子,子”,,则,则A+B为“或,者,者取到,能,能发芽,种,种子或,者,者取到,不,不能发,芽,芽种子,”,”。,事件间,的,的和事,件,件可以,推,推广到,多,多个事,件,件:事,件,件A1、A2、An至少有,一,一发生,而,而构成,的,的新事,件,件称为,事,事件A1、A2、An的和事,件,件,记,为,为A1+A2+An=,(二),积,积,事,事件,事件A和B同时发,生,生所构,成,成的新,事,事件称,为,为事件A和B的积事件,记作AB,读作,“,“A和B同时发,生,生或相,继,继发生,”,”。,事件间,的,的积事,件,件也可,以,以推广,到,到多个,事,事件:,事,事件A1、A2、An同时发,生,生所构,成,成的新,事,事件称,为,为这n个事件,的,的积事,件,件,记,作,作A1A2An=,(三),互,互,斥,斥事件,事件A和B不可能,同,同时发,生,生,即AB为不可,能,能事件,,,,记作AB,=,=V,称事,件,件A和B互斥或,互,互不相,容,容。,例如,,有,有一袋,种,种子,,按,按种皮,分,分黄色,和,和白色,。,。若记A为“取,到,到黄色,”,”,B为“取,到,到白色,”,”,显,然,然A和B不可能,同,同时发,生,生,即,一,一粒种,子,子不可,能,能既为,黄,黄色又,为,为白色,,,,说明,事,事件A和B互斥。,这一定,义,义也可,以,以推广,到,到n个事件,。,。事件A1、A2、An不可能,同,同时发,生,生所构,成,成的新,事,事件称,为,为这n个事件,互,互斥或,互,互不相,容,容,记,作,作A1A2An=V,。,(四),对,对,立,立事件,事件A和B不可能,同,同时发,生,生,但,必,必发生,其,其一,,即,即A+B为必然,事,事件(,记,记为A+B,=,=U),AB为不可,能,能事件,(,(记为AB,=,=V),则,称,称事件B为事件A的对立事,件,件,并记B为,。,。,例如,,上,上面例,子,子中A为“取,到,到黄色,”,”,B为“取,到,到白色,”,”,A与B不可能,同,同时发,生,生,但,是,是,任,意,意抽取,一,一粒种,子,子,其,皮,皮色不,是,是黄色,就,就是白,色,色,即A和B必发生,其,其一,,因,因此,A和B互为对,立,立事件,。,。,积事件AB,和事件A+B,A,B,A,B,互斥事,件,件,对立事,件,件,A,B,(五),完,完,全,全事件,系,系,若事件A1、A2、An两两互,斥,斥,且,每,每次试,验,验结果,必,必发生,其,其一,,则,则称A1、A2、An为完全事,件,件系。,例如,,仅,仅有三,类,类花色,:,:黄色,、,、白色,和,和红色,,,,则取,一,一朵花,,,,“取,到,到黄色,”,”、“,取,取到白,色,色”和,“,“取到,红,红色”,就,就构成,完,完全事,件,件系。,(六),事,事,件,件的独,立,立性,若事件A发生与,否,否不影,响,响事件B发生的,可,可能性,,,,则称,事,事件A和事件B相互独,立,立。,例如,,事,事件A为“花,的,的颜色,为,为黄色,”,”,事,件,件B为“产,量,量高”,,,,显然,如,如果花,的,的颜色,与,与产量,无,无关,则,则事件A与事件B相互独,立,立。,三、计,算,算事件,概,概率的,法,法则,(一),互,互,斥,斥事件,的,的加法,(二),独,独,立,立事件,的,的乘法,(三),对,对,立,立事件,的,的概率,(四),完,完,全,全事件,系,系的概,率,率,(五),非,非,独,独立事,件,件的乘,法,法,(一),互,互,斥,斥事件,的,的加法,假定两,互,互斥事,件,件A和B的概率,分,分别为P(A)和P(B)。则事,件,件A与B的和事,件,件的概,率,率等于,事,事件A的概率,与,与事件B的概率,之,之和,,即,即P(A+B)=P(A),+,+P(B)。,加法定,理,理对于,多,多个两,两,两互斥,的,的事件,也,也成立,:,:假定A1、A2、Ann个事件,彼,彼此间,均,均是两,两,两互斥,的,的事件,,,,其概,率,率依次,为,为P(A1),P(A2),,,,,P(An),则A1,A2到An和事件,的,的概率P(A1+A2+ ,+,+An)等于P(A1),P(A2),,,,,P(An)之和,,即,即P(A1+A2+ ,+,+An)=P(A1)+P(A2)+, +P(An)。,例如,,一,一捆花,中,中红、,黄,黄、白,花,花的概,率,率分别,为,为0.2,、,、0.3、0,.,.5,那么,我,我们随,机,机抽取,一,一朵非,白,白色花,的,的概率,为,为0.5,(,(=0,.,.2+0.3,),),这只是,由,由加法,定,定理得,到,到的两,个,个事件,概,概率之,和,和。,(二),独,独,立,立事件,的,的乘法,假定P(A)和P(B)是两个,独,独立事,件,件A与B各自出,现,现的概,率,率,则,事,事件A与B同时出,现,现的概,率,率等于,两,两独立,事,事件出,现,现概率P(A)与P(B)的乘积,,,,即P(AB,),)=P(A)P(B,),),乘法定,理,理对于n个相互,独,独立的,事,事件也,成,成立。,假,假定P(A1),P(A2),,,,,P(An)是n个相互,独,独立事,件,件各自,出,出现的,概,概率,,则,则该n个事件,同,同时出,现,现的概,率,率P(A1A2An)等于各,自,自出现,概,概率之,乘,乘积,,即,即P(A1A2An)=P(A1)P(A2)P(An)。,现有4粒种子,,,,其中3粒为黄,色,色、1粒为白,色,色,采,用,用复置,抽,抽样。,试,试求下,列,列两事,件,件的概,率,率:,(A),第,第一次,抽,抽到黄,色,色、第,二,二次抽,到,到白色,;,;,(B),两,两次都,抽,抽到黄,色,色。,由于采,用,用复置,抽,抽样(,即,即每一,次,次抽出,观,观察结,果,果后又,放,放回再,进,进行下,一,一次抽,样,样),,所,所以第,一,一次和,第,第二次,的,的抽样,结,结果间,是,是相互,独,独立的,。,。,采用概,率,率的古,典,典定义,,,,可以,求,求出抽,到,到黄色,种,种子的,概,概率为0.75,抽到,白,白色种,子,子的概,率,率为0.25。因此,,,,有,P(A),=,=P(第一次,抽,抽到黄,色,色种子)P(第二次,抽,抽到白,色,色种子),=0.250.75=0,.,.1875,,P(B),=,=P(第一次,黄,黄色种,子,子)P(第二次,黄,黄色种,子,子),=0.750.75=0,.,.5625。,(三),对,对,立,立事件,的,的概率,若事件A的概率,为,为P(A),那么,其,其对立,事,事件的,概,概率为,:,:,(四),完,完,全,全事件,系,系的概,率,率,完全事,件,件系的,概,概率为1。,例如“,从,从10个数字,中,中随机,抽,抽得任,何,何一个,数,数字都,可,可以”,这,这样一,个,个事件,是,是完全,事,事件系,,,,其概,率,率为1。,(五),非,非,独,独立事,件,件的乘,法,法,如果事,件,件A和B是非独,立,立的,,那,那么事,件,件A与B同时发,生,生的概,率,率为事,件,件A的概率P(A)乘以事,件,件A发生的,情,情况下,事,事件B发生的,概,概率P(B|A),即:P(AB,),)=P(A)P(B|A),四、随,机,机变量,随机变,量,量是指,随,随机变,数,数所取,的,的某一,个,个实数,值,值。,例1:,抛,抛硬币,试,试验,,硬,硬币落,地,地后只,有,有两种,可,可能结,果,果:币,值,值面向,上,上和国,徽,徽面向,上,上,用,数,数“1”表示,“,“币值,面,面向上,”,”,用,数,数“0”表示,“,“国徽,面,面向上,”,”。把0,1作为变,量,量y的取值,。,。在讨,论,论试验,结,结果时,,,,就可,以,以简单,地,地把抛,硬,硬币试,验,验用取,值,值为0,1的变量,来,来表示,。,。,P(y=1),=,=0.5,P(y=0),=,=0.5,例2:,用,用“1”表示,“,“能发,芽,芽种子,”,”,其,概,概率为p;用“0”表示,“,“不能,发,发芽种,子,子”,,其,其概率,为,为q。显然,p+q=1,,则,P(y=1),=,=p,P(y=0),=,=q=1p。,例3:,用,用变量y表示水,稻,稻产量,,,,若y大于500kg的概率,为,为0.25,大于300kg且等于,小,小于500kg的概率,为,为0.65,等于,小,小于300kg的概率,为,为0.1。,则用变,量,量y的取值,范,范围来,表,表示的,试,试验结,果,果为,P(y300)=0.10,,P(300y500)=0.65,,P(y500)=0.25。,离散型,随,随机变,量,量-,-,-当试,验,验只有,几,几个确,定,定的结,果,果,并,可,可一一,列,列出,,变,变量y的取值,可,可用实,数,数表示,,,,且y取某一,值,值时,,其,其概率,是,是确定,的,的,这,种,种类型,的,的变量,称,称为离,散,散型随,机,机变量,。,。,将这种,变,变量的,所,所有可,能,能取值,及,及其对,应,应概率,一,一一列,出,出所形,成,成的分,布,布称为,离,离散型,随,随机变,量,量的概,率,率分布,:,:,概率,变量,y,i,y,1,y,2,y,3,y,n,P,1,P,2,P,3,P,n,也可用,函,函数f(y)表述,,称,称为概,率,率函数,。,。,前面例1、例2中的y就是离,散,散型随,机,机变量,,,,将其,可,可能取,值,值与对,应,应概率,一,一一列,出,出,即,为,为:,变量,y,0,1,概率,0.5,0.5,变量,y,0,1,概率,q,p,连续型,随,随机变,量,量(continuousrandomvariate)-,-,-对于,随,随机变,量,量,若,存,存在非,负,负可积,函,函数f(y)(y),对任,意,意a和b(ab)都有P(ayb)=,则称y为连续型,随,随机变,量,量(continuousrandomvariate),f(y)称为y的概率密,度,度函数(probabilitydensityfunction)或分布密,度,度(distribution density,),)。,上述例3中的y就是一,个,个连续,型,型随机,变,变量。,第二节,二,二,项,项式分,布,布,一、二,项,项总体,及,及二项,式,式分布,二、二,项,项式分,布,布的概,率,率计算,方,方法,三、二,项,项式分,布,布的形,状,状和参,数,数,四、多,项,项式分,布,布,一、二,项,项总体,及,及二项,式,式分布,所谓二项总,体,体( binarypopulation ),就是,非,非此即,彼,彼的两,项,项构成,的,的总体,例如:,小,小麦种,子,子发芽,和,和不发,芽,芽,大,豆,豆子叶,色,色为黄,色,色和青,色,色,调,查,查棉田,盲,盲蝽象,为,为害分,为,为受害,株,株和不,受,受害株,等,等等。,通常将,二,二项总,体,体中的,“,“此”,事,事件以,变,变量“1”表示,,,,具概,率,率p;将“,彼,彼”事,件,件以变,量,量“0”表示,,,,具概,率,率q。因而,二,二项总,体,体又称,为,为0、1总体,,其,其概率,则,则显然,有,有:p+q=1或q=1p,如果从,二,二项总,体,体进行n次重复,抽,抽样,,设,设出现,“,“此”,的,的次数,为,为y,那么y的取值,可,可能为0、1,、,、2、,、n,共有n+1种可能,取,取值,,这,这n+1种取值,各,各有其,概,概率,,因,因而由,变,变量y及其概,率,率就构,成,成了一,个,个分布,,,,这个,分,分布叫,做,做二项式,概,概率分,布,布,简称二项式,分,分布或二项分,布,布( binomial distribution,),)。,二项总,体,体的抽,样,样试验,具,具有重复性,和,和独立,性,性,重复性是指每,次,次试验,条,条件不,变,变,即,在,在每次,试,试验中,“,“此”,事,事件出,现,现的概,率,率皆为p,独立性是指任,何,何一次,试,试验中,“,“此”,事,事件的,出,出现与,其,其余各,次,次试验,中,中出现,何,何种结,果,果无关,二、二,项,项式分,布,布的概,率,率计算,方,方法,例:在,由,由具有,一,一对基,因,因差异,的,的亲本,杂,杂交形,成,成的F2代群体,中,中,出,现,现黄色,子,子叶的,概,概率为0.75,出现,青,青色子,叶,叶的概,率,率为0.25,这是,二,二项总,体,体的概,率,率分布,。,。如果,从,从这种,总,总体抽,取,取3(n,),)粒,那,么,么得到1(y,),)粒是黄,子,子叶的,概,概率是,多,多少呢,?,?,抽取三,粒,粒种子,(,(以Y代黄子,叶,叶,以G代青子,叶,叶),,即,即n=3,有两,粒,粒黄子,叶,叶种子,,,,即y=2,这时,有,有3种不同,组,组合:GGY,,,,GYG,YGG。出现,第,第一粒,,,,第二,粒,粒和第,三,三粒种,子,子是互,不,不影响,的,的,因,此,此这三,个,个事件,是,是独立,事,事件,,由,由乘法,法,法则可,得,得:,由于这,三,三个事,件,件都是,相,相互互,斥,斥的,,所,所以出,现,现两粒,黄,黄子叶,种,种子(y=2)的概率,为,为这三,种,种概率,之,之和:,上述结,果,果也可,以,以表示,为,为:,即复合,事,事件的,概,概率必,等,等于该,事,事件出,现,现的组,合,合数目,乘,乘以单,个,个事件,的,的概率,;,;而这,一,一复合,事,事件的,可,可能组,合,合数目,则,则相当,于,于从n(3,),)个物体,中,中任取,其,其y(2,),)个物体,的,的组合,数,数。数,学,学上的,组,组合公,式,式为:,二项式,中,中包含,两,两项,,这,这两项,的,的概率,为,为p、q,并且p+q=1,可推,知,知变量y的概率,函,函数为,:,:,累积函,数,数F(y):变量,小,小于等,于,于y的,所,所有可,能,能取值,的,的概率,之,之和,理论次,数,数:对于,任,任意y,理论,次,次数=nP(y),这一分,布,布律也,称,称贝努里,(,( Bernoulli,),)分布,并有,的泰勒,展,展开式,为,为:,可以看,到,到,上,式,式右边,的,的每一,项,项即为,二,二项分,布,布中变,量,量y取0、1,、,、2、,、n时的概,率,率,又p+q=1,从而(p+q)n=1,例4,.,.1,棉,棉,田,田盲蝽,象,象为害,的,的统计,概,概率乃,从,从调查2000株后获,得,得近似,值,值p=0.35。现受,害,害株事,件,件为A,其概,率,率为p=0.35,未受,害,害株事,件,件为对,立,立事件,,,,其概,率,率q=(10.35)=0.65。这一,试,试验是,可,可以重,复,复的。,假,假定做,了,了n次试验,,,,即抽,出,出n株为一,个,个抽样,单,单位,,那,那么,,试,试问出,现,现有y株是受,害,害的,,其,其概率,应,应有多,少,少?,假定以n=1,即抽,出,出一株,为,为一个,抽,抽样单,位,位,这,里,里已知P(A),=,=0.35和P(,),),=,=0.65,总体,的,的理论,次,次数分,布,布则以n乘上述,概,概率分,布,布,即np和n(1p),所以,有,有20000,.,.35,=,=700株受害,和,和20000,.,.65,=,=1300株未受,害,害。,如调查5株为一,个,个抽样,单,单位,,即,即n=5,则受,害,害株数y=0,1,2,,,,3,4和5的概率,可,可以计,算,算出来,,,,如表4.2。棉株,受,受害数,乃,乃一随,机,机变数(y),可以,计,计算变,量,量y相应的,概,概率函,数,数,如果每,次,次抽5个单株,,,,抽n=400次,则,理,理论上,我,我们能,够,够得到y=2的次数,应,应为:,理论次,数,数=400P(2),=,=4000,.,.3364=134,.,.56(次),图4.1和图4.2给出了,概,概率函,数,数图和,累,累积概,率,率函数,图,图,和其累,计,计函数,表4.2调查单,位,位为5株的概,率,率分布,表,表(p=0.35,q=0.65),受害株数,概率函数,P,(,y,),P,(,y,),F,(,y,),nP,(,y,),P,(0),0.1160,0.1160,46.40,P,(1),0.3124,0.4284,124.96,P,(2),0.3364,0.7648,134.56,P,(3),0.1811,0.9459,72.44,P,(4),0.0488,0.9947,19.52,P,(5),0.0053,1.0000,2.12,受害株,数,数(y)受害株,数,数(y),图4.1棉株受,盲,盲蝽象,为,为害的,概,概率分,布,布图,(p=0.35,n=5),图4.2棉株受,盲,盲蝽象,为,为害的,累,累积概,率,率函数F(y)图(p=0.35,n=5),例4,.,.2,某,某,种,种昆虫,在,在某地,区,区的死,亡,亡率为40%,即p=0.4,现对,这,这种害,虫,虫用一,种,种新药,进,进行治,疗,疗试验,,,,每次,抽,抽样10头作为,一,一组治,疗,疗。试,问,问如新,药,药无疗,效,效,则,在,在10头中死3头、2头、1头,以,及,及全部,愈,愈好的,概,概率为,多,多少?,按上述,二,二项分,布,布概率,函,函数式,计,计算,7头愈好,,,,3头死去,概,概率:,8头愈好,,,,2头死去,概,概率:,9头愈好,,,,1头死去,概,概率:,10头全部,愈,愈好的,概,概率:,若问10头中不,超,超过2头死去,的,的概率,为,为多少,?,?则应,该,该应用,累,累积函,数,数,即,三、二,项,项式分,布,布的形,状,状和参,数,数,图4.3为上述,棉,棉株受,害,害概率,如,如p=1/2时的概,率,率分布,图,图。从,图,图4.1和4.3可看出,,,,如p=q,二项,式,式分布,呈,呈对称,形,形状,,如,如pq,则表,现,现偏斜,形,形状。,受害株,数,数(y),图4.3 棉株受盲椿害的概率函数,f,(,y,)图(,p,=0.5,,n,=5,株),受害株,数,数(y),图4.1棉株受,盲,盲蝽象,为,为害的,概,概率分,布,布图(p=0.35,n=5),二项式,分,分布的,参,参数,仍以上,述,述棉株,受,受害为,例,例,抽,取,取5株中受,害,害株数,的,的多少(y)作为统,计,计指标,的,的话,,从,从总体,中,中可以,抽,抽取的,所,所有样,本,本均有,一,一个y,这样,所,所有的y构成了,一,一个新,总,总体,,该,该总体,也,也属于,二,二项式,总,总体,,其,其平均,数,数、方,差,差和标,准,准差如,下,下式,从而,,上,上述棉,田,田受害,率,率调查,结,结果,n=5,p=0.35,可求,得,得总体,参,参数为,:,:=50.35=1,.,.75株,,株。,四、多,项,项式分,布,布,所谓多项总,体,体,是指,将,将变数,资,资料分,为,为3类或多,类,类的总,体,体。,例如在,给,给某一,人,人群使,用,用一种,新,新药,,可,可能有,的,的疗效,好,好,有,的,的没有,疗,疗效,,而,而另有,疗,疗效为,副,副作用,的,的,就,是,是三项,分,分布。,多项总,体,体的随,机,机变量,的,的概率,分,分布即,为,为多项式,分,分布( multinomial distribution,),)。,设总体,中,中共包,含,含有k项事件,,,,它们,的,的概率,分,分别为p1、p2、p3、pk,显然p1+p2+p3+pk=1。若从,这,这种总,体,体随机,抽,抽取n个个体,,,,那么,可,可能得,到,到这k项的个,数,数分别,为,为y1、y2、y3、yk,显然y1+y2+y3+yk=n。那么,得,得到这,样,样一个,事,事件的,概,概率为,:,:,多项分,布,布的概,率,率计算,例4,.,.3,某,某,药,药对病,人,人有效,的,的概率,为,为1/2,对病,人,人无效,的,的概率,为,为1/3,有副,作,作用的,概,概率为1/6,若随,机,机抽取2个使用,该,该药的,病,病人,,那,那么我,们,们的结,果,果可能,包,包括这,样,样几种,事,事件:2个病人,有,有副作,用,用;一,个,个无效,、,、一个,有,有副作,用,用;两,个,个无效,;,;一个,有,有效、,一,一个有,副,副作用,;,;一个,有,有效、,一,一个无,效,效;两,个,个均有,效,效。这,几,几种事,件,件的概,率,率分别,为,为多少,呢,呢?可,以,以使用,上,上述的,概,概率分,布,布公式,来,来计算,,,,如表4.3。,表4.3多项式,分,分布的,概,概率计,算,算,变 量,(,y,1,、,y,2,、,y,3,),概率及其计算,P,(,y,1,、,y,2,、,y,3,),(0,0,2),(0,1,1),(0,2,0),(1,0,1),(1,1,0),(2,0,0),五、泊,松,松分布,二项,分,分布的,一,一种极,限,限分布,二项分,布,布中往,往,往会遇,到,到一个,概,概率p或q是很小,的,的值,,例,例如小,于,于0.1,另一,方,方面n又相当,大,大,这,样,样的二,项,项分布,必,必将为,另,另一种,分,分布所,接,接近,,或,或者为,一,一种极,限,限分布,。,。这一,种,种分布,称,称泊松,概,概率分,布,布,简,称,称泊松分,布,布( Poissondistribution )。,令np=m,则泊,松,松分布,如,如下式,:,:,y=0,1,2,,,,,e=2.71828为自,然,然对数,的,的底数,。,。,凡在观,察,察次数n相当大,时,时,某,一,一事件,出,出现的,平,平均次,数,数m(m是一个,定,定值),很,很小,,那,那么,,这,这一事,件,件出现,的,的次数,将,将符合,泊,泊松分,布,布。,泊松分,布,布的平,均,均数,、,、方,差,差,和,和标准,差,差,如,如下式,:,这一分,布,布包括,一,一个参,数,数m,由m的大小,决,决定其,分,分布形,状,状如图4.4。当m值小时,分,分布呈,很,很偏斜,形,形状,m增大后,则,则逐渐,对,对称。,图4.4 不同,m,值的泊松分布,例4,.,.41907年Student氏进行,以,以血球,计,计计数,酵,酵母细,胞,胞精确,度,度试验,。,。如这,种,种计数,技,技术是,有,有效地,合,合适,,则,则在每,一,一平方,格,格的细,胞,胞数目,理,理论上,应,应作为,一,一个泊,松,松分布,。,。,表4.4是从1mm2分为400个平方,格,格的结,果,果。总,共,共计数,的,的细胞,数,数为1872个,因,之,之平均,数,数m=1782/400,=,=4.68。理论,次,次数须,从,从泊松,分,分布的,概,概率计,算,算,即,从,从(p+q)n的极限,为,为:,其中y=0,1,2,,,,3,,是,的,的泰,勒,勒展开,式,式,(48),表4.4血球计,所,所计数,的,的每平,方,方格内,酵,酵母细,胞,胞数,酵母细胞数,0,1,2,3,4,5,6,7,8,次 数,20,43,53,86,70,54,37,18,理 论 次 数,3.71,17.37,40.65,63.41,74.19,69.44,54.16,36.21,21.18,酵母细胞数,9,10,11,12,13,14,15,16,总,次 数,10,5,2,2,400,理 论 次 数,11.02,5.16,2.19,0.86,0.31,0.10,0.03,0.01,400.00,本例m=4.68,em=(2.71828)4.68=0.009275,0.009275400,=,=3.71.3.71是理论,次,次数第,一,一项,,其,其他各,理,理论次,数,数均可,按,按(48)计算。,概,概率值,乘,乘以400得理论,次,次数。,本例标,准,准差估,计,计值为,第三节,正,正,态,态分布,一、二,项,项分布,的,的极限,正态,分,分布,二、正,态,态分布,曲,曲线的,特,特性,三、计,算,算正态,分,分布曲,线,线区间,面,面积或,概,概率的,方,方法,一、二,项,项分布,的,的极限,正态,分,分布,以上述,二,二项分,布,布棉株,受,受害率,为,为例,,假,假定受,害,害概率p=1/2,那么,,,,p=q=1/2。现假,定,定每个,抽,抽样单,位,位包括20株,这,样,样将有21个组,,其,其受害,株,株的概,率,率函数,为,为,于是概,率,率分布,计,计算如,下,下:,现将这,概,概率分,布,布绘于,图,图4.5。从图4.5看出它,是,是对称,的,的,分,布,布的平,均,均数,和,和,方,方差,为,为:,=npq=20,(,(1/2)(1/2,),)=5,(,(株)2。,=np=20,(,(1/2)=10(株),,图4.5 棉株受害率(0.5+0.5),20,分布图(实线表示二项,式概率分布,虚线表示接近的正态分布曲线),如p=q,不论n值大或,小,小,二,项,项分布,的,的多边,形,形图必,形,形成对,称,称;,如pq,而n很大时,,,,这多,边,边形仍,趋,趋对称,。,倘n或组数,增,增加到,无,无穷多,时,时(n),多边,形,形的折,线,线就表,现,现为一,个,个光滑,曲,曲线。,这,这个光,滑,滑曲线,在,在数学,上,上的意,义,义是一,个,个二项,分,分布的,极,极限曲,线,线,属,于,于连续,性,性变数,分,分布曲,线,线,一,般,般称之,为,为正态分,布,布曲线或正态概,率,率密度,曲,曲线。可以,推,推导出,正,正态分,布,布的概,率,率密度,函,函数为,:,:,(49),其中,y是所研,究,究的变,数,数;是概率,密,密度函,数,数;,和,为,为,总,总体参,数,数,,表,表示,所,所研究,总,总体平,均,均数,,表,表示所,研,研究总,体,体标准,差,差,不,同,同正态,分,分布可,以,以有不,同,同的,和,和,,,,但某,一,一定总,体,体的,和,和,是,是,常,常数。,参数,和,和有如下,的,的数学,表,表述,(410),令,可,可将(49)式标准,化,化为:,(411),上式称,为,为标准,化,化正态,分,分布方,程,程,它,是,是参数时的正,态,态分布,(,(图4.7)。记,作,作N(0,1)。,正态分,布,布的曲,线,线图,-3,-,-2,-,-10123,图4.6正态分,布,布曲线,图,图,(平均,数,数为,,,,标准,差,差为,),),图4.7,标,标准正,态,态分布,曲,曲线图,(平均,数,数,为,为0,标,准,准差,为,为1,),),二、正,态,态分布,曲,曲线的,特,特性,1.,正,正态分,布,布曲线,是,是以y=为对称,轴,轴,向,左,左右两,侧,侧作对,称,称分布,,,,所以,它,它是一,个,个对称,曲,曲线。,从,从所竖,立,立的纵,轴,轴f(y=,),)是最大,值,值,所,以,以正态,分,分布曲,线,线的算,术,术平均,数,数、中,数,数和众,数,数是相,等,等的,,三,三者均,合,合一位,于,于点,上,上。,2.,正,正态分,布,布曲线,以,以参数,和,和,的,的不,同,同而表,现,现为一,系,系列曲,线,线,所,以,以它是,一,一个曲,线,线簇而,不,不仅是,一,一个曲,线,线。,确,确定,它,它在横,轴,轴上的,位,位置,,而,而,确,确,定,定它的,变,变异度,,,,不同,和,和,的,的正态,总,总体具,有,有不同,的,的曲线,和,和变异,度,度,所,以,以任何,一,一个特,定,定正态,曲,曲线必,须,须在其,和,和,确,确,定,定后才,能,能确定,。,。图4.8和4.9表示这,个,个区别,。,。,图4.8标准差,相,相同(1,),)而平均,数,数不同,(,=,=0,、,、,=,=1、,=,=2)的,三,三个正,态,态分布,曲,曲线,图4.9平均数,相,相同(0,),)而标准,差,差不同(,=,=1、,=,=1.5,、,、,=,=2)的三个,正,正态分,布,布曲线,3.,正,正态分,布,布资料,的,的次数,分,分布表,现,现为多,数,数次数,集,集中于,算,算术平,均,均数,附,附,近,近,离,平,平均数,越,越远,,其,其相应,的,的次数,越,越少;,且,且在,左,左,右,右相等,|,|,|,|范,围,围内具,有,有相等,次,次数;,在,在|,|,|,3以上其,次,次数极,少,少。,4.,正,正态曲,线,线在|,|,|=1处有“,拐,拐点”,。,。曲线,两,两尾向,左,左右伸,展,展,永,不,不接触,横,横轴,,所,所以当y,,,,分布,曲,曲线以y轴为渐,近,近线,,因,因之曲,线,线全距,从,从,到,到+。,5.,正,正态曲,线,线与横,轴,轴之间,的,的总面,积,积等于1,因此,在,在曲线,下,下横轴,的,的任何,定,定值,,例,例如从y=y1到y=y2之间的,面,面积,,等,等于介,于,于这两,个,个定值,间,间面积,占,占总面,积,积的成,数,数,或,者,者说等,于,于y落于这,个,个区间,内,内的概,率,率。,正态曲,线,线的任,何,何两个y定值ya与yb之间的,面,面积或,概,概率乃,完,完全以,曲,曲线的,和,和,而,而确定,的,的。详,细,细数值,见,见附表2,下面,为,为几对,常,常见的,区,区间与,其,其相对,应,应的面,积,积或概,率,率的数,字,字:,区间1面积或,概,概率=0.6827,2,=,=0.9545,3,=,=0.9973,1.960,=,=0.9500,2.576,=,=0.9900,例如,,上,上章水,稻,稻140行产量,资,资料的,样,样本分,布,布表现,出,出接近,正,正态分,布,布,其,平,平均数(,),)、标准,差,差(s)以及离,均,均差为1、2和3个标准,差,差的区,间,间所包,括,括的次,数,数列于,表,表4.5。实验,的,的结果,与,与正态,分,分布的,理,理论结,果,果很相,近,近。,ks,数值(g),区间(g),区间内包括的次数,次数,%,1,s,157.9,36.4,121.5194.5,99,70.71,2,s,157.9,72.8,85.1230.7,134,95.71,3,s,157.9,109.2,48.7267.1,140,100.00,表4.5140行水稻,产,产量在,1s,,2s,,3s范围内,所,所包括,的,的次数,表,表,三、计,算,算正态,分,分布曲,线,线区间,面,面积或,概,概率的,方,方法,在正态,分,分布曲,线,线下,y的定值,从,从y=a到y=b间的概,率,率可用,曲,曲线下,区,区间的,面,面积来,表,表示,,或,或者说,,,,用其,定,定积分,的,的值表,示,示,如,图,图4.10所示的,面,面积。,(413),同样可,以,以计算,曲,曲线下,从,从,到y的面积,,,,其公,式,式如下,:,:,(414),这里FN(y)称为正,态,态分布,的,的累积,函,函数,,具,具有平,均,均数,和,和标准,差,差,。,。,A=P,(,(ayb,),),fN(y),图4.10正态分,布,布密度,函,函数的,积,积分说,明,明图面,积,积A=P,(,(ayb,),),现如给,予,予变数,任,任何一,定,定值,,例,例如a,那么,,,,可以,计,计算ya的概率,为,为FN(a),即,(415),如果a与b(ab)是y的两个,定,定值,,则,则其区,间,间概率,可,可从下,式,式计算,:,:,(416),当y=,,,,,当y=+,,正态分,布,布的密,度,度函数fN(y)是按y值将累,积,积函数FN(y)求其导,数,数得之,。,。,图4.11正态分,布,布的累,积,积函数FN(y),长度A=P(ayb),例4,.,.4,假,假,定,定y是一随,机,机变数,具,具有正,态,态分布,,,,平均,数,数,=30,标准,差,差=5,试计,算,算小于26,小于40的概率,,,,介乎26和40区间的,概,概率以,及,及大于40的概率,。,。,所有正,态,态分布,都,都可以,转,转换为,标,标准化,正,正态分,布,布方程,式,式,首先计,算,算:,先将y转换为u值,然后查,表,表计算,概,概率。,同理可,得,得:FN(40,),)=0,.,.9773,所以:P(26,y40,),)=FN(40,),)FN(26,),)=0,.,.97730.2119,= 0,.,.7654,P(y40,),)=1,P(y40,),)=1,0.9773,=0.0227,查附表2,当u=,0.8时,FN(26,),)=0,.,.2119,说明,这,这一分,布,布从,到26范围内,的,的变量,数,数占全,部,部变量,数,数的21.19%,或,者,者说,y26概率为0.2119.,图4.12 概率计算图示,例4,.,.5,在,在,应,应用正,态,态分布,时,时,经,常,常要讨,论,论随机,变,变数y离其平,均,均数的,差,差数大,于,于或小,于,于若干,个,个值的,概,概率。,例,例如计,算,算离均,差,差绝对,值,值等于,小,小于和,等,等于大,于,于1的概率,为,为:,也可以,简,简写为,相应地,,,,离均,差,差绝对,值,值等于,小,小于2、等于,大,大于2、等于,小,小于3和等于,大,大于3的概率,值,值为:,以上结,果,果解释,了,了正态,分,分布曲,线,线的概,率,率特性,,,,可参,考,考图4.13。,图4.13,离,离均,差,差的绝,对,对值1,2,和,和1.96,的,的,概,概率值,例4,.,.6,计,计,算,算正态,分,分布曲,线,线的中,间,间概率,为,为0.99时,其y或u值应等,于,于多少,?,?,因为正,态,态分布,是,是对称,的,的,故,在,在曲线,左,左边从,到,u的概率,和,和在曲,线,线右边,从,从u到的,概,概率都,应,应等于,1/2,(,(10.99)=0.005。,查表,u=2.58时,fN(y)=0.004940.005。,于是知,,,,当,2.58时,在,其,其范围,内,内包括99%的变,量,量,仅,有,有1%变量,在,在此范,围,围之外,。,。上述,结,结果写,作,作:,同理可,求,求得:,以上乃正态,曲,曲线下,左,左边一,尾,尾y从,到,到上的面,积,积和右,边,边一尾y从,到上,的,的面积,之,之和,,亦,亦可写,成,成:,同理,,亦,亦可写,成,成:,以上两,式,式等号,右,右侧的,前,前一项,为,为左尾概,率,率,后一,项,项为右尾概,率,率,其和,概,概率称,为,为两尾概,率,率值。,在附表,列出,了,了两尾,概,概率取,某,某一值,时,时的临,界,界u值(正,态,态离差u值),,可,可供直,接,接查用,。,。,例如,,可,可查得P=0.01时u=2.5758,P=0.05时u=1.9599,即表,示,示:,P(|u|2,.,.5758),=,=0.01,P(|u|1,.,.9599),=,=0.05,如果仅,计,计算一,尾,尾,则,为,为一尾,概,概率值,。,。例如,计,计算,P(u1.6448)=P(|u|1,.,.6448),=,=(0,.,.1),=,=0.05,这个0.05称为y值大于,的,的一尾,概,概率值,。,。,当概率,一,一定时,,,,两尾,概,概率的,|,|u|总是,大,大于一,尾,尾概率,|,|u|。,第四节,抽,抽,样,样分布,统计学,的,的一个,主,主要任,务,务是研,究,究总体,和,和样本,之,之间的,关,关系。,两个方,向,向,从总体,到,到样本,的,的方向, 即,本,本节所,要,要讨论,的,的抽样,分,分布。,从样本,到,到总体,的,的方向,,,,即统,计,计推断,问,问题。,抽样分,布,布( sampling distribution,),)是统计,推,推断的,基,基础。,一、统,计,计数的,抽,抽样及,其,其分布,参,参数,二、正,态,态总体,的,的抽样,分,分布,三、二,项,项总体,的,的抽样,分,分布,一、统,计,计数的,抽,抽样及,其,其分布,参,参数,从总体,中,中随机,抽,抽样得,到,到样本,,,,获得,样,样本观,察,察值后,可,可以计,算,算一些,统,统计数,,,,统计,数,数分布,称,称为抽样分,布,布。,抽样,复置抽,样,样,指将,抽,抽得的,个,个体放,回,回总体,后,后再继,续,续抽样,不复置,抽,抽样,指将,抽,抽得的,个,个体不,放,放回总,体,体而继,续,续进行,抽,抽样,(一),样,样,本,本平均,数,数的抽,样,样及其,分,分布参,数,数,总体,随机样,本,本123,无穷个,样,样本,图4.14总体和,样,样本的,关,关系,如图4.14从一个,总,总体进,行,行随机,抽,抽样可,以,以得到,许,许多样,本,本,如,果,果总体,是,是无限,总,总体,,那,那么可,以,以得到,无,无限多,个,个随机,样,样本。,如果从,容,容量为N的有限,总,总体抽,样,样,若,每,每次抽,取,取容量,为,为n的样本,,,,那么,一,一共可,以,以得到,个,个样,本,本(所,有,有可能,的,的样本,个,个数),。,。,抽样所,得,得到的,每,每一个,样,样本可,以,以计算,一,一个平,均,均数,,全,全部可,能,能的样,本,本都被,抽,抽取后,可,可以得,到,到许多,平,平均数,,,,如,等,等。,如果将,抽,抽样所,得,得到的,所,所有可,能,能的样,本,本平均,数,数集合,起,起来便,构,构成一,个,个新的,总,总体,,平,平均数,就,就成为,这,这个新,总,总体的,变,变量。,由平均,数,数构成,的,的新总,体,体的分,布,布,称,为,为平均,数,数的抽样分,布,布。,随机样,本,本的任,何,何一种,统,统计数,都,都可以,是,是一个,变,变量,,这,这种变,量,量的分,布,布称为,统,统计数,的,的抽样分,布,布。,除平均,数,数抽样,分,分布外,还,还有总,和,和数、,方,方差的,抽,抽样分,布,布等。,新总体,与,与母总,体,体在特,征,征参数,上,上存在,函,函数关,系,系。以,平,平均数,抽,抽样分,布,布为例,,,,这种,关,关系可,表,表示为,以,以下两,个,个方面,。,。,(1),该,该抽,样,样分布,的,的平均,数,数,与,与母总,体,体的平,均,均数相,等,等。,(417),(2),该,该抽,样,样分布,的,的方差,与,与母总,体,体方差,间,间存在,如,如下关,系,系:,(418),其中n为样本,容,容量。,抽,抽样分,布,布的标,准,准差又,称,称为标,准,准误,,它,它可以,度,度量抽,样,样分布,的,的变异,。,。,例4,.,.7,设,设有,一,一总体N=3(例2,4,,,,6)。以,样,样本容,量,量n=1、n=2、n=4及n=8,从总,体,体中进,行,行复置,抽,抽样,,抽,抽出全,部,部样本,于,于表4.6。,表4.6中列出,这,这些不,同,同样本,容,容量的,抽,抽样,分,分布,,并,并在图4.15用方柱,形,形图表,示,示其分,布,布形状,。,。,由表中,第,第一列,当,当N=3,n=1的总体,平,平均数,和,和方差,为,为:,当样本,容,容量依,次,次为2、4,、,、8时,其,相,相应,为,为4、4、4;其,相,相应为4/3,、,、2/3、1,/,/3。即,,,,,。,。,n,=,1,n,=,2,n,=,4,n,=,8,y,f,f,f,f,2,4,6,1,1,1,2,3,4,5,6,1,2,3,2,1,2.0,2.5,3.0,3.5,4.0,4.5,5.0,5.5,6.0,1,4,10,16,19,16,10,4,1,2.00,2.25,2.50,2.75,3.00,3.25,3.50,3.75,4.00,4.25,4.50,4.75,5.00,5.25,5.50,5.75,6.00,1,8,36,112,266,504,784,1016,1107,1016,784,504,266,112,36,8,1,3,9,81,6561,平均数,4,4,4,4,方 差,8/3,4/3,2/3,1/3,表4.6,各,各种不,同,同样本,容,容量的,样,样本平,均,均数(,),)的抽,样,样分布,n=1,n=2,图4.15各种不,同,同样本,容,容量的分布方,柱,柱形图,图4.15各种不,同,同样本,容,容量的分布方,柱,柱形图,n=4,n=8,(二),样,样,本,本总和,数,数的抽,样,样及其,分,分布参,数,数,样本总,和,和数(用代表),的,的抽样,分,分布参,数,数与母,总,总体间,存,存在如,下,下关系,:,:,(1),该,该抽,样,样分布,的,的平均,数,数,与,与母总,体,体的平,均,均数间,的,的关系,为,为:,(419),(2),该,该抽,样,样分布,的,的方差,与,与母,总,总体方,差,差间存,在,在如下,关,关系:,(420),(三),两,两,个,个独立,随,随机样,本,本平均,数,数差数,的,的抽样,及,及其分,布,布参数,如果从,一,一个总,体,体随机,地,地抽取,一,一个样,本,本容量,为,为n1的样本,,,,同时,随,随机独,立,立地从,另,另一个,总,总体抽,取,取一个,样,样本容,量,量为n2的样本,
展开阅读全文