资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第四章 概率与理论分布,随机变数的数学期望,(expectation),就是它的总体,平均数,记为,三、随机变数的数字特征,反映随机变数分布特点的特征值主要有数学期望和,方差。,1.,数学期望,对于间断性随机变数,对于连续性随机变数,2.,方差,随机变数的方差,(variance),记为,,对于间断性随机变数,对于连续性随机变数,*方差具有如下性质:,(1),常数的方差为零。即,(2),常数与随机变数之积的方差为,(3),独立随机变数之和的方差等于各自的方差之和。,甲乙两工人一天中出现次品的概率分布列见表,4.3,。如两人的日产量相等,问谁的技术好?谁,的技术稳定?,例,4.4,D,(乙),0.3,(0,0.9),2,0.5,(1,0.9),2,0.2,(2,0.9),2,0.49,解:,技术好坏和稳定与否可由出次品的数学期望和方差来表示。对于甲和乙分别有,E,(甲),0.4,0,0.3,1,0.2,2,0.1,3,1,D,(甲),0.4,(0,1),2,0.3,(1,1),2,0.2,(2,1),2,0.1,(3,1),2,1,E,(乙),0.3,0,0.5,1,0.2,2,0,3,0.9,乙的技术较好且稳定。,第三节 二项分布,一、二项总体,质量性状的实验研究中常见所有个体都可根据某事件的,发生,与,不发生,而分为两组的情况:,大豆花色的遗传规律研究中,所有植株都可根据开紫花还是(不开紫花,即白花)分为两组。,还如,种子的发芽和不发芽。,二项总体:,把这种“非此即彼”事件所构成的总体,,称为二项总体。,二项总体的概率分布为,二项分布。,对于二项总体,在进行重复抽样试验中,都,具有如下,共同特征:,1.,每次试验只有两个对立结果,,分别计作,A,与,,它们出现的概率分别为,p,与,q(q=1-p),。,二、二项分布的概率函数,2.,试验具有重复性和独立性。,重复性,指每次试验条件不变,即每次试验中事,件,A,出现的概率皆为,p,。,独立性,是指任何一次试验中事件,A,的出现与其,余各次试验中出现何种结果无关。,二项分布的概率函数,以,X,表示在,n,次试验中事件,A,出现的次数。,X,是一个离散型随机变量,它的所有可能取,值为,1,,,2,,,,,n,,其概率分布函数为,P(x,),为随机变量,x,的二项分布,计作,X,B(n,p,),。,4.30,在一批发芽率为,0.9,的种子里取,5,粒进行发芽,实验。以,x,为发芽粒数,试做出实验结果,X,的概,率分布列。,例,4.6,解:已知,n,5,,,p,0.9,,,q,0.1,。,根据,(4.30),式得如下概率分布列。,表,4.6,种子发芽试验的概率分布列,X,0,0.9,0,0.1,5,0.00001,0.00001,1,5,0.9,0.1,1,0.00045,0.00046,2,10,0.9,2,0.1,3,0.00810,0.00856,3,10,0.9,3,0.1,2,0.07290,0.08146,4,5,0.9,4,0.1,1,0.32805,0.40951,5,1,0.9,5,0.59049,1.00000,若随机变量,x,服从二项分布,则,二项分布的总体,平均数,(次数)为:,此结果表明,,如果多次进行每,5,粒种子为一组的发,芽实验,平均每组会有,4.5,粒发芽,每组发芽粒数的,方差为,0.45,,标准差为,0.6708,粒。,例,4.7,计算,例,4.6,种子发芽试验结果的数学期望、,2,和,。,解:根据式,(4.32),有,2,(npq),1/2,(0.45)1/2,0.6078(,粒,),4.5(,粒,),5,0.9,np,npq,5,0.9,0.1,0.45,四、二项总体的抽样分布,1,抽样分布的意义,研究总体与从总体中抽出的样本之间的关系是数理统计的核心问题。,研究总体与样本关系的途径有两种:,一种是从总体到样本的方向;,另一种是从样本到总体的方向,2.,已知,一个或一系列样本的样本平均数和方差,,,如何据此去估计所属总体的平均数和方差,以及这,种估计的可靠性如何等。,1.,研究从,一个已知分布的总体,中抽取一个或一系列样本,其样本平均数和方差应是多少,?,3.,抽取,一个样本平均数为某个数值,的概率是多少?,无论从事哪个方向的研究,都需要了解从已知分,布的总体中随机地抽取所有可能的样本,其样本统,计数的概率分布规律也即,抽样分布,。,在样本容量为,n,的样本里,对每一个个体的抽样,都可看做是一次独立的试验,其结果是,n,个相互独,立,,但服从同一分布的随机变数。,样本统计数都是这些随机变数的函数,仍然是随,机变数,因此抽样分布也是随机变数的概率分布。,通常所说的,抽样分布,都是指无限总体和,放回,抽样,而言的。对于有限总体或不放回抽样,只要组成总,体的个体数足够大或者抽样分数,(n,N),足够小,都,可以与无限总体和放回抽样一样看待。,在一个二项总体中,假定某事件出现的概率为,p,,其对立事件出现的概率为,q,。从中随机地抽取容量为,n,的样本,其中该事件出现的次数,x,称为样本总和数。,样本总和数服从二项分布,其数学期望和方差分别为,2,样本总和数,(,次数,),的分布,3,样本平均数,(,成数,),的分布,在上述二项总体中随机地抽样,某事件出现的,频率,(,x/n,=p),称为样本平均数。若重复进行抽样,,则样本平均数分布的,总体平均数,及,方差,分别为,由二项总体中抽出的样本总和数和样本平均数的,分布是不同的。,在实践中,,处理某性状出现次数的资料应采用样,本总和数的分布,;,处理某性状出现的成数,(,或百分数,),资料应采用样,本平均数的分布,。,例,4.9,解,:,已知出现紫花的概率,p=0.75,,白花的概率,q=0.25,,,n=100,。,根据式,(4.35),可得出现紫花的株数和标准差,根据式,(4.36),可得出现紫花株的百分数和标准差,当,n,较大,,p,或,q,较小时,,np,或,nq5,时,二项分布,为,泊松分布,(,Poisson distribution,)。,泊松分布,令,m,np,则泊松分布为,P(X,1),m,x,e,-m,x!,(,4.33,),泊松分布的数学期望、方差和标准差为,m,2,m,m,1/2,(,4.34,),设一批种子中不合格种子占,0.005,,从中抽取,800,粒。试求其中不合格种子恰有,10,粒的概率和不多于,5,粒的概率。,P(X,10),4,10,e,-4,10!,0.005292,P(X,5),5,x=0,4,x,e,-4,x!,0.785132,例,4.9,解:,因为,n,800,p,0.005,np,45,,所以可以按,泊松分布计算。,第四节 正态分布,正态分布是一种重要的,连续型随机变量,的概率分布。许多社会和自然现象,特别是受众因素影响的农业和生物科学中绝大多数现象都服从正态分布。,理论研究还表明,即使原数据不服从正态分布甚至是间断性随机变数,只要试验次数,(,样本容量,)n,足够大,其样本平均数也趋于正态分布。,*,一、正态分布的定义及其特征,(一)正态分布的定义,随机变数,X,服从正态分布记为,X,N(,,,2,),。,其中,,是正态分布的,数学期望,;,2,是,方差,,称为正态分布的参数。,正态分布的概率,密度,函数为,:,相应的,概率累积函数,为,:,2,、,f,(,x,),在,x,=,处达到极大,极大值为,3,、,f(x,),是非负函数,以,x,轴为渐近线,分布从,-,至,+,;,1,、正态分布密度曲线是,单峰,、对称的“悬钟”形,曲线,对称轴为,x,=,;,(,二,),正态分布的特征,4,、曲线在,x=,处各有一个拐点,即曲线在,(-,,,-,),(,+,,,+),区间上是下凸的,在,-,,,+,区间内是上凸的;,+,-,5,、正态分布有两个参数,,平均数,和,标准差,。,是位置参数,当,恒定时,,愈大,则曲线沿,x,轴愈向右移动;反之,,愈小,曲线沿,x,轴愈向左移动。,是变异度参数。,当,恒定时,,愈大,表示,x,的取值愈分散,曲线愈“胖”;,愈小,,x,的取值愈集中在,附近,曲线愈“瘦”。,6,、分布密度曲线与横轴所夹的面积为,1,,即:,7.,无论,和,为多少,随机变数,x,的取值落在任意区间(,a,,,b,)的概率为,x=a,和,x=b,与正态分布曲线与横轴间的面积,即,习 题,1.,教材习题:,4.5,2.,反映随机变数分布特点的特征值主要有哪些?,3.,数学期望?数学期望的性质有哪些?,4.,随机变数的数学期望和方差与样本的平均数和方差是一样吗?为什么?,
展开阅读全文