资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三章 随机变量 与概率分布,主讲教师:唐 辉,讲授内容,第一节 事件、概率和随机变量,第二节 二项式分布,第三节 正态分布,第四节 抽样分布,3.1 事件、概率和随机变量,事件:,每种可能出现的情况称为事件。它是指事物发生某种情况或试验中获得某种结果。,概率:,就是用来度量每一事件出现的可能性大小的数字特征。,频率,:,在n次试验中,事件出现的次数 叫做在这n次试验中的频数,而的频数与试验次数的比叫事件在n次试验中出现的频率记为,频率和概率是不相同的,只有当试验次数无限增大时,任一事件的频率趋于稳定,这时频率又称统计概率这时的频率和概率才是一样的,随机变量,离散型随机变量,连续型随机变量,随机变量:,以一定的概率分布取值的变量。一个随机变量的所有可能的取值就构成了一个总体。,事件 具体的数值 随机变量,离散型随机变量,:,试验只有几个确定的结果,并可一一列出,变量x的取值可用实数表示,且x取某一值时,其概率是确定的,这种类型的变量称为离散型随机变量。将这种变量所有可能取值及其对应概率一一列出所形成的分布称离散型随机变量的概率分布,也可用函数,f(x,)表示,称为概率函数。,连续型随机变量,:,变量x的取值仅是一个范围,且x在该范围内取值时,其概率是确定的。这时取x为一固定值是无意义的,因为在连续尺度上一点的概率几乎为0。这种类型的变量称为连续型随机变量。,3.2 二 项 式 分 布,二项总体、二项式分布,二项式分布的概率的计算方法,二项式分布的形状和参数,一、二项总体、二项式分布,二项总体:,这种由“非此即彼”的事件构成的总体,叫做二项总体。为便于研究,通常将二项总体中的“此”事件以变量“1”表示,记为概率p;将“彼”事件以变量“0”表示,其概率q。因此二项总体又称为“0、1”总体,其概率为p+q=1或q=1-p。,二项式分布,:,如果从二项总体抽取,n,个个体,可能得到,x,个个体属于“此”,那么属于“彼”的个体为,n-x,。由于是随机独立地从总体中抽取个体的,每项一次抽取的个体均有可能属于“此”,也有可能属于“彼”,那么得到的,x个“此”个体的数目可能为0、1、2、n个,。此处将x作为间断性资料的变量,则,x共有n+1种取值,,这n+1种取值又各有其概率,因而由变量及其概率就构成了一个分布,这个分布叫做二项式概率分布,简称二项式分布或二项分布。,一、二项总体、二项式分布,二、二项式分布的概率计算方法,在n次试验中,结果为1的次数(,X=0,1,2,,n,)是个随机变量,其分布称为二项分布,表示为,X B,(,n,P),。,其概率函数为:,二项分布的期望和方差分别为:,例如:某种猪病在某地区的死亡率为,40%,,即,p=0.4,,现有,10,头病猪,若不予治疗,则在,10,头中死,3,头、,2,头、,1,头以及全部愈好的概率为多少?,按照上面的公式进行计算:,7头愈好,3头死去的概率为:,8头愈好,2头死去的概率为:,9头愈好,1头死去的概率为:,10头全部愈好的概率为:,用EXCEL函数计算,BINOMDIST(试验成功次数, 试验次数, 成功的概率,false),三、二项式分布的形状和参数,对于一个二项式总体,如果,p=q,,二项式分布呈对称形状,如果,p,q,,二项式分布则表现偏斜形状。但如果,n,时,即使,p,q,,二项式总体分布的情况也趋于对称形状,所以二项分布的形状是由,n,和,p,两个参数决定的。,独立地投掷两次骰子所得点数之和(x)的概率分布图,第三节,正态分布,正态分布的研究意义,二项式分布的极限正态分布,正态分布曲线的特性,计算正态分布曲线区间面积或概率的方法,一、正态分布的研究意义,自然界许多现象趋于正态分布, 许多其他非正态分布的资料在一定条件 下 也接近正态分布, 绝大部分资料的抽样分布,当n足够大时,接近正态分布,二、二项式分布的极限正态分布,因为正态分布是二项分布的极限,所以可以由二项分布导出正态分布。对于二项分布,当,p=q=0.5,时,无论,n,值大小,二项分布的多边形都必定是对称的;如,p,q,,而,n,又很大时,这一多边形仍然是对称的。当,n,时,则可进一步推导出一个表示观察值,x,出现的概率函数方程:,三、正态分布曲线的特性,1.,曲线关于 x,=,对称,,因而平均数=中位数=众数,2. 曲线只有一个峰值,峰值在,x,=,处,3. 曲线在 x =,+ 1,处各有一个拐点,4. 曲线以x轴为渐近线向左右无限延伸,5. 曲线有参数,和,完全决定,,确定它在x轴上的位置,,确定曲线的形状,,大时,曲线图形变的矮和宽,,小时,曲线变得高与窄。,概率密度函数:,四、标准正态分布,对任意正态分布随机变量,XN,(,2,),将X作线性变换,所得到的随机变量,Z,服从标准正态分布,Z,N,(0,1),其概率密度函数为:,五、正态分布的概率计算方法,如果变数,x,取值介于,a,、,b,之间,且,a,b,P(a,x,b),或者简写为,P( a,x,b),可以通过正态分布曲线下区间的面积来表示其概率。我们知道求曲线下区间的面积,数学上通常用定积分来表示,下面为几对常见的区间与其相对应的面积或概率的数字:,区间,面积或概率,=,1,0.6827,2,0.9545,3,0.9973,1.960,0.9500,2.576,0.9900,(一)已知临界值u求概率P,先将非标准正态分布转化为标准正态分布,查附表1,标准正态分布函数表,列出了标准正态分布随机变量,Z,在区间, -,u,内取值的概率,=阴影部分的面积,(二)已知概率求解u,附表2 标准正态分布的双侧分位数表,列出了当两尾概率之和为,时,标准正态分布的临界值,u,(三)用Excel的粘贴函数求解,已知临界值u求左侧概率,NORMDIST,(U,平均数,标准差,true)(一般正态分布),NORMSDIST,(u)(标准正态分布),已知左侧概率,求临界值u,NORMINV,(,平均数, 标准差,),NORMSINV,(,)(标准正态分布),本章要点,事件、概率和随机变量的概念,二项分布概率的计算公式,正态分布的特点,一般正态分布如何转换为标准正态分布,利用附表会计算正态分布某一区间的概率、正态分布临界值,了解Excel二项分布和正态分布的相关函数的使用,
展开阅读全文