第三章理论分布与抽样分布

上传人:无*** 文档编号:173992046 上传时间:2022-12-13 格式:PPT 页数:90 大小:704.03KB
返回 下载 相关 举报
第三章理论分布与抽样分布_第1页
第1页 / 共90页
第三章理论分布与抽样分布_第2页
第2页 / 共90页
第三章理论分布与抽样分布_第3页
第3页 / 共90页
点击查看更多>>
资源描述
西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作1西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作2西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作33.1.1 事件和事件发生的概率事件和事件发生的概率事件事件(event)event):在自然界中一种事物,常存在几种可能出现的情况,每一种可能出现的情况称为事件。概率概率(probability):每一事件出现的可能性,称为该事件的概率。随机事件随机事件(random event):若某特定事件只是可能发生的几种事件中的一种,这种事件称为随机事件。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作4要认识随机事件的规律性,个别的试验或观察是不适用的,必须在大量的实验中才能观察到。下面用棉田发生盲椿象为害的情况来说明这一问题。调查株数(n)受害株数(a)受害频率(a/n)52.402512.485015.3010033.3320072.36500177.3541000351.3511500525.3502000704.352西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作5统计学上通过大量实验而估计的概率称为实验概率或统计概率,用公式表示为:naAPnlim)(式中P代表概率,P(A)代表事件A的概率。P(A)的取集范围为:0 P(A)1。随机事件的概率表现了事件的客观统计规律性,它反映了事件在一次试验中发生可能性的大小,概率大表示事件发生的可能性大,概率小表示事件发生的可能性小。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作6小概率原理小概率原理:若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率实际不可能性原理,简称小概率原理。必然事件必然事件:对于一类事件来说,如在同一组条件的实现之下必然要发生的事件。不可能事件不可能事件:如果在同一组条件下必然不发生的事件。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作73.1.2 3.1.2 事件间的关系事件间的关系一、和事件一、和事件事件A和事件B至少有一个发生构成的新事件称为事件A和事件B的和事件,记为AB,读作“或A发生,或B发生”。例如测定棉花的纤维长度,以28毫米为事件A,28至30毫米为事件B,则抽取一根30毫米的这一新事件为AB。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作8二、积事件二、积事件事件A和B同时发生而构成的新事件,称为事件A和B的积事件,记为AB,读作“A和B同时发生或相续发生”。例如某小麦品种,以发生锈病为事件A,发生白粉病为事件B,则锈病和白粉病同时发生这一新事件为AB。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作9三、互斥事件三、互斥事件如果事件A和B不能同时发生,即A和B是不可能事件,则称事件A和B互斥。例如棉花纤维长度“28毫米”和“等于28毫米”不可能同时发生,为互斥事件。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作10四、对立事件四、对立事件事件A和B不可能同时发生,但必发生其一,即AB为必然事件(记为ABU),AB为不可能事件(记为AB=V),则称事件B为事件A的对立事件,并记B为例如,有一袋种子,按种皮分黄色和白色,事件A为“取到黄色”,事件B为“取到白色”,A与B不能同时发生,但是,任意取一粒种子,其皮色不是黄色就是白色,即A和B必发生其一,因此A和B互为对立事件。_A西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作11五、完全事件系五、完全事件系若事件A1、A2、An两两互斥,且每次试验结果必发生其一,则称A1、A2、An为完全事件系。例如对于棉花纤维长度,28毫米、28毫米和30毫米、30毫米均构成了完全事件系。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作12六、事件的独立性六、事件的独立性若事件A发生与否不影响B发生的可能性,则称事件A和事件B相互独立。例如,事件A为“花的颜色为黄色”,事件B为“产量高”,显然如果花的颜色与产量无关,则事件A和B相互独立。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作133.1.3 计算事件概率的法则计算事件概率的法则一、互斥事件的加法一、互斥事件的加法假定两互斥事件A和B的概率分别为P(A)和P(B),则 P(A+B)=P(A)+P(B)例如:荣昌猪的每胎产仔数9头的概率P(A)=0.65,为10头的概率P(B)=0.18,则每胎产仔10头的概率为:P(A+B)=P(A)+P(B)=0.65+0.18=0.83西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作14二、独立事件的乘法二、独立事件的乘法假定P(A)和P(B)是两个独立事件A与B各自出现的概率,则:P(AB)=P(A)P(B)例:现有4粒种子,其中3粒是黄色、1粒是白色,采用复置抽样。试求下列两事件的概率(1)第一次抽到黄色,第二次抽到白色;(2)两次都抽到黄色。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作15先求出抽到黄色种子的概率为3/4=0.75,抽到白色种子的概率为1/4=0.25.P(A)=P(第一次抽到黄色种子)P(第二次抽到白色种子)=0.750.25=0.1875P(B)=P(第一次抽到黄色种子)P(第二次抽到黄色种子)=0.750.75=0.5625西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作16三、对立事件的概率三、对立事件的概率若事件A的概率为P(A),那么其对立事件的概率为:P()=1P(A)四、完全事件系的概率四、完全事件系的概率例如上例,黄色种子和白色种子构成完全事件系,其概率为1。_A西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作17五、非独立事件的乘法五、非独立事件的乘法 P(AB)=P(A)P(B|A)西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作183.1.4 随机变量随机变量定义定义:随机变量是指随机变数所取的某一个实数值。例如:在抛硬币试验中,币值面向上的用数“1”表示,国徽面向上的用“0”表示。把0,1作为变量y 的取值。P(y=1)=0.5 P(y=0)=0.5西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作19一、离散型随机变量一、离散型随机变量变量y的取值可用实数表示,且y取某一值时,其概率是确定的,这种类型的变量称为离散型随机变量。将这种变量的所有可能取值及其对应的概率一一列出所形成的分布,称为离散型随机变量的概率分布:变量yi y1 y2 y3 yn 概率P(y=yi)P1 P2 P3 Pn西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作20二、连续型随机变量二、连续型随机变量变量y的取值仅为一范围,且y在该范围内取值时,其概率是确定的,这种类型的变量称为连续型随机变量(continuous random variate)。badyyfbyaP)()(式中,f(y)称为y的概率密度函数(probability density function)或分布密度(distribution density)西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作21随机变量可能取得的每一个实数值或某随机变量可能取得的每一个实数值或某一范围的实数值是有一个相应概率于其一范围的实数值是有一个相应概率于其对应的,这就是所要研究和掌握的规律,对应的,这就是所要研究和掌握的规律,这个规律称为随机变量的概率分布。这个规律称为随机变量的概率分布。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作22西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作233.2.1 二项总体与二项式分布二项总体与二项式分布 有些总体的各个个体的某些性状,只能发生非此即彼的两种结果,“此”和“彼”是对立事件。例如种子的发芽与不发芽,施药后害虫的死或活,产品的合格与不合格。这种由非此及彼事件构成的总体,称之为二项总体二项总体(binomial population)。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作24为便于研究,通常给“此”事件以变量“1”,具概率p;给“彼”事件以变量“0”,具概率q其概率关系为:pq=1 q1=p如果我们每次抽取0、1总体的n个个体,则所得变量y将可能有0,1,n,共n+1种。这n+1变量有它各自的概率而组成一个分布。这个分布叫做二项概率分布,简称二项分布二项分布(binomial distribution)。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作25 例如,观察施用某种农药后蚜虫的死亡数,记“死”为0,“活”为1。如果每次观察5只,则观察的结果将有0(5只全死)、1(4死1活)、2(3死2活)、3(2死3活)、4(1死4活)、5(5只全活),共6种变量。由这6种变量的相应概率组成的分布,就是n=5时活虫数的二项分布。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作263.2.2 二项式分布的概率计算方二项式分布的概率计算方法法下面用一个例子来讲解这一问题。红花豌豆和白花豌豆杂交,F2代出现红花的概率为p=3/4,出现白花的概率为q=1/4。如果将F1代种子成行种植,每行种4粒。问一行全是红花、三株红花、二株红花、一株红花、0红花的概率各是多少。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作27这实际上是以n=4,从p=3/4,q=1/4的二项总体中抽样构成二项分布的问题。为方便,以“1”代表出现红花的事件,“0”代表出现白花的事件。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作28红花数组合数xf(x)4红3红2红1红0红西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作29上例各项的概率相当于(p+q)4的展开:(p+q)4=p4+4p3q+6p2q2+4pq3+q4同理,以样本容量为n进行的抽样,得到的概率分布为(p+q)n的展开。每一项的系数为:)!(!knknCkn(0kn)西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作30计算二项分布任何一项概率的通式为:ynyynyynqpynynqpCyP)!(!)(例4.2 某种昆虫在某地区的死亡率为40%,即p=0.4,现对这种害虫用一种新药进行治疗试验,每次抽10头作为一组治疗。试问如新药无疗效,则在10头中死3头、2头、1头,以及全部愈好的概率为多少?西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作3121499.0)6.0()4.0()3(73310 CP8头愈好,2头死去的概率为:12093.0)6.0()4.0()2(82210 CP7头愈好,3头死去的概率为:西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作329头愈好,1头死去的概率为:04031.0)6.0()4.0()1(91110 CP10头全部愈好的概率为:00605.0)6.0()4.0()0(100010 CP若计算10头中不超过2头死去的概率为多少?则应该应用累积概率,即:2016729.012093.004031.000605.0)2()1()0()()2(PPPypF西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作333.2.3 二项式分布的形状和参数二项式分布的形状和参数一、形状0 00.050.050.10.10.150.150.20.20.250.250.30.30.350.350.40.40 01 12 23 34 45 5P=0.35,n=5的概率分布图西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作34(p=0.5,n=5)的概率分布图0 00.050.050.10.10.150.150.20.20.250.250.30.30.350.350 01 12 23 34 45 5西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作35当p=q时。二项分布呈对称形状,如pq,则表现偏斜形状。但从理论和实践检验,当n很大时即使pq,它也接近对称形状。所以这一理论分布是由n n和p p两个参数决定的。二、参数二、参数凡描述一个总体,平均数和方差(或标准差)两个参数是重要的。二项总体,其平均数、方差2和标准差为:npq=np,2=npq =西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作363.2.4 多项式分布多项式分布若总体内包含几种特性或分类标志,可以将总体中的个体分为几类,例如在给某一人群使用一种新药,可能有好的疗效,有的没有疗效,而另有疗效为副作用的,象这种将变数资料分为3类或多类的总体称为多项总体,研究其随机变量的概率分布可使用多项式分布多项式分布(multinomial distribution)。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作37设总体中共包含k项事件,它们的概率分别为:p1、p2、p3、pk,显然 p1+p2+p3+pk=1。若从这个总体随机抽取n个个体,那么可能得到这k项的个数分别为 y1、y2、y3、yk,而y1+y2+y3+yk=n。其事件的概率为:kykyyykkppppyyyynyyyyP.!.!),.,(321321321321这一概率分布称为多项式分布多项式分布。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作38例4.3某药对病人有效的概率为1/2,对病人无效的概率为1/3,有副作用的概率为1/6,若随机抽取2个使用该药的病人,那么我们的结果可能包括这样几种事件:2个病人有副作用;一个无效、一个有副作用;两个无效;一个有效、一个有副作用;一个有效、一个无效;两个均有效。试计算出现这些事件的概率。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作39解:分别用y1、y2、y3分别代表用药有效的个体数、用药无效的个体数和用药有副作用的个体数。这些事件的概率的计算见下表:西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作40变量(y1、y2、y3)概率及其计算P(y1、y2、y3)(0,0,2)361)61()31()21(!2!0!0!2200(0,1,1)91)61()31()21(!1!1!0!2110(0,2,0)91)61()31()21(!0!2!0!2020(1,0,1)61)61()31()21(!1!0!1!2101(1,1,0)31)61()31()21(!0!1!1!2011(2,0,0)41)61()31()21(!0!0!2!2002西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作413.2.5 泊松分布泊松分布二项分布的一种极限二项分布的一种极限分布分布应用二项分布时,有时会遇到一个概率p或q很小的值,例如小于0.1,另一方面n又相当大,这样二项分布必将为另一分布所接近,或者为一极限分布。这种分布称为泊松概率分布,简称泊松泊松分布分布(Poisson distribution)。如将np=m,则接近分布如下式:!)(yemyPmyy=0,1,2,西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作42凡在观察次数n(n相当大)中,某一事件出现的平均次数m(m是一个定值)很小,那么,这一事件出现的次数将符合泊松分布。泊松分布在生物学研究中是经常遇到的,例如,昆虫与植物种类在一定面积的分布,病菌侵害作物的分布,一个显微镜视野内的细菌计数以及原子衰变的规律等随机变数。泊松分布的平均数、方差和标准差为:mm2m西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作43西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作443.3.1 二项分布的极限二项分布的极限正态分布正态分布P=0.5,n=5的二项分布西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作45p=0.5,n=20的二项分布西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作46从图中看出,若n,每个组的直方形都一一变为纵轴线,连接的直线也一一变成点了。这时多边形折线应表现为一个光滑的曲线,在数学意义上它是一个二项分布的极限曲线。这一曲线称之为正态分布曲线正态分布曲线或正态概率曲正态概率曲线线。其概率密度函数为:2)(2121)(yNeyf西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作473.3.2 正态分布曲线的特性正态分布曲线的特性1、以y=为对称轴,向左右两侧作对称分布,其算术平均数、中数、众数相等,均在点上。2、正态分布曲线由参数和决定,所以它是曲线簇而不是单一的曲线。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作48 1230.00.10.20.30.40.5012345-1-2-3-4f(y)y0.00.10.20.30.40.5012345-1-2-3-4f(y)y=1=1.5=2西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作493、正态分布资料的分布表现为多数次数位于算术平均数附近,在y-3以上其次数极少,在实际应用中,y通常在 3范围之内取值,这就是66法则法则。0.00.10.20.30.40.5012345-1-2-3-4f(y)y68.27%95.45%99.73%西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作504、正态曲线在y-|=1 处有拐点,并以横轴为渐进线,因此曲线全距从-到+。5、正态曲线与横轴之间的面积等于1,因此曲线下横轴的任何定值,等于介于这两个面积占总面积的成数。下面是几组常用值:1 概率=0.6827 2 概率=0.9545 3 概率=0.9973 1.960 概率=0.9500 2.576 概率=0.9900西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作513.3.3 计算正态分布曲线区间概率的方法计算正态分布曲线区间概率的方法在正态分布曲线下,y的定值从y=a到y=b间的概率可用曲线区间的面积表示:dyebyaPyba2)(2121)(计算曲线下从-到y0的面积,公式如下:0)()(0yNNdyyfyFFN(y)称为正态分布的累积函数。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作52西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作53为了便于使用,通常是将正态分布3 分成很小的距离单位,比如0.01,进行积分,然后制成概率分布表。使用者只需查表,而无需进行复杂的积分运算。一个首先需要解决的问题是,正态分布是一个曲线簇,而非单一的曲线,用曲线簇进行制表几乎是无法完成的事情。因此要设法将其转化为一条曲线。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作54由于正态曲线受和的制约,曲线随这两个参数的变化而改变。构造一个新变数,这个变数要消去和的影响。假定新变数用u来表示,则:yu西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作55u称为正态离差正态离差,由之可将正态方程标准化为:22121ueu上式为标准化正态分布方程,它是参数西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作56有了标准曲线之后,就可以将y值从-3到3范围内的FN(y)的值,以0.01的间隔列于附表2(P357)。计算一定区间的概率值,只要查表就可以了。例4.4 假定y是一随机变数具有正态分布,平均数=30,标准差=5,试计算小于26,小于40的概率,介于26和40区间的概率以及大于40的概率。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作57首先计算:P(y26)=FN(26)先将y转换成u值:u=(y-)/=(26-30)/5=0.8查附表2,当u=0.8时 FN(26)=0.2119同样计算:P(y40)=FN(40)u=(y-)/=(40-30)/5=2.0查附表2,当u=2.0时 FN(40)=0.9773计算:P(2640)=1-P(y40)=1-0.973=0.02270.0000.0040.0080.0120.0160.0203035404525201510fN(y)yP(y26)=0.21190.0000.0040.0080.0120.0160.0203035404525201510fN(y)yP(y40)=0.9773西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作590.0000.0040.0080.0120.0160.0203035404525201510fN(y)y0.0000.0040.0080.0120.0160.0203035404525201510fN(y)yP(y40)=0.0227P(26y40)=0.7654西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作60例4.6(P64)计算正态分布曲线的中间概率为0.99时,其y或u值应为多少?因为正态分布是对称的,故在曲线左边从到u的概率和曲线右边从u到的概率应等于1/2(1-0.99)=0.005。查附表3,u=2.58时,FN(y)=0.004940.005。故当y=2.58时,在其范围内包括99%的变量。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作61f(y)y0.00.10.20.30.40.5012345-1-2-3-499.0)58.2|(|)58.2|(|01.0)58.2|(|)58.2|(|uPyPuPyP99.0)58.2|58.2(uP左尾概率右尾概率西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作62西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作633.4.1 统计数的抽样分布及其分布参数统计数的抽样分布及其分布参数前面我们谈到总体的参数是无法得到的,需要用样本的统计数进行估计。用统计数估计总体的相应参数,首先必须知道统计数与参数的关系,即要弄清楚总体和样本的关系。通过本节抽样分布的讨论,目的就是要搞清楚从总体中抽出所有可能的样本统计量的分布与原总体之间的关系。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作64总体随机样本1234无穷多个样本总体和样本的关系示意图西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作65一、样本平均数的抽样及其分布一、样本平均数的抽样及其分布如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到Nn个样本。每个样本可以计算一个平均数,这样就得到许多 平均数,如果将这些平均数集合起来便构成一个新总体。由于每次随机抽样所得的平均数可能会存在差异,所以由平均数构成的新总体也应该有其分布,这种分布称为平均数的抽样分布平均数的抽样分布。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作66下面用一个抽样实验进一步说明样本平均数的抽样分布及其分布的参数。假定用一个很小的总体N=3,其观察值为2、4、6以样本容量n=2从中进行抽样。首先计算出总体参数:=(2+4+6)/3=42=(2-4)2+(4-4)2+(6-4)2/3=8/3所有可能的样本数=Nn=32=9西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作67总体N=3,样本容量n=2时所有样本的总和数、平均数和方差表 第一个观察值第二个观察值样本(y)s2s222242000.0000242463121.4142262684482.8284424263121.4142444484000.00004646105121.4142626284482.82846464105121.41426666126000.0000总 和7236122411.3136_y20s西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作68从表中我们可以算出样本平均数 的平均数:_y4936_nyNy以自由度为除数的样本方差的平均数:22389242nsNs以样本容量为除数的样本方差的平均数:2203491220nsNs西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作69样本标准差s的平均数:257.193136.11nsNs在统计上,如果所有可能样本的某一统计数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值无偏估计值(unbiased estimate)_y1、是西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作703、以n为除数的样本方差 不是2的无偏估计值。4、s不是的无偏估计值。20s4936_fyfy再以样本容量n=4,n=8从上述总体中抽样,并将抽出的全部样本列入表4.6(P67)根据表4.6,可算得n=2时样本平均数分布的平均数为:西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作71样本平均数分布的方差为:nfyfyy2_2223834912)(_同样,可算得n=4时:481324_fyfynfyfyy2_22438328154)(_西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作72当n=8时:4656126244_fyfynfyfyy2_228383165612187)(_西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作73不同样本容量的平均数的抽样分布形状为:抽样误差的概念抽样误差的概念:nnyy22y称为标准误标准误。抽样误差的度量:西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作740 00.50.51 11.51.50 0 2 2 4 4 6 6n=1fy0 00.50.51 11.51.52 22.52.53 33.53.52 23 34 45 56 6fn=2y0 02 24 46 68 81010121214141616181820202 22.52.53 33.53.54 44.54.55 55.55.56 6fn=4y0 020020040040060060080080010001000120012002.252.252.752.753.253.253.753.754.254.254.754.755.255.255.755.75fn=8y西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作75二、样本总和数的抽样及其分布参数二、样本总和数的抽样及其分布参数样本总和数(用y代表)的抽样分布参数与母总体间存在如下关系:1、该抽样分布的平均数y与母总体平均数间的关系为:y=n。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作762、该抽样分布的方差y与母总体方差间的关系为:22ny西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作77三、两个独立随机样本平均数差数的抽样三、两个独立随机样本平均数差数的抽样分布及其分布参数分布及其分布参数我们用一个例子来阐述这一问题。假定第一个总体包括3个观察值,2、4、6(N1=3,n1=2)所有样本数为Nn=32=9,总体的平均数和方差1=4,21=8/3。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作78第二个总体包括2 个观察值,3和6(N2=2),抽出的样本容量为3(n2=3),所有样本的个数为23=8,总体平均数和方差2=4.5,22=2.25西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作79ff213132434353526162总和9总和8_1y_2y从两个总体抽出的样本平均数的次数分布表从两个总体抽出的样本平均数的次数分布表西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作8022223333444455556666总和34563456345634563456-1-2-3-40-1-2-310-1-2210-13210f1331266239932662133172_1y_2y_1y_2y样本平均数差数的次数分布表样本平均数差数的次数分布表西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作81 f f()(+0.5)(+0.5)2f(+0.5)2-41-4-3.512.2512.25-35-15-2.56.2531.25-212-24-1.52.2527.00-118-18-0.50.254.5001800.50.254.50112121.52.2527.0025102.56.2531.253133.512.2512.25总72-36150.00_1y_2y样本平均数差数分布的平均数和方差计算表样本平均数差数分布的平均数和方差计算表_1y_2y_1y_2y_1y_2y_1y_2y西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作82由上表可算得:5.05.445.07236)(21_2_1_2_1fyyfyy12257215072)5.0()()(2_2_1221_2_12_2_1yyffyyyy而:12254334349238222121nn西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作833.4.2 正态总体抽样的分布规律正态总体抽样的分布规律一、样本平均数的分布一、样本平均数的分布1、从正态总体抽取的样本,无论样本容量多大,其样本平均数 的抽样分布必做成正态分布,具有平均数 和方差 记作N(,2/n)。_y_yny22_y西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作842、若母总体不是正态分布,从中抽出的 分布不一定属于正态分布,但当样本容量n增大时,从这总体抽出样本平均数 的抽样分布趋于正态分布,具有平均数和方差2/n。这称之为中心极限定理。_y西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作85下面是不同样本容量的抽样分布0.00.20.40.81.01.21230-1-2-3fN()_y_yn=9n=4n=1西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作86二、两个独立样本平均数差数的分布二、两个独立样本平均数差数的分布1、如果两个总体各作正态分布,则其样本平均数差数 准确地遵循正态分布,无论样本容量大小都有 。),(2_2_1_2_1yyyyN_1y_2y西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作872、两个样本平均数差数的平均数等于两个总体平均数的差数。3、两个独立的样本平均数差数分布的方差等于两个总体的样本平均数的方差总和。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作883.4.3 二项总体的抽样分布二项总体的抽样分布一、二项总体的分布参数一、二项总体的分布参数以一个含有5个个体的总体为例进行说明,设这5个观察值为:0,1,0,1,1,则总体平均数和方差为:=(0+1+0+1+1)/5=3/5=0.6西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作892=(0-0.6)2+(1-0.6)2+(0-0.6)2+(1-0.6)2+(1-0.6)2/5=0.24=0.49在这个二项总体中1事件的概率 p=3/5=0.6,0事件的概率 q=2/5=0.4由此可见:二项总体的平均数为=0.6=p,方差为2=0.24=0.60.4pq。西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作西南科技大学生命科学与工程学院周海廷制作90npqy_,标准误三、样本总和数三、样本总和数(次数次数)的抽样分布的抽样分布npqy,标准误py_平均数npqy2_,方差npy平均数npqy2,方差二、样本平均数二、样本平均数(成数成数)的抽样分布的抽样分布
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 基础医学


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!