2019-2020年高中数学 2.2 2二项分布与正态分布教案 新人教A版选修选修2-3.doc

上传人:tian****1990 文档编号:2594859 上传时间:2019-11-28 格式:DOC 页数:31 大小:477.50KB
返回 下载 相关 举报
2019-2020年高中数学 2.2 2二项分布与正态分布教案 新人教A版选修选修2-3.doc_第1页
第1页 / 共31页
2019-2020年高中数学 2.2 2二项分布与正态分布教案 新人教A版选修选修2-3.doc_第2页
第2页 / 共31页
2019-2020年高中数学 2.2 2二项分布与正态分布教案 新人教A版选修选修2-3.doc_第3页
第3页 / 共31页
点击查看更多>>
资源描述
2019-2020年高中数学 2.2 2二项分布与正态分布教案 新人教A版选修选修2-3有了概率和概率分布的知识,接下来我们要逐步掌握统计检验的一般步骤。既然按照数学规则得到的概率都不能用经验方法准确求得,于是,理论概率和经验得到的频率之间肯定存在某种差别,这就引出了实践检验理论的问题。随机变量的取值状态不同,其概率分布的形式也就不同。本章我们不仅要引出二项分布和正态分布这两个著名的概率分布,并且要将它们与抽样调查联系起来,以领会统计检验,并逐步拓宽其应用面。第一节 二项分布二项分布是从著名的贝努里试验中推导而来。所谓贝努里试验,是指只有两种可能结果的随机试验。在实际问题中,有许多随机现象只包含两个结果,如男与女,是与非,生与死,同意与不同意,赞成与反对等等。通常,我们把其中比较关注那个结果称为“成功”,另一个结果则称为“失败”。每当情况如同贝努里试验,是在相同的条件下重复n次,考虑的是“成功”的概率,且各次试验相互独立,就可利用与二项分布有关的统计检验。虽然许多分布较之二项分布更实用,但二项分布简单明了,况且其他概率分布的使用和计算逻辑与之相同。所以要理解统计检验以及它所涉及的许多新概念,人们几乎都乐意从二项分布的讨论入手。1.二项分布的数学形式我们仍从掷硬币的试验人手。假定二项试验由重复抛掷n次硬币组成,已知硬币面朝上(成功)的概率是p,面朝下(失败)的概率是q (显然有 q1p)。这样,对试验结果而言,成功的次数(即硬币面朝上的次数)X是一个离散型随机变量,它的可能取值是0,1,2,3,n。而对X的一个具体取值x而言,根据乘法规则,我们立刻可以就试验结果计算出一种特定排列(先x次面朝上,而后nx次面朝下)实现的概率,即 ppppqqqqpxqn-x (71)由于正确解决概率问题,光考虑乘法规则是不够的,还要考虑加法规则,于是我们根据 (627)式,又可以得到就x次成功和(nx)次失败这个宏观结果而言所包含的所有排列的方式数,用符号表示 (7)这样,我们就得到了二项试验中随机变量X的概率分布,即P(X=x)pxqn-x (73)譬如,二项试验是将一枚硬币重复做8次抛掷,假设这枚硬币是无偏的,即pq05,那么根据(73)式,恰好得到5次面朝上的概率是 P(5)p5q8-50219同理,我们也可以求出这个二项试验中硬币刚好为0,1,2,8次面朝上的各种宏观结果的概率,全部写出来就是表71。注意:当x为0时,0!1。此外,掌握这种对称性,将有助于简化运算。 表71硬币面朝上数x概率P(X=x)012345678 1/256= 004 8/256=03128/256=10956/256=21970/256=27456/256=21928/256=109 8/256=031 1/256=004合 计 1000 表71清楚地显示,做8次抛掷一枚硬币的重复试验,我们将得到9个可能结果中的一个。与经验认识不同的是,通过运用概率论,实现的每个可能结果都与一定的概率相联系。据此,我们可以对各种结果实现的可能性作出估计。其中,试验结果为4次成功(即4次面朝上)的可能性最大,而试验结果为全部面朝上(即8次面朝上)或全部面朝下(即0次面朝上)的可能性最小,每做256次同样的重复试验才可望看到一次。 在这个简单例子中,每回试验硬币仅被重复抛掷了8次,也仅能有为数不多的可想象到的结果。当然,还可以设想做硬币重复抛掷更多次的试验比如硬币被重复抛掷100次,那么可能实现的结果就会有101种。同样运用概率论的知识,我们可以把这些可能结果编组,并把概率和整个一组结果相联系。每当我们把概率与重复试验的每一种可能结果或几组结果联系起来时,就会得到如表71所示的概率分布,我们称之为二项分布。 2二项分布的讨论(1) 二项分布为离散型随机变量的分布。每当试验做的是在相同的条件下n次重复的贝努里试验时,随机变量X共有n+1个取值。二项分布可以用分布律(表72)和折线图(图71)来表示。 表72X 0 1 2 n合计P p0qn p1qn-1 p2qn-2 pnq01 (2)二项分布的图形当p05时是对称的,当p 05时是非对称的,而当n愈大时非对称性愈不明显(参见图71)。 (3)二项分布的数学期望E(X)np,变异数D(X)2npq。 (4)二项分布受成功事件概率p和试验次数n两个参数变化的影响,只要确定了p和n,成功次数x的概率分布也随之确定。因而,二项分布还可简写作B(x;n,p)。 (5)二项分布的概率值除了根据公式直接进行计算外,还可查表求得。二项分布表的编制方法有两种:一种依据概率分布律P(x)编制(见附表2);另一种依据分布函数F(x)编制(见附表3)。 F(x)P(Xx) (74) 例711 某特定社区人口的10是少数民族,现随机抽取6人,问其中恰好2人是少数民族的概率是多少? 解 解法一:根据(73)式直接计算 P(X=2)p2q400984984解法二:根据附表2中纵列n6和横行p01所对应x值,可直接查得B(x;6,01)的概率值 B (2;6,01)00984 解法三:根据附表3求得 B (2;6,01)F(2)- F(3 )011430015900984 例712求B (x;8,07)的中位数。 解 根据附表3中纵列n8和横行p07所对应的x值,可查出大于等于x的概率值。由于附表列示的是二项分布的累计概率,因此求中位数很方便。 Md5.5 +56747 第二节 统计检验的基本步骤 二项分布是用数学或演绎推理的方法求得的一种理论分布。认识到概率分布是先验的理论分布这一点很重要,因为我们不禁要问,既然试验或抽样调查的结果仅与随机变量可能取值中的一个相联系,那么实际试验或样本调查对结果的概率分布及前提假设有没有一个检验的问题?具体来讲,对于一枚硬币被重复抛掷8次的二项试验,经验告诉我们,一共有9种可能的结果,而且实现这些结果的机会是大不相同的。研究者实际上从来不用经验的方法求得概率分布,因为通常我们只对一项试验进行一次或几次,抽取样本也是一个或至多不过几个。既然二项分布是按照数学规则得到的,那么对这9种结果的可能性我们应该作出何种评价呢?如果实际抽样得到的结果偏巧就是先验概率预示的最不可能出现的结果,那么我们是认定纯属巧合,还是开始对用数学或演绎推理方法求得的概率以及理想试验的种种前提假设产生怀疑?更准确地说,在一枚硬币被重复抛掷8次的这个二项试验中,究竟出现什么结果时,我们应该对二项分布及其前提假设产生怀疑呢?是不是只要不是得到4次成功4次失败这个最大可能性结果就开始怀疑,还是仅当出现8次成功或一次也不成功这两个极端情况时才产生怀疑呢?这就是统计检验的核心问题。 概率分布不是一种研究者从资料中看到的分布,我们讨论它,不是出于对数学的爱好,而是因为统计推论的有关工作需要它。现在,我们要进入系统讨论统计假设检验的实际步骤的阶段。所有的统计检验都包含某些特定的步骤,这里先列示如下:(1)建立假设;(2)求抽样分布;(3)选择显著性水平和否定域(4)计算检验统计量; (5)判定。 应当注意,在统计检验中,概率分布都是与样本的可能结果相联系的,所以已超越了纯数学范畴。本书至此,开始将概率分布化为抽样分布来具体讨论。所谓抽样分布,就是把具体概率数值赋予样本每个或每组结果的概率分布。 1建立假设 统计检验是将抽样结果和抽样分布相对照而作出判断的工作。取得抽样结果,依据描述性统计的方法就足够了。抽样分布则不然,它无法从资料中得到,非利用概率论不可。而不对待概括的总体和使用的抽样程序做某种必要的假设,这项工作将无法进行。比如通过掷硬币的实验得到二项分布,必须假设:样本是随机的,各次抛掷相互独立;硬币是无偏的(或称是诚实的),即pq05。概括地说,必须首先就研究总体和抽样方案都做出假设,再加上概率论,我们就可以对各种可能结果做具体的概率陈述了。 2求抽样分布在做了必要的假设之后,我们就能用数学推理过程来求抽样分布了。比如在这一章开头,在硬币抛掷n次的理想实验中,我们计算了成功次数为x的宏观结果所具有的概率,得到二项分布。如果前提假设变动了,还可以求出其他形式的概率分布,如正态分布、泊松分布、卡方分布等等,它们都有特定的方程式。由于数学上已经取得的成果,实际上统计工作者要做的这项工作往往并不是真的去求抽样分布的数学形式,而是根据具体需要,确定特定问题的统计检验应该采用哪种分布的数学用表。 3选择显著性水平和否定域 有了与问题相关的抽样分布,我们便可以把所有可能的结果分成两类:一类是不大可能的结果,比如硬币被抛掷8次,结果8次都面朝上。另一类则相反,我们预料这些结果很可能发生。既然如此,如果我们在一次实际抽样中得到的结果恰好属于第一类,我们就有理由对概率分布的前提假设产生怀疑。在统计检验中,这些不大可能的结果称为否定域。如果这类结果真的发生了,我们将否定假设;反之就不否定假设。 概率分布的具体形式是由假设决定的,假设肯定不止一个。从统计检验的角度来看,所有假设在逻辑推理中都有相同的地位。如果作为检验用的样本结果真的落在否定域内,那么可以讲,至少假设中的一个(也可能是全部)是错的。就像在掷硬币的试验中,如果实际结果落在否定域中,那么我们可以说前提假设有问题。不过,究竟是硬币不诚实还是抽样在程序上违反了随机原则,我们却无从得知。所以要使检验具有意义,必须把怀疑集中在其中一个假设上。在统计检验中,通常把被检验的那个假设称为零假设(或称原假设,用符号H0表示),并用它和其他备择假设(用符号H1表示)相对比。至于我们究竟情愿认为假设中哪一个可能是错误的,因而应该作为被检验的对象,除了检验本身所提供的知识外,还必须从以往的经验或其他方面了解更多的东西。在掷硬币的试验中,如果可以确定抽样程序遵循了随机原则,那么我们就可以认为硬币有偏,并把硬币无偏定为零假设。一旦实际结果是落在否定域,我们就说p05的假设错了。反之,实际结果落在否定域之外,就不允许我们否定零假设。 值得注意的是,假设只能被检验,从来不能加以证明。统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。比如硬币抛掷试验的结果没有落在否定域中,我们不能据此就判定p05的假设是对的。因为假若硬币真正面朝上的概率是049而不是050,则正确的抽样分布和我们所计算的几乎完全相同。如果我们因为不能否定零假设就冒然地肯定它,就很可能因为用语太绝对而犯错误。所以在统计检验中,一个零假设如果我们不能否定它,也不能将它作为完全正确的假设而无保留地予以接受,而宁愿采用“不能否定它”的陈述。 为了使检验更严格、更科学,还需要更多的东西。首先,我们必须确定甘冒犯第一类和第二类错误的风险的程度;其次,要确定否定域是否要包含抽样分布的两端。 第一类错误是,零假设H0实际上是正确的,却被否定了。第二类错误则是,H0实际上是错的,却没有被否定。例如,若抛硬币试验的否定域由0次或8次面朝上两种情况组成,每当实际试验出现这两个结果之一时,假设就被否定了。与此同时,我们就有了犯第一类错误的危险。因为,既使p05的假设是正确的,正如表71表明的那样,这样的实验每做256次,毕竟还有出现全部面朝上和全部面朝下各一次的机会。假如抽样我们得到的偏巧就是这样一种极端结果,并据此否定了p05,那么我们就犯了第一类错误。相反,假如检验中我们得到的结果是3次面朝上5次面朝下,由于这个结果不在否定域内,我们不否定p05,则有了犯第二类错误的危险。因为如果p049,而不是05,我们也很可能得到相同的结果。换句话说,由于p05的假设实际上是错误的,却没有被否定,我们犯了第二类错误。 遗憾的是,不管我们如何选择否定域,都不可能完全避免第一类错误和第二类错误,也不可能同时把犯两类错误的危险压缩到最小。对任何一个给定的检验而言,第一类错误的危险越小,第二类错误的概率就越大;反之亦然。一般来讲,不可能具体估计出第二类错误的概率值。第一类错误则不然,犯第一类错误的概率是否定域内各种结果的概率之和。对上述掷硬币的试验,假如决定当得到试验结果是0次、1次、7次或8次面朝上就否定零假设(H0),那么犯第一类错误的概率将是(1+1+8+8)2567%。 由于犯第一类错误的危险和犯第二类错误的危险呈相背趋向,所以统计检验时,我们必须事先在甘冒多大第一类错误的风险和多大第二类错误的风险之间作出权衡。被我们事先选定的可以犯第一类错误的概率,叫做检验的显著性水平(用表示),它决定了否定域的大小。如果抽样分布是连续的,否定域可以建立在想要建立的任何水平上,否定域的大小可以和显著性水平的要求一致起来(后面的正态检验就如此)。如果抽样分布是非连续的,就要用累计概率的方法找出一组构成否定域的结果。即在已知概率分布表上,从两端可能性最小的概率开始向中心累计,直至概率之和略小于选定的显著性水平为止。例如对硬币重复抛掷8次的试验,我们选用020的显著性水平,从表71开列的概率分布,可以确定否定域由0,l,7或8次面朝上这四种结果组成。每当检验的结果出现这四种情况之一,我们就否定零假设。 在掷硬币的试验中,我们可能怀疑这枚硬币是不诚实的,但却不知道它究竟偏于面朝上还是面朝下。在这种情况下,为了稳妥起见,就要考虑抽样分布的两端。但在许多场合,我们能预测偏差的方向,或只对一个方向的偏差感兴趣。每当方向能被预测的时候,在同样显著性水平的条件下,单侧检验比双侧检验更合适。因为否定域被集中到抽样分布更合适的一侧,可以得到一个比较大的尾端。这样做,可以在犯第一类错误的危险不变的情况下,减少了犯第二类错误的危险。譬如,我们预测方向p05,即怀疑这枚硬币有面朝上的偏向,那么在同样020的显著性水平的情况下,单侧检验的否定域将变为由6,7,8次面朝上这三种结果组成。原来双侧检验,出现6次面朝上这种结果将不否定零假设。现在改用单侧检验,出现这种结果就得否定零假设了。这样,犯第一类错误的概率不变(因显著性水平仍是020),但犯第二类错误的概率则显然降低了不少。 4计算检验统计量 完成了上述工作之后,接下来就是做一次与理想试验尽量相同的实际抽样(比如实际做一次重复抛掷硬币的试验),并从获取的样本资料算出检验统计量。检验统计量是关于样本的一个综合指标,但与我们后面参数估计中将要讨论的统计量有所不同,它不用作估测,而只用作检验。在二项检验中,检验统计量就是n次抛掷后成功次数x。x如果是构成否定域的那些结果之一,我们就要否定零假设;反之,就不否定零假设。 计算检验统计量总是必要的。不过在二项检验中,得到x是如此简单,以至于谈不上要去计算,只要从样本资料中点算“成功”的次数就可以了。不过,在后面的正态检验中,通过计算Z分数,我们便会真正体会到计算检验统计量的必要性了。 5判定 假设检验系指拒绝或保留零假设的判断,又称显著性检定。在选择否定域并计算检验统计量之后,我们完成最后一道手续,即根据试验或样本结果决定假设的取与舍。如果结果落在否定域内,我们将在已知犯第一类错误概率的条件下,否定零假设。反之,如果结果落在否定域外,则不否定零假设,与此同时,我们就有了犯第二类错误的危险。 例721 若想通过抛掷10次硬币的实验来检验这个硬币无偏的零假设,选用双侧检验及010显著性水平,请指出否定域。如单侧检验(p05)又将如何? 解 P(0) + P(1) + P(9) + P(10) 2(+)0022010P(0) + P(1) + P(2) + P(8) + P(9) + P(10)2(+)0110010所以双侧检验时,否定域为0,1,9,10次面朝上。 P(0) + P(1) + P(2) +0055010P(0) + P(1) + P(2) + P(3) +0172010所以单侧检验时,否定域为0,1,2次面朝上。 例722 某选区有选民10000人,其中属于文教系统的有4000人,要产生代表6名。假定各系统选民都有同等机会当选代表,求:代表是文教系统人员的概率分布;在6名代表中最可能是文教系统人员占几名;如果6名代表中实际有4名是文教育系统的人员,可以否定随机性的零假设吗?(选用005显著性水平,单侧检验,预测方向p04)解 既然各系统选民都有相同的当选机会,那么p04。按(73)式求代表中有x名是文教系统人员的抽样分布,如表73所示。表73xP01234561729/15625= 0047 6486/15625=018715324/15625=031120216/15625=027615144/15625=0138 696/15625=0037 164/15625=0004合 计 1000 由表73可见,在满足随机性假设条件下,在6名代表中最可能有文教系统的人员2名。 由表73可见 P(5) + P(6)0041005 P (4) + P(5) + P(6)0179005所以,否定域由x等于5或6组成。而在6名代表中实际有文教系统人员4名,故不能否定随机性的零假设。 此例是成功的概率p已知的情况,这样在随机性的零假设下,就可以用二项分布做非随机性检验了。 例723 在一项研究中,研究人员试图证明如下假设:一个有犯罪倾向的少年如果能经常得到一个成人热忱友好的忠告,他就可能避免犯罪。为此,研究人员在孩子们中取14组,进行控制组和实验组的对照研究。试问,怎样用二项分布做“试验无效”的检验。 解 先将14个组两两匹配,得到七配对组(要使每个配对组在除实验变量之外的其他方面尽量相似)。然后在每个配对组中任取一组安排于实验组,另一组安排于控制组。接着,在48年的时间内,让分到实验组的七组孩子接受成人一对一的忠告,而控制组的七组孩子没有这样做。而后对每个配对组分别进行后侧度量,并用“+”号表示实验组比控制组好的那些配对组,用“”号表示实验组比控制组差的那些配对组。除非度量方法很粗糙,每配对组应该都能判断出差异。这样便可以用二项分布做“试验无效”的检验了(参见本章第一节)。 零假设H0:p05(即“试验无效”) 备择假设H1:p05 选用010的显著性水平,根据附表3中纵列n7和横行p05所对应的x值,可查得 P(6) + P(7)00625010 P(5) + P(6) + P (7)02266010所以否定域由6个“+”和7个“+”组成。即对每配对组进行后测度量,如出现6个“+”或7个“+”时,在010的显著性水平上,我们将否定零假设,说明试验有效。否则就不能否定零假设,也就是说关于成年人忠告有助于减少少年犯罪的观点不能得到实验结果的支持。第三节 正态分布 如果说二项分布是离散型随机变量最具典型意义的概率分布,那么连续型随机变量最具典型意义的概率分布就是正态分布了。实践中常见的一类连续型随机变量,多数服从或近似服从正态分布。例如测量误差、智商以及人体的身高体重、运动员的成绩等等,都可以用正态分布进行描述。一般地讲,若影响某一变量的随机因素很多,而每个因素所起的作用不太大且相互独立,则这个变量服从正态分布。更为重要的是,正态分布还是抽样理论和统计推断的基础。例如,不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于正态分布。 正态分布的研究始于18世纪,是最重要的概率分布,这是因为:许多自然现象与社会现象,都可用正态分布加以叙述;不少离散型随机变量与连续型随机变量的概率分布都以正态分布为其极限(即当样本相当大时,可用正态近似法解决这些概率分布的问题);许多统计量的抽样分布呈正态分布,故在参数估计与假设检验上经常以正态分布为理论基础。 1正态分布的数学形式 自本书第三章引出变量数列,我们便可以列举出不少总体的分布很接近于正态分布,例如男性的身高。如果我们拥有的数据非常多,在编制变量数列时我们就可以把组分得很细,并得到组距很小的直方图。现在想象,如果组越分越细,并且纵轴采用频率密度(),直方图最终就转化为的概率密度曲线(Xx) (参见图72)。很显然,从图72可以看出,这样的平滑曲线如“钟型”,它具有单峰、对称这两个特点,并且曲线向左、向右延伸,以横轴为渐近线。上述实例,对于我们领会正态分布是很有启发性的。根据经验总结和理论分析可知,正态分布的概率密度表达为如下形式 (Xx) (75) 式中和e都是常数,分别近似等于314和272。 从正态分布的数学表达式可以看出,当总体均值和方差2确定后,正态分布曲线的精确形式也就确定了。换句话说,有许多不同的正态曲线,每一个对应于和的一个组合。 分析正态分布的概率密度(Xx),很容易理解正态曲线具有下列性质: (1)正态曲线以X呈钟形对称,其均值、中位数和众数三者必定相等。 (2) (Xx)在X处取极大值。X离越远,(Xx)值越小。这表明对于同样长度的区间,当区间离越远,X落在这个区间的概率越小。正态曲线以X铀为渐近线,即(Xx)在| X |无限增大时趋于零,即(x)0或( x)0。 (3)对于固定的值,不同均值的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整体平移了一个位置(参见图73)。 (4)对于固定的值,改变值,值越小,正态曲线越陡峭;值越大,正态曲线越低平(参见图74)。 (5)正态分布的数学期望E(X),变异数D(X)2,因为 E(X)D(X)2 正态曲线的性质可供阐明标准差。由于曲线的形状完全取决于标准差,所以可供作为衡量总体分布状况的一个统一的尺度,称为标准差。从直观上去理解,实际上是一个很好的离势的量度: 值越小,离中趋势越小,总体中各变量值也就越接近;;值越大,离中趋势越大,总体中各变量值也就越分散。 2标准正态分布 我们在统计分析时,经常性的重要工作是要确定给定区间所含总体单位数的比重,也就是变量X的取值在这个给定区间内出现的频率。因此在对有限总体的数据进行分组时,得到相对频数分布是很重要的。对于连续变量,过去由于分组有限,只能加以近似地讨论。现在,由于正态曲线的一些异乎寻常的数学性质,使得这项工作非但不困难,反而变得简单易行。一般作法是引入新的随机变量Z参见(512)式 Z (76)上式表明,Z代表以标准差为单位表示的变量值离开均值的偏差,即代表经标准化之后的X对的离差。故Z经常被称为变量X的标准分,或称Z分数;Z亦被称为标准正态变量。 如果把Z代入(75)式,我们便得到了用Z分数表达的标准正态分布,其概率密度为(Z) (77) 比较(75)和(77)式,很容易得知标准正态变量的数学期望E(Z)0,变异数(即方差)D(Z)1。实际上,标准正态分布(Z)只是正态分布的一个特例,即0,21的正态分布,简记作N(0,1)。对于一般正态分布则简记为N(,2)。 3正态曲线下的面积 我们在第三章学习过频数(或频率)分布图,从中我们体会到,用几何图形表示统计资料的好处在于,直观地从图形的升降起伏就可以看出总体的分布特征和规律性。具体来说,矩形的高度(更确切地说是矩形的面积)是和相应区间里所含的总体单位数成正比的。如果取各矩形的总面积为1,一定区间图形所含的面积就等于变量的取值在该区间出现的频率。现在组距不断变小,直方图过渡到了平滑曲线,但基本原理并没有变。和频率分布的直方图一样,正态曲线下的总面积也为1。从直方图中选取任一个矩形,如图75所示,平滑曲线多包含的那一部分面积等于被曲线切去一角的那一部分矩形的面积,增减相当。而作为频率分布的极限,正态曲线下的面积可设想是组距趋于0而矩形无限增多时所有矩形面积的总和。在频数分布直方图中,所有矩形的总面积为1,所以正态曲线下的面积当然也是l。正态分布是最具典型意义的连续型随机变量的概率分布。上一章已经说明,对于连续型随机变量,由于Xx的取值充满一个区间,不能一一列出,因此只能关心X的取值落在一个区间的概率。现在既然有了正态分布的概率密度(75)式,随机变量X的取值在某区间x1Xx2上的概率便可用下式求得 P(x1Xx2 ) 但积分毕竟太麻烦了,更何况许多人对积分运算不熟悉,为此须计算出现成的数值表供使用者查找。由于正态曲线的优良性质,这项工作可以卓有成效地完成:经过X的标准分Z,可以将任何正态分布N(,2)转换成标准正态分布N(0,1);运用分布函数的定义,并利用正态曲线的对称性,通过下式(分布函数)可以计算编制出正态分布表(见附表4)。 F(Z)P(0ZZ) (78) 采用标准正态变量表达正态分布,使标准差得到了进一步阐明。我们看到,标准差是计算总体单位分布及其标志值变异范围的主要依据,图76说明了这一点。 如果从总体均值向右一个标准差定出一区间,则在这个区间正态曲线下方所包含的面积为03413。因此这个面积的两倍,X的取值有6826包含在均值两侧各一个标准差的范围之内。换言之,略多于23的总体单位出现在总体均值两边的一个标准差的范围之内。同样,在均值与距它两个标准差的区间内,正态曲线下方所含面积是04773。因此略多于95的总体单位包含在均值两边的两个标准差的范围之内。虽然理论上正态曲线向两边可扩展至无限远,但几乎所有总体单位(9973)都位于均值两边的三个标准差的范围之内。 总之,决定任意两点间的面积都完全是可能的。比如向均值两侧移196个标准差,曲线下方便包含了大约95的面积,如移动258个标准差,则面积几乎是99。附录4已编制了关于Z和标准正态曲线所含面积之间关系的精确数值表,即Z从0到+变化,相应区间所含的面积从0变至05。这种处理具有重要的实用价值,以后只要知道分布是正态的,有关计算只要查表就成了。 例731 设随机变量X服从正态分布N(50102),试求P(50 X65)。解 已知50,10,Z10 Z215查表得正态曲线在此区间的面积是04332(参见图7,7)。所以,P(50 X65)4332%。 例732 设随机变量X服从正态分布N(168,122),试求P(X143)。解 已知168,12, Z208Z是负值,表示X的取值处于均值左边。由于曲线完全对称,所以使用正态分布表时可以忽略Z的正负号。查表可知,正态曲线在均值与Z208之间所含的面积是04812。由于总面积的一半是05,因此P(X143)可以由下面计算求得 P(X143)05P(0Z208) 0504812 188这说明,X的取值小于或等于143的概率大约是2。由于即将讨论的正态检验几乎都要涉及概率分布的尾端,所以此例说明的是一个非常普遍的问题(参见图78)。 例733 设随机变量X服从正态分布N(60,82),试求:第一四分位数的标志值;第一四分位数和标志值为50的取值之间正态曲线所含的面积(参见图79)。 解 先根据四分位数的定义,通过正态曲线左边尾端面积为025,查表求出四分位数Q1对应的Z分数 Z067Q1Z6006785464由此可见,第一四分位数的标志值是5464。 再求标志值为50的Z分数 Z125查表得Z125和均值之间正态曲线所含的面积是03944。所以 P(50 XQ1)0394402501444这说明,X的取值在第一四分位数Q1和50之间的概率是1444。 4二项分布的正态近似法 二项分布是在所谓的重复独立试验之中产生的。通过本章第一节的讨论,我们已经知道二项分布受成功事件概率p和试验次数n两个参数的影响,只要确定了p和n,二项分布也随之确定了。 但是,二项分布的应用价值实际上受到了n的很大限制。也就是说,只有当n较小时,我们才能比较方便地利用(73)式计算二项分布。所幸的是,二项分布是以正态分布为极限的。所以当n很大时,只要p或q不近于零,我们就可以用正态近似来解决二项分布的计算问题,即 P(Z1ZZ2)d z (79) 又 Z (710)式中:Z为标准正态随机变量,n为重复试验的次数,p为成功的概率,q1p为失败的概率,x为二项随机变量。 例734 在抛掷一枚硬币10次的二项试验中,试以二项分布与二项分布的正态近似法,求成功3到6次的概率。解1 已知p05,n10,查附表3得 P(3x6)(x;10,0.5)094530171907734 解2 用二项分布的正态近似法 np10055158 Z2- 158 Z2095 查表得 P(Z1ZZ2)P(158Z095) 04430十03289 077l 9由正态近似法求得的概率为07719,这一数值十分接近由二项分布算得的07734。 简言之,二项分布的正态近似法,即以n p、n p q2,将B(x;n,p)视为N(n p,n p q)进行计算。在社会统计中,当样本量n 30,n p、n q均不小于5时,对二项分布作正态近似是可靠的。 例1135 铁路部门预计对号车票的旅客中有5赶不上该列车,该列车有座位600个,但却售出了620张票,试求每位旅客都有座位之概率。 解 设“赶不上火车”为成功事件,则随机变量“赶不上火车的人数”可看成服从二项分布。因n620大于30,n p62000531,n q620095589,所以可对二项分布作正态近似。现n p31,2n p q6200050952945。列车有600座位却售出了620张车票,故每位旅客都有座位的概率是P(x20),于是有Z203 查表得 P(x20)P(Z203) 04788十05 9788 所以,每位旅客都有座位的概率为9788%。 例1136 共有5000个同龄人参加人寿保险,设年死亡率为01。参加保险的人在年初应交纳保险费10元,死亡时家属可领xx元。求保险公司一年从这些保险的人中,获利不少于30000元的概率。 解 据题意,保险公司一年内若获利不少于30000元,最多理赔人数为 x10(人)现因n5000大于30,n p500000015,所以二项分布可用正态分布近似法处理。于是有 Z2237 查表得 P(x10)P(Z2237) 04875十05 9875所以保险公司一年内从这些保险的人中获利不少于30000元的概率为9875。第四节 中心极限定理 在各种分布中,正态分布居于首要地位。这不仅因为许多总体分布具有正态分布的特征,更为重要的是,无论总体服从什么分布,其样本均值的概率分布都随着样本量的增加而呈正态分布。这一节我们将着重讨论抽样分布与中心极限定理,后者是全部统计推断理论中最重要的定理。在推论统计中,作为研究对象的总体,其分布总是未知的。中心极限定理对大样本均值正态分布性质的揭示,为未知总体的研究奠定了理论基础。 1抽样分布在本章第二节,我们已经引入了抽样分布的概念。为什么要讨论抽样分布?这是因为一旦统计的学习进入到推论统计,我们就必须同时与三种不同的分布概念打交道,即总体分布、样本分布、抽样分布。为了不产生混淆,视分布不同,将统计指标的符号加以区别是完全必要的。对那些反映标志值集中趋势和离中趋势的综合指标,尤其对均值和标准差(或方差),现在我们应该注意鉴别它们在具体场合哪些是概括总体特征的,哪些是概括样本特征的,哪些是概括抽样分布特征的。为此列表如下:表74均值标准差总体分布样本分布抽样分布S已知一总体分布,可求得它的特征值。根据总体分布计算的特征值,即根据总体各个单位标志值计算的统计指标,在推论统计中称为总体参数。总体均值和总体标准差(或方差)是反映总体分布特征最重要的两个总体参数,习惯上分别记作和(或2)。 同理,已知一样本分布可求得它的特征值。根据样本分布计算特征值,即根据样本各个单位标志值计算的统计指标,在推论统计中称为统计量。样本均值和样本标准差(或方差)是反映样本分布特征最重要的两个统计量,习惯上分别记作和S(或S 2)。 将总体均值、总体标准差与样本均值、样本标准差加以区别是很必要的。因为总体参数和统计量之间存在着重要差别。参数是有关总体的固定值,一般都是未知的。例如,在任何给定的时间,某学校学生平均年龄这样的参数一般是未知的,因为如果参数已知就用不着抽取样本了。但参数如果能得知,那么对所有观察者来讲都必定相同。因此和都应该是唯一确定的值。而统计量则不然。任何统计总体,由于样本容量n小于总体容量N,可能被重复抽取的样本就不止一个(也可以说可以抽取许许多多乃至无数个样本)。在一总体中,当从一个样本换为另一个样本,统计量很可能不同。例如从学生总体中随机地抽取10个学生组成样本,我们就不能期望样本不同也可以得到精确相同的年龄均值。所以,统计量必定是随机变量。另一方面,与参数不同,对于一个特定的样本而言,统计量是可以计算出来的,这便是抽样调查的价值所在。不过,一个特定的样本对总体的实际代表程度如何,则是另一回事。 由于统计量是随机变量,并且在一个统计总体中可以重复抽取的样本在理论上是无数的,所以可以用概率分布来进行描述。 在推论统计中,理论和实际的一个重要结合就是通过抽样分布和抽样调查这两者的联系来实现的。首先,抽样调查是从总体中随机地抽取样本,然后借助样本指标数值来推算总体指标数值。只有遵从随机原则,样本分布才接近于总体分布,进而表现样本分布的特征值才对反映总体分布的特征有较大的代表性。与此同时,只有遵从随机原则,尽可能减少非抽样误差,样本调查的结果才能在假设检验中作为有效的检验统计量。 其次,抽样调查只涉及总体的部分单位,因此哪怕随机样本是有保障的,样本的统计量与总体参数之间也存在一定的差别。对于用样本指标代表总体指标而不可避免存在着的误差,除了运用数理统计的方法得到抽样分布,样本本身不能告诉些什么。这样,本书在引出总体分布、样本分布的概念之后,又引出了抽样分布的概念。需要再次提醒大家,抽样分布是运用数理统计的方法,把具体概率赋予样本的所有可能结果的一种理论分布。但有了抽样分布对概率分布的具体化,研究者便找到了一种理论与实际相联系的有效途径。2中心极限定理 我们知道,概率论中用来阐明大量随机现象平均结果的稳定性的定理,是著名的大数定理。其具体内容是:频率稳定于概率,平均值稳定于期望值。但是,大量随机现象的稳定性不仅表现在平均结果上,同时也表现在分布上,这就是中心极限定理所要阐明的内容。仔细考虑统计量和与之相对应的未知参数的接近程度,引出了研究和应用抽样分布的课题。显然,推论统计需要有一座能够架通抽样调查和抽样分布的桥梁。中心极限定理告诉我们:如果从任何一个具有均值和方差2的总体(可以具有任何形式)中重复抽取容量为n的随机样本,那么当n变得很大时,样本均值的抽样分布接近正态,并具有均值和方差。通过上一节,我们已对正态分布留下了深刻印象。不过,在现实世界里,像身高、体重、婚龄、智商等等近似服从于正态分布的总体其实是相当有限的。幸运的是,中心极限定理大大放宽了对正态总体的前提要求。它指出,无论总体的分布多么异常,只要n足够大,我们可以相信得到的样本均值的抽样分布近似于正态分布。正如二项检验那样,因为在显著性检验中使用的是抽样分布,而不是总体分布。这就意味着,只要n足够大,我们就完全不必顾忌总体是不是正态,尽可以在检验中使用正态曲线。而正态曲线具有特别的数学性质,使用它是很方便的。无疑,中心极限定理大大拓展了正态分布的适用面,同时我们得到了以下重要信息: (1)虽然样本的均值可能和总体均值有差别,但我们可期望这些将聚集在的周围。因此均值抽样分布的算术平均数能和总体的均值很好地重合,这就是为什么在表74中总体均值和抽样分布的均值用同一个表示的缘故。(2) 由于抽样分布的标准差要比总体标准差小,并且,所以如图710所示,样本容量越大,抽样分布的峰态愈陡峭,由样本结果来推断总体参数的可靠性也随之提高。 这是与我们的常识相一致的。在无偏的前提下,在估计总体均值时,较之用小样本,我们更相信大样本。而定理比常识高明之处在于,它指出,如果n增加了一定的数量,那么可靠性将随之提高到什么程度。例如,为了把抽样分布的标准差缩小一半,就要把n扩大4倍。在后面学习的统计推论中,我们一般是用样本均值作为总体均值的估计量的。早在本书第二章我们就已经知道,在遵守随机原则的条件下,用样本指标值代表总体指标值不可避免地存在着抽样误差。统计推论不能从样本资料算出统计量就完事了,还必须进行误差分析。从直观的意义上去理解,抽样误差应该是指某一次抽样结果所得的样本统计量与总体参数之间的差别。但事实上,这一差别无从得知。因为,如果知道了总体参数,也就不需要抽样了。具体某一次抽样结果的误差,仅仅是反复抽样下一系列抽样结果可能出现的误差中的一个,它亦是随机变量,显然不能用来概括一系列抽样可能产生的抽样误差。而抽样分布的标准差可以综合地反映了样本均值在总体均值附近的变异程度,因此我们用它来概括一系列抽样可能产生的误差,并把它称为抽样平均误差。后面我们将看到,利用抽样分布计算,在统计推断与估计的误差分析中也具有重要意义(抽样平均误差将在第九章较系统地加以讨论)。 为了理解中心极限定理的正确性,最好的方法是从一个已知均值和标准差的总体中抽取一些样本,计算样本均值,并把这些均值一一在图上标出,看抽样分布是不是正态,同时找出这些均值的标准差,再把它与做比较。但是,为什么在总体分布不是正态的时候,其抽样分布却很可能会是正态呢?下面我们来看在一个男女人数相等的性别总体中,当抽取的样本越来越大时将会发生些什么? 描述这个该总体只要分两组、用两个标志值就可以了,因此其分布显然不可能是正态的。为了简单起见,用X1表示男性,X0表示女性。并且,因为男女人数相等,所以相对频数都是1/2,计算后知总体均值也等于1/2,图711表示了这种十分简单的分布。当然,严格来讲分布是离散的,而不是图中画的那样是连续的。现在我们从这个总体抽取随机样本,看样本均值的分布怎样随其容量n起变化。先抽2人,井计算样本均值的抽样分布。很显然,如果对抽到的人加以区分,能得到四种结果:两人都是男性,标志值和最大(为2);两人都是女性,标志值和最小(为0);男性女性各一人则会有两种情况。四种结果的标志值可分别显示为(1,1),(0,0),(1,0),(0,1)。求样本均值的方法很简单,只要按(41)式把标志值加起来除以2。样本均值的抽样分布可按古典法直接算出,也可以由(73)式算出。样本均值的概率分布分别见表75和图712。表75(均值)P(概率)01201/211/41/21/4然后抽取容量为4人的随机样本,样本均值的分布如表76所示。除均值和其概率的计算稍许复杂一点外,计算方法和n2的样本完全一样,绘成图713。表76(均值)P(概率)0123401/41/23/411/164/166/164/161/16再取样本容量为8人,样本均值抽样分布如表77所示,绘成图便是图714。表77(均值)P(概率)01234567801/82/83/81/25/86/87/811/2568/25628/25656/25670/25656/25628/2568/2561/256 至图714,样本均值的抽样分布已经开始接近正态曲线了,尽管这时样本容量还不过是8。这就从直观上说明了为什么当容量n越来越大时,样本均值的抽样分布会逼近正态曲线,而总体分布怎样是无关紧要的。 那么究竟n多大时,才可以放宽总体是正态的限制而放心使用中心极限定理呢?这个问题尚无简单的答案,因为它还与下列问题有关: 估计第一类错误所要求的精度;总体接近正态的程度(虽然总体分布是与抽样分布含义不同的分布,但正态总体的抽样分布要比非正态总体的抽样分布更容易接近正态)。一般我们采用经验定则:如果n100,正态总体的限制总是可以放宽;如果n50,同时经验表明总体分布与正态分布的差异不大时,可以放心使用中心极限定理;如果n30,就应该避免使用该定理。统计检验应用正态分布和二项分布有两点区别:抽样分布在这里是连续的而非离散的,否定域的大小可以和显著性水平的要求精确地一致起来。计算检验统计量不再像在应用二项分布时那样,可以不劳而获了。很显然,为了能使用现成的正态分布表,关键是要从样本资料中计算出在N(0,1)形式下的统计量Z,再根据Z是否落在否定城内而对被检验假设的取舍作出决定。在上一节(7.6)式,我们曾引出Z。Z的这种形式适用于N(,2)的总体,但并不适用于取正态的抽样分布。正如我们反复强调的那样,统计检验单纯依靠样本自身是得不出结果的,必须首先在一系列假设的基础上求出抽样分布。如果这些假设实际上正确,那么抽样分布将告诉我们得到一个给定的的可能性是多少。在抽样分布中,随机变量的取值是每个,均值是,标准差是。因此Z如果作为检验统计量,应该用替换X,用替换,不动,因而有 Z (711)第五节 总体均值和成数的单样本检验 现在我们来看中心极限定理在统计检验中的应用。虽然不必每一次都明写出来,但本章第二节论述的检验程序的每一步都不能缺少。把从样本调查中得到的检验统计量与假设的总体均值作比较,我们很快发现了正态分布的重要的实用价值。 1已知,对总体均值的检验例如,一位研究者试图检验某一社会调查(如家庭收入调查)所运用的抽样程序,该项调查是由一些缺乏经验的采访员进行的,研究者怀疑属于干部和知识分子的家庭抽得过多。过去的统计资料表明,这一街区的家庭的平均年收入是24500元,标准差是3000元。这次调查共随机抽选了l00个家庭,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 高中资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!