资源描述
2019-2020年高中数学第2章统计2.1抽样方法名师导航学案苏教版必修三点剖析 一、总体与样本 总体是指考察对象的全体;其中每一个考察对象是个体;从总体中所抽取的一部分个体叫做总体的一个样本;样本中个体的数目叫做样本容量.样本的抽取要具有随机性. 例如:某学校高一年级为了了解全年级1 200名学生的体重,从中抽取100名学生进行测量分析.在这个问题中总体是指“某学校高一年级全年级1 200名学生的体重”,而样本则是指“从中抽取的100名学生的体重”,样本容量则是100. 统计的基本思想方法就是用样本估计总体,即当总体容量很大或检测过程具有一定的破坏性时,不去直接研究总体,而是从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.如为了检测一批小麦良种的发芽率,我们可以从中随机地选出100粒进行试验.通过这100粒小麦的发芽率来估计这批小麦的发芽率. 二、简单随机抽样 1定义 一般地,从个体数为N的总体中不重复地取出n(n39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34至此,10个样本已经取满,于是,所要抽取的样本号码是:16,19,10,12,07,39,38,33,21,34 (6)使用随机数表法的注意事项: 利用随机数表抽取样本时,数表中的数字可以两两连在一起,也可以三三连在一起,这就要视总体中个体的个数而言.如果总体中个体的个数不多于100个,我们一般用两位数表,即将数表中的数码两两连在一起,如01,23,99,;如果总体中个体的个数多于100个而不多于1 000个,我们一般用三位数,就是将数码三三连在一起,如012,567,999,;.除此之外,当选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等.如在上一个实例中,当选定数码5后,我们也可以向左读取数码,这样得到样本号码分别是:01,06,12,25,33,21,04,24,31,17 (7)随机数表法的适用范围:适用于总体中个体个数较少时抽取样本的抽样方法.当总体中个体数较多时,利用随机数表选数将变得比较麻烦. 三、系统抽样 1定义 当总体中个体的个数较多时,采用简单随机抽样显得较为费事.这时,可将总体平均分成几部分,然后按照预先定出的规则,从每个部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样. 例如,为了了解参加某种知识竞赛的1 000名学生的成绩,打算从中抽取一个容量为50的样本.假定这1 000名学生的编号是1,2,1 000,由于501 000=120,我们将总体分成50部分,其中每一部分包括20个个体,例如第1部分的编号是1,2,20.然后在第1部分利用简单随机抽样的方法随机抽取一个号码,比如它是18,那么可以从第18号起,按事先确定的规则,如每隔20个抽取一个号码,这样得到一个容量为50的样本: 18,38,58,978,998 上例中,由于总体中的个体数1 000恰好是50的倍数,可以被样本容量50整除,可以用它们的比值作为进行系统抽样的间隔.如果不能整除,比如总体中的个体为1 003,样本容量仍为50,这时可用简单随机抽样先从总体中剔除3个个体(抽签法和随机数表法均可),使剩下的个体数1 000能被样本容量50整除,然后再按系统抽样方法往下进行. 2系统抽样的步骤 (1)采用随机的方式将总体中的个体编号. (2)将整个的编号按一定的间隔分段(样本容量是几,就分成几部分),要确定分段的间隔.当(N为总体中的个体数,n为样本容量)是整数时,k= ;当不是整数时,通过从总体中剔除一些个体使剩下的总体中个体个数N能被n整除,这时k= . (3)在第1段中用简单随机抽样的方法确定起始号m. (4)将编号为m,m+k,m+2k,m+(n-1)k的个体抽出. 3系统抽样与简单随机抽样的联系 系统抽样与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样. 4系统抽样的优点和缺点 系统抽样的优点是简便易行;当对总体结构有一定了解时,充分利用已有信息对总体中的个体进行排队再抽样,可提高抽样的效率;当总体中的个体存在一种自然编号时,便于施行系统抽样法.系统抽样的缺点是在不了解样本总体的情况下,所抽出的样本可能有一定的偏差. 四、分层抽样 1定义 一般地,当已知总体由差异明显的几部分组成时,为了使样本更客观地反映总体的情况,通常将总体中的个体按不同的特点分层次比较分明的几部分,然后按照各部分在总体中所占的比实施抽样,这样的抽样方法就叫分层抽样.其中所分成的各部分称为层. 例如,一个单位的职工有500人,其中不到35岁的有125人,35岁到49岁之间的有280人,50岁以上的有95人.为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本.总体是由差异明显的几部分组成的.不同年龄的职工的身体状况差异比较大,不能在这500人中随机地抽取100人,也不宜在这三个年龄段的职工中平均抽取样本.这时,前面所学的两种抽样方法都不适用,因为这两种抽样方法都不能准确地反映客观实际,这就需要一个更有效的抽样方法分层抽样. 具体的操作过程是:(1)确定各年龄段被抽的人数.由于样本容量与总体中的个体数的比为100500=15,所以在各年龄段抽取的个体数依次为,即25,56,19 (2)用简单随机抽样或系统抽样的方法抽出各年龄段作为样本的职工. 分层抽样的特点是:分层抽样时,每个个体被抽到的可能性是相等的.由于分层抽样充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用. 2分层抽样的步骤 (1)将总体按一定的标准(分层的标准由题意来确定)分层; (2)计算各层的个体数与总体的个体的比; (3)按各层中个体数占总体的比确定各层应抽取的样本容量; (4)在每一层进行抽样,抽样时根据各层中个体的个数选择适当的抽样方法:个体数较少时用简单随机抽样,当个体数较多时可采用系统抽样. 3三种抽样方法的特点与适用范围 分层抽样和简单随机抽样、系统抽样的联系:将总体分成几层,分层抽取样本时采用简单随机抽样或系统抽样.简单随机抽样、系统抽样和分层抽样关系密切,对抽取样本来说,可谓异曲同工.无论采取哪一种抽样方法,必须保证在整个抽样过程中每个个体被抽到的可能性相等.为了对三种抽样方法进行比较,加深对三者的理解,以达到在抽样实践中正确地对它们进行选择的功效,教材又将三种抽样方法的特点和适用范围进行了归纳,现列表如下:类别特点相互联系适用范围共同点简单随机抽样从总体中逐个抽取总体中个体个数较少抽样过程中每个个体被抽到的可能性相等系统抽样将总体均分为几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中个体个数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成 抓住三种抽样方法的本质特征是正确应用这三种抽样方法的前提.问题探究 问题1:吸烟有害健康.你知道吗?被动吸烟(在吸烟的环境中被动地吸入烟气)也大大危害着人类的健康.为此,联合国规定每年的5月31日为世界无烟日.让我们行动起来,在无烟的环境中健康地成长和生活. 请你想一想,如果让你统计你们地区居民的吸烟状况,你会采用什么方法,注意什么问题? 探究:由于不论是哪一个地区,人口都很多,我们不可能对每个对象都进行调查,只能从其中抽取一部分来进行调查.这就涉及到了抽样方法的选取.我们学的抽样方法有三种:简单随机抽样、系统抽样和分层抽样.这三种抽样方法有着各自的特点和适用范围.简单随机抽样简便易行,但它只适用于个体数较少的总体,当总体中个体个数较多时我们常采用系统抽样的方法抽取样本.当总体由差异明显的几部分组成时我们宜采用分层抽样的方法.由于不论是哪个地区吸烟的人群中年龄、性别、经济基础和工作性质都有着很大的区别,所以在抽取样本时宜采用分层抽样的方法(如可按年龄分层,也可以按性别分层).而在每层抽取样本时,再根据实际情况来选取是用简单随机抽样还是采用系统抽样. 问题2:抽样方法在实际生活中有着广泛的应用.你能说说都有哪些吗? 探究:我们生活在一个数字化的时代,时时刻刻都在与数据打交道,如产品的合格率、农作物的产量、商品销售量、当地的气温、就业状况、电视台的收视率等.这些数据都是通过抽样的方法得到的.常用的抽样方法有三种:简单随机抽样、系统抽样和分层抽样,这三种抽样方法关系密切,对抽取样本来说,可谓异曲同工.无论采取哪一种抽样方法,必须保证在整个抽样过程中每个个体被抽到的可能性是相等的.而在实际操作时,应根据总体中的个体数和个体的特点来选择适当的抽样方法. 例如:要从高一(1)班40名学生中随机抽选8人去参加一项活动,我们应采用简单随机抽样的方法. 但应注意:由于总体的复杂性,在实际抽样中,为了使样本具有代表性,通常要同时使用几种抽样方法. 问题3:1936年,美国文学文摘杂志根据1 000万户电话用户和从该杂志订户所收回的意见,断言兰登将以370161的优势在总统选举中击败罗斯福.但结果是,罗斯福当选了,文学文摘大丢面子.你知道原因何在吗? 探究:在实际抽样中,应使样本具有代表性,对于美国选民来说他们在年龄、性别、经济基础和工作性质等方面都有着很大的区别.因此在抽样调查时,应采用分层抽样的方法进行抽样,这样才能使样本具有一定代表性.在1936年使用电话或订阅文学文摘杂志的人,在经济上都相对富裕,而收入不高的是大多数的选民,他们选择了罗斯福.文学文摘的教训表明,抽样抽查时,既要关注样本的大小,又要关注样本的代表性.精题精讲例1某工厂有工人1 200人,为了调查某种情况打算抽取一个样本容量为50的样本,问此样本若采用简单随机抽样将如何获得?思路解析简单随机抽样分两种:抽签法和随机数表法.尽管此题的总体中的个数不算少,但依题意其操作过程能保障每一个个体被抽到的机会等可能.所以,可将这1 200个工人进行编号,利用抽签法或随机数表法来进行抽样. 解法一:首先,把该工厂的工人都编上号码:0 001,0 002,0 003,1 200.如用抽签法,则作1 200个形状、大小相同的号签(号签可以用小球、卡片、纸条等制作),然后将这些号混合放在同一个箱子里,进行均匀搅拌.抽签时,每次从中抽一个号签,连续抽50次,就得到一个容量为50的样本. 解法二:首先,把该工厂的工人都编上号码:0 001,0 002,0 003,1 200.如用随机数表法,则可在数表上随机选定一个起始位置.假如起始位置是表中第5行第9列的数字从6开始向右连续取数字,以4个数为一组,碰到右边线时向下错一行向左继续取,所得数字如下: 6 438,5 482,4 622,3 162,4 309,9 006,1 844,3 253,2 383,0 130,3 046,1 943,6 248,3 469,0 253,7 887,3 239,7 371,2 845,3 445,9 493,4 977,2 261,8 442,. 所录取的4位数字如果小于或等于1 200,则对应此号的工人就是被抽取的个体;如果所取的4位数大于1 200而小于2 400,则减去1 200剩余数即是被抽取的号码;如果所取的4位数大于2 400而小于3 600,则减去2 400剩余数即是被抽取的号码(出现重复数则去掉)可得下列数字: 0 438,0 682,1 022,0 762,0 709,0 606,0 644,0 853,1 183,0 130,0 646,0 743,0 248,1 069,0 253,0 687,0 839,0 171,0 445,1 045,1 093,0 177,1 061,0 042,,一直取够50人为止.绿色通道 本题的解法体现了简单随机抽样的适用范围和步骤.规范的、不带主观意向的随机抽样,才能保证公平性、客观性、准确性和可信性.而利用随机数表法进行抽样时,数表中数字的位数要与编号的位数一致.例2某单位有在岗职工1 244人,为了调查工人上班时,从离开家到来到单位的路上平均所用时间,决定从中抽取10%的工人调查这一情况.如何采用系统抽样方法完成这一抽样?思路解析由于总体中个体数比较多,且抽取的样本中个体的个数也比较多,如果此时再用简单随机抽样,则操作过程将比较麻烦.所以此时可以考虑系统抽样.抽样时总体中的每个个体,都必须等可能地入样.本题中总体中个体数为1 244,而为了抽取一个容量为120的样本,只有先剔除总体中的一部分个体才能实现“等距”入样,且又具有等可能性.因此,解此题时,应选用系统抽样法,且应先剔除,再“分段”,后定起始位置. 解:首先,将在岗的工人1 244人,用随机方式编号(如按出生年月顺序),0 000,0 001,0 002,0 003,1 243第二步,由题意知,应取124人的样本.因为不是整数,所以应从总体中剔除4个人,(剔除方法用随机数表法或抽签法)将余下的1 200人,按编号顺序补齐0 000,0 001,0 002,0 003,1 239分成120段,每段10人,在第一段0 000,0 001,0 002,,0 009这十个编号中随机定一起始号为m,则编号m,m+10,m+20,,m+11910为所取的样本.绿色通道 采用系统抽样可以减少工作量,提高可操作性,减少人为的导向和误差.当总体中个体数不能被所抽样本中个体数整除时,必须先用简单随机抽样的方法从中抽取几个样本,以使余下的总体中的个体数被样本中的个体数整除. 利用随机抽样的方法抽取样本时,总体中的个体数必须是样本中个体的倍数,否则必须先用简单随机抽样的方法从中抽取几个样本,使余下的总体中的个体数被样本中的个体数整除.例3要从高一(1)班40名学生中随机抽选8人去参加一项活动,分别用抽签法和随机数表法进行抽签,并写出过程.思路解析本题考查抽签法和随机数表法的步骤应用.先将40名学生编号,然后按抽签法和随机数表法的步骤进行抽样即可. 解:抽签法: 将全班40名学生编号,可编号为00,01,02,39,并把号码写在形状、大小相同的小球上,然后将这些号签放在同一个箱子中,搅拌均匀.每次从中抽出一个号签,连续抽取8次,便可得到一个容量为8的样本,参加比赛的8人便产生了.当然,也可以一次从中取出8个号签. 随机数表法: 第一步,先将这40名学生编号,可以编为00,01,02,39 第二步,在附录1随机数表中任选出一个数作为开始.例如从第8行第9列的数5开始. 第三步,从选定的数字5开始,向右读下去,得到第一个两位数字号码59,由于5939,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33至此,8个样本已经取满,于是,所要抽取的样本号码是:16,19,10,12,07,39,38,33参加比赛的8人便产生了.绿色通道 简单随机抽样的方法适用于总体中个体数较少时.在用抽签法抽取样本时,为了体现抽签的客观性和公平性,在制作号签时,一定要注意使号签的大小、形状都相同. 利用随机数表法抽样本时,起始数字可以随便选择,在读数时,读数的方向可以向右,也可以向左、向上、向下等等,只要具有一定的规律就可以.如果总体中个体的个数不多于100个,我们一般用两位数表,即将数表中的数码两两连在一起,如01,23,99例4在1 000个有机会中奖的号码(编号为000999)中,在公证部门监督下按照随机抽取的方法确定后两位为88的号码为中奖号码,这是运用哪种抽样方法来确定中奖号码的?依次写出这10个中奖号码.思路解析由于总体中个体的个数较多,且被抽取的号码有一定的规律性,故不宜采用随机抽样,因为随机抽样抽取的号码具有随机性,所以宜采用系统抽样. 解:题中运用了系统抽样的方法来确定中奖号码,中奖号码依次为088,188,288,388,488,588,688,788,888,988绿色通道 若题目中出现判断采用何种抽样方法时,可根据各抽样方法的定义来判断.利用系统抽样的方法抽取样本时,如果规则已给出,则按题中给出的规则抽取样本即可.例5为了考察某校的教学水平,将抽查这个学校高三年级的部分学生的本学年考试成绩.为了全面地反映实际情况,采用以下三种方式进行抽查(已知该校高三年级共有20个教学班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生人数都相同): 从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的学习成绩; 每个班抽取1人,共计20人,考察这20个学生的成绩; 把学生按成绩分成优秀、良好、普通三个级别,从中抽取100名学生进行考察(已知:若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人). 根据上面的叙述,试回答下列问题: (1)上面三种抽取方式中,其中总体、个体、样本分别指的是什么?每一种抽取方式抽取的样本中,其样本容量分别是多少? (2)上面三种抽取方式中各自采用何种抽取样本的方法? (3)试分别写出上面三种抽取方式各自抽取样本的步骤.思路解析本题目主要考查数理统计中的一些基本概念和基本方法.做这种题目时,应该注意叙述的完整性和条理性. 解:(1)这三种抽取方式中,其总体都是指该校高三全体学生本年度的考试成绩;个体都是指高三年级每个学生本年度的考试成绩.其中第一种抽取方式中样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第二种抽取方式中样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第三种抽取方式中样本为所抽取的100名学生本年度的考试成绩,样本容量为100. (2)上面三种抽取方式中,第一种方式采用的方法是简单随机抽样法;第二种方式采用的方法是系统抽样法和简单随机抽样法;第三种方式采用的方法是分层抽样法和简单随机抽样法. (3)第一种方式抽样的步骤如下: 第一步:在这20个班中用抽签法任意抽取一个班; 第二步:从这个班中按学号用随机数表法或抽签法抽取20名学生,考查其考试成绩. 第二种方式抽样的步骤如下: 第一步:在第一个班中,用简单随机抽样法任意抽取某一个学生,记其学号为a; 第二步:在其余的19个班中,选取学号为a的学生,共计19人. 第三种方式抽样的步骤如下: 第一步:分层. 因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三个层次. 第二步:确定各个层次抽取的人数. 因为样本容量与总体的个体数比为:1001000=110,所以在每个层次抽取的个体数依次为,即15,60,25 第三步:按层次分别抽取. 在优秀生中用简单随机抽样法抽取15人; 在良好生中用简单随机抽样法抽取60人; 在普通生中用简单随机抽样法抽取25人.绿色通道 弄清考察对象是明确总体、个体、样本的关键,这里考察的对象指的是数据.样本中有多少个个体,样本容量就是多少. 总体、个体、样本的考察对象是同一的,所不同的是范围的大小.样本容量只是样本中个体的数目,不能带单位.被抽取出来的考生的考试成绩,只是总体的一个样本,抽取样本的目的,是为了用这个样本所反映出来的情况去估计总体的情况. 判断采用何种抽样方法时,应充分理解三种抽样方法的定义. 利用抽签法时一定要体现抽签的客观性和公平性. 利用随机数表法时,要注意数字的组合. 采用系统抽样法时,确定起始号后,一定要按规则抽取其余的样本. 采用分层抽样法时应先将总体按一定的标准分层;接着要计算样本容量与总体的个体的比,以确定各层中应抽取的样本容量,最后在每一层进行抽样,抽样时根据各层中个体的个数选择适当的抽样方法:个体数较少用简单随机抽样,当个体个数较多时可采用系统抽样.
展开阅读全文