三种抽样方法

上传人:gp****x 文档编号:242916853 上传时间:2024-09-11 格式:PPT 页数:29 大小:262.50KB
返回 下载 相关 举报
三种抽样方法_第1页
第1页 / 共29页
三种抽样方法_第2页
第2页 / 共29页
三种抽样方法_第3页
第3页 / 共29页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,三种抽样方法,1,数理统计是研究如何有效地收集,整理,分析受随机影响的数据,并对所考虑的问题作出推断或预测,直至为采取决策和行动提供依据和建议的一门学科。它是一门应用性很强的学科,凡是有大量数据出现的地方,都要用到数理统计。现在,数理统计的内容已异常丰富,成为数学中最活跃的学科之一。教科书选择了数理统计中最基本问题来介绍这门学科的思想与方法。,数理统计所要解决的问题是如何根据样本来推断总体,,第一个问题就是采集样本,,然后才能作统计推断。,2,注意以下四点:,(,1,)它要求被抽取样本的总体的个体数,有限,;,(,2,)它是从总体中,逐个,进行抽取;,(,3,)它是一种,不放回抽样,;,(4)它是一种,等概率,抽样。,简单随机抽样是在特定总体中抽取样本,总体中每一个体被抽取的可能性是等同的,而且任何个体之间彼此被抽取的机会是独立的。如果用从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽取的概卒等于,一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为,简单随机抽样。,1、简单随机抽样,3,抽签法,简单随机抽样的方法:,随机数表法,练习,:将全班同学按学号编号,制作相应的卡片号签,放入同一个箱子里均匀搅拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查。分析并说明整个抽签过程中每个同学被抽到的概率是相等的。,1、抽签法,先将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。,4,2、用随机数表法进行抽取,随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素,(1)随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。,(2)随机数表并不是唯一的,因此可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。,(3)用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码。,(4)由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的。,5,随机数表法例,下面举例说明如何用随机数表来抽取样本。,为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,在利用随机数表抽取这个样本时,可以按下面的步骤进行:,第一步,先将40件产品编号,可以编为00,01,02,38,39。,第二步,在附录1随机数表中任选一个数作为开始,例如从第8行第9列的数5开始,为便于说明,我们将附录1中的第6行至第10行摘录如下。,16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64,84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76,63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79,33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54,57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28,6,第三步,从选定的数5开始向右读下去,得到一个两位数字号码59,由于5939,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34。至此,10个样本号码已经取满,于是,所要抽取的样本号码是,16191012073938332134,注将总体中的N个个体编号时可以从0开始,例如N100时编号可以是00,01,02,99,这样总体中的所有个体均可用两位数字号码表示,便于运用随机数表。,7,注:,当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。,在上面每两位、每两位地读数过程中,得到一串两位数字号码,在,去掉其中不合要求和与前面重复的号码,后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。由于随机数表中每个位置上出现哪一个数字是等概率的,每次读到哪一个两位数字号码,即从总体中抽到哪一个个体的号码也是等概率的。因而利用随机数表抽取样本保证了各个个体被抽取的概率相等。,8,由于每排的座位有,40,个,各排每个号码被抽取的概率都是 ,因,而第,1,排被抽取前,其他各排中各号码被抽取哪率也是 ,也就是,说被抽取的概率是 ,每排的抽样也是简单随机抽样,这种,抽样的方法是系统抽样。,(1)一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见留下了座位号为20的30名听众进行座谈。,当总体的个数,较多,时,采用简单随机抽样太麻烦,这时将总体分成均衡的部分,然后按照预先定出的规则,从每一部分中抽取1个个体,得到所需要的样本,这种抽样称为,系统抽样,。,2系统抽样,9,系统抽样的步骤为:,(1)采取随机方式将总体中的个体编号。,(2)将整个的编号均衡地分段,确定分段间隔k。,是整数时, ;,不是整数时,从N中剔除一些个体,使得其为整数为止。,(3)第一段用简单随机抽样确定起始号码l。,(4)按照规则抽取样本:,l,;,l,k;,l,2,k,;,l,nk,系统抽样时,将总体中的个体均分后的每一段进行抽样时,采用简单随机抽样;系统抽样每次抽样时,总体中各个个体被抽取的概率也是相等的;如,总体的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,,然后再按系统抽样进行。需要说明的是整个抽样过程中每个个体被抽到的概率仍然相等。,10,例如,,为了了解参加某种知识竞赛的1000名学生的成绩,打算从中抽取一个容量为50的样本。假定这1000名学生的编号是1,2,1000,由于50:10001:20,我们将总体均分成50个部分,其中每一部分包括20个个体,例如第1部分的个体编号是1,2,20。然后在第一部分随机抽取一个号码,这样得到一个容量为50的样本:,18,38,58,978,998,在上面的抽样中,由于在第1部分(个体编号120)中的起始号码是随机确定的,每个号码被抽取的概率都等于0.05,所以在抽取第1部分的个体前,其他各部分中每个号码被抽取的概率也都是0.05.就是说,在这个系统抽样中,每个个体被抽到的概率都是0.05.,11,思考1:下列抽样中不是系统抽样的是 ( ),A、从标有115号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样;,B、工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验;,C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止;,D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈。,C,12,思考2:从编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( ),A5,10,15,20,25,B、3,13,23,33,43,C、1, 2, 3, 4, 5,D、2, 4, 6, 16,32,B,13,思考3:从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为 ( ),A99,B、99.5,C100,D、100.5,C,思考4:某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是,抽样方法。,系统,14,思考5:采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体,人样的可能性为 _.,思考6:从2004名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2004人中剔除4人,剩下的2000个再按系统抽样的方法进行,则每人入选的机会( ),A.不全相等 B.均不相等,C.都相等 D.无法确定,C,15,系统抽样与简单随机抽样比较,有何优、缺点?,点评:,(1),系统抽样比简单随机抽样更容易实施,可节约抽样成本;,(2),系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;,系统抽样所得样本的代表性和具体的编号有关,而简单随机抽样所得样本的代表性与个体的编号无关.如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差.例如学号按照男生单号女生双号的方法编排,那么,用系统抽样的方法抽取的样本就可能会是全部男生或全部女生.,(3),系统抽样比简单随机抽样的应用范围更广.,16,3分层抽样,当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样。其中所分成的各部分叫做,层,。,由于分层抽样的要求不同,各层的抽样的样本容量也不相同,所以,应当按照实际情况,合理地将样本容量分配到各个层,以确保抽样的合理性,研究时可以根据不同的要求来分层抽样。,分层抽样适用于总体由,差异明显的几部分组成,的情况,每一部分称为层,在每一层中实行简单随机抽样。这种方法较充分地利用了总体己有信息,是一种实用、操作性强的方法。,分层抽样的一个重要问题是一个总体如何分层。分层抽样中分多少层,要视具体情况而定。,总的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,,否则将失去分层的意义。,17,例如,一个单位的职工有500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?,分析,:这总体具有某些特征,它可以分成几个不同的部分:不到35岁;3549岁;50岁以上,把每一部分称为一个层,因此该总体可以分为3个层。由于抽取的样本为100,所以必须确定每一层的比例,在每一个层中实行简单随机抽样。,解,:抽取人数与职工总数的比是100:5001:5,则各年龄段(层)的职工人数依次是125:280:9525:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽取。,答,:在分层抽样时,不到35岁、3549岁、50岁以上的三个年龄段分别抽取25人、56人和19人。,18,思考1、,某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( ),A.15,5,25 B.15,15,15,C.10,5,30 D15,10,20,思考2:,一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。,D,19,解:,因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:,(1)将3万人分为5层,其中一个乡镇为一层。,(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。,3003/15=60(人),3002/15=100(人),3002/15=40(人),3002/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人。,(3)将300人组到一起,即得到一个样本。,20,练习:,分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行 ( ),A、每层等可能抽样,B、每层不等可能抽样,C、所有层按同一抽样比等可能抽样,c,21,分层抽样的抽取步骤:,(1)总体与样本容量确定抽取的比例。,(2)由分层情况,确定各层抽取的样本数。,(3)各层的抽取数之和应等于样本容量。,(4)对于不能取整的数,求其近似值。,22,4,三种抽样方法的比较,23,课堂练习,1,、,某单位有老年人,28,人,中年人,54,人,青年人,81,人,为了调查他们的身体情况,需从他们中抽取一个容量为,36,的样本,则适合的抽取方法是,(,),A,简单随机抽样,B,系统抽样,C,分层抽样,D,先从老人中剔除,1,人,然后再分层抽样,2,、,某校有,500,名学生,其中,O,型血的有,200,人,,A,型血的人有,125,人,,B,型血的有,125,人,,AB,型血的有,50,人,为了研究血型与色弱的关系,要从中抽取一个,20,人的样本,按分层抽样,,O,型血应抽取的人数为,人,,A,型血应抽取的人数为,人,,B,型血应抽取的人数为,人,,AB,型血应抽取的人数为,人。,24,3、统计的基本思想方法是_。,抽样调查常用的方法有_。,样本容量是指_.,4、简单随机抽样适用的范围是_.,系统抽样适用的范围是_.,分层抽样适用的范围是_.,5、为了了解某地区参加数学竞赛的1005名学生的数学,成绩,打算从中抽取一个容量为50的样本,现用系统抽样,的方法,需要从总体中剔除5个个体,在整个过程中,每个,个体被剔除的概率和每个个体被抽取的概率分别为_.,用样本估计总体,简单随机抽样,系统抽样,分层抽样,样本中包含的个体的个数,总体中的个体数较少,总体中的个体数较多,总体由差异明显的几部分组成,A,课堂练习,25,6,、,某中学高一年级有学生,600,人,高二年级有学生,450,人,高三年级有学生,750,人,若该校取一个容量为,n,的样本,每个学生被抽到的可能性均为,0.2,则,n=,。,7,、,对某单位,1000,名职工进行某项专门调查,调查的项目与职工任职年限有关,人事部门提供了如下资料:,任职年限,5,年以下,5,年至,10,年,10,年以上,人数,300,500,200,试利用上述资料设计一个抽样比为,1/10,的抽样方法。,26,系统抽样,088,188,288,388,488,588,688,788,888,988,8、,在1000个有机会中奖的号码(编号为000999)中,在公证部门的监督下,按随机抽取的方法确定最后两位数为88的号码为中奖号码,这是运用那种抽样方法确定中奖号码的?依次写出这10个中奖号码。,27,9、一个电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下所示:,很喜爱 喜爱 一般 不喜爱,2400 4200 3800 1600,打算从中抽取60人进行详细调查,如何抽取?,6、布置作业,教科书P-24习题,1,3,第,27,题。,28,(2004年福建省高考卷)一个总体中有100个个体,随机编号为0,1,2,99,依编号顺序平均分成10个小组,组号分别为1,2,3,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是_.,解析:依编号顺序平均分成的10个小组分别为09, 1019, 2029, 3039, 4049,5059,6069,7079,8089,9099.因第7组抽取的号码个位数字应是3,所以,抽取的号码是63.,这个样本的号码依次是6,18,29,30,41,52,63,74,85,96这10个号.,29,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!