资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,统 计,统计学,:,统计的基本思想,:,用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况,。,研究客观事物的数量特征和数量关系,它是关于数据的搜集、整理、归纳和分析方法的科学。,P53,数理统计所要解决的问题是如何根据,样本,来推断,总体,,第一个问题:,总体、个体、样本、样本容量的概念,.,总体:,所要考察对象的全体,。,个体:,总体中的每一个考察对象,。,样本:,从总体中抽取的一部分个体叫做这个总体的一个样本。,样本容量:,样本中个体的数目。,1、为了了解全校,240,名学生的身高情况,从中抽取,40,名学生进行测量,下列说法正确的是,A总体是,240 B,、个体是每一个学生,C、样本是,40,名学生,D,、样本容量是,40,2、为了正确所加工一批零件的长度,抽测了其中,200,个零件的长度,在这个问题中,,200,个零件的长度是 (),A、总体,B,、个体是每一个学生,C、总体的一个样本,D,、样本容量,在高考阅卷过程中,为了统计每一道试题的得分情况,如平均得分、得分分布情况等,如果将所有考生的每题的得分情况都统计出来,再进行计算,结果是非常准确的,但也是十分烦琐的,那么如何了解各题的得分情况呢?,通常,在考生有这么多的情况下,我们只从中抽取部分考生,(,比如说,1000,名,),,统计他们的得分情况,用他们的得分情况去估计所有考生的得分情况。,联系生活,样本,总体,估计,首要问题:样本一定能准确地反应总体吗?,候选人,预测结果(,%,),选举结果(,%,),Landon,57,38,Roosevelt,43,62,在,1936,年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验,调查兰顿 和罗斯福中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(,在,1936,年电话和汽车只有少数富人拥有,),通过分析收回的调查表,显示兰顿非常受欢迎。于是此杂志预测兰顿将在选举中获胜。实际选举结果正好相反,最后罗斯福在选举中获胜。其数据如下:,思 考,问题一:,对一个确定的总体其样本唯一吗?,问题二:如何科学地,抽取样本?怎样使抽取 的样本充分地反映总体的情况?,合理、公平,为了了解高一(,15,)班,4,7名同学的视力情况,从中抽取,10,名同学进行检查。,抽签决定,实 例 一,开始,抽签法,47,名同学从,1,到,47,编号,制作,1,到,47,个号签,将,47,个号签,搅拌均匀,随机,从中抽出,10,个签,对对应号码的学生检查,结束,抽签法的一般步骤:,(,1,)将总体中的,N,个个体编号;,(,2,)将这,N,个号码写在形状、大小相 同的号签上;,(,3,)将号签放在同一箱中,并搅拌均匀;,(,4,)从箱中每次抽出,1,个号签,连续抽出,n,次;,(,5,)将总体中与抽到的号签编号一致的,n,个个体取出。,开始,47,名同学从,1,到,47,编号,制作,1,到,47,个号签,将,47,个号签搅拌均匀,随机从中抽出,10,个签,对对应号码的学生检查,结束,(总体个数,N,,样本容量,n,),开始,编号,制签,搅匀,抽签,取出个体,结束,P56,抽签法所产生的样本为何是具有代表性的,?,摇匀,使得每一个体被抽到的,机会是相等,的,一、简单随机抽样,设一个总体含有,N,个个体,从中逐个不放回地抽取,n,个个体作为样本,(n,N),,如果每次抽取时总体内的各个个体被抽到的机会都相等,这种抽样方法叫做简单随机抽样。,1,、抽签法(抓阄法),2,、随机数法,2,、随机数表法,注意以下四点:,(,1,)它要求被抽取样本的总体的个体数有限;,(,2,)它是从总体中逐个进行抽取;,(,3,)它是一种不放回抽样;,(4)它是一种等概率抽样。,简单随机抽样每个个体入样的可能性都相等,均为,n/N,,但是这里一定要将,每个个体入样的可能性,、,第,n,次每个个体入样的可能性,、,特定的个体在第,n,次被抽到的可能性,这三种情况区分开业,避免在解题中出现错误。,随机数表法,随机数表:,制作一个表,其中的每个数都是用随机方法产生的(随机数)。,随机数表,教材,103,页,范例,要考察某公司生产的,500,克袋装牛奶的质量是否达标,现从,800,袋牛奶中抽取,60,袋进行检验。,1,、将,800,袋牛奶编号,,000,,,001,,,,,799,2,、在随机数表(课本,103,页)中任选一数,例如第,8,行第,7,列,是,7,。,3,、从,7,开始往右读(方向随意),得到第一个三位数,785,编号,799,,舍弃;如此继续下去,直至抽出,60,袋牛奶。,能从本例体会下,从,000,开始编号的好处吗?,随机数表法,随机数表:,制作一个表,其中的每个数都是用随机方法产生的(随机数)。,先将总体中的所有个体,(,共有,N,个)编号,然后在随机数表内任选一个数作为开始,再从选定的起始数,沿任意方向取数,(,不在号码范围内的数、重复出现的数必须去掉,),,最后根据所得号码抽取总体中相应的个体,得到总体的一个样本,.,步 骤:,编号、选数、取号、抽取,.,练习,3,、下列抽取样本的方式是属于简单随机抽样的是(),从无限多个个体中抽取,100,个个体作样本;,盒子里有,80,个零件,从中选出,5,个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后,再把它放回盒子里;,从,8,台电脑中不放回的随机抽取,2,台进行质量检验(假设,8,台电脑已编好号,对编号随机抽取),A.B.C.D.,以上都不对,C,某学校为了了解高一年级学生对教师教学的意见,打算从高一年级,500,名学生中抽取,50,名进行调查。请设计出抽取样本的方法。,你能否设计其他抽取的方法?,将总体分成均衡的,n,个部分,再按照预先定出的规则,从每一部分中抽取,1,个个体,即得到容量为,n,的样本,.,系统抽样的步骤:,(,1,)先将总体的,N,个个体编号。,(,2,)确定分段间隔,k,,当,N/n,(,n,是样本容 量)是整数时,取,k=N/n,;,(,3,)在第,1,段用间单随机确定第一个个体编号,m(mk),(4),按照一定的规则抽取样本。通常是将,m,加上间隔,k,得到第二个个体编号(,m+k,),再加,k,得到第,3,个个体编号,依次进行下去,直到获得整个样本。,思考:,当,N/n,不是整数时,如何进行系统抽样?,当,N/n,不是整数时,令,k=N/n,,那先从总体中用简单随机抽样的方法剔除,N-nk,个个体,再将其余的编号均分成,k,段。,1,、为了了解,1200,名学生对学校某项教改试验的意见,打算从中抽取一个容量为,30,的样本,考虑采用系统抽样,则分段间隔,k,为(),A,、,40,B,、,30,C,、,20,D,、,12,2,、下列抽样试验中,最适宜系统抽样的是,A,、从某厂生产的,2000,个电子元件中随机抽取,5,个人样,B,、从某厂生产的,2000,个电子元件中随机抽取,200,个人样,C,、从某厂生产的,20,个电子元件中随机抽取,5,个人样,3,:为了了解一次知识竞赛的,1252,名学生的成绩,决定采用系统抽样的方法抽取一个容量为,50,的样本,那么总体中应随机剔除的个体数目是(),A,、,2 B,、,4 C,、,5 D,、,6,4,、要从,1002,个学生中选取一个容量为,20,的样本,试用系统抽样的方法给出抽样过程。,系统抽样的特点,(,1,)适用于总体容量较大的情况;,(,2,)剔除多余个体及第一段抽样都用简单随机抽样,因而与简单随机抽样有密切联系;,(,3,)是等可能抽样,每个个体被抽到的可能性都是,n/N,1.下列抽样中不是系统抽样的是 (),A、从标有,115,号的,15,号的,15,个小球中任选,3,个作为样本,按从小号到大号排序,随机确定起点,i,以后为,i+5,i+10(,超过,15,则从,1,再数起,),号入样,B工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验,C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止,D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为,14,的观众留下来座谈,3、从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为 (),A99 B、99.5 C100 D、100.5,4、从学号为050的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样的方法,则所选5名学生的学号可能是 (),A1,2,3,4,5 B、5,16,27,38,49,C2,4,6,8,10 D、4,13,22,31,40,设计科学、合理的抽样方法,其核心问题是保证抽样公平,并且样本具有好的代表性,.,如果要调查我校高一学生的平均身高,由于男生一般比女生高,故用简单随机抽样或系统抽样,都可能使样本不具有好的代表性,.,对于此类抽样问题,我们需要一个更好的抽样方法来解决,.,某地区有高中生2400人,初中生10900人,小学生11100人.当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查.,样本容量与总体个数的比例为,1:100,,则,高中应抽取人数为,2400*1/100=24,人,初中应抽取人数为,10800*1/100=108,人,,小学应抽取人数为,11100*1/100=111,人,.,思考1:具体在三类学生中抽取样本时(如在10800名初中生中抽取108人),可以用哪种抽样方法进行抽样?,思考2:在上述抽样过程中,每个学生被抽到的概率相等吗?,思考3:上述抽样方法不仅保证了抽样的公平性,而且抽取的样本具有较好的代表性,从而是一种科学、合理的抽样方法,这种抽样方法称为分层抽样.一般地,分层抽样的基本思想是什么?,若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本,.,思考4:若用分层抽样从该地区抽取81名学生调查身体发育状况,那么高中生、初中生和小学生应分别抽取多少人?,高中生,8,人,初中生,36,人,小学生,37,人,.,某单位有职工,500,人,其中,35,岁以下的有,125,人,,35,岁,49,岁的有,280,人,,50,岁以上的有,95,人,.,为了调查职工的身体状况,要从中抽取一个容量为,100,的样本,.,思考,1,:该项调查应采用哪种抽样方法进行?,思考,2,:按比例,三个年龄层次的职,工分别抽取多少人?,35,岁以下,25,人,,35,岁,49,岁,56,人,,50,岁以上,19,人,.,思考,3,:在各年龄段具体如何抽样?怎样获得所需样本?,思考,4,:一般地,分层抽样的操作步骤如何?,第一步,计算样本容量与总体的个体数之比,.,第四步,将各层抽取的个体合在一起,就得到所取样本,.,第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体,.,第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数,.,思考,5,:在分层抽样中,如果总体的个体数为,N,,样本容量为,n,,第,i,层的个体数为,k,,则在第,i,层应抽取的个体数如何计算?,思考,6,:样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数该如何处理?,调节样本容量,剔除个体,.,1.分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取
展开阅读全文