资源描述
讲课人:邢启强,*,9.1.2,分层随机抽样,9.1.3,获取数据的途径,1,、简单随机抽样的概念,:,2,、简单随机抽样的特点,:,3,、简单随机抽样的常用方法:,机会均等抽样,.,总体个数有限;,逐个进行抽取;,抽签法;,随机数表法,.,设一个总体含有有限个个体,并记其个体数为,N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为,简单随机抽样,.,复习回顾,抽样调查最核心的问题是样本的代表性,简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本,,例如,在对树人中学高一年级学生身高的调查中,可能出现样本中,50,个个体大部分来自高个子或矮个子的情形,这种“极端”样本的平均数会大幅度地偏离总体平均数,从而使得估计出现较大的误差,.,能否利用总体中的一些额外信息对抽样方法进行改进呢?,新课引入,学习新知,在对树人中学高一年级学生身高的调查中,采取简单随机抽样的方式抽取了,50,名学生。,1.,抽样调查最核心的问题是什么?,2.,会不会出现样本中,50,个个体大部分来自高个子或矮个子的情形?,3.,为什么会出现这种“极端样本”?,4.,如何避免这种“极端样本”?,样本代表性,会,抽样结果的随机性个体差异较大,分组抽样,减少组内差距,在树人中学高一年级的,712,名学生中,男生有,326,名、女生有,386,名,学习新知,样本量在男生、女生中应如何分配?,探究?,假设某地区有高中生,2400,人,初中生,10900,人,小学生,11000,人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取,1%,的学生进行调查,你认为应当怎样抽取样本?,80,60,40,20,0,近视率,%,小学 初中 高中,你认为哪些因素影响学生视力?抽样要考虑哪些因素?,分析:考察对象的特点是由具有明显差异的几部分组成。,当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“,分层抽样,”,其中所分成的各部分叫做“,层,”。,学习新知,一、分层抽样的定义。,一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为,分层随机抽样,(,stratified random sampling,),每一个子总体称为层,.,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为,比例分配,.,学习新知,每一层抽取的样本数,=,总样本量,学习新知,应用分层抽样应遵循以下要求:,(,1,)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。,(,2,)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。,分层随机抽样的特点,1.,从分层随机抽样的定义可看出,分层随机抽样适用于总体由差异明显的几个部分组成的情况。,2.,比例分配的分层随机抽样是等可能抽样,如果层数分为,2,层,第,1,层和第,2,层包含的个体数分别为,M,和,N,抽取的样本数分别,m,和,n,。,第一步,计算样本容量与总体的个体数之比,.,第四步,将各层抽取的个体合在一起,就得到所取样本,.,第三步,用简单随机抽样在各层中抽取相应数量的个体,.,第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数,.,分层抽样的步骤:,学习新知,注意事项:,1.,分层抽样法适用于总体中个体差异明显的抽样,;,2.,分层是按总体中个体的明显差异进行分类,;,3.,分层抽样是按各层中含个体在总体中所占的比例,确定层抽样的个体个数进行随机抽样,.,学习新知,某地区有高中生,2400,人,初中生,10800,人,小学生,11100,人,.,当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生中抽取,1%,的学生进行调查,.,样本容量与总体个数的比例为,1:100,,则,高中应抽取人数为,2400*1/100=24,人,初中应抽取人数为,10800*1/100=108,人,,小学应抽取人数为,11100*1/100=111,人,.,典型例题,变式,1,:,若用分层抽样从该地区抽取,81,名学生调查身体发育状况,那么高中生、初中生和小学生应分别抽取多少人?,高中生,8,人,初中生,36,人,小学生,37,人,.,某单位有职工,500,人,其中,35,岁以下的有,125,人,,35,岁,49,岁的有,280,人,,50,岁以上的有,95,人,.,为了调查职工的身体状况,要从中抽取一个容量为,100,的样本,.,思考,1,:,该项调查应采用哪种抽样方法进行?,典型例题,思考,2,:,按比例,三个年龄层次的职工分别抽取多少人?,35,岁以下,25,人,,35,岁,49,岁,56,人,,50,岁以上,19,人,.,思考,3,:,在各年龄段具体如何抽样?怎样获得所需样本?,1,、,某高中共有,900,人,其中高一年级,300,人,高二年级,200,人,高三年级,400,人,现采用分层抽样抽取容量为,45,的样本,那么高一、高二、高三各年级抽取的人数分别为(),A.15,5,25 B.15,15,15,C.10,5,30 D15,10,20,D,巩固练习,2:,一个地区共有,5,个乡镇,人口,3,万人,其中人口比例为,3:2:5:2:3,从,3,万人中抽取一个,300,人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。,巩固练习,解:,因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:,(,1,)将,3,万人分为,5,层,其中一个乡镇为一层。,(,2,)按照样本容量的比例随机抽取各乡镇应抽取的样本。,300,3/15=60,(人),,300,2/15=100,(人),,300,2/15=40,(人),,300,2/15=60,(人),因此各乡镇抽取人数分别为,60,人、,40,人、,100,人、,40,人、,60,人。,(,3,)将,300,人组到一起,即得到一个样本。,3.,某公司共有,1000,名员工,下设若干部门,现用分层抽样法,从全体员工中抽取一个容量为,80,的样本,已知策划部被抽取,4,个员工,求策划部的员工人数是多少?,50,人,.,巩固练习,4.,某中学有,180,名教职员工,其中教学人员,144,人,管理人员,12,人,后勤服务人员,24,人,设计一个抽样方案,从中选取,15,人去参观学习,.,用分层抽样,抽取教学人员,12,人,管理人员,1,人,后勤服务人员,2,人,.,5.,某公司在甲、乙、丙、丁四个地区分别有,150,个、,120,个、,180,个、,150,个销售点,公司为了调查产品的销售情况,需从这,600,个销售点中抽取一个容量为,100,的样本,记这项调查为;,在丙地区中有,20,个特大型销售点,要从中抽取,7,个调查其销售收入和售后服务等情况,记这项调查为,,完成这两项调查宜分别采用什么方法?,用分层抽样,,用简单随机抽样,.,巩固练习,请根据上述基本数据,设计一个样本容量为总体中个体数量的千分之一的抽样方案,.,6.,某地区中小学生人数的分布情况如下表所示(单位:人):,学段,城市,县镇,农村,小学,357 000,221 600,258 100,初中,226 200,134 200,11 290,高中,112 000,43 300,6 300,巩固练习,7,、,某校有,500,名学生,其中,O,型血的有,200,人,,A,型血的人有,125,人,,B,型血的有,125,人,,AB,型血的有,50,人,为了研究血型与色弱的关系,要从中抽取一个,20,人的样本,按分层抽样,,O,型血应抽取的人数为,人,,A,型血应抽取的人数为,人,,B,型血应抽取的人数为,人,,AB,型血应抽取的人数为,人。,8,5,5,2,巩固练习,8,、,某中学高一年级有学生,600,人,高二年级有学生,450,人,高三年级有学生,750,人,若该校取一个容量为,n,的样本,每个学生被抽到的可能性均为,0.2,则,n=,.,360,10,、某校有老师,200,人,男学生,1200,人,女学生,1000,人,现用分层抽样的方法从所有师生中抽取一个容量为,n,的样本,已知女学生中抽取的人数为,80,,则,n=,192,9,、某单位有职工,160,人,其中业务员有,104,人,管理人员,32,人,后勤,24,人,现用分层抽样从中抽取一容量为,20,的样本,则抽取管理人员()人,A,、,3 B,、,4 C,、,7 D,、,12,B,巩固练习,11,、某大学数学系共有本科生,5000,人,其中一、二、三、四年级的学生比为,4,:,3,:,2,:,1,,用分层抽样的方法抽取一个容量为,200,人的样本,则应抽取三年级的学生为()人。,A,、,80,B,、,40,C,、,60,D,、,20,B,巩固练习,思考:,样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数该如何处理?,调节样本容量,剔除个体,.,学习新知,某单位有老年人,28,人,中年人,54,人,青年人,81,人,为了调查他们的身体情况,需从他们中抽取一个容量为,36,的样本,则适合的抽取方法是,A,简单随机抽样,B,系统抽样,C,.,分层抽样,D,.,先从老人中剔除,1,人,然后再分层抽样,D,学习新知,四、分层随机抽样的平均数,.,在简单随机抽样中如何估计总体平均数?,.,那么在分层随机抽样中如何估计总体平均数呢?,是否也可以直接用样本平均数进行估计?,学习新知,第,1,层的总体平均数和样本平均数为,:,第,2,层的总体平均数和样本平均数为,:,总体平均数和样本平均数为,:,学习新知,由于用第一层的样本平均数 可以估计第层的总体平均数 ,第二层的样本平均数 可以估计第,2,层的总体平均数,因此我们可以用,估计总体平均数,对各层样本平均数加权(层权)求和,学习新知,分层随机抽样如何估计总体平均数,在比例分配的分层随机中抽样中,典型例题,在树人中学高一年级的,712,名学生,男生有,326,名、女生有,386,名,分别抽取的男生,23,名男生、,27,名女生样本数据如下,173.0,174.0,166.0,172.0,170.0,165.0,165.0,168.0,164.0,173.0,172.0,173.0,175.0,168.0,170.0,172.0,176.0,175.0,168.0,173.0,167.0,170.0,175.0,163.0,164.0,161.0,157.0,162.0,165.0,168.0,155.0,164.0,162.5,154.0,154.0,164.0,149.0,159.0,161.0,170.0,171.0,155.0,148.0,172.0,162.5,158.0,155.5,157.0,163.0,172.0,样本女生平均身高,=160.6,样本男生平均身高,=170.6,巩固练习,高一年级有男生,490,人,女生,510,人,张华按照男生女生进行分层,得到男生女生平均身高分别为,170.2cm,和,160.8cm,。,(,1,)如果张华在各层中按比例分配样本,总样本量为,100.,那么男生、女生中分别抽取了多少名?在这种情况下,请估计高一年级全体学生的平均身高。,(,2,)如果张华从男生、女生中抽取的样本量分别为,30,和,70,,那么在这种情况下,如何估计高一全体学生的平均身高。,深入思考,小明用比例分配的分层抽样方法,从高一年
展开阅读全文