资源描述
*,*,*,*,*,*,*,*,*,*,*,*,*,*,第九章 统计,第九章 统计,在现实生活中,我们经常会接触到各种统计数据,例如,人,口总量、经济增长率、就业状况、物价指数、产品的合格率、商,品的销售额、农作物的产量、人均水资源、居民人均年收入、电,视台节目的收视率、学生的平均身高等.要正确阅读并理解这些,数据,需要具备一些统计学的知识.,统计学是通过收集数据和分析数据来认识未知现象的一门科学,.面对一个统计问题,首先要根据实际需求,通过适当的方法获取数据,并选择适当的统计图表对数据进行整理和描述,在此基础上用各种统计方法对数据进行分析,从样本数据中提取需要的信息,推断总体的情况,进而解决相应的实际问题,.,那么,对于具体的统计问题,,,应如何收集数据?如何从所收集的数据中提取信息来认识未知现象?这种认识一定正确吗?应如何正确解释统计的结果?本章我们将在初中学过的统计与概率知识的基础上,通过进步学习,加深对这些问题的认识,并通过解决问题的实践,进一步学习数据分析的方法.,在现实生活中,我们经常会接触到各种统计数据,例如,人,9.1,随机抽样,9.1 随机抽样,统计的研究对象是数据,核心是通过数据分析研究和解决问题.因此,首先要设法获取与问题有关数据,从而为解决问题奠定基础.,统计的研究对象是数据,核心是通过数据分析研究和解决问题.,因此,首先要设法获取与问题有关的数据,从而为解决问题奠定基础.例如,准确掌握全国的人口数据,可以为科学制定国民经济和社会发展规划及其他方针政策提供依据.2010年我国进行了第六次人口普查,对全国人口普遍地、逐户逐人地进行一次性调查登记.调查内容包括每位居民的姓名、性别、年龄、民族、受教育程度等.这里,居民为调查对象,而居民的性别、年龄、民族、受教育程度等是要调查的指标.由于不同调查对象的指标值往往不同,它是一个变化的量,所以常把指标称为变量.像人口普查这样,,对每一个调查对象都进行调查的方法,称为,全面调查,,又称,普查,.,在一个调查中,我们把,调查对象的全体称为,总体,,,组成总体的每一个调查对象称为,个体,.为了强调调查目的,也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体.,统计的研究对象是数据,核心是通过数据分析研究和解决问,由于人口普查需要花费巨大的财力、物力,因而不宜经常进行,为了及时掌握全国人口变动状况,我国每年还会进行一次人口变动情况的调查.这种调查是抽取一部分居民进行调查,根据抽取的居民情况来推断总体的人口变动情况.像这样,,根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为,抽样调查,.我们把,从总体中抽取的那部分个体称为,样本,,,样本中包含的个体数称为,样本量,.,调查样本获得的变量值称为样本的观测数据,简称,样本数据,.,相对全面调查而言,抽样调查由于只抽取一部分个体进行调查,因此具有花费少、效率高的特点,.,在总体规模比较大的调查中,如果经费、时间上受限,那么抽样调查是比较合适的调查方法.在有些调查中,抽样调查则具有不可替代的作用,例如,检测一批灯泡的寿命,或一批种子的发芽率,或一批待售袋装牛奶的细菌数是否超标,这些检测具有毁损性,此时只能用抽样调查.,随着社会的发展,抽样调查的应用范围越来越广泛.下面我们研究两种基本的抽样方法,简单随机抽样和分层随机抽样.,由于人口普查需要花费巨大的财力、物力,因而不宜经常进,9.1.1,简单随机抽样,第一课时,(,简单随机抽样,),9.1.1 简单随机抽样第一课时,一、探究新知,抽样调查的目的是为了了解总体的情况.例如,抽样调查一批待售袋装牛奶的细菌数是否超标,其目的是要了解整批牛奶的细菌含量超标情况,而不只是局限在抽查到的那几袋牛奶的情况.因此,通过抽样调查了解总体的情况,自然希望抽取的样本数据能很好地反映总体的情况,即样本含有和总体基本相同的信息.,假设口袋中有红色和白色共1000个小球,除颜色外,小球的大小、质地完全相同,.,你能通过抽样调查的方法估计袋中红球所占的比例吗?,这里袋中所有小球是调查的总体,每一个小球是个体,小球的颜色是所关心的变量.我们可以从袋中随机地摸出一个球,记录颜色后放回,摇匀后再摸出一个球,如此重复n次.根据初中的概率知识可知,随着摸球次数的增加,摸到红球的频率会逐渐稳定于摸到,红球的概率,即口袋中红球所占的比例,因此,我们可以通过放回摸球,用频率估计出红球的比例.,一、探究新知 抽样调查的目的是为了了解总体的情况.例如,在有放回地摸球中,同一个小球有可能被摸中多次,极端情况是每次摸到同一个小球,而被重复摸中的小球只能提供同一个小球的颜色信息,如果我们采用不放回摸球,即从袋中摸出一个球后不再放回袋中,每次摸球都在余下的球中随机摸取,这样就可以避免,同一个小球被重复摸中.特别地,当样本量n=1000时,不放回摸球已经把袋中的所有球取出,这就完全了解了袋中红球的比例,而有放回摸球一般还不能对袋中红球的比例作出准确的判断.,一、探究新知,在有放回地摸球中,同一个小球有可能被摸中多次,极端情,二、,简单随机抽样的概念,从总体中,逐个不放回地随机抽取n个个体作为样本,一次性批量随机抽取,n,个个体作为样本,两种方法是等价的.,一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1nN)个个体作为样本,.,如果抽取是,放回,的,且每次抽取时总体内的各个个体被抽到的,概率都相等,,我们把这样的抽样方法叫做,放回简单随机抽样,.,如果抽取是,不放回,的,且每次抽取时总体内未进入样本的各个个体被抽到的,概率都相等,,我们把这样的抽样方法叫做,不放回简单随机抽样,.,放回简单随机抽样和不放回简单随机抽样统称为,简单随机抽样,.通过简单随机抽样获得的样本称为,简单随机样本,.,与放回简单随机抽样比较,不放回简单随机抽样的效率更高,因此实践中人们更多采用不放问简单随机抽样.除非特殊声明,本章所称的简单随机抽样指不放回简单随机抽样.,二、简单随机抽样的概念 从总体中,逐个不放回地随机抽取,问题1,一家家具厂要为树人中学高一年级制作课桌椅,他们事先想,了解全体高一年级学生的平均身高,以便设定可调节课桌椅,的标准高度.已知树人中学高一年级有712名学生,如果要通,过简单随机抽样的方法调查高一年级学生的平均身高,应该,怎么抽取样本?,在这个问题中,树人中学全部高一年级的学生构成调查的总体,每一位学生是个体,学生的身高是调查的变量.与“探究”栏目中估计红球的比例类似,我们可以对高一年级进行简单随机抽样,用抽出的样本的平均身高估计高一年级学生的平均身高.实现,简单随机抽样的方法,有很多,,抽签法和随机数法,是比较常用的两种方法.,下面分别介绍这两种方法,.,三、,简单随机抽样的方法,问题1 一家家具厂要为树人中学高一年级制作课桌椅,他们事先想,1.,抽签法,先给712名学生编号,例如按1,712进行编号,然后把所有,编号写在外观、质地等无差别的小纸片(也可以是卡片、小球),上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.,最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的,学生进入样本,直到抽足样本所需要的人数.,抽签法的优点是,简单易行,,缺点是当总体较大时,操作起来比较麻烦,费时、费力,又不方便,.,因此,抽签法一般适用于总体中个体数不多的情形,.,一般地,抽签法就是把总体中的,N,个个体编号,把号码写在号签上,将号签放在一个容器中搅拌均匀,每次不放回地从中抽取一个号签,连续抽取,n,次,就得到一个容量为,n,的样本,.,(1),抽签法的定义,:,你认为抽签法有什么优点和缺点,?,当总体中的个体数很多时,用抽签法方便吗?,(2),抽签法的优缺点,:,为什么要给学生编号?编号用学号可以吗?,三、,简单随机抽样的方法,1.抽签法 抽签法的优点是简单易行,缺点是当总体较大时,2.,随机数法,先给712名学生编号,例如按1712进行编号.,用随机数工具产生1712范围内的整数随机数,,把产生随机数作为抽中编号,使与编号对应学生,进入样本.重复上述过程,直到抽足所需要人数.,如果生成的随机数有重复,即同,与编号被多次抽到,可以剔除重复的,编号并重新产生随机数,直到产生的,不同编号个数等于样本所需要的人数.,一般说来,在计算器,或计算机软件没有特殊设,定的情况下,它们生成的,随机数,都是可重复的.,为了确认你使用的计算器,或计算机软件的情况,可,以查阅它的说明书,也可,以通过测试它能否生成3,个整数随机数1或2来进行判断.,比较随机数法与抽签法,它们各有什么优点和缺点?,(2),随机数法的步骤,:,将总体的个体编号;,在产生的随机数选择数字;,读数获取样本号码,.,(1),随机数法的概念,:,利用随机数工具产生的随机数,进行抽样方法,叫做随机数法,.,三、,简单随机抽样的方法,2.随机数法 如果生成的随机数有重复,即同 一般,(1)用随机试验生成随机数,(2)用信息技术生成随机数,准备10个大小、质地一样的小球,小球上分别写上数字0,1,2,9,把它们放入一个不透明的袋中,从袋中有放回摸取3次,每次摸取前充分搅拌,并把第一、二、三次摸到的数字分别作为百、十、个位数,这样就生成了一个三位随机数.如果这个三位数在1712范围内,就代表对应编号的学生被抽中,否则舍弃编号.这样产生的随机数可能会有重复.,进入计算器的计算模式(不同的计算器型号可能会有不同),调出生成随机数的函数并设置参数,例如RandInt#(1,712),按“=”键即可生成1712范围内的整数随机数.重复按“=”键,可以生成多个随机数.这样产生的随机数可能会有重复.,用计算器生成随机数,三、,简单随机抽样的方法,(1)用随机试验生成随机数(2)用信息技术生成随机数,在电子表格软件的任一单元格中,输入“=RANDBETWEEN(1,712)”,即可生成一个1712范围内的整数随机数.再利用电子表格软件的自动填充功能,可以快速生成大量的随机数(如下图1).这样产生的随机数可能会有重复.,用电子表格软件生成随机数,三、,简单随机抽样的方法,在电子表格软件的任一单元格中,输入“=RANDBET,在R软件的控制台中,输入“sample(1:712,50,replace=F)”,按回车键,就可以得到50个1712范围内的不重复的整数随机数(如下图).,用R统计软件生成随机数,R软件是免费的统计软件,该软件具有比较强大数据处理、绘图和分析等统计功能,在统计学研究和学习中被广泛使用,.,三、,简单随机抽样的方法,在R软件的控制台中,输入“sample(1:71,随着信息技术发展,人们更多利用计算器、数学软件、统计软件等来生成随机数.尤其是统计软件,可以非常方便地按要求生成各种随机数.用信息技术工具产生随机数最大的优点是方便、快捷.,我们知道,在重复试验中,试验次数越多,,频率接近概率的可能性越大.与此类似,用简单,随机抽样的方法抽取学生,样本量越大,样本中,不同身高的比例接近总体中相应身高的比例的可能性也越大,样本的平均身高接近总体的平均身高的可能性也越大.即对于样本的代表性,一般说来,样本量大的会好于样本量小的.尤其是样本量不大时,增加样本量可以较好地提高估计的效果.但是,在实际抽样中,样本量的增大会导致调查的人力、费用、时间等成本的增加.因此,抽样调查中样本量的选择要根据实际问题的需要,并不一定是越大越好.,用简单随机抽样方法抽取样本,样本量,是否越大越好?,在简单随机抽样调查中,当样本量和总体一样大时,就是全面调查了,.,三、,简单随机抽样的方法,随着信息技术发展,人们更多利用计算器、数学软件、统计,例1,在简单随机抽样中,某个个体被抽中的可能性是,(),A.,与第几次抽样有关,第一次抽中的可能性要大些;,B.,与第几次抽样无关,每次抽到的可能性都相等;,C.,与第几次抽样有关,最后一次抽中的可能性要大些;,D.,与第几次抽样无关,每个都是等可能抽取,但各次抽取的,可能性不一
展开阅读全文