第7章 抽样调查

上传人:xinsh****encai 文档编号:243618618 上传时间:2024-09-27 格式:PPT 页数:75 大小:1.09MB
返回 下载 相关 举报
第7章 抽样调查_第1页
第1页 / 共75页
第7章 抽样调查_第2页
第2页 / 共75页
第7章 抽样调查_第3页
第3页 / 共75页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第七章 抽样调查,第七章 抽样调查,7.1,抽样调查概述,7.2,抽样推断的基本原理,7.3,抽样,误差,7.4,全及总体指标的推断,第一节 抽样调查概述,一、抽样的概念和特点,抽样:,根据随机原则从总体中抽取一部分单位作为样本,并根据样本数量特征对总体数量特征做出具有一定可靠程度的估计与推断。,特点:,用部分信息推断总体数量特征,按随机原则抽取样本单位,存在抽样误差,但误差可以事先计算并控制,二、抽样的作用,对不可能进行全面调查的社会现象,可以取得事半功倍的效果,对普查资料进行评价和修正,三、抽样推断中常用的几个基本概念,全及总体和抽样总体,全及指标和抽样指标,平均数、成数、标准差、方差,(一)全及总体和抽样总体,1,、全及总体(总体,N,),所要认识对象的全体。,(,1,)有限总体 (,2,)无限总体,2,、抽样总体(样本,n,),所抽取的一部分单位。,(,1,)大样本(,n30,) (,2,)小样本(,n,30,),(二)全极指标和样本指标,全及指标:,指反映总体数量特征的综合指标。(即参数),参数,研究总体中,的数量标志,总体平均数,总体方差,X=,X,N,X=,XF,F,(,X-X,),N,2,=,2,(,X-X,),F,F,2,=,2,研究总体中,的品质标志,成数平均数,成数方差,2,= P(1-P),P =,N1,N,8,例,1,某公司生产的,10000,件产品中,有,500,件为不合格品。则 产品不合格率,P, ,N,500,10000,5,0, 产品合格率,Q,1P,1,5,0,95,标准差为:,2,= P(1-P)=95%*5%=0.0475,=0.22,样本指标,:,根据样本数据计算的综合指标。(即统计量),研究数,量标志,样本平均数,样本标准差,研究品,质标志,成数平均数,成数标准差,第二节 抽样推断的基本原理,一、抽样推断的方法论基础,大数定理,独立同分布的随机变量: ,,设它们的平均数为 ,方差为 ,即 ,,(i=1,2,),。则对任意的正数,,有:,中心极限定理,正态分布的再生定理:,只要在样本容量,n,充分大的条件下,不论全及总体的变量分布是否属于正态分布,其抽样平均数也趋近正态分布。,二、抽样误差的基本要求,无偏性,一致性,有效性,评价估计量优良性的三个标准:,1,、无偏性:,样本统计量的期望值等于被估计的总体参数。,设 表示总体的待估参数, 是估计 的样本统计量,无偏估计指的是 满足:,如:,由于 ,所以样本平均数是总体平均数的无偏估计量。,2,、一致性:,当样本的单位数充分大时,样本统计量也充分靠近总体参数。,所以样本平均数是总体平均数的一致估计量。,如:,3,、有效性:,作为优良估计量,其方差应比其它无偏估计量的方差小。,如:,设 和 都是总体参数 的无偏估计量,如果 ,则说明估计量 比 更有效。,第三节 抽样平均误差,一、抽样误差的概念,二、抽样平均误差,三、抽样极限误差,四、抽样估计的可信度,一、抽样误差的概念,抽样误差的一般概念,抽样误差是指样本指标与总体指标之间的差距。,表示为 、,统计调查误差种类,按产生的原因分,统计调查误差可分为调查误差和代表性误差。,调查误差是指统计调查时,由于主观或客观因素引起的技术性、登记性误差以及责任性误差等。,代表性误差又可分为两种:系统性误差和随机误差。,系统性误差又称偏差,它是由于抽样调查没有遵循随机原则而产生的误差。只要遵循随机原则就可以避免。,随机误差又称偶然的代表性误差,它是指没有调查误差的前提下,又遵循了随机原则所产生的误差。随机误差是抽样调查固有的误差。抽样误差是指这种随机误差。,制约抽样误差的因素,抽样单位数的多少,总体被研究标志的变异程度,二、抽样平均误差,抽样平均误差,是一系列抽样指标(平均数或乘数)的,标准差,求抽样平均误差就是求所有可能样本平均数的标准差。,用计算器求,2,、,2.5,、,3,、,2.5,、,3,、,3.5,、,3,、,3.5,、,4,的标准差得,即为抽样平均误差,抽样平均数的平均误差,前面已经举例说明了直接按照可能抽样平均数求标准差的方法计算,但该方法太繁。,可以证明:,在重复抽样下,抽样平均误差,为总体标准差,,n,为样本单位数,在总体标准差未知,,且样本单位数较大时,可以用样本标准差代替。,例:从,40,、,50,、,70,、,80,中抽取,3,个组成样本,在重复抽样下,求抽样平均误差。,求总体标准差,直接用计算器统计功能键可以求出:,求抽样平均误差,2.,在不重复抽样下,抽样平均误差,为总体标准差,,n,为样本单位数,,N,为总体单位数。,例:从,40,、,50,、,70,、,80,中抽取,3,个组成样本,在不重复抽样下,求抽样平均误差。,求总体标准差,直接用计算器统计功能键可以求出:,求抽样平均误差,练习:,1,、随机重复抽选某校学生,100,人,调查他们的体重得到平均体重为,58,公斤,标准差为,10,公斤。问抽样推断的平均误差是多少?,解,:,即当根据样本学生的平均体重估计全部学生的平均,体重时,抽样平均误差为,1,公斤。,已知:,则:,练习:,1,、随机重复抽选某校学生,100,人,调查他们的体重得到平均体重为,58,公斤,标准差为,10,公斤。问抽样推断的平均误差是多少?,2,、某厂生产一种新型灯泡共,20000,只,随机抽出,400,只作耐用时间试验,测试结果平均使用寿命为,4800,小时,样本标准差为,300,小时,求抽样推断的平均误差?,解,:,已知:,则:,2,、某厂生产一种新型灯泡共,20000,只,随机抽出,400,只,作耐用时间试验,测试结果平均使用寿命为,4800,小时,,样本标准差为,300,小时,求抽样推断的平均误差,?,抽样成数的平均误差,总体成数是总体中具有某种属性的单位占所有单位的比重,用,P,表示,不具有某种属性的比重用,Q,表示;样本中具有某种属性用,p,表示,不具有某种属性用表示。,可以证明:总体平均数,=P,总体标准差,样本标准差,3,、某校随机抽选,400,名学生,发现戴眼镜的学生有,80,人。根据样本资料推断全部学生中戴眼镜的学生,所占比重时,抽样平均误差为多大?,解,:,已知:,则:样本成数,3,、某校随机抽选,400,名学生,发现戴眼镜的学生有,80,人。根据样本资料推断全部学生中戴眼镜的学生,所占比重时,抽样平均误差为多大?,求样本平均数和样本成数各自的平均误差。,求灯泡平均使用时间、标准差和灯泡合格率(样本),求灯泡使用时间抽样平均误差:,在不重复抽样下抽样平均误差:,在重复抽样下抽样平均误差,:,求灯泡合格率的抽样平均误差:,在不重复抽样下抽样平均误差:,在重复抽样下抽样平均误差,:,练习:,某冷库厂从一批冻鸡中抽取样本,测得平均每只重,1200,克,标准差,70,克,如果重复随机抽取,100,只和,200,只,分别计算,抽样平均误差。,本次抽样测得,冻鸡合格率为,97%,,如果重复随机抽取,100,只和,200,只,分别计算,抽样平均误差。,练习:,某冷库厂从一批冻鸡中抽取样本,测得平均每只重,1200,克,标准差,70,克,如果重复随机抽取,100,只和,200,只,分别计算,抽样平均误差。,本次抽样测得,冻鸡合格率为,97%,,如果重复随机抽取,100,只和,200,只,分别计算,抽样平均误差。,40,(,三)抽样极限误差极限误差是指抽样推断中依一定的概率保证下的误差的最大范围。,1.,抽样平均数的极限误差:,41,2.,抽样成数的极限误差:,42,43,(四)抽样估计的可信程度,抽样极限误差通常是以抽样平均误差为标准单位来衡量的,即:,一般地,,在抽样平均误差 为一定的条件下,当概率度,t,的值越大,则抽样误差范围,越大,估计总体平均数或成数包含在相应的区间范围内的概率越大,从而抽样估计的可靠程度也就越高。反之亦然。,如果把可靠程度即概率用,p,表示,概率度,t,的大小决定,p,的大小,即,p,是,t,的函数:,为了方便计算,在实际工作中,按不同的,t,值和相应的概率 编成正态分布概率表供查用。,常用的有:,置信度,F,(,t,):,指总体指标落在某个区间,的概率保证程度。,t,1,1.64,1.96,2,3,0.6827,0.9000,0.9500,0.9545,0.9973,概率度和置信度的函数关系,置信区间:以一定的概率保证程度确定总体指标,所在的区间。,(分为置信下限和置信上限),置信区间为:,48,抽样极限误差也可以表示为抽样平均误差的若干倍,其倍数即概率度,t,:,49,同理:,50,例,某农场种植小麦,5000,亩,收获前夕随机抽取,25,亩进行实割实测,测得平均亩产,500,千克,标准差为,50,千克,试求全部,5000,亩小麦的平均亩产在,480,千克至,520,千克之间的概率。,51,例,某农场种植小麦,5000,亩,收获前夕随机抽取,25,亩进行实割实测,测得平均亩产,500,千克,标准差为,50,千克,试求全部,5000,亩小麦的平均亩产在,480,千克至,520,千克之间的概率。,某灯泡厂某月生产,5000000,个灯泡,在进行质量检查中,随机抽取,500,个进行检验,这,500,个灯泡的耐用时间见下表:,试求:该厂全部灯泡平均耐用时间的取值范围(概率保证程度,0.9973,),检查,500,个灯泡中不合格产品占,0.4%,,试在,0.6827,概率保证下,估计全部产品中不合格率的取值范围。,求解如下:,计算抽样平均误差,由概率保证程度,0.9973,,查表得概率度,t=3,计算抽样极限误差,估计总体指标区间,p=0.4%,概率保证程度为,0.6827,时,,t=1,纯随机抽样,机械抽样,类型抽样,整群抽样,第四节 抽样形式,纯随机抽样,按随机原则直接从总体,N,个单位中抽取,n,个单位作为样本。,对总体的要求:,总体分布均匀。,有抽样框的名单。,可事先确定总体的标准差。,方法:,摇号法 抽签法,随机数表法,机械抽样,将总体各单位按某一标志进行顺序排列,然后按固定的间隔来抽取样本单位的抽样组织形式,又称,等距抽样,或,系统抽样,。,特点:,事先需了解总体的一些辅助信息。,在各单位顺序排列的基础上,再按某种规则依一定间隔取样,可保证取到的样本单位在总体中分布均匀,使样本有较高的代表性。,仅当排列的标志与所研究的标志有较密切的关系时,才能提高抽样效果。,类型抽样,按一定标志对总体各单位进行分类,然后分别从每一类中按随机原则抽取一定的单位构成样本,又称,分层抽样,。,适用的条件:,总体各单位在被研究标志上有明显差别。,事先掌握总体相关的信息。,优点:,把统计分组和抽样原理有机结合,使抽取的样本更具代表性,能有效减小抽样误差。,与所研究的标志值大小有关,整群抽样,将总体各单位分成若干群,然后从其中随机抽取部分群,对中选的群进行全面调查的抽样组织方式,又称,集团抽样,。,优点:,因对中选的群进行全面调查,调查单位很集中,组织抽样简单,节省费用。,适用条件:,在没有总体的有关信息可利用时,可采用整群抽样。,第五节 抽样单位数目的确定,必要的样本单位数,:,在一定的概率保证程度下,要使抽样误差不超过某一给定范围所必需的样本单位数。,必要样本单位数的确定:,根据给定的抽样极限误差和概率保证程度计算必要的样本单位数。,1,、估计总体平均数时:,重复抽样下,不重复抽样下,2,、估计总体成数时:,重复抽样下,不重复抽样下,注意:,在多主题抽样情况下,一个样本要调查多项指标,此时要采用样本单位数较大的设计方案。,例:,某市要进行职工家计调查,由历史资料知该市职工家庭年收入与消费支出的标准差分别为,2400,元和,1500,元。现采用重复抽样方法,要求在,95.44%,的置信度下,平均年收入与消费支出的极限误差分别不超过,200,元和,120,元,求样本必要的单位数。,例:,某市要进行职工家计调查,由历史资料知该市职工家庭年收入与消费支出的标准差分别为,2400,元和,1500,元。现采用重复抽样方法,要求在,95.44%,的置信度下,平均年收入与消费支出的极限误差分别不超过,200,元和,120,元,求样本必要的单位数。,解:,由,1-,=0.9544,,查表得概率度,t=2,,根据重复抽样的样本必要单位数公式:,因此,样本必要的单位数为,625,户。,1,、一某市常住居民为,70,万人,现采用简单随机方法抽样,对该市常住居民人均年食糖需要量进行调查,共抽取,1400,人进行调查,得知人均年食糖需,5.6kg,,样本方差为,40.46,。如果允许误差为,0.34kg,,请问该市常住居民年食糖需要量的置信区间和置信概率。,2,、某小区有居民家庭,24000,户,一家汽车销售公司采用简单随机的方法抽样,对该小区居民的私家车拥有量进行调查。抽取了,1200,户,发现每百户拥有私家车,8,辆。如果要求把握程度为,95%,,请问该小区居民拥有私家车的置信区间是什么?,3,、,工商部门对某超市经销的小包装休闲食品经销重量合格抽查,规定每包重量不低于,30,克,在,1000,包食品中抽,1%,进行检验,结果如下:,按重量分组,包数(包),26-27,27-28,28-29,29-30,30-31,1,3,3,2,1,合计,10,试以,95.45%,的概率推算,(,1,)这批食品的平均每包重量是否符合规定要求,(,2,)若每包食品重量低于,30,克为不合格,求合格率的范围,4,、某高校有,5000,名学生,随机抽取,250,名学生进行调查。下面是被调查学生收看电视时间调查资料,按不重复抽样方法,以,95.45%,的概率推断该校全部学生每周平均看电视时间的可能范围。,按每周收看电视时间分组,学生人数,2,以下,2-4,4-6,6-8,8,以上,22,56,92,60,20,合计,250,2,)例题,5,、某类产品根据以往资料的估计,总体方差,5.456,千克,现对一批进行简单随机抽样以推断该批产品的平均重量,要求可靠程度达到,99.73%,,误差范围不超过,0.9,千克,需要抽多少样本单位?,2,)例题,6,、某类产品根据以往资料的估计,总体方差,5.456,千克,现对一批进行简单随机抽样以推断该批产品的平均重量,要求可靠程度达到,99.73%,,误差范围不超过,0.9,千克,需要抽多少样本单位?,解:按题意,由,F(t,)=99.73, 查表可得,t,3,因此:,(,2,)根据以往资料的估计,该类产品的一等品率为,90%,,可靠程度仍为,99.73%,,误差范围不超过,5%,,推断该批产品的一等品率,需要抽多少样本单位?,(,2,)根据以往资料的估计,该类产品的一等品率为,90%,,可靠程度仍为,99.73%,,误差范围不超过,5%,,推断该批产品的一等品率,需要抽多少样本单位?,解:按题意,因此,,1,、某种产品重量的均值为,6,克,标准差为,2.5,克,从这种产品中随机抽取容量为,15,的样本,则下列关于样本均值的抽样分布的描述正确的是( ),A.,抽样分布的均值为,6,克,B.,抽样分布的标准差为,2.5,克,C.,抽样分布是正态分布,D.,以上叙述都正确,课堂练习题:,1,、某地区的电视台委托调查公司估计地区内居民平均每日的看电视时间。调查公司随机抽取了,100,名居民进行调查,样本数据显示平均每人每天看电视时间是,4,个小时,样本标准差是,1.5,小时。试求:,(1),该地区内居民每天看电视的平均时间的置信区间,(,置信度是,95%),;,(2),如果要求估计的误差不超过,27,分钟,这时置信度是多少?,练习题:,结 束,THANKS,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!