第8章抽样调查理论与方法-课件

上传人:痛*** 文档编号:241647924 上传时间:2024-07-12 格式:PPT 页数:79 大小:477.50KB
返回 下载 相关 举报
第8章抽样调查理论与方法-课件_第1页
第1页 / 共79页
第8章抽样调查理论与方法-课件_第2页
第2页 / 共79页
第8章抽样调查理论与方法-课件_第3页
第3页 / 共79页
点击查看更多>>
资源描述
统计学统计学主编:费宇,石磊主编:费宇,石磊7/12/20241统计学第8章抽样调查理论与方法第第8章章 抽样调查理论与方法抽样调查理论与方法F8.1 抽样调查的意义抽样调查的意义F8.2 抽样调查的基本概念抽样调查的基本概念F8.3 抽样误差抽样误差F8.4 抽样方案设计抽样方案设计F8.5 样本容量的确定样本容量的确定7/12/20242统计学第8章抽样调查理论与方法8.1 抽样调查的意义抽样调查的意义F8.1.1 抽样调查的概念抽样调查的概念F8.1.2 抽样调查的作用抽样调查的作用F8.1.3 抽样调查的应用领域抽样调查的应用领域7/12/20243统计学第8章抽样调查理论与方法8.1.1 抽样调查的概念抽样调查的概念F统统计计调调查查:是是获获取取数数据据资资料料的的一一种种重重要要手手段段,它又分为全面调查与非全面调查两类。它又分为全面调查与非全面调查两类。全面调查全面调查:普查普查 非全面调查:又称为抽样调查,它是指从研非全面调查:又称为抽样调查,它是指从研究对象的全体(总体)中抽取一部分单元作为究对象的全体(总体)中抽取一部分单元作为样本进行观察,并根据观察结果来推断全体,样本进行观察,并根据观察结果来推断全体,以此达到对全体目标量的了解。这是广义的抽以此达到对全体目标量的了解。这是广义的抽样调查的概念。样调查的概念。例:调查北京市民对出租车行例:调查北京市民对出租车行业的满意度调查业的满意度调查7/12/20244统计学第8章抽样调查理论与方法抽样调查的分类抽样调查的分类F依据样本抽取的同,抽样可以分为非概率抽样和概依据样本抽取的同,抽样可以分为非概率抽样和概率抽样两类。率抽样两类。7/12/20245统计学第8章抽样调查理论与方法非概率抽样非概率抽样(non-probability sampling)与概率抽样相对的一种抽样。又称非随机抽样,是指抽样与概率抽样相对的一种抽样。又称非随机抽样,是指抽样时不遵循随机原则,而是按照研究人员的主观经验或其他时不遵循随机原则,而是按照研究人员的主观经验或其他条件来抽取样本的一种抽样方法。条件来抽取样本的一种抽样方法。问题:问题:(1)其效果好坏依赖于抽样者的主观判断能力和经验其效果好坏依赖于抽样者的主观判断能力和经验 (2)无法计算和控制抽样误差。无法用样本的量化数据来无法计算和控制抽样误差。无法用样本的量化数据来推断总体。推断总体。7/12/20246统计学第8章抽样调查理论与方法便利抽样便利抽样F是是根根据据调调查查者者的的方方便便与与否否来来抽抽取取样样本本的的一一种种非非概概率率抽抽样样方方法法。典典型型的的形形式式是是“拦拦截截式式”调调查查。调调查查过过程程中中由由调调查查员员依依据据方方便便的的原原则则,自自行行确确定定入入抽抽样本的单位样本的单位调调查查员员在在街街头头、公公园园、商商店店等等公公共共场场所所进进行行拦拦截调查截调查厂家在出售产品柜台前对路过顾客进行的调查厂家在出售产品柜台前对路过顾客进行的调查F优点:优点:容易实施,调查的成本低容易实施,调查的成本低F缺缺点点:样样本本单单位位的的确确定定带带有有偶偶然然性性,样样本本无无法法代代表表有有明明确确定定义义的的总总体体,调调查查结结果果无无法法根根据据样样本本信信息息对对总总体体进进行行数数量量特特征征的的推推断断,样样本本不不适适合合描描述述性研究和因果关系研究性研究和因果关系研究 7/12/20247统计学第8章抽样调查理论与方法判断抽样判断抽样F是是一一种种凭凭研研究究人人员员的的主主观观意意愿愿、经经验验和和知知识识,从从总总体体中中选选择择具具有有典典型型意意义义和和代代表表性性的的样样本本点点构构成成样样本本作为调查客体的一种非概率抽样方法。作为调查客体的一种非概率抽样方法。一一般般选选择择“平平均均型型”、“众众数数型型”、“特特殊殊型型”单单元元作作为为样本样本F样样本本量量小小及及样样本本不不易易分分门门别别类类挑挑选选时时有有其其较较大大的的优优越性越性F由由于于其其估估计计精精度度严严重重依依赖赖于于研研究究者者对对调调查查对对象象的的了了解解程程度度、判判断断水水平平和和对对结结果果的的解解释释情情况况,所所以以,一一般不轻易地用于对总体进行数量方面的判断般不轻易地用于对总体进行数量方面的判断7/12/20248统计学第8章抽样调查理论与方法配额抽样配额抽样F先将总体中的所有单元按一定的标志分为若干(组)先将总体中的所有单元按一定的标志分为若干(组),然后在每个类(组)中按照事先规定的比例或数,然后在每个类(组)中按照事先规定的比例或数量(即配额)用便利抽样或判断抽样方法选取样本量(即配额)用便利抽样或判断抽样方法选取样本点点 分类依据通常就是总体单元的某些属性、特征,如分类依据通常就是总体单元的某些属性、特征,如受调查者的受调查者的年龄、性别、社会阶层等年龄、性别、社会阶层等F方法简单易行,可以保证总体的各个类别都能包括方法简单易行,可以保证总体的各个类别都能包括在所抽样本之中,使得样本的结构和总体的结构类在所抽样本之中,使得样本的结构和总体的结构类似似7/12/20249统计学第8章抽样调查理论与方法配额抽样配额抽样F独独立立控控制制配配额额抽抽样样:根根据据调调查查总总体体的的不不同同特特性性,对对具具有某个特性的调查样本分别规定单独分配数额有某个特性的调查样本分别规定单独分配数额 优点优点:方法简单易行,调查人员选择余地较大:方法简单易行,调查人员选择余地较大 缺点缺点:调查人员可能图一时方便,选择样本过:调查人员可能图一时方便,选择样本过于偏向某一组别,从而影响样本的代表性于偏向某一组别,从而影响样本的代表性F交交叉叉控控制制配配额额抽抽样样:是是根根据据调调查查对对象象的的各各个个特特性性的的样样本数额交叉分配本数额交叉分配 由于各个特性都同时得到了控制,从而克服了独由于各个特性都同时得到了控制,从而克服了独立控制配额抽样的缺点,提高了样本的代表性。立控制配额抽样的缺点,提高了样本的代表性。7/12/202410统计学第8章抽样调查理论与方法滚雪球抽样滚雪球抽样F是是以以“滚滚雪雪球球”的的方方式式抽抽取取样样本本,即即通通过过一一些些“种种子子”样样本本点点以以获获取取更更多多样样本本点点的的信信息息,样本量逐渐扩大样本量逐渐扩大F优优点点:便便于于有有针针对对性性找找到到被被调调查查者者,调调查查的成本也比较低的成本也比较低F缺缺点点:要要求求样样本本单单元元之之间间必必须须有有一一定定的的联联系并且愿意保持和提供这种关系系并且愿意保持和提供这种关系 7/12/202411统计学第8章抽样调查理论与方法概率抽样概率抽样(probability sampling)F又又称随机抽样称随机抽样,是指依据随机原则,按照某种事,是指依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的抽样方先设计的程序,从总体中抽取部分单元的抽样方法法 F特点特点按一定的概率以随机原则抽取样本按一定的概率以随机原则抽取样本F抽抽取取样样本本时时使使每每个个单单位位都都有有一一定定的的机机会会(概概率率)被被抽中抽中F“随机随机”不等于不等于“随便随便”F“随机随机”不等于不等于“等概率等概率”用样本指标数值去推断总体的指标数值用样本指标数值去推断总体的指标数值抽抽样样调调查查会会产产生生抽抽样样误误差差,这这个个误误差差可可以以计计算算,并并且且可以加以控制可以加以控制7/12/202412统计学第8章抽样调查理论与方法概率抽样概率抽样(probability sampling)F概率抽样被视为狭义的抽样调查,在实践中被广概率抽样被视为狭义的抽样调查,在实践中被广泛加以采用,通常所谓的抽样调查,均指概率抽泛加以采用,通常所谓的抽样调查,均指概率抽样调查。样调查。F概率抽样有多种形式:概率抽样有多种形式:简单随机抽样、分层抽样、简单随机抽样、分层抽样、系统抽样、整群抽样系统抽样、整群抽样等,这些方法将在等,这些方法将在8.4节逐一节逐一介绍。介绍。7/12/202413统计学第8章抽样调查理论与方法8.1.2 抽样调查的作用抽样调查的作用F实际工作不可能进行全面调查,而又需要了解其实际工作不可能进行全面调查,而又需要了解其全面情况的现象全面情况的现象 F对虽然可以进行全面调查,但调查时范围大、单对虽然可以进行全面调查,但调查时范围大、单位数目多,又缺乏原始记录作依据的现象位数目多,又缺乏原始记录作依据的现象F对普查资料的质量进行检查和修正对普查资料的质量进行检查和修正F抽样调查方法可以用于工业生产过程中的质量控抽样调查方法可以用于工业生产过程中的质量控制制 7/12/202414统计学第8章抽样调查理论与方法8.1.3 抽样调查的应用领域抽样调查的应用领域F社会经济现象的调查社会经济现象的调查 如:人口变动、农产量、城市居民家计、农村经济、小型如:人口变动、农产量、城市居民家计、农村经济、小型工业企业生产情况、小型商业企业交易情况调查工业企业生产情况、小型商业企业交易情况调查 F社会性的民意调查社会性的民意调查 F市场调查市场调查F卫生调查卫生调查 F资源环境调查资源环境调查7/12/202415统计学第8章抽样调查理论与方法8.2 抽样调查的基本概念抽样调查的基本概念 F8.2.1 总体与样本总体与样本F8.2.2 总体参数与统计量总体参数与统计量F8.2.3 抽样单元与抽样框抽样单元与抽样框 F8.2.4 抽样方法与样本可能数目抽样方法与样本可能数目F8.2.5 精度与费用精度与费用7/12/202416统计学第8章抽样调查理论与方法8.2.1 总体与样本总体与样本F总体总体:研究对象的全体,或者说是希望从中获取信息:研究对象的全体,或者说是希望从中获取信息的总体,它是由研究对象中所有性质相同的个体的总体,它是由研究对象中所有性质相同的个体(individual)所组成所组成 1)总体的限定是人为的)总体的限定是人为的 2)在一项调查中,)在一项调查中,总体是唯一的,样本不是唯一的总体是唯一的,样本不是唯一的 3)总体中包含的单元数称为)总体中包含的单元数称为总体容量总体容量,记为,记为F个体个体:构成总体的基本单元:构成总体的基本单元 7/12/202417统计学第8章抽样调查理论与方法统计总体的种类统计总体的种类指总体中所包含的单位数目是有指总体中所包含的单位数目是有限的总体限的总体指总体中所包含的单位数目是无指总体中所包含的单位数目是无限的总体限的总体有限总体有限总体无限总体无限总体对对有有限限总总体体可可以以进进行行全全面面调调查查,也可以进行也可以进行非全面调查;非全面调查;对无限总体只能采取对无限总体只能采取非全面调查非全面调查 7/12/202418统计学第8章抽样调查理论与方法F样本样本:是总体的一部分,从总体中按一定程序抽取的那部是总体的一部分,从总体中按一定程序抽取的那部分抽样单元或个体组成。分抽样单元或个体组成。1)样本也是一个集合,每个被抽中的进入样本的单元称)样本也是一个集合,每个被抽中的进入样本的单元称为为入样单元入样单元,2)样本包含的单元数称为样)样本包含的单元数称为样样本容量样本容量,记为,记为n 3)样本量对总体容量之比称为)样本量对总体容量之比称为抽样比抽样比,记为,记为fn/N(一(一般是一个很小的数)般是一个很小的数)4)大样本)大样本 ;小样本;小样本 7/12/202419统计学第8章抽样调查理论与方法8.2.2 总体参数与统计量总体参数与统计量F总体参数总体参数:是根据总体中各单位的变量值:是根据总体中各单位的变量值计算出来的用于反映总体的数量特征的指计算出来的用于反映总体的数量特征的指标标 F调查的目标量都是由总体的某些指标来表调查的目标量都是由总体的某些指标来表示的示的F总体参数表现为一系列唯一的常数,但往总体参数表现为一系列唯一的常数,但往往却是未知的,需要去推断和估计往却是未知的,需要去推断和估计 7/12/202420统计学第8章抽样调查理论与方法F统计量:统计量:是根据样本的是根据样本的n个单元的变量值计个单元的变量值计算出来一个量,也叫估计量算出来一个量,也叫估计量(estimator),1)样本指标是随机变量)样本指标是随机变量 2)往往构成了用于估计总体参数的估计量。)往往构成了用于估计总体参数的估计量。7/12/202421统计学第8章抽样调查理论与方法常见的总体参数包括常见的总体参数包括:F总体均值(平均数)总体均值(平均数)(population mean)F总体总值(总和)(总体总值(总和)(population total)F总体比例(总体比例(proportion)F总体方差总体方差(population variance)F标准差标准差(population standard deviation)7/12/202422统计学第8章抽样调查理论与方法8.2.3 抽样单元与抽样框抽样单元与抽样框F总体是由个体组成的,可以是有限的,也可以是无限总体是由个体组成的,可以是有限的,也可以是无限的,当从抽样角度而言,总将总体看成是有限的。的,当从抽样角度而言,总将总体看成是有限的。F将总体划分为互不重迭而又穷尽的有限多个部分,将将总体划分为互不重迭而又穷尽的有限多个部分,将这样的每个部分称为这样的每个部分称为抽样单元抽样单元(sampling unit)。)。1)每个抽样单元都由或多或少的个体组成,当然也)每个抽样单元都由或多或少的个体组成,当然也可以是一个个体。可以是一个个体。7/12/202423统计学第8章抽样调查理论与方法 2)抽样单元可大可小,可以分级。分别称为一级)抽样单元可大可小,可以分级。分别称为一级抽样单元(抽样单元(psu)、二级抽样单元()、二级抽样单元(ssu),),基本抽样单元(最小一级抽样单元)。基本抽样单元(最小一级抽样单元)。3)抽样单元可以是人为划分的,也可以是自然形)抽样单元可以是人为划分的,也可以是自然形成的。成的。7/12/202424统计学第8章抽样调查理论与方法F包含所有抽样单元的名单或者清册,称为包含所有抽样单元的名单或者清册,称为抽样抽样框。框。1)抽样框的形式是多样的)抽样框的形式是多样的 2)抽样框中的单元原则上既不应有重复,也)抽样框中的单元原则上既不应有重复,也不应有遗漏不应有遗漏抽样框的种类抽样框的种类:名录框、区域框、自然框名录框、区域框、自然框7/12/202425统计学第8章抽样调查理论与方法8.2.4 抽样方法与样本可能数目抽样方法与样本可能数目F从总体中抽取样本方式的不同,构成了不同的抽从总体中抽取样本方式的不同,构成了不同的抽样方法样方法 1)放回抽样)放回抽样/回置抽样、不放回抽样回置抽样、不放回抽样 2)等概率抽样、不等概率抽样)等概率抽样、不等概率抽样F对样本开展调查,获得样本数据,形成样本指标,对样本开展调查,获得样本数据,形成样本指标,构造适当的统计量作为总体指标的估计是抽样调构造适当的统计量作为总体指标的估计是抽样调查的必要工作查的必要工作7/12/202426统计学第8章抽样调查理论与方法F重复抽样重复抽样:指每次从总体中抽取一个单元:指每次从总体中抽取一个单元进行观察后,再把这个单元重新放回总体,进行观察后,再把这个单元重新放回总体,使之继续参加下次抽选(回置抽样或重置使之继续参加下次抽选(回置抽样或重置抽样)。抽样)。F不重复抽样不重复抽样:指每次从总体中抽取一个单:指每次从总体中抽取一个单元进行观察后,不再把这个单元重新放回元进行观察后,不再把这个单元重新放回总体,这个总体单元不再继续参加下次抽总体,这个总体单元不再继续参加下次抽选(不回置抽样或不重置抽样)。选(不回置抽样或不重置抽样)。7/12/202427统计学第8章抽样调查理论与方法F考虑顺序的重复抽样考虑顺序的重复抽样F不考虑顺序的重复抽样不考虑顺序的重复抽样F考虑顺序的不重复抽样考虑顺序的不重复抽样F不考虑顺序的不重复抽样不考虑顺序的不重复抽样7/12/202428统计学第8章抽样调查理论与方法8.2.5 精度与费用精度与费用 抽样调查的精度抽样调查的精度误差的大小误差的大小 抽样误差的大小抽样误差的大小 (可用估计量,大样本)方差或标准差大小(可用估计量,大样本)方差或标准差大小 抽样调查中,精度的估计主要就是估计量的方差估计抽样调查中,精度的估计主要就是估计量的方差估计 影响方差的最重要的因素是样本量,样本量又与费用有关影响方差的最重要的因素是样本量,样本量又与费用有关 影响精度和费用的另一因素是抽样方法和估计方法影响精度和费用的另一因素是抽样方法和估计方法 对于一个具体的抽样设计,应尽量做到在固定费用的限制下使精对于一个具体的抽样设计,应尽量做到在固定费用的限制下使精度最高,或在要求达到的精度的约束下使调查费用最省,称这样度最高,或在要求达到的精度的约束下使调查费用最省,称这样的设计为的设计为最优设计最优设计7/12/202429统计学第8章抽样调查理论与方法 对精度的讨论基于两个方向对精度的讨论基于两个方向:F对于某类抽样方案,构造合适的估计量并讨论这对于某类抽样方案,构造合适的估计量并讨论这一估计量的方差估计一估计量的方差估计F对于既定的抽样方案,依据给定的精度要求(误对于既定的抽样方案,依据给定的精度要求(误差限要求)讨论方案的细节(如样本量的确定问差限要求)讨论方案的细节(如样本量的确定问题)题)7/12/202430统计学第8章抽样调查理论与方法8.3 抽样误差抽样误差 F8.3.1抽样调查中误差的来源抽样调查中误差的来源F8.3.2抽样平均误差、方差与偏差抽样平均误差、方差与偏差 F8.3.3抽样平均误差的计算抽样平均误差的计算 F8.3.4抽样极限误差与置信度抽样极限误差与置信度 7/12/202431统计学第8章抽样调查理论与方法8.3.1 抽样调查中的误差来源抽样调查中的误差来源F凡调查就一定有误差,不可能完全避免。抽样调查中误差可分凡调查就一定有误差,不可能完全避免。抽样调查中误差可分为为非抽样误差非抽样误差及及抽样误差抽样误差两大类。两大类。非抽样误差非抽样误差(nonsampling error):指不是由于抽样引起的,指不是由于抽样引起的,在全面普查中也存在。包括:在全面普查中也存在。包括:1)调查误差:调查所得数据与样本单元的真值不一致所造成的)调查误差:调查所得数据与样本单元的真值不一致所造成的误差。原因包括测量误差、失真回答等。误差。原因包括测量误差、失真回答等。2)不完整的抽样框误差:抽样框的重复和遗漏。)不完整的抽样框误差:抽样框的重复和遗漏。3)不回答误差(无相应误差):抽中的样本单元找不到或者拒)不回答误差(无相应误差):抽中的样本单元找不到或者拒绝回答问题或缺失所需要的信息绝回答问题或缺失所需要的信息 4)填写录入误差)填写录入误差7/12/202432统计学第8章抽样调查理论与方法#抽样误差抽样误差(sampling error):指由于抽样所造成的):指由于抽样所造成的误差(用样本估计总体而产生的误差)。其根源在于误差(用样本估计总体而产生的误差)。其根源在于样本的随机性,使得样本指标值和总体真实值之间存样本的随机性,使得样本指标值和总体真实值之间存在差异在差异 1)只要是抽样调查,这个误差不可避免)只要是抽样调查,这个误差不可避免 2)能够计量和控制,可用各种量值表示)能够计量和控制,可用各种量值表示 3)通常样本量愈大,则抽样误差愈小(抽样误差与)通常样本量愈大,则抽样误差愈小(抽样误差与样本量的平方根成反比)样本量的平方根成反比)7/12/202433统计学第8章抽样调查理论与方法8.3.2 抽样平均误差、方差和偏差抽样平均误差、方差和偏差7/12/202434统计学第8章抽样调查理论与方法F均方误差可以分解:均方误差可以分解:其中:其中:称称为的(抽的(抽样)方差方差 称称为的的偏差偏差(Bias)特别地,对于无偏估计量,满足:特别地,对于无偏估计量,满足:因此:因此:即:对于无偏估计量,其方差可以表征抽样平均误差程度即:对于无偏估计量,其方差可以表征抽样平均误差程度7/12/202435统计学第8章抽样调查理论与方法F均方误差的平方根称为均方误差的平方根称为抽样平均误差抽样平均误差,方差的平方根称为,方差的平方根称为标准差标准差(standard deviation)。F抽样平均误差抽样平均误差 、标准差、标准差 和偏差和偏差 三者之间的三者之间的关系:关系:7/12/202436统计学第8章抽样调查理论与方法8.3.3 抽样平均误差的计算抽样平均误差的计算F本章主要讨论简单随机抽样条件下,以及估计量本章主要讨论简单随机抽样条件下,以及估计量是无偏估计量的抽样平均误差的计算是无偏估计量的抽样平均误差的计算(一一)样本平均数的抽样平均误差样本平均数的抽样平均误差1.1.重重复抽样复抽样7/12/202437统计学第8章抽样调查理论与方法 某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:=20小时,根据以往资料,产品质量不太稳定,若=200小时,例例7/12/202438统计学第8章抽样调查理论与方法2.不重复抽样:7/12/202439统计学第8章抽样调查理论与方法(二)样本比例的抽样平均误差 已证明得:已证明得:比例的平均数就是比例本身比例的平均数就是比例本身 比例的方差是比例的方差是 7/12/202440统计学第8章抽样调查理论与方法 某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽样平均误差。例例7/12/202441统计学第8章抽样调查理论与方法得取总体方差的途径有:1.1.用用过去全面调查或抽样调查的资料,若同时有几个方差的过去全面调查或抽样调查的资料,若同时有几个方差的资料,应选用数值较大的那个;资料,应选用数值较大的那个;2.2.用用样本标准差代替全及标准差;样本标准差代替全及标准差;3.3.在在大规模调查前,先搞个小规模的试验性的调查来确定总大规模调查前,先搞个小规模的试验性的调查来确定总体方差;体方差;4.4.用用估计估计的方法。的方法。7/12/202442统计学第8章抽样调查理论与方法8.3.4 抽样极限误差抽样极限误差和置信度和置信度F实际问题中,估计量的精度通常采用抽样极限误差来表示实际问题中,估计量的精度通常采用抽样极限误差来表示或要求或要求F抽样极限误差:抽样极限误差:是根据概率理论,以一定的可靠程度保证是根据概率理论,以一定的可靠程度保证抽样误差不超过某一给定的范围,抽样误差不超过某一给定的范围,也称作也称作也称作也称作抽样允许误差。抽样允许误差。抽样允许误差。抽样允许误差。常用常用常用常用 表示表示表示表示。意义意义:在一定的置信度下,估计值与真实值的差异不超过:在一定的置信度下,估计值与真实值的差异不超过 上式表明,样本平均数(比例)是以总体平均数(比例)上式表明,样本平均数(比例)是以总体平均数(比例)为中心,在相应的区间内变动。为中心,在相应的区间内变动。7/12/202443统计学第8章抽样调查理论与方法F置信度置信度:极限误差是在某种概率意义下的最大误差范:极限误差是在某种概率意义下的最大误差范围,这里的概率称为置信度一般用围,这里的概率称为置信度一般用 表示。表示。F抽样极限误差与抽样平均误差之间的关系,与估计量抽样极限误差与抽样平均误差之间的关系,与估计量的分布有关的分布有关F有:有:误差限与置信度是成对出现的,置信度越大,则相应误差限与置信度是成对出现的,置信度越大,则相应的误差限就越大。的误差限就越大。因此,实际问题中,只给出误差限不给出置信度或者因此,实际问题中,只给出误差限不给出置信度或者相反,都是没有意义的。相反,都是没有意义的。7/12/202444统计学第8章抽样调查理论与方法8.4 抽样方案设计抽样方案设计 F8.4.1抽样方案设计的基本原则抽样方案设计的基本原则F8.4.2简单随机抽样简单随机抽样 F8.4.3分层抽样分层抽样 F8.4.4系统抽样系统抽样 F8.4.5整群抽样整群抽样 7/12/202445统计学第8章抽样调查理论与方法8.4.1抽样方案设计的基本原则抽样方案设计的基本原则F抽样方案的设计关系到调查的准确度有多高以及抽样方案的设计关系到调查的准确度有多高以及必要的样本数目是多少等问题。因此要科学地设必要的样本数目是多少等问题。因此要科学地设计抽样调查方案。计抽样调查方案。1.在抽样设计中要保证实现在抽样设计中要保证实现随机抽取随机抽取的原则(随机的原则(随机原则是概率抽样的基础原则是概率抽样的基础)2.在抽样设计中要保证实现在抽样设计中要保证实现最大抽样效率最大抽样效率的原则的原则(实现最大抽样效率是经济效益的问题)(实现最大抽样效率是经济效益的问题)7/12/202446统计学第8章抽样调查理论与方法8.4.2 简单随机抽样简单随机抽样(simple random sampling)F从从总总体体N个个单单位位中中随随机机地地抽抽取取n个个单单位位作作为为样样本本,使使得得每一个容量为每一个容量为n n的样本都有相同的机会的样本都有相同的机会(概率概率)被抽中被抽中 F抽取元素的具体方法有抽取元素的具体方法有重复抽样重复抽样和和不重复抽样不重复抽样F特点特点简单、直观,在抽样框完整时,可直接从中抽取样本简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便F局限性局限性当当N很大时,不易构造抽样框很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率没有利用其他辅助信息以提高估计的效率7/12/202447统计学第8章抽样调查理论与方法8.4.2 简单随机抽样简单随机抽样F简单随机抽选有各种不同的具体做法,如:简单随机抽选有各种不同的具体做法,如:1.抽签法抽签法 2.使用统计软件直接抽取法使用统计软件直接抽取法 3.随机数法随机数法F简单随机抽样误差的计算简单随机抽样误差的计算在重复抽样条件下:在重复抽样条件下:在不重复抽样条件下:在不重复抽样条件下:7/12/202448统计学第8章抽样调查理论与方法8.4.3 分层抽样分层抽样(stratified sampling)F将将抽抽样样单单位位按按某某种种特特征征或或某某种种规规则则划划分分为为不不同同的的层,然后从不同的层中独立、随机地抽取样本层,然后从不同的层中独立、随机地抽取样本例例如如,在在居居民民生生活活水水平平调调查查中中,先先按按职职业业分分类类,然后每种职业分别随机抽取部分居民进行调查。然后每种职业分别随机抽取部分居民进行调查。实质上是实质上是分组法分组法与与随机原则随机原则的结合的结合总体总体N样本样本n等比例抽取等比例抽取不等比例抽取不等比例抽取优最抽取优最抽取7/12/202449统计学第8章抽样调查理论与方法分层抽样分层抽样F优点优点1.既既可可以以对对总总体体参参数数进进行行估估计计,也也可可以以对对各各层层的的目标量进行估计目标量进行估计2.保保证证样样本本的的结结构构与与总总体体的的结结构构比比较较相相近近,从从而而提高估计的精度提高估计的精度3.组织实施调查灵活方便组织实施调查灵活方便4.分分层层样样本本分分别别取取自自各各层层,在在总总体体中中的的分分布布更更为为均匀,不会出现不平衡的情况均匀,不会出现不平衡的情况 7/12/202450统计学第8章抽样调查理论与方法两种类型:1.1.等等比例分配法比例分配法(类型比例抽样类型比例抽样)2.2.不不等比例分配法等比例分配法(类型适宜抽样类型适宜抽样)实际工作中比较常用的是等比例分配法实际工作中比较常用的是等比例分配法 7/12/202451统计学第8章抽样调查理论与方法分层抽样抽样平均误差的计算分层抽样抽样平均误差的计算F在重复抽样条件下:在重复抽样条件下:F在不重复抽样条件下:在不重复抽样条件下:7/12/202452统计学第8章抽样调查理论与方法8.4.4 系统抽样系统抽样(systematic sampling)F将将总总体体中中的的所所有有单单位位(抽抽样样单单位位)按按一一定定顺顺序序排排列列,在在规规定定的的范范围围内内随随机机地地抽抽取取一一个个单单位位作作为为初初始始单单位位,然然后后按按事事先先规规定定好好的的规规则确定其他样本单位则确定其他样本单位先先从从数数字字1到到k之之间间随随机机抽抽取取一一个个数数字字r作作为为初初始始单位,以后依次取单位,以后依次取r+k,r+2k等单位等单位F优点优点:操作简便,可提高估计的精度:操作简便,可提高估计的精度F缺点缺点:对估计量方差的估计比较困难:对估计量方差的估计比较困难7/12/202453统计学第8章抽样调查理论与方法排列次序用的标志有两种:1.1.无关标志排队:无关标志排队:选择标志与抽样调查选择标志与抽样调查所研究内容无关所研究内容无关2.2.有关标志排队:有关标志排队:选择标志与抽样调查选择标志与抽样调查所研究的内容有关所研究的内容有关研究工人的平均收入水平时,按工号排队。研究工人的平均收入水平时,按工号排队。例例研究工人的生活水平,按工人月工资额高研究工人的生活水平,按工人月工资额高低排队。低排队。例例7/12/202454统计学第8章抽样调查理论与方法根据样本抽选的方法不同,可分为:根据样本抽选的方法不同,可分为:随机起点等距抽样随机起点等距抽样半距起点等距抽样半距起点等距抽样对称起点等距抽样对称起点等距抽样(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)(总体单位按某一标志排序)7/12/202455统计学第8章抽样调查理论与方法按无关标志排队的等距抽样按无关标志排队的等距抽样,可按简单随机抽可按简单随机抽样来计算;样来计算;按有关标志排队的等距抽样,按有关标志排队的等距抽样,可按分层抽样来可按分层抽样来计算。计算。等距抽样的抽样平均误差等距抽样的抽样平均误差等距抽样的抽样平均误差估计比较复杂。等距抽样的抽样平均误差估计比较复杂。一般按以下方法近似计算。一般按以下方法近似计算。7/12/202456统计学第8章抽样调查理论与方法等距抽样抽样平均误差的计算等距抽样抽样平均误差的计算F按无关标志排队按无关标志排队一、在重复抽样条件下:一、在重复抽样条件下:二、在不重复抽样条件下:二、在不重复抽样条件下:7/12/202457统计学第8章抽样调查理论与方法F按有关标志排队按有关标志排队一、在重复抽样条件下:一、在重复抽样条件下:二、在不重复抽样条件下:二、在不重复抽样条件下:在等距系统抽样时,每个组内只抽取一个单元,因此在等距系统抽样时,每个组内只抽取一个单元,因此 ,从而从而所以,所以,7/12/202458统计学第8章抽样调查理论与方法8.4.5整群抽样整群抽样(cluster sampling)F将将总总体体中中若若干干个个单单位位合合并并为为组组(群群),抽抽样样时时直直接接抽抽取取群群,然然后后对对中中选选群群中中的的所所有有单单位位全部实施调查全部实施调查F特点特点抽样时只需群的抽样框,可简化工作量抽样时只需群的抽样框,可简化工作量调调查查的的地地点点相相对对集集中中,节节省省调调查查费费用用,方方便便调调查的实施查的实施缺点是估计的精度较差缺点是估计的精度较差7/12/202459统计学第8章抽样调查理论与方法例:例:例:例:总体群数总体群数总体群数总体群数R=16 R=16 样本群数样本群数样本群数样本群数r=4r=4ABCDEFGHIJKLMNOPIHPD样本容量样本容量简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差7/12/202460统计学第8章抽样调查理论与方法整群抽样的抽样平均误差整群抽样的抽样平均误差1、抽样平均数的平均误差、抽样平均数的平均误差2、抽样成数的平均误差、抽样成数的平均误差整群抽样整群抽样一般都采用不重复抽样方法。因此,在一般都采用不重复抽样方法。因此,在计算抽样误差时要使用修正系数。计算抽样误差时要使用修正系数。7/12/202461统计学第8章抽样调查理论与方法8.5 样本容量的确定样本容量的确定 F8.5.1影响样本容量确定的主要因素影响样本容量确定的主要因素F8.5.2确定抽样单元数的方法确定抽样单元数的方法7/12/202462统计学第8章抽样调查理论与方法8.5.1影响样本容量确定的主要因素影响样本容量确定的主要因素F总体被研究标志的变异程度总体被研究标志的变异程度 F调查者对推断精确度的要求调查者对推断精确度的要求F抽样调查的方式和方法抽样调查的方式和方法F人力、物力和财力的允许条件人力、物力和财力的允许条件 7/12/202463统计学第8章抽样调查理论与方法8.5.2确定抽样单元数的方法确定抽样单元数的方法(一)简单随机抽样 重复抽样 不重复抽样 7/12/202464统计学第8章抽样调查理论与方法8.5.2确定抽样单元数的方法确定抽样单元数的方法(二)分层抽样 重复抽样 不重复抽样 7/12/202465统计学第8章抽样调查理论与方法8.5.2确定抽样单元数的方法确定抽样单元数的方法(三)整群抽样 由于整群抽样一般为不重复抽样,所以按不重复抽样计算必要抽样群数 不重复抽样 7/12/202466统计学第8章抽样调查理论与方法 等距抽样的抽样数目,在有总体差异等距抽样的抽样数目,在有总体差异程度和比重的全面资料时,可采用类型抽程度和比重的全面资料时,可采用类型抽样的公式;没有总体的全面资料时,可采样的公式;没有总体的全面资料时,可采用简单随机抽样的公式。用简单随机抽样的公式。7/12/202467统计学第8章抽样调查理论与方法建筑工地打土方工人建筑工地打土方工人40004000人,需测定平均每人工作量,要求误差人,需测定平均每人工作量,要求误差范围不超过范围不超过0.2M0.2M3 3,并需有,并需有99.73%99.73%保证程度。根据过去资料保证程度。根据过去资料=1.5=1.5,求样本数应是多少?,求样本数应是多少?例例1 17/12/202468统计学第8章抽样调查理论与方法 某金笔厂月产某金笔厂月产1000010000支金笔,以前多次抽样调查一等品率为支金笔,以前多次抽样调查一等品率为90%90%,现在要求误差范围在,现在要求误差范围在2%2%之内,可靠程度达之内,可靠程度达95.45%95.45%,问必须抽,问必须抽取多少单位数?取多少单位数?例例2 27/12/202469统计学第8章抽样调查理论与方法本章小结本章小结 本章介绍了抽样调查的分类、作用和应用领域以及抽样调本章介绍了抽样调查的分类、作用和应用领域以及抽样调查中涉及的基本概念和基本方法。主要分析了抽样调查中误查中涉及的基本概念和基本方法。主要分析了抽样调查中误差的来源和不同概率抽样误差的计算方法以及样本容量的确差的来源和不同概率抽样误差的计算方法以及样本容量的确定问题。定问题。抽样调查抽样调查分为非概率抽样和概率抽样。非概率抽样有便利分为非概率抽样和概率抽样。非概率抽样有便利抽样、判断抽样、配额抽样和雪球抽样四种方法。概率抽样抽样、判断抽样、配额抽样和雪球抽样四种方法。概率抽样又称为随机抽样,有简单随机抽样、分层抽样、系统抽样和又称为随机抽样,有简单随机抽样、分层抽样、系统抽样和整群抽样等抽样方法,这些抽样方法各有优缺点,在实践中整群抽样等抽样方法,这些抽样方法各有优缺点,在实践中被广泛采用。被广泛采用。7/12/202470统计学第8章抽样调查理论与方法 抽样调查中涉及的抽样调查中涉及的基本概念基本概念有总体有总体 与样本、总体参数与统计量、抽样单元与样本、总体参数与统计量、抽样单元与抽样框、抽样方法与样本可能数目、与抽样框、抽样方法与样本可能数目、精度与费用。精度与费用。7/12/202471统计学第8章抽样调查理论与方法 抽样误差抽样误差是由于用样本估计总体而产生的误差,是由于用样本估计总体而产生的误差,它直接关系到抽样的精度。如果抽样误差大,抽样它直接关系到抽样的精度。如果抽样误差大,抽样推断的精度就会低,所以要合理地控制抽样误差。推断的精度就会低,所以要合理地控制抽样误差。而正确反映抽样误差的指标是抽样平均误差。至于而正确反映抽样误差的指标是抽样平均误差。至于如何合理地控制抽样误差,要以一定的抽样概率如何合理地控制抽样误差,要以一定的抽样概率(置信度)作保证,才能使误差不超过某一给定的(置信度)作保证,才能使误差不超过某一给定的范围,这个给定的范围叫做抽样极限误差。如果置范围,这个给定的范围叫做抽样极限误差。如果置信度越大,相应的极限误差就越大,抽样推断的精信度越大,相应的极限误差就越大,抽样推断的精度就越低。极限误差等于度就越低。极限误差等于 值和抽样平均误差的值和抽样平均误差的乘积。乘积。7/12/202472统计学第8章抽样调查理论与方法 抽样平均误差抽样平均误差的计算首先要考虑抽样的的计算首先要考虑抽样的方法。一般说来,重复抽样的误差要大于不方法。一般说来,重复抽样的误差要大于不重复抽样的误差,所以,为了达到和不重复重复抽样的误差,所以,为了达到和不重复抽样相同的抽样精度,就要多抽样本容量;抽样相同的抽样精度,就要多抽样本容量;其次还要考虑不同的概率抽样方式,即简单其次还要考虑不同的概率抽样方式,即简单随机抽样、分层抽样、系统抽样和整群抽样随机抽样、分层抽样、系统抽样和整群抽样等(本章主要讲解简单随机抽样),抽样方等(本章主要讲解简单随机抽样),抽样方式不同,抽样平均误差的计算结果就不一样,式不同,抽样平均误差的计算结果就不一样,抽样效率就会不同。抽样效率就会不同。7/12/202473统计学第8章抽样调查理论与方法 样本容量样本容量是决定抽样误差大小的因是决定抽样误差大小的因素,样本容量愈大,抽样误差就愈小,素,样本容量愈大,抽样误差就愈小,估计量的精度就愈高,所以要合理确定估计量的精度就愈高,所以要合理确定必要的样本容量。必要的样本容量。7/12/202474统计学第8章抽样调查理论与方法案例:对某高校大学生月消费水平调查案例:对某高校大学生月消费水平调查 随着我国社会和经济的飞速发展,大学生的学习随着我国社会和经济的飞速发展,大学生的学习和生活条件有了较大改善,他们的消费水平正在发生和生活条件有了较大改善,他们的消费水平正在发生着巨大的改变。因此,当代大学生成为了一个特殊而着巨大的改变。因此,当代大学生成为了一个特殊而又庞大的消费群体,由于大学生年龄较轻,群体较特又庞大的消费群体,由于大学生年龄较轻,群体较特别,他们有着不同于社会其他消费群体的消费心里和别,他们有着不同于社会其他消费群体的消费心里和消费行为。一方面,他们有着旺盛的消费需求;另一消费行为。一方面,他们有着旺盛的消费需求;另一方面,他们尚未获得经济上的独立,消费受到很大的方面,他们尚未获得经济上的独立,消费受到很大的制约。因此,制约。因此,2009年年9月组织了一次对某高校大学生月组织了一次对某高校大学生月消费水平的调查。月消费水平的调查。7/12/202475统计学第8章抽样调查理论与方法 本次对大学生消费水平的调查目的是:本次对大学生消费水平的调查目的是:1.了解当代大学生的生活状况,尤其是在物价不了解当代大学生的生活状况,尤其是在物价不断上涨的今天,大学生的实际生活水平;断上涨的今天,大学生的实际生活水平;2.了了解大学生的消费行为。大学生的消费行为是社解大学生的消费行为。大学生的消费行为是社会、学校和家长普遍关心的问题,因为,一般会、学校和家长普遍关心的问题,因为,一般情况下消费水平决定着人们的消费行为和消费情况下消费水平决定着人们的消费行为和消费结果,并在社会和文化意义上影响着对人的塑结果,并在社会和文化意义上影响着对人的塑造,需要适当地加以引导;造,需要适当地加以引导;3.了解大学生的经了解大学生的经济来源以及消费的经济基础。济来源以及消费的经济基础。调查采用简单随机抽样的方法,从全校调查采用简单随机抽样的方法,从全校所有大学生中抽取了名进行调查,他们的月消所有大学生中抽取了名进行调查,他们的月消费水平结果如表费水平结果如表8.13所示:所示:7/12/202476统计学第8章抽样调查理论与方法问题:问题:通过计算名大学生月消费水平的平均数和标准通过计算名大学生月消费水平的平均数和标准差,就可以得出抽样平均误差,并在一定概率保证差,就可以得出抽样平均误差,并在一定概率保证下,推断出全校大学生的月消费水平。下,推断出全校大学生的月消费水平。1.给出全校大学生月消费水平在的置信区间,并给出全校大学生月消费水平在的置信区间,并讨论这一置信区间的含义。讨论这一置信区间的含义。2.评价在本次调查中采用简单随机抽样的优缺点。评价在本次调查中采用简单随机抽样的优缺点。3.除了简单随机抽样方法,能否应用其它的抽样方除了简单随机抽样方法,能否应用其它的抽样方法进行调查?这些方法有什么特点?法进行调查?这些方法有什么特点?7/12/202477统计学第8章抽样调查理论与方法This is the END7/12/202478统计学第8章抽样调查理论与方法
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!