抽样推断-课件

上传人:风*** 文档编号:242660763 上传时间:2024-08-30 格式:PPT 页数:125 大小:1.28MB
返回 下载 相关 举报
抽样推断-课件_第1页
第1页 / 共125页
抽样推断-课件_第2页
第2页 / 共125页
抽样推断-课件_第3页
第3页 / 共125页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,STAT,第八章 抽样推断,抽样估计的现实应用,例,1,一汽车轮胎制造商生产一种被认为,寿命更长的新型轮胎,。,120,个,样本,测试,平均里程:,36,500,公里,推断,新轮胎,平均寿命,:,36,500,公里,400,个,样本,支持人数:,160,推断,支持该候选人的选民,占全部选民的比例:,160/400=40%,例,2,:,某党派想支持某一候选人参选美国某州议员,为了决定是否支持该候选人,该党派领导需要估计,支持该候选人的民众占全部登记投票人总数的比例,。由于时间及财力的限制:,抽样估计的现实应用例1 一汽车轮胎制造商生产一种被认为寿命,第七章 抽样推断,第一节 抽样推断的基础理论,第二节 抽样误差,第三节 抽样估计,第四节 样本容量的确定,第七章 抽样推断第一节 抽样推断的基础理论,第一节 抽样估计的意义,一、抽样估计的定义,二、抽样估计的特点,三、抽样估计的运用,四、抽样估计的一般步骤,第一节 抽样估计的意义一、抽样估计的定义,指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会,抽样估计,按照,随机原则,从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出,具有一定可靠程度,的估计与推断,从而,认识总体,的一种统计方法,指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体,统计推断,全及总体指标:,参数(未知量),样本总体指标:,统计量(已知量),抽样估计,统计推断全及总体指标:参数(未知量)样本总体指标:统计量(已,并非所有的抽样估计都按随机原,则抽取样本,也有,非随机抽样,总体,随机样本,非随机样本,与总体分布特征相同,与总体分布特征不同,并非所有的抽样估计都按随机原总体随机样本非随机样本与总体分布,按随机原则抽取样本单位,目的是推断总体的数量特征,抽样推断的结果具有一定的可靠程度,抽样误差可以事先计算并控制,抽样估计的特点,按随机原则抽取样本单位抽样估计的特点,不可能进行全面调查时,不必要进行全面调查时,来不及进行全面调查时,对全面调查资料进行补充修正时,抽样估计的适用范围,不可能进行全面调查时抽样估计的适用范围,设,计,抽,样,方,案,抽,取,样,本,单,位,收,集,样,本,数,据,计,算,样,本,统,计,量,推,断,总,体,参,数,抽样估计的一般步骤,设抽收计推抽样估计的一般步骤,第二节 抽样调查的基本概念及理论依据,一、全及总体和抽样总体,二、全及指标和抽样指标,三、抽样方法和样本的可能数目,四、 抽样调查的理论依据,第二节 抽样调查的基本概念及理论依据一、全及总体和抽样总体,全及总体,研究对象的全体,即第一章中学过的总体。,抽样总体,按随机原则从全及总体中抽取一部分单位组成的集合体,又叫抽样总体。,样本总体中所包括的单位数叫样本容量,一般用,n,表示,1,、大样本(,n30 2,、小样本,(n30,),全及总体中所包括的单位数一般用,N,表示。,1,、有限总体,2,、无限总体,全及总体研究对象的全体,即第一章中学过的总体。抽样总体,设总体中 个总体单位某项标志的标志值分别,为 ,其中具有某种属性的有 个,单位,不具有某种属性的有 个单位,则,总体平均数(又叫总体均值):,指被估计的总体指标,又被称为,总体参数,全及指标,设总体中 个总体单位某项标志的标志值分别 总体平均数,总体标准差:,总体方差:, 总体标准差: 总体方差:,总体成数:,总体是非标志的标准差:,总体是非标志的方差:, 总体成数: 总体是非标志的标准差: 总体是非标志的方,设样本中 个样本单位某项标志的标志值,分别为 ,其中具有和不具有某,种属性的样本单位数目分别为 和 个,则,样本平均数(又叫样本均值):,指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合指标,又被称为,估计量或统计量,样本指标,设样本中 个样本单位某项标志的标志值 样本平均数(又,样本单位标志值的标准差:,样本单位标志值的方差:,为自由度,为 的无偏估计,为 的无偏估计, 样本单位标志值的标准差: 样本单位标志值的方差:为自由,样本成数:,样本单位是非标志的标准差:,样本单位是非标志的方差:,为 的,无偏估计,为 的,无偏估计, 样本成数: 样本单位是非标志的标准差: 样本单位是非,当样本容量很大时,,1/n,与,1/(n-1),相差不大,样本方差的分式,可以直接除以,n,与总本的方差计算分式保持一致。,当样本容量很大时,1/n,与1/(n-1)相差不大,样本方差,例,3,:,某大公司人事部经理整理其,2500,个中层干部的档案。其中一项内容是考察这些中层干部的,平均年薪,及,参加过公司培训计划的比例,。,总体:,2500,名中层干部,如果:,上述情况可由每个人的个人档案中得知,可容易地测出这,2500,名中层干部的平均年薪及标准差。,假如,:,1,:,已经得到了如下的结果:,总体均值,:,=51800,总体标准差,:,=,4000,例3:某大公司人事部经理整理其2500个中层干部的档案。其中,参数,是总体的,数值特征,上述,总体均值,、,总体标准差,、,比例,均称为总体的,参数,2,、,同时,有,1500,人参加了公司培训,,则,参加公司培训计划的,比例,为:,P =,1500/2500=0.60,如:,例,3,中的中层干部,平均年薪,,,年薪标准差,及,受培训人数所占比例,均为该公司中层干部这一总体的参数。,抽样估计,就是要通过样本而非总体来估计总体参数,。,参数是总体的数值特征 上述总体均值、总体,假如随机抽取了一个容量为,30,的样本:,工资 是否参加培训,49094.3 Yes,53263.9 Yes,49643.5 Yes, ,假如,根据该样本求得的,年薪样本,平均数,、,标准差,及,参加过培训计划人数的,比例,分别为:,假如随机抽取了一个容量为30的样本: 假如根据该样本求,抽样方法,重复抽样,又被称作重置抽样、有放回抽样,继续,抽取,抽出,个体,登记,特征,放回,总体,特点,同一总体单位有可能被重复抽中,而且每次抽取都是独立进行,抽样方法重复抽样又被称作重置抽样、有放回抽样继续抽出登记放回,不重复抽样,又被称作不重置抽样、不放回抽样,抽出,个体,登记,特征,继续,抽取,特点,同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行,是最为常用的抽样方法,用于无限总,体和许多有限总体样本单位的抽样。,抽样方法,不重复抽样又被称作不重置抽样、不放回抽样抽出登记继续特点同一,对样本的要求不同,考虑顺序的抽样,ABBA,不考虑顺序的抽样,AB=BA,两种分类交叉,考虑顺序的重复抽样,考虑顺序的不重复抽样,不考虑顺序的重复抽样,不考虑顺序的不重复抽样,对样本的要求不同考虑顺序的抽样 ABBA不考虑顺序,例:从,A,、,B,、,C,、,D,四个工人中随机抽取二人组成一样本,可能的样本是:,考虑顺序的重复抽样 考虑顺序的不重复抽样,AA AB AC AD AA AB AC AD,BA BB BC BD BA BB BC BD,CA CB CC CD CA CB CC CD,DA DB DC DD DA DB DC DD,不考虑顺序的重复抽样 不考虑顺序的不重复抽样,AA AB AC AD AA AB AC AD,BA BB BC BD BA BB BC BD,CA CB CC CD CA CB CC CD,DA DB DC DD DA DB DC DD,例:从A、B、C、D四个工人中随机抽取二人组成一样本,可能的,第八章 抽样推断,1.1,抽样方案的设计,1.2,简单随机抽样的抽样误差的测定,1.3,简单随机抽样的抽样估计,第八章 抽样推断1.1 抽样方案的设计,一、抽样误差的概念,二、抽样平均误差,三、抽样极限误差,第三节,抽样平均误差,一、抽样误差的概念第三节 抽样平均误差,说,明,对于任何一个样本,,其抽样误差都不可能测量出来,抽样误差的大小可以依据概率分布理论加以说明,指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不包括登记性误差和系统偏差,抽样误差,说对于任何一个样本,其抽样误差都不可能测量出来指样本估计量与,某个样本容量的抽样分布,更大样本容量的抽样分布,某个样本容量的抽样分布更大样本容量的抽样分布,抽样平均,误差,根据所有可能样本的样平均数或样本成数计算的标准差,即每一次抽样的样本指标和总体指标之间的平均差异程度。,即样本估计量的标准差,式中: 为样本平均数的抽样平均误差; 为可能的样本数目; 为第 个可能样本的平均数; 为总体平均数,注意:不要混淆抽样,平均误差与样本标准差!,抽样平均根据所有可能样本的样平均数或样本成数计算的标准差,即,例:有,4,个工人,月产量分别为,40,,,50,,,70,,,80,,这一总体平均数和标准差为:,总体平均数,标准差,例:有4个工人,月产量分别为40,50,70,80,这一总体,现用重复抽样的方法从,4,人中抽取,2,人构成样本,求样本的平均数,用以代表,4,人总体的平均水平,所有可能的样本及样本的平均工资列表如下:,现用重复抽样的方法从4人中抽取2人构成样本,求样本的平均数,,样本平均数的平均数:,抽样平均误差,样本平均数的平均数:,抽样平均误差的计算公式,样本平均数的抽样平均误差,当,N500,时,有,重复抽样时:,不重复抽样时:,抽样平均误差的计算公式 样本平均数的抽样平均误差当N50,样本成数的抽样平均误差,重复抽样时:,不重复抽样时:,当,N500,时,有,抽样平均误差的计算公式, 样本成数的抽样平均误差重复抽样时:不重复抽样时:当N5,关于总体方差的估计方法,用过去同类问题全面调查或抽样调查的经验数据代替;,用样本标准差 代替总体标准差 ,用 代替 。,抽样平均误差的计算公式,关于总体方差的估计方法用过去同类问题全面调查或抽样调查的经验,影响抽样误差的因素,总体各单位的差异程度(即标准差的大小):,越大,抽样误差越大;,样本单位数的多少:,越大,抽样误差越小;,抽样方法:,不重复抽样的抽样误差比重复抽样的抽样误差小;,抽样组织方式:,简单随机抽样的误差最大。,影响抽样误差的因素总体各单位的差异程度(即标准差的大小):,练习,1,、对某乡进行简单重复抽样调查,抽出,100,个农户,户均年收入,2000,元,年收入标准差,100,元,求抽样平均误差。若抽取的是,200,户,则抽样平均误差以是多少。若要使抽样平均误差降低为原来的一半,则应抽多少户。,2,、对某县人口用不重复抽样方法按,1/10,比例抽出,1,万人进行调查,得知样本平均年龄,40,岁,年龄标准差,20,岁,求抽样平均误差。,3,、某县人口,10,万人,用简单随机不重复抽样方法抽取,1/10,的人口进行调查,得知男性人口比重为,51%,,求男性人口比重的抽样平均误差。,4,、对某乡进行简单随机重复抽样调查,抽出,100,个农户进行调查,得知年收入在,1800,元以上的占,95%,,求农户年收入在,1800,元以上比重的抽样平均误差。,练习1、对某乡进行简单重复抽样调查,抽出100个农户,户均年,抽样极限,误差,指在一定的概率保证程度下,抽样误差不允许超过的某一给定范围,也称作,允许误差、误差范围、误差置信限,等,注意:,1,、统计学上往往用,抽样极限误差,来测度抽样误差的大小或者说测度点估计的精度。,原因:,总体参数值往往并不知道,因此,,实际抽样误差,与,抽样平均误差,也往往无法求出,但在抽样分布大体知道的情况下,,抽样极限误差,是可以估计出来的。,抽样极限指在一定的概率保证程度下,抽样误差不允许超过的某一给,2,、抽样极限误差的估计总是要和一定的概率保证程度联系在一起的。,原因:,样本统计量往往是一随机变量,它与总体参数真值之差也是一个随机变量,因此就不能期望某次抽样的样本估计值落在一定区间内是一个必然事件,而只能给予一定的概率保证。,因此,,在进行抽样估计时,既需要考虑抽样误差的,可能范围,,同时还需考虑落到这一范围的,概率大小,。,前者是,估计的准确度,问题,后者是,估计的可靠性,问题,两者紧密联系不可分开。这也正是区间估计所关心的主要问题。,2、抽样极限误差的估计总是要和一定的概率保,平均产量的分布如下:,平均产量的分布如下:,实际计算中一般不直接计算概率保证程度,,由于 ,,样本平均数的极限误差:,样本成数的极限误差:,所以抽样极限误差是概率度,t,的函数,t,为概率度,是给定概率保证程度下样本均值,偏离总体均值的抽样平均误差的倍数。,实际计算中一般不直接计算概率保证程度,样本平均数,据中心极限定理,当总体为正态或总体非正态但,n30,时,样本均值的分布趋近于正态分布;,当,n,足够大时,样本成数的分布近似为正态分布。,令,据中心极限定理,当总体为正态或总体非,平均数的抽样分布,全部可能样本平均数的均值等于总体均值,即:,从非正态总体中抽取的样本平均数当,n,足够大时其分布接近正态分布。,从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。,样本均值的标准差为总体标准差的,平均数的抽样分布全部可能样本平均数的均值等于总体均值,即:,成数的抽样分布,全部可能样本成数的均值等于总体比率,即:,从非正态总体中抽取的样本成数,当,n,足够大时其分布接近正态分布。,从正态总体中抽取的样本成数,不论容量大小其分布均为正态分布。,样本成数的标准差为总体标准差的,成数的抽样分布全部可能样本成数的均值等于总体比率,即:,样本抽样分布,原总体分布,样本抽样分布原总体分布,抽样推断-课件,t,与相应的概率保证程度存在一一对应关系,,常用,t,值及相应的概率保证程度为:,t,值 概率保证程度,1.00 0.6827,1.65 0.9000,1.96 0.9500,2.00 0.9545,2.58 0.9900,3.00 0.9973,在实际中,一般将这种对应函数关系编成,正态概率表,供直接查用,(大样本条件下),t与相应的概率保证程度存在一一对应关系,常用t值及相应的概率,68.27%,95.45%,99.73%,68.27%95.45%99.73%,估计的准确度,和,估计的可靠性,问题,由于提高把握程度,会增大允许误差,,使估计精度降低,而缩小允许误差,,提高估计的精度,又会降低估计的把握程度,,所以在实际中应根据具体情况,先确定一个合理的把握程度再求相应的允许误差或先确定一个允许误差范围再求相应的把握程度。,估计的准确度和估计的可靠性问题 由于提高把握,抽样估计量的优良标准,设为待估计的总体参数, 为样本统计量,则的优良标准为:,若,则称为的无偏估计量,指样本指标的均值应等于被估计的总体指标,无偏性,第四节 全及指标的推断,抽样估计量的优良标准设为待估计的总体参数, 为样本统计量,若,则称为比更有效的估计量,作为优良的估计量,除了满足无偏性的要求外,其方差应比较小,有效性,指随着样本单位数 的增大,样本估计量将在概率意义下越来越接近于总体真实值,一致性,抽样估计量的优良标准,若对于任意,0,,有,若,则称为比更有效的估计量作为优良的估计量,除了,为的无偏、有效、一致估计量;,为的无偏、有效、一致估计量;,为的无偏、有效、一致估计量。,数理统计证明:,抽样估计量的优良标准,为的无偏、有效、一致估计量;数理统计证明:抽样估,点估计,指直接以样本指标来估计总体指标,也叫,定值估计,简单,具体明确,优点,缺点,无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况,点估计指直接以样本指标来估计总体指标,也叫定值估计简单,具体,区间估计,指根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范围;其中,被推断的总体指标的下限与上限所包括的区间称为,置信区间,,估计的可靠程度也称为,置信度。,(这里只讨论常用的大样本的情况),区间估计指根据样本指标和抽样极限误差以一定的可靠程度推断总体,区间估计原理,0.6827,落在范围内的概率为,68.27%,样本抽样分布曲线,原总体分布曲线,区间估计原理0.6827落在范围内的概率为68.27,区间估计原理,0.9545,落在范围内的概率为,95.45%,样本抽样分布曲线,原总体分布曲线,区间估计原理0.9545落在范围内的概率为95.45,区间估计原理,0.9973,落在范围内的概率为,99.73%,样本抽样分布曲线,总体分布曲线,区间估计原理 0.9973落在范围内的概率为,总体平均数的区间估计,表,达,式,其中, 为极限误差,总体平均数的区间估计表其中,,步,骤,计算样本平均数 ;,搜集总体方差的经验数据 ;或计算样本标准差 ,,总体平均数的区间估计,计算抽样平均误差:,重复抽样时,不重复抽样时:,步 计算样本平均数 ; 搜集总体方差的经验,步,骤,计算抽样极限误差:,确定总体平均数的置信区间:,总体平均数的区间估计,步 计算抽样极限误差: 确定总体平均数的置信区间:总体平,总体成数的区间估计,表,达,式,其中, 为极限误差,总体成数的区间估计表其中,,步,骤,计算样本成数 ;,搜集总体方差的经验数据 ;,计算抽样平均误差:,重复抽样条件下,不重复抽样条件下,总体成数的区间估计,步 计算样本成数 ; 搜集总体方,步,骤,计算抽样极限误差:,确定总体成数的置信区间:,总体成数的区间估计,步 计算抽样极限误差: 确定总体成数的置信区间:总体成数,1,、按照质量要求,灯泡使用寿命在,1000,小时以上为合格品试,以,95.45%,的概率保证度估计该批灯泡的耐用时数和合格率;,2,、试以,99%,的概率保证程度估计计该批灯泡的而用时数和合格率。,例:某灯泡厂对,10000,个产品进行使用寿命检验,随机不重复抽取,2%,的样本进行测试。所得资料如下:,1、按照质量要求,灯泡使用寿命在1000小时以上为合格品试,,抽样推断-课件,抽样推断-课件,因此,该批灯泡的使用寿命在,1049.49-1064.51,之间,其概率保证度为,95.45%,因此,该批灯泡的使用寿命在1049.49,抽样推断-课件,因此,该批灯泡的合格率在,87.6%-95.4%,之间,其概率保证度为,95.45%,因此,该批灯泡的合格率在87.6%-95.4%之间,其概率保,1,、,若允许的误差范围为,10,小时,,试估计该批灯泡的耐用时数;,2,、按照质量要求,灯泡使用寿命在,1000,小时以上为合格品,,要求合格率误差不超过,3%,,试估计该批灯泡的合格率。,例:某灯泡厂对,10000,个产品进行使用寿命检验,随机重复抽取,2%,的样本进行测试。所得资料如下:,1、若允许的误差范围为10小时,试估计该批灯泡的耐用时数;,抽样推断-课件,抽样推断-课件,因此,该批灯泡的使用寿命在,1047-1067,之间,其概率保证度为,99.17%,因此,该批灯泡的使用寿命在1047-1067之间,其概率保证,抽样推断-课件,因此,该批灯泡的合格率在,88.5%-94.5%,之间,其概率保证度为,87.15%,因此,该批灯泡的合格率在88.5%-94.5%之间,其概率保,作业:,某企业生产某种产品的工人有,1000,人,某日采用不重复抽样从中随机抽取,100,人调查他们的当日产量,要求:,1,、在,95,的概率保证程度下,,估计该厂全部工人的日平均产量和日总产量,。,2,、若工人日产量在,118,件以上者为完成生产定额任务,要求在,95,的概率保证程度下,,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。,作业:某企业生产某种产品的工人有1000人,某日采用不重复抽,100,名工人的日产量分组资料,100名工人的日产量分组资料,100,名工人的日产量分组资料,100名工人的日产量分组资料,解:,解:,则该企业工人人均产量 及日总产量 的置信区间为:,即该企业工人人均产量在,124.797,至,127.203,件之间,其日总产量在,124797,至,127303,件之间,估计的可靠程度为,95,。,则该企业工人人均产量 及日总产量 的,100,名工人的日产量分组资料,完成定额的人数,100名工人的日产量分组资料完成定额的人数,解:,解:,则该企业全部工人中完成定额的工人比重 及完成定额的工人总数 的置信区间为:,即该企业工人中完成定额的工人比重在,0.8432,至,0.9568,之间,完成定额的工人总数在,843.2,至,956.8,人之间,估计的可靠程度为,95,。,则该企业全部工人中完成定额的工人比重 及完成定额的工人总数,样本容量,调查误差,调查费用,小样本容量节省费用但调查误差大,大样本容量调查精度高但费用较大,找出在规定误差范围内的最小样本容量,确定样本容量的意义,找出在限定费用范围内的最大样本容量,样本容量调查误差调查费用小样本容量节省费用但调查误差大大样本,确,定,方,法,推断总体平均数所需的样本容量,重复抽样条件下:,通常的做法是先确定置信度,然后限定抽样极限误差。,或,S,通常未知。一般按以下方法确定其估计值:过去的经验数据;试验调查样本的,S,。,计算结果通常向上进位,确推断总体平均数所需的样本容量 重复抽样条件下:通常的做法,不重复抽样条件下:,确,定,方,法,推断总体平均数所需的样本容量, 不重复抽样条件下:确推断总体平均数所需的样本容量,【,例,A】,某食品厂要检验本月生产的,10000,袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为,25,克。要求在,95.45,的概率保证程度下,平均每袋重量的误差范围不超过,5,克,应抽查多少袋产品?,【例A】某食品厂要检验本月生产的10000袋某产品的重量,根,解:,解:,确,定,方,法,推断总体成数所需的样本容量,重复抽样条件下:,通常的做法是先确定置信度,然后限定抽样极限误差。,计算结果通常向上进位,通常未知。一般按以下方法确定其估计值:过去的经验数据;试验调查样本的 ;取方差的最大值,0.25,。,确推断总体成数所需的样本容量 重复抽样条件下:通常的做法是,不重复抽样条件下:,确,定,方,法,推断总体成数所需的样本容量, 不重复抽样条件下:确推断总体成数所需的样本容量,【,例,B】,某企业对一批总数为,5000,件的产品进行质量检查,过去几次同类调查所得的产品合格率为,93,、,95,、,96,,为了使合格率的允许误差不超过,3,,在,99.73,的概率保证程度下,应抽查多少件产品?,【,分析,】,因为共有三个过去的合格率的,资料,为保证推断的把握程度,应选其,中方差最大者,即,P=93,。,【例B】某企业对一批总数为5000件的产品进行质量检查,过去,解:,解:,必要样本容量的影响因素,总体方差的大小;,允许误差范围的大小;,概率保证程度;,抽样方法;,抽样的组织方式。,重复抽样条件下:,不重复抽样条件下:,必要样本容量的影响因素总体方差的大小;重复抽样条件下:不重复,抽样复查的方法,其全面调查时的登记结果为,2.2861,亿元,其抽样复查的结果为,2.1734,亿元,随机抽取,五个下属单位,修正系数为,则:,该企业集团所拥有的固定资产原值应为,16.8510.9507=16.020,(亿元),所拥有固定资产,原值的普查结果为,16.851,亿元,某企业集团,总体,抽样复查的方法其全面调查时的登记结果为2.2861亿元其抽样,第五节,抽样方案的设计,一、抽样方案设计的基本准则,二、抽样方案设计的主要内容,第五节 抽样方案的设计,随机原则,抽取样本单位时,应确保每个总体单位都有被抽取的可能;在对样本单位的资料进行搜集和整理时,不能随意遗漏或更换样本单位,抽样误差最小,在其他条件相同的情况下,选抽样误差最小的方案,费用最少,在其他条件相同的情况下,选费用最少的方案,设计抽样方案时,通常是,在误差达到一定要求的条,件下,选择费用最少的方案,抽样方案设计的基本准则, 随机原则抽取样本单位时,应确保每个总体单位都有被抽取,第五节,抽样方案的设计,一、抽样方案设计的基本准则,二、抽样方案设计的主要内容,第五节 抽样方案的设计,抽样框,指包括全部抽样单位的名单框架,仅对有限总体而言,主要形式,名单抽样框,区域抽样框,时间表抽样框,编制抽样框,抽样框指包括全部抽样单位的名单框架,仅对有限总体而言主要形式,确定抽样方法,重复抽样,又被称作重置抽样、有放回抽样,不重复抽样,又被称作不重置抽样、不放回抽样,确定抽样方法重复抽样又被称作重置抽样、有放回抽样不重复抽样又,确定抽样组织方式,1,简单随机抽样(纯随机抽样),对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本,应用,仅适用于规模不大、内部各单位标志值差异较小的总体,是最简单、最基本、最符合随机原则,,但同时也是抽样误差最大的抽样组织形式,确定抽样组织方式1 简单随机抽样(纯随机抽样)对总体单,2,类型抽样(分层抽样),将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位组成样本。,总体,N,样本,n,等额抽取,等比例抽取,能使样本结构更接近于总体结构,提高样本的,代表性;能同时推断总体指标和各子总体的指标,确定抽样组织方式,2 类型抽样(分层抽样)将总体全部单位分类,形成若干个,类型抽样的抽样平均误差,类型抽样的抽样平均误差,抽样推断-课件,某农场种小麦,12000,公顷,其中平原,3600,公顷,丘陵,6000,公顷,山地,2400,公顷,现用类型抽样法调查,1200,公顷,以各种麦田占全农场面积的比重分配抽样面积数量。,麦田类型抽样的平均误差计算表,例,某农场种小麦12000公顷,其中平原3600公顷,抽样推断-课件,高产麦田比重的平均误差计算表,高产麦田比重的平均误差计算表,3,等距抽样(机械抽样或系统抽样),将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。,随机起点,半距起点,对称起点,(总体单位按某一标志排序),按无关标志排队,其抽样效果相当于,简单随机抽样,;按有关标志排队,其抽样效果相当于,类型抽样,。,确定抽样组织方式,3 等距抽样(机械抽样或系统抽样)将总体单位按某一标志,1.,若,按无关标志排队,公式用以上纯随机抽样的公式,一般采用,不重复抽样公式:,机械抽样,(,等距抽样,),的抽样平均误差,1.若按无关标志排队公式用以上纯随机抽样的公式,一般采用机械,2.,若,按有关标志排队,公式用类型抽样的公式:,2. 若按有关标志排队公式用类型抽样的公式:,4,整群抽样(集团抽样),将总体全部单位分为若干,“群”,,然后随机抽取一部分,“群”,,被抽中群体的所有单位构成样本,例:总体群数,R=16,样本群数,r=4,A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,L,H,P,D,样本容量,简单、方便,能节省人力、物力、财,力和时间,但其样本代表性可能较差,确定抽样组织方式,4 整群抽样(集团抽样) 将总体全部单位分为若干“群”,整群抽样的抽样平均误差,整群抽样的抽样平均误差受三个因素影响:,(1),抽,出的群数,(r),多少,(,反比关系,),(2),群,间方差,( ) (,正比关系,),整群抽样的抽样平均误差 整群抽样的抽样平均误差受三个因素影响,计算方法如下:,计算方法如下:,(3),抽,样方法,(3) 抽样方法,假如某一机器大量生产某一种零件,现每隔一小时抽取,5,分钟产品进行检验,用以检查产品的合格率,检查结果如下:,例,假如某一机器大量生产某一种零件,现每隔一小时抽取5分钟产,以上抽样平均误差的公式归纳如下:,以上抽样平均误差的公式归纳如下:,5,多阶段抽样,指分两个或两个以上的阶段来完成抽取样本单位的过程,例:在某省,100,多万农户抽取,1000,户调查农户生产性投资情况。,第一阶段:从该省所有县中抽取,5,个县,第二阶段:从被抽中的,5,个县中各抽,4,个乡,第三阶段:从被抽中的,20,个乡中各抽,5,个村,第四阶段:从被抽中的,100,个村中各抽,10,户,样本,n=10010=1000(,户,),确定抽样组织方式,5多阶段抽样 指分两个或两个以上的阶段来完成抽取样本单,调查对象的性质特点,对调查对象的了解程度(抽样框的特点),抽样误差的大小,人力、财力和物力等条件的限制,在实际工作中,选择适当的抽样组织方式主要应考虑:,确定抽样组织方式,调查对象的性质特点在实际工作中,选择适当的抽样组织方式主要应,确定样本容量,n30,,为大样本;,n 30,,为小样本,样本容量,指样本中含有的总体单位的数目,,通常用,n,来表示。,确定适当样本容量的意义:,若,n,过大,调查工作量增大,体现不出抽样调查的优越性;,若,n,过小,抽样误差会增大,抽样推断就会失去价值。,确定样本容量n30,为大样本;n 30,为小样本样本容,(,一,),简单随机抽样,必要抽样数目的计算公式,(一) 简单随机抽样必要抽样数目的计算公式,(,二,),类型抽样,(二) 类型抽样,(,三,),整群抽样,(三) 整群抽样,等距抽样的抽样数目,在有总体差异程度和比重的全面资料时,可采用类型抽样的公式;没有总体的全面资料时,可采用简单随机抽样的公式。,等距抽样的抽样数目,在有总体差异程度和比重的全面,建筑工地打土方工人,4000,人,需测定平均每人工作量,要求误差范围不超过,0.2M,3,,并需有,99.73%,保证程度。根据过去资料,=1.5,,求样本数应是多少?,例,1,建筑工地打土方工人4000人,需测定平均每人工作量,要求误差,某金笔厂月产,10000,支金笔,以前多次抽样调查一等品率为,90%,,现在要求误差范围在,2%,之内,可靠程度达,95.45%,,问必须抽取多少单位数?,例,2,某金笔厂月产10000支金笔,以前多次抽样调查一等品,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!