第三章简单随机抽样课件

上传人:沈*** 文档编号:241654126 上传时间:2024-07-13 格式:PPT 页数:68 大小:752.50KB
返回 下载 相关 举报
第三章简单随机抽样课件_第1页
第1页 / 共68页
第三章简单随机抽样课件_第2页
第2页 / 共68页
第三章简单随机抽样课件_第3页
第3页 / 共68页
点击查看更多>>
资源描述
第三章简单随机抽样本章要点本章要点 简单随机抽样是抽样中最基本、最成熟、也简单随机抽样是抽样中最基本、最成熟、也是最简单的抽样设计方式,是所有概率抽样方法是最简单的抽样设计方式,是所有概率抽样方法发展、比较的基础。发展、比较的基础。要求通过学习熟练掌握简单随机抽样的抽要求通过学习熟练掌握简单随机抽样的抽样方式和样本抽选方法;样方式和样本抽选方法;熟知总体均值、总体总值和总体比例的简熟知总体均值、总体总值和总体比例的简单估计;单估计;掌握样本量的确定;了解子总体的估计。掌握样本量的确定;了解子总体的估计。2021/2/42第一节第一节 抽样方式抽样方式2021/2/43 简单随机抽样也称纯随机抽样。对于大小为的总简单随机抽样也称纯随机抽样。对于大小为的总体,抽取样本量为的样本,若全部可能的样本被抽中体,抽取样本量为的样本,若全部可能的样本被抽中的概率都相等,则称这样的抽样为简单随机抽样。根的概率都相等,则称这样的抽样为简单随机抽样。根据抽样单位是否放回可分为放回简单随机抽样和不放据抽样单位是否放回可分为放回简单随机抽样和不放回简单随机抽样。回简单随机抽样。(一)放回简单随机抽样(一)放回简单随机抽样 (二)不放回简单随机抽样(二)不放回简单随机抽样 (三)不放回与放回简单随机抽样的比较(三)不放回与放回简单随机抽样的比较 一、什么是简单随机抽样一、什么是简单随机抽样2021/2/44(一)放回简单随机抽样(一)放回简单随机抽样 如果抽样是有放回的,那么每次抽取都都是从如果抽样是有放回的,那么每次抽取都都是从 个个总体单位中抽取,这时可能的样本为总体单位中抽取,这时可能的样本为 个(考虑样本个(考虑样本单位的顺序)或单位的顺序)或 个(不考虑样本单位的顺序),个(不考虑样本单位的顺序),每个样本被抽中的概率为每个样本被抽中的概率为 或或 ,这种抽样方式,这种抽样方式就是放回简单随机抽样,所得的样本称为放回的简单就是放回简单随机抽样,所得的样本称为放回的简单随机样本。考虑与不考虑样本单位顺序的放回简单随随机样本。考虑与不考虑样本单位顺序的放回简单随机抽样,有一个共同的特点,即同一个单位有可能在机抽样,有一个共同的特点,即同一个单位有可能在同一个样本中重复出现。但是他们也有明显的区别:同一个样本中重复出现。但是他们也有明显的区别:一是可能的样本数不同;二是样本的概率分布不同,一是可能的样本数不同;二是样本的概率分布不同,由此会导致估计量的概率分布不同。由此会导致估计量的概率分布不同。2021/2/45 可以证明,不考虑顺序的放回简单随机抽可以证明,不考虑顺序的放回简单随机抽样的估计量的方差大于等于考虑顺序的放回简样的估计量的方差大于等于考虑顺序的放回简单随机抽样的估计量的方差,因此在抽样实践单随机抽样的估计量的方差,因此在抽样实践中,若用到放回简单随机抽样这种方式,也只中,若用到放回简单随机抽样这种方式,也只讨论和使用考虑顺序的情形。讨论和使用考虑顺序的情形。2021/2/46(二)不放回简单随机抽样(二)不放回简单随机抽样 如果抽样是无放回的,即同一个单位不能如果抽样是无放回的,即同一个单位不能在样本中重复出现,那么,若考虑样本单位的在样本中重复出现,那么,若考虑样本单位的顺序,则可能的样本为顺序,则可能的样本为 个,每个样本被抽个,每个样本被抽中的概率为中的概率为 ;若不考虑样本单位的顺序,;若不考虑样本单位的顺序,则可能的样本为则可能的样本为 个,每个样本被抽中的概率个,每个样本被抽中的概率为为 。这样的抽样方式就是不放回简单随机。这样的抽样方式就是不放回简单随机抽样,所得的样本称为不放回简单随机样本。抽样,所得的样本称为不放回简单随机样本。2021/2/47 考虑样本单位顺序与不考虑样本单位顺序的不放回考虑样本单位顺序与不考虑样本单位顺序的不放回简单随机抽样,除了单位不可能在同一个样本中重复简单随机抽样,除了单位不可能在同一个样本中重复出现这一共同特点外,还有一个共同点,即虽然他们出现这一共同特点外,还有一个共同点,即虽然他们的可能样本数不同,考虑顺序是不考虑顺序的的可能样本数不同,考虑顺序是不考虑顺序的 倍,倍,但是它们的样本却有相同的概率分布。由此会导致依但是它们的样本却有相同的概率分布。由此会导致依据样本构造的估计量的概率分布也是相同的。据样本构造的估计量的概率分布也是相同的。由于这一共同点的存在,加之不考虑顺序的放回简由于这一共同点的存在,加之不考虑顺序的放回简单随机抽样的工作量更小,所以抽样实践中对于不放单随机抽样的工作量更小,所以抽样实践中对于不放回简单随机抽样,只讨论和使用不考虑顺序不放回简回简单随机抽样,只讨论和使用不考虑顺序不放回简单随机抽样这种方式。单随机抽样这种方式。2021/2/48(三三)不放回与放回简单随机抽样的比较不放回与放回简单随机抽样的比较 1、每次抽取样本单位面对的总体结构不同。这是二者、每次抽取样本单位面对的总体结构不同。这是二者的主要不同之处。这一点使得前者的数学处理相对的主要不同之处。这一点使得前者的数学处理相对简单。简单。2、样本提供的信息量不同。显然,在样本量一定的条、样本提供的信息量不同。显然,在样本量一定的条件下,由于后者提供的信息量大于前者,其抽样效件下,由于后者提供的信息量大于前者,其抽样效率更高。率更高。在实践中,一般多采用不考虑顺序的不放回简单在实践中,一般多采用不考虑顺序的不放回简单随机抽样,所以以下讨论如无特别说明,都指这一随机抽样,所以以下讨论如无特别说明,都指这一类简单随机抽样。类简单随机抽样。2021/2/49二、简单随机样本的抽选方法二、简单随机样本的抽选方法 简单随机样本的抽选,首先要将总体简单随机样本的抽选,首先要将总体 个单位从个单位从1到到 编号,每个单位对应一个号;编号,每个单位对应一个号;然后从所编的号中抽号,如果抽到某个号,然后从所编的号中抽号,如果抽到某个号,则对应的那个单位入样,直到抽够则对应的那个单位入样,直到抽够 个单位个单位为止。为止。(一)抽签法(一)抽签法(二)随机数法(二)随机数法 2021/2/410(一)抽签法(一)抽签法 当总体不大时,可分别采用两种方法抽当总体不大时,可分别采用两种方法抽取。一种是全样本抽选法,另一种是逐个抽取。一种是全样本抽选法,另一种是逐个抽选法,按这两种方法抽到的选法,按这两种方法抽到的 个单位的样本个单位的样本是等价的,每个被抽到的样本的概率都等于是等价的,每个被抽到的样本的概率都等于 。2021/2/411(二)随机数法(二)随机数法 当总体较大时,抽签法实施起来比较困难,当总体较大时,抽签法实施起来比较困难,这时可以利用随机数表、随机数骰子、摇奖这时可以利用随机数表、随机数骰子、摇奖机、计算机产生的伪随机数进行抽样。机、计算机产生的伪随机数进行抽样。1、利用随机数表进行抽选。、利用随机数表进行抽选。随机数表是一张由随机数表是一张由0,1,2,9这十这十个数字组成的,一般常用的是五位数的随机个数字组成的,一般常用的是五位数的随机数字表,数字表,10个数字在表中出现的顺序是随机个数字在表中出现的顺序是随机的,每个数字都有同样的机会被抽中。的,每个数字都有同样的机会被抽中。2021/2/412 用随机数表抽选简单随机样本时,一般可用随机数表抽选简单随机样本时,一般可根据总体大小根据总体大小 的位数决定在随机数表中随的位数决定在随机数表中随机抽取几列,比如机抽取几列,比如 =768,要从中抽取要从中抽取 =10的简单随机样本,则在随机数表中随机抽取的简单随机样本,则在随机数表中随机抽取相邻的相邻的3列,顺序往下(或往上),选出前列,顺序往下(或往上),选出前10个个001到到768之间的互不相同的数,如果这之间的互不相同的数,如果这3列列随机数字不够,可另选其他随机数字不够,可另选其他3列继续,直到抽列继续,直到抽够个够个 单位为止。单位为止。2021/2/413 用此种方法,当用此种方法,当 的最高位数较小,比如的最高位数较小,比如小于小于5,且不小,且不小 时,由于读到的随机数被舍时,由于读到的随机数被舍弃不用的比例较大,抽选效率较差。此时采弃不用的比例较大,抽选效率较差。此时采用下面的方法。在随机数表中随机抽取用下面的方法。在随机数表中随机抽取3列,列,顺序往下,如果得到的随机数大于顺序往下,如果得到的随机数大于247,小于,小于989(因为(因为247的的4倍为倍为988,因此,因此000及及989到到999的数字应舍弃),则用这个数除以的数字应舍弃),则用这个数除以247,得到的余数入样,显然这种方法效率要高得得到的余数入样,显然这种方法效率要高得多。随机数表的起始页和起始点都应用随机多。随机数表的起始页和起始点都应用随机数产生。数产生。2021/2/4143 3、利用摇奖机进行抽选、利用摇奖机进行抽选。4 4、利用计算机产生的伪随机数进行抽选。通常、利用计算机产生的伪随机数进行抽选。通常产生的伪随机数有循环周期。因此在有条件产生的伪随机数有循环周期。因此在有条件的情况下,一般不建议使用此种方法的情况下,一般不建议使用此种方法。2、利用随机数骰子进行抽选。、利用随机数骰子进行抽选。2021/2/415(一)简单随机抽样在抽样理论中的地位(一)简单随机抽样在抽样理论中的地位它是抽样中最容易掌握的技术、也是发展它是抽样中最容易掌握的技术、也是发展最成熟的技术,建立了最完备的理论。简单最成熟的技术,建立了最完备的理论。简单随机抽样也是比较其他抽样设计方法优劣的随机抽样也是比较其他抽样设计方法优劣的基础。其他抽样方法技术都是在它的理论技基础。其他抽样方法技术都是在它的理论技术基础上,针对它的局限发展起来的。术基础上,针对它的局限发展起来的。三、简单随机抽样在抽样理论中的地位三、简单随机抽样在抽样理论中的地位 与局限性与局限性2021/2/416 若总体单位数若总体单位数 很大时,编制抽样框困很大时,编制抽样框困难;抽样框中即使有辅助信息也不加利用,难;抽样框中即使有辅助信息也不加利用,使得估计的统计效率较其他利用辅助信息的使得估计的统计效率较其他利用辅助信息的抽样设计方法低;由于样本在总体中的地理抽样设计方法低;由于样本在总体中的地理分布范围较广,如果采取面访,则费时、费分布范围较广,如果采取面访,则费时、费钱、费力,困难较大;可能得到一个钱、费力,困难较大;可能得到一个“差差”的简单随机样本;若不用计算机,而用随机的简单随机样本;若不用计算机,而用随机数表或随机数骰子抽取一个大样本,比较劳数表或随机数骰子抽取一个大样本,比较劳神单调神单调。(二)简单随机抽样的局限性(二)简单随机抽样的局限性2021/2/417四、有关指标与符号四、有关指标与符号指指 标标 总总 体体 样样 本本 总值总值均值均值比例比例比率比率有限总体方差有限总体方差无限总体方差无限总体方差2021/2/418第二节第二节 总体均值与总体总值总体均值与总体总值的简单的简单估计估计2021/2/419(一)简单估计量的定义(三)简单估计量 的方差(四)简单估计量 的方差的无偏估计(二)简单估计量 的无偏性(五)放回简单随机抽样的简单估计(六)设计效应(七)影响估计量精度的因素一、总体均值的简单估计一、总体均值的简单估计 2021/2/420(一)简单估计量的定义(一)简单估计量的定义 对对于于简简单单随随机机抽抽样样,最最简简单单的的估估计计是是利利用用样样本本均均值值作为总体均值的估计,即总体均值的简单估计量为:作为总体均值的估计,即总体均值的简单估计量为:也就是说,样本均值是总体均值的简单估计量。也就是说,样本均值是总体均值的简单估计量。2021/2/421(二)简单估计量(二)简单估计量 的无偏性的无偏性对于简单随机抽样,对于简单随机抽样,是是 的无偏估计,即有的无偏估计,即有 证明:证明:这就是对称性论证法。由于总体中每一个单位的入样概率这就是对称性论证法。由于总体中每一个单位的入样概率都相等,所以不放回简单随机抽样是一种等概率抽样。都相等,所以不放回简单随机抽样是一种等概率抽样。2021/2/422(三三)简单估计量简单估计量 的方差的方差 式中,式中,抽样比;抽样比;为有限总体校正系数。为有限总体校正系数。证明:证明:根据对称性论证法,有根据对称性论证法,有根据对称性论证法,有根据对称性论证法,有 2021/2/423因此有因此有2021/2/424(四四)简单估计量简单估计量 的方差的无偏估计的方差的无偏估计 的无偏估计是:的无偏估计是:式中式中 为样本方差。为样本方差。证明:证明:2021/2/425根据对称性论证法及根据对称性论证法及 的表达式,有的表达式,有 由此可得:由此可得:2021/2/426(五)放回简单随机抽样的简单估计(五)放回简单随机抽样的简单估计 现实中有许多情况下,抽样必须是放回的,现实中有许多情况下,抽样必须是放回的,即从总体中抽中的单位每次都要放回总体中去。即从总体中抽中的单位每次都要放回总体中去。例如在城市中对行人、车辆的调查,对超市顾例如在城市中对行人、车辆的调查,对超市顾客、影剧院观众的调查等抽样都是有放回的,客、影剧院观众的调查等抽样都是有放回的,从而,有可能重复抽中某些单位。从而,有可能重复抽中某些单位。对于每次抽到的结果对于每次抽到的结果(视为随机变量视为随机变量)都有都有 2021/2/427由此可以证明:由此可以证明:注意到注意到 2021/2/428因此样本方差因此样本方差 是无限总体方差是无限总体方差 的无偏估计量。的无偏估计量。方差方差 的一个无偏估计是:的一个无偏估计是:考虑样本单位顺序的放回简单随机抽样也是考虑样本单位顺序的放回简单随机抽样也是等概率抽样。等概率抽样。2021/2/429这说明除非 =1,否则在相同的样本量下,放回简单随机抽样的方差总是大于不放回的方差,即它的抽样效率一般比不放回简单随机抽样的低。根据抽样设计效应定义:放回简单随机抽样的 为:2021/2/430n【例【例3-3】为调查某大学学生的电信消费水平,在全校】为调查某大学学生的电信消费水平,在全校=15230名学生中,用简单随机抽样的方法抽得一个名学生中,用简单随机抽样的方法抽得一个=36的样本。对每的样本。对每个抽中的学生调查其上个月的电信支出金额(如表个抽中的学生调查其上个月的电信支出金额(如表3-6所示)。所示)。试以试以95%的置信度估计该校大学生该月电信消费的平均支出的置信度估计该校大学生该月电信消费的平均支出额。额。样本序号消费额(元)样本序号消费额(元)样本序号消费额(元)12345678910111245367131708933752256795131415161718192021222324485324394193195911164357625262728293031323334353683513325289017574314619472021/2/431 ,。因此,对该校大学生某月的电信消费的人均支出额的估计为53.64(元),由于置信度95%对应的 =1.96,所以,可以以95%的把握 说该校大学生该月的电信消费的人均支出额大约在53.641.966.1355,即41.6165.67元之间。若采取放回简单随机抽样,则:,以95%的把握估计该校大学生该月的电信消费的人均支出额大约在53.641.966.1428,即41.6065.68元之间。计算结果说明,不放回比放回简单随机抽样估计的置信区间略小一些。由于总体较大而抽样比较小,所以两者之间相差很小。解:依据题意和表中数据,可计算得:2021/2/432 总体总值为总体均值的总体总值为总体均值的 倍,即倍,即 (一)简单估计量的定义(一)简单估计量的定义 N倍的样本均值是总体总值的简单估计量,倍的样本均值是总体总值的简单估计量,即即 二、总体总值的简单估计二、总体总值的简单估计 只要我们有了总体均值的估计结果,就可只要我们有了总体均值的估计结果,就可以很容易地推出总体总值的估计结果。以很容易地推出总体总值的估计结果。2021/2/433由于总体总值是总体均值的由于总体总值是总体均值的N倍,其简单倍,其简单估计量也是总体均值估计量的估计量也是总体均值估计量的N倍,而倍,而N是固是固定常数,所以总体总值的简单估计量的性质定常数,所以总体总值的简单估计量的性质由总体均值的简单估计量的性质来决定。由总体均值的简单估计量的性质来决定。容易证明容易证明的无偏估计为的无偏估计为(二)简单估计量的性质(二)简单估计量的性质2021/2/434【例例3.4】试试以以95%的置信度估计例3.3中该校大学生该月电信消费的总支出额。解:依题意,N=15230,根据例3.3计算的结果,可估计该校大学生该月电信消费的总支出额为 (元)。在不放回简单随机抽样下,=1523037.6444=1523037.6444=8731 727 749(元),(元),以95%的把握估计该校大学生该月电信消费的总支出额为:816 937.21.9693 443.71元即在633 787.531 000 086.87元之间。若为放回简单随机抽样,则可得:1523037.7336 =8752417947(元),(元),以95%的把握估计该校大学生该月电信消费的总支出额为816 937.21.9693 554.36元,即在633 570.651 000 303.75元之间。2021/2/435第三节第三节 总体比例的简单估计总体比例的简单估计2021/2/436规定规定 设总体中有设总体中有 个单位,具有某种属性的单位数个单位,具有某种属性的单位数为为 ;不具有该种属性的单位数为;不具有该种属性的单位数为 。具有某种属性的单位比例为:具有某种属性的单位比例为:不具有该种属性的单位的比例为:不具有该种属性的单位的比例为:因此对总体比例的估计就是对总体均值的估计,因此对总体比例的估计就是对总体均值的估计,对总体中具有某种属性单位的总个数对总体中具有某种属性单位的总个数 的估计是的估计是对总体总值估计的一个特例。对总体总值估计的一个特例。一、问题的提法一、问题的提法 2021/2/437(一)简单估计量的定义(一)简单估计量的定义 二、总体比例的简单估计量及其性质二、总体比例的简单估计量及其性质 根据调查要求,利用简单随机抽样的方式随机抽取个单位组成样本,其中 个具有某种属性,则样本比例(样本均值)就是总体比例 的简单估计量;就是总体中具有某种属性单位的总个数 的简单估计量。2021/2/438(二)估计量的性质(二)估计量的性质1、是 的无偏估计。即有:2、的方差为:3、的无偏估计量是 ,即2021/2/439当 都比较大时,我们以正态分布给出 及 的近似置信区间(置信度为 )为:修正后的 与 的置信区间分别为:2021/2/440 【例例3.5】试以】试以95%的置信度估计例3.3中该校大学生该月电信消费支出超出80元的人数及其比例。解:根据例3.3所给的资料可知,=15230,=36,7,=1.96。由此可计算得:于是 的95%的置信区间为 的95%的置信区间为(0.0496 ,0.3392 )=(755,5166)。=(0.0496,0.3392)2021/2/441第四节第四节 样本量的确定样本量的确定2021/2/442 在抽样调查的理论方法研究中,样本量的确定在抽样调查的理论方法研究中,样本量的确定既有重要的理论意义,又有现实的实用价值。样本既有重要的理论意义,又有现实的实用价值。样本量过大,不符合抽样调查的宗旨;过小,则抽样误量过大,不符合抽样调查的宗旨;过小,则抽样误差偏大,无法保证估计精度的要求。样本量的确定差偏大,无法保证估计精度的要求。样本量的确定主要受两个方面因素的影响和制约:主要受两个方面因素的影响和制约:一是对抽样估计量精度的要求。对于一个确定一是对抽样估计量精度的要求。对于一个确定的抽样设计,估计量的精度要求高意味着要求的抽的抽样设计,估计量的精度要求高意味着要求的抽样误差小,而要想抽样误差小,就必须样本量大。样误差小,而要想抽样误差小,就必须样本量大。而总体单位调查标志的变异程度、总体的大小、样而总体单位调查标志的变异程度、总体的大小、样本设计和所使用的估计量、回答率等都是影响估计本设计和所使用的估计量、回答率等都是影响估计精度的因素,从而也是影响样本量的因素。精度的因素,从而也是影响样本量的因素。一、确定样本量主要考虑的因素一、确定样本量主要考虑的因素2021/2/443 二是实际调查运作的限制。调查的经费能支持二是实际调查运作的限制。调查的经费能支持多大的样本?允许调查持续的时间有多长?需要多多大的样本?允许调查持续的时间有多长?需要多少调查人员?虽然有些限制因素在样本量的计算公少调查人员?虽然有些限制因素在样本量的计算公式中还无法体现,但是在确定最终所需的样本量时式中还无法体现,但是在确定最终所需的样本量时必须加以考虑。实践中样本量的确定是在多种约束必须加以考虑。实践中样本量的确定是在多种约束条件下进行的折衷过程。条件下进行的折衷过程。由于大部分限制约束条件不便于量化,确定样由于大部分限制约束条件不便于量化,确定样本量的计算公式时往往只在抽样精度与调查费用两本量的计算公式时往往只在抽样精度与调查费用两者之间权衡。采用两种不同的方式来确定:一种是者之间权衡。采用两种不同的方式来确定:一种是在总费用一定的条件下使精度最高;另一种是在满在总费用一定的条件下使精度最高;另一种是在满足一定精度要求的条件下使费用最小。足一定精度要求的条件下使费用最小。2021/2/444给定绝对误差限给定绝对误差限 、相对误差限、相对误差限 和变异和变异系数系数 的允许上限的样本量确定公式,即的允许上限的样本量确定公式,即分别有:分别有:二、估计总体均值(总值)的样本确定二、估计总体均值(总值)的样本确定2021/2/445 由由于于总总体体方方差差 和和总总体体均均值值 未未知知,因因此此在在利利用用上上述述公公式式时时,必必须须事事先先对对它它们们做做出出估估计计。实实际际工工作作中中,可可以以通通过过以以往往对对同同类类问问题题调调查查积积累累的的经经验验来来估估计计,也也可可以以通通过过预预调调查查来来估估计计,或或通通过过其其他他调调查查方法和定性分析方法获得。方法和定性分析方法获得。对于复杂抽样设计方法,由于确定样本量的公式对于复杂抽样设计方法,由于确定样本量的公式比较复杂,常常难于计算。在同样精度要求的条件比较复杂,常常难于计算。在同样精度要求的条件下,简单随机抽样的样本量下,简单随机抽样的样本量 相对容易获得,这时相对容易获得,这时可以利用(可以利用(3.21)式先计算复杂抽样设计的设计效应)式先计算复杂抽样设计的设计效应 ,然后再间接推算复杂抽样设计方法所需要的样本,然后再间接推算复杂抽样设计方法所需要的样本量量 ,即有:,即有:2021/2/446【例例3.6】在在例例3.3中,如果要求以95%的置信度估计该校大学生该月人均电信消费支出的绝对允许误差不超过5元,样本量应确定为多少?解:依据所给条件:=15230,=5,置信度95%对应的标准正态分布表的上侧分位数为 1.96,且 =1358.41,据此可计算得:=也就是说,至少应抽取一个样本量为206的简单随机样本,才能满足95%置信度条件下绝对误差不超过5元的精度要求。2021/2/447根据样本比例根据样本比例 的方差公式的方差公式 可以推得:可以推得:其中其中 同样可求得给定绝对误差限同样可求得给定绝对误差限 、相对误差限、相对误差限 和和变异系数变异系数 的允许上限的样本量确定公式,即分的允许上限的样本量确定公式,即分别有:别有:在无限总体或放回抽样情形下,在无限总体或放回抽样情形下,即为所确即为所确定的样本量。定的样本量。三、估计总体比例的样本量确定三、估计总体比例的样本量确定2021/2/448【例例3.7】在例3.5中,如果要求以95%的置信度估计该校大学生该月电信消费支出超出80元的人数比例的相对允许误差不超过10%,样本量至少应为多少?解:根据例3.5所给的资料和计算的结果可知:=15230,=36,7,=1.96。,由此可计算得:计算结果说明,至少应抽取一个样本量为1442的简单随机样本,才能满足95%置信度条件下相对允许误差不超过10%的精度要求。2021/2/449四、逆抽样法四、逆抽样法 现实中有这样一种情况,即总体中具有现实中有这样一种情况,即总体中具有所考虑属性的单位数很少,也就是说所考虑属性的单位数很少,也就是说 值很值很小。对于此类稀有事件的比例估计问题,利小。对于此类稀有事件的比例估计问题,利用前面给出的公式确定样本量有困难。用前面给出的公式确定样本量有困难。霍丹(霍丹(HaldaneHaldane)19451945年提出一种称为年提出一种称为逆抽样的方法,专门用于此类小比例的抽样。逆抽样的方法,专门用于此类小比例的抽样。2021/2/450第五节第五节 子总体估计子总体估计2021/2/451一、问题的提出一、问题的提出 我们把总体中具有某种共同属性特征的单位的我们把总体中具有某种共同属性特征的单位的集合称为子总体。集合称为子总体。对子总体的处理有多种方法:若每个子总体在编对子总体的处理有多种方法:若每个子总体在编制抽样框时就可以区分开,可以采用分层抽样方法进制抽样框时就可以区分开,可以采用分层抽样方法进行估计;若事先不能将各个子总体区分开来,但是事行估计;若事先不能将各个子总体区分开来,但是事先可以知道各个子总体的单位数先可以知道各个子总体的单位数 ,则可采用事后,则可采用事后分层的方法进行估计;还有一种情况是,既不能事先分层的方法进行估计;还有一种情况是,既不能事先将各个子总体区分开来,又无法事先知道各个子总体将各个子总体区分开来,又无法事先知道各个子总体的单位数的单位数 。本节的讨论仅限于后一类子总体的估。本节的讨论仅限于后一类子总体的估计计。2021/2/452 二、子总体均值的估计二、子总体均值的估计样本均值样本均值是子总体均值是子总体均值的无偏估计量的无偏估计量2021/2/453式中式中 为第为第 个子总体的抽样比,子总体的个子总体的抽样比,子总体的方差未知,可用其样本方差方差未知,可用其样本方差 其方差为其方差为 来估计。至此我们的问题并没有解决,因为来估计。至此我们的问题并没有解决,因为 未未知,所以知,所以 也是未知的。也是未知的。2021/2/454 我们可以将单位是否属于第我们可以将单位是否属于第 个子总体看作是总体个子总体看作是总体单位的一个属性特征,那么单位的一个属性特征,那么 就是总体的比例就是总体的比例 ,而而 就是其样本的比例就是其样本的比例 ,是是 的无偏估计,因的无偏估计,因此有此有因为因为 和和 都是固定的,所以都是固定的,所以 因此可用因此可用 来估计来估计 据此我们可得到据此我们可得到 的无偏估计量为的无偏估计量为2021/2/455 上一小节解决了子总体均值的估计问题,上一小节解决了子总体均值的估计问题,但是由于但是由于 未知,子总体总值的估计问题依未知,子总体总值的估计问题依然没有得到解决。然没有得到解决。定义定义记记它们可以分别用它们可以分别用 ,进行估计。进行估计。三、子总体总值的估计三、子总体总值的估计2021/2/456于是有于是有 2021/2/457 总体总值总体总值 (也就是子总体总值(也就是子总体总值 )的)的一个简单无偏估计为一个简单无偏估计为 它的方差为它的方差为 2021/2/458而样本方差而样本方差 因此因此 的一个无偏估计为的一个无偏估计为 2021/2/459编号为奇数的习题答案编号为奇数的习题答案3.1判断以下抽取方式是否为等概率抽样判断以下抽取方式是否为等概率抽样:(1)是是 (2)否否 (3)是是 (4)否否2021/2/4603.3为调查某中学学生的每月购书支出水平,在为调查某中学学生的每月购书支出水平,在全校名学生中,用不放回简单随机抽样的方全校名学生中,用不放回简单随机抽样的方法抽得一个的样本。对每个抽中的学生调查法抽得一个的样本。对每个抽中的学生调查其上个月的购书支出金额其上个月的购书支出金额 (如表(如表1所示)。所示)。(1)在在95%的置信度下估计该校学生该月平均购的置信度下估计该校学生该月平均购书支出额;书支出额;(2)试估计该校学生该月购书支出超出试估计该校学生该月购书支出超出70元的人元的人数;数;(3)如果要求相对误差限不超过如果要求相对误差限不超过10%,以,以95%的的置信度估计该校学生该月购书支出超出置信度估计该校学生该月购书支出超出70元元的人数比例,样本量至少应为多少。的人数比例,样本量至少应为多少。2021/2/461样本序号支出额(元)样本序号支出额(元)样本序号支出额(元)123456789108562421550398365324611121314151617181920 20 75 34 41 58 63 95 120195721222324252627282930494595362545128452984 表1 30名学生某月购书支出金额的样本数据2021/2/4623.3解:(1)依据题意和表1的数据,有:因此,对该校学生某月的人均购书支出额的估计为56.07(元),由于置信度95%对应的 所以,可以以95%的把握说该学生该月的人均购书支出额大约在56.071.965.115,即50.9661.19元之间。,2021/2/463(2)易知,N=1750,n=30,的95%的置信区间为:的95%的置信区间为:(159,776)2021/2/464(3)N=1750,n=30,由此可计算得:计算结果说明,至少应抽取一个样本量为1237的简单随机样本,才能满足95%置信度条件下相对误差不超过10%的精度要求。2021/2/4653.5要调查甲乙两种疾病的发病率,从历史资料要调查甲乙两种疾病的发病率,从历史资料得知,甲种疾病的发病率为得知,甲种疾病的发病率为8,乙种疾病的,乙种疾病的发病率为发病率为5,求:,求:(1)要得到相同的标准差要得到相同的标准差0.05,采用简单随机抽,采用简单随机抽样各需要多大的样本量?样各需要多大的样本量?(2)要得到相同的变异系数要得到相同的变异系数0.05,又各需要多大,又各需要多大的样本量?的样本量?2021/2/4663.5解:(1)已知,由得:由得:(2)2021/2/467汇报结束谢谢大家!请各位批评指正
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!