资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第七章 整群抽样,7.1 概述,一、,整群抽样(cluster sampling),的定义:,由若干个基本单元所组成的集合称为群。将总体划分为若干群,然后以群为抽样单元,从总体中随机抽取一部分群,对抽中的群中的所有基本单元进行调查的一种抽样技术。,严格来讲也称为,单阶整群抽样,。,二、,特点,:,1.可以简化抽样框的编制。,2.实施调查便利,节省费用。,3.但通常比简单随机抽样的抽样误差大。,三、,分群的原则:,群内单元差异大,群间差异小。,这样,被抽到的群代表性好,整群抽样的效率就高。,7.2 群规模相等情形,对群进行简单随机抽样时的估计量及其方差,一、符号:,总体群数:N,每群含有的单元数:M,总体第i群第j个单元的指标值:Y,ij,总体中单元总数:M,0,=NM,样本群数:n,样本第i群第j个单元的观测值:y,ij,二、估计量:,1.群规模相等时,对群的抽样采取简单随机抽样,将群和Y,i,作为群的指标值,例:在一次对某寄宿中学在校生零花钱的调查中,以宿舍作为群进行整群抽样。每个宿舍有6个学生。用简单随机抽样在全部315间宿舍中抽取8间宿舍。样本数据如下:,试估计该学校平均每个学生每周的零花钱,并给出置信度为95%的置信区间。,宿舍1,宿舍2,宿舍3,宿舍4,宿舍5,宿舍6,宿舍7,宿舍8,学生1,58,91,123,99,110,111,120,96,学生2,83,83,89,105,99,100,115,80,学生3,74,79,94,98,132,116,117,63,学生4,82,111,109,107,87,99,99,130,学生5,66,101,79,129,99,107,106,105,学生6,87,69,80,90,124,105,120,86,解:,宿舍1,宿舍2,宿舍3,宿舍4,宿舍5,宿舍6,宿舍7,宿舍8,学生1,58,91,123,99,110,111,120,96,学生2,83,83,89,105,99,100,115,80,学生3,74,79,94,98,132,116,117,63,学生4,82,111,109,107,87,99,99,130,学生5,66,101,79,129,99,107,106,105,学生6,87,69,80,90,124,105,120,86,75.00,89.00,95.67,104.67,108.50,106.33,112.83,93.33,125.60,233.60,299.07,177.87,287.50,42.27,72.57,527.87,三、整群抽样的设计效应:,1.群内、群间差异的定量刻划:,2.群内相关系数:是表达总体中群内小单元间相关程度的一个指标。,定义:,3.整群抽样的设计效应:,四、样本容量的确定:,1.根据方差公式确定。,7.4 群规模不相等的一般情形,一、符号:,总体群数:N,总体第i群含有的单元数:M,i,总体第i群第j个单元的指标值:Y,ij,样本群数:n,样本第i群含有的单元数:m,i,样本第i群第j个单元的观测值:y,ij,总体中单元总数:,二、按简单随机抽样抽群时,总体总和、均值的估计量及方差:,设群的样本量为n,则对Y的估计有两种方法。,(1)方法1:加权估计,(2)比估计:,例:从某新村中抽了由38户组成的一个简单随机样本,调查每户参加体育活动的人数,设第i户有M,i,个人,其中参加体育活动的有a,i,人。经计算:,试估计该新村参加体育活动的人所占的比例及其标准差。(不计算f),解:,*利用比估计来估计总体均值,精度要求为V时,样本量的确定:,例:调查预估计某城市的人均收入,该城市共415个街区,从中随机抽取了25个进行试点调查,调查每个街区的居民数M,i,和总收入Y,i,(单位:美圆),数据如下:,为了使估计量的最大绝对误差为500美圆(置信度为95%),应抽多大的样本?,解:,三.按与群规模M,i,成比例的PPS抽样抽取群:,例.某市建筑行业集团共有48个单位,有载货汽车186辆。按每个单位的车辆拥有量成比例的概率进行放回的PPS抽样,共抽10次。对抽中单位的所有车辆调查季度运量(单位:吨)。样本数据如下:,试估计全集团的季度运量及标准差。,样本单位编号i,车辆数m,i,单位运量总和y,i,平均每车运量,1,2,3,4,5,6,7,8,9,10,5,8,5,4,6,9,5,3,7,3,14230,21336,13650,11568,15216,23094,13650,7443,16723,8391,2846,2667,2730,2892,2536,2566,2730,2481,2389,2797,解:全集团季度总运量Y的估计为:,
展开阅读全文