资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,一 总体均值的估计,二,总体总量的估计,三,总体比例的估计,四,总体特征单元数的估计,第二节 估计量及其性质,一 分层抽样的定义,定义,1,:,层:如果一个包含,N,个单元的总体可分成“不重不漏”的,L,个子总体,则称这样的子总体为层(,stratum,)。,定义,2,:,分层抽样:在每一层中独立进行抽样,总的样本由各层样本组成,总体参数根据各子总体参数的估计进行,汇总,得到,这种抽样称为分层抽样,所得样本称为分层样本。,1,、估计量的定义,一、总体均值的估计,对于分层抽样,,对于分层随机抽样,,2,、估计量的性质,性质,1,:对于分层样本,若 ,则,一、总体均值的估计,2,、估计量的性质,性质,2,:对于分层随机样本,,性质,3,:对于分层随机样本,,总体均值 的置信水平为,1-,的置信区间为,性质,4,对于分层随机样本,,1,、估计量的定义,二、总体总量的估计,对于分层抽样,,对于分层随机抽样,,2,、估计量的性质,性质,1,:对于分层样本,若 ,则,二、总体总量的估计,2,、估计量的性质,性质,2,:对于分层随机样本,,性质,3,:对于分层随机样本,,总体总量值 的置信水平为,1-,的置信区间为,性质,4,对于分层随机样本,,例,1,:,调查某地区的家庭年收入,以居民户为抽样单元,根据经济及收入水平将居民户划分为,2,层,每层按简单随机抽样抽取,10,户,调查获得如下数据(单位:万元):,层,居民户总数,样本户家庭年收入,1,2,3,4,5,6,7,8,9,10,1,2,600,900,10,5,8,7,12,3,9,4,6,5,20,8,8,2,12,4,7,6,15,9,求(,1,)估计该地区居民家庭总收入及该估计的标准差。,(,2,)以,95%,的置信度对总收入进行区间估计。,1,、估计量的定义,三、总体比例的估计,对于分层抽样,,对于分层随机抽样,,2,、估计量的性质,性质,1,:对于分层样本,若 ,则,三、总体比例的估计,2,、估计量的性质,性质,2,:对于分层随机样本,,性质,3,:对于分层随机样本,,总体比例 的置信水平为,1-,的置信区间为,性质,4,对于分层随机样本,,1,、估计量的定义,四、总体特征单元数的估计,对于分层抽样,总体的特征数,A,的估计,对于分层随机抽样,,2,、估计量的性质,性质,1,:对于分层样本,若 ,则,四、总体特征数的估计,2,、估计量的性质,性质,2,:对于分层随机样本,,性质,3,:对于分层随机样本,,总体特征数 的置信水平为,1-,的置信区间为,性质,4,例,2,:,为调查某地电视观众观看某综艺节目的人数比例,由于市区,近郊和远郊的观众对该节目的兴趣有差别,而且调查费用也不同,因此,分为三层进行分层简单随机抽样,调查结果如下:,年龄组,层权,W,h,层,样本量,n,h,p,h,市区,近郊,远郊,0.5,0.2,0.3,200,80,120,0.8,0.5,0.25,求(,1,)估计该地观看该节目人数的比例,并以,95%,置信度,作出区间估计。,(,2,)假设该地区共有电视观众,50,万人,估计有多少人看了此,节目,并以,95%,置信度作出区间估计。,问题:,当总的样本量,n,确定的条件下,如何分配各层之间的样本量,n,h,(,h=1,,,,,L,)?,第三节 样本量在各层的分配,一 样本量分配对精度与费用的影响,二 常见的几种样本分配方式,例,3,:,已知,L=3,,,n=300,,考虑六种不同的样本量的分配,并计算每种分配下,总体均值估计量的方差与总费用?,其中,费用函数:,其中,C,为总费用,为基本费用且与样本量无关,是第,h,层中单位样本所花费的费用。,一 样本量分配对精度与费用的影响,1,、常数分配(平均分配),每层抽取相同单位数组成样本,即,适用情形:,缺陷:,一 样本量分配对精度与费用的影响,2,、层样本量与层方差成正比分配,适用情形:,缺陷:,一 样本量分配对精度与费用的影响,3,、层样本量与层权,W,h,成正比分配(或比例分配),优点:,缺陷:,估计量具有简单的形式,样本的代表性较强,精度较高。,3,比例分配,对于分层随机抽样,若样本量按比例分配,则,一 样本量分配对精度与费用的影响,4,、层样本量与层单位调查费用,c,h,成反比分配,优点:,缺陷:,费用最低。,精度最低,一 样本量分配对精度与费用的影响,5,、层样本量与,S,h,W,h,成正比分配,优点:,缺陷:,精度最高。,一 样本量分配对精度与费用的影响,6,、层样本量与,S,h,W,h,/,成正比分配,优点:,综合考虑了估计的精度与调查的总费用。,1,比例分配,二 常见的几种样本分配方式,2,、最优分配,3,Neyman,(奈曼)分配,2,、最优分配,1,定义,在分层随机抽样中,如何将样本量分配到各层,使得总费用给定的条件下,估计量的方差达到最小,或给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。,2,、最优分配,定理,1,:最优分配中,固定费用,C,使 最小的样本量分配有,3,、,奈曼分配,1,定义,在最优分配中,若单位抽样的费用相等,即,c,h,=c,时,称此最优分配为奈曼分配,。,定理,2,:奈曼分配中,样本量分配有,例,4,(续例,1,)若,n=20,,对城镇居民与农村居民抽样平均每户的费用比为,1,:,2,,试求(,1,)城镇与农村两层比例分配与最优分配的样本量。,(,2,)又若不考虑费用因素,那么最优分配的结果又有何变化?,1,某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇,23560,户中抽取,300,户,在全部农村,148420,户中抽取,250,户(均按简单随机抽样进行),调查结果城镇年平均户收入为,15180,元,标准差为,2972,元;农村年平均户收入为,9856,元,标准差为,2546,元。求全市年平均户收入的估计及其,90%,置信度下的置信区间。,作业:,2,某企业有工人,132,人,技术人员,92,人,管理人员,27,人。现欲通过抽样调查去年全年平均每人请假天数,拟采用分层抽样。若已知工人请假天数的方差为,36,,技术人员请假天数的方差为,25,,管理人员请假天数的方差为,9,,设样本量为,30,,试用奈曼分配确定各层的样本量。,作业:,
展开阅读全文