应用抽样技术课件第七章

上传人:沈*** 文档编号:241328010 上传时间:2024-06-18 格式:PPTX 页数:66 大小:646.96KB
返回 下载 相关 举报
应用抽样技术课件第七章_第1页
第1页 / 共66页
应用抽样技术课件第七章_第2页
第2页 / 共66页
应用抽样技术课件第七章_第3页
第3页 / 共66页
点击查看更多>>
资源描述
第七章第七章 整群抽样整群抽样(chu yn)(chu yn)ncluster sampling精品文档2 2本章(bn zhn)(bn zhn)要点 本章给出整群抽样的定义,讨论了群大小相本章给出整群抽样的定义,讨论了群大小相等的整群抽样方法及与之匹配的估计量、估等的整群抽样方法及与之匹配的估计量、估计量的方差及方差的估计量。具体要求:计量的方差及方差的估计量。具体要求:掌握掌握群大小相等的群大小相等的情形下整群抽样的情形下整群抽样的简单简单估计量及方差的无偏估计估计量及方差的无偏估计,了解群内方差、群,了解群内方差、群间方差概念及其对整群抽样精度的影响,掌握间方差概念及其对整群抽样精度的影响,掌握群的划分群的划分(hu fn)原则原则。掌握掌握估计总体比例估计总体比例的整群抽样方法及简单的整群抽样方法及简单估计量。估计量。精品文档3 3第一节 抽样(chu yn)(chu yn)方式精品文档4 4设想杭州市教育局想了解杭州中学生的体质状况。设想杭州市教育局想了解杭州中学生的体质状况。调查单位:杭州市每一个中学生调查单位:杭州市每一个中学生n简单随机抽样或分层抽样的抽样框应如何构建?调查实施会有简单随机抽样或分层抽样的抽样框应如何构建?调查实施会有什么困难?什么困难?n有两个困难有两个困难:n1 1)编制全体中学生的抽样框编制全体中学生的抽样框,非常困难;,非常困难;n2 2)样本单位可能)样本单位可能遍布全市遍布全市,对如此分散的样本逐个进行访问,工作对如此分散的样本逐个进行访问,工作量非常大。量非常大。n但是如果但是如果在杭州地区在杭州地区按学校进行抽样按学校进行抽样,在抽得的几所学校中对该在抽得的几所学校中对该校所有校所有(suyu)(suyu)中学生进行全面调查,抽样框的编制和调查实施中学生进行全面调查,抽样框的编制和调查实施都大大简化。都大大简化。n这就是整群抽样。这就是整群抽样。精品文档5 5 (一)定义(一)定义 若总体可分为若总体可分为 A个初级单位个初级单位(称为(称为群群),每个初级单),每个初级单位包含若干次级单位。位包含若干次级单位。按照某种方式按照某种方式从总体中抽取从总体中抽取 a个群个群,对这些群中的,对这些群中的所有所有次级单位全部进行次级单位全部进行(jnxng)调查调查。这种抽样方式称为这种抽样方式称为整群抽样整群抽样。一、整群抽样一、整群抽样的定义的定义(dngy)及其实施理及其实施理由由精品文档6 6A124个个班班样本样本(yngbn)200人人整群抽样整群抽样(chu yn)(chu yn)图图示示例:从全校例:从全校例:从全校例:从全校(qun xio)(qun xio)124124个班中随机抽取个班中随机抽取个班中随机抽取个班中随机抽取a=5a=5个班构成样本。个班构成样本。个班构成样本。个班构成样本。精品文档7 7在实际工作中,整群抽样方法在社会经济、农林牧业以及企业产品质量在实际工作中,整群抽样方法在社会经济、农林牧业以及企业产品质量检验中被广泛采用。检验中被广泛采用。例如,人口调查、家计调查通常以居委会(村委会)或调查小区作为群例如,人口调查、家计调查通常以居委会(村委会)或调查小区作为群进行抽样;进行抽样;农林牧业调查以地块为群进行抽样;农林牧业调查以地块为群进行抽样;工业产品质量检验:在连续工业产品质量检验:在连续(linx)(linx)生产的产品线上每隔生产的产品线上每隔2020小时抽取小时抽取1 1小时生产的全部产品进行检验。小时生产的全部产品进行检验。精品文档8 8(二)实施(二)实施(shsh)(shsh)整群抽样的原因整群抽样的原因1、当、当缺少调查单元的必要信息无法对其直接编制缺少调查单元的必要信息无法对其直接编制抽样框抽样框实施概率抽样,而由调查单元组成的群是现实施概率抽样,而由调查单元组成的群是现成成(xinchng)的或者群很容易划分、的或者群很容易划分、编制群抽样框非常编制群抽样框非常容易时容易时,常采用整群抽样。,常采用整群抽样。n例如:对例如:对杭州中学生体质杭州中学生体质(tzh)状况的调查,状况的调查,若以学校为单位进若以学校为单位进行整群抽样,就行整群抽样,就大大简化了抽样框的编制大大简化了抽样框的编制。精品文档9 92、为了使调查、为了使调查实施便利、节省费用实施便利、节省费用而采用整群抽样。而采用整群抽样。大规模调查中,调查单位的空间分布很广,整群抽样可使调大规模调查中,调查单位的空间分布很广,整群抽样可使调查单位相对查单位相对(xingdu)集中,调查实施较便利、节省费用。集中,调查实施较便利、节省费用。n例如例如(lr),城镇居民家庭生活水平调查城镇居民家庭生活水平调查,一般,一般以居委会为群以居委会为群进行整进行整群抽样调查群抽样调查。精品文档10103、对某些、对某些由特殊结构的群组成的总体由特殊结构的群组成的总体(zngt)实施整群抽样,实施整群抽样,能使精度有较大提高。能使精度有较大提高。n例如:人口统计中例如:人口统计中估计性别比例估计性别比例(bl),一个家庭本身就具一个家庭本身就具有一个性别结构有一个性别结构,以家庭为群进行整群抽样比直接对个,以家庭为群进行整群抽样比直接对个人进行调查精度要高。人进行调查精度要高。精品文档1111二、整群抽样二、整群抽样(chu yn)(chu yn)的特点的特点1 1、群与群之间不重叠群与群之间不重叠(chngdi)(chngdi),总体的任何一个基本单位,总体的任何一个基本单位都必须且只能归于某一群;都必须且只能归于某一群;2 2、整群抽样是、整群抽样是以群为单位的概率抽样以群为单位的概率抽样;3 3、群间是抽样调查群间是抽样调查,对于被抽中的,对于被抽中的群内是全面调查群内是全面调查。整群抽样的整群抽样的误差取决于群间差异误差取决于群间差异,而不受群内差异的影响。,而不受群内差异的影响。划分群时应使划分群时应使“群间差异尽量小、群内差异尽量大群间差异尽量小、群内差异尽量大”。精品文档1212 5 5、整群抽样的、整群抽样的缺点缺点:由于调查单位比较集中、在总体中由于调查单位比较集中、在总体中的分布不够的分布不够(bgu)(bgu)均匀均匀,且群内调查单位指标值或多或少具,且群内调查单位指标值或多或少具有一定的正相关性,因此有一定的正相关性,因此在样本量相同的条件下,整群抽样的精度可能不如简单在样本量相同的条件下,整群抽样的精度可能不如简单随机抽样高,尤其当群间差异较大的时候随机抽样高,尤其当群间差异较大的时候。但由于平均单位调查费用较少,因此但由于平均单位调查费用较少,因此可以把节省的费用可以把节省的费用用来适当扩大群样本量以提高整群抽样的精度用来适当扩大群样本量以提高整群抽样的精度。n4 4、整群抽样、整群抽样(chu yn)(chu yn)的的最大优点最大优点:便于组织实施,节省:便于组织实施,节省费用和时间。费用和时间。精品文档1313思考:思考:整群抽样与分层抽样都需要对总体进行划整群抽样与分层抽样都需要对总体进行划分分(hu fn),划分,划分(hu fn)的原则有何区别?理由是的原则有何区别?理由是什么?什么?精品文档1414n群可以是自然形成的实体或现有的机构、组织群可以是自然形成的实体或现有的机构、组织,如城镇、企业、,如城镇、企业、学校、街道等;学校、街道等;n也可以是也可以是人为划分的单位人为划分的单位,比如对职工分组、生产线的产品批,比如对职工分组、生产线的产品批次等。次等。n群的大小可以相等群的大小可以相等(xingdng),也可能不等,也可能不等。三、群的划分三、群的划分(hu fn)当群需要通过当群需要通过(tnggu)人为划分时,人为划分时,需考虑两个问题:需考虑两个问题:n 一是如何定义一是如何定义群的组成群的组成,n 二是如何确定二是如何确定群的规模群的规模。精品文档1515群的划分群的划分(hu fn)(hu fn)原则原则1、如何定义群的组成、如何定义群的组成(z chn)基本出发点:群的组成基本出发点:群的组成应有利于估计量精度尽可能高应有利于估计量精度尽可能高。群间差异尽量小、群内差异尽量大群间差异尽量小、群内差异尽量大n使使各群间尽量各群间尽量(jnling)有相同或相近的结构,这样群间差异就小有相同或相近的结构,这样群间差异就小,只抽少数群就可以很好地代表总体。只抽少数群就可以很好地代表总体。精品文档1616高高高高高高中中中中(zhn zhn)中中低低低低低低高高中中低低群群1高高中中低低群群2高高中中低低群群1高高中中低低群群A高高中中低低群群2高高中中低低群群a+总体总体(zngt)N高高高高中中中中低低低低样本样本n各群结构相近各群结构相近(xin jn),群间差异小群间差异小群内群内差差异异大大样本结构与总体样本结构与总体相近相近精品文档17172、如何确定、如何确定(qudng)群的规模群的规模群的群的规模的选择取决于精度与费用之间的平衡规模的选择取决于精度与费用之间的平衡。群的规模大群的规模大调查费用比较节省但精度较低;调查费用比较节省但精度较低;群的规模小群的规模小精度较高但费用较多,精度较高但费用较多,需要在两者间权衡。除了依靠实践经验外,还可对假定的方差需要在两者间权衡。除了依靠实践经验外,还可对假定的方差函数和费用函数在理论上进行最优选择函数和费用函数在理论上进行最优选择(xunz)。在正常情况下,群的规模不宜过大,在正常情况下,群的规模不宜过大,对于规模很大的群,通常需对于规模很大的群,通常需要采用多阶段抽样。要采用多阶段抽样。精品文档1818 第二节第二节 群大小相等群大小相等(xingdng)(xingdng)的整群的整群抽样抽样精品文档 宿舍宿舍1宿舍宿舍2宿舍宿舍3宿舍宿舍4宿舍宿舍5宿舍宿舍6宿舍宿舍7宿舍宿舍8学生学生158911239911011112096学生学生28383891059910011580学生学生37479949813211611763学生学生482111109107879999130学生学生5661017912999107106105学生学生6876980901241051208675.0089.0095.67104.67 108.50 106.33 112.8393.33125.60 233.60 299.07 177.87 287.5042.2772.57527.87例例1:在一次对某寄宿中学在校生零花钱的调查中,以宿舍作为群进行:在一次对某寄宿中学在校生零花钱的调查中,以宿舍作为群进行整群抽样。每个宿舍有整群抽样。每个宿舍有6个学生个学生(xu sheng)。用简单随机抽样在全部。用简单随机抽样在全部315间宿舍中抽取间宿舍中抽取8间宿舍。每人每周零花钱数据如下表所示。间宿舍。每人每周零花钱数据如下表所示。试估计该学校试估计该学校平均每个学生每周的零花钱平均每个学生每周的零花钱精品文档2020总体有总体有A群,每群都有群,每群都有M个调查单位,个调查单位,总体容量总体容量(rngling)为为AM。从中简单随机抽取从中简单随机抽取a群,群,样本容量为样本容量为aM,抽样比抽样比 f=a/A。一、记号一、记号(j ho)及目标及目标量量总体总体(zngt)第第i群第群第j个单元的指标值:个单元的指标值:Yij精品文档2121总体总体(zngt)第第i群的群总值群的群总值 总体总值总体总值总体第总体第i群的群均值群的群均值按群平均按群平均(pngjn)的总体均值的总体均值按调查单位平均的总体均值按调查单位平均的总体均值群总值的群总值的平均数平均数精品文档2222总体总方差总体总方差(fn ch):总体群间方差定义为总体群间方差定义为:总体群内方差定义为总体群内方差定义为:精品文档2323三个方差三个方差(fn ch)之间的关系为:之间的关系为:精品文档2424n样本样本(yngbn)第第i群的总值群的总值n样本样本(yngbn)第第i群的均值群的均值n按群平均按群平均(pngjn)的样本均值的样本均值n按调查单位平均的样本均值按调查单位平均的样本均值n样本第样本第i群第群第j个单位指标值个单位指标值 yijn样本总值样本总值群总值的群总值的平均数平均数精品文档2525样本样本(yngbn)总方差:总方差:样本样本(yngbn)群间方差:群间方差:样本群内方差:样本群内方差:精品文档2626样本样本(yngbn)方差的关系式:方差的关系式:由于群的选取是简单随机的,因此由于群的选取是简单随机的,因此 与与 分别是分别是 与与 的的无偏估计无偏估计 不是不是 的的无偏估计无偏估计。精品文档2727群规模相等时,对群规模相等时,对群的抽取为简单随机抽样群的抽取为简单随机抽样,将,将群总值群总值Y Yi i作为群作为群的指标值,的指标值,则总体则总体(zngt)(zngt)为:为:样本为:样本为:二、估计量及其性质二、估计量及其性质(xngzh)精品文档28281、总体、总体(zngt)均值的估计量均值的估计量精品文档2929估计量方差的另一种估计量方差的另一种(y zhn)计计算:算:精品文档3030例例1:在一次对某寄宿中学在校生零花钱的调查中,以宿:在一次对某寄宿中学在校生零花钱的调查中,以宿舍作为群进行整群抽样。每个宿舍有舍作为群进行整群抽样。每个宿舍有6个学生。用简单随机个学生。用简单随机抽样在全部抽样在全部315间宿舍中抽取间宿舍中抽取(chu q)8间宿舍。每人每周零间宿舍。每人每周零花钱数据如下页表所示。花钱数据如下页表所示。试估计该学校试估计该学校平均每个学生每周的零花钱平均每个学生每周的零花钱,并给出置信度,并给出置信度为为95%的置信区间。的置信区间。精品文档3131 宿舍宿舍1宿舍宿舍2宿舍宿舍3宿舍宿舍4宿舍宿舍5宿舍宿舍6宿舍宿舍7宿舍宿舍8学生学生158911239911011112096学生学生28383891059910011580学生学生37479949813211611763学生学生482111109107879999130学生学生5661017912999107106105学生学生6876980901241051208675.0089.0095.67104.67 108.50 106.33 112.8393.33125.60 233.60 299.07 177.87 287.5042.2772.57527.87精品文档3232n解:解:精品文档2、总体、总体(zngt)总值的估计量总值的估计量精品文档3434例例2:为估计某海域的:为估计某海域的鱼的总量,鱼的总量,从整个海域内的从整个海域内的320个区域中随机抽取个区域中随机抽取20个区域作为样本进行调查,每个区个区域作为样本进行调查,每个区域中又包含域中又包含5个基本区域。调查得数据如下个基本区域。调查得数据如下(rxi)(单位:(单位:吨):吨):样本群样本群12345678鱼量合计鱼量合计8.417.547.549.913.018.847.331.4样本群样本群910111213141516鱼量合计鱼量合计39.917.37.730.018.314.050.824.0样本群样本群17181920鱼量合计鱼量合计30.915.245.830.6yin估计整个估计整个(zhngg)海域的鱼量并计算抽样误差。海域的鱼量并计算抽样误差。精品文档3535精品文档3636思考思考(sko)(sko)邮局欲估计每个家庭邮局欲估计每个家庭(jitng)的平均订报份数,辖区内共有的平均订报份数,辖区内共有4000户,划分为户,划分为400个群,每群个群,每群10户,现随机抽取户,现随机抽取4个群,个群,取得资料如下:取得资料如下:试估计平均每户家庭的订报份数及辖区总的订报份数,并计试估计平均每户家庭的订报份数及辖区总的订报份数,并计算估计量的方差。算估计量的方差。群群各户订报数各户订报数合计合计12341,2,1,3,3,2,1,4,1,11,3,2,2,3,1,4,1,1,22,1,1,1,1,3,2,1,3,11,1,3,2,1,5,1,2,3,119201620精品文档3737若直接对调查单元进行若直接对调查单元进行(jnxng)(jnxng)简单随机抽样简单随机抽样 三、整群抽样三、整群抽样(chu yn)效果效果分析分析n可见在相同的可见在相同的调查单元样本量调查单元样本量 下,只有下,只有当当群间方差群间方差 比总体方差比总体方差 小时,整群抽样才小时,整群抽样才优于简单随机抽样优于简单随机抽样。精品文档3838而总体方差而总体方差(fn ch)(fn ch)与群内方差与群内方差(fn ch)(fn ch)、群间方差、群间方差(fn(fn ch)ch)之间有如下关系:之间有如下关系:对于固定的总体,对于固定的总体,是常数,故当群内方差是常数,故当群内方差 增增大时群间方差大时群间方差 必然减小。必然减小。n因此群的划分原则因此群的划分原则(yunz)应是使应是使群内差异尽可能大,群内差异尽可能大,群间差异尽可能小,群间差异尽可能小,以保证整群抽样的效果。以保证整群抽样的效果。精品文档3939对于对于例例1 1,如果我们直接对所有学生采用简单,如果我们直接对所有学生采用简单随机抽样抽取随机抽样抽取4848人进行调查,将表人进行调查,将表1 1的数据视的数据视为样本量为为样本量为4848的简单随机样本,则的简单随机样本,则 可见可见整群抽样误整群抽样误差比简单随机抽样要大,原因差比简单随机抽样要大,原因在于宿舍间平均在于宿舍间平均(pngjn)(pngjn)零花钱零花钱 之间差异相对之间差异相对较大,较大,精品文档40401、群内相关系数、群内相关系数 群内相关系数描述的是群内相关系数描述的是群内成对个体单位之间群内成对个体单位之间的相关的相关(xinggun)程度程度,表达为,表达为 四、群内相关系数与设计四、群内相关系数与设计(shj)效应效应协方差协方差方差方差(fn ch)精品文档4141当当A大时上式可写成大时上式可写成n若各群均值若各群均值(jn zh)都相等,则群都相等,则群间方差为间方差为0,此时,此时 达到最达到最小值小值 将将 用用 和和 代替,可得代替,可得 所以所以 取值于取值于 若群内各单位若群内各单位(dnwi)值都相等,值都相等,群内方差为群内方差为0,达达到最大值到最大值1精品文档42422、整群抽样的设计、整群抽样的设计(shj)效应效应而相同而相同(xin tn)样本量下简单随机抽样的方差为样本量下简单随机抽样的方差为因此因此(ync)整群抽样的设计效应整群抽样的设计效应为为精品文档4343nDeffDeff何时何时(h sh)(h sh)1,1,1,=1?1,=1?精品文档4444相同相同(xin tn)(xin tn)样本量的情况下,整群抽样的估计量方差为简单样本量的情况下,整群抽样的估计量方差为简单随机抽样的方差的随机抽样的方差的 倍倍。要想获得要想获得相同的估计量方差,那么整群抽样的样本量必须是相同的估计量方差,那么整群抽样的样本量必须是简单随机抽样样本量的简单随机抽样样本量的 倍倍。这个事实提供给我们确定整群抽样的样本量的重要思路!这个事实提供给我们确定整群抽样的样本量的重要思路!的另一个的另一个(y)启示:启示:精品文档4545n在在例例1中,中,Deff=2.741,即要想达到与简单随机抽样同样,即要想达到与简单随机抽样同样(tngyng)的误的误差,整群抽样的样本量应为简单随机抽样的差,整群抽样的样本量应为简单随机抽样的2.741倍。倍。样本量的确定样本量的确定(qudng)精品文档4646实际调查中,群内相关系数可由小规模试抽样的样本资实际调查中,群内相关系数可由小规模试抽样的样本资料料(zlio)来估计来估计精品文档4747例例3 对全国成年人身体尺寸对全国成年人身体尺寸(ch cun)测量,若以工作单位为现成的测量,若以工作单位为现成的群,则这些单位一般不是等规模,可用平均大小比如群,则这些单位一般不是等规模,可用平均大小比如 人计算。人计算。通过少量样本的试抽样,得单位内同性别人的群内通过少量样本的试抽样,得单位内同性别人的群内相关估计相关估计 。根据精度要求,简单随机抽样需。根据精度要求,简单随机抽样需要样本量为要样本量为6147人,那么整群抽样需要多少人才能达到同样的估计精人,那么整群抽样需要多少人才能达到同样的估计精度?度?整群抽样需要人数整群抽样需要人数 人人约等于约等于 个群个群r精品文档4848第三节第三节 估计估计(gj)(gj)总体比例的整群抽样总体比例的整群抽样精品文档4949 在估计总体比例时在估计总体比例时普遍采用整群抽样,普遍采用整群抽样,优点如下优点如下:判断一个单元是否具有某项特征的调查,调查费用很低,判断一个单元是否具有某项特征的调查,调查费用很低,而组织、差旅费相对较大;而组织、差旅费相对较大;整群抽样整群抽样可以大大节省组织、可以大大节省组织、差旅费用,从而差旅费用,从而使使总费用比较节省总费用比较节省;由于比例由于比例总体的方差不超过总体的方差不超过0.250.25,群间方差一般也比较,群间方差一般也比较小小,因此,因此估计总体比例时采用整群抽样能有较高的精度估计总体比例时采用整群抽样能有较高的精度。对某些特殊对某些特殊(tsh)(tsh)结构的群,整群抽样甚至比直接对调查单元结构的群,整群抽样甚至比直接对调查单元的简单随机抽样有高得多的精度。的简单随机抽样有高得多的精度。一、问题一、问题(wnt)(wnt)(wnt)(wnt)的提出的提出精品文档5050设总体含设总体含A A个群,每个群均含个群,每个群均含M M个调查个调查(dio ch)(dio ch)单元,定义单元,定义 1 1,第,第i i群第群第j j调查单元具某特征,调查单元具某特征,=0 0,不具有某特征,不具有某特征二、估计量及其性质二、估计量及其性质(xngzh)(xngzh)(xngzh)(xngzh)则则 总体总体(zngt)第第i群群具有某特征的调查单元的总数及比例具有某特征的调查单元的总数及比例为:为:样本第样本第i i群中具有某特征的调查单元数及群比例为群中具有某特征的调查单元数及群比例为精品文档5151总体中具有某特征的调查单元的总数总体中具有某特征的调查单元的总数(zngsh)及总体比例为:及总体比例为:样本中具有样本中具有(jyu)(jyu)某特征的调查单元数及样本比例为某特征的调查单元数及样本比例为Pi的均值的均值(jn zh)精品文档5252由于由于(yuy)(yuy)对对群的抽取为简单随机抽样群的抽取为简单随机抽样,将,将群比例群比例P Pi i作为群的指标值,作为群的指标值,则总体为:则总体为:样本为:样本为:srs精品文档5353例:例:对某居民对某居民(jmn)小区居民小区居民(jmn)户进行网络使用情况的调查,户进行网络使用情况的调查,以每个楼层(相当于居民以每个楼层(相当于居民(jmn)小组)为群进行整群抽样。每小组)为群进行整群抽样。每个楼层都有个楼层都有8个住户。个住户。用简单随机抽样在全部用简单随机抽样在全部510个楼层中抽取个楼层中抽取12个楼层个楼层。下表是。下表是12个样本楼层使用网络的住户数个样本楼层使用网络的住户数 及在楼层及在楼层8户中所占的比例的资料,试对该小区的网络使用率进行估计。户中所占的比例的资料,试对该小区的网络使用率进行估计。123456i789101112i4356340.50.3750.6250.750.3750.55264350.6250.250.750.50.3750.625上网上网(shn wn)户户数数上网上网(shn wn)户户数数占比占比占比占比精品文档5454思考思考(sko):汽车运输公司抽样检查在用车辆中:汽车运输公司抽样检查在用车辆中不安全轮胎的不安全轮胎的比例比例。在。在175辆车中随机抽取了辆车中随机抽取了25辆,其不安全轮胎数如表辆,其不安全轮胎数如表所示。试估计该公司的汽车中不安全轮胎的比例及其方差。所示。试估计该公司的汽车中不安全轮胎的比例及其方差。不安全轮胎的个数(个)不安全轮胎的个数(个)汽车数量(辆)汽车数量(辆)0123458723精品文档小结小结(xioji)(xioji)n n估计估计估计估计(gj)(gj)总体均值总体均值总体均值总体均值估计总体估计总体估计总体估计总体(zngt)(zngt)比例比例比例比例精品文档56561.下面关于群内相关系数的说法错误的是下面关于群内相关系数的说法错误的是:A.若群内若群内各单元值都相等各单元值都相等(xingdng)则则 ,此时,此时 取取最大值最大值1B.若群内方差与总体方差相等,则若群内方差与总体方差相等,则 ,此时表示,此时表示分群是完全随机的分群是完全随机的C.若若 取负值取负值,则整群抽样的效果好于简单随机抽则整群抽样的效果好于简单随机抽样。样。D.若若 取正值取正值,则则整群抽样的效果好于简单随机抽整群抽样的效果好于简单随机抽样。样。思考思考(sko)(sko)与练习:与练习:精品文档57572.下面关于整群抽样的说法,有哪些是正确的?(下面关于整群抽样的说法,有哪些是正确的?()A.通常情况下抽样误差比较大通常情况下抽样误差比较大B.整群抽样可以看作为多阶段抽样的特殊情形,即最后整群抽样可以看作为多阶段抽样的特殊情形,即最后一阶抽样是一阶抽样是100%的抽样的抽样C.调查相对比较集中,实施便利,节省费用调查相对比较集中,实施便利,节省费用D.整群抽样的方差约为简单整群抽样的方差约为简单(jindn)随机抽样的方差的随机抽样的方差的 倍倍E.为了获得同样的精度,整群抽样的样本量是简单随机为了获得同样的精度,整群抽样的样本量是简单随机抽样的抽样的 倍倍。精品文档58583.关于整群抽样(群规模相等)的设计效应,下面说关于整群抽样(群规模相等)的设计效应,下面说法正确的有(法正确的有()A.B.为了获得同样的精度,整群抽样的样本量是简单随为了获得同样的精度,整群抽样的样本量是简单随机抽样的机抽样的 倍倍C.要提高整群抽样要提高整群抽样的估计效率的估计效率,可通过增大群内相,可通过增大群内相关系数关系数来实现来实现D.要提高整群抽样估计效率,可通过增大群内单元要提高整群抽样估计效率,可通过增大群内单元的差异的差异(chy)实现实现E.整群抽样的精度取决于群整群抽样的精度取决于群间方差,群间方差越大,间方差,群间方差越大,则估计量的精度越高则估计量的精度越高精品文档4、若欲调查某城市的猪肉人均消费量,讨论下列情况下、若欲调查某城市的猪肉人均消费量,讨论下列情况下采用街道作为群采用街道作为群的整群抽样是否合适;如果不合适,你认的整群抽样是否合适;如果不合适,你认为应采用什么抽样方式好:为应采用什么抽样方式好:(1)少数民族的居住比较集中;)少数民族的居住比较集中;(2)少数民族比较均匀)少数民族比较均匀(jnyn)地分布在各条街道;地分布在各条街道;(3)少数民族分散在各街道,但比重不同。)少数民族分散在各街道,但比重不同。精品文档6060案例:全国成年人的体型尺寸测量的抽样案例:全国成年人的体型尺寸测量的抽样(chu yn)(chu yn)方案方案考虑考虑(kol)到我国人口分布的现状及人体测量的特点,在制定到我国人口分布的现状及人体测量的特点,在制定抽样方案时应对总体做必要的划分,抽样方案时应对总体做必要的划分,对每个子总体:成年男子、对每个子总体:成年男子、成年女子都采用分层整群抽样成年女子都采用分层整群抽样。1、层的划分及群的组成、层的划分及群的组成采用分层整群抽样必须考虑到影响人的体型尺寸的因素,比如地域、采用分层整群抽样必须考虑到影响人的体型尺寸的因素,比如地域、年龄的影响,同时考虑到测量工作的方便年龄的影响,同时考虑到测量工作的方便。精品文档6161(1)按地域分层)按地域分层 多种历史资料表明,多种历史资料表明,中国人人体尺寸与地域的关系极为密切。中国人人体尺寸与地域的关系极为密切。参考有关资料,按人类学的观点将参考有关资料,按人类学的观点将全国各省市自治区分为全国各省市自治区分为6个自个自然区域。然区域。在同一区域中,有的由于地理、气候、遗传等因素影响,差别仍较在同一区域中,有的由于地理、气候、遗传等因素影响,差别仍较大,因此再进一步根据几种历史资料中大,因此再进一步根据几种历史资料中各省成年人平均身高各省成年人平均身高(shn o)资料,划分为高、中上、中下及矮四档资料,划分为高、中上、中下及矮四档。最终最终所有省区分为所有省区分为12个层个层,在抽样时为了工作方便,在抽样时为了工作方便,在层内选在层内选取一个或几个省(市、自治区)取一个或几个省(市、自治区)进行测量。进行测量。为了今后数据分析方便,在为了今后数据分析方便,在各层中采用按人口总数比例分配的各层中采用按人口总数比例分配的方法。方法。精品文档6262表表1:中国人体型:中国人体型(txng)的地域划分的地域划分 区域区域平均身高平均身高123456矮矮湖南、湖南、江西江西广广东、广西广西四川、四川、贵州州中下中下甘甘肃、青海、青海浙江、浙江、安徽安徽湖北湖北福建福建云南云南中上中上陕西、宁夏、西、宁夏、山西、河南、山西、河南、西藏西藏江江苏、上海上海高高黑黑龙江、吉林江、吉林辽宁、内蒙、宁、内蒙、河北、北京、河北、北京、天津、山天津、山东 新疆新疆精品文档6363(2 2)群的组成)群的组成 为了测量工作方便,为了测量工作方便,在层内采用随机整群抽样在层内采用随机整群抽样。在群的抽取过程中,特别要注意的是群内个体的年龄结构。在群的抽取过程中,特别要注意的是群内个体的年龄结构。资料表明,资料表明,不同年龄段的人体型尺寸有明显差异不同年龄段的人体型尺寸有明显差异。因此规定:因此规定:整群样本应当是一个自然整群样本应当是一个自然(zrn)(zrn)的群体单位的群体单位,如一个独,如一个独立的实际单位,或一个单位的一个或几个车间或部门。立的实际单位,或一个单位的一个或几个车间或部门。人数恰好达人数恰好达到方案规定的群体大小到方案规定的群体大小(允许有几个人的误差,避免在一个较大单(允许有几个人的误差,避免在一个较大单位中人为挑选被测人员,以凑够规定的群体大小)。位中人为挑选被测人员,以凑够规定的群体大小)。这样做能尽量这样做能尽量使样本中各年龄段的结构与总体中相应结构基本一致。使样本中各年龄段的结构与总体中相应结构基本一致。必要时可通过适当选择样本群以调整样本中的年龄结构,必要时可通过适当选择样本群以调整样本中的年龄结构,例如,当中例如,当中老年人的被测人数不足时,可有意选择一些历史较长、老同志较多的单老年人的被测人数不足时,可有意选择一些历史较长、老同志较多的单位,例如多抽取一些办公室、科研单位等。位,例如多抽取一些办公室、科研单位等。精品文档6464(3 3)群的大小)群的大小整群抽样的设计效应为整群抽样的设计效应为deff1+(M-1),Mdeff1+(M-1),M为群规模的为群规模的平均大小。平均大小。对于对于,我们根据,我们根据对四川省的试测数据对四川省的试测数据计计算得到算得到(d do)(d do)群间方差和群内方差群间方差和群内方差的样本估计以及当时的样本估计以及当时实测的群平均规模(实测的群平均规模(=124=124),),根据公式,估计出根据公式,估计出 =0.00775=0.00775。为提高效率,同时也为测量方便,减少因测试人员疲为提高效率,同时也为测量方便,减少因测试人员疲劳引起测量误差增大,我们劳引起测量误差增大,我们取群平均规模取群平均规模=80=80人,即一人,即一个测量组一天的工作量个测量组一天的工作量。精品文档6565(4 4)整群抽样的样本量)整群抽样的样本量根据根据deff1+(M-1)deff1+(M-1),样本量应为,样本量应为 n n=n deff=n1+(M-1)=n deff=n1+(M-1)。在给定抽样极限误差和概率保证程度下,可在给定抽样极限误差和概率保证程度下,可计算出简单计算出简单随机抽样的样本量随机抽样的样本量n n,据此公式,据此公式推算出整群抽样的样本推算出整群抽样的样本量量n n。在实际问题中,考虑到测试记录在实际问题中,考虑到测试记录(jl)(jl)可能出现的错可能出现的错误以及其他原因,在数据处理时,可能剔除一部分误以及其他原因,在数据处理时,可能剔除一部分数据,因此我们数据,因此我们通常在通常在n n的基础上再加上的基础上再加上10%10%左右的余左右的余量。量。精品文档内容摘要第七章 整群抽样。若总体可分为 A个初级单位(称为群),每个初级单位包含若干次级单位。工业产品质量检验:在连续生产的产品线上每隔20小时抽取1小时生产的全部产品进行检验。3、对某些由特殊结构的群组成的总体实施整群抽样,能使精度有较大提高。1、群与群之间不重叠,总体的任何一个基本单位都必须且只能归于某一群。3、群间是抽样调查,对于(duy)被抽中的群内是全面调查。划分群时应使“群间差异尽量小、群内差异尽量大”。但由于平均单位调查费用较少,因此可以把节省的费用用来适当扩大群样本量以提高整群抽样的精度。整群抽样与分层抽样都需要对总体进行划分,划分的原则有何区别。群间差异尽量小、群内差异尽量大。(4)整群抽样的样本量精品文档
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!