综合变量法在多目标分层抽样中的应用

上传人:仙*** 文档编号:163748277 上传时间:2022-10-22 格式:DOC 页数:9 大小:338.50KB
返回 下载 相关 举报
综合变量法在多目标分层抽样中的应用_第1页
第1页 / 共9页
综合变量法在多目标分层抽样中的应用_第2页
第2页 / 共9页
综合变量法在多目标分层抽样中的应用_第3页
第3页 / 共9页
点击查看更多>>
资源描述
综合变量法在多指标分层抽样中的应用摘 要本文采用综合变量法对多目标总体进行分层抽样,并设计了T变量作为估计量,比较了综合变量法和简单随机抽样的优劣性。而后通过案例证明了上述结论。关键词:多指标抽样 分层抽样 主成分分析 综合变量法引言抽样调查作为认识社会现象的工具已经得到了广泛应用,其在政治、经济、文化、军事、人口等领域已经成为了广泛使用的有效方法。并且绝大部分的抽样调查都是希望能在一次调查中得到多个结论,因此多目标抽样是普遍使用的方法,关于这方面的研究已经有了很多成果,但依然不能满足现实的需要,所以对多目标抽样进行研究是很有现实意义的。本文将在已有理论的基础上,试图对多目标的分层抽样问题进行研究,采用主成分方法处理辅助信息,而后用综合变量法分层,研究该方法的性质。一、模型介绍将进行主成分变换后,计算求得综合变量,即其中为主成分的贡献率。以作为分层标志,进行综合变量法分层抽样。这种变换将原来的多指标转换为了单指标,而后就可以用单指标的方法进行分层抽样。层数的确定可以按照如下准则:至于分层的界限,只要满足下面关系:就可以使达到最小。现实中仍然采用戴伦纽斯和霍奇斯(Dalenius and Hodges)提出的快速近似法计算。抽样方法若总的样本量固定,如何把这个样本进行分配到各层,在各层的分配取决于层的规模、层内的方差和抽样的费用。这里只讨论最优分配,至于比例分配和内曼分配是最优分配的特例。最优分配为确定了在各层的样本量后,在各层的抽样方式这里采用简单随机抽样。分层抽样中,样本量的确定不仅取决于精度要求和费用的限制,而且取决于如何分层和样本在各层的分配方式。这里精度要求的上限设定为,第层的每单元抽样费用为,采用最优分配方式下,样本量计算公式如下:二、多目标分层抽样估计量设计目标变量的均值估计量为,其简单估计量为是的无偏估计量,即该估计量的方差为由于多个研究变量的量纲并不完全相同,并且的均值估计量的方差不止一个,所以不同方法求得的均值估计量的方差协方差矩阵无法进行比较,也就无法对各种抽样设计方法进行评价和进一步研究。因此这里提出了一种解决上述问题的方法,为消除量纲影响,将均值估计量的方差比上均值估计量的平方,至于多目标变量无法比较的问题,可以将消除了量纲的方差加总求和,由此定义一个新的变量。定义:在多目标抽样中,目标变量之间量纲不同,其样本均值的方差无法直接比较,为的变异系数,将其平方求和得到值是消除了量纲影响的方差之和,它将作为多目标抽样的精度指标。显然,值的大小就可以说明抽样设计效果的好坏,值越小,表明抽样精度越高,反之,抽样精度越低。在分层抽样中,的表达式为:根据前面的假设条件和有关主成分分析的性质,基于主成分综合的方法,求得的有如下性质:证明:也可以用矩阵的迹的形式来表示,即为当和极小,可以忽略时已知有 所以 证毕为了方便,下面对进行讨论 综合变量法根据上面的介绍,综合变量法是将综合变量排序后,进行分层抽样,分层的结果是保证了最小。即 (3.3)是最小的。在满足什么条件时,可以采用综合变量法抽样,而使值达到最小。可以看出当与成反比例关系时,采用综合变量法抽样会更优。证明:对3.2式进行整理,有 (3.4)对比3.3式与3.4式,3.4式是在3.3式的基础上加了权重。当与成反比例关系,即时,值就是综合变量的方差的倍数,可以表示为,显见,与成反比例关系时,采用综合变量法抽样最优。当与不成反比例关系时,即不全相等,此时,若采用综合变量法进行分层,使得达到最小,不能保证值是最小的。综上,采用综合变量法抽样的条件是与成反比例关系 证毕其中 ,所以,从而证明了多指标情况下无论是超空间区域法还是综合变量法分层抽样的方差都是小于等于简单随机抽样的方差。三、与简单分层抽样比较这里定义简单分层抽样为:在多指标抽样中,只用一个指标作为抽样标志的分层抽样方法。这里我们假定使用作为分层标志,将样本分为个层,其他指标的证明同理。下面将分别将此方法与超空间区域法和综合变量法分层抽样进行比较,比较他们在何种条件下,他们的值更小。上一节已经说明,用进行分层得到的均值估计量的分层抽样方差为。其设计效应为简称为。用综合变量法进行分层,即用作为分层标志,将样本分为层。这种方法的设计效应为简称为。现在分别采用简单分层抽样和综合变量法抽样,之后得到的值分别用和表示,即已知采用这两种抽样方法计算的估计量都是的无偏估计量,即,因此,假设上式的相等,而后就可以比较和的大小。和作差有可以看出差值的大小主要取决于与的大小,而,所以上式分解为:其中,而,所以的大小并不是固定的,这要取决于每一主成分变量的设计效应,以及设计效应对应的权重(方差与均值之比)。根据经验,在综合变量法中,欲使的分层抽样方差最小,被赋予较大权重的应该得到较小的设计效应。所以,与的大小应该差不多,这样就会有由此判断,会是更为常见的状态。通常情况下,综合变量法还是优于简单分层抽样的,但是这个结论并不是确定的,也会有特殊情况出现。综上,综合变量法和简单分层比较来看,在费用方面,两种方法没有什么区别,它们都是将总体划分成了层,而后在层中进行简单随机抽样。在精度方面,综合变量法可能会有更大的优势,通常情况下,综合变量法会比简单分层抽样更优。四、案例分析本文研究的两种方法都是基于主成分综合的,因此,首先将原数据进行主成分变换,原变量主成分变换为,表达式如下: (5-1)使用SPSS19.0对数据进行相关性分析,从表5.1可以看出指标之间存在着一定的相关性,需要通过主成分分析法将相关的指标转换为相互独立的指标,主成分分析得到的表5.2解释的总方差表,这里保留了所有主成分,四个主成分的方差贡献率分别为38.849%、24.984%、22.802%和13.366%,由表5.3成分矩阵表可以得到结果如下: (5-2)由此便得到了变换之后的主成分数据。表5.1 相关系数表食品衣着居住交通和通信相关食品1.000.442.187.113衣着.4421.000.046.142居住.187.0461.000.019交通和通信.113.142.0191.000Sig.(单侧)食品.000.000.000衣着.000.039.000居住.000.039.232交通和通信.000.000.232表5.2 解释的总方差表成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %11.55438.84938.8491.55438.84938.8492.99924.98463.833.99924.98463.8333.91222.80286.634.91222.80286.6344.53513.366100.000.53513.366100.000提取方法:主成份分析表5.3 成份矩阵表成 份1234食品.821.103-.213-.520衣着.781-.186-.343.487居住.355.789.475.162交通和通信.379-.577.723-.029提取方法:主成份分析表5.4 超空间区域法均值及比较总体均值样本均值相对误差(%)标准差食品6997.34 6997.770.0062651.37衣着2206.242148.96-2.5961411.33居住1980.951920.08-3.0733513.61交通和通信2329.391852.00-20.4941753.25综合变量法也是基于主成分分析的抽样设计方法,由式5-2和表5.2中的方差贡献率可以求出综合变量的值,而后以作为分层标志,为方便与超空间区域法进行对比,在该方法下,将总体分为16层,临界值同样采用快速近似法确定,每一层的个数为,按照10%的抽样比进行抽样后,各层的样本数分别为,运用SPSS19.0里的复杂抽样功能进行一次抽样后有表5.5所示结论。表5.5 综合变量法均值及比较总体均值样本均值相对误差(%)标准差食品6997.34 7004.460.1022897.92衣着2206.242107.55-4.4731693.09居住1980.951752.32-11.5411328.44交通和通信2329.391762.20-24.3491262.34五、结论本文所研究的抽样方法是基于主成分分析方法而设计的超空间区域法和综合变量法,介绍了两种抽样方法的实施过程,粗略地说明了两种的优势和劣势,为多目标分层抽样理论提供了一个新的思路,其创新之处表现为:一、证明了W.G.Cochran的的结论在多变量抽样中同样有效。二、采用了多元统计分析中的主成分分析方法研究多目标分层抽样。三、丰富了多目标分层抽样方法。本文试图将辅助信息充分利用到分层抽样的抽样设计阶段,通过主成分变换实现了这一目标,取得了一定的效果,但仍然存在很多未解决的问题。参考文献1冯士雍,施锡铨.抽样调查理论、方法与实践M.上海:上海科学技术出版社 ,1996,54-99.2何晓群.多元统计分析M.北京:中国人民大学出版社,2009,152-190.3施锡铨.抽样调查的理论与方法M. 上海:上海财经大学出版社,1996, 44-63.4金勇进,杜子芳,蒋 妍.抽样技术M.北京:中国人民大学出版社,2008,75-132,239-2615刘建平.辅助信息在抽样调查中的应用模型与方法M.中国统计出版社,2007,89-1086刘建平,陈光慧.通过对辅助变量的线性转化来改进比率估计M.统计研究,2006,69-717刘建平,陈光慧.MPPS抽样下Hansen-Hurwitz估计量的扩展J统计研究, 2005,50-52.8刘建平,陈光慧.辅助信息在二重抽样中的应用J.理论新探.2006第3期,16-17.9林才生. 多目标分层次复合抽样设计研究D.2006.10卢山.迭代方法在多目标总体抽样调查中的应用J.统计研究,2005,53-5711刘建平, 陈光慧. 利用辅助信息提高事后分层估计量的精度J. 理论新探,2007.11-13.12彭念一,陈曜.对分层抽样设计的改进J.统计研究,2001年第3期51-54.13庞新生.多目标双重事后分层抽样中辅助变量的选择J.统计与信息论坛2001第45期,63-64,77.14魏利东,闰在在,洪志敏.以多辅助指标线性组合为辅助信息的比估计法J.数理统计与管理, 2009 ,443-448.15王学民.多指标分层抽样中样本容量折衷分配的加权方法J.理论新探,2006,27.16王佐仁,张维群,耿宏强. 高低成本指标广义相关下的多目标复合抽样方法的设计与应用J. 统计与信息论坛,2004,22-26.17王国明,石庆焱.成本条件下多目标复合抽样设计J.统计研究.2002第11期17-20.18魏航,陈沁群.多变量分层抽样技术的改进与应用J.科学技术与工程.2010第12期2980-2983.19肖玲. 多主题分层抽样的分层技术J.统计研究,1994,74-76.20俞纯权. 多指标目录抽样的排列标识与最优分界点J.广西商专学报,1993.21张维群. 多目标抽样调查的模型选择J. 统计理论与方法,1999,39-42.22张维群.均匀设计在多指标抽样调查方案设计中的应用J.统计与信息论坛.2009, 第10 期,18-23.23曾五一.统计调查体系与调查方法问题研究M.中国统计出版社.2009,84-12224W.G. 科克伦著 张尧庭、吴辉译.抽样技术M. 北京:中国统计出版社,1985.25 Bengt Rosen. On sampling with probability proportional to size. Journal of Statistical Planning and Inference 62 (1997) 159-191.26 Kuk,A.Y.C.A .Kernel Method for Estimating Finite Population Distribution Functions Using Auxiliary Information.Biometrika.199327 Sen, P.K., 1953.On the estimate of the variance in sampling with varying probabilities. J. Indian Soc.Agricultural Statist. 5, 119127.28 Sengupta . S. 1989. On Chaos unequal probability sampling plan J. Biometrika 76: 192196.29 Wu Chang Hun, Zhang Run Chu. Empirical Likelihood Method under Stratified Random Sampling Using Auxiliary Information and the Information in the Strata Population Size. Chinese Journal of Applied Probability and Statistics V61.22 No.4 Nov.2006.30张勇,周魏,涂玉娟.MPPS 抽样设计方差估计的比较研究J.统计研究,2006,(4):64-68.31虞明娟.多目标抽样若干问题探讨D.2007.1.32 On Two Different Aspects of the Representative Method: The Method of Stratified Sampling and the Method of Purposive Selection33 Ratio Estimation and Finite Populations: Some Results Deducible from the Assumption of an Underlying Stochastic Process34 Some Results on Generalized Difference Estimation and Generalized Regression Estimation for Finite Population35刘红英,关于多目标分层抽样方法及其应用研究
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!