四章分层随机抽样

上传人:hjk****44 文档编号:244624826 上传时间:2024-10-05 格式:PPTX 页数:63 大小:1.38MB
返回 下载 相关 举报
四章分层随机抽样_第1页
第1页 / 共63页
四章分层随机抽样_第2页
第2页 / 共63页
四章分层随机抽样_第3页
第3页 / 共63页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,第四章 分层随机抽样,4.1概述,4.1,.,.1分层抽,样,样(stratifiedsampling)、分层随,机,机抽样(stratifiedrandomsampling):,分层抽,样,样:将容,量,量为N的总体,分,分成L个不相,重,重叠的,子,子总体,,,,子总,体,体的大,小,小分别,为,为N1、N2、NL,皆已,知,知,且,每个子,总,总体就,称,称为层。从每层,中,中独立,地,地进行,抽,抽样,,这,这样的,抽,抽样方,法,法称为分层抽,样,样。,分层随,机,机抽样:在分,层,层抽样,中,中,如,果,果每层,中,中的抽,样,样都是,简,简单随,机,机抽样,,,,则这,样,样的分,层,层抽样,称,称为分,层,层随机,抽,抽样。,4.1,.,.2分层抽,样,样的适,用,用场合:,(1)不仅,需,需要估,计,计总体,参,参数,,也,也需要,估,估计各,层,层参数,。,。,(2)便于,管,管理,,按,按现成,的,的地理,分,分布或,行,行政划,分,分来分,层,层。,(3)希望,样,样本中,能,能包含,各,各个部,分,分,以,增,增加代,表,表性。,(4)把一,个,个内部,差,差异很,大,大的总,体,体分成,几,几个内,部,部比较,相,相似的,子,子总体,(,(层),进,进行分,层,层抽样,,,,可以,提,提高估,计,计量的,精,精度。,如,如果有,极,极端值,,,,也可,以,以把它,们,们分离,出,出来形,成,成一层,。,。,即“层,间,间方差,大,大,层,内,内方差,小,小”。,4.2简单估,计,计量及,其,其性质,对总体,均,均值或,总,总值的,估,估计:,一、分,层,层抽样,中,中,例4.:调,查,查某地,区,区的居,民,民奶制,品,品年消,费,费支出,,,,以居,民,民户为,抽,抽样单,元,元,根,据,据经济,及,及收入,水,水平将,居,居民户,分,分为,层,层,每,层,层按简,单,单随机,抽,抽样抽,取,取,户,户,调,查,查数据,如,如下,,估,估计该,地,地区居,民,民奶制,品,品年消,费,费总支,出,出及估,计,计的标,准,准差。表:样,本,本户奶,制,制品年,消,消费支,出,出,层,居民户总数,样本户奶制品年消费支出,1,2,3,4,5,6,7,8,9,10,1,200,10,40,0,110,15,10,40,80,90,0,2,400,50,130,60,80,100,55,160,85,160,170,3,750,180,260,110,0,140,60,200,180,300,220,4,1500,50,35,15,0,20,30,25,10,30,25,解:,(3)该地,区,区居民,奶,奶制品,年,年消费,总,总支出,的,的置信,度,度为95%的置信,区,区间为,例4.3:某市,进,进行家,庭,庭收入,调,调查,,分,分城镇,居,居民及,农,农村居,民,民两部,分,分抽样,,,,在全,部,部城镇,居,居民23560户中随,机,机抽取300户,在,全,全部农,村,村居民148420户中随,机,机抽取250户,调,查,查结果,是,是城镇,年,年平均,户,户收入,为,为15180元,标,准,准差为2972元;农,村,村年平,均,均户收,入,入为9856元,标,准,准差为2546元。求,全,全市年,平,平均户,收,收入的,置,置信度,为,为90%的置信,区,区间。,解:,3、分层,随,随机抽,样,样中,,总,总体比,例,例P的简单,估,估计,估计的,性,性质,(,1,),(,2,),例:在,某,某行业,技,技术人,员,员中,,按,按年龄,分,分层,,调,调查会,使,使用计,算,算机者,所,所占的,比,比例。,数,数据如,下,下:,试估计,总,总体中,会,会计算,机,机者占,的,的比例,。,。,层,人数,入样人数,样本中会使用计算机的人数,30,岁以下,7781,71,24,3035,岁,7497,68,12,3640,岁,9779,89,22,4145,岁,4627,42,11,45,岁以上,5366,50,4,总计,35050,320,解:,4.3各层样,本,本量的,分,分配,在分层,随,随机抽,样,样中,,假,假设样,本,本量n固定,1.比例分,配,配:指,按,按各层,层,层权(,各,各层单,元,元数占,总,总体单,元,元数的,比,比例),进,进行分,配,配。,例:假,设,设某公,司,司欲估,计,计某类,产,产品的,用,用户的,每,每年平,均,均支出,。,。企划,人,人员拟,就,就整个,潜,潜在用,户,户的名,单,单,共8000户。,采用分,层,层随机,抽,抽样抽,取,取样本200户,求,按,按比例,分,分配时,各,各层样,本,本量。,层,每层中的潜在用户,少用,2000,中等,4000,多用,2000,总和,N=8000,例.某电视,台,台要在,某,某地区,的,的住户,中,中,调查该,台,台的晚,间,间新闻,的,的收视,率,率。该,地,地区包,括,括3个县,共有67401家住户,。,。假定,该,该电视,台,台采用,分,分层随,机,机抽样,分,分别从,三,三个县,抽,抽取住,户,户,样,本,本量为1500。每个,县,县的总,户,户数以,及,及抽样,数,数据列,表,表如下,:,:,求该地,区,区新闻,收,收视率,的,的95%的置信,区,区间。,县,h,每个县的户数,N,h,每个县被抽出的户数,n,h,每个县的样本收视率,p,h,1,2,3,48107,12419,6875,1071,276,153,0.27,0.18,0.17,合计,N=67401,n=,1500,解:分,层,层随机,抽,抽样时,,,,收视,率,率P的估计,为,为:,收视率P的置信,度,度为95%的近似,置,置信区,间,间为:,即有95%的把握,可,可以认,为,为,该,地,地区的,新,新闻收,视,视率在22.1%26.5%之间。,2.最优分,配,配:,例.在例4.3中,样,本,本量仍,为,为n=550。,城镇居,民,民23560户,农,村,村居民148420户。,城镇居,民,民与农,村,村居民,的,的年收,入,入的标,准,准差分,别,别为S1=3000元,S2=2500元。,对城镇,居,居民与,农,农村居,民,民抽样,平,平均每,户,户的费,用,用比为1:2,,试求城,镇,镇与农,村,村两层,比,比例分,配,配与最,优,优分配,的,的样本,量,量。,又若不,考,考虑费,用,用因素,,,,那么,最,最优分,配,配的结,果,果如何,?,?,例3.:调,查,查某地,区,区的居,民,民奶制,品,品年消,费,费支出,,,,以居,民,民户为,抽,抽样单,元,元,根,据,据经济,及,及收入,水,水平将,居,居民户,分,分为,层,层,每,层,层按简,单,单随机,抽,抽样抽,取,取,户,户,调,查,查数据,如,如下,,估,估计该,地,地区居,民,民奶制,品,品年消,费,费总支,出,出及估,计,计的标,准,准差。表:样,本,本户奶,制,制品年,消,消费支,出,出,层,居民户总数,样本户奶制品年消费支出,1,2,3,4,5,6,7,8,9,10,1,200,10,40,0,110,15,10,40,80,90,0,2,400,50,130,60,80,100,55,160,85,160,170,3,750,180,260,110,0,140,60,200,180,300,220,4,1500,50,35,15,0,20,30,25,10,30,25,解:按,比,比例分,配,配时,,对于Neyman分配,,4.4样本总,量,量的确,定,定,1.在分层,随,随机抽,样,样中,,影,影响样,本,本总量n的因素,:,:,(1)只讨,论,论对总,体,体参数,的,的精度,要,要求;,(2)样本,量,量的分,配,配形式,。,。,2.在估计,总,总体均,值,值时,若精度,要,要求给,定,定,样本总,量,量n的确定,公,公式:,证明:,*,例:某,地,地区采,用,用按比,例,例分层,随,随机抽,样,样对养,猪,猪场的,调,调查,,根,根据养,猪,猪场的,规,规模大,小,小分为,大,大、中,、,、小三,层,层。已,知,知上次,调,调查的,资,资料如,下,下:某,地,地区采,用,用按比,例,例分层,随,随机抽,样,样对养,猪,猪场的,调,调查,,根,根据养,猪,猪场的,规,规模大,小,小分为,大,大、中,、,、小三,层,层。已,知,知上次,调,调查的,资,资料如,下,下:,估计该,地,地区生,猪,猪存栏,总,总数的,精,精度要,求,求为以95%的置信,度,度,相,对,对误差,为,为10%,试确,定,定这次,调,调查的,总,总样本,量,量以及,各,各层样,本,本量。,层(,h,),N,h,第,h,层样本均值,第,h,层样本方差,1,2,3,432,546,322,43.2,26.5,13,170.11,69.92,20.23,总计,1300,解:,例:某,流,流水线,生,生产了1500件产品,,,,为估,计,计产品,的,的合格,率,率,将,产,产品按,早,早、中,、,、晚班,分,分成三,层,层。各,班,班产量,分,分别为,:,:早班550件,中,班,班500件,晚,班,班450件。根,据,据以往,的,的情况,,,,每班,合,合格率,均,均在95%左右。,若,若要求,以,以95%的把握,使,使估计,量,量的绝,对,对误差,不,不超过2%,分别,确,确定按,比,比例配,置,置和按Neyman配置时,总,总样本,量,量和各,层,层样本,量,量。,解:,例:,(,(续例3.2)如果,要,要求在置信度95%下,相,对,对误差,不,不超过10%,则按比例分,配,配和Neyman分配时,,,,总样,本,本量分,别,别为多,少,少?,解:,3.在估计,总,总体均,值,值时,若总费,用,用给定,精度,最,最高时,,,,样本,总,总量n的确定,公,公式:,4.5分层时,的,的若干,问,问题,1.抽样效,果,果分析,:,:,(1)分层,随,随机抽,样,样与简,单,单随机,抽,抽样的,比,比较:,在相同,的,的样本,量,量下,,比,比较二,者,者的估,计,计量的,方,方差的,大,大小。,分,分层随,机,机抽样,以,以比例,分,分配为,代,代表。,(2)最优,分,分配(,以,以Neyman为例),与,与比例,分,分配在,精,精度上,的,的比较,:,:,理论上,讲,讲,最,优,优分配,的,的精度,应,应高于,相,相同样,本,本量的,任,任何其,他,他分配,。,。,当然,,也,也高于,比,比例分,配,配的精,度,度。,但最优,分,分配在,精,精度上,的,的改进,有,有多大,呢,呢?,*最优分,配,配对于,估,估计总,体,体比例P的情形,较,较少使,用,用。,(除非,特别,小,小或特,别,别大),2.层的划,分,分:,(),层,层的划,分,分原则,:,:,a.一种原,则,则是仅,为,为满足,估,估计部,分,分(即,子,子总体,),)参数,的,的需要,或,或为了,组,组织实,施,施的便,利,利。,b.另一种,原,原则是,尽,尽可能,提,提高抽,样,样精度,,,,减少,估,估计量,的,的方差,。,。需要,选,选择恰,当,当的变,量,量变量,作,作为分,层,层标志,。,。,分层标,志,志的选,择,择:可,以,以是调,查,查指标,的,的前期,值,值,可以是,与,与调查,指,指标有,较,较大线,性,性相关,的,的指标,。,。例如,交,交通运,输,输量的,调,调查中,,,,车辆,的,的吨位,是,是与其,两,两个主,要,要指标,:,:运量,与,与周转,量,量密切,相,相关的,。,。,(2)层权,对,对估计,量,量的影,响,响:,(3)最优,分,分层如,何,何确定,各,各层的,分,分点:下面介,绍,绍一种,确,确定层,界,界的快,速,速近似,法,法累积平,方,方根法,。,。,它是由Dalenius和Hodges提出的,。,。,其做法,:,:将分,层,层变量,的,的分布,的,的累积,平,平方根,进,进行等,分,分来获,得,得最优,分,分层,,所,所以成,为,为累积平,方,方根法。,例:某,地,地区电,信,信部门,在,在对利,用,用电话,上,上网的,居,居民家,庭,庭安装ADSL意愿进,行,行调查,时,时,以,辖,辖区内,最,最近三,个,个月有,电,电话上,网,网支出,的,的居民,用,用户为,总,总体(,上,上网电,话,话费为0.02元/分钟),,,,并准,备,备按上,网,网电话,费,费支出,(,(记为x)进行,分,分层,,试,试确定,各,各层的,分,分点。,居民家,庭,庭上网,电,电话费,支,支出分,布,布,范围,x,频数,f,累积,05,65328,255.5934,255.5934,510,89240,298.7306,554.3241,1015,36128,190.0737,744.3977,1520,77525,278.4331,1022.831,2025,62407,249.8139,1272.645,2530,24591,156.8152,1429.46,3040,24586,221.7476,1651.208,4050,9582,138.4341,1789.642,5060,15761,177.5444,1967.186,6070,8099,127.2714,2094.457,7080,5676,106.5458,2201.003,8090,3453,83.10235,2284.106,90100,4256,92.2605,2376.366,100150,1246,111.6244,2487.99,150200,800,89.44272,2577.433,200250,365,60.41523,2637.848,250300,90,30,2667.848,300350,35,18.70829,2686.557,350400,5,7.071068,2693.628,400450,12,10.95445,2704.582,450,7,8.3666,2712.949,*计算累,积,积频数,时,时,应注意x的取值,区,区间不,是,是等长,的,的。,30元以下,,,,以5元为间,距,距,计,算,算时,,按,按,累,累积;,30100元,以10元为间,距,距,计,算,算时,,按,按,累,累积;,100元以上,,,,以50元为间,距,距,计,算,算时,,按,按,累,累积。,解:若,取,取层数,为,为4,则应,每,每隔2712.949/4=678.237分一层,。,。,分点应,使,使得累,积,积,最,最接,近,近678,.,.237,,2*678,.,.237 =1356.474,,3*678,.,.237 =2034.712。,所以较,合,合理的,分,分层为,:,:,(4)层数,的,的确定,:,:一般地,,,,每层,至,至少有2个样本,单,单元,,以不超,过,过6层为宜,。,。,3.事后分,层,层:(poststratification),是用简单随,机,机抽样,方,方法或按其他,标,标识分,层,层的严,格,格按比,例,例分配,分,分层随,机,机抽样,从总,体,体中抽,取,取一个,样,样本量,为,为n的样本,。,。然后,对,对每个,样,样本单,元,元按分,层,层原则,进,进行分,层,层。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 市场营销


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!