统计学抽样调查学习教案

资源描述

会计学1统计学统计学抽样调查抽样调查(chu yn dio ch)第一页，共108页。2第2页/共108页第二页，共108页。3随机原则：即是在抽取样本时，排除人们随机原则：即是在抽取样本时，排除人们主观意图的作用主观意图的作用(zuyng)，使得总体中的每个，使得总体中的每个单位或每个样本有相等的入选机会。随机原则单位或每个样本有相等的入选机会。随机原则又称为等可能性原则。又称为等可能性原则。第3页/共108页第三页，共108页。4第4页/共108页第四页，共108页。5从理论(lln)上讲，有些现象虽然可以进行全面调查，但实际上没有必要或很难办到，也要采用抽样调查。抽样调查的结果可以对全面调查的结果进行检查和修正抽样调查的结果可以对全面调查的结果进行检查和修正抽样调查可以用于工业生产过程的质量控制。抽样调查可以用于工业生产过程的质量控制。利用抽样调查原理，可以对某些总体的假设进行检验，来判别这种假设的真伪，以决定行动的取舍。利用抽样调查原理，可以对某些总体的假设进行检验，来判别这种假设的真伪，以决定行动的取舍。例如：v对无限总体不能采用全面调查。对无限总体不能采用全面调查。v另外，有些产品的质量检查具有破坏性，不可能进行全面调查，只能采用抽样调查。另外，有些产品的质量检查具有破坏性，不可能进行全面调查，只能采用抽样调查。第5页/共108页第五页，共108页。6第6页/共108页第六页，共108页。74样本均值：样本均值：x x4样本样本(yngbn)(yngbn)成数：成数：p p4样本样本(yngbn)(yngbn)标准差标准差：S Sl 总体参数总体参数4 总体均值总体均值： X第7页/共108页第七页，共108页。8计算总体样本随机随机(su j)抽取抽取总体总体(zngt)(zngt)中有中有N N个个个个体体样本容量为：样本容量为：n n计算样本统计量样本统计量xps统计推断统计推断总体参数一般是未知的总体参数一般是未知的样本统计量的值是可知的总体参数总体参数XP第8页/共108页第八页，共108页。9l总体容量N=10000l样本单位数n=100l样本均值（平均耐用时间） x=1055小时，样本成数（合格率） p=91%l依据样本统计量可以对总体参数(cnsh)进行估计（估计方法将在第三节介绍）。均耐用(niyng)时间为1055小时，合格率为91%。第9页/共108页第九页，共108页。10l样本样本(yngbn)成成数：数：l样本样本(yngbn)标标准差：准差：在样本资料未分组的情况下：nxnxxn1ii在样本资料分组的情况下：fxfffxxk1iik1iiinnp1在样本资料未分组的情况下在样本资料未分组的情况下：1n)xx(Sn1i2i在样本资料分组的情况下：在样本资料分组的情况下：1ff)xx(Sk1iik1ii2i第10页/共108页第十页，共108页。11第11页/共108页第十一页，共108页。12nnNAN重复抽样时的样本(yngbn)可能数目是一个可重复的排列数：例8-2：从0-9的10个数中随机重复抽选6个数字组成电话号码，共能组成多少个电话号码？610100nnNAN万第12页/共108页第十二页，共108页。13不重复抽样时的样本可能数目可分为考虑(kol)顺序和不考虑(kol)顺序两种情况。考虑(kol)顺序时的样本可能数目是不重复的排列数：六、抽样(chu yn)方法与样本可能数目(1)(2).(1)!/()!nNPN NNNnNNn例8-3：从班级10位学生中抽选三人担任不同的职务(zhw)，问共有几种抽法？(1)(2).(1)1098720nNPN NNNn种第13页/共108页第十三页，共108页。14六、抽样方法与样本可能(knng)数目不考虑顺序时的样本不考虑顺序时的样本(yngbn)可能数目是不重复的组合数：可能数目是不重复的组合数：(1)(2).(1)/ !nnNNN NNNnCPnn例84：从小组10位学生中不重复随机(su j)抽选3个组成样本，考查其平均成绩，可能的样本数目为：31010987201203216C种第14页/共108页第十四页，共108页。15第二节第二节抽样抽样(chu yn)分布分布第15页/共108页第十五页，共108页。16第16页/共108页第十六页，共108页。17一、重复一、重复(chngf)（置）抽样分布（置）抽样分布（一）样本平均数的分布（一）样本平均数的分布（二）抽样成数的分布（二）抽样成数的分布二、不重复二、不重复(chngf)（置）抽样分布（置）抽样分布（一）样本平均数的分布（一）样本平均数的分布（二）抽样成数的分布（二）抽样成数的分布三、抽样误差的种类三、抽样误差的种类四、关于正态分布的定理四、关于正态分布的定理第二节抽样(chu yn)分布第17页/共108页第十七页，共108页。18一、重复(chngf)（置）抽样分布（一）样本平均数的分布（一）样本平均数的分布样本平均数的分布由所有可能样本的平均数取值和相应的概样本平均数的分布由所有可能样本的平均数取值和相应的概率组成。率组成。例例8-58-5：某施工：某施工(sh gng)(sh gng)班组班组5 5个工人的日工资分别为：个工人的日工资分别为：3434、3838、4242、4646、5050元。则总体工人日工资平均数和方差分别元。则总体工人日工资平均数和方差分别为：为：3438424650425XN元222222234 4238 4246 4250 42325XXN元第18页/共108页第十八页，共108页。19一、重复(chngf)（置）抽样分布现用重复抽样方法从现用重复抽样方法从5 5人中随机抽取人中随机抽取2 2人组成样本人组成样本(yngbn)(yngbn)，样本，样本(yngbn)(yngbn)可能数目为可能数目为52 = 2552 = 25个。各样个。各样本本(yngbn)(yngbn)的日平均工资计算结果如下：的日平均工资计算结果如下：样本变量34384246503434363840423836384042444238404244464640424446505042444648502525个样本的日工资个样本的日工资(gngz)(gngz)平均数计算表平均数计算表第19页/共108页第十九页，共108页。20一、重复（置）抽样(chu yn)分布根据上根据上表数据表数据(shj)，可以，可以整理出整理出样本平样本平均数的均数的分布如分布如右表：右表：样本日平均工资样本日平均工资频数频数频率频率3411/253622/253833/254044/254255/254444/254633/254822/255011/25合计251第20页/共108页第二十页，共108页。21一、重复(chngf)（置）抽样分布5/254/253/252/251/25 34 36 38 40 42 44 46 48 50样本样本(yngbn)日平均工资分布图日平均工资分布图第21页/共108页第二十一页，共108页。22一、重复(chngf)（置）抽样分布根据样本日工资平均数分布表，可以计算日工资根据样本日工资平均数分布表，可以计算日工资平均数的数学期望平均数的数学期望(qwng)和方差：和方差：1( )(34 1 36 2 38 3 . 50 1) 4225XfE XXf 元22()2222()1(3442)1 (3642)2.(5042)11625XXE Xff 元2( )( )164xx元第22页/共108页第二十二页，共108页。23一、重复（置）抽样(chu yn)分布1.重复抽样(chu yn)的样本平均数的数学期望等于总体平均数，即： 2.抽样平均数的标准差又称为抽样平均误差或抽样标准误差抽样平均数的标准差又称为抽样平均误差或抽样标准误差,重复抽样的抽样平均误差重复抽样的抽样平均误差等于总体等于总体(zngt)标准差除以样本单位数的平方根。即：标准差除以样本单位数的平方根。即： 222()()()3242XXXXMMnn元()42E X元第23页/共108页第二十三页，共108页。2424 23 22元元总体(zngt)分布样本(yngbn)平均数的分布原来如此X5042383420100%46484642403836343/252/251/254/255/25504422()()4232162XE Xn2元元第24页/共108页第二十四页，共108页。25一、重复一、重复(chngf)（置）抽样分布（置）抽样分布从以上结论可知，（从以上结论可知，（1 1）抽样平均误差比总体标准差小得多，仅为总体标准差的）抽样平均误差比总体标准差小得多，仅为总体标准差的。例如，一个县的粮食亩产高低相差很大，亩产标准差为。例如，一个县的粮食亩产高低相差很大，亩产标准差为8080公斤，如果随机抽取公斤，如果随机抽取100100亩计算其平均亩产，其平均误差就显著缩小，只有总体标准差的亩计算其平均亩产，其平均误差就显著缩小，只有总体标准差的1/101/10。（。（2 2）抽样平均误差与总体标准差成正比，而和样本单位数的方根成反比。）抽样平均误差与总体标准差成正比，而和样本单位数的方根成反比。n1第25页/共108页第二十五页，共108页。26一、重复（置）抽样(chu yn)分布（二）抽样成数的分布（二）抽样成数的分布可以把是非标志作为（可以把是非标志作为（0 0，1 1）变量，其总体平均数就是）变量，其总体平均数就是(jish)(jish)总体成数，总体方差也由成数确定。总体成数，总体方差也由成数确定。0-10-1变量变量0 01 1概率概率1-P1-PP P() 0 (1) 1PPXE XPPP 222( )(1)(0) (1)(1)PPpPPPP第26页/共108页第二十六页，共108页。27一、重复（置）抽样(chu yn)分布现在从总体中用重复现在从总体中用重复(chngf)(chngf)抽样方法抽取抽样方法抽取n n个个单位组成样本，计算样本成数单位组成样本，计算样本成数p p，样本成数的分，样本成数的分布实质上就是（布实质上就是（0 0，1 1）变量的样本平均数的分布）变量的样本平均数的分布：2( )( )(1)pE pPPPPnn第27页/共108页第二十七页，共108页。28一、重复（置）抽样(chu yn)分布例例8-68-6：已知某批零件的优等品率为：已知某批零件的优等品率为80%80%，现用重复抽，现用重复抽样方法从中抽取样方法从中抽取(chu q)100(chu q)100件，求样本优等品率的件，求样本优等品率的抽样平均误差。抽样平均误差。(1)0.8 0.24%100pPPn第28页/共108页第二十八页，共108页。29二、不重复（置）抽样(chu yn)分布(一一)样本平均数的分布样本平均数的分布1.不重复抽样的样本平均数的数学不重复抽样的样本平均数的数学(shxu)期望等于总体期望等于总体平均数，即：平均数，即：1NnN 3252()123.464251x元修正修正(xizhng)因子因子 2.不重复抽样的抽样平均误差等于重复抽样的抽样平均不重复抽样的抽样平均误差等于重复抽样的抽样平均误差乘以修正因子，即：误差乘以修正因子，即： 22()(1)1XNnnnNnN()E X第29页/共108页第二十九页，共108页。30二、不重复(chngf)（置）抽样分布（二）抽样成数(chngsh)的分布PXP( )E pP(1)(1)()(1)1pPPNnPPnnNnN( )E pP第30页/共108页第三十页，共108页。31例例8-78-7：要估计某地区：要估计某地区1000010000名适龄儿童的入学率，用不名适龄儿童的入学率，用不重复抽样的方法抽取重复抽样的方法抽取400400名儿童，检查结果名儿童，检查结果(ji gu)(ji gu)有有320320名入学，计算样本入学率的抽样平均误差。名入学，计算样本入学率的抽样平均误差。由上可知由上可知(k zh)(k zh)，P=320/400P=320/40080%80%1 1、在重复抽样下，入学率的抽样平均误差：、在重复抽样下，入学率的抽样平均误差：2 2、在不重复、在不重复(chngf)(chngf)抽样下，入学率的抽样平均误差抽样下，入学率的抽样平均误差：(1)0.8 0.22%400pPPn(1)0.8 0.2400(1)(1)1.96%40010000pPPnnN第31页/共108页第三十一页，共108页。32抽样平均误差公式抽样平均误差公式(gngsh)汇编汇编重复重复(chngf)抽样抽样不重复不重复(chngf)抽样抽样样本样本(yngbn)平均数的抽平均数的抽样误差样误差2()Xnn(1)pPPn2(1)XnnN(1)(1)pPPnnN样本成数样本成数的抽样误的抽样误差差第32页/共108页第三十二页，共108页。33第33页/共108页第三十三页，共108页。34第34页/共108页第三十四页，共108页。35Xx Pp 第35页/共108页第三十五页，共108页。36MXxx2)(MPpp2)(第36页/共108页第三十六页，共108页。37t第37页/共108页第三十七页，共108页。38四、关于(guny)正态分布的定理（一）正态分布再生定理（一）正态分布再生定理（二）中心（二）中心(zhngxn)极限定理极限定理第38页/共108页第三十八页，共108页。3922( ,)( ,).XNnXNn 2当总体服从正态分布，即时，来自该总体的所有容量为的样本的均值也服从均值为，方差为的正态分布，n即X502=10X总体分布当n=16时，2.5x当n=4时,5x样本均值分布()50E X 第39页/共108页第三十九页，共108页。4022nn22x一个任意分一个任意分布的总体布的总体()E X第40页/共108页第四十页，共108页。4121212()600050050100(6000,50 ),5900,6100,/5900600061006000225050590061002295.45%XE XnXNXXzxxnzzpXpz 对作标准变换，即令已知所以第41页/共108页第四十一页，共108页。422()3030.536(30,0.5 )(0,1),/31 3031297.725%0.5XE XnXNXzNnp xp Zp z解：而故第42页/共108页第四十二页，共108页。43有效(yuxio)的估计将是第43页/共108页第四十三页，共108页。44一、样本(yngbn)统计量的优良标准（一）无偏性（二）一致性（三）有效性第44页/共108页第四十四页，共108页。45222122211( )()11()()1()()1nniinniiEE XnE SEXXnnE SEXXn第45页/共108页第四十五页，共108页。46E( x )=X无偏估计量E(Me) X有偏估计量例如，样本均值( x )和中位数(Me)均可作为总体均值(X)的估计量，但是一般情况下E(Me) X，而E( x )= X，所以样本均值是总体均值的无偏估计量。第46页/共108页第四十六页，共108页。47lim1np 较大的样本容量较大的样本容量较小的样本容量x第47页/共108页第四十七页，共108页。481212( )()DD如果，则称是比更为有效的估计量。中位数估计量中位数估计量样本均值估计量样本均值估计量第48页/共108页第四十八页，共108页。49 点估计的点估计的优点是？优点是？点估计的优点：能够提供总点估计的优点：能够提供总体参数的具体估计值。体参数的具体估计值。点估计的缺点：并不能提供点估计的缺点：并不能提供误差大小误差大小(dxio)的信息。的信息。第49页/共108页第四十九页，共108页。50我们知道，制造出来的坦克数肯定我们知道，制造出来的坦克数肯定(kndng)(kndng)大于记录中的最大编号。因此，其中点估计的方法之一就是，计算出被缴获坦克编号的平均值，并认为这个值是德军全部坦克编号的中点，用样本均值乘以大于记录中的最大编号。因此，其中点估计的方法之一就是，计算出被缴获坦克编号的平均值，并认为这个值是德军全部坦克编号的中点，用样本均值乘以2 2就是总数的一个估计。就是总数的一个估计。注从战后发现的德军记录来看，盟军估计值非常接近所生产坦克的真实记录。统计学家做得比间谍们更漂亮！第50页/共108页第五十页，共108页。51第51页/共108页第五十一页，共108页。52第52页/共108页第五十二页，共108页。535.相应的为0.01，0.05，0.10第53页/共108页第五十三页，共108页。54第54页/共108页第五十四页，共108页。55第55页/共108页第五十五页，共108页。56第56页/共108页第五十六页，共108页。57第57页/共108页第五十七页，共108页。58第58页/共108页第五十八页，共108页。5925袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3第59页/共108页第五十九页，共108页。60第60页/共108页第六十页，共108页。6136个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532第61页/共108页第六十一页，共108页。62第62页/共108页第六十二页，共108页。63解：x)mm(95.1461 .151 .156 .14nxn1ii当=0.05时，查正态分布表得：z=1.96样本均值的抽样(chu yn)平均误差为:x1 . 0606. 0nxz x = 14.95 1.960.1即平均直径的95%的置信区间为(14.75，15.15)所以平均直径的置信区间为：第63页/共108页第六十三页，共108页。64第64页/共108页第六十四页，共108页。65第65页/共108页第六十五页，共108页。6616只只灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470第66页/共108页第六十六页，共108页。67第67页/共108页第六十七页，共108页。68总体成数是指总体中具有(jyu)某种特征的单位数量占总体全部单位数的比重，也称为总体比例。第68页/共108页第六十八页，共108页。69u可以证明，在大样本的情况下，若可以证明，在大样本的情况下，若n nP P和和n(1-n(1-P)P)两者都大于两者都大于5 5时，样本成数时，样本成数P P近似服从期望值为近似服从期望值为P P ，方差为，方差为的正态分布。的正态分布。P (1-P)nv使用正态分布统计量使用正态分布统计量Z Z对总体成数对总体成数P P进行区间估计。进行区间估计。) 1,0(NPPZPw总体成数总体成数P P是未知的，用样本成数是未知的，用样本成数p p来代替，所以来代替，所以P P的置信的置信度为度为1-1- 的置信区间为：的置信区间为：,)ZPp2ZP(p2第69页/共108页第六十九页，共108页。70解：P31%10031nn1w当=0.10时，查正态分布表得：2Z=1.65v计算(j sun)样本成数的抽样平均误差：x计算总体成数P的置信区间：p2ZP= 0.31 1.650.0462即P的90%的置信区间为(23.4%，38.6%)u计算样本成数：p0.0462nP(1-P)1000.31(1-0.31)第70页/共108页第七十页，共108页。71 第71页/共108页第七十一页，共108页。72第72页/共108页第七十二页，共108页。73?均值估计的抽样单位数目均值估计的抽样单位数目(shm)(shm)计算计算 ?在重复抽样的条件下在重复抽样的条件下 nz222x因为nzzx2x22zn所以有：在不重复在不重复(chngf)(chngf)抽样的条件下抽样的条件下 nNn1zx因为所以有： 222x22zNznN第73页/共108页第七十三页，共108页。74?成数估计的抽样单位数目计算(j sun) ?在重复抽样的条件下在不重复(chngf)抽样的条件下因为n)P1(Pzpn)P1(Pz22p所以有：2p2)P1(Pzn因为)Nn1(n)P1(Pzp所以有： )P1(PzN)P1(Pzn22p2N第74页/共108页第七十四页，共108页。75 例例8-168-16：某市开展职工家计调查，根据历史资料该：某市开展职工家计调查，根据历史资料该市职工家庭平均每人年收入的标准差为市职工家庭平均每人年收入的标准差为24002400元，家元，家庭消费总支出中食品庭消费总支出中食品(shpn)(shpn)消费支出比重（恩格消费支出比重（恩格尔系数）为尔系数）为54%54%。现用重复抽样方法，要求在。现用重复抽样方法，要求在95.45%95.45%的概率保证下，平均收入的抽样极限误差不超过的概率保证下，平均收入的抽样极限误差不超过200200元，恩格尔系数的抽样极限误差不超过元，恩格尔系数的抽样极限误差不超过4%4%，请确定，请确定样本必要数目。样本必要数目。解：根据公式，在重复抽样条件下：解：根据公式，在重复抽样条件下：样本成数的样本必要(byo)数目：2222222 *2400576200 xzn户2222(1)2 *0.54*0.466210.04Pz PPn户样本样本(yngbn)平均数的样本平均数的样本(yngbn)必要数目：必要数目：第75页/共108页第七十五页，共108页。76?在同样条件下，不重复抽样比重复抽样要求的抽样单位数目少。但在同样条件下，不重复抽样比重复抽样要求的抽样单位数目少。但不重复抽样的抽样单位数目计算公式比较复杂。在实际工作中，一不重复抽样的抽样单位数目计算公式比较复杂。在实际工作中，一般当般当的抽样比的抽样比很小时（小于很小时（小于5%5%），为了简化计算，虽然采），为了简化计算，虽然采用不重复抽样，也可用重复抽样计算公式计算抽样单位数目。用不重复抽样，也可用重复抽样计算公式计算抽样单位数目。Nn关于(guny)抽样单位数目的几点说明 ?同一总体往往同时同一总体往往同时(tngsh)需要估计总体平均数和总体成数，对二者可以分别需要估计总体平均数和总体成数，对二者可以分别计算出各自抽样单位数目，为了防止抽样单位数目的不足，在实际工作中，往计算出各自抽样单位数目，为了防止抽样单位数目的不足，在实际工作中，往往根据抽样单位数目比较大的一个数目进行抽样，以满足共同要求往根据抽样单位数目比较大的一个数目进行抽样，以满足共同要求第76页/共108页第七十六页，共108页。77关于抽样(chu yn)单位数目的几点说明一个问题：一个问题：在重复抽样情况下，如果其它条件保持不变在重复抽样情况下，如果其它条件保持不变，要使允许误差范围缩小为原来的，要使允许误差范围缩小为原来的1/21/2，则样本单位数，则样本单位数目需要目需要(xyo)(xyo)扩大为原来的多少？反之，如果允许误扩大为原来的多少？反之，如果允许误差范围要求扩大为原来的差范围要求扩大为原来的2 2倍，抽样单位数目又要如何倍，抽样单位数目又要如何变化？变化？第77页/共108页第七十七页，共108页。78第78页/共108页第七十八页，共108页。79月工资月工资水平水平524524534534540540550550560560580580600600660660工人数工人数4 46 69 910108 86 64 43 3第79页/共108页第七十九页，共108页。80第80页/共108页第八十页，共108页。81第81页/共108页第八十一页，共108页。82 使用寿命（小时）产品个数3000以下23000-4000304000-5000505000以上18合计100第82页/共108页第八十二页，共108页。83第83页/共108页第八十三页，共108页。84类型抽样整群抽样简单随机抽样简单随机抽样多阶段抽样等距抽样第84页/共108页第八十四页，共108页。85简单随机抽样，又称为纯随机抽样，它是按照随机原则直接从总体N个个体中抽取n个个体作样本，使总体中的每个个体都有同等的机会被抽中。简单随机抽样图示简单(jindn)随机抽样的样本个体在总体中的分布是无规律的。总体(zngt)中有N个个体从总体中随机抽取n个个体第85页/共108页第八十五页，共108页。86简单随机抽样是抽样调查中最基本的组织形式(xngsh)，前面所讲的估计方法都是以简单随机抽样为基础的；简单随机抽样是按随机原则直接从总体N个单位中抽取个单位作为样本，不论是重复抽样还是不重复抽样都要保证每个单位在抽选中有相等的中选机会；由于在抽样中除了抽样框的信息外，不需要其它信息，所以又称为纯随机抽样。简单随机抽样被用作评估其他抽样策略的效率的基准；简单随机抽样最原始的抽取方法是抽签法，最常用的抽取方法是利用随机数表或计算机生产随机数。第86页/共108页第八十六页，共108页。87类型抽样图示 (一)类型抽样的概念类型抽样，又称为分层抽样。它首先把总体各个体按某一标志分成若干个类型组，使各组组内标志值比较接近，然后分别在各组组内按随机原则抽取样本个体。总体(zngt)中有N个个体将总体(zngt)分成若干个类型组在i组中随机抽取n 个个体in1+ n2+ +nk= n第87页/共108页第八十七页，共108页。88(二二)类型抽样类型抽样(chu yn)的分类的分类1、等比例、等比例(bl)类型抽样类型抽样1212.nnnNNN2、不等比例类型(lixng)抽样第88页/共108页第八十八页，共108页。89222组间组内总第89页/共108页第八十九页，共108页。9025. 85 . 175. 65 . 11015646)5 . 65 . 5(4)45 . 5()75. 6105 .6764625. 645 . 725. 665 .376)5 . 610()5 . 64()5 . 63()(5 . 6639610976435 . 74304)48()45()42()41 ()44164852125. 8105 .8210)5 . 510()5 . 52()5 . 51 ()5 . 51055101021222222222222222222222又（总组间总总iiiiiiBBAANNXXNNNXXNXXNXXNXXNXXNXX222组间组内总第90页/共108页第九十页，共108页。911inijjiixxn11kkiiiiiiN xn xxNn第三步计算(j sun)抽样平均误差(1)计算(j sun)各组内方差:第二步计算样本平均数222()()iiiiiiiXXxxNn第91页/共108页第九十一页，共108页。92 (4)抽样(chu yn)平均数的估计区间:(3)样本平均数的抽样平均误差:22iiinn2ixn2(1)ixnnN重复抽样：重复抽样：不重复抽样不重复抽样：xxz第92页/共108页第九十二页，共108页。93粮食样本资料平原1400028056080山区6000120350150合计20000400497106亩产标准差(公斤)i全部面积(亩)Ni样本面积(亩)ni样本平均亩产(公斤)x例例:某乡粮食播种面积某乡粮食播种面积20000亩亩,现在按平原和山区面积比例抽取其中的现在按平原和山区面积比例抽取其中的2%,计算各组平均亩产计算各组平均亩产和各组亩产标准差和各组亩产标准差i如下表如下表,求样本平均亩产求样本平均亩产和抽样平均误差和抽样平均误差ixxx第93页/共108页第九十三页，共108页。9422228028015012011230()400iiinn公斤2112305.3()n400ix公斤2x(1)5.25()innN公斤不重复不重复(chngf)抽样时：抽样时：重复重复(chngf)抽样时：抽样时：560 280350 120497()400iin xxn公斤第94页/共108页第九十四页，共108页。95iiiiN pn pPpNn(1):(1):(1)iipiipppnppnnN重置抽样不重置抽样（二）计算(j sun)抽样成数的平均误差（一）计算样本成数(chngsh)估计总体成数(chngsh)(1)(1)iiiiin ppppn其中：其中：第95页/共108页第九十五页，共108页。96类型抽样的平均误差与组间方差无关，而决定于组内方差的平均水平。由此可以(ky)推导出两点结论：1、根据总体方差等于组间方差与组内方差之和定理，类型抽样的平均误差一般小于简单随机抽样的平均误差；2、由于总体方差是确定的数，因此，在类型抽样分组时应该尽可能扩大组间方差，缩小组内方差，从而减少抽样误差，提高抽样效果。第96页/共108页第九十六页，共108页。97等距抽样图示（一）等距抽样的概念：等距抽样又称为机械抽样或系统抽样，它是事先将总体各个体按某一标志排列，然后依固定顺序和间隔抽选样本个体的一种抽样组织形式。总体(zngt)中有N个个体将总体中个体将总体中个体(gt)(gt)按某按某一标志排序，并均分成一标志排序，并均分成n n个个部分。部分。在第一部分中随机地抽取一在第一部分中随机地抽取一个个, ,然后每隔相同的距离抽然后每隔相同的距离抽取一个取一个, ,直到抽完直到抽完n n个为止。个为止。第97页/共108页第九十七页，共108页。98在等距抽样中，由于排队所依据的标志不同，等距抽样分在等距抽样中，由于排队所依据的标志不同，等距抽样分为按无关标志排队和有关标志排队两种。为按无关标志排队和有关标志排队两种。按无关标志排序：是指排列的标志和所研究的标志值的大按无关标志排序：是指排列的标志和所研究的标志值的大小无关或不起主要影响小无关或不起主要影响(yngxing)作用；作用；按有关标志排序：即用来排列的标志和所研究的标志值的按有关标志排序：即用来排列的标志和所研究的标志值的大小保持密切关系。按有关标志排序实质上一种特殊的类大小保持密切关系。按有关标志排序实质上一种特殊的类型抽样，有利于提高样本的代表性。型抽样，有利于提高样本的代表性。第98页/共108页第九十八页，共108页。99第99页/共108页第九十九页，共108页。100（三）等距抽样(chu yn)的抽选方法对称对称(duchn)等距抽样示意图等距抽样示意图第100页/共108页第一百页，共108页。101u等距抽样需要有总体的辅助信息，以便于进行单位等距抽样需要有总体的辅助信息，以便于进行单位(dnwi)(dnwi)的排的排序；序；u无论是有关标志还是无关标志排队，都要注意避免抽样间距与总无论是有关标志还是无关标志排队，都要注意避免抽样间距与总体变化的周期性相吻合，引起系统误差体变化的周期性相吻合，引起系统误差；u与简单随机抽样相比，按有关标志排队的等距抽样的平均误差较与简单随机抽样相比，按有关标志排队的等距抽样的平均误差较小；小；u对于无关标志排队且随机起点的等距抽样，可以采用简单随机抽对于无关标志排队且随机起点的等距抽样，可以采用简单随机抽样误差公式。样误差公式。第101页/共108页第一百零一页，共108页。102整群抽样图示 (一)整群抽样的概念:先将总体各个体划分成若干群(组)，然后以群 (组)为单元从总体中随机抽取一些群(组),对中选群(组)的所有个体进行全面调查的抽样组织(zzh)形式。总体(zngt)中有N个个体以群为单元在总以群为单元在总体中抽取若干群体中抽取若干群以中选群中的所以中选群中的所有个体组成样本有个体组成样本将总体所有个将总体所有个体分成若干群体分成若干群第102页/共108页第一百零二页，共108页。103u整群抽样直接抽取的不是总体中的个体而是整群抽样直接抽取的不是总体中的个体而是“群群”，因此总体和样，因此总体和样本是由本是由“群群”组成的。组成的。u影响抽样误差的方差是群间方差，群内方差不影响抽样误差。因为影响抽样误差的方差是群间方差，群内方差不影响抽样误差。因为对抽中的群来说，对群中所有单位对抽中的群来说，对群中所有单位(dnwi)(dnwi)都进行调查，因此群内都进行调查，因此群内不产生抽样误差。不产生抽样误差。u整群抽样是不重复抽样，应该用不重复抽样公式计算抽样平均误差整群抽样是不重复抽样，应该用不重复抽样公式计算抽样平均误差。第103页/共108页第一百零三页，共108页。104中选乡号每户平均存栏生猪（头）优良品种比重1509027080380504857059055第104页/共108页第一百零四页，共108页。105多阶段抽样图示多阶段抽样也称多级抽样，是先从总体中随机地抽取若干初级单元，再从中选的一级单元中随机地抽选二级单元，如此下去，直至(zhzh)抽取所要调查的样本个体的抽样组织方式。将总体(zngt)划分成若干个初级单元在总体中随机地抽取若干初级单元再在中选的初级单元中抽取若干次级单元总体中有N个个体如果抽样过程经过这样两次抽样，完成了样本个体的抽取，则称之为两阶段抽样。若要继续进行下一阶段的抽样，则称之为多阶段抽样。第105页/共108页第一百零五页，共108页。106u当群内单元对于调查变量是同质时，多阶抽样比单阶整群抽样的效率高；u样本分布相对集中，因此采用面访的旅行时间和费用都大为降低(jingd)；u不需要有整个总体的名录框，所要的只是在每个阶段抽样都有一个完整的抽样框。第106页/共108页第一百零六页，共108页。107u虽然多阶抽样的效率比一阶整群抽样的高，但它没有简单随机抽样的效率高；u通常不能提前知道多阶抽样的样本量，因为在具体调查前，我们不知道在每个大单元中到底包含多少个下级单元（若固定每个大单元中的抽样数目(shm)，则总的样本量也可控制）；u调查的组织较为复杂（比单阶整群抽样复杂）；u估计值与抽样方差的计算较为复杂。第107页/共108页第一百零七页，共108页。108感谢您的观看感谢您的观看(gunkn)！第108页/共108页第一百零八页，共108页。

展开阅读全文

统计学抽样调查学习教案

最新文档