社会调查的抽样资料课件

上传人:仙*** 文档编号:241656155 上传时间:2024-07-13 格式:PPT 页数:35 大小:1.04MB
返回 下载 相关 举报
社会调查的抽样资料课件_第1页
第1页 / 共35页
社会调查的抽样资料课件_第2页
第2页 / 共35页
社会调查的抽样资料课件_第3页
第3页 / 共35页
点击查看更多>>
资源描述
CompanyLOGO第四章第四章第四章第四章 社会调查的抽样社会调查的抽样社会调查的抽样社会调查的抽样1 抽样的概念和意义2 概率抽样的原理与方法3 非概率抽样的方法和应用4 样本规模与抽样误差1 抽样的概念和意义抽样的概念和意义v一、概念一、概念 总体:全体研究对象被统称为总体。总体:全体研究对象被统称为总体。样本:是从总体中按一定规则抽取出的一部分元素的集合。抽样:是从总体中,按一定方式选择和抽取一部分元素的过程。抽样单位:一次直接抽样时所使用的基本单位。抽样框:一次直接抽样时总体中所有抽样单位的名单。总体值:关于总体某种特征的综合数量表现。样本值:关于样本某种特征的综合数量表现。二、意义二、意义是由部分推及总体、了解复杂多变的社会现象的桥梁解决了如何从总体中选出一部分对象作为总体的代表的问题一个案例一个案例主办机构主办机构日期日期布什布什克里克里Fox/OpinDynamics10月28日50505050TIPP10月28日53534747CBS/NYT10月28日52524848ABC10月28日51514949Fox/OpinDynamics10月29日49495151Gullup/CNN/USA10月29日49495151NBC/WSJ10月29日51514949TIPP10月29日51514949Harris10月29日52524848DemocracyCorps10月29日49495151CBS10月29日51514949Fox/OpinDynamics10月30日49495252TIPP10月30日51514949Marist10月31日50505050GWUBattleground200410月31日52524848选举结果11月2日202048482004美国总统大选前夕的民意调查结果美国总统大选前夕的民意调查结果2 概率抽样的原理与方法概率抽样的原理与方法v一、基本原理一、基本原理 随机抽取(random selection)就是保证总体中的每一个个体都有同等的机会入选样本,而且,任何一个个体是否入选,与其他个体毫不相干,是彼此独立的。二、概率抽样方法二、概率抽样方法1、简单随机抽样 简单随机抽样也称作纯随机抽样,是严格按照随机原则从含有N个元素的总体中抽取n个元素(Nn),在抽样的过程中,总体的每一个元素都有同等的机会入选样本,而且每个元素的抽取都是相互独立的。抽签法:总体及样本元素较少时使用 例:P56随机数法:总体或样本元素较多时使用随机数筛子法:较少使用随机数法的具体步骤随机数法的具体步骤v第一步,获得总体中所有元素的名单v第二步,将总体中的所有元素按顺序一一编号v第三步,使用随机数表抽取足够的数码个数 起 点:任意起点 数码位数:根据总体规模的位数确定 数字顺序:任意顺序 数码筛选:以总体的规模为标准 数码个数:按样本规模的要求v第四步,通过上述步骤的顺序所抽取的元素的集合,就构成了使用随机数表抽中的样本案例案例 某企业共350名员工,老总打算从中抽取60人进行一次对企业管理满意度的调查,具体步骤如下:v第一步,获得总体这350名员工的名单;v第二步,把这些人名按顺序一一编号;v第三步,使用随机数表抽取足够的数码:假如我们任意选择第四行、第二列这个数字9作为随机的起点;按照从上到下的方法,从随机数表中选取一个三位数;按总体规模进行衡量和取舍,选取280、106、180;直到选中60个不同的数码为止。v第四步,在刚才已经编好的员工名单中,找到这60个不同数码所对应的员工,即组成60人的样本。2、系统抽样、系统抽样 系统抽样又称作机械抽样或等距抽样,它先将N个总体元素按一定的顺序排列,然后在前面K个个体中,先随机抽取一个起始元素,再间隔K个距离,按照固定的抽样间隔K抽取其他n-1个元素。注意事项:非整数抽样间距问题总体元素的排序问题系统抽样的具体步骤系统抽样的具体步骤第一,将总体的所有个体按顺序编号第二,计算抽样间距K:K=总体规模/样本规模=N/n第三,在头K个个体中确定随机起点(A)第四,从A开始,每隔K个个体抽取一个个体组成样本,A,A+K,A+2K.,A+(n-1)K案例案例 在某企业20000名职工中,使用系统抽样的方法抽取出2000人组成样本,具体步骤如下:v第一步,获得总体中全部20000名职工的名单;v第二步,将这20000名职工按顺序编号;v第三步,计算抽样间距K=20000/2000=10;v第四步,在前面10个元素中,按简单随机抽样的方法抽取一个元素,假设抽到的是数码2,作为随机的起点;v第五步,抽取数字2、2+10=12、2+210=22,2+310=32,2+(2000-1)10=19992v找到这2000个数码所对应人的名单。3、分层抽样、分层抽样 分层抽样也叫类型抽样,是先将总体N个单位,按某种特征划分为若干个层次或子类型,然后在每个层次或子类型中分别独立的进行简单随机抽样或系统抽样,最后,将抽取的子样本集合成总体的样本。注意事项:分层标准问题分层比例问题案例案例v在某大学2000名教职工中用分层抽样方法抽取一个200人的样本。职称职称人数人数百分比(百分比(%)等比例分层样本数等比例分层样本数教授教授37837818.918.93838副教授副教授60360330.130.16060讲师讲师56156128.128.15656助教助教23023011.511.52323教辅教辅22822811.411.42323合计合计20002000100.0100.02002004、整群抽样、整群抽样 整群抽样又称作聚类抽样,是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位用简单随机抽样、系统抽样或分层抽样的方法抽取样本的一种抽样方式。步骤:确定分群的标注将总体N按一定标准划分为互不重叠的部分,每个部分为一个子群根据个子群的样本量,确定应该抽取的群数根据个子群的样本量,确定应该抽取的群数eg:P615、多阶段抽样、多阶段抽样(1)多段抽样)多段抽样 多段抽样又称为多级抽样、分段抽样或多阶段抽样,是指按总体内的层级关系,把抽样分为几个阶段来进行,在每一个阶段都使用简单随机抽样、系统抽样、分层抽样的方法来进行。案例案例v某市有某市有10所高校,所高校,20万名大学生,研究者想使用多段抽万名大学生,研究者想使用多段抽样的方法,从中抽取样的方法,从中抽取2000人组成样本,有多种组合方式人组成样本,有多种组合方式具体方案具体方案第一阶段第一阶段第二阶段第二阶段第三阶段第三阶段方案一方案一抽取抽取2 2所高校所高校每所高校抽取每所高校抽取5 5个院个院(系系/所所)每个学院抽取每个学院抽取200200名学生名学生方案二方案二抽取抽取2 2所高校所高校每所高校抽取每所高校抽取1010个院个院(系系/所所)每个学院抽取每个学院抽取100100名学生名学生方案三方案三抽取抽取4 4所高校所高校每所高校抽取每所高校抽取5 5个院个院(系系/所所)每个学院抽取每个学院抽取100100名学生名学生方案四方案四抽取抽取5 5所高校所高校每所高校抽取每所高校抽取2 2个院个院(系系/所所)每个学院抽取每个学院抽取200200名学生名学生方案五方案五抽取抽取5 5所高校所高校每所高校抽取每所高校抽取4 4个院个院(系系/所所)每个学院抽取每个学院抽取100100名学生名学生方案六方案六抽取抽取5 5所高校所高校每所高校抽取每所高校抽取1010个院个院(系系/所所)每个学院抽取每个学院抽取4040名学生名学生方案七方案七抽取抽取8 8所高校所高校每所高校抽取每所高校抽取5 5个院个院(系系/所所)每个学院抽取每个学院抽取5050名学生名学生方案八方案八抽取抽取1010所高校所高校每所高校抽取每所高校抽取2 2个院个院(系系/所所)每个学院抽取每个学院抽取100100名学生名学生方案九方案九抽取抽取1010所高校所高校每所高校抽取每所高校抽取1010个院个院(系系/所所)每个学院抽取每个学院抽取2020名学生名学生缺点缺点 多段抽样过程中暗含了一个假定,即每个阶段抽样时,子群元素的规模是相同的。而现实生活中,这种情况非常少,按照上述方法抽取,样本个体入选的概率其实不完全相同。例:P64 如果研究者第一个阶段抽中了两个社区:甲和乙。甲社区中的居民有800户,而乙社区是200户。此时,甲社区中的居民户被抽中的概率是10/20100/800=1/16,而乙社区居民户被抽中的概率则是10/20100/200=1/4。(2)分层多阶段等概率抽样)分层多阶段等概率抽样 先将总体中规模不等的子群按规模或重要性进行分层,然后在不同阶段对不同的层使用不同的抽样比。以两阶段抽样为例,假如将总体分为大群、中群、小群三个层。第一个阶段时,大群、中群、小群三个层的抽样比fa依次递减,第二个阶段时,大群、中群、小群三个层的抽样比fb依次递增。假如f=1/400,可以进行以下样本设计:层层fafbf大群11/4001/400中群1/201/201/400小群1/40011/400(3)多阶段PPS抽样 多阶段PPS抽样即“概率与元素的规模大小成比例的抽样”,英文缩写简称为PPS抽样。它的基本原理在于以阶段性的不等概率换取最终总体的等概率。例:从全市100家企业、总共20万名职工中,抽取1000名职工进行调查。采取多段抽样的方法,先从100家企业中随机抽取20家企业,然后再从这20家企业中分别抽取50名职工,构成了一个1000人的构成样本。方法方法1企业企业规模规模所占比例所占比例累计累计选择号码范围选择号码范围所选号码所选号码入样元素入样元素企业16003302企业2160008083382020、076元素1、2企业3200010938392企业460003012393122098、112元素3、4企业52001124123企业618009133124132130元素5企业710005138133137企业998004994990993企业100120061000994999997元素20方法方法2规模规模频数频数累计频数累计频数所选号码所选号码入样元素入样元素企业1600600企业216000166001000、11000元素1、2企业3200018600企业460002460021000元素3、4企业520024800企业6180026600元素5企业7100027600企业99800198800企业1001200200000元素206、户内抽样、户内抽样 一般情况下,多阶段抽样的最后一级抽样单位常常是居民住户,但事实上,居民住户中大多是由多名成员组成的,因此实际调查中,仍需要按随机原则从这些成员里按一定的规则抽取一位成年人作为调查对象,而户内抽样可以帮助我们。方法:Kish选择法掷骰子法生日法Kish选择法选择法 调查员要先向住户家庭征求意见,询问其家庭成员的基本情况,包括性别、年龄、与住户的关系。然后,按男性在前、女性在后,年长者在前、年幼者在后的顺序排序。最后,借助kish表确定调查对象。Kish表表A A式选择表式选择表B1B1式选择表式选择表如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为1 12 23 34 45 56 6人或以上人或以上1 11 11 11 11 11 11 12 23 34 45 56 6人或以上人或以上1 11 11 11 12 22 2Kish表表B2B2式选择表式选择表C C式选择表式选择表如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为1 12 23 34 45 56 6人或以上人或以上1 11 11 12 22 22 21 12 23 34 45 56 6人或以上人或以上1 11 12 22 23 33 3Kish表表D D式选择表式选择表E1E1式选择表式选择表如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为1 12 23 34 45 56 6人或以上人或以上1 12 22 23 34 44 41 12 23 34 45 56 6人或以上人或以上1 12 23 33 33 35 5Kish表表E2E2式选择表式选择表F F式选择表式选择表如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为如果家庭户中如果家庭户中1818岁以上人口数为岁以上人口数为被抽中人被抽中人的序号为的序号为1 12 23 34 45 56 6人或以上人或以上1 12 22 24 45 55 51 12 23 34 45 56 6人或以上人或以上1 12 23 34 45 56 63 非概率抽样的方法和应用非概率抽样的方法和应用v一、一、偶遇抽样偶遇抽样又称为方便抽样或就近抽样,指的是研究者使用对自己最为方便的形式来抽取样本。eg:街头拦人:街头拦人二、二、判断抽样v判断抽样又称为立意抽样或目标式抽样,是指研究者根据对总体的知识和认识,并结合自身对研究目的判断或专家的判断来选择适当调查对象的抽样方法。三、三、配额抽样v也称为定额抽样,是按总体某种特征,确定不同总体类别中的样本单位数额,然后按比例在各类别中进行方便抽样。v例例P72性别性别合计合计男男女女年龄年龄3535岁及以下岁及以下24241616404035-6535-65岁岁2424161640406565岁以上岁以上12128 82020合计合计60604040100100四、雪球四、雪球抽样v其抽样过程类似于滚雪球,从开始比较小的个体或群体着手,向他们询问是否能找到其他符合条件的人,这样一层层积累下去,随着人群的增加及人际关系网络的不断扩大,样本的积累越来越多,就像滚雪球一样越滚越大。4 样本规模与抽样误差样本规模与抽样误差v一、样本规模与抽样误差一、样本规模与抽样误差 在概率抽样中抽样误差是可以估算出来的。以简单随机抽样为例,95%置信水平下不同抽样误差要求的样本规模其样本规模为容许的抽烟误差比例(容许的抽烟误差比例(%)样本规模样本规模容许的抽烟误差比例(容许的抽烟误差比例(%)样本规模样本规模1.01.010000100006.06.02772771.51.5450045006.56.52372372.02.0250025007.07.02042042.52.5160016007.57.51781783.03.0110011008.08.01561563.53.58168168.58.51381384.04.06256259.09.01231234.54.54944949.59.51101105.05.040040010.010.01001005.55.5330330二、影响样本规模因素二、影响样本规模因素抽样的精度抽样的精度总体的规模总体的规模总体的异质性程度总体的异质性程度研究者研究者拥有的时间、经费与人力人有了知识,就会具备各种分析能力,明辨是非的能力。所以我们要勤恳读书,广泛阅读,古人说“书中自有黄金屋。”通过阅读科技书籍,我们能丰富知识,培养逻辑思维能力;通过阅读文学作品,我们能提高文学鉴赏水平,培养文学情趣;通过阅读报刊,我们能增长见识,扩大自己的知识面。有许多书籍还能培养我们的道德情操,给我们巨大的精神力量,鼓舞我们前进。CompanyLOGO
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!