现场调查中的抽样方法(骄阳书苑)

上传人:8** 文档编号:177300184 上传时间:2022-12-25 格式:PPT 页数:75 大小:1.54MB
返回 下载 相关 举报
现场调查中的抽样方法(骄阳书苑)_第1页
第1页 / 共75页
现场调查中的抽样方法(骄阳书苑)_第2页
第2页 / 共75页
现场调查中的抽样方法(骄阳书苑)_第3页
第3页 / 共75页
点击查看更多>>
资源描述
现场调查中的抽样方法现场调查中的抽样方法1优选课程练习练习 人群总数人群总数10000(男(男4000人,女人,女6000)分层抽样,男性抽分层抽样,男性抽100人,女性抽人,女性抽1000人,共人,共1100人人 样本中共样本中共105人抽烟,其中男性人抽烟,其中男性55人,女性人,女性50人人问:人群总吸烟率是多少?问:人群总吸烟率是多少?2优选课程练习练习 人群总数人群总数10000(男男4000人,女人,女6000),抽取样本男,抽取样本男100人(人(55人抽烟)人抽烟),女女1000人(人(50人抽烟)。人抽烟)。问:人群总吸烟率是多少?问:人群总吸烟率是多少?直接算法:总吸烟率直接算法:总吸烟率=(55+50)/(100+1000)=9.5%正确算法:男正确算法:男4000抽抽100,每人代表,每人代表40人人(W=40)女女6000抽抽1000,每人代表,每人代表6人人(W=6)总吸烟率总吸烟率=(55*40+50*6)/(100*40+1000*6)=25%3优选课程调查的分类调查的分类 普查(全面调查)普查(全面调查)典型调查(案例调查)典型调查(案例调查)抽样调查抽样调查4优选课程普查普查 Census 人群中每个人都调查人群中每个人都调查 没有抽样误差没有抽样误差 人群很小时可以使用人群很小时可以使用 人群数很大时耗费人、财、物力,质量不易控制,人群数很大时耗费人、财、物力,质量不易控制,非抽样误差大非抽样误差大 不适于患病率低和诊断技术比较复杂的疾病不适于患病率低和诊断技术比较复杂的疾病 无应答率常常较高无应答率常常较高5优选课程典型调查(案例调查)典型调查(案例调查)有目的地选定典型的人、单位进行调查,对事物有目的地选定典型的人、单位进行调查,对事物特征作深入了解。特征作深入了解。没有随机原则,不能估计总体参数,只能对总体没有随机原则,不能估计总体参数,只能对总体特征作特征作经验推论经验推论,不属于统计推断的范畴,不属于统计推断的范畴6优选课程抽样调查抽样调查 抽样调查:从总体中抽取一定数量的观察抽样调查:从总体中抽取一定数量的观察单位组成样本,根据样本信息来了解总体单位组成样本,根据样本信息来了解总体特征。特征。7优选课程基本概念基本概念 总体:根据研究目的确定的同质观察单位的全体总体:根据研究目的确定的同质观察单位的全体 样本:从总体中随机抽取的部分观察单位的总和样本:从总体中随机抽取的部分观察单位的总和 抽样的目的:用样本信息推断总体特征抽样的目的:用样本信息推断总体特征 抽样误差:抽样误差:由抽样造成的样本信息偏离总体参数由抽样造成的样本信息偏离总体参数 可计算总体参数的可计算总体参数的95%可信区间可信区间8优选课程 95%可信区间:以样本信息推论总体时,计算出可信区间:以样本信息推论总体时,计算出的可信区间有的可信区间有95%的概率覆盖总体参数。的概率覆盖总体参数。高血压患病率为高血压患病率为20%(15%-28%)高血压患病率为高血压患病率为18%(4%-51%)9优选课程 X市居民甲状腺结节患病情况调查:在沿海地区、山区、平市居民甲状腺结节患病情况调查:在沿海地区、山区、平原地区各随机抽取原地区各随机抽取1个村庄,每个村中再随机抽取个村庄,每个村中再随机抽取100户家户家庭,每个家庭的全部成员作为调查对象。庭,每个家庭的全部成员作为调查对象。在某地区的医院进行医院感染情况的抽样调查,抽中在某地区的医院进行医院感染情况的抽样调查,抽中40所所医院。实施过程中,有些医院不配合。可根据医院特征医院。实施过程中,有些医院不配合。可根据医院特征(如同级、同类、病床数)替换愿意配合的医院。(如同级、同类、病床数)替换愿意配合的医院。10优选课程 调查某地区腹泻患病率,采用多阶段抽样方法。第调查某地区腹泻患病率,采用多阶段抽样方法。第1阶段:阶段:兼顾地理位置、经济水平、人口数量、工作基础和意愿,兼顾地理位置、经济水平、人口数量、工作基础和意愿,选择选择A县、县、B县,县,C区和区和D县作为调查点;第县作为调查点;第2阶段阶段11优选课程 在某地区进行某病患病率调查,将乡镇按收入水平分层在某地区进行某病患病率调查,将乡镇按收入水平分层3层(高中低三层分别有层(高中低三层分别有150、120、100个乡镇),在每层个乡镇),在每层各抽取各抽取10个乡镇,每个乡镇再各随机抽取个乡镇,每个乡镇再各随机抽取2个村庄,抽中个村庄,抽中村庄内居民全部调查。村庄内居民全部调查。抽样方法设计如何?抽样方法设计如何?每个村庄约每个村庄约60人,共调查到人,共调查到2400人,其中人,其中240人患病,患人患病,患病率为多少?病率为多少?12优选课程两类抽样方法两类抽样方法 非概率抽样:非概率抽样:无法确定被调查对象的概率,无法无法确定被调查对象的概率,无法推断总体,常用于探索性研究推断总体,常用于探索性研究 碰巧抽样或方便抽样:超市里走出的前碰巧抽样或方便抽样:超市里走出的前10个人个人 意图抽样:调查者有意的抽取某些对象,认为能代表意图抽样:调查者有意的抽取某些对象,认为能代表某类人群。如:选择一个大城市,一个城镇,一个乡某类人群。如:选择一个大城市,一个城镇,一个乡村地区村地区 滚雪球抽样滚雪球抽样 概率抽样:概率抽样:每个个体有一个可计算的非零概率,每个个体有一个可计算的非零概率,可计算抽样误差,可推断总体可计算抽样误差,可推断总体13优选课程概率抽样调查概率抽样调查 Sample surveys 按一定的概率,在人群中抽取一部分人来调查按一定的概率,在人群中抽取一部分人来调查 以样本统计量估计总体参数以样本统计量估计总体参数 节省时间、人力、物力,调查可以做得更细致节省时间、人力、物力,调查可以做得更细致 不适用于患病率很低疾病不适用于患病率很低疾病14优选课程常用概率抽样的方法常用概率抽样的方法 简单随机抽样简单随机抽样 系统抽样(等距抽样、机械抽样)系统抽样(等距抽样、机械抽样)分层抽样(分类抽样)分层抽样(分类抽样)整群抽样整群抽样15优选课程将总体的全部观察单位编号,再用随机数字等方法将总体的全部观察单位编号,再用随机数字等方法随机抽取部分观察单位组成样本随机抽取部分观察单位组成样本例:某中学例:某中学2100名学生,随机抽名学生,随机抽200人估计近视率人估计近视率 先将所有学生编号:先将所有学生编号:1,2,3,4,2100 查随机数字表查随机数字表 6394 0710 6376 3587 0304 7988 94 710 76 1487 304 1688 注意:注意:8400以上的数字不要以上的数字不要 产生随机数字:产生随机数字:=rand()()=randbetween()()随机数字发生器随机数字发生器 (练习)(练习)单纯随机抽样单纯随机抽样 Simple random sampling (SRS)16优选课程 1,2,3,4,21002101,2102,2103,2104,42004201,4202,4203,4204,63006301,6302,6303,6304,84008401,8402,8403,8404,9999105001600个数个数2100个数个数1600个数个数500个数个数17优选课程单纯随机抽样单纯随机抽样 优点:均数(或率)及标准误的计算简单优点:均数(或率)及标准误的计算简单 缺点:总体例数多时,需有全部名单,编号缺点:总体例数多时,需有全部名单,编号18优选课程将全部观察单位根据某一顺序编号,计算抽样间隔,随机将全部观察单位根据某一顺序编号,计算抽样间隔,随机抽第抽第k号(小于抽样间隔)观察单位,然后依次用相等间号(小于抽样间隔)观察单位,然后依次用相等间隔抽取观察单位组成样本隔抽取观察单位组成样本 先将所有学生编号:先将所有学生编号:1,2,3,4,2100 确定抽样间隔:确定抽样间隔:2100/200=10.5(人),取(人),取10 在在1-10之间随机找一个数字,例如之间随机找一个数字,例如4 依次机械抽取:依次机械抽取:14,24,34,1994,2004 系统抽样系统抽样19优选课程系统抽样系统抽样 优点:优点:易于理解,易行易于理解,易行 样本是均匀分布的,抽样误差小于单纯随机抽样,对样本是均匀分布的,抽样误差小于单纯随机抽样,对样本进行方差估计时,可以将它看成是样本进行方差估计时,可以将它看成是SRS 缺点:缺点:当抽样单位的排列有周期趋势时,抽样结果可能有偏当抽样单位的排列有周期趋势时,抽样结果可能有偏差差20优选课程根据样本量估算,需要抽取该社区根据样本量估算,需要抽取该社区1/10的儿童采血检测;的儿童采血检测;每个家庭有门牌号,从每个家庭有门牌号,从1-2000号,单号一排,双号一排。调查号,单号一排,双号一排。调查者首先用随机数字表从者首先用随机数字表从1-10中选一个数字,然后用系统随机方中选一个数字,然后用系统随机方法抽取该街道的法抽取该街道的1/10有儿童的家庭。有儿童的家庭。这一抽样方法有什么潜在问题?这一抽样方法有什么潜在问题?在农村某地区开展儿童维生素在农村某地区开展儿童维生素D缺乏调查缺乏调查21优选课程分层抽样分层抽样按影响较大的某种特征将总体分成若干组(统计上按影响较大的某种特征将总体分成若干组(统计上叫做叫做”层层”),再从每一层内随机抽取一定数量的),再从每一层内随机抽取一定数量的观观察单位察单位 分层变量最好是层间差别大,层内差别小分层变量最好是层间差别大,层内差别小 层内样本量分配层内样本量分配 按比例分配按比例分配 等额分配等额分配 最优分配最优分配 按照性别分层,男生和女生按照性别分层,男生和女生 每层中随机抽取每层中随机抽取100名学生名学生层层1层层2层层3总体总体层层1层层2层层3总体总体22优选课程分层抽样分层抽样 优点:优点:减少抽样误差,分层后增加层内同质性减少抽样误差,分层后增加层内同质性 便于对不同的层采取不同的抽样方法,如城乡分层便于对不同的层采取不同的抽样方法,如城乡分层 还可对不同层独立进行分析(各层要满足样本量)还可对不同层独立进行分析(各层要满足样本量)23优选课程先将总体分成若干个群,每个群包括若干观察单位,先将总体分成若干个群,每个群包括若干观察单位,再随机抽取再随机抽取k个群,每个群的全部观察单位组成样个群,每个群的全部观察单位组成样本本整群抽样整群抽样Population of L strata,stratum l contains nl unitsPopulation of C clustersTake SRS in every stratumTake SRS of clusters,sample every unit in chosen clusters24优选课程群间差异越小、抽取的群间差异越小、抽取的“群群”越多,精度越高,样越多,精度越高,样本量确定后,宜增加本量确定后,宜增加“群群”数而减少群内的观察数数而减少群内的观察数 学校共有学校共有70个班(各个班级情况相似时比较好)个班(各个班级情况相似时比较好)随机抽取随机抽取20个班(各班人数越少,抽班级数越多越好)个班(各班人数越少,抽班级数越多越好)20个班级的所有学生都调查个班级的所有学生都调查整群抽样整群抽样25优选课程整群抽样整群抽样 优点:优点:便于组织、节省经费,容易控制调查质量便于组织、节省经费,容易控制调查质量 缺点:缺点:当样本例数一定时,抽样误差大于单纯随机抽当样本例数一定时,抽样误差大于单纯随机抽样的误差样的误差 抽取的群数应尽量多(抽取的群数应尽量多(15个),个),群数太少抽样群数太少抽样误差大误差大26优选课程各种抽样方法的方差各种抽样方法的方差分层抽样分层抽样 系统抽样系统抽样 单纯随机抽样单纯随机抽样 整群抽样整群抽样27优选课程 设计效力设计效力(Design Effect):样本量不变时,:样本量不变时,实际抽样方法的方差与单纯随机抽样的方差实际抽样方法的方差与单纯随机抽样的方差的比值的比值 Ratio of actual variance to variance assuming SRS,given same n DE一般为一般为1.3-328优选课程多阶段抽样多阶段抽样 单阶段抽样:四种基本抽样方法都是通过一次抽样产生一个单阶段抽样:四种基本抽样方法都是通过一次抽样产生一个完整的样本完整的样本 多阶段抽样:总体大,情况复杂,分布广,可分若干阶段进多阶段抽样:总体大,情况复杂,分布广,可分若干阶段进行抽样,行抽样,每个阶段可用上述四种方法中任意一种进行抽样每个阶段可用上述四种方法中任意一种进行抽样例:在某省进行某项调查:例:在某省进行某项调查:o 第一阶段:用系统抽样法随机抽取第一阶段:用系统抽样法随机抽取30个县个县o 第二阶段:用第二阶段:用SRS法每县抽取法每县抽取10个自然村个自然村o 第三阶段:用第三阶段:用SRS法每村抽取法每村抽取10名村民名村民29优选课程 第第1阶段为初级抽样单位阶段为初级抽样单位PSU(primary sampling unit)第第2阶段为二级抽样单位阶段为二级抽样单位SSU(second sampling unit)第第3阶段为三级抽样单位阶段为三级抽样单位TSU(tertiary sampling unit)初级抽样单位多,调查结果抽样误差小,精度高初级抽样单位多,调查结果抽样误差小,精度高建议不少于建议不少于10-15个个30优选课程 第第1阶段:阶段:50个班级中随机抽取个班级中随机抽取20个班级个班级 第第2阶段:每个抽中班级中随机抽取阶段:每个抽中班级中随机抽取3个小组个小组 第第3阶段:每个小组中随机抽取阶段:每个小组中随机抽取4名学生名学生 初级抽样单位:班级初级抽样单位:班级 二级抽样单位:班级里的小组二级抽样单位:班级里的小组 三级抽样单位:学生三级抽样单位:学生31优选课程阜阳市各级医疗机构治疗发热阜阳市各级医疗机构治疗发热儿童用药现况调查儿童用药现况调查 32优选课程 20082008年安徽省阜阳市发生年安徽省阜阳市发生EV71EV71手足口病疫情手足口病疫情 3 3月月1 1日至日至5 5月月9 9日共报告日共报告60496049病例病例 99%99%的为的为1414岁以下儿童岁以下儿童 大多数病例以急性发热起病大多数病例以急性发热起病 EV71EV71重症危险因素研究发现重症危险因素研究发现 首诊在村级医疗机构首诊在村级医疗机构 氨基比林和激素类药物氨基比林和激素类药物33优选课程调查目的调查目的 了解阜阳市各级医疗机构治疗发热儿童的用药现状了解阜阳市各级医疗机构治疗发热儿童的用药现状 发现存在的问题及影响因素发现存在的问题及影响因素 为规范发热儿童用药提供依据为规范发热儿童用药提供依据 34优选课程调查对象和内容调查对象和内容 各级医疗机构的儿科医生:访谈用药习惯各级医疗机构的儿科医生:访谈用药习惯 各级医疗机构发热儿童的治疗处方:各种药物的各级医疗机构发热儿童的治疗处方:各种药物的使用情况使用情况35优选课程样本量计算样本量计算 根据简单随机抽样计算公式,以氨基比林使用比根据简单随机抽样计算公式,以氨基比林使用比例为例为p p,=5%=5%,设计效率,设计效率1.441.44 根据预调查获得各级医疗机构氨基比林使用比例根据预调查获得各级医疗机构氨基比林使用比例计算样本量计算样本量医院级别医院级别p p样本量样本量市(县)市(县)0.120.12234234乡镇乡镇0.250.25415415村级村级0.170.1731231236优选课程 市级和县级共市级和县级共8家医院家医院 乡镇卫生院乡镇卫生院171所所 村诊所:每个乡镇有村诊所:每个乡镇有20-40所左右所左右 调查调查3-6月份的各级医院的处方用药情况,月份的各级医院的处方用药情况,如何抽样?如何抽样?37优选课程处方:分层多阶段抽样处方:分层多阶段抽样u抽取市(县)、乡镇及村级医疗机构抽取市(县)、乡镇及村级医疗机构市、县级医院:市、县级医院:8 8所全部调查所全部调查乡镇医院:乡镇医院:171171所中随机抽取所中随机抽取3030所所村诊所:在抽中的村诊所:在抽中的3030个乡镇医院所在乡镇中,分别随机个乡镇医院所在乡镇中,分别随机抽取抽取1-21-2个村卫生室,共个村卫生室,共4040所所u抽取各医院抽取各医院20082008年年3-63-6月治疗发热儿童的用药处方月治疗发热儿童的用药处方市、县级医院:每月随机抽取市、县级医院:每月随机抽取8 8张,共张,共3232张张乡镇医院:每月随机抽取乡镇医院:每月随机抽取4 4张,共张,共1616张张村卫生室:每月随机抽取村卫生室:每月随机抽取2 2张,共张,共8 8张张 38优选课程医生:分层多阶段抽样医生:分层多阶段抽样u抽取市(县)、乡镇及村级医疗机构抽取市(县)、乡镇及村级医疗机构u市、县级医院:市、县级医院:8 8所全部调查所全部调查u乡镇医院:乡镇医院:171171所中随机抽取所中随机抽取3030所所u村诊所:在抽中的村诊所:在抽中的3030个乡镇医院所在乡镇中,分别随机个乡镇医院所在乡镇中,分别随机抽取抽取1-21-2个村卫生室,共个村卫生室,共4040所所u抽取到医院的儿科医生全部调查抽取到医院的儿科医生全部调查39优选课程某市医务人员甲型某市医务人员甲型H1N1流感疫苗接种意愿调查流感疫苗接种意愿调查40优选课程背背 景景 20092009年甲型年甲型H1N1H1N1流感大流行,防控工作再次成为流感大流行,防控工作再次成为全球关注焦点全球关注焦点 流感疫苗流感疫苗-有效防控流感的手段有效防控流感的手段 41优选课程WHOWHO和我国准备为医务人员优先接种甲型和我国准备为医务人员优先接种甲型H1N1H1N1疫苗疫苗 医务人员是特殊群体,非常重要:医务人员是特殊群体,非常重要:救治病人的中坚力量救治病人的中坚力量 暴露的高风险人群暴露的高风险人群 感染后易传给患者,医院内传播感染后易传给患者,医院内传播 文献显示医务人员流感疫苗接种率较低文献显示医务人员流感疫苗接种率较低42优选课程目的目的 了解该市医护人员接种甲型了解该市医护人员接种甲型H1N1疫苗的意愿,分疫苗的意愿,分析不愿接种的原因,为政府制定流感疫苗接种策析不愿接种的原因,为政府制定流感疫苗接种策略提供科学依据略提供科学依据43优选课程研究人群:该市医护人员研究人群:该市医护人员如何抽样?如何抽样?44优选课程采用分层二阶段抽样方法采用分层二阶段抽样方法 第一阶段:先抽医院第一阶段:先抽医院 第二阶段:再抽取医护人员第二阶段:再抽取医护人员 第一阶段抽取多少医院合适?第一阶段抽取多少医院合适?45优选课程 抽取抽取5家?家?抽取抽取10家?家?抽取抽取20家?家?抽取抽取30家?家?抽取抽取50家?家?46优选课程抽取的抽取的Cluster越少,抽样误差越大越少,抽样误差越大数理统计推理和中心极限定理表明,从正态总体中随机抽取例数为n的样本,样本均数服从正态分布对样本均数这个正态变量采用u=(样本均数-总体均数)/变换,变换为标准正态分布N(0.1),即u分布。实际工作中往往是s来估计的,这时就是t变换了,其结果就是t分布可信区间估计时,因为未知,一般按照t分布的原理,95%CI=Xbar SE =1,t=12.7 =2,t=4.3 =3,t=3.18,2.2(=10)2.1(=20)2.0(=30)1.96(=infinite),t47优选课程随着随着cluster增加,增加,95%CI越精确越精确 假设医院疫苗接种意愿率50%,抽4家,95%CI:44%-56%抽8家,95%CI:45.7%-54.3%抽13家,95%CI:46.2%-53.9%抽18家,95%CI:46.5%-53.5%48优选课程采用分层二阶段抽样方法采用分层二阶段抽样方法 第一阶段:共随机抽取第一阶段:共随机抽取30家医院,其中:家医院,其中:三级医院抽取三级医院抽取5家家二级医院抽取二级医院抽取10家家一级医院抽取一级医院抽取15家家 第二阶段:抽取医护人员第二阶段:抽取医护人员每家医院中随机抽取若干名医护人员每家医院中随机抽取若干名医护人员 每家医院中抽取多少名医护人员?每家医院中抽取多少名医护人员?49优选课程估计总体率的样本量估计总体率的样本量(按简单随机抽样计算)(按简单随机抽样计算)22)1(ppun=0.05,U=1.96,p=估计总体率,估计总体率,=容许误差,一般取总体率容许误差,一般取总体率95%可信区间宽度的一半可信区间宽度的一半Nnnnc/1医护人员甲流疫苗愿意接种率医护人员甲流疫苗愿意接种率50%,=0.05,=5%如果如果p=0.5,则,则 n=1.96 0.5(1-0.5)/0.05 400 人人2250优选课程两阶段抽样,样本量需要乘以设计效力两阶段抽样,样本量需要乘以设计效力 两阶段抽样的抽样误差大于单纯随机抽样两阶段抽样的抽样误差大于单纯随机抽样 本次抽样方法需要乘以设计效力,本次抽样方法需要乘以设计效力,2 共需约共需约800名医护人员名医护人员 失访率失访率10%,约,约900人人抽样的方差相同样本量下简单随机实际抽样设计的方差设计效力51优选课程900名样本的分配医院级别医院级别医护人员总数医护人员总数三级三级5家家4000二级二级10家家4000一级一级15家家900 合计合计52优选课程900名样本的分配:等额分配名样本的分配:等额分配医院级别医院级别医护人员总数医护人员总数 每家医院每家医院抽取人数抽取人数共抽取人数共抽取人数三级三级5家家400060300二级二级10家家400030300一级一级15家家90020300 合计合计 90053优选课程 什么是什么是PSU?什么是分层变量?什么是分层变量?54优选课程假如是单纯随机抽样,总体率的计算假如是单纯随机抽样,总体率的计算npq1.96率该市医护人员中,接种意愿率为:该市医护人员中,接种意愿率为:49.9%95%CI:46.6%-53.2%900名医护人员中,名医护人员中,449名愿意接种,名愿意接种,意愿接种率点值估计:意愿接种率点值估计:95%CI估计:估计:练习计算练习计算55优选课程权重调整权重调整 权重的大小:权重的大小:weight=1/抽样概率抽样概率 每名个体抽样概率不等时,需要按照权重进行调每名个体抽样概率不等时,需要按照权重进行调整整 权重调整的目的:使调整后样本人群的特征与总权重调整的目的:使调整后样本人群的特征与总体人群特征一致体人群特征一致 如:总体为如:总体为3000人,男女比例人,男女比例1:1 样本中男生抽样本中男生抽100人,女生抽人,女生抽200人人56优选课程男生男生100女生女生200女生女生=1500男生男生=1500男生抽样概率男生抽样概率=100/1500=1/15女生抽样概率女生抽样概率=200/1500=2/15男生权重男生权重=1/(1/15)=15女生权重女生权重=1/(200/1500)=7.557优选课程 复杂抽样方差与复杂抽样方差与SRS不不同,需用特殊软件计算同,需用特殊软件计算oEpiInfo有三个模块,可以进行复杂抽样的一些基本分析有三个模块,可以进行复杂抽样的一些基本分析 Complex Sample Frequencies Complex Sample Tables Complex Sample Meanso更为复杂的计算需要用其他软件更为复杂的计算需要用其他软件o SAS,SUDAAN,SPSS,STATA区间(方差)估计区间(方差)估计计算时需要计算时需要PSU和权重!和权重!58优选课程医院医院编号编号医护医护人员人员总数总数抽取医抽取医护人员护人员数量数量医护人员在医护人员在医院内被抽医院内被抽样概率样概率p2每个医院每个医院被抽中概被抽中概率率p1每个医护人每个医护人员总抽样概员总抽样概率率 p1*p2权重权重1900602800603700604600605100060三级医院共抽取三级医院共抽取5家(共家(共18家),每家被抽中概率家),每家被抽中概率p1=0.2859优选课程医院医院编号编号医护医护人员人员总数总数抽取医抽取医护人员护人员数量数量医护人员在医护人员在医院内被抽医院内被抽样概率样概率p2每个医院每个医院被抽中概被抽中概率率p1每个医护人每个医护人员总抽样概员总抽样概率率 p1*p2权重权重1400302500303300304450305350306470307330308300309320301028030二级医院共抽取二级医院共抽取10家(共家(共25家),每家被抽中概率家),每家被抽中概率p1=0.460优选课程医院医院编号编号医护医护人员人员总数总数抽取医抽取医护人员护人员数量数量医护人员在医护人员在医院内被抽医院内被抽样概率样概率p2每个医院每个医院被抽中概被抽中概率率p1每个医护人员每个医护人员总抽样概率总抽样概率 p1*p2权重权重1802027020355204452055020640207602086720一级医院共抽取一级医院共抽取15家(共家(共45家),每家被抽中概率家),每家被抽中概率p1=0.3361优选课程医院医院编号编号医护医护人员人员总数总数抽取医抽取医护人员护人员数量数量医护人员在医护人员在医院内被抽医院内被抽样概率样概率p2每个医院每个医院被抽中概被抽中概率率p1每个医护人每个医护人员总抽样概员总抽样概率率 p1*p2权重权重1900600.0670.280.012832800600.0750.280.021483700600.0860.280.025404600600.10.280.0283651000600.060.280.01759三级医院共抽取三级医院共抽取5家,每家被抽中概率家,每家被抽中概率p1=0.2862优选课程医院医院编号编号医护医护人员人员总数总数抽取医抽取医护人员护人员数量数量医护人员在医护人员在医院内被抽医院内被抽样概率样概率p2每个医院每个医院被抽中概被抽中概率率p1每个医护人每个医护人员总抽样概员总抽样概率率 p1*p2权重权重1400300.0750.40.03332500300.060.40.024423300300.10.40.04254450300.0670.40.027375350300.0860.40.034296470300.0640.40.025407330300.090.40.036288300300.10.40.04259320300.0940.40.0382610280300.110.40.04423二级医院共抽取二级医院共抽取10家,每家被抽中概率家,每家被抽中概率p1=0.463优选课程医院医院编号编号医护医护人员人员总数总数抽取医抽取医护人员护人员数量数量医护人员在医护人员在医院内被抽医院内被抽样概率样概率p2每个医院每个医院被抽中概被抽中概率率p1每个医护人员每个医护人员总抽样概率总抽样概率 p1*p2权重权重180200.250.330.08312270200.2860.330.09411355200.3640.330.128.3445200.4440.330.1466.8550200.40.330.1327.6640200.50.330.1656.1760200.330.330.1099.2867200.2990.330.1327.6一级医院共抽取一级医院共抽取15家,每家被抽中概率家,每家被抽中概率p1=0.3364优选课程按权重调整的意愿接种率按权重调整的意愿接种率权重调整的意愿接种率权重调整的意愿接种率:44.9%95%CI:41%48.9%65优选课程66优选课程两个率的比较两个率的比较 医生和护士的接种意愿率是否有差别?医生和护士的接种意愿率是否有差别?看医生和护士的接种意愿率看医生和护士的接种意愿率95%CI是否互相包含是否互相包含 互相包含:无差别,互相不包含:有差别互相包含:无差别,互相不包含:有差别 使用使用Epi info复杂抽样模块复杂抽样模块医生接种意愿医生接种意愿44%(38%-51%)护士接种意愿护士接种意愿 45%(41%-50%)67优选课程 不同级别医院医护人员的接种意愿率是否有差别?不同级别医院医护人员的接种意愿率是否有差别?看不同级别医院的医护人员接种意愿的看不同级别医院的医护人员接种意愿的95%CI是是否互相包含否互相包含三级医院接种意愿三级医院接种意愿 41%(37%-45%)二级医院接种意愿二级医院接种意愿47%(35%-58%)一级医院接种意愿一级医院接种意愿60%(56%-64%)三个率的比较三个率的比较68优选课程学到了什么?学到了什么?加权后的统计量与不加权的统计量一般加权后的统计量与不加权的统计量一般是不同的是不同的 不用加权可能会得出错误的统计推论!不用加权可能会得出错误的统计推论!记住!复杂抽样设计需用复杂抽样方法记住!复杂抽样设计需用复杂抽样方法来分析!来分析!69优选课程 95%可信区间:以样本信息推论总体时,计算出可信区间:以样本信息推论总体时,计算出的可信区间有的可信区间有95%的概率覆盖总体参数。的概率覆盖总体参数。容许误差:在抽样调查时,调查者所要求的精确容许误差:在抽样调查时,调查者所要求的精确度不是百分之百,而是在设定总体参数上下各多度不是百分之百,而是在设定总体参数上下各多少百分点作为误差容许范围,称为容许误差。少百分点作为误差容许范围,称为容许误差。70优选课程 对正态变量采用u=(X-)/变换,则将一般的正太分布N(,2)变换为标准正态分布N(0,1)数理统计推理和中心极限定理标明,从正态总体中随机抽取例数为n的样本,样本均数Xbar服从正态分布 标准误=/根号n 实际工作中标准误往往是用sxbar来估计的,这是对正态变量Xbar采用的不是u变换而是t变换了 t分布的峰部较矮尾部翘得较高,说明远侧的t值个数较多,自由度越小越明显,逐渐增大时,t分布逼近标准正态分布71优选课程 有限总体校正公式Square root(N-n)/(N-1)72优选课程Epi info中估计总体率的样本量中估计总体率的样本量 Utilities菜单的菜单的StatCalc模块模块73优选课程要求输入三个参数要求输入三个参数目标人群数目标人群数估计总体率估计总体率容许误差容许误差74优选课程可以更改任何一个参数后按可以更改任何一个参数后按F4重新计算重新计算75优选课程
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!