调查研究的统计问题ppt课件

上传人:钟*** 文档编号:1923425 上传时间:2019-11-10 格式:PPT 页数:36 大小:465.50KB
返回 下载 相关 举报
调查研究的统计问题ppt课件_第1页
第1页 / 共36页
调查研究的统计问题ppt课件_第2页
第2页 / 共36页
调查研究的统计问题ppt课件_第3页
第3页 / 共36页
点击查看更多>>
资源描述
调查研究中的统计问题,1,医学科研的分类,实验(experiment) 对研究对象采取某种干预措施 调查(survey) 研究对象没有接受任何干预措施,2,调查研究的特点,研究者未对研究对象施加任何干预措施; 不能对研究对象进行随机化分组; 随机化抽样获得样本; 影响研究结果的因素较多; 通过配对设计和运用统计模型实现均衡。,3,调查研究的种类,描述性研究 现况调查和叙述性研究(文献综述) 分析性研究 病例对照研究和队列研究,4,734,154,580,合 计,486,122,364,对照组,248,32,216,病例组,合计,不吸烟,吸烟,组别,表1 、食管癌吸烟的关系,5,统计方法:,两组吸烟率的比较: 卡方检验 关联性描述: 比值比(odds ratio, OR),6,优点:,节省人力和物力; 一次调查可作多个可疑病因的探索; 获得结果的时间较短。,7,缺点:,必须通过回忆获取数据,容易影响资料的准确性。 由于疾病多存在潜伏期、隐性感染和相关疾病,选择理想的对照较困难。,8,734,154,580,合 计,486,122,364,不吸烟,248,32,216,吸烟,合计,未发病,发病,组别,表2、吸烟与食管癌的关系,9,统计方法:,两组发病率的比较: 卡方检验 吸烟与食管癌的关联性: 相对危险度(relative risk ,RR),10,优点:,由因到果的研究方法,可更加肯定地推断病因。 资料可靠性好,易于计算和比较发病率。,11,缺点:,对发病率很低的疾病,观察人数较多,容易失访。 只能作一个或几个因素的观察,若观察因素选择不当,浪费较多。,12,按调查对象的范围分类,普查(census) 对某总体中全部个体进行调查 抽样调查(sampling study) 对某总体中部分个体进行抽样,由样本获得的信息来对总体的体征做出推断。 概率抽样(随机抽样)和非概率抽样,13,概率(随机)抽样的特点与方法,特点: 保证抽样框架中的每一个研究对象都有相同的概率被抽中进入研究。 方法: 简单随机化抽样(simple random sampling) 系统抽样(systematic sampling) 分层抽样(stratified sampling) 整群抽样(cluster sampling),14,简单随机抽样,最简单的抽样方法,随机性比较好,标准误计算比较容易,实施比较麻烦。 实施方法(以1500名受试对象中抽100名为例) 1、编号; 2、取100组随机数字; 3、整理随机数字; 4、确定人员。,15,系统抽样,将总体观察单位按某特征顺序编号,确定抽样间隔H,随机确定起点k(kH),每间隔H抽取一个观察单位组成样本。,16,系统抽样,例:共有1200名学生,采用系统抽样抽取120组成样本。 1、编号; 2、确定抽样间隔H=1200/120=10; 3、随机确定K=6; 4、确定样本编号6、16、1196,17,系统抽样,优点:简便易行,容易得到一个按比例分配的样本。 缺点:当总体中的观察单位的顺序有周期趋势或单调增、减趋势时,将产生明显的偏性。,18,分层抽样,按照与研究目的明显有关的因素,将总体分为若干类型或区域(层),从每个层按比例抽取一定数量的观察单位组成该层的样本。 各层样本之和为总样本。 要求:选用分层的特征指标要使各层内观察值的变异度减小,从而减小层内抽样误差,使层间的差异增大。,19,分层抽样,例:欲了解某地区高血压患病率,按年龄分层进行抽样,各层比例如下: 60岁:5,20,整群抽样,按某种与研究目的无关的分布特征划分若干各“群”,随机抽取部分“群”组,调查“群”内所有的观察单位。 例:欲了解某部队卫生知识的普及率,按该部队的建制分为若干个连,随机抽取35个连中的全体战士作为样本。,21,整群抽样,优点:便于操作,容易控制调查质量。 缺点:抽样误差较大。 克服办法:适当地多抽取一些“群”。,22,抽样误差大小顺序,分层 系统 单纯 整群 实际操作中可根据总体情况,将过程分解为几个部分实施,称为分阶段抽样。,23,分阶段抽样,全国所有省市自治区,部分省市自治区(初级单位),部分地市(二级单位),抽到的地市中部分居民(三级单位),24,非概率抽样的特点与方法,特点: 无法确定研究对象的抽样框架,无法按常规方法计算抽样误差和推断总体。 方法: 配额抽样( quota sampling ) 滚雪球抽样(snowball sampling),25,配额抽样,样本中个体的构成在指定的几个特征方面的比例完全与总体一样。 样本有总体宏观上的代表性。 已知某地苗族居民30,故要求在调查对象中苗族居民占30。,26,滚雪球抽样,研究者尽可能找到和识别需调查的个体,并通过该个体找到下一个或多个需调查的个体,依此类推,找到足够例数的个体从而构成调查样本。 某项研究的目的是了解吸毒者的生活习惯,可通过第一吸毒者寻找该吸毒者认识的其他吸毒者,当找到第二个、第三个后,再通过他们找到第四个、第五个吸毒者,依此类推,从而找到足够的吸毒者。,27,样本量的估计,两组或多组样本比较的样本量估计与实验研究样本量估计方法相同。 单组样本量估计的条件 I型错误的概率 总体参数的变异程度 允许误差,28,估计总体均数时所需样本量大小,计算公式: 公式中为I型错误的概率,为估计指标的标准差,为允许的估计误差。,29,总体均数样本量估计的实例,某项研究工作中,据前人资料,冠心病患者血清胆固醇标准差为0.94。现要求对冠心病患者血清胆固醇总体均数做出估计,要求估计的总体均数与真实的总体均数的允许误差不超过0.2,允许犯I型错误的概率为0.05,应调查多少冠心病病人?,30,总体均数样本量估计的实例,因此认为应至少调查88人。,31,估计总体发生率时所需样本量大小,计算公式: 公式中为I型错误的概率,为估计的发生率,为允许的估计误差。,32,总体发生率样本量估计的实例,某项研究工作中,据前人资料,20-24岁妇女生育率为5-25。现要求对20-24妇女生育率做出估计,要求估计的总体生育率与真实生育率的允许误差不超过2,允许犯I型错误的概率为0.05,应调查多少20-24岁妇女人?,33,总体发生率样本量估计的实例,研究中取发生率最接近0.5的已知发生率作为预测值,因此本例需要调查1800名20-24岁妇女。,34,调查研究的资料分析,统计描述 均数、标准差、发生率等 统计推断 t检验、方差分析、2检验等 回归与相关分析、logistic回归、COX回归、聚类、判别、主成分、因子分析等等。,35,谢谢!,36,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!