资源描述
,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,病例对照研究(Case-control study),定义,选择患有“某特定疾病的病人”作为病例,以不患有该疾病但具有可比性的个体作为对照,调查他们发病前对某因素的暴露情况,比较两组中暴露率和暴露水平的差异,研究该疾病与这个因素的关系。,第一节 基本原理,原理:,以确诊的患有某特定疾病的病人作为病例,以不患有该病但具有可比性的个体为对照,通过询问,实验室检查或复查病史,搜集既往各种可能的危险因素的暴露史,测量并比较病例组与对照组中各因素的暴露比例,经统计学检验,若两组差别有意义,则可认为因素与疾病之间存在着统计学上的关系。,人群或人群样本,病例,对照,+,-,-,+,a,c,b,d,可,比,调查过去,是否暴露,研究方向,时间顺序,回顾性的,逆向的,病例对照研究示意图,特点,1.属于观察法,2.设立对照组,3.观察方向由“果”及“因”,4.不能确实证明暴露与疾病的因果关系。,适用于罕见病的研究,适用于慢性病的研究,研究所需的样本量较小,省时、省钱、省力,可同时研究多个因素与某疾病的联系,不适用于暴露率低的研究,常发生各种偏倚,论证强度较低,只能估计相对危险性,暴露与结局出现的时间先后不易判断,病例对照研究的优缺点,优点缺点,用途:,(1)广泛探索检验疾病的危险因素,(2)深入检验某个或几个病因假设,(3)对干预措施或效果进行初步评价,(4)为前瞻性研究提供明确的病因线索,研究类型,成组病例与对照研究,匹配病例与对照研究,衍生的研究类型,(一)成组病例与对照研究,从设计所规定病例和对照人群中,分别抽取一定量的研究对象,选择对照没有特殊规定,对照组人数病例组人数,(二)匹配病例与对照研究,匹 配/配 比(matching),定义 对照在某些因素或特征上与病例保持一致,目的 对两组进行比较时排除匹配因素的干扰,分 类,成组匹配,个体匹配,成组匹配(又称频数匹配),匹配因素所占的比例在对照组与病例组一致例如性别、年龄构成一致,具体做法上类似分层抽样。如病例组中男女各半,65岁以上者占1/3,则对照人群也是如此,个体匹配,以病例和对照个体为单位进行匹配,匹配的注意事项,慎重选择匹配因素;,可疑病因决不能作为匹配因素 ;,比例一般为1:1,也可以 1:2,甚至1:3或 1:4,一般不超过1:4 ;,匹配的因素不宜过多,避免发生“匹配过度(overmatching)” 增加工作的难度。,第二节 病例对照研究的实施,(一)提出假设,(二)确定研究对象,(三)样本含量的估计,(四)确定研究因素,(五)资料的来源与收集,(一) 提出假设,根据以往疾病分布研究或现况调查结果并结合文献,提出病因假设,(二 )病例与对照的选择,基本原则,代表性,病例能代表总体的病例,对照能代表产生病例的总体人群或源人群,可比性,两组主要特征方面无明显差异,(一)病例的选择,选择病例的要求,诊断可靠 使用金标准,选择确诊的新病例,病例种类,新发病例,现患病例,死亡病例,回忆偏倚小,代表性好,容易合作,被调查因素改变少,回忆偏倚大,被调查因素改变多,病例数较多易获得资料,来 源,总体人群中全部病例或总体随机样本人群中全部,医院住院或门诊的病例,病例,代表性好,工作开展比较困难,耗费人力物力,比较合作,资料易得到且比较可靠,与对照的可比性好,代表性差,(二)对照的选择,原 则,候选对象必须来自于产生病例的总体,意味着对照一旦发生所研究的疾病,就能成为病例组的研究对象。,来 源,研究的总体人群或抽样人群,医院中患有其它疾病的病人,亲属、邻居、同事、同学等,对照与病例比较的方法,成组比较法(group comparison),广泛探讨某种疾病的危险因素,匹配法(matching),频数匹配,个体匹配:罕见疾病或提 高研究效率时,二、样本含量的估计,有关参数,人群中被研究因素的暴露率(exposure rate),RR的近似值 OR值(查阅文献或预调查获得),值,把握度1-B,方 法,查表法,公式法:求病例对照研究样本含量的公式,暴露组患病率,对照组患病率,第三节 资料的整理与分析,资料整理,均衡性检验,计算OR,推论因素与疾病关联,一、资料整理,调查收集的资料要进行核查、检错、验收、归档;,将原始资料进行分组、归纳、编码,输入计算机,利用适当的软件统计分析。,二、描述性分析,(一)描述研究对象一般特征,(二)均衡性检验,比较病例组与对照组在研究因素以外的其他主要特征方面有否可比性,两组非研究因素均衡,其暴露率的差异与发病有关。,二、推断性分析,分析暴露因素与疾病的统计学联系以及联系强度,(一)成组比较法资料的分析,(1)分析第一步:病例组和对照组的暴露率差异是否有统计学意义(2 检验),(2)分析第二步:推断暴露因素与疾病关联强度,OR,又称优势比,比值比,指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。,公式,OR:(a/c)/(b/d)=ad/bc,(3)分析第三步:OR可信限的估计及其意义,OR 95%C.I.=,OR值及其可信限的意义:,OR1:暴露与疾病危险无关联;,OR1:暴露与疾病危险的关联增强;,OR1:暴露与疾病危险的关联减小;,OR值95%的可信限包含1,表明暴露与疾,病的联系不显著。,例13.3 饮酒与食管癌关系的病例对照研究,结果如下表:,分析第一步:病例组和对照组的暴露率差异是否有统计学意义,P0.05,两组暴露率差别具有统计学意义,,提示饮酒与食管癌有统计学关联,第二步,推断暴露因素与疾病关联强度:,比值比:病例组的暴露比值与对照组的暴露比值之比,优势比(OR),病例组暴露与非暴露的比值为a/c,对照组暴露与非暴露的比值为b/d,则OR=a/c:b/d=ad/bc=(164*379)/(397*36)=4.35,第三步:OR值95%CI计算,通过OR的可信区间的计算,得知该区间不包括1,且大于1,提示该项研究OR=4.35不是抽样误差造成的,可以认为饮酒是食管癌的危险因素。,(二) 1:1配对资料的分析,匹配资料是由病例与对照结合成对子,列成下表的格式,表内的数字a、b、c、d 是病例与对照配成对的对子数,公式,表 1:1配对研究中疾病与暴露的关系,OR 95%C.I.=,(三)分层分析,分层分析是将研究人群按可能的混杂因素分成若干层,如按性别可分为男女两层,按年龄可分为2039岁、4059岁及60岁及以上三层,然后分别分析各层中暴露与疾病的关联。,分层分析提供了控制混杂因素对结果影响的最基本的分析方法。,1分层资料的整理和混杂因素的识别和判断,2计算各层的OR,分析研究因素与疾病的关联强度,3计算总的卡方值及总OR值,分层分析步骤,1、确定分层因素,分层列四格表,2、分别计算各层的OR值,3、各层OR值同质性检验,4、如果来自同一总体,则计算合并的OR值;异质的情况下计算,标化OR值,5、计算合并的卡方值,6、下结论,将研究资料按照混杂因素来进行分层。若各层之间的暴露与疾病的效应值一致,可以用M-H法计算调整混杂因素后的效应估计值;若各层之间的暴露与疾病的效应值不一致,可用标准化法的方式来调整。存在混杂时,需要计算经过调整的总的关联效应估计值(加权平均,如Woolf法,M-H法),此时一定要结合临床/生物学意义进行综合分析,而不应该仅仅根据统计学结果来判断。调整后的关联效应值总的OR值与粗的关联效应值的变化在10%以上时,即存在差异,可以认为混杂作用的存在,否则此时可以认为第三个变量没有作用,可以忽略。,混杂因素的识别与判断,(四)分级资料的分析,1)资料整理,2)卡方趋势检验,3)计算各级的OR值:,4)得出结论,四、常见偏倚及其控制,1. 选择偏倚(selection bias),产生原因 选择的研究对象不能代表总体人群,最常见偏倚 伯克森偏倚(Berksons bias),选择医院的病人作为病例与对照,这些病人可以因为种种原因造成入院率的差异,例如高血压、肿瘤、阑尾炎病人的入院率显然各不相同入院率的不同就可造成偏倚。,现患病例-新发病例偏倚,检出症候偏倚,时间效应偏倚,选择偏倚的控制,尽量合理地选择病例与对照,尽可能地从多家(类)医院选择病例与对照,2. 信息偏倚(information bias),在收集整理信息过程中由于测量暴露与结局,的方法有缺陷造成的系统误差,病例对照研究中最常见的信息偏倚是回忆偏倚,回忆偏倚由于被调查者记忆失真或不完整造成的偏倚。,控制:采用客观的标准获得资料;用新发病例。,3.混杂偏倚(confounding bias),研究某个因素与某种疾病的关联时,由于某个既与疾病有关系,又与所研究的暴露因素有联系的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系。,混杂偏倚控制,混杂因素作为匹配因素,分层分析,进行多因素分析(限制),吸烟和肺癌关系的病例对照研究,20世纪二十年代,许多工业发达国家报道,肺癌年死亡率逐年升高。1901年1920年男性为1.1/10万,女性为0.6/10万,至19361939年上升到男性10.6/10万,女性为2.5/10万。,关于肺癌的病因,当时有人提出过吸烟、大气污染等危险因素,但也有人提出肺癌死亡率升高的原因是由于人口寿命延长、人口老化的结果或/和对肺癌的诊断手段的改进,使肺癌的检出率与死因诊断水平提高等。,课题一,问题1 如何提出病因假设?,问题2 为验证上述因素和肺癌之间是否存在因果关系,可采用哪些流行病学研究方法?,英国学者Doll和Hill于1948年4月至1952年2月进行了吸烟和肺癌关系的专题研究。在四年间,搜集了伦敦及其附近20所医院(后来又增加了一些医院)诊断为肺癌的病人作为调查对象,上述医院在这四年期间凡新收入肺癌、胃癌、肠癌及直肠癌等患者时,即派调查员前往医院调查。每调查一例肺癌病人,同时配一例同医院同期住院的其他肿瘤病人作为对照。,问题3 此为何种流行病学研究方法?简述该研究方法的设计原理。,问题4 简述该种研究方法的特点、应用和优缺点。,问题5 简述该种研究中病例和对照的选择原则。,问题6 病例和对照的来源有哪些?,问题7 本研究选择住院病人作为调查对象是否有代表性?,肺癌病人大都经病理组织学或痰细胞学检查确诊,少部分病人依据肺部X线检查或支气管镜检查确诊。事先规定75岁以上的病人不作为调查对象,并去除了误诊为肺癌最后修订诊断的病人80例,因故未能调查的肺癌病人408例(包括调查时出院者189例,病危者116例,死亡者67例,耳聋者24例,不会英语者11例),这样被调查的肺癌病人大约占当时这些医院里肺癌病人总数的85%,计1465例。,问题8 试述严格制定病例、对照诊断和排除标准的重要性。,问题9 缺失因故未能调查的病例资料对研究结果有何影响?,对照组和肺癌组的匹配因素是(1)年龄相差少于5岁,性别相同;(2)居住地区相同;(3)家庭经济条件相似;(4)同期入院并住同一医院。表5-1为肺癌组与对照组年龄,性别的均衡性比较。,问题10 病例组和对照组匹配的目的是什么?匹配的注意事项有哪些?,表5-1 肺癌组与对照组性别、年龄均衡性比较,肺癌组和对照组病人均详细询问既往和现在的情况并填入统一的调查表。调查工作是由具备四年该种调查研究经验的调查员来完成。作者对各项调查内容均有明确规定,其中吸烟者的定义是,一个人每日吸一支或以上纸烟持续一年之久者,不足此标准列为非吸烟者。为检验调查对象对吸烟史回答的可靠性,作者随机抽查了50例,问过吸烟史后,间隔6个月后第二次重新询问,两次回答的结果见表5-2。,表5-2 两次询问50人吸烟量(支/日)的一致性,问题11 调查病例和对照“既往”暴露情况时,对“既往”如何界定?,问题12 在进行病例对照研究时,进行调查可靠性检验的目的是什么,问题13 根据表5-2,计算第一次和第二次询问结果的一致性,即调查的可靠性。并对结果进行评价?,研究者对男性调查结果进行了下列两种分析,见表5-3、表5-4。,表5-3 男性肺癌患者与对照的吸烟习惯比较,问题14,根据表5-3,计算下列指标:,肺癌组中吸烟者所占的比例=,对照组中吸烟者所占的比例= 2 P OR OR 95%的可信区间=,下限 上限,表5-4 男性肺癌患者与对照的吸烟情况比较,问题15,根据表4,计算下列指标:,2 P OR OR95%的可信区间= 下限 上限,问题16,表3和表4的设计、数据整理和分析原理有何不同?本研究资料采用哪一种分析方法更合理?为什么?,
展开阅读全文