资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,临床科研中常见偏倚及其控制(二),许能锋,2013年12月16日第6,8节,上街校区第六教室,提纲,一、信息偏倚及其控制,二、混杂偏倚及其控制,一、信息偏倚及其控制,(一)信息偏倚概念,(二)信息偏倚产生环节与原因,(三)常见信息偏倚,(四)信息偏倚的控制,(一)信息偏倚概念,信息偏倚,:指由于测量、诊断、询问或抄录过程中收集资料不当,使观察对象的某些特征被错误分类而产生的误差。,本质,:测量(暴露、疾病、预后等)时发生错误分类。,(二)信息偏倚产生环节与原因,产生环节,:信息偏倚主要发生在资料收集阶段,亦可发生于研究设计与资料整理分析阶段。,产生原因,:资料的观察、测量、收集方法不当,诊断试验的灵敏度、特异度以及患者提供有关信息的准确性不足,并且这种不足在比较组之间存在差别。,(三)常见信息偏倚,1.回忆偏倚(recall bias),2.诊断怀疑偏倚(diagnostic suspicion bias),3.暴露怀疑偏倚(exposure suspicion bias),4.测量偏倚(measurement bias),5.报告偏倚(reporting bias),6.沾染偏倚,7.归类错误偏倚(misclassification bias),8.家庭信息偏倚(family information bias),9.临床资料遗漏偏倚(missing clinical data bias),10.顺序偏倚(sequence bias),11.不敏感测量偏倚(non-sensitive bias),1.回忆偏倚(recall bias),1)概念:回忆偏倚是指研究对象在回忆以往发生的事情或经历时,由于在准确性和完整性上的差异所致的系统误差。在病例对照研究中最常见。,2)产生原因:,(1)所调查事件或因素发生频率太低,未给研究对象留下深刻印象而被遗忘;,(2)所需回忆事件时间久远,研究对象对其已记忆不清;关于自然流产史回忆准确性研究发现,对前10年发生的自然流产,82%回忆准确;前20年发生的自然流产,仅73%能回忆完整。,(3)研究对象对所调查的内容或事件关心程度不同,而致回忆的认真程度不一。,实例:幼儿白血病病因学的病例对照研究,Slewart等(1956)在关于幼儿白血病病因学的病例对照研究中发现,多数患儿母亲于本次怀孕期间和孕前接受X线照射的比例大于对照组,以腹部和骨盆接受X线检查尤为明显,认为幼儿白血病与母亲孕期接受X线照射有关。,有学者认为,两组妇女孕期X线照射史不同也有可能由于回忆偏差所致。因为,由于幼儿患病或死亡给病例组母亲在心理上带来创伤,使他们能够比较认真地回忆孕期各方面的情况,甚至家属也帮助回忆;而对照组母亲无此创伤,可能不会认真回忆,使暴露率较病例组低,从而夸大了X线照射与幼儿白血病之间的联系。,有学者比较了孕妇接受X线照射的医院记录与其回忆结果,发现两者一致率仅73%。,2.诊断怀疑偏倚,(diagnostic suspicion bias),1)概念:当观察者已知被观察者的某些暴露时,在调查时会自觉不自觉地侧重询问、检查该暴露就可能得出两者有联系的结论,此乃诊断怀疑偏倚。若研究对象知道自己存在某种预后因素,或了解研究目的,其主观因素亦可对研究接造成影响,亦属于诊断怀疑偏倚。,2)原因:研究者若事先知道研究对象的某种暴露或预后因素,就怀疑其已具有某种结局,或在主观上倾向于应出现某结局,于是在作诊断或分析时,倾向于自己的判断,此即诊断怀疑偏倚。例如,对暴露组或实验组进行非常细微的检查,而对非暴露组或对照组则不然,从而使研究结果出现偏差。,3)常见于队列研究和临床试验,特别是在诊断亚临床病例、判断药物副反应时,这种偏倚最容易产生。,3.暴露怀疑偏倚,(exposure suspicion bias),研究者若事先知道暴露组或实验组的某种结局,可能会对其采取与对照组不可比的方法探寻其认为与该结局有关的暴露因素,如多次认真询问实验组的相关资料,而漫不经心地调查对照组,从而导致高估暴露组或实验组的暴露,此即暴露怀疑偏倚。,例如,Nishiyama 等(1962)对儿童甲状腺癌过去放射性物质暴露史的调查发现,在36例和22例两组患儿中,以常规和查阅医疗记录方法调查,有暴露史者分别为28%和0;而经过深入调查和询问,有暴露史者分别为47%和50%。,4.测量偏倚(measurement bias),1)测量环境与条件不对等,(1)病例在医院调查,对照在家里或工作场所调查;,(2)病例与对照使用不同的调查表;,(3)调查者对病例与对照的态度与认真程度不同;,(4)由不同调查员调查病例与对照;,(5)调查病例与对照的时间间隔太长;,(6)调查员无意或有意地套取符合病因假说的信息。,2)测量差错,(1)调查员未按要求进行培训与预调查;,(2)使用的仪器设备不精良或未按要求校正;,(3)使用的试剂药品不规范;,(4)调查表设计不科学,记录不完整;,(5)调查询问方式、态度不恰当;,(6)调查或研究工作丧失科学态度。,5.报告偏倚(reporting bias),报告偏倚,是指研究对象有意地夸大或缩小某些信息而导致的偏倚。亦称说谎偏倚。,若涉及劳保、福利等,对一些问题的调查如职业危害,研究对象可能会夸大某些暴露信息;,另一方面,对从业人员进行健康调查时,某些人为了继续从事该职业可能故意缩小某些患病信息。,例如,调查性乱史或青少年吸烟史等,就可能会有相当部分的被调查者没有如实地报告实际情况。,6.沾染偏倚,对照组成员有意或无意应用了试验组的措施,称为,沾染,。,实验组成员有意、无意地接受了研究因素以外的措施,而使结果有利于试验组,称为,干扰,。,7.归类错误偏倚,每项诊断试验的灵敏度和特异度不可能达到100,就会产生假阳性和假阴性,即,误诊和漏诊,在研究中将而将非病人分入病例组,病人分入对照组。,由于调查者使用了,不正确的诊断标准或不真实的检测数据,而产生了错误分类。,错分有均衡与非均衡之分。,均衡错分使偏倚趋向无效,而非均衡错分对结果判断有影响。,实例:队列研究中病例错分,8.家庭信息偏倚,(family information bias),通过向家庭成员了解其某成员的既往病史或暴露史时,若该患者为新发病或久病不愈,则倾向于提供更多阳性信息;而当被调查成员是健康人时,则倾向于提供更多阴性信息,其中一部分可能是假阴性,这种偏倚称之为家庭信息偏倚。,9.临床资料遗漏偏倚,(missing clinical data bias),由于临床资料正常、阴性、未测量或测量未作记录所造成的临床资料遗漏,与完整的临床资料之间存在系统误差,称之为临床资料遗漏偏倚。,例如,在统计分析病历资料时,未发现某项内容,就可能导致此类偏倚。,10.顺序偏倚(sequence bias),当研究按一定的顺序进行时,季节、气候、温度、研究对象机体状况发生变化,即由于顺序规律而发生的系统误差称之为顺序偏倚。,例如,药物治疗慢性支气管炎通常需持续治疗几个月,则季节的变化可影响疗效,如从冬季开始治疗到夏季,其效果会优于从夏季开始治疗到冬季。,11.不敏感测量偏倚,(non-sensitive bias),当某检测试验或手段不足以测出临床有意义的变化或差别就可能带来假阴性,称之为不敏感测量偏倚。,(三)信息偏倚控制,1制定明细的资料收集方法和严格的质量控制方法,(1)测量变量与指标明确、客观,并力求量化或等级化;,(2)研究中使用的仪器、设备应精良,并经常校正,使用标准化试剂;,(3)对资料收集者进行统一培训,以便统一标准、统一方法,并按要求进行预调查,调查方法也应规范化,调查者对被调查者的询问方式,提问的深度和广度均应相同;,(4)通过与所收集资料有联系的鲜明记忆目标帮助患者联想回忆;,(5)收集到的患者记忆资料与相关客观记录核实;,(6)通过调查知情人或相应调查技术获取敏感问题的正确信息;,(7)对研究对象要做好宣传、组织工作,以取得研究对象的密切合作,提供如实、客观的信息;,(8)资料收集全过程都要进行质量控制,组织措施:有明确的组织系统及各岗位职责与分工。常用课题负责人、具体执行者(资料收集者)与督导员三级系统。,工作制度:实行包括工作日志、汇报制度与督导检查制度,即随时与定期考核制度。,资料可靠性抽查制度:由督导员在工作早期抽查10%研究对象进行复查或核对。,资料的检查与核实,a技术检查,检查资料收集方法、实验方法及操作规程等是否存在技术问题以至于影响资料的真实性与可靠性。,b对照核实,所有资料都要逐项检查,对关键性的、有可疑的、填写不准确的资料,再次对照客观事实进行调查、测量或检验,并予以纠正。,c缺漏检查,在资料收集过程中就应及时对逐项数据进行复核,检查资料是否齐全;在资料收集结束后应再次认真检查是否存在缺项与漏项或某项目填写不完整。,d逻辑检查,逐项对数据进行复核,发现资料间相互矛盾的地方就可能存在错误。例如,某人性别为男性,而生育史中记载先兆流产3次,这就显然存在逻辑错误。,e计算机检查,e1资料录入时检查,资料录入时可通过设置某些变量的类型(字符型、日期型或数字型)、取值范围、有效数字位数及逻辑检查,也可以通过双输入(例如应用,Epi Data,软件)部分或全部数据来检查数据的录入质量。,e2资料录入后检查,资料录入完成后一方面可通过抽查部分调查表来了解输入质量;另一方面还可以通过统计软件做简单的统计描述,如进行频数分布分析、绘制散点图等,检查所有数值是否在容许范围之内,就可以发现异常值与异常点。此外,计算机也可以通过检查相关项目的数值之间是否存在不合理或逻辑错误来发现差错或异常。例如,某人在吸烟史项目是填写从未吸过烟,而戒烟史上却记载戒烟3次,显然存在逻辑错误。,开展阶段性小结工作,2.尽可能采用客观指标或客观方法获取信息。,如应用实验室检查结果、诊疗记录作为资料的来源。此外,可以采用虚变量来分散研究对象的注意力,以减少主观因素对信息准确性的影响。制定严格统一的诊断标准与纳入标准,并严格执行。,3.尽可能采用“盲法”收集资料。,采用“盲法”收集资料有助于减少观察员的测量偏倚,若做不到盲法,应由同一个观察员测量待比较的各组。,4.精心设计好调查表,使每个问题的答案标准化,通常采用带有编码设计的封闭式调查表较为适宜。调查表应由名称与编号、一般(识别)项目、研究项目、结尾部分(各类人员对调查工作的评价)和结束部分(签名、日期)五个基本部分组成。,(1)编写调查表的基本原则,1)不需要的项目一个不要,需要的项目一个不能少;,2)用语通俗易懂,精炼准确,适合于所有调查对象,避免使用专业术语;,3)问题不能引起回答者的反感,亦不能带有暗示性,并避免出现固定倾向的问答;,4)要注意问题的现实性和逻辑性,特别是各问题之间的逻辑性;,5)尽量选用客观、定量指标;,6)多次修改,反复征求意见,力争完善。,(2)安排调查表项目顺序的基本原则,1)识别项目放在研究项目之前;,2)应符合逻辑顺序,如后面需要利用其结果的项目放在前面,按时间先后等;,3)易于回答或易于引起兴趣的问题放在前面,敏感问题或难于回答的问题放在后面;,4)封闭式问题放在前面,开放使问题放在后面;,5)评价调查工作可信度的问题应分散安排在调查表中。,5.尽量在同一时间由同一调查员调查病例与对照。,6.如有可能,在收集时可增加一些“无关”信息,以分散调查者和被调查者的注意力,以减少主观因素造成的误差。,7.研究者应始终以科学的态度搞好研究工作的质量控制。,二、混杂偏倚及其控制,(一) 混杂偏倚概念,(二)混杂因子的特征,(三)混杂偏倚的特点,(四),混杂因子的识别,(五)混杂偏倚的控制,(一) 混杂偏倚概念,1.定义:混杂偏倚(confounding)是指在研究某暴露因素与疾病(事件)之间的关联时,由于一个或多个既与疾病(事件)有制约关系,又与所研究暴露因素密切相关的外来因素的影响,掩盖或夸大了所研究暴露因素与疾病(事件)的联系。引起混杂偏倚的因素称为混杂因子(confounder)。,2.混杂偏倚在分析性研究、实验性研究中均可发生,但在分析性研究中尤为多见,并可发生于研究工作的各个阶段。,(二)混杂因子的特征,1.第三因子是所研究的疾病的危险因素或通过其他因素与疾病产生因果联系;,2.第三因子与所研究的暴露因素有联系,但不是暴露因素作用的结果;,3.若第三因子为暴露与疾病因果联系中的一中间环节,那么该第三因子不可能为一混杂因子,即混杂因子应不是疾病因果链中的中间变量。,研究肺癌与饮酒关系时吸烟混杂作用分析示意图,研究心梗与高胆固醇关系时肥胖混杂作用分析示意图,(三)混杂偏倚的特点,1有方向性,当粗OR值层内OR值时,混杂因子的作用是正的,称之为正混杂,反之,为负混杂。,2无特异性,1.根据专业知识和经验提出可疑的混杂因子。,2.分层分析再比较粗OR与层内OR是否相等。,(四)混杂因子识别,OR值齐性检验,OR值齐性检验结果表明方差齐性,可以计算合并OR值。即:,若OR值齐性检验结果表明方差齐性,则可以计算合并OR值。即:,若OR值齐性检验结果表明方差不齐,则总OR值需标准化处理。即:,计算结果,结果表明方差齐性,故可以将肥胖与不肥胖的OR值可以合并。即:,由于肥胖的混杂作用,高估了高胆固醇与心梗的联系强度。,3.借助计算机进行多元回归分析,Logistic回归模型,COX回归模型,(五)混杂偏倚控制,研究工作中可在3个阶段采取不同措施控制混杂偏倚。,在研究设计阶段采取预防措施防止混杂因子发挥作用;,在资料收集阶段详细准确收集潜在混杂因子的资料;,在资料分析阶段采取各种技术措施控制混杂偏倚的产生。,1.研究设计阶段的控制,1)限制:限制研究对象的选择条件,使某些可能产生混杂作用的变量不进入研究。,例如,比较4550岁组妇女口服避孕药与乳腺癌发病的关系,就是通过限制年龄范围来控制其混杂作用。,再如,研究年龄与心肌梗死的预后,需要限制性别、种族、心梗部位、并发症等。,2)匹配,匹配,是指应用一种特殊性限制方法,强制实验组与对照组在某些混杂因素上保持同质性,以期在设计阶段控制混杂因子。,(1)匹配方法,个体匹配:一个病例与一个或多个对照匹配,并组成对子。其中匹配个对照者称:配对,匹配多个对照者称:配比。就统计效率而言,:为50,:为67,:为80,超过:就难以使统计效率再提高。,成组配对(频数匹配):先查清病例组匹配因素的频率分布,然后按比频数分布去选对照组,使之与病例组一致。,(2)匹配因素的确定,已知或非常怀疑是混杂因子,将此因素作为匹配条件,则可消除其混杂作用。,某些复合变量作为配对条件,例如居住地或血缘关系,以消除构成复合变量的各种具体成份间种种难以推测的混杂效应。,配对因素一般不超过45个,不然匹配难以实现。没有匹配的潜在的混杂因子,可放在分析阶段去解决。,匹配因素中年龄、性别是最常的混杂因素,它与许多疾病和危险因素都有联系,因此也是最常用的匹配因素。,3)随机分组,在流行病学现场实验、临床试验、预后研究等研究中,可采用此方法。,(1)随机分组是指每个研究对象都有同样的机会进入治疗组或对照组;,(2)检验随机化效果的方法是比较两组的基本特征;,(3)随机化是消除混杂偏倚的有效方法。,平衡治疗组与对照组已知可能影响疗效和预后的因素;,平衡我们不清楚地因素。,2.资料收集阶段,认真收集关于混杂因素的详尽材料。,3.在资料分析阶段,1)分层分析,常用Mantel-Haenszel方法。例如在研究吸烟与冠心病关系时,采用病例对照研究,年龄、性别可能是混杂因素,可采用年龄大于或小于60岁分层分别比较,也可采用男女性别分层比较。,2)标准化,当两个率进行比较时,如果两组内部构成存在差别足以影响结论,需要标准化或校正。,例如,比较两个医院护士率时,甲医院:245/500=49%;乙医院:182/500=36.4%。,甲、乙两医院2000年护士功能性腰背痛患病率(%)比较,年龄,甲医院,乙医院,护士人数,患病人数,患病率,护士人数,患病人数,患病率,35岁,100,25,25.0,400,120,30.0,35岁,400,220,55.0,100,62,62.0,合计,500,245,49.0,500,182,36.4,年龄,甲医院,乙医院,护士标准人数,实际患病率,预期患病人数,护士标准人数,实际患病率,预期患病人数,35岁,500,25.0,125,500,30.0,150,35岁,500,55.0,275,500,62.0,310,合计,1000,400,1000,460,甲、乙两医院2000年护士功能性腰背痛患病率(%)标准化分析,3)多变量分析,(Logistic回归模型、COX回归模型等),用途:病因、危险因素及预后因素研究;,优点:,平衡多个混杂因素,且可以是连续变量;,估计混杂因素的相互作用;,减少样本量;,决定危险因素或预后因素的相对比重。,谢谢!,
展开阅读全文