资源描述
,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,*,诊断试验的设计与评价,2011.7.16,诊断试验的设计与评价2011.7.16,1,一.诊断试验(diagnostic test),是对疾病进行诊断的试验方法。,包括实验室检查,各种物理诊断如各种影像诊断(X线诊断、CT、磁共振成像)、超声诊断以及放射性核素检查、纤维内窥镜、电镜等方法。,一.诊断试验(diagnostic test),2,诊断试验评价的意义,应用流行病学的方法对新的诊断试验进行评价研究,将有助于临床医师正确选用各种诊断试验,科学地解释诊断试验的各种结果,从而提高诊断水平。,诊断试验评价的意义,3,二.诊断试验研究的设计原则,确定“金标准”,选择研究对象,样本含量的估计,诊断试验临界值的制定,盲法比较诊断试验与金标准的结果,二.诊断试验研究的设计原则确定“金标准”,4,(一)金标准(gold standard),是指当前临床医学界公认的诊断疾病的最可靠的方法。也称为标准诊断。,通常包括:活检、手术发现、微生物培养、尸检、特殊检查和影像诊断,以及长期随访的结果。,(一)金标准(gold standard)是指当前临床医学界,5,关于金标准,可正确区分“有病”或“无病”。,当新试验实际上更优于传统,“金标准”,方法时,应采用最新的病理生理知识去,更新,传统的“金标准”,关于金标准可正确区分“有病”或“无病”。,6,常见问题,金标准选择不当:会造成对受试者诊断分类上的错误,使整个试验的评价失去准确性的基础。,研究设计方法不熟悉,或是对金标准在诊断性试验评价中的重要性认识不足以及疾病诊断的金标准过于复杂或风险较大等原因,常选用容易得到结果的、但准确性不高的诊断方法作为金标准。,导致结论的可信度低甚至是错误的结论。,常见问题金标准选择不当:会造成对受试者诊断分类上的错误,使整,7,(二)研究对象,病例组:,是指用金标准确诊“有病”的病例,应包含典型的、不典型病例,早、中、晚期病例,轻、中、重病例,有和无并发症的患者。,对照组:,是指用金标准证实没有目标疾病的其他病例,特别是与该病容易混淆的病例。,正常人一般不宜纳入对照组。,研究对象的代表性影响评价指标的真实性,(二)研究对象病例组:是指用金标准确诊“有病”的病例,应包含,8,常见错误,将已知某病患者作为病例组,然后再挑选健康人或其他疾病患者作为对照组,只对诊断试验阳性的患者行金标准检查,仅选用经金标准确诊的患者及非患者为研究对象;而将曾疑为某病,但因某诊断试验阴性暂未采用金标准检查的患者除外,只选用金标准确诊有病的患者作为研究对象而无对照组,常见错误将已知某病患者作为病例组,然后再挑选健康人或其他疾病,9,(三)样本含量的估计,诊断试验要求有一定数量的观察对象,即样本含量。,按照统计学中有关总体率的样本含量估算方法,分别计算病例组和对照组的样本含量。,(三)样本含量的估计诊断试验要求有一定数量的观察对象,即样本,10,样本含量计算举例:,样本含量计算举例:,11,(五)诊断试验结果的测量,1.同步盲法比较,受检对象在检测前不分组,在整理资料时才按金标准进行分组,尽可能让所有受试患者同时接受诊断试验和金标准方法,采用同步盲法判定结果(尤其是定性结果),由不知另一试验结果的人独立、客观地对诊断试验或金标准结果做出判断,(四)结果测量与处理,(五)诊断试验结果的测量1.同步盲法比较(四)结果测量与处理,12,(五)诊断试验结果的测量,1.同步盲法比较,如果先做诊断试验或金标准,然后由了解前一试验结果的人判断后一试验结果,则会发生判断倾向性,使两种方法一致性增高,当评估者了解受试者是患者,就会潜意识地寻找可能存在的阳性结果;相反,如果知道受试者不是患者,则可能放弃仔细寻找阳性信息的机会,使可能存在的阳性信息被遗漏,从而导致敏感度和特异度高于真实值,偏倚的原因,(五)诊断试验结果的测量1.同步盲法比较偏倚的原因,13,2.诊断实验的测量偏倚,应注意诊断试验的重复性及测量结果的可靠性,防止测量偏倚。,如需要由操作者判断结果的试验,至少应该用部分受试者对操作者的变异性进行简要评估。,试验结果由仪器判断时,应对仪器的变异性进行简要估计。,对诊断试验中不确定结果出现的频率,计算评价指标时是否包括了这些不确定结果均应说明。,偏倚的原因,2.诊断实验的测量偏倚偏倚的原因,14,不同诊断界值时敏度与特异度间的平衡,0,20,40,60,80,100,50,60,70,80,90,100,特异度,灵敏度,百分率(),Test variable,不同诊断界值时敏度与特异度间的平衡0204060801005,15,(五)诊断试验临界值的制定,ROC曲线法,确定诊断试验临界值是目前较为理想的方法,(五)诊断试验临界值的制定ROC曲线法确定诊断试验临界值是目,16,ROC曲线反映了灵敏度与特异度间的平衡。,在ROC曲线空间,如果曲线沿着左边线,然后沿着上边线越紧密,则试验准确度越高。,在ROC曲线空间,如果曲线沿着机会线(45度对角线)越紧密,则试验准确度越低。,ROC曲线下面积是重要的试验准确度指标。,ROC曲线反映了灵敏度与特异度间的平衡。,17,完美与无用的ROC曲线,真阳性率,即,灵敏度,假阳性率 即 1特异度,机率线(chance line)(diagonal reference line),完美与无用的ROC曲线真阳性率假阳性率 即 1特异度,18,诊断准确度较低(,0.9,),0.0,0.2,0.4,0.6,0.8,1.0,0.0,0.2,0.4,0.6,0.8,1.0,FPR,T,P,R,A,0.938,ROC曲线下面积(Area)与诊断准确度高低,高 0.90-1.00=excellent(A),中 0.80-0.90=good(B)0.70-0.80=fair(C),低 0.60-0.70=poor(D)0.50-0.60=fail(F),诊断准确度较低(0.7)0.00.20.40.60.81.,19,临界值的选择,其选择直接影响到敏感度和特异度等评价指标,诊断试验不仅要有区分健康或非某病与某病的界值,最好还有需要治疗与判断预后的界值(如:医学决定水平),其选择取决于诊断试验的目的与权衡漏诊和误诊的利弊,有时还要根据研究对象中不同年龄组、不同临床特征时临界值的差异对诊断试验准确性的影响等多种临床实际情况,分别选用多个临界值,临界值的选择其选择直接影响到敏感度和特异度等评价指标,20,参考区间的差别,正常参考区间的获得可根据常用的统计学方法,如正态分布法及百分位数法,资料必须来源于健康人的结果,同时要注意不同人种、地区、性别、年龄、不同的检测方法和系统误差等对参考值的影响,正态分布法要求资料呈正态分布,且样本含量要大(120例以上),以保证样本的代表性和结果的稳定性,一般用(X2SD)作为正常参考值,资料呈偏态分布时,要求使用百分位数法,参考区间的差别正常参考区间的获得可根据常用的统计学方法,如正,21,三、诊断试验评价,诊断试验评价就是将待评诊断试验与诊断目标疾病的标准方法,即“金标准”(gold standard),进行同步盲法比较,判定该方法对疾病“诊断”的,真实性、可靠性和实用性,。,三、诊断试验评价诊断试验评价就是将待评诊断试验与诊断目标疾病,22,目,标,人,群,金标准,病人,非病人,待评价诊断试验,评价指标,有效,无效,有效,无效,诊断试验评价程序,目金标准病人非病人待评价诊断试验评价指标有效无效有效无效诊断,23,诊断试验与金标准比较的四格表,标准诊断,有病,无病,诊断性试验,+,a,(真阳性),b,(假阳性),-,c,(假阴性),d,(真阴性),诊断试验与金标准比较的四格表标准诊断有病无病诊断性试验+a(,24,诊断试验的评价指标,特征值,别名,含义,公式,灵敏度(S),真阳性率,(真患者),在金标准诊断的“有病”病例中,诊断性试验检测为阳性例数的比例。真阳性率越高,漏诊率越低,a/,(a+c),特异性,(Sp,),真阴性率,(非患者),在金标准诊断的“无病”病例中,诊断性试验检测为阴性例数的比例。真阴性率越高,误诊率越低。,d/,(b+d),诊断试验的评价指标特征值别名含义公式 灵敏度(S)真阳性率,25,灵敏度与特异度的优缺点,优点:,灵敏度与特异度不受患病率的影响,其取值范围均在(0,1)之间,其值越接近于1,说明其诊断准确性越好。,缺点:,当比较两个诊断试验时,单独使用灵敏度或特异度,可能出现矛盾。,解决办法:,将两指标结合:Youden,指数、阳性似然比、阴性似然比等,灵敏度与特异度的优缺点优点:灵敏度与特异度不受患病率的影响,,26,诊断试验设计与循证评价ppt课件,27,医生最关心的问题:,1.试验阳性时患病的概率多大?2.试验阴性时不患病的概率多大?,医生最关心的问题:1.试验阳性时患病的概率多大?,28,诊断试验的指标(续),阳性,预测值,(PPV),阳性试验的事后概率,诊断试验出现阳性的全部事例中,有病患者出现阳性所占的比率。,a/,(a+b),阴性,预测值(NPV),阴性试验的事后概率,诊断试验出现阴性的全部事例中,无病患者出现阴性所占的比率。,d/,(c+d),准确性,(Acc,),所有检测结果中,全部真阳性和真阴性所占的比率,(a+d)/,(a+b+c+d),诊断试验的指标(续)阳性阳性试验的事后概率 诊断试验,29,例:,阳性预测值=215/231X100%=93.07%,阴性预测值=114/129X100%=8837%,PPV=93.07%表示用CPK诊断心肌梗死,结果阳性者中有93.07%确实患心肌梗死,或者说某受检者得到阳性结果时,有93.07%的可能患心肌梗死。,NPV=88.37%则表示结果为阴性者不患心肌梗死的比例,即得到阴性结果时,排除患心肌梗死的概率。,例:,30,预测值与灵敏度、特异度、患病率的关系,1预测值与患病率的关系,当灵敏度、特异度一定时,阳性预测值随着患病率的升高而升高;阴性预测值随着患病率的降低而升高。,Sketch做了一个冠状动脉狭窄的诊断研究,取了195个受试者。动脉造影以动脉狭窄75作为异常,而运动试验以心电图判断,结果见下表。,预测值与灵敏度、特异度、患病率的关系,31,诊断试验设计与循证评价ppt课件,32,患病率高时,阳性预测值高;患病率低时,阴性预测值高。,患病率高时,阳性预测值高;患病率低时,阴性预测值高。,33,阳性试验似然比(+LR),在“有病”患者中,真阳性比例与在“无病”患者中,假阳性的比例的比值。表明试验阳性时,患病与不患病机会的比值。比值越大(如10),患病概率越大,试验越好。,灵敏度/(1特异性),a/,(a+c)/1d(b+d),阴性试验似然比,(-LR),患者试验假阴性比例与非患者试验真阴性比例的比值,表明试验阴性时,患病与不患病机会的比值。比值越小(如0.1),不患病的概率越大,试验越好。,(1灵敏度)/特异性,1-a(a+c)/d(b+d),比数比,(OR,),有病患者阳性试验似然比与阴性试验似然比的比值。数值越大,表明诊断试验区分患者与非患者的能力越大。,灵敏度/(1特异性)/(1灵敏度)/特异性,(ad)/(cb),注:a,真阳性;b,假阳性;c,假阴性;d,真阴性,诊断试验的指标(续),阳性试验似然比(+LR)在“有病”患者中,真阳性比例,34,临床实践中似然比应用的粗略判断原则,阳性似然比,阴性似然比,临床判断,10,0.1,基本上可确定或排除诊断,510,0.10.2,试验前后概率中度变化,
展开阅读全文