诊断性研究证据的评价和应用

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,诊断性研究证据的评价和应用,诊断性试验的范围,诊断性试验是对疾病进行诊断的试验和方法。,病史和体检所获得的临床资料；,各种实验室检查，生化、血液学、细菌学、病毒学、免疫学、病理学和遗传学等；,影像学检查，,X,线诊断、超声诊断、,CT,、,MRI,及放射性核素检查等；,各种器械诊断，心电图、纤维内镜等；,各种公认的诊断标准，诊断急性风湿热的,Jones,诊断标准、诊断,SLS,的,ARA,诊断标准等。,诊断性试验的目的,诊断疾病：病因、病原学、病理学诊断等；,判断病情的严重性：功能损害的诊断；,估计疾病临床过程及预后；,预测治疗效果；,筛查无症状的病人,;,监测疗效,循证诊断,循证诊断,(evidence base of clinical diagnosis),：指临床上选用何种诊断试验，采用何种诊断标准用于您所经治的患者，都必须建立在当前最佳研究结果所获得的证据和最佳临床专业知识的基础上，使患者获得最大的利益。,诊断试验的研究链,技术性能，诊断技术的精确性,诊断试验准确性，准确诊断疾病,对诊断试验的影响，诊断试验结果是否影响对其他诊断技术的选择,治疗的影响，诊断试验结果是否影响选择和提供治疗方法,对患者结局的影响，能否改善患者的健康状况,成本效果的影响,研究和评价诊断性试验的目的,正确认识诊断试验的临床应用价值,合理选用各种诊断试验，提供临床上最好的诊断方法,科学解释诊断试验结果,提高临床疗效：早期诊断，早期治疗,诊断试验研究的基本原则,1,、确定金标准,2,、研究对象的选择,3,、盲法、独立和同步比较,4,、列四格表，计算相关指标,5,、样本量的计算,1,、确定金标准,金标准,(gold standard),或标准诊断：指当前医学界公认的诊断某种疾病最准确、最可靠的方法。,包括：外科手术,病理诊断,影像学诊断,临床专家共同制定的标准,长期临床随访,金标准确定后，所有研究对象均用金标准划分为有病、无病两组,金标准选择必须准确，否则造成疾病分类错误，影响要评价的诊断试验的准确性。,如：将多普勒超声图像代替静脉造影作为分析深静脉血栓的参考方法,2,、研究对象的选择,诊断试验的临床标准,不是取决于是否能区分正常人与典型、重型病例,而是取决于是否能区分容易混淆的疾病或疾病的严重程度,诊断试验的研究对象，应能代表试验检查对象的总体,典型和不典型,早、中、晚期,轻、中、重型,有和无并发症的病例,容易和该病混淆的病例,正常人一般不宜纳入对照组,3,、盲法、独立和同步比较,盲法、独立和同步比较诊断试验和金标准的结果,要评价的诊断试验必须与金标准比较,选择的诊断试验：更简便,更容易实施,减少创伤,成本更低,新诊断试验与金标准盲法比较,判断诊断试验结果不能预先知道金标准划分研究对象的标准,如：知道了超声心动图的结果后，原来未听到的心脏杂音很容易听到,知道了,CT,扫描的结果，原来胸片上未发现的肺部肿块很容易发现,独立比较,某些情况下，金标准是建立在一系列试验和相关临床资料基础上，此时，金标准不能包括新的诊断试验，以免夸大诊断的准确性，产生,incorporation bias,新诊断试验的结果影响金标准的使用，如采用介入方法作为金标准，当新的诊断试验结果为阴性时，病人不能接受再使用金标准进行诊断，产生,verification bias,同步比较,诊断试验与金标准诊断的结果应同期进行，疾病过程的不同阶段，其病理形态、生理、发生发展影响诊断,如某些急性自限性疾病,4,、列四格表，计算相关指标,敏感度,(Sensitivity,Sen,),：金标准诊断全部,有病,病例中，诊断性试验结果,阳性,所占的比例，也称,真阳性率,。,Sensitivity(Sen,)= a/(,a+c,),假阴性率：诊断性试验结果为,阴性,的病例占全部,有病,病例的比例，代表,漏诊率,。,真阳性率,1,假阴性率,Sen,高，则漏诊率低，有助于排除相应疾病。,特异度,(Specificity,Spe,),：金标准诊断全部,无病,的受试者中，诊断性试验结果,阴性,所占的比例，也称,真阴性率,。,Specificity(Spe,)=,d/(b+d,),假阳性率：诊断性试验结果为,阳性,的病例占全部,无病,受试者的比例，代表,误诊率,。,真阴性率,1,假阳性率,Spe,高，则误诊率低，有助于确定诊断。,敏感度和特异度的特点,当试验方法和金标准固定时，每个诊断试验的敏感度和特异度是恒定的；,当诊断试验的结果呈连续性数据时，区分诊断试验正常和异常的临界点会影响敏感度和特异度。,不同应用目的，对诊断性试验要求不同。,Sen,高的诊断试验用于：,筛选患病率低的疾病、防漏诊；,临床排除某一疾病（用阴性结果）；,防漏诊致严重后果者（如,SARS,）。,Spe,高的诊断试验用于：,假阳性致不当防治者；,假阳性致患者巨大精神障碍、经济负担者（如癌症）；,肯定临床诊断，指导治疗。,提高诊断性试验敏感度或特异度的方法,（一）平行试验,多个诊断试验，只要,任一试验的结果阳性,，即判断为患病者，这种方法称为平行试验,(,parallel test,),。,Sen,A=80%;,Sen,B=60%;,Spe,A=80%;,Spe,B=90%,平行试验,Sen,=,Sen,A + (1-Sen,A)Sen,B,=0.80+(1-0.80)0.60=0.92,平行试验,Spe,=,Spe,A ,Spe,B,=0.800.90=0.72,平行试验适用于：,急需迅速作出诊断者，如急诊患者或外地门诊患者复诊有困难时；,诊断该病如漏掉一个患者后果严重，迫切需要敏感度高的试验，但目前手中只有两项或两项以上不太灵敏的试验。,（二）系列试验,使用两个或两个以上的诊断试验，并,均取得阳性结果,后再作出疾病存在的多项试验称系（序）列试验,(,serial test,),。,Sen,A=80%;,Sen,B=60%;,Spe,A=80%;,Spe,B=90%,系列试验,Sen,=,Sen,ASen,B,=0.800.60=0.48,系列试验,Spe,=,Spe,A + (1-Spe,A)Spe,B,=0.80+(1-0.80)0.90=0.98,系列试验适用于：,慢性病，不一定需要迅速做出诊断，但需要增加诊断的正确性；,为减少误诊率，迫切需要特异度高的试验，但目前手中只有两项或两项以上特异度不高的试验；,当诊断该病的某些试验昂贵且有危险，可用较简单而安全的试验先做，一旦提示该病可能，才做上述试验。,准确度,(Accuracy, Ac),：该项诊断性试验的全部,真阳性者和真阴性者,占受试对象总和的比例，又称总符合率，反映诊断试验结果与,金标准,试验结果,符合或一致,的程度。,Accuracy(Ac,)=(,a+d,)/N,患病率,(prevalence, PREV),：经诊断性试验检测的全部病例中，真正“有病”患者所占的比例。,PREV=(,a+c)/(a+b+c+d,),在级别不同的医院中，某种疾病的患者集中程度不同，故患病率差别大。,预测值,(predictive value, PV),：根据诊断试验的结果来估计患病可能性大小的指标。,阳性预测值,(positive predictive value, +PV),阴性预测值,(negative predictive value, -PV),阳性预测值,(positive predictive value, +PV),：诊断性试验为,阳性,的全部病例中，用金标准诊断为“,有病,”的病例所占的比例。,+PV=a/(,a+b,),阴性预测值,(negative predictive value, -PV),：诊断性试验为,阴性,的全部病例中，用金标准诊断为“,无病,”的病例所占的比例。,-PV=,d/(c+d,),预测值的特点,敏感度越高的试验，,-PV,越高；,特异度越高的试验，,+PV,越高；,患病率对预测值的影响要比敏感度和特异度更重要。,敏感度和特异度不变时，,+PV,随患病率上升而上升；,-PV,随患病率的上升而下降，,+PV,上升速度快于,-PV,的下降速度，说明患病率对,+PV,的影响更明显。,患病率对预测值的影响,(1),监护病房,CK,诊断心梗(CK80=CK-),心梗无心梗,CK+215(93%)16231,+PV=93%,CK-15114(88%)129,-PV=88%,Total230130360,Pre=64%,普通医院,CK,诊断心梗,(CK40岁人群,肝癌非肝癌,AFP+ 800 9900 10700,+PV=7.48%,AFP- 20089100 89300,Total100099000100000,Pre=1000/10万,患病率对预测值的影响,(4),AFP,诊断肝癌，敏感度80，特异度90,HBsAg(+) 年龄40岁肝硬化人群,肝癌非肝癌,AFP+ 8000 9000 17000,+PV=47.06%,AFP- 200081000 83000,Total1000090000100000,Pre=10000/10万,患病率对预测值的影响,(5),似然比,(likelihood ratio, LR),：诊断试验结果在,患者,中出现的概率与,非患者,中出现的概率之比。,代表一个诊断性试验区分有病和无病的能力大小。,阳性似然比,(positive likelihood ratio, +LR),：出现在金标准确定有病的受试者,阳性,结果与出现在无病受试者,阳性,试验结果的比值大小或倍数。,或表示,阳性,试验结果对一个受试者患病的概率与未患病的概率的比值或倍数。,即,真阳性率和假阳性率,的比值。,+LR=Sn/(1-Sp),阴性似然比,(negative likelihood ratio,-LR),：出现在金标准确定有病的受试者,阴性,结果与出现在无病受试者,阴性,试验结果的比值大小或倍数。,或表示试验结果,阴性,时，一个受试者患病概率与未患病的概率的比值或倍数。,即,假阴性率和真阴性率,的比值。,-LR=(1-Sn)/Sp,似然比的特点和应用,可以同时反应,Sen,和,Spe,的复合指标，比,Sen,和,Spe,更稳定，不受患病率的影响，是诊断性试验综合评价的理想指标；,在确定某项检验或某项体征的,+LR,后，可根据患者的病史、体征作出验前概率的估计，再根据检测结果，应用,+LR,，计算该病例患病的验后概率。,验前概率,(pre-test probability),：临床医师根据病史、体征等，估计该患者可能患病的概率。,诊断性试验中验前概率的判断：根据个人经验，人群患病率资料，实践资料，文献描述，对不同情况下验前概率的研究资料。,验前概率实例,验后概率：诊断试验不能直接告诉患者是否患某种疾病，只能帮助我们根据试验结果估计患者的患病概率，验后概率的计算取决于：验前概率的估计和诊断试验似然比的大小,验前比,(pre-test odds)=,验前概率,/(1-,验前概率,),验后比,(post-test odds)=,验前比,似然比,验后概率,(post-test probability)=,验后比,/(1+,验后比,),注意事项：在诊断性试验的计算中，如果验前概率与该试验的患病率相同，则验后概率与阳性预测值相同。否则，不能认为验后概率就等于阳性预测值。,似然比应用图,Sn,= a/(,a+c,)=215/230=93.5%,Sp=,d/(b+d,)=114/130=87.7%,PREV=(,a+c)/(a+b+c+d,)=230/360=63.9%,+PV=a/(,a+b,) =215/231=93.1%,-PV=,d/(c+d,)=114/129=88.4%,+LR=Sn/(1-Sp)=0.935/(1-0.877)=7.60,-LR=(1-Sn)/Sp=(1-0.935)/0.877=0.0741,血清磷酸肌酸激酶,(U/L),急性心肌梗死,合计,是,否,+(,80),215(a),16(b),231,(10,或,0.1,，使验前概率到验后概率发生决定性变化，基本可确定或排除诊断,似然比,510,或,0.10.2,，使验前概率向验后概率发生中等度变化,似然比,25,或,0.20.5,，使验前概率向验后概率发生较小程度的变化,似然比,12,或,0.50.1,，使验前概率向验后概率之间基本上不发生变化,一位中学女教师,36,岁，面色不好，心悸半年多，每次月经量偏多，如何进行诊断？,根据病史：面色不好、月经量偏多,初步诊断：缺铁性贫血,(IDA),可能性有,70% (,验前概率,),经检查：,Hb,65g/L,，,RBC 3.02,10,2,/L,，血清铁蛋白,20,g/L (,LR=4.8,),验前比,=,验前概率,/(1,验前概率,),=0.7/(1-0.7)=2.3,验后比,=,验前比,似然比,=2.3,4.8,=11.04,验后概率,=,验后比,/(1+,验后比,),=11.04/(1+11.04)=0.916,该教师患,IDA,的可能性为,91.6%,。,受试者工作特征曲线,(receive operator characteristic curve,简称,ROC,曲线）,采用真阳性率和假阳性率作出的曲线，适用于,诊断试验结果为连续变量,试验的,真阳性率,（,Sen,）为,纵坐标（,Y,）,，,假阳性率,（,Spe,）为,横坐标（,X,）,，,坐标轴上的率值由,01,或,0%100%,。,制作：根据诊断性试验测定的系列数据，选择不同临界点，分别计算敏感度和特异度，一般要求,5,个连续分组数据，选择,5,个不同标准，分别画四格表，得出,5,个特异度，敏感度，根据这,5,个特异度和敏感度画,ROC,曲线。,临床应用：正确选择参考值的临界点；比较两种或两种以上诊断性试验的诊断价值。,IgG,和,IgG,1,指数诊断多发性硬化的,ROC,曲线,离,左上角,垂直距离最短的一点，其敏感度和特异度之和最大，这一点或邻近点常被作为诊断参考值，这些点称为,最佳临界点,，点上的值称为,最佳临界值,。,ROC,曲线下面积,(area under the ROC curve,AUC,ROC,),：反映一个试验的整体准确性，面积越大、准确性越高。,诊断准确度较低（,0.9,）,0.0,0.2,0.4,0.6,0.8,1.0,0.0,0.2,0.4,0.6,0.8,1.0,FPR,T,P,R,A,0.938,ROC,曲线下面积（,Area,）与诊断准确度高低,高,0.90-1.00 = excellent (A),中,0.80-0.90 = good (B) 0.70-0.80 = fair (C),低,0.60-0.70 = poor (D) 0.50-0.60 = fail (F),似然比（,LR,）在,ROC,曲线空间的涵义,白细胞计数诊断白血病,LR,7.5,LR,0.7,LR,2.3,LR,25.0,ROC,曲线小结,ROC,曲线反映了敏感度与特异度间的平衡,(,增加敏感度将降低特异度；增加特异度将降低敏感度,),。,在,ROC,曲线空间，如果曲线沿着左边线，然后沿着上边线越紧密，则试验准确度越高。,在,ROC,曲线空间，如果曲线沿着机会线（,45,度对角线）越紧密，则试验准确度越低。,在诊断界值（,cutpoint,）处的正切线的斜率就是该试验值对应的阳性似然比（,likelihood ratio,，,LR),。在,ROC,曲线空间的左下角,LR+,最大，随着曲线从左下往右上方移动，,LR+,逐渐减小。,ROC,曲线下面积是重要的试验准确度指标。,5,、样本量的计算,确定所需的最小样本量,诊断试验样本量的大小与下列因素有关,诊断试验的敏感度,特异度,允许的误差范围,诊断性研究证据的分级,诊断试验证据的真实性评价,是否与诊断目标疾病的参考标准或金标准独立地同步地进行了盲法比较？,是否纳入适当的研究对象（这些研究对象与临床实践中的对象相似）？,研究所采用的金标准或参考标准是否与诊断试验无关？,测量诊断试验的方法或一组方法在另一组受试对象中是否也能得到可靠的结果？,QUADAS(Quality,Assessment for Diagnostic Accuracy Studies),评价诊断试验,21,条：,1,、诊断试验准确性研究中所纳入的患者病谱是否代表了实践中将应用此诊断试验的患者？,2,、是否将参考标准像目标疾病一样正确地分类？,3,、参考标准检测诊断试验时与用该研究检测方法检测诊断试验之间的间隔时间是否足够短而不至于造成目标疾病病情在两次检测之间发生变化？,4,、所有样本或随机抽取的样本是否都接受过诊断参考标准的确认？,5,、无论所研究的诊断试验检测方法的结果如何，患者是否经过相同的参考标准确认？,6,、参考标准是否独立于检测方法（例如，检测方法不是参考标准的一部分）？,7,、该检测方法结果的解释是否没有使用参考标准的结果？,8,、参考标准结果的解释是否没有使用检测方法的结果？,9,、实际应用检测方法时所解释的临床资料是否与研究该方法时结果解释的相同？,10,、是否报告了不可解释的,/,中间试验的结果？,11,、是否对研究过程丢失的病例进行了解释？,12,、如果使用了临界值，其值是否在试验开始前就确定了（预先确定临界值）？,13,、自从检测方法的研究完成后，其检测技术是否有改变？,14,、该研究是否有清楚的“阳性”结果定义？,15,、受试对象是否接受该检测方法检测之后开始治疗，尔后再使用参考标准进行诊断？,16,、受试对象是否接受参考标准诊断后开始治疗，尔后再使用该检测方法进行检测？,17,、是否报告了检测者的资料变异？,18,、是否报告了仪器的资料变异？,19,、资料是否与受试对象的分层亚组相对应列出？,20,、纳入的样本含量是否适当？,21,、是否预先描述了研究目的？,其中，前,11,条涉及受试对象病谱,(1),、金标准,(2),、疾病进展偏倚,(disease progression bias)(3),、部分确证偏倚,(,patial,verification bias)(4),、不同确证偏倚,(differential verification bias)(5),、加合偏倚,(incorporation bias)(6),、检测方法评估偏倚,(test review bias)(7),、诊断评估偏倚,(diagnostic review bias)(8),、临床评估偏倚,(clinical review bias)(9),、不可解释结果,(,uninterpretable,results)(10),、丢失,(withdrawl)(11),等，为必须条目。,诊断试验的重要性评价,是否通过该项诊断试验，能正确诊断或鉴别该患者有无特定的目标疾病,临床上初步考虑诊断的可能性就是验前概率，通过试验得到了阳性似然比，就可计算验后概率，在这过程中诊断试验能起多大的作用，这就是该诊断试验改变我们诊断性思维的能力。,敏感度、特异度、似然比,诊断试验的精确性评价,计量资料用标准差异及变异系数来表示,CV= SD/M,计数资料用观察符合率与卡帕（,Kappa,）,值表示,观察符合率又称观察一致率，指两名观察者对同一事物的观察结果一致的百分率，或指同一观察者对同一事物的两次观察结果一致的百分率，前者称观察者间观察符合率，后者称观察者内观察符合率。,Kappa,值是指判断不同观察者间，校正机遇一致率后观察一致率指标，是实际符合率与最大可能符合率之比。,Kappa,值的计算,甲医生,肺门淋巴结核,正常,乙医生,肺门淋巴结核,46 a,b 10,56(r,1,),正常,12 c,d 32,44(r,2,),58(c,1,),42(c,2,),甲、乙医生阅读同样,100,张胸部,X,线片的诊断一致性,观察一致率,(,po,)= (,a+d,)/N,po,= (46+32)/100=78%,机遇一致率,(pc)= (r,1,c,1,)/N+ (,r,2,c,2,)/N)/N pc=(56,58)/100+(44,42)/100)/100 =51%,非机遇一致率,=1-pc,非机遇一致率,=100%-,51%=49%,实际一致率,=,po,-pc,实际一致率,=,78%-51%=27%,Kappa,值,=po-pc/1-pc,Kappa,值,=27%/49%=0.55,甲医生两次阅读同样,100,张胸部,X,线片的一致率,第,1,次,肺门淋巴结核,正常,第,2,次,肺门淋巴结核,69 a,b 11,80 (r,1,),正常,1 c,d 19,20 (r,2,),70 (c,1,),30 (c,2,),100,（,N,）,观察一致率,(,po,)= a+d/N,po,= 69+19/100=88%,机遇一致率,(pc)= (r,1,c,1,)/N+ (,r,2,c,2,)/N)/N,pc,=(80,70)/100+(20,30)/100)/100 =62%,非机遇一致率,=1-pc,非机遇一致率,=100%-62,%=38%,实际一致率,=,po,-pc,实际一致率,= 88,%-62%=26%,Kappa,值,=po-pc/1-pc,Kappa,值,=26%/38%=0.68,简化公式,N(a+d)-(r,1,c,1,+r,2,c,2,),Kappa=,N,2,-(r,1,c,1,+r,2,c,2,),Kappa,值的计算,Kappa,值判断标准,Kanidis,和,Koch,提出判断标准,Kappa,值一致性强度,0,弱,00.2,轻,0.210.40,尚好,0.410.60,中度,0.610.80,高度,0.811.00,最强,诊断试验的适用性评价,该诊断试验在本地是否能实施、经济上能否承担、准确性和精确性如何？,根据该诊断试验产生的验前概率是否符合临床估计？,由此产生的验后概率是否影响对患者的处治和对患者有利？,需要做进一步的试验？,立即进行治疗？,基本上排除了该病的可能性，既不需要进一步检查，也不需要治疗？,诊断阈值,治疗阈值,诊断阈值,：诊断试验结果为阴性或产生似然比为,0.1,使验后概率低于某一数值，此时我们不需要再做任何进一步试验而否定该病诊断，该数值叫诊断阈值。,治疗阈值,：诊断试验结果为阳性或有非常高的似然比，验后概率非常高，在这种情况下也不需要进一步做其他检查就可以肯定诊断，给予治疗，该值叫治疗阈值。,0 .10 .20 .30 .40 .50 .60 .70 .80 .90 1.0,不做进一步检查,不做治疗,根据检查结果,决定检查和治疗,不做检查,直接治疗,A,B,目标疾病的患病率（验前概率）,注：,A,、,B,分别是阴性和阳性阈值点，,A,阈值点左侧是阴性区，,A,和,B,之间是中度阳性区，,B,阈值点右侧是阳性区。,验后概率从原验前概率所在的区域移动到另一区域称为跨越检测,-,治疗阈值。,验后概率能否跨越阈值取决于似然比的变化，如果诊断试验结果为阴性，且似然比低至,0.1,，验后概率可能很低，低至图中,A,点一下，则可放弃最初的诊断，不再从该病考虑进一步检查，而考虑其他诊断可能。相反，如果诊断试验结果为阳性，且似然比很高，则验后概率可跨越,B,阈值点以上，可做出目标疾病的诊断并直接对患者进行治疗。,如果验后概率落在,诊断阈值,与,治疗阈值,之间，要考虑作进一步检查来决定排除或肯定诊断，则需要做联合试验，此时前一个试验的验后概率就是下一项试验的验前概率。通过一系列试验计算总的验后概率，就能做出肯定或否定的诊断帮助决策。,举例：一位,45,岁男性步行来门诊求诊，其冠状动脉狭窄,75%,的可能性（验前概率）为,6%,。他向医师陈述了其心绞痛的历史。该病史作为一项诊断试验，阳性似然比为,13,。接着患者又去做心电图运动试验，结果显示,ST,段压低,2.2mm,（似然比为,11,）。此时计算其验后概率如下：,验后比,(0.06/0.94)1311=9.13,验后概率,=9.13/(1+9.13)=90%,根据此验后概率可开始对患者进行治疗。,

展开阅读全文

诊断性研究证据的评价和应用

最新文档