医学科研设计 5筛检与诊断试验

资源描述

王建炳王建炳浙江大学公共卫生学院浙江大学公共卫生学院2015-10-222015-10-22 12Fig 1.Study design.CHB,chronic hepatitis B;HCC,hepatocellular carcinoma;ROC,receiver operating characteristics;RT-PCR,reverse transcriptase polymerase chain reaction.3 筛检试验筛检试验诊断试验诊断试验对象对象不同不同健康人或无症状的健康人或无症状的病人病人病人病人目的目的不同不同把病人及可疑病人把病人及可疑病人与无病者区分开来与无病者区分开来病人与可疑有病但病人与可疑有病但实际无病的人区分实际无病的人区分开来开来要求要求不同不同快速、简便、高灵快速、简便、高灵敏度敏度科学性、准确性科学性、准确性费用费用不同不同简单、廉价简单、廉价一般花费较贵一般花费较贵处理处理不同不同阳性者须进一步作阳性者须进一步作诊断试验以便确诊诊断试验以便确诊结果阳性者要随之结果阳性者要随之以治疗以治疗 45（一）筛检试验（一）筛检试验1678四四实施筛检试验的原则实施筛检试验的原则910（二）诊断试验（二）诊断试验作为临床医师，必须考虑的问题：u一个试验方法用于某种疾病诊断的真实性和可靠性如何？u如试验结果异常对疾病的诊断价值有多高？u试验结果正常对排除疾病的判断价值又如何？u哪些因素能影响试验的结果？11一、诊断试验评价的基本程序一、诊断试验评价的基本程序二、诊断试验的评价指标二、诊断试验的评价指标三、预测值三、预测值四、提高试验效率的方法四、提高试验效率的方法五、常见的偏倚五、常见的偏倚六、存在的问题六、存在的问题12一、诊断试验评价的基本程序13金标准：是当前医学界公认的、诊断某病的最可靠的诊断方法是当前医学界公认的、诊断某病的最可靠的诊断方法，应用该标准能较正确区分某种疾病的人和不具有该病的人。不同的疾病有不同的金标准不同的疾病有不同的金标准，常见的金标准有：u病理学检查病理学检查诊断肿瘤、外科手术发现结石诊断胆结石、特殊的影像学诊断等。u对于有些诊断困难的疾病，可以采用现今公认的方法如综合诊断方法或长期随访病例观察所得到的结果。评价一个试验方法，金标准的选择是非常重要的金标准的选择是非常重要的。1.1.确立金标准确立金标准14研究对象包括两组，一是被金标准确诊的病例组病例组，另一组是金标准证实无该病的人群，即对照组对照组。病例应包括该病的各种临床类型（轻、中、重）、病期（早、中、晚）、典型和不典型病例以及并发症和肿瘤转移等病人。病例的代表性影响评价结果的普遍性以及临床推广的意义。对照组人群应是确实无该病的人群对照组人群应是确实无该病的人群，应包括来自非研究疾病的其他病例，尤其是与该疾病易混淆而在临床上需要鉴别诊断的疾病。在年龄、性别等因素上与病例有可比性。可比性。2.选择研究对象选择研究对象15p p：灵敏度或特异度：灵敏度或特异度：容许误差，允许波动的范围：容许误差，允许波动的范围：为第一类错误的概率：为第一类错误的概率u u：u u分布界值分布界值221)p(pun 3.样本大小样本大小1617用被评价的诊断试验方法对研究对象进行同步检查，采用盲法采用盲法(double double blindblind)观察观察。目的：避免由于试验者主观意愿而影响试验结果。如没有采用盲法观察，试验者就有可能自觉或不自觉地对病人或非病人的试验结果作出不同的判断。u对同样一个可疑阳性结果，对病人则倾向于阳性，而对非病人则易判为阴性。4.同步评价同步评价18诊断性试验方法评价诊断性试验方法评价 5.根据试验检查的结果，评价其诊断价值根据试验检查的结果，评价其诊断价值19二、诊断试验的评价指标v试验方法的可靠性评价试验方法的可靠性评价v试验方法的真实性评价试验方法的真实性评价 v真实性评价结果的统计学推断真实性评价结果的统计学推断 v临床参考值的确定临床参考值的确定20 可靠性也称为重复性或精确性，指一项试验在相同条件重复试验获得相同结果的稳定程度。1.可靠性评价21 可靠性的影响因素可靠性的影响因素试验方法和仪器设备以及试验条件试验方法和仪器设备以及试验条件 u试验方法设计原理、仪器设备以及所用试剂的稳定性以及试验试验方法设计原理、仪器设备以及所用试剂的稳定性以及试验条件如温度等可使结果产生系统误差。条件如温度等可使结果产生系统误差。研究对象的生物学变异研究对象的生物学变异 u不同研究对象间由于性别、年龄等的差异，结果不一定相同；不同研究对象间由于性别、年龄等的差异，结果不一定相同；u同一个体在不同时间与条件下的测量结果也存在变异。同一个体在不同时间与条件下的测量结果也存在变异。观察者的测量变异观察者的测量变异u观察者间变异观察者间变异u观察者内变异观察者内变异22提高可靠性的方法提高可靠性的方法试验方法的标准化试验方法的标准化统一试验条件和观察方法,相同的判断标准,观察者的培训研究对象的同质性研究对象的同质性观察时间如饭前或饭后,是否空腹等以减少个体变异23可靠性的测量指标变异系数变异系数(计量数据计量数据)符合率或一致性符合率或一致性(计数数据计数数据)符合率指试验结果与金标准结符合率指试验结果与金标准结果一致性（真阳性果一致性（真阳性+真阴性）的人数占受试者总人数的百分真阴性）的人数占受试者总人数的百分率，可以用符合率和率，可以用符合率和Kappa值来表示值来表示/CV 标准差算术均数24符合率即粗一致率符合率即粗一致率调整符合率调整符合率25Kappa值表示两种试验结果的一致性程度值表示两种试验结果的一致性程度观察一致率观察一致率 kappa值的取值范围为值的取值范围为l+1，该分析考虑了机遇因素对一致性的影响：，该分析考虑了机遇因素对一致性的影响：kappa值值1，表明两医生的判断完全不一致；，表明两医生的判断完全不一致；kappa值值0，表示观察一致率完全由机遇，表示观察一致率完全由机遇所致；所致；kappa值值0，表示观察的一致程度大于因机遇一致的程度；，表示观察的一致程度大于因机遇一致的程度；kappa1，表，表明两医生的判断完全一致。明两医生的判断完全一致。机遇一致率机遇一致率Kappa值值26真实性是指测量值与实际值的符合程度。任何检查结果与金标真实性是指测量值与实际值的符合程度。任何检查结果与金标准相比，有四种情况：准相比，有四种情况：正确结果：正确结果：真正有病的人中试验结果阳性（真阳性真正有病的人中试验结果阳性（真阳性a a）无病的人中试验结果阴性（真阴性无病的人中试验结果阴性（真阴性d d）错误结果：错误结果：真正有病的人中试验结果阴性（假阴性真正有病的人中试验结果阴性（假阴性c c）无病的人中试验结果阳性（假阳性无病的人中试验结果阳性（假阳性b b）2.真实性评价真实性评价27 灵敏度和特异度灵敏度和特异度灵敏度灵敏度 Se特异度特异度 Sp28漏诊率和误诊率漏诊率和误诊率漏诊率漏诊率误诊率误诊率29 似然比似然比LR阳性似然比阳性似然比阴性似然比阴性似然比区间似然比区间似然比人数的百分比该区间非病人数占非病数的百分比该区间病人数占总病人LR30约登指数约登指数 YI31实例某科研机构对甲胎蛋白对肝癌的诊断价值进行了评价研究，对经肝穿刺确诊的234例肝癌病人和68例非肝癌对照进行了甲胎蛋白检测分析。其中，234例肝癌病人中，甲胎蛋白阳性205人，阴性29人；68例非肝癌病人中，甲胎蛋白阳性31人，阴性37人。请：1）整理出相应的数据分析用四格表。2）计算甲胎蛋白诊断肝癌的灵敏度、特异度和约登指数对该方法的真实性进行评价。32实例33真实性指标计算真实性指标计算实例%61.87%100234205）（灵敏度%39.12%61.8711灵敏度漏诊率%41.54%1006837）（特异度%59.45%41.5411特异度误诊率92.14559.08761.01特异度灵敏度假阳性率真阳性率阳性似然比23.05441.01239.01特异度灵敏度真阴性率假阴性率阴性似然比4202.015441.08761.01特异度灵敏度约登指数34可靠性指标计算实例%13.80%10030237205符合率%24.71%1006637236205683723420541）（调整符合率%13.80%10030237205观察一致率%47.653023026866302236234机遇一致率42.06547.016547.08013.01appa机遇一致率机遇一致率观察一致率K35不同诊断水平对灵敏度、特异度的影响不同诊断水平对灵敏度、特异度的影响v同一试验方法的不同诊断标准有不同的灵敏度和特异度。某种指标在病人同一试验方法的不同诊断标准有不同的灵敏度和特异度。某种指标在病人和非病人中的分布在大多数情况下并不是完全分离，例如血糖水平的分布和非病人中的分布在大多数情况下并不是完全分离，例如血糖水平的分布理想和实际情况下正常人和糖尿病病人的血糖分布理想和实际情况下正常人和糖尿病病人的血糖分布36v理想情况（理想情况（A A曲线）曲线）糖尿病病人和非病人血糖水平的分布如糖尿病病人和非病人血糖水平的分布如A A曲线所曲线所示。在示。在ab ab 之间的任一点作为诊断标准，则不会发生漏诊和误诊。之间的任一点作为诊断标准，则不会发生漏诊和误诊。v实际情况（实际情况（B B曲线）曲线）糖尿病病人和非病人之间的血糖水平在糖尿病病人和非病人之间的血糖水平在abab间间有重叠，在此范围内，既可能是糖尿病病人，也可能是非病人。有重叠，在此范围内，既可能是糖尿病病人，也可能是非病人。v如以如以a a虚线处血糖水平为标准，则灵敏度高，即漏诊少，但是特异虚线处血糖水平为标准，则灵敏度高，即漏诊少，但是特异度低，误诊多。但以度低，误诊多。但以b b虚线处的血糖水平为标准，则刚好相反，即虚线处的血糖水平为标准，则刚好相反，即特异度高，误诊少，而灵敏度低，漏诊多。特异度高，误诊少，而灵敏度低，漏诊多。37 因此，就同一诊断试验来说，灵敏度和特异度是矛盾的。要提高因此，就同一诊断试验来说，灵敏度和特异度是矛盾的。要提高试验的灵敏度，必然要损失部分的特异度，反之亦然。试验的灵敏度，必然要损失部分的特异度，反之亦然。38 ROC曲线受试者工作特征曲线（受试者工作特征曲线（receive operator characteristic curve）v是以灵敏度为纵坐标，假阳性率（是以灵敏度为纵坐标，假阳性率（1特异度）为横坐标作图所特异度）为横坐标作图所得的曲线得的曲线v该曲线反映灵敏度与特异度之间相互关系的一种方法该曲线反映灵敏度与特异度之间相互关系的一种方法v在对两种方法进行比较时，可用在对两种方法进行比较时，可用ROC曲线下面积的大小直观比曲线下面积的大小直观比较诊断方法好坏。较诊断方法好坏。ROC曲线下面积越大，说明该方法越好。曲线下面积越大，说明该方法越好。39 40u诊断试验研究为一个样本研究，所得灵敏度、特异度、Youden指数均为样本值，因此存在抽样误差。从样本值来推断总体值，须进行统计推断。u不同方法的比较应排除抽样误差，进行统计学检验。这些指标的统计学推断和统计学检验方法，见如下两表3.真实性评价结果的统计学推断真实性评价结果的统计学推断414243 应用血清铁蛋白（SF）和血清原卜啉（ZPP）试验法进行铁缺乏症的临床诊断。以骨髓涂片铁染色检查作为诊断缺铁的金标准，确诊为缺铁性贫血50例，非缺铁性贫血78例。结果如下表，试比较两试验的约登指数的优劣实例4445SF法法灵敏度灵敏度=(4750)100%=94%特异度特异度=(7578)100%=96%约登指数约登指数实例ZPP法法灵敏度灵敏度=(2850)100%=56%特异度特异度=(6878)100%=87%约登指数约登指数46 仅从约登指数看，仅从约登指数看，SF法要高于法要高于ZPP法。但这是两个样本值的差别，是法。但这是两个样本值的差别，是由于两方法的总体约登指数不同，还是由于抽样误差所引起？需进行由于两方法的总体约登指数不同，还是由于抽样误差所引起？需进行假设检验。假设检验。H0：SF法的总体约登指数与法的总体约登指数与ZPP法相同法相同=，并根据公式计算如下：，并根据公式计算如下：SF法的约登指数方差法的约登指数方差同理，同理，ZPP法的方差法的方差实例47 查z 临界值表，z0.05=1.96，zz，P，按水准拒绝H0，即SF法与ZPP法总体Youden指数不同，SF法较优。实例48 参考值（参考值（reference value）是指正常人体在解剖、生理、生化）是指正常人体在解剖、生理、生化上的正常水平以及人体对各种试验的正常反应值。这里的正上的正常水平以及人体对各种试验的正常反应值。这里的正常人是指没有得所检查疾病的人。确定参考值的方法有很多，常人是指没有得所检查疾病的人。确定参考值的方法有很多，主要有以下几种。主要有以下几种。4.临床参考值的确定临床参考值的确定49统计学方法统计学方法SUxx50统计学方法统计学方法若频数分布表呈明显偏态分布，则可用百分位数法确定参考值范围。若频数分布表呈明显偏态分布，则可用百分位数法确定参考值范围。双侧时，（双侧时，（1）100%参考值范围为：参考值范围为：P/2P1-/2 若取单侧，大于某限值为异常，则（若取单侧，大于某限值为异常，则（1）100%参考值范围为：参考值范围为：0P1-若取单侧，小于某限值为异常，则（若取单侧，小于某限值为异常，则（）100%参考值范围为：参考值范围为：P 式中式中P 为第为第百分位数百分位数51危险度决定法（临床界限）危险度决定法（临床界限）按疾病各种危险因素的危险度决定参考值范围。某项指标虽然在参考值范围内，但对于发生某种疾病的危险性仍有较大差别。如根据调查发现，尿酸在7mg/dl或以下不会发生痛风，超过这一数值发生痛风的危险性上升，如超过，则无一幸免。危险度决定法在足够样本量的前瞻性队列研究基础上，能够较确切地反映该地区人群某种指标的参考值范围。52预后界限预后界限u有些在统计学上或临床上都认为是正常值，但预有些在统计学上或临床上都认为是正常值，但预后发现也有危险性后发现也有危险性u如如5050岁男性收缩压岁男性收缩压150mmHg150mmHg是常见的，无临床症是常见的，无临床症状不能认为是病人。但出现冠心病发作的危险性状不能认为是病人。但出现冠心病发作的危险性比同龄低血压者约高比同龄低血压者约高2 2倍左右倍左右53u 根据研究的需要，人为地规定根据研究的需要，人为地规定“病例病例”和和“非病例非病例”或正常与异常的截断值。以灵敏度最大，特异度最高，或正常与异常的截断值。以灵敏度最大，特异度最高，约登指数最大为理想。但对于同一试验方法，灵敏度约登指数最大为理想。但对于同一试验方法，灵敏度和特异度相矛盾。和特异度相矛盾。u应综合考虑灵敏度、特异度的重要程度确定正常与异应综合考虑灵敏度、特异度的重要程度确定正常与异常的截断值，或以约登指数最大时为截断值。常的截断值，或以约登指数最大时为截断值。54 确定诊断标准原则确定诊断标准原则对于一些严重疾病，如果能及早诊断，治疗效果就好，否则后果对于一些严重疾病，如果能及早诊断，治疗效果就好，否则后果严重。在这种情况下，诊断标准应稍低，以提高试验的灵敏度，严重。在这种情况下，诊断标准应稍低，以提高试验的灵敏度，使病人能够尽可能地诊断出来，减少遗漏使病人能够尽可能地诊断出来，减少遗漏对于疗效不理想，确诊和治疗费用较贵或假阳性结果会导致患者对于疗效不理想，确诊和治疗费用较贵或假阳性结果会导致患者精神和肉体上的痛苦或危害，如肿瘤病人实施放疗或化疗、精神和肉体上的痛苦或危害，如肿瘤病人实施放疗或化疗、HBsAgHBsAg的筛查。此时可使诊断标准提高，以提高试验的特异度。的筛查。此时可使诊断标准提高，以提高试验的特异度。当漏诊和误诊的重要性相等时，诊断标准可定在约登指数最大处。当漏诊和误诊的重要性相等时，诊断标准可定在约登指数最大处。55三、预测值三、预测值v在已知试验结果（阳性或阴性）的条件下，有无疾病的概率称为在已知试验结果（阳性或阴性）的条件下，有无疾病的概率称为试验的预测值试验的预测值v阳性预测值阳性预测值是指试验阳性者患目标疾病的可能性是指试验阳性者患目标疾病的可能性v阴性预测值阴性预测值是指试验阴性者未患目标疾病的可能性是指试验阴性者未患目标疾病的可能性%100%100baa试验结果阳性人数真阳性阳性预测值%100%100dcc试验结果阴性人数真阴性阴性预测值56 影响因素影响因素灵敏度和特异度灵敏度和特异度灵敏度越高，阴性预测值越大；特异度越高，阳性预测值越大患病率患病率患病率越低，试验阳性预测值越低，阴性预测值越高；患病率越高，阳性预测值越高，阴性预测值越低阳性预测值阳性预测值 =灵敏度灵敏度患病率患病率/灵敏度灵敏度患病率患病率+(1-+(1-患病率患病率)(1-)(1-特异度特异度)阴性预测值阴性预测值 =特异度特异度(1(1患病率患病率)/)/特异度特异度(1(1患病率患病率)+(1-)+(1-灵敏度灵敏度)患病率患病率 57 下表显示，在患病率为下表显示，在患病率为2%时，当特异度为时，当特异度为95%时，灵敏度由时，灵敏度由50%升至升至99%，阳性预测值由，阳性预测值由17%升高到升高到28.8%；当灵敏度为；当灵敏度为95%时，特时，特异度由异度由50%升至升至99%，阳性预测值由，阳性预测值由3.7%升高到升高到66%。即在患病率即在患病率固定不变的条件下，特异度的改变对阳性预测值的影响比灵敏度改变固定不变的条件下，特异度的改变对阳性预测值的影响比灵敏度改变更大。更大。实例58患病率对预测值的影响更大。受试人群的患病率越低，试验阳性预测值患病率对预测值的影响更大。受试人群的患病率越低，试验阳性预测值越低，阴性预测值越高；反之，患病率越高，阳性预测值越高，阴性预测值越低，阴性预测值越高；反之，患病率越高，阳性预测值越高，阴性预测值越低。例如有一试验方法，特异度为越低。例如有一试验方法，特异度为95%，灵敏度，灵敏度99%，分别对患病率，分别对患病率1%、2%和和10%的人群进行检查，人群的阳性预测值分别为的人群进行检查，人群的阳性预测值分别为17、29和（见下和（见下表）。表）。实例59酸性磷酸酶试验诊断前列腺癌的灵敏度为酸性磷酸酶试验诊断前列腺癌的灵敏度为7070，特异度为，特异度为9090，若用于不同患病率人群进行检查，阳性预测值差别很大。若用于不同患病率人群进行检查，阳性预测值差别很大。实例60四、提高试验效率的方法v选择合适的方法和指标选择合适的方法和指标v选择患病率高的人群（高危人群）选择患病率高的人群（高危人群）v采用联合试验采用联合试验61选择合适的方法和指标尽量选择客观的指标，对指标的测量方法和条件应进尽量选择客观的指标，对指标的测量方法和条件应进行采用标准化，对计量数据应选择恰当的截值点。如行采用标准化，对计量数据应选择恰当的截值点。如有多个指标可供选择时，应根据灵敏度、特异度大小有多个指标可供选择时，应根据灵敏度、特异度大小来决定。来决定。62选择患病率较高的人群进行检查（高危人群筛检选择患病率较高的人群进行检查（高危人群筛检策略）策略）设立专科门诊设立专科门诊专科门诊的设立，使患有同类疾病的病人集中就诊于相应的科室，患病率就相对提高了。选择高危人群选择高危人群如有冠心病家族史，年龄大于45岁，肥胖者去检查冠心病，则这些人群患病率必然比一般人群高。选择有特殊临床表现的人群选择有特殊临床表现的人群特殊的临床症状、体症、病史特点的选择，必然会影响试验人群的患病率。63联合试验联合试验一种方法的灵敏度或特异度不能满足要求时，一种方法的灵敏度或特异度不能满足要求时，可以采用联合试验。联合试验方式用两种方式：可以采用联合试验。联合试验方式用两种方式：串联试验和并联试验。串联试验和并联试验。64u 若若两诊断试验完全独立，串联诊断试验的灵敏度、特异度计算方法如下：两诊断试验完全独立，串联诊断试验的灵敏度、特异度计算方法如下：串联串联试验的灵敏度试验的灵敏度=A试验的灵敏度试验的灵敏度B试验的灵敏度试验的灵敏度串联串联试验的特异度试验的特异度=A试验的特异度试验的特异度+B试验的特异度试验的特异度(1-A试验的特异度试验的特异度)u 并联并联试验的灵敏度、特异度计算方法如下：试验的灵敏度、特异度计算方法如下：并联并联试验的灵敏度试验的灵敏度=A试验的灵敏度试验的灵敏度+B试验的灵敏度试验的灵敏度(1-A试验的灵敏度试验的灵敏度)并并联联试验的特异度试验的特异度=A试验的特异度试验的特异度B试验的特异度试验的特异度串联串联用两种以上试验，只有全部结果阳性才定为阳性。可提用两种以上试验，只有全部结果阳性才定为阳性。可提高特异度高特异度并联并联同时进行多项试验，只要一项阳性就可定为阳性。可提同时进行多项试验，只要一项阳性就可定为阳性。可提高灵敏度高灵敏度65尿糖和血糖试验尿糖和血糖试验用不同的联合方式对灵敏度和特异度的影响用不同的联合方式对灵敏度和特异度的影响实例66五、常见的偏倚五、常见的偏倚u领先时间偏倚领先时间偏倚u病程长短偏倚病程长短偏倚u志愿者偏倚志愿者偏倚67 领先时间偏倚领先时间偏倚 (lead time bias)自诊断至死亡的时间中位数：自诊断至死亡的时间中位数：5 5年年(领先时间领先时间)68 病程长短偏倚病程长短偏倚 (length bias)恶性程度高 6月无症状期 1年有症状期开始发病出现症状死亡死亡临床诊断筛检间隔期1年开始发病出现临床死亡死亡 2年无症状期症状诊断 4年有症状期恶性程度低69 志愿者偏倚志愿者偏倚（volunteer bias）7071目前临床上诊断试验存在的问题很多目前临床上诊断试验存在的问题很多：没有采用盲法没有采用盲法没有正确选择对照没有正确选择对照没有采用公认可靠的金标准没有采用公认可靠的金标准有些研究有些研究的的样本量不足题样本量不足题六、存在的问题六、存在的问题Thanks！72

展开阅读全文

医学科研设计 5筛检与诊断试验

最新文档