资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,统计学:生存分析,(survival analysis of follow-up medical data ),要求,1.,掌握生存分析的基本概念,2.,会用乘积极限法和寿命表法计算生存率,3.,了解对数秩检验,4.,了解,Cox,回归分析,统计学:生存分析(survival analysi,第一节 生存资料的特点,在临床实验和动物试验研究中,常对各个观察对象进行随访观察,记录各个时点上某事件的发生情况而获得资料,称为随访资料,(,follow-up data,),,以评价临床疗效。如:,*某病经治疗开始到痊愈,*某病经治疗开始到死亡,*患者从手术到复发,*患者从出院到死亡,这类现象的共性是:效应和时间。在比较不同疗法的疗效时,不仅要考虑是否有效,还要考虑从试验开始到产生疗效的时间。假定用甲、乙两药治疗某病,其治愈率均为,80%,,我们不能笼统地说两种药物的疗效一致,因为还有一个时间效应问题。如果甲药平均,3,天治愈,80%,,而乙药平均,7,天治愈,80%,,则可以认为两药的疗效有差别。生存分析,(,survival analysis,),是将事件的结果和出现这一结果所经历的时间两个因素结合在一起的一种统计分析方法,它能充分利用所得到的研究信息,更加准确地评价和比较随访资料。,第一节 生存资料的特点 在临床实验和动物试验,一、生存分析的基本概念,1.,随访资料的记录,某医师收集,1992,年,1,月,1,日到,2001,年,12,月,31,日,10,年间共,346,例大肠癌患者术后的资料,研究因素有:性别、年龄(岁)、从确诊到进行手术的时间,dtime,(月),资料如下:,表,20-1 346,例大肠癌患者手术后的生存时间记录,数据特点:应变量有,2,个,,生存时间,和,结局,;生存时间存在观察完全的数据和观察不完全的数据(称为删失值),如,2,号和,4,号和,5,号。,编号,性别,年龄,dtime,手术时间,终止随访时间,结局,生存时间,1,男,32,10,1994.01.23,1994.12.24,死亡,11,2,女,48,12,1998.02.14,1999.01.01,失访,10,+,3,女,26,6,1992.03.04,1995.04.12,死亡,37,4,男,55,3,1999.08.20,2001.09.21,死于其他,25,+,5,女,58,8,2001.03.10,2001.12.31,存活,9,+,一、生存分析的基本概念1.随访资料的记录表20-1,2.,起始事件与终点事件,终点事件(,outcome event,)又称死亡事件、失效事件,它是研究者所关心的特定结局,而起始事件是反映研究对象生存过程的起始特征事件。这两者是相对的,由研究目的决定。如:起始事件可以是患者接受某种特定治疗、铅作业工人开始职业性铅接触等,相应的终点事件为患者死于该病、工人发生重症铅中毒症状等。一项研究可以把开始治疗作为起始事件,痊愈为终点事件;另一项研究可以把痊愈作为起始事件,复发为终点事件。,2.起始事件与终点事件 终点事件(outcom,生存时间示意图,生存时间示意图,3.,生存时间,是指观察到的存活时间,有两种类型:,(,1,),完全数据,(,complete data,),指从起点至死亡所经理的时间,如表,20-1,中,11,月,,37,月。,(,2,),截尾数据,(,censored data,),指由于失访、改变防治方案、研究工作结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。从起点到截尾点所经历的时间,称为截尾数据,如表,20-1,中的,10,月、,25,月和,9,月天。,4.,死亡概率、生存概率,(,1,),死亡概率,q,(,mortality probability,),:,指死于某时段内的可能性大小。它是一个随时间上升的函数,q,(,t,),当时间趋于无穷大时,死亡概率等于,1,。年死亡概率公式为,死亡概率不同于,死亡率,,区别在于分母不同,死亡率的分母为年中平均人口数,而死亡概率的分母是年初人口数。,3.生存时间 是指观察到的存活时间,有两种类型:4.死亡概,(,2,),生存概率,p,(,survival probability,),p,=1-,q,5.,生存率、生存曲线,(,1,),生存率,(,survival rate,),记作,S,(,t,k,),指病人经历,tk,个时间单位后仍存活的概率。若无截尾数据,则,(,2,),生存率估计的概率乘法原理,假定病人在各个时段生存的事件独立,生存概率为,p,,生存率估计公式为:,S,(,t,k,),=,P,(,T,t,k,),=,p,1,p,2,p,k,注意:生存率与生存概率在意义上有差别,生存概率只指某个时段内的,p,,而生存率是指从,0,t,k,多个时段。,(2)生存概率 p(survival probability,(,3,),生存曲线,(,survival curve,),以,t,为横坐标轴,,S,(,t,)为纵坐标轴,将各时点的生存率连接在一起的曲线。,6.,半数生存期,(,median survival time,),指只有,50%,的个体存活的时间(寿命的中位数)。,(3)生存曲线(survival curve)以t 为横,二、算法步骤,(,1,)列出序号:,i=1,2,3,,生存时间排序:将,t,从小到大排列,重复数据只列一次。当遇到数值相同的完全数据与删失数据时,删失数据排在完全数据之后。,(,2,)列出,ti,时刻的死亡例数,di,其中删失数据对应的死亡例数为,0,。,(,3,)列出,ti,时刻期初期观察例数,ni,即该时刻之前的生存例数。,(,4,)计算各时段生存概率,pi,。,Pi=(ni-di)/ni,(,5,)求出,ti,时刻的生存率:,S(ti)=P,1,P,2,P,3,P,t,(,6,)求出,ti,时刻的生存率的标准误:,(,7,)总体生存率的置信区间:,二、算法步骤(1)列出序号:i=1,2,3,,生存时间排,三、生存率的估计,例,20-1,将符合手术治疗的,21,例乳腺癌患者随机分为,2,组,一组,10,;一,6,单纯接受手术治疗,另一组,11,例手术后,+,化疗,其生存时间(月)见下表,试估计两种疗法的生存率及生存曲线。,手术组,6,9,13,15,18,19,19,20,22,24,手术,+,化疗,10,14,15,16,+,19,19,20,20,+,24,26,28,三、生存率的估计 例20-1 将符合手术治疗的,例,20-1,的结果,序号,存活时间,死亡数,初期例数,生存概率,生存率,标准误,i,tti,di,nni,ppi,S(t,k,),SE,1,10,1,11,10/11,0.9091,0.0867,2,14,1,10,9/10,(10/11)(9/10)=0.8182,0.1163,3,15,1,9,8/9,0.81828/9=0.7273,0.1343,4,16+,0,8,8/8,0.7273 1=0.7273,0.1343,5,19,2,7,5/7,0.7273 5/7=0.5195,0.1569,6,20,1,5,4/5,0.5195 4/5=0.4156,0.1562,7,20+,0,4,4/4,0.4156 1=0.4156,0.1562,8,24,1,3,2/3,0.4156 2/3=0.2771,0.1537,9,26,1,2,1/2,0.2771 1/2=0.1385,0.1245,10,28,1,1,0/1,0.1385 0=0.1385,_,例20-1的结果序号存活时间死亡数初期例数生存概率生存率标准,四、生存资料分析的基本要求,1.,样本由随机抽样方法获得,并应有足够的数量,2.,死亡例数不能太少(,30,),3.,删失值比例不能太大,4.,生存时间尽可能精确到天数,因为多数生存分析方法都在生存时间排序的基础上作统计处理的,即使是小小的舍入误差,也可能改变生存时间顺序而影响结果,5.,缺项要尽量补齐,四、生存资料分析的基本要求1.样本由随机抽样方法获得,并应有,第四节,Cox,回归分析,1972,年英国生物统计学家,D.R.Cox,提出了半参数方法,称为,比例风险模型,(,proportional hazard model,),亦称为,Cox,回归模型。,Cox,回归模型是将生存时间和影响生存时间的因素之间建立回归方式,使两者之间的关系以数量来表达,,Cox,回归主要解决多因素(如年龄、职业、吸烟、病情、治疗等)对生存期的影响。由于生存数据不仅包含生存时间,t,,同时还有截尾数据,这就造成了用回归方法来研究生存时间的困难,因此,Cox,将协变量对生存期的影响表现为它对危险函数的关系上,以危险度,h,(,t,)作为因变量(时间变量),解决了截尾的困难,使具有生存资料的多因素分析成为可能。,Cox regression analysis,第四节 Cox回归分析 1972年,Cox,模型的基本形式,Cox模型的基本形式,例,20-3,某医药公司与中山医科大学协作,研究天花粉注射治疗绒癌的疗效问题。将,16,只体表接种绒癌成功的裸鼠分为,4,组,其中一组作空白对照,其余三组分别注射天花粉、甲药和乙药,实验记录和整理数据见表,试作,Cox,回归分析。,编号,NO,变量,观察记录,整理,带瘤天数,td,瘤体大小,V0,天花粉,tr1,甲药,tr2,乙药,tr3,维生素,C,vitC,开始日期,Date 0,终止日期,Date 1,结局(死),d,生存天数,day,1,19,25,0,0,0,1,89-05-20,89-05-28,1,8,2,17,16,0,0,0,1,89-05-20,89-05-29,1,9,3,19,37,0,0,0,1,89-05-20,89-05-28,1,8,4,16,19,0,0,0,1,89-05-20,89-05-28,1,8,5,14,25,1,0,0,1,89-05-20,89-05-07,0,18,6,13,18,1,0,0,1,89-05-20,89-05-06,1,17,7,16,25,1,0,0,1,89-05-20,89-05-03,1,14,8,9,10,1,0,0,1,89-05-20,89-05-04,1,15,9,9,22,0,1,0,1,89-05-20,89-05-04,1,15,10,10,25,0,1,0,1,89-05-20,89-05-31,1,11,11,14,25,0,1,0,1,89-05-20,89-05-02,1,13,12,12,37,0,1,0,1,89-05-20,89-05-01,1,12,13,17,37,0,0,1,1,89-05-20,89
展开阅读全文