生存分析概述及实例分析课件

上传人:沈*** 文档编号:243882686 上传时间:2024-10-01 格式:PPT 页数:37 大小:1.54MB
返回 下载 相关 举报
生存分析概述及实例分析课件_第1页
第1页 / 共37页
生存分析概述及实例分析课件_第2页
第2页 / 共37页
生存分析概述及实例分析课件_第3页
第3页 / 共37页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,生存分析概述及实例分析,生存分析概述及实例分析,目录,1,概述,2,常用术语,3,分析方法,4,案例分析,目录1概述2常用术语3分析方法4案例分析,概述,概述,生存分析概述及实例分析课件,生存分析概述及实例分析课件,研究内容,生存分析研究的内容主要有以下两个方面:,一 对生存过程的描述,二 分析生存过程的影响因素并对生存的结局加以预测,研究内容生存分析研究的内容主要有以下两个方面:,应用领域,生存分析虽然源自医学领域,但其在生物学,保险学,可靠性工程学,经济学,教育学,社会学等领域都有广泛的应用。比如:,医疗科学中病人的去世,保险行业中的赔偿,可靠性工程中产品的失效,金融领域中银行账户从开立到取消的时间的研究,教育行业中学生的中途退学,客户关系管理中的客户流失,应用领域生存分析虽然源自医学领域,但其在生物学,保险学,可靠,常用术语,常用术语,生存数据,生存分析中所分析的数据通常称为分析数据,一般度量的是某个事件发生所经历的时间长度。生存数据可以分为完全数据和删失数据。,完全数据:指提供了完整信息的数据。例如,在研究产品的失效时间时,某个样品从进入研究直到失效都在我们的观察中,可以得到该样品的具体失效时间,这就是一个完全数据。,删失数据:是指在观测期内,我们并没有看见个体的状态发生改变,无法确定个体具体的生存时间。又分为左删失数据,右删失数据,区间删失数据。,生存数据生存分析中所分析的数据通常称为分析数据,一般度量的是,A,B,C,D,E,删失数据示意图,起始 观测时间区间 终止,死亡,死亡,死亡,未知,退出,完全数据:,A,观测期内死亡,右删失数据:,B,,观测未终止时因故退出,C,,观测终止时尚未死亡,左删失数据:,D,,死亡时间在某一时刻之前,具体时间未知,区间删失数据:,E,,死亡时间位于某一区间,具体时间未知,A删失数据示意图起始 观测时间区间,生存函数,生存函数,(,survival function,),,又称为累积生存率,我们用符号,T,表示个体的生存时间(从开始记录到事件发生的时间),用,t,表示观测时间,将生存函数记作,S,(,t,),,是指个体生存时间大于,t,的概率。,S,(,t,),=P,(,T,t,),,显然,S,(,t,)是非升函数,且,S,(,0,),=1,S(,),=0,,,生存函数生存函数(survival function),又,风险函数,风险函数,(,hazard function,),,又称为瞬时死亡率,记作,h,(,t,),。是指在,t,时刻存活的个体,在,t+t,时刻死亡的概率。,显然,,h,(,t,)非负,且无上限。,风险函数风险函数(hazard function),又称为,分析方法,分析方法,按照是否使用参数,可以将生存分析中的分析方法分为三类:,参数方法:若已经证明某事件的发展可以用某个参数模型很好地拟合,就可以用参数方法做该事件的生存分析。常用的参数模型有指数分布模型、对数分布模型、正态分布模型,威泊分布模型等。,非参数方法:当被研究事件不能被参数模型很好地拟合时,可以采用非参数方法研究它的生存特征。常用的非参数方法包括生命表分析和,K-M,分析。,半参数方法:它比参数模型灵活,与非参数方法相比更容易对分析结果进行解释。生存分析中使用的半参数模型是,Cox,比例风险模型。,按照是否使用参数,可以将生存分析中的分析方法分为三类:,非参数方法,生命表分析,K-M,分析,非参数方法生命表分析,生命表分析,生命表分析将观测时间分成时间段,按时间段逐个统计事件发生的情况,以此估计生存函数。假设共有,k,个时间段,t,0,t,1,),t,1,t,2,),t,k-1,t,k,),每个区间中事件发生的次数分别为,d,1,,,d,2,d,k,每个区间中的个体总数分别为,n,1,n,2,n,k,所以在第,i,个区间个体存活的概率为(,n,i,-d,i,),/n,i,,而个体可以从第一个区间存活到第,i,个区间的概率,(,累积生存率)为:,i=1,2,,,k,,且,S,(,t,)为递减函数。,生命表分析生命表分析将观测时间分成时间段,按时间段逐个统计事,K-M,分析,Kaplan-Meier,分析,也称为乘积极限分析,是,Kaplan,和,Meier,在,1958,年提出的一种估计生存函数的非参数方法。与生命表分析不同,,K-M,分析以事件发生的时间点将观测区间分段,用来估计生存函数。下举例说明其具体的分析过程。,K-M分析Kaplan-Meier分析,也称为乘积极限分析,,下表记录了5个实验对象的存活时间,其中F代表失效,S代表存活,2和4为右删失数据。,用S(t)表示实验对象的累积存活概率,分时间段计算如右:,t,0,31):,此区间,5,个实验对象均存活,故,S,(,t,),=5/5=1.,31,65):,个体,1,在,31,小时死亡,故本区间,S,(,t,),=14/5=0.8,65,150):,个体,2,在,65,小时退出实验,本区间无个体死亡,,S,(,t,),=0.84/4=0.8.,150,220):,个体,3,在,150,小时死亡,,S,(,t,),=0.82/3=0.53.,220,300):,个体,4,在,220,小时退出实验,本区间无个体死亡,,S,(,t,),=0.532/2=0.53.,t=300,时,个体,5,死亡,,S,(,300,),=0,下表记录了5个实验对象的存活时间,其中F代表失效,,以SPSS对上例进行K-M分析,结果如下:,1.输入数据,2.进行K-M分析,以SPSS对上例进行K-M分析,结果如下:2.进行,参数设置,参数设置,输出结果,K-M,分析生存函数图,输出结果K-M分析生存函数图,生命表分析与,K-M,分析的比较,生命表分析适用于大样本的情况,特别是没有个体数据的情形,主要优点是对生存时间的分布没有要求。,K-M,分析中时间区间的划分是以事件的发生为依据的,因此必须知道每个个体的生存时间数据,适用于小样本的情况。,生命表分析与K-M分析的比较生命表分析适用于大样本的情况,特,半参数方法,生存分析中我们常常遇到个体的生存状况受到多种因素影响的情况。这些对生存时间有影响的变量称为协变量。在分析生存数据时要将协变量的影响考虑进去。,Cox,半参数模型就很好地解决了这个问题。它假定风险函数由两部分构成:基准风险函数和协变量线性组合的指数。,Cox,半参数模型又分为独立协变量比例风险模型和时间相依性协变量比例风险模型两种。二者的区别在于协变量的取值是否和时间有关。,半参数方法生存分析中我们常常遇到个体的生存状况受到多种因素影,Cox,独立协变量比例风险模型,该模型可写成如下形式:,式中,,Z,1,,,Z,2,,,Z,m,为协变量,这里的协变量与时间无关,,1,,,2,,,m,为对应协变量的未知参数。,h,0,(,t,)是基准风险函数。,实际应用中常比较两个不同个体风险函数的比率,即危险率。可以证明危险率为常数,因此该模型又称为比例风险模型。,当协变量与时间有关时,危险率将不再是常数,此时称为时间相依性比例风险模型。,Cox独立协变量比例风险模型该模型可写成如下形式:,案例分析,案例分析,两组小白鼠用来检验癌症的治疗状况。一组使用传统治疗方法,另一组使用试验方法,试验人员记录了小白鼠的存活时间及状态:,Days,为存活时间或观测时间;,Status,表示生存状态,取值,1,表示死亡,,0,表示存活;,Group,表示治疗方法,取,0,表示传统疗法,取,1,表示试验疗法,共有,64,组数据。,两组小白鼠用来检验癌症的治疗状况。一组使用传统治疗方法,另,原始数据如下:,原始数据如下:,首先用生命表分析方法对数据进行处理:,1.输入数据,2.选择生命表分析,首先用生命表分析方法对数据进行处理:1.输入数据2.选择生命,3.设置参数,3.设置参数,4.输出结果,可以看出,大约在,200,天时两种治疗方法的生存函数相交,在,200,天以前传统治疗方法的存活率较高,而在,200,天以后试验方法的治疗效果明显优于传统治疗方法。,中位数生存时间是生存率为,50%,时,生存时间的平均水平。,从中位数生存时间来看,传统治疗方法的中位数为,241,天,试验方法的中位数为,266,天,明显高于传统治疗方法。可以判断试验方法的疗效相比传统治疗方法有所提高。,4.输出结果可以看出,大约在200天时两种治疗方法的生存函数,用,K-M,方法对数据进行处理,结果如下:,生存函数分布和生命表分析的结果相似。,K-M,方法可以记录删失数据,且由于分段较多整体呈现密集的锯齿,而生命表分析的分布则较为平缓。,在结果检验上,不同检验方法结果有所差异,其中,Log Rank,检验的,p,值小于,0.05,,表明两种治疗方法有显著性差异。,用K-M方法对数据进行处理,结果如下:生存函数分布和生命表分,除了治疗方法对小白鼠的生存状况有影响,其他因素如性别,年龄,体重等都可能对其生存时间造成影响。加入这些数据后,用,Cox,独立协变量比例风险模型重新分析。,1.输入数据,2.设置参数,除了治疗方法对小白鼠的生存状况有影响,其他因素如性别,年龄,,3.输出结果,分类变量是指不连续的变量,此例中治疗方法的值只取,0,和,1,,性别只取,F,和,M,。不同于体重、年龄这些连续变量,分类变量在计算风险比例时以参考类别作为参照。如在本案例中治疗方法这一因子以试验方法作为参照。计算结果为传统方法的风险率相对于参考的倍数。,3.输出结果 分类变量是指不连续的变量,此例中治疗方,生存分析概述及实例分析课件,上表为模型系数的综合检验结果。可以看到,p=0,,小于,0.05,,说明这些因素中有些变量对白鼠的生存时间有显著影响。,上表为模型系数的综合检验结果。可以看到p=0,小于0.05,,此表给出了各个变量的单个模型系数检验结果,可以看到体重变量的,p=0,,说明体重对风险函数有极显著影响。体重每增加,1,(盎司),风险大约为原来的,1/3,;治疗方法的,p=0.068,,影响几乎显著,传统方法的风险为试验方法的,1.75,倍;而性别和年龄对风险的影响微弱。,结论:综合几种不同的分析方法,我认为综合以上三种模型的分析结果,我认为在本实验中白鼠体重是影响其生存时间的重要因素,治疗方法的不同也有比较重要的影响,而年龄和性别几乎不对其生存时间产生影响。,此表给出了各个变量的单个模型系数检验结果,可以看到体重变量的,THANKS,谢谢观看,THANKS谢谢观看,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!