MBA统计学课件

上传人:沈*** 文档编号:112647378 上传时间:2022-06-23 格式:PPTX 页数:30 大小:430.59KB
返回 下载 相关 举报
MBA统计学课件_第1页
第1页 / 共30页
MBA统计学课件_第2页
第2页 / 共30页
MBA统计学课件_第3页
第3页 / 共30页
点击查看更多>>
资源描述
统计学从数据到结论第十七章 生存分析生存分析 什么是生存分析的内容?什么是生存分析的内容? l“我的期望年龄是多少岁?我的期望年龄是多少岁?”l“到底这个新疗法能使得这类绝症到底这个新疗法能使得这类绝症患者多存活多久?患者多存活多久?”“”“还有什么别还有什么别的因素和存活长短有关?的因素和存活长短有关?”l保险公司也要考虑各种人群的寿命,保险公司也要考虑各种人群的寿命,以确保其人寿保险或医疗保险既具以确保其人寿保险或医疗保险既具有竞争力又有利可图。有竞争力又有利可图。l在工程上,人们也会考虑一个材料,在工程上,人们也会考虑一个材料,一个原件,甚至一个设备的寿命是一个原件,甚至一个设备的寿命是多少。多少。什么是生存分析的内容?什么是生存分析的内容? l对于某一特定个体对于某一特定个体“能够活多久能够活多久”这一类的问题,任何负责任的人都这一类的问题,任何负责任的人都不会作出确定的回答。不会作出确定的回答。l但是对于具有某些性质的一类人群,但是对于具有某些性质的一类人群,则可以通过对数据的分析来得到活则可以通过对数据的分析来得到活过一定时间的概率。过一定时间的概率。l如果关心不同治疗手段的效果,则如果关心不同治疗手段的效果,则可以通过数据分析来比较这些方法,可以通过数据分析来比较这些方法,看它们是否有效,还能建立可以预看它们是否有效,还能建立可以预测的量化的模型。下面引进一个例测的量化的模型。下面引进一个例子。子。 例子例子 l例例 18.1(数据(数据 surv.txt)为了研究对农)为了研究对农药中毒的治疗,需要进行动物试验。研药中毒的治疗,需要进行动物试验。研究人员利用究人员利用40只老鼠进行某种农药中毒只老鼠进行某种农药中毒后的某种治疗方法试验。后的某种治疗方法试验。l其中有其中有20只鼠接受治疗处理;而作为对只鼠接受治疗处理;而作为对照的另外照的另外20只鼠没有接受治疗。只鼠没有接受治疗。l在此之后观察这些老鼠的生存时间在此之后观察这些老鼠的生存时间(天天数数)。对每一个鼠都记录了其存活时间。对每一个鼠都记录了其存活时间(t)、是否属于治疗组以及是否在某观测时间是否属于治疗组以及是否在某观测时间段数据出现删失。段数据出现删失。例子例子 l这里的所谓删失这里的所谓删失(censored)是由于某是由于某种原因,无法继续观测;这意味着老种原因,无法继续观测;这意味着老鼠至少活过了这个最后记录的时间,鼠至少活过了这个最后记录的时间,但最终活了多久就不得而知了。但最终活了多久就不得而知了。l这种删失在对于人类疾病的跟踪研究这种删失在对于人类疾病的跟踪研究中 经 常 出 现 ; 虽 然 不 如 未 删 失中 经 常 出 现 ; 虽 然 不 如 未 删 失(uncensored)的数据完整,但也包的数据完整,但也包含了其至少活了多久这样的信息。含了其至少活了多久这样的信息。l这里数据中的删失称为右删失。这里数据中的删失称为右删失。一些概念一些概念l在生存分析中,人们往往希望知道在生存分析中,人们往往希望知道存活过时间存活过时间t的概率,这就是所谓的的概率,这就是所谓的生存函数生存函数(survival function)S(t)。l显然它等于显然它等于1减去生存时间少于减去生存时间少于t的的概率,即概率,即S(t)=1-F(t)。l还有一个在还有一个在t时刻处时刻处(附近附近),对死亡,对死亡发生的可能性进行度量的函数,称发生的可能性进行度量的函数,称为危险函数为危险函数(hazard function),用,用h(t)表示,它实际上是表示,它实际上是-lnS(t)的关于的关于t的导数(见后面公式)。的导数(见后面公式)。17.1 17.1 对生命数据的简单描述:生命表对生命数据的简单描述:生命表 l生命表生命表(Life Table)是对生存分析是对生存分析数据的一种数量和图形的描述。数据的一种数量和图形的描述。l生命表计算出一些估计,并依此生命表计算出一些估计,并依此画出描绘性的图。画出描绘性的图。l下页的生存函数图是从下页的生存函数图是从简单生命简单生命表表得到的:得到的:Survival Function存活时间180160140120100806040200Cum Survival1.11.0.9.8.7.6.5.4.3.2.10.0组别 1.00 .00横坐标为生存的时间,而纵坐标是生横坐标为生存的时间,而纵坐标是生存函数的大小。显然,随着时间流逝,存函数的大小。显然,随着时间流逝,生存的概率应该递减;因此这种曲线生存的概率应该递减;因此这种曲线都是呈下降趋势。都是呈下降趋势。治疗组治疗组的生存概率的生存概率要比要比对照组对照组看上去要高。看上去要高。还可以得到生命表中的其他量的图,比如估计还可以得到生命表中的其他量的图,比如估计的概率密度函数和危险函数。由于它们并不比的概率密度函数和危险函数。由于它们并不比生存函数更直观,这里就不给出了。生存函数更直观,这里就不给出了。检验治疗组与对照组的生存函数是否不同:检验治疗组与对照组的生存函数是否不同:Wilcoxon (Gehan)检验。检验。l在上面得到的生存函数的估计下,在上面得到的生存函数的估计下,可以对治疗组和对照组进行比较。可以对治疗组和对照组进行比较。所用的检验为所用的检验为Wilcoxon (Gehan)检检验。验。l这里的零假设是:这两组的生存函这里的零假设是:这两组的生存函数相同。数相同。l可以很容易从计算机输出得到检验可以很容易从计算机输出得到检验的的p-值等于值等于0.0564。因此,如取显著。因此,如取显著性水平为性水平为0.05,就不能拒绝零假设。,就不能拒绝零假设。 17.2 对简单生命表的改进对简单生命表的改进:Kaplan-Meier方法方法 l前面的描述性生命表有些粗糙,对于删失数前面的描述性生命表有些粗糙,对于删失数据的处理也过于简单。据的处理也过于简单。lKaplan-Meier方法对其进行了改进。主要是方法对其进行了改进。主要是对累积生存函数(输出列为对累积生存函数(输出列为Cumulative Survival)的估计方法和前面的不同。)的估计方法和前面的不同。l下面的表格为根据例下面的表格为根据例18.1数据按照数据按照Kaplan-Meier方法所产生的生命表。方法所产生的生命表。l这 里 一 共 两 个 表 : 第 一 个 是 对 照 组 的这 里 一 共 两 个 表 : 第 一 个 是 对 照 组 的(treat=0),第二个是治疗组的(),第二个是治疗组的(treat=1)。)。这里这里Status=1意味着没有删失,而意味着没有删失,而Status=0意味着有删失。意味着有删失。Survival Functions存活时间180160140120100806040200Cum Survival1.11.0.9.8.7.6.5.4.3.2.10.0组别 1.00 1.00-censored .00 .00-censored这是按照这是按照Kaplan-Meier方法所估计的生存方法所估计的生存函数的图。这个图和前面的不仅数值上不函数的图。这个图和前面的不仅数值上不同,而且还标出了删失值的位置。同,而且还标出了删失值的位置。治疗组与对照组的生存函数是否不同:三种检验治疗组与对照组的生存函数是否不同:三种检验 l在存在任意右删失在存在任意右删失(例例18.1数据的删失就是右数据的删失就是右删失删失)的情况下,利用的情况下,利用SPSS软件可以得到三软件可以得到三种对治疗组和对照组进行比较的检验;检验种对治疗组和对照组进行比较的检验;检验的的零假设均为:这两组的生存函数相同零假设均为:这两组的生存函数相同。这。这三种检验是对数秩(三种检验是对数秩(logrank)检验)检验(Mantel-Cox检验检验)、Breslow检验(对前面检验(对前面Wilcoxon检验的改进),以及检验的改进),以及Tarone-Ware检验。通检验。通过软件计算可以得到这三种检验的结果:过软件计算可以得到这三种检验的结果:17.3 17.3 回归:回归:COX COX 比例危险模型比例危险模型 l回归的方法对于统计推断是十分重回归的方法对于统计推断是十分重要的。那么,如何在生存数据的分要的。那么,如何在生存数据的分析上建立回归模型呢?析上建立回归模型呢?l人们一般希望生存函数能表示为某人们一般希望生存函数能表示为某些相关的自变量的一个函数。在例些相关的自变量的一个函数。在例18.1中的自变量就是判别治疗组和对中的自变量就是判别治疗组和对照组的哑元;照组的哑元;l自变量还可能是连续变量,比如年自变量还可能是连续变量,比如年龄,药物剂量等等。龄,药物剂量等等。17.3 17.3 回归:回归:COX COX 比例危险模型比例危险模型 l用用x表示自变量(变量可能是向量,即有表示自变量(变量可能是向量,即有多个自变量);多个自变量);l用用S(t|x)表示在时间表示在时间t的生存函数,这里的的生存函数,这里的x表示有关的自变量;表示有关的自变量;l用用S0(t)表示待估计的基本生存函数表示待估计的基本生存函数(baseline survival function);它和自);它和自变量变量x无关;无关;lCox 比例危险模型为比例危险模型为exp( )00( | )( )lnln ( | )ln( )xS t xS tS t xxHt或者例例18.118.1数据拟合数据拟合CoxCox回归模型的回归模型的SPSSSPSS输出:输出:可以得到各种点图(可以得到各种点图(1 1)0.0020.0040.0060.0080.00Survival Time0.00.20.40.60.81.0Cum SurvivalGroup.001.00Survival Function for patterns 1 - 2根据根据Cox模型所估计的模型所估计的治疗组治疗组(group=1)和和对照对照组组(group=0)的生存函数的生存函数图图 可以得到各种点图(可以得到各种点图(2 2)10.0020.0030.0040.0050.0060.0070.0080.00Survival Time012345Cum HazardGroup.001.00Hazard Function for patterns 1 - 2根据根据Cox模型所估计的模型所估计的治治疗组疗组(group=1)和和对照组对照组(group=0)的累积危险函数的累积危险函数 SPSS软件使用说明(描述性生命表软件使用说明(描述性生命表 ) l选择选择AnalyzeSurvivalLife Tables;l然后把变量然后把变量time选入选入Time;l再在再在Display Time Intervals选选0 though 200 by 1(或者诸如(或者诸如5等任意间隔);等任意间隔);l把变量把变量censored选入选入Status,再点击,再点击Define Event来定义未删失值用来定义未删失值用1代表;再把变量代表;再把变量treat选入选入Factor,再点击,再点击Define Range,在,在Minimum和和Maximum分别选分别选0和和1;l之后点击之后点击Options,在其中点击,在其中点击Life Table(默(默认值);在认值);在Plot选择需要的图,比如选择需要的图,比如Survival;l在在Compare Levels of First Factor处,可点处,可点Overall或根据需要。然后在点击或根据需要。然后在点击Continue之后,之后,点击点击OK来运行。来运行。SPSS软件使用说明软件使用说明(Kaplan-Meier方法方法 ) l选择选择AnalyzeSurvivalKaplan-Meier;l然后把变量然后把变量time选入选入Time;把变量;把变量censored选选入入Status,再点击,再点击Define Event来定义未删失值来定义未删失值为为1;再把变量;再把变量treat选入选入Factor;l之后点击之后点击Options,在其中点击,在其中点击Survival Table(s)(默认值)和其他需要的表格;在(默认值)和其他需要的表格;在Plot选择需要的图,比如选择需要的图,比如Survival;l回到主对话框后,点击回到主对话框后,点击Compare Factor Levels来选择需要的检验;也可点击来选择需要的检验;也可点击Save来存储一些来存储一些输出。然后在点击输出。然后在点击Continue之后,最后点击之后,最后点击OK来运行。来运行。SPSS软件使用说明软件使用说明(Cox 比例危险模型比例危险模型 ) l选择选择AnalyzeSurvivalCox Regression;l然后把变量然后把变量time选入选入Time;把变量;把变量censored选入选入Status,再点击,再点击Define Event来定义未删失值为来定义未删失值为1;再;再把变量把变量treat选入选入Covariates;之后点击;之后点击Categorical,把把treat选入;选入;l在主对话框点击在主对话框点击Options,在其中选择需要的表格输出,在其中选择需要的表格输出内容;内容;l在主对话框点击在主对话框点击Plots,选择需要的图形,其中可以把,选择需要的图形,其中可以把Covariate Values Plotted at中的中的treat选入选入Separate Lines for以把定性协变量的不同水平的曲线放到一张以把定性协变量的不同水平的曲线放到一张图中图中1。然后在点击。然后在点击Continue之后,回到主对话框,之后,回到主对话框,最后点击最后点击OK来运行。来运行。l1 注意在注意在SPSS12.0之前的之前的SPSS版本,这个操作有问版本,这个操作有问题(不能实现)。题(不能实现)。附录:对生命数据的简单描述:生命表附录:对生命数据的简单描述:生命表 l简单生命表对每个分析者确简单生命表对每个分析者确定的宽度为定的宽度为hi的时间段的时间段i: (ti, ti+1),给出了如下信息,给出了如下信息(以(以SPSS输出为例):输出为例):简单生命表简单生命表 l在这个输出中的多数概念都是很容在这个输出中的多数概念都是很容易理解的,最多参见最后一列的简易理解的,最多参见最后一列的简单定义。单定义。l这种表格仅仅是数据通过初等运算这种表格仅仅是数据通过初等运算的一些汇总。具体的生命表就不在的一些汇总。具体的生命表就不在这里展示了。后面一节还将介绍并这里展示了。后面一节还将介绍并展示改进的生命表。根据这里的生展示改进的生命表。根据这里的生命表可以绘出描述性的图。命表可以绘出描述性的图。l图图18.118.1是根据例是根据例18.118.1数据绘出的对数据绘出的对治疗组(组治疗组(组1 1)和对照组(组)和对照组(组0 0)所)所估计的生存函数图。估计的生存函数图。返回到生存函返回到生存函数图数图本章的内容和公式本章的内容和公式( (基本)基本) 本章的内容和公式本章的内容和公式(Kaplan-Meier) 本章的内容和公式本章的内容和公式(Cox模型模型)
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!