临床科研中常用的统计分析方法课件

上传人:txadgkn****dgknqu... 文档编号:242496428 上传时间:2024-08-25 格式:PPT 页数:159 大小:2.39MB
返回 下载 相关 举报
临床科研中常用的统计分析方法课件_第1页
第1页 / 共159页
临床科研中常用的统计分析方法课件_第2页
第2页 / 共159页
临床科研中常用的统计分析方法课件_第3页
第3页 / 共159页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,临床科研中常用的统计分析方法,临床科研中常用的统计分析方法 临床科研中常用的统计分析方法 主要内容如何正确抉择统计方法,常用的统计方法,中医领域的应用,临床科研中常用的统计分析方法 临床科研中常用的统计分析方法,1,主要内容,如何正确抉择统计方法,常用的统计方法,中医领域的应用,主要内容如何正确抉择统计方法,2,一、如何正确抉择统计方法,1,分析集,2,研究目的,3,资料类型,4,设计类型,5,方法的应用,/,适用条件,一、如何正确抉择统计方法1 分析集,3,1,分析集(,ANALYSIS SET,),分析集应在,研究设计阶段,确定,建立规则。,意向性分析集(,intention to treat, ITT),全分析集(,Full analysis set,,,FAS,),符合方案集(,per protocol set,,,PPS,),安全集(,safety set,,,SS,),1 分析集(ANALYSIS SET)分析集应在研究设计阶段,4,使用适宜、正确的统计分析方法是统计结论真实可靠的重要保证。,统计分析包括:,统计描述:选择什么样的指标,选用统计表还是图取决于资料的性质及研究目的等,统计推断:方法的正确抉择与研究目的、资料类型、设计类型、样本大小、资料分布类型、数据结构、特定条件综合分析等有关。,使用适宜、正确的统计分析方法是统计结论真实可靠的重要保证。,5,2,研究目的,研究目的通常有:,估计,参数的点估计和区间估计,比较,t,、,u,、,ANOVA,筛选主要影响因素,回归,相关分析,各种相关,建立临床医学参考值范围,校正与控制混杂因素,协方差分析、,CMH,因果关系分析,通径分析,预测、预报分析,回归。 等等,2 研究目的研究目的通常有:,6,3,资料类型,资料类型包括三个方面,数据性质,定量资料,定性资料,资料分布类型,正态分布,偏态分布,分布类型不清,结局变量的类型,数值变量,分类变量,二分类,无序多分类,有序分类,3 资料类型资料类型包括三个方面,7,4,设计类型,统计设计的类型取决于研究目的,实际上是为了更好地达到研究目的而采取的设计方案,从统计学上来讲,临床上常用的有:,完全随机设计,配对设计,随机区组设计,交叉设计,序贯设计,重复测量设计,4 设计类型统计设计的类型取决于研究目的,实际上是为了更好地,8,5,统计方法的应用,/,使用条件,对样本量的要求,对应变量、自变量分布类型的要求,对数据缺失程度的要求,5 统计方法的应用/使用条件对样本量的要求,9,二、常用的统计分析方法,差异性检验,疗效性检验,优效性,等效性,非劣效性,二、常用的统计分析方法差异性检验,10,2.1,差异性检验,(,1),临床试验中的,3,种数据来源,处理,反应,影响因素,2.1 差异性检验(1)临床试验中的3种数据来源,11,基线测定数据的可比性:,20,个指标中有,4,个有统计学意义,则随机有问题(,P=0.0159,),2.1,差异性检验,(,2),基线测定数据的可比性:2.1 差异性检验(2),12,定性数据,统计描述,统计描述,频数和百分比,统计推论,两个率的比较,卡方检验、,Fisher,;,logistic,回归,等级定性反应变量,卡方、,Ridit,、秩和检验、,CMH,2.1,差异性检验,(,3),定性数据2.1 差异性检验(3),13,定量数据,统计描述,例数、均数、标准差、中位数、四分位数间距、最大值、最小值,统计推论,t,检验,ANOVA,GLM,(协方差),生存时间,N,年生存率、中位生存期、无病进展时间等,Life table,K-M test,COX,2.1,差异性检验,(,4),定量数据2.1 差异性检验(4),14,申杰主编,.,中医统计学,.,北京:科学出版社,2009:P33.,申杰主编. 中医统计学. 北京:科学出版社,2009:P33,15,2.2,临床试验的优效性、等效性、非劣效性检验方法,差异性检验:通常所用的统计分析方法都是进行的差异性检验,临床试验的三种检验,确切的说是为三种设计而进行的分析方法,金丕焕,.,临床试验,.,复旦大学出版社,.p86,2.2 临床试验的优效性、等效性、非劣效性检验方法差异性检验,16,统计分析方法同差异性检验方法,但是单侧检验。,须在研究设计阶段确定。,统计分析方法同差异性检验方法,但是单侧检验。,17,临床科研中常用的统计分析方法课件,18,临床科研中常用的统计分析方法课件,19,临床科研中常用的统计分析方法课件,20,临床科研中常用的统计分析方法课件,21,可信区间估计,可信区间估计,22,3.,中医领域的应用,3. 中医领域的应用,23,临床科研中常用的统计分析方法课件,24,方差分析,一类方法,完全随机设计,随机区组设计,交叉设计,拉丁方设计,析因设计,正交设计,均匀设计,嵌套设计,重复测量设计,裂区设计,协方差分析,多元方差分析,重复测量的方差分析,方差分析一类方法完全随机设计,25,协方差分析的概念,协方差分析模型,协方差分析举例,协方差分析,协方差分析的概念协方差分析,26,试验设计的三项基本原则,目的就是为了排除非处理因素的干扰和影响,使试验误差的估计降到最低限度,从而可以准确地获得处理因素的试验效应。,但在某些实际问题中,有些因素在目前还不能控制或难以控制,如在动物饲养试验中,动物增加的平均体重不仅仅与动物的进食量有关,甚至与各动物的初始重量等因素有关系。如果直接进行方差分析,会因为混杂因素的影响而无法得出正确结论。,一、协方差分析的概念,试验设计的三项基本原则,目的就是为了排除非处理因素的,27,协方差分析(,Analysis of Covariance),是将回归分析与方差分析结合起来使用的一种分析方法。它先将定量的影响因素看作自变量,或称为协变量,,,建立因变量随自变量变化的回归方程,这样就可以利用回归方程把因变量的变化中受定量因素的影响扣除掉,从而能够较合理地比较因变量的总体均数之间是否有显著性的差别,增加了分析的准确性。,协方差分析的功用,就是用处理前的基数矫正处理后的结果,提高其精确度。,定义,协方差分析(Analysis of Covarian,28,考察某因素对因变量,Y,的影响,布置了一单项分类资料的试验,其方差分析模型为:,y,ij,=,i,+,ij,i,该因素第,i,个水平的效应,,ij,为随机误差,同时收集到与,y,有密切回归关系的变量,x,,其方差分析模型变为:,y,ij,=,i,+,b,(x,ij,-,x)+,d,ij,b,为,y,对,x,的回归系数,,d,ij,为随机误差,二、协方差分析模型,平行性假定:,各组协变量和因变量的关系是线性的,各组残差正态,各组回归斜率相等,即各组回归线是平行的,考察某因素对因变量Y的影响,布置了一单项分类资料的试验,,29,1、比较三种猪饲料,A1,A3,A3,对猪催肥的效果,测得每头猪增加的重量(,y),与初始重量(,x),与数据如表。试测定三种饲料对猪的催肥有无显著的不同?初始重量与猪的增加重量之间有无明显的关系?,三、协方差举例,水平,观察值,A1,x 15 13 11 12 12 16 14 17,y 85 83 65 76 80 91 84 90,A2,x 17 16 18 18 21 22 19 18,y 97 90 100 95 103 106 99 94,A3,x 22 24 20 23 25 27 30 32,y 89 91 83 95 100 102 105 110,1、比较三种猪饲料 A1,A3,A3对猪催肥的效果,测得每头,30,1、平方和,2、回归关系的显著性检验,协方差举例,变异来源,自由度,平方和,均方,F,值,回归,误差,1,20,1010.76 227.615,1010.76 11.38,88.8*,1、平方和协方差举例变异来源 自由度平方和均方F值回归110,31,3、纠正后的处理间方差分析,4、用回归纠正每处理的平均增重,协方差举例,变异来源,自由度,平方和,均方,F,值,处理,误差,2,20,707.218 227.615,353.609 11.381,31.07*,总变异,22,934.833,y,i,=,i,+,b,(x,i,-,x),3、纠正后的处理间方差分析协方差举例变异来源 自由度平方和均,32,1、统计资料应服从正态分布,否则要做适当的统计代换。,2、做一般方差分析时处理间差异显著,而做协方差分析时,处理间差异反而不显著,说明所谓的差异是由于初始的试验条件造成的,并非处理间真正的差异。,3、做一般方差分析时处理间差异不显著,而做协方差分析时,处理间差异反而显著,说明除去试验条件的影响后处理间有真正的差异。,注意的问题,1、统计资料应服从正态分布,否则要做适当的统计代换。注意的问,33,重复测量设计的方差分析,重复测量设计的方差分析,34,重复测量设计,一、重复测量资料的数据特征,当对同一受试对象在不同时间重复测量次数,p3,时,称为重复测量设计或重复测量数据。,测 量 时 间 点,受试者,1 2 p,1 y,11,y,12, y,1p,2 y,21,y,22, y,2p,:,n y,n1,y,n2, y,n p,重复测量设计一、重复测量资料的数据特征测 量 时 间 点受试,35,图例,图例,36,重复测量资料,是同一受试对象的同一观察指标在不同时间点上进行多次测量所得的资料,,常用来分析该观察指标在不同时间点上的变化。有时是从同一个体的不同部位(或组织)上重复测量获得的指标的观测值。,目的:就是比较不同时间点动态变化趋势的特征,重复测量资料是同一受试对象的同一观察指标在不同时间点上进行多,37,问题?,想一想?同一观察单位具有多个观察值,而这些观察值来自同一受试对象的不同时点(部位等),这类数据间往往有,相关性存在,,违背了方差分析要求,数据满足独立性,基本条件。,问题?想一想?同一观察单位具有多个观察值,而这些观察值来自同,38,在这种情况下:,若,使用一般的方差分析,,就不能充分揭示出内在的特点,有时甚至会得出错误结论。,所以重复测量资料需要采用专门的统计分析方法,该方法是近代统计学研究的热点之一。,在这种情况下:若使用一般的方差分析,就不能充分揭示出内在的特,39,实际中:重复测量资料比独立资料更多见。,临床研究中,需要观察病人在不同时间的某些生理、生化或病理指标的变化趋势,研究不同时间或疗程的治疗效果。,流行病学研究中,观察队列人群在不同时间上的发病情况。研究不同职业、性别人群实施某种控制后,不同时间的多次效果考察。,卫生学研究中,纵向观察儿童生长发育规律等,不同地区和环境营养状况。,实际中:重复测量资料比独立资料更多见。临床研究中,需要观察,40,提醒大家,重复测量数据在医学研究中十分常见,在医学类杂志上约占四分之一,而且统计表达和分析误用情况严重。,提醒大家重复测量数据在医学研究中十分常见,在医学类杂志上约占,41,主要优点,减少样本含量,控制个体变异,非实验因素(干扰因素),主要优点减少样本含量,42,单变量重复测量方差分析,1.,单组重复测量,指同一组内(或接受同一种处理)的多个受试者,在多个时间点上的反应变量所作的测量,又称为单变量重复测量。,测 量 时 间 点,受试者,1 2 p,1 y,11,y,12, y,1p,2 y,21,y,22, y,2p,:,n y,n1,y,n2, y,n p, 单变量重复测量方差分析1. 单组重复测量测 量 时 间,43,2.,多组重复测量,(多组并不等于多因素),指将受试者按处理的不同水平分为几个组,对这些组内的每一受试者,都在不同时间点对他们的反应变量进行测量。,表,3.1,(余松林),2.多组重复测量(多组并不等于多因素)指将受试者按处理的不同,44,1.,单组重复测量数据方差分析,2.,两组重复测量数据方差分析,单变量重复测量方差分析,1. 单组重复测量数据方差分析 单变量重复测量方差分析,45,二、重复测量资料分析的前提条件和基本步骤,1.,前提条件:,首先要求样本是随机的,,除了满足一般方差分析,条件外,特别强调,满足,协方差阵,(,covariance,matrix,),球形性,。,sphericity,二、重复测量资料分析的前提条件和基本步骤1.前提条件:sph,46,概念:,协方差阵的球对称性是指该对角线元素(方差)相等、非主对角线元素(协方差)为零,方差指在某一时点上测定值变异的大小,而协方差是指在两个不同时点上测定值相互变异的大小。如果在某个时点上的取值不影响其它时点上的取值。则协方差为,0,,相反,则不为,0,。,由协方差构成的矩阵称为协方差阵。,0,0,概念:协方差阵的球对称性是指该对角线元素(方差)相等、非主对,47,若球对称性得不到满足,方差分析的,F,值是有偏的,会增大,类错误的概率,2.,用,Mauchly,法检验协方差阵的球形性质,如果,P,值大于,,说明协方差阵的球对称性质得到满足。否则,必须对与时间有关的,F,统计量的分子和分母,自由度,进行调整,减少,类错误的概率。调整系数为:,(读:,epsilon,),若球对称性得不到满足,方差分析的F值是有偏的,会增大类错误,48,3.,自由度常用调整方法,Greenhouse-Geisser,法,简称:,G-G,法,Huynh-Feldt,法,简称:,H-F,法,Lower-bound,法,简称:,L-B,下界法,以上前两种方法较复杂,采用软件计算。,3.自由度常用调整方法Greenhouse-Geisser,49,4.,举例:,单组重复测量数据的方差分析,观察,10,名慢性乙型肝炎患者治疗前、治疗,12,周、,24,周、,36,周四个时间点上谷丙转氨酶(,ALT,)水平的变化趋势,结果见下表,试进行统计推断。,4. 举例:单组重复测量数据的方差分析观察10名慢性乙型肝炎,50,分析,:,数据结构上与完全区组设计相似但实质不同,各观测点时间顺序是固定的,不能随机分配;不同观测点数据彼此不独立或不完全独立,存在一定的相关性。,分析: 数据结构上与完全区组设计相似但实质不同各观测点时间,51,SAS,结果中包括偏相关阵,SAS结果中包括偏相关阵,52,例题,1.,建立假设,确定检验水准,0.01,2.,进行球对称性检验,球对称性通常采用,Mauchlys test,检验标准来判断,例题 1.建立假设,确定检验水准0.012.进行球对,53,3.,调整时间点,F,值的自由度调整原则:,当资料满足“球对称”,(Sphericity),条件时(,P,) ,不作调整。,当资料不满足“球对称” 条件时(,P27,的肥胖患者,40,名随机等分成,两组,一组给予曲明片十模拟曲明胶囊,另一组给予曲明胶囊十模拟,77,表,9-13,表9-13,78,可以看出重复测量资料中同一受试对象(看成区组)的数据高度相关,无论哪位受试对象服用曲明片剂或是胶囊,其服药后,8,周、,16,周和,24,周的体重均和前面时间点(含服药前的,0,周)的体重相关。不同时点数据其相关性较强。,可以看出重复测量资料中同一受试对象(看成区组)的数据高度相关,79,重复测量资料方差分析的基本步骤,分为三步:,重复测量资料方差分析的基本步骤分为三步:,80,计算检验统计量:使用统计软件进行计算结果如下,:,计算检验统计量:使用统计软件进行计算结果如下 :,81,确定,P,值,做出推断结论:,根据专业知识和假设检验,直接由计算机所给,P,值做出推断结论。,按,=0.05,水准,减肥药剂型,k,(片剂和胶囊),剂型,k,与时间,i,的交互效应,ki,均不拒绝,H,0,,无统计学意义,还不能认为曲明不同剂型的减肥效果不同,也还不能认为剂型,k,与时间,i,间有交互效应。而时间因素,i,拒绝,H,0,,接受,H,1,,有统计学意义,可认为服用减肥药盐酸西市曲明前后不同时间(,8,周、,16,周和,24,周)的平均体重不全相同。,确定P值,做出推断结论: 根据专业知识和假设检验,直接由计,82,重复测量资料方差分析的前提条件,重复测量资料的方差分析,除了满足一般方差分析的条件外,还要满足协方差阵的球形性或复合对称性。若条件不能满足,,F,值有偏性,通常采用,Mauchly,检验来判断,通过软件选参数计算。,重复测量资料方差分析的前提条件重复测量资料的方差分析,除了满,83,校正后的结果:,校正后的结果:,84,两组重复测量数据结构,两组重复测量数据结构,85,SAS,程序,显示该资料不满足球对称性,参看校正结果。,SAS程序显示该资料不满足球对称性,参看校正结果。,86,结果表明经,G-G,和,H-F,调整后,按,0.05,检验水准,,A,(不同药物)和,A,与,TIME,(时间)无统计学意义,后者无交互作用,而时间因素间有统计学意义。,结果表明经G-G和H-F调整后,按0.05检验水准,A(,87,例,4,用丹参注射液治疗,7,例慢性肾功能衰竭患者,治疗前后不同时间各患者的血尿素氮(,BUN,)的变化,如表所示。试比较治疗前后不同时间各患者血尿素氮的变化是否不同?,表,4-5,丹参注射液治疗慢性肾衰患者,不同时间的,BUN,(,mg/dl,)变化,治 疗 后,不同,患者 治疗前 第,2,周 第,4,周 第,6,周,1 60.7 41.0 34.5 36.2,2 65.2 44.7 41.2 39.4,3 66.3 42.4 40.5 37.7,4 67.1 49.1 43.3 40.2,5 62.8 38.5 40.1 35.8,6 72.5 52.3 44.6 37.6,7 58.0 35.0 38.6 37.2,例4 用丹参注射液治疗7例慢性肾功能衰竭患者,治疗前后,88,题意分析:,本题要探讨治疗前后“不同时间”,又要研究“不同患者”的血尿素氮的变化,是属于按两因素分组的多个均数间比较的重复测量方差分析,首先在,Insight,中建立数据集,本题变量,FL,为不同治疗时间的分组变量,如治疗前为,1,,治疗后第,2,周为,2,,,,第,6,周为,4,。,X,为,BUN,的测定值。建好结构录入数据,格式如图,4-17,所示,数据集名为,L2,存入,SASUSER,库中,备用。,题意分析:本题要探讨治疗前后“不同时间”,又要研究“不同患者,89,如图所示:,如图所示:,90,生存分析,SURVIVAL ANALYSIS,91,生存分析SURVIVAL ANALYSIS 91,何为生存分析,92,何为生存分析92,传统方法在分析随访资料时的困难,时间和生存结局都成为了要关心的因素,除了生存结局作为判定标准以外,只要能让病人存活时间延长,这种药物也应当是被认为有效的。即时间延长也认为有效,如果将两者均作为应变量拟和多元模型,因为时间分布不明(一般不呈正态分布,在不同情况下的分布规律也不同),拟和多元模型极为困难,93,传统方法在分析随访资料时的困难时间和生存结局都成为了要关心的,传统方法在分析随访资料时的困难,存在大量失访的资料,失去联系(病人搬走,电话号码改变),无法观察到结局(死于其他原因),研究截止,显然,将失访数据无论是算作死亡还是存活似乎都不大合理,94,传统方法在分析随访资料时的困难存在大量失访的资料94,第一节 概述,95,第一节 概述95,一、基本概念,(一)生存时间(,survival time,):,1,定义:广义的生存时间是指从某个起始事件开始到某个终点事件的发生,(,出现反应,),所经历的时间。也称失效时间(,failure time,)。,2,特点:,(,1,)分布类型不易确定。一般不服从正态分布,,有时近似服从指数分布、,Weibull,分布、,Gompertz,分布等,多数情况下往往不服从任,何规则的分布类型。,96,一、基本概念 (一)生存时间(survival time):,(,2,)生存时间的影响因素多而复杂且不易控制。,(,3,)根据研究对象的结局,生存时间数据可分两种类型:,完全数据,(,complete data,),:观察对象在观察期内出现反应,(,终点事件,),,这时记录到的时间信息是完整的,这种生存时间数据称为完全数据。,截尾数据,(截尾值、删失数据,,censored data,),:尚未观察到研究对象出现反应,(,终点事件,),时,即由于某种原因停止了随访,这时记录到的时间信息是不完整的,这种生存时间数据称为不完全数据或截尾值。,常用符号“”表示。,97,(2)生存时间的影响因素多而复杂且不易控制。97,截尾值(,CENSORED VALUE,)出现的原因,截尾的原因主要有,3,种:,失访:,生存但中途失访:包括拒绝访问、失去联系等。,退出:,中途退出试验、改变治疗方案、死于其它与研究无关的原因:如肺癌患者死于心机梗塞、自杀或因车祸死亡,终止随访时间为死亡时间。,终止:,指观察期结束时仍未出现结局。,98,截尾值(CENSORED VALUE)出现的原因截尾的原因主,关于截尾或删失,随访开始,事件,失访,失访,研究截止时仍存活,研究截止时点,患者进入期间,删失的模式图,99,关于截尾或删失随访开始事件失访研究截止时点患者进入期间删失的,100,100,101,101,102,102,103,103,104,104,105,105,106,106,风险函数与生存函数的关系,107,风险函数与生存函数的关系107,108,108,109,109,110,110,第二节 生存率估计的非参数法,111,第二节 生存率估计的非参数法 111,112,112,113,113,114,114,图,16-2,两种疗法治疗后白血病患者的生存率曲线,1,0.90,0.79,3,0.68,6,7,0.56,11,0.42,13,0.21,115,图16-2 两种疗法治疗后白血病患者的生存率曲线 10.90,116,116,117,117,118,118,119,119,120,120,121,121,122,122,123,123,124,124,第三节 生存率的比较,生存率比较的假设检验方法有参数法、半参数法和非参数法,,因医学研究中的生存时间资料大多为不规则分布或者分布未知,常采用非参数法进行假设检验。,非参数法是将生存率曲线作为整体进行曲线与曲线之间的比较,其零假设为各总体生存率曲线相同。,常用的非参数检验方法有,log-rank,检验,(时序检验)、,Gehan,比分检验和,Breslow,检验,等。,125,第三节 生存率的比较 生存率比较的假设检验方法有参数法、半参,126,126,127,127,128,128,129,129,130,130,续表,131,续表131,132,132,133,133,对于大样本资料生存率的比较,可以将其整理成频数表形式,采用寿命表法计算生存率然后进行比较,其基本原理与上述方法相同。,134,对于大样本资料生存率的比较,可以将其整理成频数表形式,采用寿,第四节,COX,比例风险回归模型,135,第四节 COX比例风险回归模型 135,136,136,一、,COX,比例风险回归模型的基本形式,看下面例子,137,一、COX比例风险回归模型的基本形式 看下面例子137,如果分析,x1-x6,这,6,个因素对生存时间,t,的影响,能否用线性回归分析建立时间,t,与影响因素间的线性回归方程?或建立生存函数,S(t),与影响因素间的线性回归方程?,t,=,b,0,+,b,1,x,1,+,b,2,x,2,+,b,6,x,6,?,S(t),=,b,0,+,b,1,x,1,+,b,2,x,2,+,b,6,x,6,?,1,、生存时间,t,一般不服从正态 分布;,2,、生存时间,t,中含有截尾值。,138,如果分析x1-x6这6个因素对生存时间t的影响,能否用线性回,利用生存率函数,S,(,t,X,),与风险函数,h,(,t,X,),的关系可导出,较好的解决截尾值的问题,反映了协变量,X,与生存函数的关系,Cox,模型的基本形式,139,利用生存率函数S(t,X)与风险函数h(t,X)的关系可导出,所有危险因素为,0,时的基础风险率,它是未知的,但假定它与,h,(,t,X,),是呈比例的。,右侧可分为两部分:,h,0(,t,),没有明确的定义,分布无明确的假定,参数无法估计,为非参数部分;另一部分是参数部分,其参数可以通过样本的实际观察值来估计的,正因为,Cox,模型有非参数和参数两部分组成,故又称为半参数模型,。,140,所有危险因素为0时的基础风险率,它是未知的,但假定它与h(t,141,141,142,142,143,143,144,144,145,145,二、,COX,回归分析的步骤:,确定自变量和因变量,参数估计,拟和模型,对模型的假设检验,模型的解释及应用,对模型的拟和优度检验,146,二、COX回归分析的步骤: 确定自变量和因变量146,模型的参数估计,(一)参数估计,-,偏似然估计,147,模型的参数估计(一)参数估计-偏似然估计 147,代表,t,i,时刻以后危险集,R,(,t,i,),中对似然函数作贡献的个体,将,n,个病人死亡的 条件概率相乘,148,代表ti时刻以后危险集R(ti)中对似然函数作贡献的个体 将,模型的假设检验,149,模型的假设检验 149,150,150,151,151,COX,回归分析的应用实例,152,COX回归分析的应用实例 152,153,153,调用,Cox,模型分析模块 ,分析数据集为,cox,建立生存时间为,t,,截尾指示变量为,d,的,Cox,模型,,d,取值为,1,时表示截尾,选入和剔出水平均为,0.05,计算筛选因素的相对危险度及其,95%,的可信区间,154,调用Cox模型分析模块 ,分析数据集为cox建立生存时间为t,Summary of Stepwise Selection,Variable Number Score Wald,Step Entered Removed In Chi-Square Chi-Square Pr ChiSq,1 x4 1 13.0399 . 0.0003,2 x5 2 4.7039 . 0.0301,筛选过程总结,Analysis of Maximum Likelihood Estimat,Parameter Standard Hazard 95%HR,Variable DF Estimate Error Chi-Square PrChiSq Ratio Confidence Limits,x4 1,1.76128,0.54785 10.3356 0.0013,5.820,1.989 17.031,x5 1,0.93133,0.44455 4.3890 0.0362,2.538,1.062 6.066,最大似然估计结果,治疗方式(,x4,),:相对危险度为,5.820,,说明传统的治疗方式和新的治疗方式相比,病人死亡的风险为,5.820,倍,相对危险度的,95%,的可信区间为,1.98917.031,;,淋巴结是否转移(,x5,)的,RR,值的含义与治疗方式相同。,155,Summary of Stepwise Selection筛,四、,COX,模型的适用范围,Cox,模型适用于生存资料的统计分析,属半参数模型,对资料没有特殊的要求,也可以估计各因素的参数,并能做多因素的统计分析。该模型的主要优点在于能从众多的影响因素中排除混杂因素的影响,找出影响生存时间的因素,根据各因素的参数估计出个体的生存率。,另外,,Cox,模型能分析具有截尾数值的生存时间。,Cox,模型在临床流行病学分析中,使临床观察的定性指标又加上定量指标进行分析,提高了分析的效率。,156,四、COX模型的适用范围Cox模型适用于生存资料的统计分析,,五、,COX,模型的适用范围及注意事项,1,设计阶段应注意的问题,2,模型拟合时应注意的问题,3,模型应用时应注意的问题,157,五、COX模型的适用范围及注意事项 1设计阶段应,The end!,Thanks!,The end!,158,谢谢!,谢谢!,159,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!