资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,二级,三级,四级,五级,*,研究生医学统计中logistic回归,*,Logistic regression,Logistic回归,研究生医学统计中logistic回归,1,Logistic回归研究生医学统计中logistic回归1,第一节.非条件logistic回归,第二节.条件logistic回归,第三节.应用及其注意事项,研究生医学统计中logistic回归,2,第一节.非条件logistic回归研究生,医学研究中常碰到,应变量,的可能取值仅有两个(即,二分类变量,),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多元(重)回归的条件,什么情况下采用Logistic回归,研究生医学统计中logistic回归,3,医学研究中常碰到应变量的可能取值,Brown(1980)在术前检查了53例前列腺癌患者,拟用年龄(AGE)、酸性磷酸酯酶(ACID)两个连续型的变量,X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤的大小与位置(STAGE)三个分类变量与手术探查结果变量NODES(1、0分别表示癌症淋巴结转移与未转移,)建立淋巴结转移的预报模型。,实例,研究生医学统计中logistic回归,4,Brown(1980)在术前检查,(一)53例接受手术的前列腺癌患者情况,研究生医学统计中logistic回归,5,(一)53例接受手术的前列腺癌患者情况,(二)26例冠心病病人和28例对照进行病例,对照研究,研究生医学统计中logistic回归,6,(二)26例冠心病病人和28例对照进行病例对照研究,26例冠心病病人和28例对照者进行病例,对照研究,研究生医学统计中logistic回归,7,26例冠心病病人和28例对照者进行病例对照研究,一、logistic回归模型,研究生医学统计中logistic回归,8,一、logistic回归模型 研究生医学,概率预报模型,研究生医学统计中logistic回归,9,概率预报模型 研究生医学统计中logistic回归9,二、模型的,参数估计,Logistic回归参数的估计通常采用,最大似然法,(maximum likelihood,,ML,)。最大似然法的基本思想是先建立似然函数与对数似然函数,再通过使对数似然函数最大求解相应的参数值,所得到的估计值称为参数的最大似然估计值。,研究生医学统计中logistic回归,10,二、模型的参数估计 研究生医学统计中lo,参数估计的公式,研究生医学统计中logistic回归,11,参数估计的公式 研究生医学统计中logistic回归11,三、回归,参数的假设检验,研究生医学统计中logistic回归,12,三、回归参数的假设检验 研究生医学统计中logistic回归,优势比及其可信区间,研究生医学统计中logistic回归,13,优势比及其可信区间 研究生医学统计中logistic回归13,标准化回归,参数,用于评价各自变量对模型的贡献大小,研究生医学统计中logistic回归,14,标准化回归参数用于评价各自变量对模型的贡献大小研究生医学统计,SAS程序,研究生医学统计中logistic回归,15,SAS程序研究生医学统计中logistic回归15,The LOGISTIC Procedure,Analysis of Maximum Likelihood Estimates,研究生医学统计中logistic回归,16,The LOGISTIC ProcedureAnalys,预报模型,研究生医学统计中logistic回归,17,预报模型研究生医学统计中logistic回归17,The LOGISTIC Procedure,Analysis of Maximum Likelihood Estimates,研究生医学统计中logistic回归,18,The LOGISTIC ProcedureAnalys,预报模型,研究生医学统计中logistic回归,19,预报模型研究生医学统计中logistic回归19,四、回归,参数的意义,当只有一个自变量时,以相应的预报概率 为纵轴,自变量 为横轴,可绘制出一条S形曲线。回归参数的正负符号与绝对值大小,分别决定了S形曲线的方向与形状,研究生医学统计中logistic回归,20,四、回归参数的意义 当只有一个自变量时,以相应的预报,优势比改变exp(,b,j,)个单位,研究生医学统计中logistic回归,21,优势比改变exp(bj)个单位研究生医学统计中logisti,研究生医学统计中logistic回归,22,研究生医学统计中logistic回归22,五、整个回归模型,的假设检验,研究生医学统计中logistic回归,23,五、整个回归模型的假设检验 研究生医学统计中logistic,似然比检验(likelihood ratio test),研究生医学统计中logistic回归,24,似然比检验(likelihood ratio test)研究,ROC曲线模型评价,研究生医学统计中logistic回归,25,ROC曲线模型评价研究生医学统计中logistic回归25,ROC曲线模型评价,图16-2 Logistic回归预报能力的ROC曲线,研究生医学统计中logistic回归,26,ROC曲线模型评价图16-2 Logistic回归预报能力,六、logistic逐步回归(变量筛选),MODEL语句加入选项“SELECTION=STEPWISE,SLE=,0.10,SLS=,0.10,;”,常采用似然比检验:,决定自变量是否引入或剔除。,研究生医学统计中logistic回归,27,六、logistic逐步回归(变量筛选)MODEL语句加入选,模型中有X5、X6、X8,看是否引入X1,模型含X5、X6、X8的模型的负二倍,对数似然为:50.402,模型含X1、X5、X6、X8的模型的负二倍,对数似然为:46.224,研究生医学统计中logistic回归,28,模型中有X5、X6、X8,看是否引入X1模型含X5、X6、,第二节.条件logistic回归,研究生医学统计中logistic回归,29,第二节.条件logistic回归 研究生,条件似然函数,研究生医学统计中logistic回归,30,条件似然函数 研究生医学统计中logis,1:3配对的例子,研究生医学统计中logistic回归,31,1:3配对的例子 研究生医学统计中log,1:2配对的例子,研究生医学统计中logistic回归,32,1:2配对的例子 研究生医学统计中log,表16-7条件logistic回归的SAS程序,研究生医学统计中logistic回归,33,表16-7条件logistic回归的SAS程序,结果,研究生医学统计中logistic回归,34,结果研究生医学统计中logistic回归34,第三节 应用及其注意事项,应变量,为(二项)分类的资料,(预测、判别、危险因素分析等等),研究生医学统计中logistic回归,35,第三节 应用及其注意事项应变量为(二,注意事项,分类自变量的哑变量编码,为了便于解释,对二项分类变量一般按0、1编码,一般以0表示阴性或较轻情况,而1表示阳性或较严重情况。如果对二项分类变量按+1与-1编码,那么所得的 ,容易造成错误的解释。,研究生医学统计中logistic回归,36,注意事项分类自变量的哑变量编码 研究生医,西、中西、中三种疗法哑变量化,原资料,姓名,性别,年龄,疗法,张山,1,50,中西,李四,1,20,西,王五,0,18,中,刘六,0,70,中,赵七,1,35,中西,孙八,0,29,西,哑变量化,姓名,性别,年龄,X1,X2,张山,1,50,0,1,李四,1,20,1,0,王五,0,18,0,0,刘六,0,70,0,0,赵七,1,35,0,1,孙八,0,29,1,0,研究生医学统计中logistic回归,37,西、中西、中三种疗法哑变量化 原资料姓名性,注意事项,2.自变量的筛选,不同的筛选方法有时会产生不同的模型。实际工作中可同时采用这些方法,然后根据专业的可解释性、模型的节约性和资料采集的方便性等,决定采用何种方法的计算结果。,研究生医学统计中logistic回归,38,注意事项2.自变量的筛选研究生医学统计中,注意事项,3.交互作用,交互作用的分析十分复杂,应根据临床意义与实际情况酌情使用。,研究生医学统计中logistic回归,39,注意事项3.交互作用研究生医学统计中lo,注意事项,4.,多分类,logistic回归,心理疾病分为精神分裂症、抑郁症、神经官能症等(,名义变量,nominal variables);疗效评价分为无效、好转、显效、痊愈(,有序变量,ordinal variables)。,参见第17章,应变量,研究生医学统计中logistic回归,40,注意事项4.多分类logistic回归,SPSS软件计算,Analyze,Regression,Binary Logistic,Dependent:,y,Covariates:,x1,x8,Method:Forward Ward,Save,Predicted Values,Probabilities,Group membership,Option,CI for exp 95%,Probability for Stepwise,Entry:0.1 Removal 0.15,研究生医学统计中logistic回归,41,SPSS软件计算Analyze研究生医学统计中logisti,DATA,samp16_1;,INPUT x_ray grade stage age acid nodes;,CARDS;,.,;,PROC,LOGISTIC,DESCENDING;,MODEL nodes=x_ray grade stage age acid/RISKLIMITS;,OUTPUT OUT=pred PROB=pred;,PROC,PRINT,DATA=pred;,RUN,;,研究生医学统计中logistic回归,42,DATA samp16_1;研究生医学统计中logistic,The SAS System 22:07 Monday,November 29,2005 1,The LOGISTIC Procedure,Model Information,Data Set WORK.SAMP16_1,Response Variable nodes,Number of Response Levels 2,Number of Observations 53,Model binary logit,Optimization Technique Fishers scoring,Response Profile,Ordered Total,Value nodes Frequency,1 1 20,2 0 33,Probability modeled is nodes=1.,研究生医学统计中logistic回归,43,The SAS System 22:07 Mo,Model Convergence Status,Convergence criterion(GCONV=1E-8)satisfied.,Model Fit Statistics,Intercept,Intercept and,Criterion Only Covariates,AIC 72.252 60.126,SC 74.222 71.948,-2 Log L 70.252 48.126,Testing Global Null Hypothesis:BETA=0,Test Chi-Square DF Pr ChiSq,Likelihood Ratio 22.1264 5 0.0005,Score 19.4514 5 0.0016,Wald 13.1406 5 0.0
展开阅读全文