Logistic回归分析方法.ppt

上传人:za****8 文档编号:13189808 上传时间:2020-06-07 格式:PPT 页数:29 大小:254.96KB
返回 下载 相关 举报
Logistic回归分析方法.ppt_第1页
第1页 / 共29页
Logistic回归分析方法.ppt_第2页
第2页 / 共29页
Logistic回归分析方法.ppt_第3页
第3页 / 共29页
点击查看更多>>
资源描述
Logistic回归分析,公共卫生学院,一、前言,应变量为分类指标的资料线性回归分析:应变量为连续计量资料,二、Logistic回归模型,Logistic回归的分类二分类多分类条件Logistic回归非条件Logistic回归,Logit变换也称对数单位转换logitP=,流行病学概念:设P表示暴露因素X时个体发病的概率,则发病的概率P与未发病的概率1-P之比为优势(odds),logitP就是odds的对数值。,Logistic回归模型Logistic回归的logit模型Logistic回归模型,三、参数估计,最大似然估计法(Maximumlikehoodestimate)似然函数:L=Pi对数似然函数:lnL=(lnP)=lnP1+lnP2+lnPn非线性迭代方法Newton-Raphson法,四、参数检验,似然比检验(likehoodratiotest)通过比较包含与不包含某一个或几个待检验观察因素的两个模型的对数似然函数变化来进行,其统计量为G(又称Deviance)。G=-2(lnLp-lnLk)样本量较大时,G近似服从自由度为待检验因素个数的分布。,比分检验(scoretest)以未包含某个或几个变量的模型为基础,保留模型中参数的估计值,并假设新增加的参数为零,计算似然函数的一价偏导数(又称有效比分)及信息距阵,两者相乘便得比分检验的统计量S。样本量较大时,S近似服从自由度为待检验因素个数的分布。,Wald检验(waldtest)即广义的t检验,统计量为uu服从正态分布,即为标准正态离差。Logistic回归系数的区间估计,上述三种方法中,似然比检验最可靠,比分检验一般与它相一致,但两者均要求较大的计算量;而Wald检验未考虑各因素间的综合作用,在因素间有共线性时结果不如其它两者可靠。,五、回归系数的意义,单纯从数学上讲,与多元线性回归分析中回归系数的解释并无不同,亦即bi表示xi改变一个单位时,logitP的平均变化量。,流行病学中的一些基本概念:相对危险度(relativerisk):RR=P1/P2比数Odds=P/(1-P)比数比OR=P/(1-P)/P/(1-P)在患病率较小情况下,ORRR,Logistic回归中的常数项(b0)表示,在不接触任何潜在危险保护因素条件下,效应指标发生与不发生事件的概率之比的对数值。Logistic回归中的回归系数(bi)表示,某一因素改变一个单位时,效应指标发生与不发生事件的概率之比的对数变化值,即OR的对数值。,Logistic回归系数的意义,分析因素xi为二分类变量时,存在(暴露)xi,不存在(未暴露)xi,则Logistic回归中xi的系数bi就是暴露与非暴露优势比的对数值即OR=exp(bi)=e(bi),分析因素xi为多分类变量时,为方便起见,常用1,2,k分别表示k个不同的类别。进行Logistic回归分析前需将该变量转换成k-1个指示变量或哑变量(design/dummyvariable),这样指示变量都是一个二分变量,每一个指示变量均有一个估计系数,即回归系数,其解释同前。,分析因素xi为等级变量时,如果每个等级的作用相同,可按计量资料处理:如以最小或最大等级作参考组,并按等级顺序依次取为0,1,2,。此时,e(bi)表示xi增加一个等级时的优势比,e(k*bi)表示xi增加k个等级时的优势比。如果每个等级的作用不相同,则应按多分类资料处理。分析因素xi为连续性变量时,e(bi)表示xi增加一个计量单位时的优势比。,多因素Logistic回归分析时,对回归系数的解释都是指在其它所有自变量固定的情况下的优势比。存在因素间交互作用时,Logistic回归系数的解释变得更为复杂,应特别小心。,根据Wald检验,可知Logistic回归系数bi服从u分布。因此其可信区间为进而,优势比e(bi)的可信区间为,六、Logistic回归分析方法,基本思想同线性回归分析。从所用的方法看,有强迫法、前进法、后退法和逐步法。在这些方法中,筛选变量的过程与线性回归过程的完全一样。但其中所用的统计量不再是线性回归分析中的F统计量,而是以上介绍的参数检验方法中的三种统计量之一。,为计算方便,通常向前选取变量用似然比或比分检验,而向后剔除变量常用Wald检验。,七、条件Logistic回归,对配对/比调查资料,应该用条件Logistic回归分析。对于配比资料,第i个配比组可以建立一个Logistic回归:,假设自变量在各配比组中对结果变量的作用是相同的,即自变量的回归系数与配比组无关。配比设计的Logistic回归模型其中不含常数项。,可以看出此回归模型与非条件Logistic回归模型十分相似,只不过这里的参数估计是根据条件概率得到的,因此称为条件Logistic回归模型。条件Logistic回归的回归系数检验与分析,和非条件Logistic回归完全相同。,八、Logistic回归的应用,危险/保健因素的筛选,并确定其作用大小。预测:预测某种情况下或者某个病例,某特定事件发生的概率。,九、Logistic回归应用实例,十、注意事项,应用条件1.各观察对象间相互独立;2.logitP与自变量呈线性关系。异常值计量资料间的共线性问题,暴露率样本量,谢谢!,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!