第13章-无序多分类逻辑斯蒂回归模型

上传人:su****e 文档编号:243438379 上传时间:2024-09-23 格式:PPT 页数:23 大小:407.50KB
返回 下载 相关 举报
第13章-无序多分类逻辑斯蒂回归模型_第1页
第1页 / 共23页
第13章-无序多分类逻辑斯蒂回归模型_第2页
第2页 / 共23页
第13章-无序多分类逻辑斯蒂回归模型_第3页
第3页 / 共23页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,多元回归中的几种重要模型,第一部分:多重共线情况的处理,第,10,章,岭回归分析(,Ridge Regression,),第二部分:自变量中含定性变量的处理,第,11,章,自变量中含有定性变量的回归分析,第三部分:,因变量中含有定性变量情况的处理,第,12,章,二项,Logistic,回归,第,13,章,多项,Logistic,回归,第,14,章,有序回归,(等级回归分析),第,15,章,Probit,回归,(概率单位回归),第,16,章,最佳尺度回归,本章总结,Logistic,回归,因变量,二项,Logistic,回归,多项,Logistic,回归,有序回归,Probit,回归,第,13,章,多项,Logistic,回归,(无序多分类,Logistic,回归),13.1,无序多分类,Logistic,回归的基本思想,13.2,无序多分类,Logistic,回归的案例分析,13.1,无序多分类,Logistic,回归的基本思想,设因变量有,k,个取值水平,,可以对其中的,k-1,个取值水平各做一个回归方程,。设因变量第,i,个水平的,Logistic,回归模型:,这样,对于每一个模型都可以获得一组回归系数,。,根据因变量(响应变量)类型的不同,分两种情况:,因变量为定性名义变量:各类之间地位相等,因变量为定性有序变量:各类之间存在程度、先后之分,13.1,无序多分类,Logistic,回归的基本思想,当,名义因变量(响应变量),有多个类别时,,一般通过一种叫广义,Logit,模型的方法进行,。即:多项,Logistic,模型采取把每个类别与一个参考类别配成对,通常取最后一类为基线,/,参照类别,称为基线,-,类别,Logistic,,,预测变量为,x,的基线,-,类别,logit,模型为:,模型共有,J-1,个方程,每个方程有不同的参数,这些效应依据与基线配对的类别而变化;,不管哪个类别作为参照,对于同一对类别都会有相同的参数估计;即参照类别的选择是任意的。,以,Y,分三类情形为例。,假定因变量,Y,为,分类变量,类数为,3,,各类之间,无顺序之分,,且假定,Y,的取值分别为,a,、,b,、,c,,选,Y,a,为,b,和,c,的共同参照组,则有以下模型:,Pa+Pb+Pc,=1,,实质上通过两个二维逻辑回归方程 就可以处理三分类情形。,如果希望比较,b,和,c,两组,则直接将上述两方程相减即可得到相应函数。,13.2,无序多分类,Logistic,回归的案例分析,例题:研究,不同学校,和,不同课程计划,对,学生学习方式偏好,的影响,得到数据如下表。试进行,logistic,回归分析。数据文件:“学习偏好,.,sav,”,学校,school,课程计划,program,学生偏好的学习方式,自修,小组,上课,1,常规,10,17,26,附加,5,12,50,2,常规,21,17,26,附加,16,12,26,3,常规,15,15,16,附加,12,12,20,SPSS,操作步骤:,1,、建立数据文件;,2,、,数据加权个案,3,、分析回归多元,logistic,回归,4,、学习方式因变量;学校、课程计划因子,5,、确定(其他选项默认),13.2,无序多分类,Logistic,回归的案例分析,默认参考类别为最后一类,也可重新设定,因变量和因子,都,必须,为,分类变量,协变量:不能够控制和不感兴趣的变量。例如,当研究学习时间对学习绩效的影响,学生原来的学习基础、智力、学习兴趣就是协变。,在实验的设计中,协变量是一个独立变量(解释变量),不为实验者所操纵,但仍影响实验结果。例如,研究教学方法对学生成绩的影响,学生原来的学习基础就是你所不能控制的,只能尽量消除其影响。,协变量可以为分类变量和连续变量,用于设置区分类别的顺序,升序则取值最小的类为第一类,降序则取值最小的类为最后一类,指定模型,主效应:表示模型中只包含些变量和因素变量的主效应,全因子:表示模型中包含所有主效应以及它们之间所有可能的交互效应,设定,/,步进式:由用户自行选择使用哪些效应进行分析,选中之后激活下面的选项,强制输入项:进入的效应强制出现在模型中,步进项:选入此列表的效应将以逐步回归的方式加入模型,建立项:用来指定效应的种类,可供选择的有,6,种,步进法:给出了,4,种步进方法,输出逐步回归的判别标准,输出,Akaike,信息标准(,AIC,)和施瓦兹,-,贝叶斯信息标准(,BIC,),越小越好,用于指定一个小于,1,的正数,此数将被添入分类变量交叉标的空单元格中,有助于稳定算法,防止出现较大的估计偏差,对所有因自变量和协变量计算单元概率,并进行拟合优度检验,把观测记录按照因变量进行分类的估计概率,因变量有几个水平就保存几个变量,保存模型的预测响应分类,保存最大的预测响应概率,保存预测正确时的估计响应概率,该表为总模型的似然比检验结果,可见最终模型和只含有常数项的初始模型相比,,-2LL,值从,78.128,下降至,51.303,,下降了,26.825,,似然比卡方检验的,P-,值小于,0.05,,说明模型整体是显著的。,伪,R,2,指标,此处因只有分类变量,所以三个决定系数都非常低,不过在,Logistic,模型分析中它们的用处不太大。,拟合优度检验:检验的零假设是模型能很好的拟合原始数据,从,sig.,看,均远大于,0.05,,不能否定原假设,即最终模型的显著成立。,似然比检验,该表结果表明,在,5%,的显著水平下,两个变量的作用都是显著的。,其中,:school=3,和,program=2,为参照,因此其参数为,0,。,变量“,school,1”,回归系数为负值,显著不为零,表明:自修与上课两种学习方式相比,学校,1,的学生比学校,3,的学生更容易选择上课,学校,2,与学校,3,的学生的选择则没什么差别。,常规课程计划的学生比附加学习计划的学生更容易选择自修学习方式;,常规课程,计划的,学生更偏好小组学习,。,冗余参数:研究者不感兴趣的参数,此处是被固定参考类别,在实际应用中,分类自变量,(,如婚姻状况,),各哑变量的偏回归系数可能其中某一,(,几,),个有统计学意义,而其他的没有统计学意义(,P,a,)。此时建议保留该自变量。,分类表:是根据观测频率和预测频率统计得到的。对角线上的单元个代表判断正确的个数或概率,非对角线则为判错的个数或概率。可以看出,模型仍有改进的余地。,观测频率和预测频率:较为接近,拟合不错,练习:早餐习惯受生活方式、性别等因素的影响。某块三公司为了提高其早餐的市场份额,对,880,名消费者做了一次调查,见数据“早餐偏好调查数据,.,sav,”,,问卷提出了年龄段、性别、生活方式、早餐、婚否等问题,其中早餐,=1,表示不吃,,=2,表示吃麦片,,=3,表示吃谷物。试分析各因素对早餐的影响。,13.2,无序多分类,Logistic,回归的案例分析,练习:小布什为捍卫家庭荣誉与民主党总统候选人克里围绕新一届总统大选进行,“,殊死搏斗,”,以试图打破,“,赢了战争却丢了总统宝座,”,的怪圈。这里回顾一下老布什与克林顿在,1992,年进行的较量,当时还有独立候选人佩罗先生。数据文件为“,vote.,sav,”,,变量有,:pres92,,所欲选的总统候选人,; age,,年龄,;,agecat,,年龄分组,;,educ,,受教育年数,; degree,,最高学历,; sex,,性别。试对其拟合反应变量为无序多分类的,Logistic,回归,看看哪些因素导致了老布什的败北,小布什应从中吸取哪些教训。,13.2,无序多分类,Logistic,回归的案例分析,本章结束!,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!