资源描述
1,Logit模型的原理及应用,2017年3月3日,1.问题的提出,如果回归模型的解释变量中含有定性变量,则可以用虚拟变量来处理。 在实际经济问题中,被解释变量也可能是定性变量。 因变量取值是离散的,这类回归模型称为离散选择模型或“定性反应模型” 。 例如通过一系列解释变量的观测值观察人们对某项提议的态度,某件事情的成功和失败等。 这类模型被称为“离散选择模型” :二值选择模型、多值选择模型、计数模型。,2.线性概率模型(Tobit),2.线性概率模型(Tobit),2.线性概率模型(Tobit),Pobit模型,Logit模型,2.线性概率模型(Tobit),7,3.Logit 模型-提出,3.Logit 模型-提出,ln,3.Logit 模型-分类,3.Logit 模型-二分类,3.Logit 模型-二分类,若将 看成是因变量,则logit线性回归模型与多元线性回归模型的形式是一致的,且有很多共性。不同的是: 1、logistic回归模型中因变量是二分类的,而且非连续,其误差的分布不再是正态分布,而是二项分布,且所有的分析均建立在二项分布的基础上。 2、由于上述原因,logit回归系数的估计不能再用最小二乘法,而要用极大似然估计法。回归模型和回归系数的检验也不是F检验和t检验,而要用Wald检验、似然比检验等。,3.Logit 模型-二分类,例:讨论某特定人群(例如糖尿病患者)中患动脉硬化的概率与年龄、婚姻状况的关系。试建立死亡率关于年龄和婚姻状况的logit模型。 其中,A表示年龄(取中值),M1、M2、M3表示婚姻状况 其中,3.Logit 模型-多分类,前面讨论的logit模型为二分数据的情况,有时候响应变量有可能取三个或更多值,即多类别的属性变量。 根据响应变量类型的不同,分两种情况: 响应变量为定性名义变量; 响应变量为定性有序变量; 当名义响应变量有多个类别(即名义、无序)时,多项logit模型应采取把每个类别与一个基线类别配成对,通常取最后一类为参照,称为基线-类别logit.,3.Logit 模型-多分类,有些协变量为定量数据,logistic回归模型的协变量可以是定性名义数据。这就需要对名义数据进行赋值。 通常某个名义数据有k个状态,则定义变量 代表前面的k-1状态,最后令k-1变量均为0或-1来代表第k个状态。 如婚姻状况有四种状态:未婚、有配偶、丧偶和离婚,则可以定义三个指示变量M1、M2、M3,用(1,0,0)、 (0,1,0) 、(0,0,1) 、(0,0,0)或(-1,-1,-1)来对以上四种状态赋值。,3.Logit 模型-多分类,【例】研究三个学校、两个课程计划对学生偏好何种学习方式的影响。调查数据见表: 其中,三个学校对应两个哑变量x1和x2(学校一(1.0)学校二(0.1)学校三(0.0),两个课程计划为常规(M=1)和附加(M=0),学习方式分为:自修(y=1)、小组(y=2)、上课(y=3) 从题目可以看出,响应变量是学习方式有三类,属于多项逻辑斯蒂回归问题。于是,建模为:,3.Logit 模型-多分类(名义),3.Logit 模型-多分类(有序),对有序数据的赋值可以按顺序用数0,1,2,3,4分别表示,3.Logit 模型-多分类(有序),3.Logit 模型-多分类(有序),
展开阅读全文