资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,.,*,多元离散选择模型,胡 枫,北京科技大学经济管理学院,二一一年十月,1,.,多元离散选择模型胡 枫1.,本讲内容,多元离散选择模型,定序选择模型,2,.,本讲内容多元离散选择模型2.,一、多元离散选择模型,3,.,一、多元离散选择模型3.,问题:农村异地转移劳动力的迁移目的地,被解释变量:,迁移目的地,即小城镇、县级市、地级市、省级城市和超大城市,依次取值1、2、3、4、5。,解释变量:,个人特征、家庭特征和目前所在地属性,。,连续变量,包括受教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、原有收入、现有收入,目前所在地属性中的所在地农村人口、国内生产总值、城乡居民储蓄余额、粮食产量、中学生在校人数、小学生在校人数等。,离散变量,包括性别、婚姻状况、收入稳定与否,目前所在地所属级别与家乡所在地所属级别等。,与上次讲的有何不同?,4,.,问题:农村异地转移劳动力的迁移目的地被解释变量:迁移目的地,,Multinomial Logistic Model,Multinomial logistic regression involves nominal response variables,more than two categories,Multinomial logit models are,multi-equation,models,A response variable with,j,+1 categories will generate,j,equations,Each of these,j,equations is a binary logistic regression comparing a group with the reference group,Multinomial logistic regression simultaneously estimates the,j,logits,5,.,Multinomial Logistic ModelMult,多元离散选择Logit模型,如果决策者,i,在(,J,+1)项可供选择方案中选择了第,j,项,那么其效用模型为:,如果(J+1)个随机误差项互不相关,并且服从类极值分布,选择j的概率,6,.,多元离散选择Logit模型如果决策者i在(J+1)项可供选择,多元离散选择Logit模型,7,.,多元离散选择Logit模型7.,多元离散选择Logit模型,X中未包含备选方案所具有的属性变量,而参数向量B对不同的选择方案(即不同的方程)是不同的。,令B,0,=0,j=1,2,J,8,.,多元离散选择Logit模型X中未包含备选方案所具有的属性变量,Multinomial Logistic Model,Therefore,we can obtain the following probabilities relative to the reference group:,The coefficients,represent the,log odds,of being in the target groups,relative to the reference group,9,.,Multinomial Logistic ModelTher,参数估计,10,.,参数估计10.,Ex1.Binary Logistic Model Result,Dependent variable:honcomp,11,.,Ex1.Binary Logistic Model Res,Stata Output,12,.,Stata Output12.,Multinomial Logistic Model Result,Dependent variable:prog,13,.,Multinomial Logistic Model Res,Stata Output,14,.,Stata Output14.,例2 农村异地转移劳动力的迁移目标研究,被解释变量:,迁移目标,即小城镇、县级市、地级市、省级城市和超大城市,依次取值1、2、3、4、5。,解释变量:,个人特征和目前所在地属性,。,连续变量,包括受教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、原有收入、现有收入,目前所在地属性中的所在地农村人口、国内生产总值、城乡居民储蓄余额、粮食产量、中学生在校人数、小学生在校人数等。,离散变量,包括性别、婚姻状况、收入稳定与否,目前所在地所属级别与家乡所在地所属级别等。,虽然作为被解释变量的城市规模本身是有序的,但是对于农村劳动力来说,选择进入哪一个级别的城市,本身是无序的,因此对于城市化迁移目标构造,多元名义logit离散选择模型,。,15,.,例2 农村异地转移劳动力的迁移目标研究被解释变量:迁移目标,,调查样本:有效样本303份。,用统计软件进行估计与分析(SAS、Stata、SPSS均可)。,首先将定义的全部变量放进模型中进行估计,并,通过比较各个变量的P值来考虑具体剔除哪些变量以及对哪些变量考虑将其交互影响的效应放进模型中去,。,小城镇、县级市、地级市、省级城市和超大城市依次取值1、2、3、4、5。,16,.,调查样本:有效样本303份。16.,最终模型的估计结果(部分),*代表的是90的显著性水平,,*代表的是95的显著性水平,*代表的是99的显著性水平。,变量,模型序号,系数估计,标准差,P,值,1,1.2137,1.4518,0.4032,2,*,2.7685,1.0998,0.0118,3,*,2.3962,0.9351,0.0104,常数项,4,*,3.6742,1.0665,0.0006,1,*,-,0.2475,0.1050,0.0184,2,*,-,0.2800,0.0727,0.0001,3,*,-,0.1136,0.0660,0.0852,教育程度,4,-,0.0856,0.0696,0.2184,1,-,0.1299,0.1084,0.2310,2,*,-,0.0943,0.0552,0.0877,3,-,0.0337,0.0452,0.4556,家庭情况,4,*,-,0.1578,0.0586,0.0071,17,.,最终模型的估计结果(部分)*代表的是90的显著性水平,变,教育程度、家庭情况及现有收入对迁移目标的影响,:,Log(小城镇/超大城市),Log(县级市/超大城市),Log(地级市/超大城市),Log(省级市/超大城市),18,.,教育程度、家庭情况及现有收入对迁移目标的影响:Log(小城镇,从教育程度来看,,所有系数都是负值,教育程度越高的农村劳动力越愿意进入规模较大的城市;从显著性水平来看,相对于超大城市来说,县级市被选择的可能性最小,其次是小城镇,然后是地级城市,而教育程度相似的农村劳动力在省级城市与超大城市之间的选择没有明显的差异,从家庭情况来看,,所有系数都是负值,也就是说家庭情况越好的农村劳动力越愿意进入规模较大的城市;从显著性水平来看,相对于超大城市来说,省级城市最不容易被选中,其次是县级市,而小城镇与地级市之间没有明显区别,从现有收入来看,,所有系数都是负值,也就是说目前收入越高的农村劳动力越愿意进入规模较大的城市;再从显著性水平来看,所有系数都是显著的,这说明相对于任何级别的城市而言,农村劳动力都更倾向于超大城市,结果解释,19,.,从教育程度来看,所有系数都是负值,教育程度越高的农村劳动力越,Other Models for Nominal Outcomes,Conditional Logit,Attributes of choices can be used as predictors,Example:way of transportation(car,bus,bike),time,wealth,and age,Nested Logit,Treats a set of choices as a hierarchy,IIA assumption can be relaxed,Example:migration,current(permanent,or temporary),or return?,20,.,Other Models for Nominal Outco,一是研究选择某种方案的概率与决策者的特征变量之间的关系;,二是研究选择某种方案的概率与决策者的特征变量以及方案的特征变量之间的关系;,三是考虑到不同方案之间的相关性的情况。,Multinomial Logit Model,多项式Logit模型,名义Logit模型,Conditional Logit Model,条件Logit模型,Nested Logit模型,嵌套模型,Three Types of Multiple Response Models,21,.,一是研究选择某种方案的概率与决策者的特征变量之间的关系;Mu,二、定序选择模型,22,.,二、定序选择模型22.,1、问题的提出,作为被解释变量的(,J,+1)个选择结果本身是排序的,,J,优于(J1),2优于1,1优于0。,决策者选择不同的方案所得到的效用也是排序的。,一般多元离散选择模型中的效用关系不再适用。,23,.,1、问题的提出作为被解释变量的(J+1)个选择结果本身是排序,Example,A study looks at factors that influence the decision of whether to apply to graduate school.College juniors are asked if they are,unlikely,somewhat likely,or,very likely,to apply to graduate school.Hence,our outcome variable has three categories.Data on parental educational status,whether the undergraduate institution is public or private,and current GPA is also collected.,24,.,ExampleA study looks at factor,2、效用关系,选择不同方案的效用关系:,25,.,2、效用关系选择不同方案的效用关系:25.,3、模型,为了保证所有的概率都是正的,必须有,:,假定服从正态分布,并且标准化为服从期望为0、方差为1的正态分布。那么可以得到选择各个方案的概率,为正态分布的概率函数,ML estimation,26,.,3、模型为了保证所有的概率都是正的,必须有:假定服从正态,Ex3.Ceilphone,Objective:,Consumer preference for different ceilphone,Data Source,The EDP students from GSM,A total of 1451 observations,27,.,Ex3.CeilphoneObjective:27.,Variables,28,.,Variables28.,Linear Regression?,One common/convenient way,but,29,.,Linear Regression?One common/c,A Latent Variable Model,30,.,A Latent Variable Model30.,The Ordinal Regression Model,31,.,The Ordinal Regression Model31,Two Popular Models,32,.,Two Popular Models32.,Another Formulation,33,.,Another Formulat
展开阅读全文