二值因变量回归模型课件

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2019/12/21,#,第,8,章,二值因变量回归模型,第8章二值因变量回归模型,1,二,值因变量回归模型,8.1,二值因变量模型,8.1.1,效用理论和指标模型,8.1.2,probit,模型和,logit,模型,8.2,二值因变量模型估计,8.2.1,二值因变量模型极大似然估计,8.2.2,用,EViews7.2,估计二值因变量模型,重要概念,二值因变量回归模型8.1 二值因变量模型,2,8.1,二,值,因变量模型,8.1.1,效用理论和指标模型,8.1.2 probit,模型和,logit,模型,8.1 二值因变量模型8.1.1 效用理论和指标模型,3,8.1,二,值,因变量模型,8.1.1,效用理论和指标模型,因变量只取,0,和,1,的模型称为二值因变量（,binary dependent variable,）模型。模型因变量没有明显的数量特征，往往对应研究对象的不同属性，属于分类变量。,例：女性决定投入劳动力市场还是做家务的影响因素、投资人决定是风险投资还是无风险投资的决定因素、哪些财务指标决定着上市公司财务状况（正常或恶化）、股票涨跌的影响因素。,8.1 二值因变量模型8.1.1 效用理论和指标模型,4,8.1,二,值,因变量模型,8.1.1,效用理论和指标模型,以投资决策为例，,表示购买股票，,表示银行存款,表示投资股票的收益，,表示投资风险,需要研究的是,的变化如何影响投资决策变化，即投资倾向（或者意愿）的变化。可观测，但观测不到投资者投资意愿的变化，只会观测到,或者。,8.1 二值因变量模型8.1.1 效用理论和指标模型,5,8.1,二,值,因变量模型,8.1.1,效用理论和指标模型,以投资决策为例，,表示购买股票，,表示银行存款,表示投资股票的收益，,表示投资风险,设,表示投资者的效用函数，不可观测，其与自变量关系式：,假定,大于临界值,时，投资者购买股票，则,8.1 二值因变量模型8.1.1 效用理论和指标模型,6,8.1,二,值,因变量模型,8.1.1,效用理论和指标模型,设,的分布函数为,，并且满足,称为连接函数（,link function,），线性函数,称为指标函数（,index,）。,8.1 二值因变量模型8.1.1 效用理论和指标模型,7,8.1,二,值,因变量模型,8.1.1,效用理论和指标模型,定义,1,：设,为二值因变量，,为自变量，称模型,为二值因变量模型，其中,为分布函数，满足,。,二值因变量模型不是回归模型，没有误差项。内生性异方差等问题需对原模型,讨论。,二值因变量模型中的,不可观测，模型不能用最小二乘估计。参数估计有赖于对的假设。,8.1 二值因变量模型8.1.1 效用理论和指标模型,8,8.1,二,值,因变量模型,8.1.2 probit,模型和,logit,模型,probit,模型,假设连接函数为标准正态分布的分布函数,实际上等价于假定了服从标准正态分布；若的方差未定，则参数不能被唯一估计。,8.1 二值因变量模型8.1.2 probit模型和l,9,8.1,二,值,因变量模型,8.1.2 probit,模型和,logit,模型,logit,模型,假设连接函数为逻辑分布函数,logit,模型中的连接函数是一种特殊的逻辑分布，目的是保证模型中参数能够唯一确定。,8.1 二值因变量模型8.1.2 probit模型和l,10,8.1,二,值,因变量模型,8.1.2 probit,模型和,logit,模型,probit,模型和,logit,模型的比较,大多数情况下二者估计结果相似,值较大时，正态分布函数对的敏感性较低，,logit,模型可以缓解这种现象,0,0.5,1,logit,proit,t,8.1 二值因变量模型8.1.2 probit模型和l,11,8.1,二,值,因变量模型,8.1.2 probit,模型和,logit,模型,probit,模型和,logit,模型的比较,logit,模型可变换为,若能得到的一致估计，就能用,OLS,方法估计上述模型参数。,8.1 二值因变量模型8.1.2 probit模型和l,12,8.2,二值因变量模型估计,8.2.1,二值因变量模型极大似然估计,8.2.2,用,EViews7.2,估计二值因变量模型,8.2 二值因变量模型估计8.2.1 二值因变量模型极大似然,13,8.2,二值因变量模型估计,8.2.1,二值因变量模型极大似然估计,8.2 二值因变量模型估计8.2.1 二值因变量模型极大似然,14,二值因变量模型极大似然估计,极大似然估计,样本似然函数,二值因变量模型极大似然估计极大似然估计,15,二值因变量模型极大似然估计,对数似然函数,对上述函数求分别关于、和求导就可求得参数估计；但是该函数通常太过复杂，一般用数值方法求得参数估计。,二值因变量模型极大似然估计对数似然函数,16,二值因变量模型极大似然估计,参数估计的渐近分布,由第,2,章结论,8,知，上述参数的极大似然估计、,和渐进服从正态分布，即,故可构造以下统计量检验,二值因变量模型极大似然估计参数估计的渐近分布,17,二值因变量模型极大似然估计,拟合优度、似然比和,McFadden,由于因变量取值的特殊性，二值因变量模型不再用,来度量模型拟合的好坏，而采用似然比（,likely ratio,）和似然比指数（,likelihood ratio index,）对模型拟合效果进行评价。,例：检验,首先进行不受限极大似然估计，得参数估计,再进行原假设限制下的极大似然估计，得参数估计,二值因变量模型极大似然估计拟合优度、似然比和McFadden,18,二值因变量模型极大似然估计,拟合优度、似然比和,McFadden,例：检验,似然比（,LR,）统计量：,原假设成立时服从。,McFadden,为对应的对数似然函数值。,二值因变量模型极大似然估计拟合优度、似然比和McFadden,19,二值因变量模型极大似然估计,probit,模型和,logit,模型的估计,依前面给出的对数似然函数做最大似然估计，如,logit,模型,做完估计后可以对单个参数显著性或者模型的拟合效果进行检验，统计量上面已经给出。,二值因变量模型极大似然估计probit模型和logit模型的,20,二值因变量模型极大似然估计,完全分离（,complete separation,）及其处理,定义,2.,设,为样本，如果存在线性组合,和常数,C,使得,称样本存在完全分离。,如果存在这种情况，则相应地增大的值会不断增加对数似然函数的值，因此将没有最大值点。,二值因变量模型极大似然估计完全分离（complete sep,21,二值因变量模型极大似然估计,完全分离（,complete separation,）及其处理,出现完全分离的原因：,1.,因变量几乎全部取,1,（或者,0,），取,0,（或者,1,）的样本太少，解决的办法是增加取,0,的样本，或者减少取,1,的样本。,2.,自变量太多，容易找到线性组合将数据完全分离，解决方法是去掉一些自变量。,二值因变量模型极大似然估计完全分离（complete sep,22,8.2,二值因变量模型估计,8.2.2,用,EViews7.2,估计二值因变量模型,EViews,操作,与其他回归模型的估计操作类似，只需在模型估计（,Equation Estimation,）窗口的估计设定（,Estimation Setting,）中从估计方法（,Method:,）中选择,BINARY-Binary Choice(logit,probit,extreme value),，然后选择模型类型,Binary estimation method Probit Logit,，然后点击,Option,选项，对数值方法、初始值和收敛准则进行选择，完成设置。,8.2 二值因变量模型估计8.2.2 用EViews7.2估,23,8.2,二值因变量模型估计,8.2.2,用,EViews7.2,估计二值因变量模型,EViews,操作,二值因变量模型采用极大似然估计，对数似然函数的极大化采用数值解法，需要对数值解法采用的方法（,Optimization algorithm,）进行选择。,EViews,提供了三种算法：,Quadratic Hill Climbing,、,Newton-Raphson,、,Berndt-Hall-Hall-Hausman,8.2 二值因变量模型估计8.2.2 用EViews7.2估,24,8.2,二值因变量模型估计,8.2.2,用,EViews7.2,估计二值因变量模型,EViews,操作,还可以对参数估计方差的计算方法进行选择，在,Option,窗口中的,Covariance,框下勾选,Robust Covariances,，可选,Hubert/White,或者,GML,方法。,对迭代控制（,Iteration control,）也可选选填最大迭代次数（,Max,）和收敛公差（,Convergence,：）,Options,窗口右下角为二值因变量模型中指标函数求导设置（,Derivatives,（,for index,），可选,A,ccuracy,或者,Sp,e,ed,8.2 二值因变量模型估计8.2.2 用EViews7.2估,25,8.2,二值因变量模型估计,8.2.2,用,EViews7.2,估计二值因变量模型,EViews,操作,8.2 二值因变量模型估计8.2.2 用EViews7.2估,26,8.2,二值因变量模型估计,8.2.2,用,EViews7.2,估计二值因变量模型,估计结果解释,表示自变量的变化对概率的影响，与一般线性模型不一样的是，此处它的大小与自变量有关（一般在样本均值处衡量）。,8.2 二值因变量模型估计8.2.2 用EViews7.2估,27,8.2,二值因变量模型估计,8.2.2,用,EViews7.2,估计二值因变量模型,估计结果解释,probit,模型和,logit,模型得出的结果不同,8.2 二值因变量模型估计8.2.2 用EViews7.2估,28,8.2,二值因变量模型估计,8.2.2,用,EViews7.2,估计二值因变量模型,例子,8.1,银行贷款违约概率,因变量：贷款人是否违约（，表示违约）,自变量：资产负债率（）、流动比率（）、总债务,/,利税前收入（）、净资产收益率（）、销售（营业）利润率（），总资产周转率（）、流动资产周转率（）、销售,(,营业,),增长率（）、资本积累率（）,8.2 二值因变量模型估计8.2.2 用EViews7.2估,29,8.2,二值因变量模型估计,8.2.2,用,EViews7.2,估计二值因变量模型,例子,8.1,银行贷款违约概率,8.2 二值因变量模型估计8.2.2 用EViews7.2估,30,8.2,二值因变量模型估计,8.2.2,用,EViews7.2,估计二值因变量模型,例子,8.1,银行贷款违约概率,若将所有自变量包括在内，回归结果如上，,EViews,提示有完全分离的情况。,去掉部分自变量可以消除完全分离。经多次尝试，最终保留,、,、,、,、,、,和常数项,作为解释变量，数值算法采用牛顿,-,拉夫森算法，参数估计的标准差和协方差计算采用,Hubert/White,方法,8.2 二值因变量模型估计8.2.2 用EViews7.2估,31,8.2,二值因变量模型估计,8.2.2,用,EViews7.2,估计二值因变量模型,例子,8.1,银行贷款违约概率,8.2 二值因变量模型估计8.2.2 用EViews7.2估,32,8.2,二值因变量模型估计,8.2.2,用,EViews7.2,估计二值因变量模型,例子,8.1,银行贷款违约概率,第一部分显示回归信息：采用二值因变量模型，选择,Probit,模型，并采用,Newton-Raphson,算法，,15,次迭代后收敛，用,H

展开阅读全文

二值因变量回归模型课件

最新文档