资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章 标准线性回归模型(2),1、控制变量的思想,多元模型中每个变量的回归系数,可以理解为在模型中其他解释变量所代表的因素保持不变的情况下,该变量对被解释变量的影响,这就是所谓的控制,1、控制变量,被解释变量,解释变量,控制变量,1、控制变量,1、控制变量,条件收敛的验证,一般认为经济增长具有收敛性,即落后国家(人均,GDP,较低)会比先进国家(人均,GDP,较高)具有更高的,GDP,增长率,但实证分析的结果并不支持此种观点,所以有学者提出条件收敛的概念,即,增长率的高低取决于一个国家或地区实际增长水平与稳态增长水平之间的差距,,而非仅仅由实际增长水平决定。差距越大,平均增长率会越高,反之则较低。条件收敛理论意味着:如果两国有相同的稳态增长水平,落后国家会具有较高的增长率。,1、控制变量,如果控制了不该控制的变量,如该变量和核心解释变量高度相关,或具有因果关系,则也会影响估计的可靠性,2、因果分析的方法,相关不是因果,有因果的关系可以不相关,无因果的关系可以表现出相关,2、因果分析的方法,回归模型只具有相关意义,不具有因果意义,2、因果分析的方法,6、因果分析的方法,患癌症,未患癌症,吸 烟,40,60,不吸烟,20,80,女性,男性,患癌症,未患癌症,患癌症,未患癌症,吸 烟,0,60,40,0,不吸烟,0,80,20,0,Granger检验,检验要求估计如下回归,Granger检验,检验统计量,Granger检验,3点注意:,1、在检验之前,要先保证序列的平稳性,,或者具有协整关系;,2、控制变量问题,3、检验结果对滞后长度敏感。,Granger检验,Granger检验,Granger检验经常用来判断两个变量的因果关系,其基本思想是,如果X为Y的原因,则X的发生应该在前,应该可以通过X预测Y,所以Granger检验是通过检验可预测性来推断因果关系,本质上Granger检验不是因果检验,2、因果分析的方法,有学者引入图模型(graphical model) 理论研究该问题,有向非循环图( directed acyclic graphs,DAG),3、解释变量之间的关系,因变量,自变量1,自变量2,自变量3,3、解释变量之间的关系,因变量,自变量1,自变量2,自变量3,3、解释变量之间的关系,解释变量(explanatory variables),vs,控制变量(control variables),中介变量( mediator ),vs,调节变量(moderator),3、解释变量之间的关系,调节变量,因变量,自变量1,自变量2,3、解释变量之间的关系,中介变量,因变量,自变量1,自变量2,调节效应的检验,设交互项检验调节效应,适用于解释变量X1对于被解释变量Y的边际影响取决于解释变量X2的水平的情况,调节效应的检验,假说:“若行业的平均规模越大,则更高的银行集中度有利于该行业的发展,若行业以中小企业为主,则更低的银行集中度有利于该行业的发展”,人口密度高的地区,交通设施对信任的影响要比人口密度低的地区大,教育对于经济体吸收新技术的能力具有积极效应,因此,平均教育年限越长的国家,经济由初始水平收敛到均衡水平的速度越快,调节效应的检验,中介变量的检验方法,中介变量的检验方法,中介变量的检验方法,方法1,中介变量的检验方法,方法2,中介变量的检验方法,方法3,中介变量的检验方法,群体效能感在团队组织氛围与团队有效性之间充当中介变量,即团队组织氛围通过提升或降低群体效能感来影响团队的有效性。,工作满意度是个人组织匹配影响离职倾向的中介变量;工作满意度是组织支持感影响离职倾向的中介变量,4.函数的设定,常用手段:,1)增设二次项,适用于解释变量X对于被解释变量Y的边际影响取决于解释变量X的水平的情况,4.函数的设定,4.函数的设定,4.函数的设定,民主与增长的关系:,当民主水平很低时,提高民主可以限制政府权力的过度使用,从而促进增长;而当民主水平较高时,进一步提高民主程度,反而会因过度关注公平而影响效率,从而抑制增长。,库兹涅兹曲线(环境库兹涅兹曲线EKC),4.函数的设定,人均GDP,人均净对外直接投资,4.函数的设定,2)设滞后项,存在,1,期的滞后影响,4.函数的设定,3)部分变量取非线性形式,5.变量变换取对数,取对数的好处,如果因变量、自变量都取对数,参数具有弹性含义,经过对数变换的变量,一般更加符合假设条件,可以缩小取值范围,减少异常值的影响,什么时候取对数,变量之间为相乘关系(双对数),或具有某种非线性关系(单对数),那些取值为正的右偏分布变量,5.变量变换取对数,取对数的陷阱,取对数后,为获得原变量的估计,往往需要取指数进行还原,此时的估计会出现系统偏差。,5.变量变换取对数,5.变量变换取对数,如果,u,不服从正态分布,则调整程序如下:,1)得到,ln,Y,的拟合值,2)对每个拟合值取指数,得到,m,i,3)做,Y,对,m,i,的过原点回归,得到回归系数,4)将此系数乘以,m,i,,得到最终拟合值,6.常遭忽略的两个问题,1)把函数当作确定关系处理,遗忘了随机项,也存在问题,存在干扰不对称问题,6.常遭忽略的两个问题,2)过原点回归具有一些特殊的性质,残差的均值不等于0,R,2,有可能为负,一般需要调整,如果总体回归函数中截距项非0,则斜率估计是有偏的,7.模型的评价,经济显著,与,统计显著,经济显著是指自变量的改变对因变量有较大的影响;,统计显著是指有充分证据证明回归系数不为0(一般情况下);,对于参数是否为0的检验:,经济显著性越强,则在统计上越容易显著;,在小样本下,经济显著而统计不显著的情况容易出现;,在大样本下,统计显著而经济不显著的情况容易出现;,7.模型的评价,分析系数的符号、取值是否与理论预期相一致,是评价模型的关键环节。如果出现不一致,首先怀疑模型与数据,如确无问题,再怀疑理论。,对于线性模型,主要观察正负号,。,7.模型的评价,对于,非线性模型,(包括对变量非线性和对参数非线性),情况要比较复杂,有时系数符号以及其他约束条件的预期到底是什么,并非一望可知,,需要根据理论推出,。,7.模型的评价,例1:总成本函数的估计,7.模型的评价,MC要大于0,不能和X轴有交点:,7.模型的评价,例2:洛伦兹曲线的估计,7.模型的评价,a 判定系数R,2,或修正R,2,7.模型的评价,a 判定系数R,2,或修正R,2,7.模型的评价,修正R,2,的主要优点在于:,它为在一个模型中随意增加自变量施加了惩罚,当自由度过小时,该指标会非常小,而R,2,则往往很大。,7.模型的评价,对于拟合优度,没有一个标准来说明,拟合优度小到什么程度,就是不可接受的,对于时序数据而言, R,2,大于0.9也很正常,对于截面数据而言, R,2,等于0.5也不算小,当在自变量数目不同的模型间进行选择时,修正R,2,更适合作为选择标准,7.模型的评价,帽子矩阵(hat matrix)寻找杠杆点,7.模型的评价,帽子矩阵对角线上的点称为杠杆率,在高杠杆率的位置如果出现异常的Y值,将对拟合产生严重的影响。,7.模型的评价,PRESS预测误差平方和,用以判断交叉有效性,Cooks D,反映删除一个观测值对参数估计的影响,8.联合假设检验,不仅可以检验全部回归系数全为0,和某个系数为0,还可以检验某几个系数是否全为0。,8.联合假设检验,不受约束模型,受约束模型,8.联合假设检验,如果p值很小,则可以拒绝原假设,8.联合假设检验,该检验实际检验了两个线性约束,所以称为联合假设检验,类似的思想也可以用于检验各种线性约束(,如果只检验一个约束,不称为联合检验,)如:,8.联合假设检验,例,8.联合假设检验,研究地区差异的影响,设置多个地区变量,如果每个都不显著,可对之进行联合检验,以判断地区因素是否存在影响,9.经济解释,基本含义:,X增加1个单位,Y将平均增加 个单位,9.经济解释,取对数以后的解释,X增加1%,Y将增加 %。,双对数模型应用非常广泛,其优点是:,参数具有弹性含义(可用来估计常弹性),经过对数变换的变量,一般更加符合假设条件,可以缩小取值范围,减少异常值的影响,9.经济解释,9.经济解释,X增加1%,Y将增加 。,9.经济解释,X增加1个单位,Y将增加,9.经济解释,在解释时,要考虑计量单位,9、多元模型的解释,基本解释,的含义是在X,2,不变的情况下, X,1,增加1个单位,Y将平均增加 个单位;,的含义是在X,1,不变的情况下, X,2,增加1个单位,Y将平均增加 个单位,9、多元模型的解释,更加复杂的情况,要通过计算导数研究,9、多元模型的解释,比较不同变量影响程度的方法有二:,计算弹性,标准化数据,9.系数的解释,近似结果,精确结果,
展开阅读全文