资源描述
1,第八章多重共线性问题,一、问题的种类和原因二、多重共线性的危害三、多重共线性的测定四、多重共线性的克服和处理,2,8.1问题的种类和原因,1、完全多重共线性一个自变量刚好是其他自变量的线性组合如果存在c1X1i+c2X2i+ckXki=0i=1,2,n其中:ci不全为0,则称为解释变量间存在完全共线性(perfectmulticollinearity)。矩阵X至少有一列向量可由其他列向量(不包括第一列)线性表出,它是非满秩的。模型设定问题识别问题,3,2、近似多重共线性如果存在c1X1i+c2X2i+ckXki+vi=0i=1,2,n其中ci不全为0,vi为随机误差项,则称为近似共线性(approximatemulticollinearity)或交互相关(intercorrelated)。主要是数据问题,也有模型设定问题,8.1问题的种类和原因,4,3、实际经济问题中的多重共线性一般地,产生多重共线性的主要原因有以下三个方面:(1)经济变量相关的共同趋势时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。,8.1问题的种类和原因,5,(2)滞后变量的引入在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。(3)样本资料的限制由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。一般经验:时间序列数据样本:简单线性模型,往往存在多重共线性。截面数据样本:问题不那么严重,但多重共线性仍然是存在的。,8.1问题的种类和原因,6,8.2(近似)多重共线性的危害,1、普通最小二乘法估计量的方差和标准差变大,即精确度下降;2、置信区间变宽;3、t值不显著;4、R平方值较高,但t值并不都显著;5、OLS估计量及其标准差对数据的微小变化非常敏感,即它们趋于不稳定;,7,以二元线性模型y=1x1+2x2+为例:,恰为X1与X2的线性相关系数的平方r2,即X1对X2回归的拟合优度。,由于r21,故1/(1-r2)1,8,多重共线性使参数估计值的方差增大,1/(1-r2)为方差扩大因子(VarianceInflationFactor,VIF),当完全不共线时,r2=0,当近似共线时,0r215.19,故认上述粮食生产的总体线性关系显著成立。但X4、X5的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性。,(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14),27,2、检验简单相关系数,发现:X1与X4间存在高度相关性。,列出X1,X2,X3,X4,X5的相关系数矩阵:,28,3、找出最简单的回归形式,可见,应选第1个式子为初始的回归模型。,分别作Y与X1,X2,X4,X5间的回归:,(25.58)(11.49)R2=0.8919F=132.1DW=1.56,(-0.49)(1.14)R2=0.075F=1.30DW=0.12,(17.45)(6.68)R2=0.7527F=48.7DW=1.11,(-1.04)(2.66)R2=0.3064F=7.07DW=0.36,29,4、逐步回归,将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。,30,回归方程以Y=f(X1,X2,X3)为最优:,5、结论,
展开阅读全文