新计量经济学-多重共线性.ppt

上传人:za****8 文档编号:16591134 上传时间:2020-10-17 格式:PPT 页数:38 大小:267.50KB
返回 下载 相关 举报
新计量经济学-多重共线性.ppt_第1页
第1页 / 共38页
新计量经济学-多重共线性.ppt_第2页
第2页 / 共38页
新计量经济学-多重共线性.ppt_第3页
第3页 / 共38页
点击查看更多>>
资源描述
回顾: 什么函数可以描述产量与其总成本关系 ? 如果要计算两个变量之间的弹性应用什 么函数形式? 如何计算科技进步贡献率?用什么函数 ?如何计算? 第六章 多 重 共 线 性 在实践中,关于线性回归的基本假定不能全部满足, 出现基本假定违背。主要包括: ( 1)随机项序列不是同方差,而是异方差的; ( 2)随机项序列相关,即存在自相关; ( 3)解释变量与随机项相关; ( 4)解释变量之间线性相关,存在多重共线性。 多重共线性是对第( 4)个基本假定的违反,导致 OLS估计量失去优良性。 第一节 多重共线性的概念 第二节 多重共线性的后果 第三节 多重共线性的检验 第四节 多重共线性的修正方法 第五节 案例 一、多重共线性的定义 多重共线性是指解释变量 Xi 之间存在完全的或 近似的线性关系 。 在线性模型中 , 解释变量的 观察值距阵 X(包括常数项 )其秩等于模型中的解释 变量的个数加一 rank(X)= k + 1 如果此假定不成立 , 则称解释变量 Xi之间存在 多重共线性 ,至少有一列向量可由其它列向量线性 表示 。 如 X2 = X1 X2与 X1的相关系数为 1, 解释变量 X2 对因变量 Y 的 作用可由 X1 完全替代 。 第一节 多重共线性的概念 1、 经济变量之间的相互依存关系 如替代品价格之间会存在多重共线性 2、 时间趋势影响 经济繁荣和经济衰退 时间序列样本建立线性模型时 , 往往存在多重共线 。 3、 样本资料方面的原因 样本资料推算数据往往存在多重共线性 4、 滞后变量的引入 同一变量的前后期之值可能是高度线性相关的 5、 虚拟变量设置不合理 6、 变量设置过多 二、产生多重共线性的原因 多重共性的原因 原因 变量设定: 虚变量设计错误、 滞后变量引入 设置过多变量 变量自身存在问题: 总体数据:时间趋势相同、 变量存在内在关系; 样本数据:样本不具代表性 一 、 完全多重共线性的影响 1、 无法估计模型参数 yi = b1 x1+ b2 x2 第二节 多重共线性的后果 0 0 )()( )()()( )()( )()( 22 2 22 2 2 2 2 2 22 2 22 1 21 2121 2 21 2 2 2 1 212 2 21 1 xxx xyxxyx b xx XXXX xxxx xxyxxyx b 得 设存在完全多重共线性,与如果 BXYUXBY YX - X)( X B BX)XY)( X 1 ( 对上述方程两边同乘观察值距阵 X 的转置距阵 X 一、完全多重共线性的影响 完全共线性 : XX =0,(XX)-1不存在, R23=1; 例: 0 1206020 603010 20104 841 631 421 211 XX X 2、 模型参数估计方差无穷大 22 2 222 2 2 2 2 2 1 21 2121 2 2 21 2 2 2 1 2 2 1 )()( )( ) ( )()( )( ) ( xx xu bV a r xx XXXX u xxxx x bV a r 得 设存在完全多重共线性,与如果 当存在多重共线性时,利用 OLS 无法估计参数, 即参数估计值是不确定的,且估计值的方差无穷大。 1、 可以估计参数 , 但参数估计不稳定 2、 参数估计量的方差增大 , 使参数估计量 的精度降低 。 不能正确判断各解释变量 对被解释变量的贡献 。 3、 由于参数估计量的方差和标准差增大 , 在对参数进行显著性检验性 t 检验时 , 增大了接受零假设的可能性 。 4、 若作区间 预测也将降低预测的 精度 。 二 、 不完全多重共线性的影响 1、 简单相关系数法 解释变量组的相关矩阵中解释变量间的简单相 关系数的绝对值甚至大于被解释变量与解释变量 之间的简单相关系数的绝对值 cor X1 X2 几何度量 第三节 多重共线性的检验 22 iyix iyixr X2 X1 X3 ( x, y ) 2、 综合统计检验法 若 R2,F 均很大 ,而各 t值均偏小 ,则可以认 为存在多重共线性 3、 用 F 检验 确定哪些解释变量是多重共线的 对每个解释变量 Xj 作它与其它解释变量的 回归 , 并计算样本决定系数 R2 若 F Fa(临界值, 则认为 Xj与 X1, , Xj-1 , Xj+1 , , Xk, 多重共线显著 4、 用 t 检验 来找出哪些解释变量是造成多 重共线的原因 ( 对自变量两两回归 ) 若 T Ta,即 Xj与 Xi是引起多重共线的原因。 2 第四节 多重共线性的修正方法 一 、 删除不重要的变量 1、 将证实为多重共线性原因的变量删除 2、 由实际经济分析确定变量的相对重要性 , 删除不 太重要的变量 3、 变量删除不当 , 会产生模型设计偏倚 二 、 改变解释变量形式 1、 采用相对数量 如对于需求函数 Q = b0 + b1Y + b2P0 + b3P1 + u 商品价格 P0 和替代商品价格 P1 可能高度线性相 关 , 可将模型改为如下形式: Q = a0 + a1Y + a3(P0 /P1) + u 2、 采用增量型变量 如对于消费函数 Ct = b0 + b1Yt + b2Yt-1 + u 本期收入 Yt 和上期收入 Yt-1 可能高度线性相关 , 可将模型改为如下形式: Ct = a0 + a1Yt + a2 Yt + u Yt = Yt Yt-1 3、 改变解释变量样本信息 ( 1) 改变样本 ( 2) 增加样本容量 样本容量 n 增加 , x2 增大 , var(b1 )的值会 降低 , 抵消方差增大的影响 。 三 、 利用已知信息进行参数约束修正 如对于 C D 生产函数的对数形式 lnY = lnA + a lnL+ b lnk + u 资金和劳动之间可能高度线性相关 , 如假定规 模报酬不变 , 施加约束条件 a + b = 1可将模型改 为如下形式: ln(Y/K) = lnA + a ln (L /K) + u b = 1 a 四、 逐步回归法 逐步回归法分为逐个剔除法与逐个引入法 “逐步” 指的是在使用回归分析方法建立模型时 ,一次只能剔除 (减少) 一个解释变量或者一次只 能引入 (增加) 一个解释变量。进行一次剔除或引 入称为“一步”,这样逐步的进行下去,直到最 后得到模型达到“最优” 模型中无不显著解 释变量。 引入的准则: 引入解释变量后使模型的拟合优度 (及 F)显著增加的,应当引入;否则不引入。 剔除的准则: 剔除解释变量后使模型的拟合优度 (及 F)不显著的减少,应当剔除;否则不剔除。 1、逐步剔除法 先将一切可能的解释变量全部引入模型 再依据各个解释变量的显著性 每次从模型中剔除一个不显著的解释变量 从不显著的解释变量中,剔除 t最小(对应 的概率 P最大)的解释变量 直至留在模型中的全部解释变量影响显著 ,得到最简洁的模型(模型中不包含不显 著的解释变量)。 逐步剔除与多重共线性 如果剔除一个解释变量,使模型拟合优度( 及 F)显著地减少,那么这个剔除是不应当的 。但证明了该剔除变量与留在模型中的解释变 量不构成多重共线。它对解释变量 Y的贡献不 能由已在模型中的解释变量线性表出。 如果剔除一个解释变量,使模型拟合优度( 及 F)不显著地减少,那么这个剔除是应当的 。而且证明了它与留在模型中的解释变量构成 多重共线。它可由这些变量线性表出,所以剔 除不至于引起拟合优度的减少。 2、逐个引入法 如果引入解释变量,使模型拟合优度显著 地增加,那么这个引入是应当的,而且它与 模型中已有的解释变量不构成多重共线。 如果引入解释变量,使模型拟合优度不显 著地增加,那么这个引入是不应当的,而且 它与已在型中的解释变量构成多重共线,它 可由这些解释变量线性表出。也就是说,它 对被解释变量的贡献已由这些共线变量提供 。所以,引入它并不能提高拟合优度。 第五节 案例一 中国粮食生产函数 根据理论和经验分析 , 影响粮食生产 ( Y) 的 主要因素有: 农业化肥施用量 ( X1) ;粮食播种面积 (X2) 成灾面积 (X3); 农业机械总动力 (X4); 农业劳动力 (X5) 已知中国粮食生产的相关数据,建立中国粮食 生产函数: Y=b0+b1 X1 +b2 X2 +b3 X3 +b4 X4 +b4 X5 + 表 4. 3 . 3 中国粮食生产与相关投入资料 年份 粮食产量 Y ( 万吨 ) 农业化肥施 用量 1 X (万公斤) 粮食播种面 积 2 X (千公顷) 受灾面积 3 X (公顷) 农业机械总 动力 4 X (万千瓦) 农业劳动 力 5 X (万人) 1983 38728 1659.8 114047 162 09. 3 18022 316 45. 1 1984 40731 1739.8 112884 152 64. 0 19497 316 85. 0 1985 37911 1775.8 108845 227 05. 3 20913 303 51. 5 1986 39151 1930.6 110933 236 56. 0 22950 304 67. 0 1987 40208 1999.3 111268 203 92. 7 24836 308 70. 0 1988 39408 2141.5 110123 239 44. 7 26575 314 55. 7 1989 40755 2357.1 112205 244 48. 7 28067 324 40. 5 1990 44624 2590.3 113466 178 19. 3 28708 333 30. 4 1991 43529 2806.1 112314 278 14. 0 29389 341 86. 3 1992 44264 2930.2 110560 258 94. 7 30308 340 37. 0 1993 45649 3151.9 110509 231 33. 0 31817 332 58. 2 1994 44510 3317.9 109544 313 83. 0 33802 326 90. 3 1995 46662 3593.7 110060 222 67. 0 36118 323 34. 5 1996 50454 3827.9 112548 212 33. 0 38547 322 60. 4 1997 49417 3980.7 112912 303 09. 0 42016 324 34. 9 1998 51230 4083.7 113787 251 81. 0 45208 326 26. 4 1999 50839 4124.3 113161 267 31. 0 48996 329 11. 8 2000 46218 4146.4 108463 343 74. 0 52574 327 97. 5 1、用 OLS法估计上述模型 : R2接近于 1; 给定 a=5%,得 F临界值 F0.05(5,12)=3.11 F=638.4 15.19, 故认为上述粮食生产的总体线性关系显著成立。 但 X4 、 X5 的参数未通过 t检验,且符号不正确 ,故 解释变量间可能存在多重共线性 。 54321 0 2 8.00 9 8.01 6 6.04 2 1.02 1 3.644.1 2 8 1 6 XXXXXY (-0.91) (8.39)* (3.32) *(-2.81) *(-1.45) (-0.14) 75.1 12.2 10.0 05.0 t t 2、检验简单相关系数 发现: X1与 X4间存在高度相关性 。 列出 X1, X2, X3, X4, X5的相关系数矩阵: X1 X2 X3 X4 X5 X1 1.00 0.01 0.64 0.96 0.55 X2 0.01 1.00 -0.45 -0.04 0.18 X3 0.64 -0.45 1.00 0.69 0.36 X4 0.96 -0.04 0.69 1.00 0.45 X5 0.55 0.18 0.36 0.45 1.00 3、找出最简单的回归形式 可见,应选 第 1个式子 为初始的回归模型。 1576.464.3 0 86 7 XY (25.58) (11.49) R2=0.8919 F=132.1 DW=1.56 2699.018.3 3 8 2 1 XY (-0.49) (1.14) R2=0.075 F=1.30 DW=0.12 43 8 0.00.3 1 9 1 9 XY (17.45) (6.68) R2=0.7527 F=48.7 DW=1.11 5240.219.2 8 2 5 9 XY (-1.04) (2.66) R2=0.3064 F=7.07 DW=0.36 4、逐步回归 将其他解释变量分别导入上述初始回归模型 , 寻 找最佳回归方程 。 C X1 X2 X3 X4 X5 2R DW Y= f ( X 1 ) 30868 4.23 0. 8852 1.56 t 值 25 . 58 1 1.49 Y = f ( X 1 , X2 ) - 438 71 4.65 0.67 0.9 558 2.01 t 值 - 3.02 18.47 5.16 Y = f ( X 1 , X2 , X3 ) - 1 197 8 5.26 0.41 - 0.19 0.9 752 1.53 t 值 0.85 19.6 3.35 - 3.57 Y = f ( X 1 , X2 , X 3, X 4 ) - 130 56 6.17 0.42 - 0.17 - 0.09 0.977 5 1.80 t 值 - 0.97 9.61 3.57 - 3.09 - 1.55 Y = f ( X 1 , X3 , X 4, X 5 ) - 126 90 5.22 0.40 - 0.2 0 0.07 0.9 798 1.55 t 值 - 0.87 17.85 3.02 - 3.47 0.37 4、逐步回归 将其他解释变量分别导入上述初始回归模型 , 寻 找最佳回归方程 。 C X1 X2 X3 X4 X5 2R DW Y= f ( X 1 ) 30868 4.23 0. 8852 1.56 t 值 25 . 58 1 1.49 Y = f ( X 1 , X2 ) - 438 71 4.65 0.67 0.9 558 2.01 t 值 - 3.02 18.47 5.16 Y = f ( X 1 , X2 , X3 ) - 1 197 8 5.26 0.41 - 0.19 0.9 752 1.53 t 值 0.85 19.6 3.35 - 3.57 Y = f ( X 1 , X2 , X 3, X 4 ) - 130 56 6.17 0.42 - 0.17 - 0.09 0.977 5 1.80 t 值 - 0.97 9.61 3.57 - 3.09 - 1.55 Y = f ( X 1 , X3 , X 4, X 5 ) - 126 90 5.22 0.40 - 0.2 0 0.07 0.9 798 1.55 t 值 - 0.87 17.85 3.02 - 3.47 0.37 4、逐步回归 将其他解释变量分别导入上述初始回归模型 , 寻 找最佳回归方程 。 C X1 X2 X3 X4 X5 2R DW Y= f ( X 1 ) 30868 4.23 0. 8852 1.56 t 值 25 . 58 1 1.49 Y = f ( X 1 , X2 ) - 438 71 4.65 0.67 0.9 558 2.01 t 值 - 3.02 18.47 5.16 Y = f ( X 1 , X2 , X3 ) - 1 197 8 5.26 0.41 - 0.19 0.9 752 1.53 t 值 0.85 19.6 3.35 - 3.57 Y = f ( X 1 , X2 , X 3, X 4 ) - 130 56 6.17 0.42 - 0.17 - 0.09 0.977 5 1.80 t 值 - 0.97 9.61 3.57 - 3.09 - 1.55 Y = f ( X 1 , X3 , X 4, X 5 ) - 126 90 5.22 0.40 - 0.2 0 0.07 0.9 798 1.55 t 值 - 0.87 17.85 3.02 - 3.47 0.37 4、逐步回归 将其他解释变量分别导入上述初始回归模型 , 寻 找最佳回归方程 。 C X1 X2 X3 X4 X5 2R DW Y= f ( X 1 ) 30868 4.23 0. 8852 1.56 t 值 25 . 58 1 1.49 Y = f ( X 1 , X2 ) - 438 71 4.65 0.67 0.9 558 2.01 t 值 - 3.02 18.47 5.16 Y = f ( X 1 , X2 , X3 ) - 1 197 8 5.26 0.41 - 0.19 0.9 752 1.53 t 值 0.85 19.6 3.35 - 3.57 Y = f ( X 1 , X2 , X 3, X 4 ) - 130 56 6.17 0.42 - 0.17 - 0.09 0.977 5 1.80 t 值 - 0.97 9.61 3.57 - 3.09 - 1.55 Y = f ( X 1 , X3 , X 4, X 5 ) - 126 90 5.22 0.40 - 0.2 0 0.07 0.9 798 1.55 t 值 - 0.87 17.85 3.02 - 3.47 0.37 4、逐步回归 将其他解释变量分别导入上述初始回归模型 , 寻 找最佳回归方程 。 C X1 X2 X3 X4 X5 2R DW Y= f ( X 1 ) 30868 4.23 0. 8852 1.56 t 值 25 . 58 1 1.49 Y = f ( X 1 , X2 ) - 438 71 4.65 0.67 0.9 558 2.01 t 值 - 3.02 18.47 5.16 Y = f ( X 1 , X2 , X3 ) - 1 197 8 5.26 0.41 - 0.19 0.9 752 1.53 t 值 0.85 19.6 3.35 - 3.57 Y = f ( X 1 , X2 , X 3, X 4 ) - 130 56 6.17 0.42 - 0.17 - 0.09 0.977 5 1.80 t 值 - 0.97 9.61 3.57 - 3.09 - 1.55 Y = f ( X 1 , X3 , X 4, X 5 ) - 126 90 5.22 0.40 - 0.2 0 0.07 0.9 798 1.55 t 值 - 0.87 17.85 3.02 - 3.47 0.37 回归方程以 Y=f(X1, X2, X3)为最优: 5、结论 321 19.041.026.51 1 9 7 8 XXXY 第五节 案例二 家庭消费支出生产函数 样本 消费支出 Y 收入 X 1 家庭财产 X 2 1 70 80 810 2 65 100 1009 3 90 120 1273 4 95 140 1425 5 110 160 1633 6 115 180 1876 7 120 200 2050 8 140 220 2201 9 155 240 2435 10 150 260 2686 11 80 90 1400 12 130 250 1700 家庭消费支出 、 收入和财产数据 用前 10组数据建立模型: 1.92953.0 2 963.0 2 )5.0()12.1()66.3( 041.0925.0767.24 * 21 FRR XXY 对前 10组数据运用逐步回归的思路 建立模型: 87.202957.0 2 962.0 2 )24.14()81.3( 51.045.24 * 1 FRR XY 29.177951.0 2 957.0 2 )32.13()56.3( 50.04.24 * 2 FRR XY Dependent Variable: Y Method: Least Squares Date: 05/04/08 Time: 22:40 Sample: 1 12 Included observations: 12 Variable Coefficient Std. Error t-Statistic Prob. C 24.01065 6.021813 3.987279 0.0032 X1 0.267934 0.066106 4.05307 0.0029 X2 0.023675 0.007521 3.147728 0.0118 R-squared 0.964828 Mean dependent var 110 Adjusted R-squared 0.957012 S.D. dependent var 30.45115 S.E. of regression 6.313609 Akaike info criterion 6.73561 Sum squared resid 358.7549 Schwarz criterion 6.856836 Log likelihood -37.4137 F-statistic 123.4425 扩大样本数据重新建立模型: 扩大样本数据重新建立模型: 4.123957.0 2 965.0 2 )15.3()05.4()98.3( 023.0268.001.24 * 21 FRR XXY 作业: 如何判断一个方程是否存在共线性? 用什么办法可以消除共线性?
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!