资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第七章 多重共线性,一、多重共线性问题,基本假定:,1,、,u,零均值。所有的,u,i,均值为,0,,,E,(,u,i,),=0,。,2,、,u,同方差。,Var,(,u,i,),=,2,,,i=1,,,2,,,,,n,如果假定,6,不成立,即在解释变量,X,1,,,X,2,,,,,X,P,中,存在线性关系。解释变量间存在确定的线系关系时,存在不全为零的常数,这种关系称为完全多重共线性,实际上更多的情况是,解释变量间有不完全的线性关系:即存在不全为零的数,:,其中,v,i,为随机项。我们把这种关系称为不完全多重共线性。由于经济变量自身的性质,多重共线性或强或弱,普遍存在的。,假定,1,0,,,多重共线:,解释变量之间存在完全的线性关系或近似的线性关系。解释变量存在完全的线性关系叫完全多重共线;解释变量之间存在近似的线性关系叫不完全多重共线。,多重共线性产生的原因:,1,、经济变量之间的内在联系引起多重共线,2,、经济变量在时间上有同方向变化的趋势,3,、模型中引入滞后变量引起多重共线。,二、多重共线性的后果,完全多重共线性:,以两个解释变量的回归模型为例,假定回归模型为,:,根据最小平方和原则,并求解正规方程组,可得到:,如果采用,OLS,估计,则有:,如果,X,1,与,X,2,存在完全共线性,即 则,:,因此,存在完全共线性时,不能利用,OLS,估计参数,参数的方差变为无限大。,不完全多重共线性,假定,X,1,,,X,2,间存在不完全多重共线性,以离差形式表示为:,其中,v,i,为随机项。则,显然,当解释变量,X,1,、,X,2,之间的相关系数,r,12,的绝对值越大,共线性程度就越高,参数估计值的方差就越大,越不准确,且随着相关系数的增大,方差以更大的幅度增加。,(Variance Inflation Factor),多重共线性的后果:,1,、参数估计值的方差增大,估计量的精度大大降低。影响预测结果(准确度和置信区间)。,2,、参数估计值的标准差增大,使的,t,检验值变小,增大了接受,H,0,,,舍弃对因变量有显著影响的变量。,3,、尽管,t,检验不显著,但是,R,2,仍可能非常高。,4,、,OLS,估计量对观测值的轻微变化相当敏感。,三、多重共线的检验,1,、利用解释变量之间的拟合优度(判定系数)检验法,每次以一个解释变量对余下的,P-1,个解释变量做回归,即建立,P,个回归方程:,2,、不含某个解释变量,X,j,的拟合优度(判定系数)检验法,将,Y,对全部解释变量,X,1,,,X,2,,,,,X,P,做回归,得回归方程,3,、,R,2,、,F,、,t,检验结果进行综合分析检验法,无多重共线性:,R,2,、,F,、,t,检验均显著,存在多重共线性:,R,2,、,F,检验很显著,但,t,检验不全显著(一般是不显著的,X,与,显著的,X,存在共线性。),4,、方差膨胀因子(,VIF,)检验法,5,、相关系数检验法,四、多重共线性的修正,如果发现解释变量之间存在高度得多重共线性,就必须消除这种多重共线性的影响,保证模型的正确性和估计的有效性。有以下几种解决方法。,1,、除去不重要的变量,把回归模型中引起多重共线性,而对因变量的影响不大的变量。但是变量的剔除可能导致模型的设定偏误。,已知,X,1,和,X,2,之间高度共线。根据先验信息,确定,2,=2,1,,,带入模型后可得:,例如:,C-D,生产函数 ,,K,与,L,高度相关。已知规模收益不变,则,+=1,。,生产汉数的双对数模型可变为:,2,、利用先验信息,假定对回归模型:,可以对这一新回归方程进行估计。,3,、变换模型的形式,如果作为解释变量的某些经济变量间出现高度相关,而进行回归分析的目的是为了预测,不是研究单个经济变量对因变量的影响时,可以根据实际问题,改变模型模型的形式。,4,、增加样本容量,如果多重共线性是由样本引起,增加样本容量可以减少多重共线性的程度。以二元回归方程为例,根据第二节的结果,参数估计值的方差为:,当样本容量增大时,增大,方差将减小,,可以提高参数估计的精度。,5,、横截面数据与时间序列数据并用,如果时间序列数据中,解释变量间存在高度相关,可以先使用横截面数据估计出存在高度相关解释变量中的一个或多个,然后再在时间序列数据中剔除这些变量,在消除多重共线性影响下估计因变量与剩余变量间的回归式。,例如,为了估计汽车需求的价格弹性和收入弹性,得到销售量、平均价格、消费者收入的时间序列数据。设定回归式:,新的回归式中消除了多重共线性的影响。,由于在时间序列数据中价格,P,t,、,收入,I,t,一般都具有高度共线的趋势。因此,直接估计上面的回归式将存在问题。由于在同一式点上,价格与收入的相关程度不高,可以先利用截面数据估计出收入弹性 ,再利用这一估计结果修改原回归式,变为:,6,、利用时间序列数据的差分或离差进行估计,如果时间序列数据中,解释变量间存在高度相关,那么这些变量的差分之间不一定相关。因此利用差分进行回归能降低多重共线性的程度。,7,、逐步分析估计法,先对设定的总体回归模型用普通最小二乘法进行估计,并检验总体回归模型的效果;,若经检验后总体回归方程显著,再计算解释变量之间的相关系数,分析多重共线的程度;,若多重共线相当严重,则进一步将被解释变量对每一个解释变量做回归,并根据经济理论和实际经验及它们的判定系数,从中选择一个最合理的作为基本回归方程式;,在上述这个最合理的基本回归方程式中,逐步插入新的解释变量进行回归,并对其结果进行检验,直到变量插入完为止。,五、案例分析,
展开阅读全文