违背古典假定的计量经济模型(新)

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第四章违背古典假定的计量经济模型,*概述,*异方差,*自相关,*随机解释变量,*多重共线性,第一节概述,一、古典假定,假定1,、随机项,i,具有零均值,E(,i,)=0 i=1,2, n,假定2,、随机项,i,具有同方差,Var (,i,)=,2,i=1,2, n,假定3,、随机项,i,无,序列相关性,Cov(,i, ,j,)=0 ij i,j= 1,2, n,假定4,、随机项,与解释变量X之间不相关：,Cov(X,j,i,)=0 i=1,2, n,假定5,、,服从正态分布,i,N(0, ,2,) i=1,2, n,假定6,、多元回归模型中解释变量之间不存在多重共线性,rank(X)=k+1 k+1n,根据Gauss-Markov定理可知，古典回归模型的最小二乘估计量（,OLSE,）是线性无偏有效的估计量，而且由于正态性假定，它们服从正态分布的。因此，就有可能得出区间估计式，而且也可以检验真实总体回归系数。,二、古典假定的违背及造成的后果,在实际经济问题中，上述的古典假定不一定都能得到满足。如果这些假定不完全满足，则OLSE的BLUE特性将不复存在。当然，每一个假定不满足所造成的后果是不同的。在本章中，我们将严格考察上述假定，找出如果有一个或多个假定得不到满足时，估计量的性质将会发生什么变化 ,并研究当出现这些情况时，应该如何处理，即古典模型假定违背的经济计量问题。,关于假定1，一般地我们认为假定E(,i,)=0,是合理的。因为随机项是多种因素的综合，而每种因素的影响都“均匀”地微小，它对因变量的影响不是系统的，且正负影响相互抵消，故所有可能取值平均起来为零。即使有轻度的违反，从实践的观点来看可能不会产生严重的后果，因为它可能只影响回归方程的截距项。,关于随机项正态性分布的假定，如果我们的目的仅仅是估计，这种假定并不是绝对必要的。事实上，无论是否是正态分布，OLSE估计式都是BLUE。,剩下的四个假定将在下面的四节中分别加以讨论。,三、广义最小二乘法（GLS）,给定线性回归模型,Y=X,+U,若古典假定完全满足，根据Gauss-Markov定理，其系数的最小二乘估计量,B (X,T,X),1,X,T,Y,具有 BLUE性质。,若古典假定得不到完全满足，特别是假定2（同方差性）和假定3（无序列相关性）得不到满足时，对OLSE的影响更大。,广义最小二乘法,（General Least SquaresGLS）就是为了解决上述问题提出的。其基本思路是：若假定2（同方差性）和假定3（无序列相关性）得不到满足时，我们可以采取适当的变换，使原模型变为以下的形式：,使得其中的重新满足假定2（同方差性）和假定3（无序列相关性）。这样就可以对上式使用OLS估计参数，从而使得上式的OLSE仍然为BLUE。,若因假定2和假定3不满足时，有,其中,I，,是一个n,n的正定对称方阵。,此时可可以觅得一个n,n的非奇异矩阵P，使得：,P,P,T,=I,然后用觅得的P乘以原模型的两边，有：,PY=PX,+PU,记,原模型就转换为：,可证明转换后的模型其随机项满足同方差性和无序列相关性，即可以采用OLS估计参数了。,第二节异方差性,一、异方差的,涵义,二、异方差性的后果,三、异方差的检验,四、异方差的消除方法,五、案例,对于模型,如果出现,即,对于不同的样本点,，,随机误差项的方差不再是常数,，,而互不相同,，,则认为出现了,异方差性,(,Heteroscedasticity,)。,一、异方差的概念,异方差举例,例：截面资料下研究居民家庭的储蓄行为,Y,i,=,0,+,1,X,i,+,u,i,Y,i,:第,i,个家庭的储蓄额,X,i,:第,i,个家庭的可支配收入,高收入家庭：储蓄的差异较大,低收入家庭：储蓄则更有规律性，差异较小,u,i,的方差呈现单调递增型变化,例,以某一行业的企业为样本建立企业生产函数模型,Y,i,=A,L,i,K,i,e,i,被解释变量：产出量,Y,解释变量：资本,K,、劳动力,L,那么：,每个企业所处的,外部环境,对产出量的影响被包含在随机误差项中。,每个企业所处的外部环境对产出量的影响程度不同，造成了随机误差项的异方差性。,这时，随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化，呈现复杂型。,异方差产生的原因：,一模型中省略的解释变量；,二测量的误差；,三截面数据中总体各单位的差异,二、异方差产生的后果,计量经济学模型一旦出现异方差性，如果仍采用OLS估计模型参数，会产生下列不良后果：,1、参数估计量非有效,OLS估计量,仍然具有,无偏性,，但,不具有,有效性,因为在有效性证明中利用了,E(,uu,T,)=,2,I,而且，在大样本情况下，尽管参数估计量,具有,一致性,，但仍然,不具有,渐近有效性,。,2、变量的显著性检验和置信区间失去意义,变量的显著性检验中，,构造了t统计量,t = b,1,/s(b,1,),它是建立在,2,不变而正确估计了参数方差,s(b,1,),的基础之上的。,如果出现了异方差，估计的,s(b1),出现偏误（偏大或偏小），,t,检验失去意义。,其他检验也是如此。,3 、,参数方差的估计量是有偏的,虽然最小二乘法参数的估计量是无偏的，但这些参数方差的估计量、是有偏的。正的偏差会高估参数估计值的真实方差，负的偏差会低估参数估计值的真实方差。,4、模型的预测失效,一方面，由于上述后果，使得模型不具有良好的统计性质；,所以，当模型出现异方差性时，参数OLS估计值的变异程度增大，从而造成对,Y,的预测误差变大，降低预测精度，预测功能失效。,三、异方差性的检验,检验思路：,由于,异方差性,就是相对于不同的解释变量观测值，随机误差项具有不同的方差。那么：,检验异方差性，也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。,(一)图示法,既可利用因变量,Y,与解释变量,X,的散点图,也可利用残差,e,2,-X,的散点图，对随机项,u,的异方差作近似的直观判断。,（1）用X-Y的散点图进行判断,看是否存在明显的,散点扩大,、,缩小,或,复杂型趋势,（即不在一个固定的带型域中）,看是否形成一斜率为零的直线,（二）,戈德菲尔德-匡特(Goldfeld-Quandt)检验,G-Q检验以F检验为基础，适用于大样本、异方差递增或递减的情况。,G-Q检验的思想,:,先排序,将样本去掉中间的c个,然后一分为二，对子样,和子样,分别作回归，然后利用两个子样的残差平方和之比构造统计量进行异方差检验。,H,: 随x递增（或递减）,G-Q检验的步骤：,将,n,对样本观察值(,X,i, Y,i,),按观察值,X,i,的大小排队,将序列中间的,c=n/,4,个观察值除去，并将剩下的观察值划分为较小与较大的相同的两个子样本，每个子样样本容量均为,(,n-c,)/2,对每个子样分别进行OLS回归，并计算各自的残差平方和,分别用RSS,1,与RSS,2,表示解释变量较小与较大的残差平方和(自由度均为(n-c)/2-k);,给定显著性水平,，确定临界值,F,(,v,1,v,2,),，,若,F F,(,v,1,v,2,),，则拒绝同方差性假设，,表明,存在异方差,。,在同方差性假定下，选择如下满足F分布的统计量如果检验递增方差,F=,=,F( k, k ),如果检验递减方差,F=,=,F( k, k ),（三）戈里瑟(,Gleiser),检验,基本思想:,尝试建立|,e,i,|关于解释变量,X,的各种幂次方程：如：,|ei| =,0,+,1,X,i,+v,i,|ei| =,0,+,1,Xi,-1,+v,i,等等,选择关于变量,X,的不同的函数形式，对方程进行估计并进行显著性检验，如果存在某一种函数形式，使得方程显著成立，则说明原模型存在异方差性。,（四）,Spearman,等级（秩）相关检验,这是一种非参数检验。方法为：,1. 利用最小二乘法对模型进行回归，计算残差 e,i,及其绝对值|,e,i,|；,2. 给出,X,的每个,X,i,的位次和|,e,i,|的位次；,3. 计算每个样本点的,X,i,的位次和|,e,i,|的位次的差,d,i,4. 计算,Spearman,等级（秩）相关系数：,5. 对,Spearman,等级（秩）相关系数进行显著性检验。检验统计量为,上述统计量服从自由度为（n2）的t分布。,对应给定显著性水平的临界值，若,t ，则认为不存在异方差，若t,，则认为存在异方差。,(五).,怀特（,White,）检验,怀特检验不需要排序，且适合任何形式的异方差。,怀特检验的基本思想与步骤,（以二元为例）：,然后做如下辅助回归,可以证明，在同方差假设下：,(*),R,2,为(*)的可决系数，,h,为(*)式解释变量的个数，,表示渐近服从某分布。,做如下辅助回归,注意：,辅助回归仍是检验与解释变量可能的组合的显著性，因此，辅助回归方程中还可引入解释变量的更高次方。,如果存在异方差性，则表明确与解释变量的某种组合有显著的相关性，这时往往显示出有,较高的可决系数,以及,某一参数的t检验值较大,。,当然，在多元回归中，由于辅助回归方程中可能有太多解释变量，从而使自由度减少，有时可去掉交叉项。,四、,异方差的消除方法,异方差消除的,基本思路,是将原模型加以“,变换,”，使得“变换”后的模型具有同方差性。但是变换的形式与每个随机项方差的真实值是已知还是未知有关。,（,一）随机项方差,i,2,已知,当,i,2,已知或者可以估计出来的情况，可利用广义的最小二乘法。下面介绍广义最小二乘法的另一种情形:,加权最小二乘法,（Weighted Least Squares, WLS）,乘以模型的两端，得,以一元线性回归模型为例，变换的方法是用,令,把它称为,变换后的随机项.,因为,而,所以,由此可得,所以,中随机项,满足了同方差性的假定。,故可以用常规的,对其进行估计.,参数的OLS估计式按下式要求给出。,即,其中,由此可得模型（）的参数估计式为：,注意,（）,时，随机项,为同方差，OLSE与WLSE一致.,(2). 也可选用其他的权数。,当选择的权数为,时，加权最小二乘法的,实质是用方差的平方根,对原模型进行变换。,加权最小二乘法的基本思想：,加权最小二乘法,是对原模型加权，实质是用方差,i,2,的平方根,i,对原模型进行变换。使之变成一个新的不存在异方差性的模型，然后采用OLS估计其参数。,在采用WLS方法时:,对较小的残差平方,e,i,2,赋予较大的权数,对较大的残差平方,e,i,2,赋予较小的权数,其中,加权最小二乘法的基本思想：,加权最小二乘法,是对原模型加权，实质是用方差,i,2,的平方根,i,对原模型进行变换。使之变成一个新的不存在异方差性的模型，然后采用OLS估计其参数。,注意:,加权最小二乘法的思路很简单，但在具体实践中有关随机项方差的信息极少，我们很难找出真实的随机项方差,i,2,。因此加权最小二乘法仅是,理论上的存在,，实际上往往很难使用它。所以，当,i,2,未知或者利用已知观测数据无法估计的情况下，必须寻求其它的方法。,（二）随机项方差未知,从异方差的意义看，异方差就是随机项在解释变量取不同数值时方差不同。这就意味着异方差,i,2,是解释变量,x,的函数，这种函数形式我们可假设出来。,例如,，如果只与一个解释变量有关，可假设,可以用去除该模型，得,新模型中，存在,即满足同方差性,，可用OLS法估计。,若与m(1mk)个解释变量有关，则异方差形式,可写作,以遍除原模型，得：,记,可以对转换后的模型OLS应用进行参数估计。,这说明转换后的模型具有了同方差性。,如果给定的模型为:,假定1:,此时用X去乘以原模型,可得,(其中, ),则有:,这样转换后的模型具有同方差性。,对转换后的模型应用OLS,即可求得对的,回归方程:,将上式两边同乘，可得原模型的回归方程为：,假定2,此时用去除原模型, 可得,其中,则有:,对转换后的模型即可应用普通最小二乘法进行参数,估计可得：,所以原模型的回归方程为：,注意：,(1).实际应用WLS时，经常用自变量的幂函数的倒数,形式作为权数对原模型进行加权，,但m究竟取何值合适，需要通过估计。,(2). 如果异方差是由省略的解释变量造成的，最好的解,决方法是在模型中加入省略的解释变量。,(3). 对于多元线性回归模型，异方差问题同样存在。用,哪一个自变量构造权数呢？通行的做法是：首先,用 OLS估计样本回归方程，计算出各样本点的绝对,残差；然后分别计算每一个自变量与绝对残差序列的,等级相关系数；选取 Spearman等级相关系数大的自变,量构造权数。权数的构造方法同一元线性回归模型。,五、案例储蓄与收入模型,例,表(见Eviews)是储蓄与收入的样本观测值，试进行异方差性分析,并建立储蓄,y,关于收入,x,的线性回归模型。,（1）根据表中数据，做出X与Y的散点图。方法为：打开Eviews工作文件。点击quick,选Graph，点击ok;在对话框中从Graph Type中选scatterDiagram，点击“ok”。散点图如下：,（一）异方差检验,（,2）根据表中数据，做出残差图,运行Eviews,进行OLS估计；点击Resids，可得拟合与残差图，选View中的,Actual,Fitted,Residual Actual,Fitted,Residual Table功能就得到可用来进行残差分析,表；利用该结果画出X与残差平方的散点图输出结果整理如下：,x,与残差平方的散点图,从上面两图可以看出，在较高的收入水平上储蓄的离散程度增大，表明随机项可能存在,递增型,的异方差。,进一步的统计检验,G-Q,检验,将原始数据按,排成升序，去掉中间的,个观测点数据，得两个容量为,1,的子样本。,对两个子样本分别作,OLS,回归，求各自的残差平方和,RSS,1,和,RSS,2,：,子样本1：,（189.4) (0.015),R,2,=0.787 RSS,1,=144771.5,子样本2：,(709.8) (0.022),R,2,=0.152 RSS,2,=769889.2,计算F统计量：,F= RSS,2,/RSS,1,=769889.2/144771.5=5.3,查表,给定,=,5%,，查得临界值,F,0.05,(9,9)=3.18,判断,F F,0.05,(9,9),否定两组子样方差相同的假设，从而,该总体随机项存在递增异方差性。,(二)异方差的处理,1. 最优权数的确定,以上检验证实了,y,的异方差性的存在。所以需要用加权最小二乘法估计参数。使用WLS首先需要估计权数。我们采用自变量幂函数的倒数权数的形式：,利用SPSS，可以求得幂的最佳取值。打开SPSS，依次点击Analyze,Regression,Weight,Estimate，本例通过运行SPSS得到的取值为2，即权数为：,相当于对原总体回归模型变换为：,从而消除异方差性的影响。,其拟合优度检验、F检验、t检验均高度显著。加权回归的结果比不加权的回归结果有很大的改进,(0.004484) (74.165566),(19.815) (9.985),R,2,= 0.93122 F = 392.64453,2.加权回归,从输出结果看，还原后的加权最小二乘法的估计结果为：,一、,自相关的涵义,二、,自相关产生的后果,三、自相关检验,四、自相关模型的经济计量方法,五、案例,第三节自相关,一、自相关的涵义,如果对于不同的样本点，随机误差项之间不再是不相关的，而是存在某种相关性，则认为出现了,序列相关性,或称,存在自相关,。,对于模型,Y,i,=,0,+,1,X,1i,+,2,X,2i,+,k,X,ki,+,i,i,=1,2, ,n,随机项互不相关的基本假设表现为,Cov(,i,j,)=0,i,j,i,j,=1,2,n,或,称为,一阶序列相关,，或一阶,自回归.,其中：,被称为,自协方差系数,（,coefficient of autocovariance,）或,一阶自回归系数,（,first-order coefficient of autocorrelation,）,i,是满足以下标准的OLS假定的随机干扰项：,如果仅存在,E(,i,i+1,),0,i,=1,2, ,n,一阶自回归,往往可写成如下形式,：,i,=,i,-1,+,i,-1,1,由于序列相关性经常出现在以时间序列为样本的模型中，因此，本节将用下标,t,代表,i,。,自相关产生的原因,（一）被解释变量的自相关,（二）模型省略了自相关的解释变量,（三）随机项本身存在自相关,（四）回归模型的数学形式不正确,(五) 经济变量的惯性作用.,计量经济学模型一旦出现序列相关性，如果仍采用OLS法估计模型参数，会产生下列不良后果：,二、自相关产生的后果,1、参数估计量非有效,因为，在有效性证明中利用了,E(UU,T,)=,2,I,即同方差性和不相关性的假定条件。,而且，在大样本情况下，参数估计量虽然具有一致性，但仍然不具有渐近有效性。,2、变量的显著性检验失去意义,在变量的显著性检验中，统计量是建立在参数方差正确估计基础之上的，这只有当随机误差项具有同方差性和互相独立性时才能成立。,其他检验也是如此。,3、,模型的预测失效,区间预测与参数估计量的方差有关，在方差有偏误的情况下，使得预测估计不准确，预测精度降低。,所以，,当模型出现序列相关性时，它的预测功能失效。,然后，通过分析这些“近似估计量”之间的相关性，以判断随机误差项是否具有序列相关性。,序列相关性,检验方法有多种，但基本思路相同：,基本思路:,三、自相关的检验,（一）图示法,（二）杜宾-瓦森（Durbin-Watson）检验法,D-W检验是杜宾（J.Durbin）和,瓦森(G.S. Watson)于1951年提出的一种检验序列自相关的方法，,该方法的假定条件是,：,（,1）解释变量,X,非随机；,（2）随机误差项,i,为一阶自回归形式：,i,=,i-1,+,i,（3）回归模型中不应含有滞后因变量作为解释变量，即不应出现下列形式：,Y,i,=,0,+,1,X,1i,+,k,X,ki,+Y,i-1,+,i,（4）大样本,回归含有截距项,该统计量,的分布与出现在给定样本中的X值有复杂的关系，因此其,精确的分布很难得到,。,但是,，,他们,成功地导出了临界值的下限,d,L,和上限,d,U,，且这些上下限只与样本的容量,n,和解释变量的个数,k,有关，而与解释变量,X,的取值无关。,杜宾和瓦森针对原,假设：,H,0,:,=0,，,即不存在一阶自回归，构如下造统计量：,D.W. 统计量:,d=,当,D.W.,值在,2,左右时，模型不存在一阶自相关。,证明：,展开,D.W.,统计量：,(*),如果存在,完全一阶正相关,，即,=1,，则,D.W. 0,完全一阶负相关,，即,= -1, 则,D.W. 4,完全不相关,，即,=0,，则,D.W.2,这里，,为一阶自回归模型,i,=,i,-1,+,i,的参数估计。,D.W检验步骤:,（1）计算DW值,（2）给定,，由,n,和,k,的大小查DW分布表，得临界值d,L,和d,U,（3）比较、判断,若 0D.W.d,L,存在正自相关,d,L,D.W.d,U,不能确定,d,U,D.W.4d,U,无自相关,4d,U,D.W.4 d,L,不能确定,4,d,L,D.W.4,存在负自相关,0 d,L,d,U,2 4-d,U,4-d,L,4,正相关,不能确定,无自相关,不能确定,负相关,如果模型被检验证明存在序列相关性，则需要分析原因,若是由省略某些解释变量造成的,则应找出省略的变量,将它包含在模型中;如果是由于错误地确定模型的数学形式引起,则应该修正其数学形式.排除以上原因后仍然存在的自相关可以发展新的方法估计模型。,最常用的方法是,广义最小二乘法,（,GLS: Generalized least squares,）和,广义差分法,(,Generalized,Difference),。,四、自相关的经济计量方法,1、广义最小二乘法,对于模型,Y,=,X,+,如果存在序列相关，同时存在异方差，即有,是一对称正定矩阵，存在一可逆矩阵,D,，,使得,=DD,T,变换原模型：,D,-1,Y,=,D,-1,X,+,D,-1,即,Y,*,=,X,*,+,*,(*),(*)式的OLS估计：,这就是原模型的,广义最小二乘估计量(GLS estimators),，,是无偏的、有效的估计量。,该模型具有同方差性和随机误差项互相独立性,：,如何得到矩阵,？,对,的形式进行特殊设定后，才可得到其估计值。,如设定随机扰动项为,一阶序列相关形式,i,=,i,-1,+,i,则,1、广义差分法,广义差分法,是将原模型变换为满足OLS法的差分模型，再进行OLS估计。,如果原模型为,可以将原模型变换为:,令,原模型可变为:,其中,这种变换叫,广义差分变换,。变换后的模型称为,广义差分模型。,其中,将原回归模型进行广义差分变换得广义差分模型，对广义差分模型应用普通最小二乘法，这种方法称为,广义差分法,。,可取,补全数据,时，上式变为：,即,其中,该种变换叫做,一阶差分变换,，变换后的模型,叫做,一阶差分模型,。这种模型的一个重要特征是没有常数项。易得：,随机误差项相关系数的估计,应用,广义差分法,，必须已知随机误差项的相关系数,。,实际上，人们并不知道它们的具体数值，所以必须首先对它们进行估计。,常用的估计方法有：,科克伦,-,奥科特,（,Cochrane-,Orcutt,）,迭代法,。,杜宾,（,durbin,）,两步法,2,、,杜宾,（,durbin,）,两步法,该方法仍是先估计,，再对差分模型进行估计,第一步,，变换差分模型为下列形式,进行,OLS估计，得Y,j,（,j,=t-1),前的系数,估计值,令,则,(2). 用估计值对原模型进行差分变换,对差分模型,应用OLS方法，可得、的估计值、,从而,还可以用其它的方法求的估计值，如：,存在两个问题。其一，所得参数估计值的精确度依赖于,的精确度；其二，差分模型的随机项有可能仍存在自,相关。,、,科克伦-奥科特迭代法,。,以一元线性模型为例：,首先,，采用OLS法估计原模型,Y,i,=,0,+,1,X,i,+,i,得到的,的“,近似估计值,”，并以之作为观测值使用OLS法估计下式,求得的估计值，记作：,利用,进行广义差分变换得广义差分模型,对原模型,其中,对模型应用普通最小二乘法进行估计，得到参数的估,计值并对模型中的随机项是否存在自相关进行检验。,如果检验得出随机项无自相关，迭代就此结束。,否则，就重复前面的步骤，将模型的估计值还原为原,模型的参数估计值，由此计算的第二次估计值，,然后根据，计算的第二次估计值，记作,关于迭代的次数，可根据具体的问题来定。,一般是事先给出一个精度，当相邻两次,1,2, ,L,的估计值之差小于这一精度时，迭代终止。,实践中，有时只要迭代两次，就可得到较满意的结果。两次迭代过程也被称为,科克伦-奥科特两步法,。,利用对原模型再进行差分变换，这就是第二次,迭代,同样可以进行第三次、第四次迭代,，直至差分,模型中的随机项消除自相关性，就停止迭代过程。,五、案例,某国进口贸易额,IM,与国民生产总值,GDP,的数据见表。试建立进口贸易额,IM,与国民生产总值,GDP,的线性回归模型。,资料见下页,进口贸易额与国民生产总值的数据,序号,IM,(,y,),GDP,(,x,),序号,IM,(,y,),GDP,(,x,),1,3748,21777,11,5669,28134,2,3711,22418,12,5628,29091,3,4010,22308,13,5736,29450,4,4004,23319,14,5964,30705,5,4151,24180,15,6501,32372,6,4569,24893,16,6549,33152,7,4582,25310,17,6705,33764,8,4697,25799,18,7104,34411,9,4753,25886,19,7609,35429,10,5062,26868,20,8100,36200,单位：百万英镑,应用最小二乘法得到如下回归方程：,s(b)=（248.65） (0.087),R,2,= 0.983,d,=0.9337,给定,= 0.05，查显著性水平为0.05，观测值个数为20及解释变量个数为1的,D-W,分布表，得到临界值,d,L,=1.20 d,U,=1.41,因为,d,d,L,，所以随机项,u,存在一阶正自相关,自相关的处理,杜宾二步法, 估计一阶自相关系数,作,e,t,关于,e,t-,1,的线性回归，得到,可得 = 0.53,令 =0.53，做以下变换,对,关于的线性模型做最小二乘估计，得,R,2,=0.949,d,=1.87,因为,d,接近2，已消除自相关，故得,0,、,1,的估计值分别为：,b1=0.296,b0=1369.36/(1 0.53)= 2966.7,由此可得要估计的原回归方程为,第四节,随机解释变量问题,一,、估计量的渐近性质,二、,随机解释变量模型估计特性,三、,随机解释变量模型的经济计量方法,四、,案例,基本假设:解释变量,X,1,X,2,X,k,是确定性变量。,如果存在一个或多个随机变量作为解释变量，则称原模型出现,随机解释变量问题,。,对于模型,1. 随机解释变量与随机误差项独立(Independence),2.,随机解释变量与随机误差项同期无关(contemporaneously uncorrelated)，但异期相关。,3. 随机解释变量与随机误差项同期相关(contemporaneously correlated),。,在许多经济现象中，自变量的非随机性假定有时是不符合实际的。因为，,许多经济变量是不能用控制的方法进行观测的，所以作为模型中的解释变量其取值就不可能是确定的，而是随机的。,又由于随机项包含了模型中略去的解释变量，而略去的解释变量同模型中保留的解释变量往往是相关的。,自回归模型中，因变量作为解释变量也必定是随机变量了。因此，我们必须对模型中的解释变量为随机变量且与随机项相关的情形进行讨论。,一、估计量的渐近性质,线性,、,无偏性,和,有效性,是评价一个估计量优劣的标准。在有的情况下，小样本的估计量不具有某种统计特性，但随着样本容量的增大，估计量逐渐有了这种统计性质，此时称之为估计量的渐近统计性质。,1. 渐近无偏性,2. 渐近一致性,为样本容量为n时参数的估计量.,下面,记,1. 渐近无偏性,如果满足,则称为的渐近无偏估计量。,随着样本容量的逐步增大，估计量与真实值的系统,偏差越来越小，逐渐趋于0。即:通过增加样本容量，,可以改善参数估计的精度。,2. 渐近一致性,如果满足,简记为,则称为的一致估计量。,表示概率极限,可以证明为的一致估计量，当且仅当,一致估计量具有渐近无偏性的概率为1，且在真实值,附近离散的程度随样本容量的增大逐渐趋于0的概率为1。,在大样本的条件下，一致估计量具有很高的精度,二、随机解释变量模型估计特性,以一元线性回归模型为例说明。设给定的模型为,采用离差形式即为,式中,，，,不管自变量是否是随机变量，对上式应用,OLS,，参数的估计量都是,我们分下列三种情况进行讨论,1.,x,是非随机变量，x与u自然不相关,最小二乘估计量是无偏的。,2.,x是随机变量，但x与u不相关,最小二乘估计量仍然是无偏的。,3. x是随机变量，且u与x线性相关,最小二乘估计量是有偏的。这时，又分两种情况：,（1）在大样本下，如果x与u渐近不相关，,对,1,估计式两边取概率极限,有,说明最小二乘估计量具有,一致性,。也就是说，如果 x是随机变量，且x与u不独立，虽然小样本的无偏性得不到满足，但在样本容量增加时，OLSE会逐渐逼近真实的总体参数，即在样本足够大时，OLSE仍然是有意义的。,（,2） x与u不存在渐近不相关关系，即使在大样本条件下，仍然存在,由此可以看出，b,1,是,1,的非一致估计量。这时OLS失效，必须引进其他方法估计参数和进行统计推论推论。,模型中出现随机解释变量且与随机误差项相关时，OLS估计量是有偏的。,如果随机解释变量与随机误差项异期相关，则可以通过增大样本容量的办法来得到一致的估计量；,但如果是同期相关，即使增大样本容量也无济于事。这时，最常用的估计方法是,工具变量法,（,Instrument variables,）,。,三、随机解释变量模型的经济计量方法,1、工具变量的选取,工具变量,：在模型估计过程中被作为工具使用，以替代模型中与随机误差项相关的随机解释变量。,选择为工具变量的变量必须满足以下条件,：,（1）与所替代的随机解释变量高度相关；,（2）与随机误差项不相关；,（3）与模型中其它解释变量不相关，以避免出现多重共线性。,2、工具变量的应用,以一元回归模型的离差形式为例说明如下：,用OLS估计模型，相当于用,x*,i,去乘模型两边、对,i,求和、再略去,x*,i,u,i,项后得到,正规方程,：,(*),解得,如果选择,Z,为,X,的,工具变量,，那么在上述估计过程可改为:,利用,E(,z,i,u,i,)=0,，即,这种求模型参数估计量的方法称为,工具变量法,(instrumental variable method,)，相应的估计量称为,工具变量法估计量,（,instrumental variable (IV) estimator,）。,可得,1、在小样本下，工具变量法估计量仍是有偏的,。,注意：,2、工具变量并没有替代模型中的解释变量,，只是在估计过程中作为“工具”被使用。,上述工具变量法估计过程可等价地分解成下面的两步,OLS,回归：,第一步,，用,OLS,法进行,X,关于工具变量,Z,的回归：,1、在小样本下，工具变量法估计量仍是有偏的,。,注意：,2、工具变量并没有替代模型中的解释变量,，只是在估计过程中作为“工具”被使用。,上述工具变量法估计过程可等价地分解成下面的两步,OLS,回归：,第一步,，用,OLS,法进行,X,关于工具变量,Z,的回归：,容易验证仍有:,因此，,工具变量法仍是Y对X的回归，而不是对Z的回归,。,3、,如果模型中有两个以上的随机解释变量与随机误差项相关，就必须找到两个以上的工具变量,。但是，一旦工具变量选定，它们在估计过程被使用的次序不影响估计结果,4、OLS可以看作工具变量法的一种特殊情况。,、要找到与随机扰动项不相关而又与随机解释变量相关的工具变量并不是一件很容易的事,可以用,X,t-1,作为原解释变量,X,t,的工具变量。,4、OLS可以看作工具变量法的一种特殊情况。,5、如果1个随机解释变量可以找到多个互相独立的工具变量，人们希望充分利用这些工具变量的信息，就形成了,广义矩方法,（,Generalized Method of Moments, GMM,）,。,在GMM中，矩条件大于待估参数的数量，于是如何求解成为它的核心问题。,工具变量法是,GMM,的一个特例。,6、要找到与随机扰动项不相关而又与随机解释变量相关的工具变量并不是一件很容易的事,可以用,X,t-1,作为原解释变量,X,t,的工具变量。,四、案例,下页表中x代表国内生产总值，y代表消费，z代表投资。用表中所提供的某地的三项指标的资料说明工具变量的使用方法。,国内生产总值、消费、投资数据,年,份,x,y,z,年份,x,y,Z,1,7164.3,4694.5,2468.6,9,25863.6,15952.1,9636.0,2,8792.1,5773.0,3386.0,10,34500.6,20182.1,12998.0,3,10132.8,6542.0,3846.0,11,47110.9,27216.2,19260.6,4,11784.0,7451.2,4322.0,12,58510.5,33635.0,23877.0,5,14704.0,9360.1,5495.0,13,68330.4,40003.9,26867.2,6,16466.0,10556.5,6095.0,14,74894.3,43579.4,28457.6,7,18319.5,11365.2,6444.0,15,79853.3,46405.9,30396.0,8,21280.4,13145.9,515.0,单位:亿元,设消费y与国内生产总值x之间具有线性关系，可建立如下模型：,由于国内生产总值x与随机项u相关，而投资z与随机项u无关，与国内生产总值x高度相关，故可用z作为国内生产总值x的工具变量。参数估计如下：,= 0.568051,876.010088,则样本回归模型为：,一、多重共线性的涵义,二、多重共线性引起的后果,三、多重共线性的检验,四、消除多重共线性的方法,五、案例,第五节,多重共线性,一、多重共线性的涵义,对于模型,Y,i,=,0,+,1,X,1i,+,2,X,2i,+,k,X,ki,+u,i,i=1,2,n,其基本假设之一是解释变量是互相独立的。,如果某两个或多个解释变量之间出现了相关性,则称为,多重共线性(,Multicollinearity,),。,如果存在,c,1,X,1,i,+,c,2,X,2,i,+,c,k,X,ki,=0,i,=1,2,n,其中:,c,i,不全为0，则称为解释变量间存在,完全共线性,（perfect multicollinearity）,。,如果存在,c,1,X,1i,+c,2,X,2i,+c,k,X,ki,+v,i,=0,i=1,2,n,其中,c,i,不全为0，,v,i,为随机误差项，则称为,近似共线性,（approximate multicollinearity）或,存在不完全线性相关,、,接近线性关系,。,在矩阵表示的线性回归模型,Y=X,+u,中，,完全共线性,指：,rank,(X),k,+1,，即,中，至少有一列向量可由其他列向量（不包括第一列）线性表示。,如：X,2,=,X,1,，则X,2,对Y的作用可由X,1,代替。,注意：,完全共线性的情况并不多见，一般出现的是在一定程度上的共线性，即近似共线性。,综上所述，,多重共线性,就是指解释变量之间存在完全的线性关系或接近的线性关系.,多重共线性产生的原因,一般地，产生多重共线性的主要原因有以下三个方面：,（,1）经济变量相关的共同趋势,时间序列样本：,经济,繁荣时期,，各基本经济变量（收入、消费、投资、价格）都趋于增长；,衰退时期,，又同时趋于下降。,横截面数据,：,生产函数中,，,资本投入与劳动力投入往往出现高度相关情况，大企业二者都大，小企业都小。,多重共线性是实际经济现象中一种普遍存在的现象,存在的原因主要是经济活动中变量之间复杂的相互联系,（2）滞后变量的引入,在经济计量模型中，往往需要引入滞后经济变量来反映真实的经济关系。,例如,，消费=f(当期收入, 前期收入）,显然，两期收入间有较强的线性相关性。,（3）,样本资料的限制,一般经验,：,时间序列数据,样本：简单线性模型，往往存在多重共线性。,截面数据,样本：问题不那么严重，但多重共线性仍然是存在的。,由于完全符合理论模型所要求的样本数据较难收集，特定样本可能存在某种程度的多重共线性,二、多重共线性的后果,1、完全共线性下参数估计量(OLSE)不确定,如果存在,完全共线性,，则,(X,T,X),-1,不存在，无法得到参数的估计量。,的OLS估计量为：,例：,对二元回归模型,如果两个解释变量完全相关，如,x,2,=,x,1,，则,这时，只能确定综合参数,1,+,2,的估计值.,2、近似共线性下,OLS,估计值不精确，也不稳定,由于,|X,T,X|,0,，引起,(X,T,X),-1,主对角线元素较大，使参数估计值的方差增大，,OLS参数估计量非有效。,近似共线性下，可以得到OLS参数估计量，但参数估计量,方差,的表达式为,、变量的显著性检验与预测失去意义,存在多重共线性时,参数估计值的方差与标准差变大,容易使通过样本计算的,t,值小于临界值，,误导作出参数为,0,的推断,可能将重要的解释变量排除在模型之外,注意：,除非是完全共线性，多重共线性并不意味着任何基本假设的违背；因此，即使出现较高程度的多重共线性，OLS估计量仍具有线性性等良好的统计性质。,问题在于,，即使OLS法仍是最好的估计方法，它却不是“完美的”，尤其是在统计推断上无法给出真正有用的信息。,变大的方差容易使区间预测的“区间”变大，使预测失去意义。,4.难以区分每个解释变量的单独影响,多重共线性检验的任务,是：,（1）检验多重共线性是否存在；,（2）估计多重共线性的范围，即判断哪些变量之间存在共线性。,多重共线性表现为解释变量之间具有相关关系，所以,用于多重共线性的检验方法主要是统计方法。,三、多重共线性的检验,（一）直观判断法,1. 散点图法。,对含有两个解释变量的模型，利用解释变量样本观测值的散点图来考察二者是否存在显著的线性关系。,2. 相关系数法。,计算解释变量之间的简单相关系数，若两个解释变量之间的相关系数接近于1，则可以认为模型存在多重共线性。,3. “经典”判断法。,多重共线性的“经典”特征是R,2,较高，但参数t检验值显著的不多，如果一个回归分析结果中存在这一特征，则应考虑其是否存在多重共线性的问题。,注意：前两种方法只适用于两个自变量的情况,（二）自变量之间的复决定系数和方差扩大因子,设解释变量为,k,个，即,x,1,，,x,2,， ,x,k,。我们分别以其中的一个对其它所有的解释变量进行回归，得,k,个回归方程,对每个回归方程求其决定系数分别为,在这些决定系数中寻其最大而且接近于1者，比如说,R,j,2,最大，则可以判定解释变量x,j,与其它解释变量中的一个或多个相关程度高，因此就使得回归模型出现高度多重共线性。,计量经济学中在检验多重共线性时，往往称（,1-,R,j,2,）为自变量,x,j,的容忍度,（Tolerance），其倒数为,方差扩大因子,（Variance Inflation Factor,简记为VIF），即,经验表明，当,VIF,j,10时，自变量,x,j,与其它自变量之间的多重共线性就非常大了，以至于足以影响到OLSE。,例二元回归模型,OLSE的方差为：,x,1,与x,2,的样本相关系数 :,所以,同理,可见，一个自变量与其它自变量的复决定系数越大，,即多重共线性越严重，会造成回归系数的OLSE,的方,差越大,.,所以称,为“方差扩大因子”,它可以用来反映多重共线性的严重程度。,具体可进一步对上述回归方程作F检验：,式中：,R,j,2,为第,j,个解释变量对其他解释变量的回归方程的决定系数,构造如下,F,统计量,在模型中排除某一个解释变量,X,j,，估计模型,；,如果拟合优度与包含,X,j,时十分接近，则说明,X,j,与其它解释变量之间存在共线性。,另一等价的检验,是:,若存在较强的共线性，则,R,j,2,较大且接近于1，这时（,1- R,j,2,）较小，从而,F,j,的值较大。,因此，给定显著性水平,，计算,F,值，并与相应的临界值比较，来判定是否存在相关性。,（三）利用不包括某一解释变量所构成的回归方程之决定系数,设多元线性回归模型为以下函数形式,：,设其样本决定系数为,R,2,。假定依次缺一个解释变量进行回归，则可得到,k,个回归方程。对应的样本决定系数分别为：,其中,R,j,2,为缺少解释变量,x,j,的回归方程之决定系数,在这些决定系数中选取一个最大者比如说,R,j,2,，则,R,j,2,与,R,2,的差为最小，如果解释变量,x,j,从模型中去掉，对样本决定系数的影响不大，由此说明了解释变量,x,j,对因变量的解释能力已由其它解释变量代替了，从而表明,x,j,可能是其它解释变量的线性组合，因此可以判定解释变量中包含,x,j,引起了多重共线性。,（四）法勒格劳伯（FarrarGlauber）检验,FarrarGlauber,提出的检验是三种检验的结合。第一种检验是检验，它检验多元回归模型中所有解释变量之间存在共线性及共线性的程度。第二种检验是,F,检验，用来确定哪些解释变量是多重共线的。第三种检验是,t,检验，用来找出造成解释变量多重共线性原因的是哪些变量。,四、消除多重共线性的方法,模型中存在多重共线性，是不是一定不好呢？这要视模型的具体用途而定。如果模型只是用来进行,预测,，只要多重样本决定系数（,R,2, ）足够大即可，无需消除多重共线性。但如果模型是用来进行,结构分析和政策评价,，由于多重共线性影响到每个自变量系数估计的正确性和有效性，所以应设法消除多重共线性的影响，确保模型的可用性。,（一）增加样本观测值,如果多重共线性是由样本引起的（例如测量误差或偶然的样本），但解释变量的,总体不存在多重共线性,，则可以通过收集更多的观测值增加样本容量，避免或减弱多重共线性。对于时间序列资料就是增大观测次数，对于截面数据资料就是增加观测对象，或者把时间序列资料与截面数据资料结合起来使用。当解释变量总体存在多重共线性时，增加样本容量也无助于减轻多重共线的程度。,以二元线性模型为例可以看出.,（二）删去不重要的解释变量,对待严重的多重共线性问题，一个最简单的解决办法就是,删去,那些,产生多重共线性、对因变量影响不大,且人们认为,不重要,的解释变量，使模型中剩下那些对因变量起重要作用的解释变量，然后对仅包含重要解释变量的模型应用普通最小二乘法。,但应注意:,由于把删去的解释变量对因变量的影响归入随机项中，有可能使随机项不满足零均值的假设，这时所得的参数估计值可能是有偏的，即产生,确定性偏倚,。,（三）利用“先验”信息,先验信息既包括从经济理论也包括从实际统计资料中获得的,解释变量之间关系的信息,。如果我们研究的回归模型存在多重共线性，而线性相关的解释变量之间的关系可由事前信息得到。则只要把事前知道的关系包含进回归模型中，多重共线性就会消失。,举例1 柯布道格拉斯生产函数,其中，y为产出，K为资本，L为劳动力，A,、,将该模型转化为对数形式,资金和劳动力之间是高度相关的，所以lnK,、lnL,之间也是高度相关的，对数模型存在着多重共线性,先验信息,根据西方经济理论，一般假设规模报酬不变，即,+,=1,、,为参数,利用,+=1将对数模型转化为：,式中，,y/L,为人均产出，,K/L,为人均资本量。上式即为人均单位产出对人均资本量的一元回归模型，多元回归存在的多重共线性就被消除了。,举例消费函数,设消费函数为：,式中，,y,为消费指出，,x,1,为收入，,x,2,为财富,从收入与财富的关系来看，是高度相关的,先验信息,根据大量的统计数据可以总结出，,2,大约是,1,的 2/3,利用此信息将原模型化为：,令,上式即化为：,就变为一元回归模型，多重共线性就消除了。,（四）变换模型的形式,有时作为解释变量的某些经济变量之间出现了高度相关，但当我们的研究目的是为了预测，并不需要区分这些相关的解释变量单独对因变量的影响时，我们可以根据问题的需要对原模型加以变形，使新的模型不再出现多重共线性。,例如，某产品的销售量y取决于其出厂价格,x,1,、市场价格,x,2,和市场总供应量,x,3,，设定模型为:,通常,x,1,、,x,2,、,x,3,是高度相关的，如果研究的目的主要是为了预测某厂该产品销售量，则可以用相对价格,x,1,/,x,2,代替,x,1,、,x,2,对,y,的影响，采用 ln(,x,1,/,x,2,)为解释变量，建立如下对数回归模型:,从而克服了,x,1,与,x,2,的相关性。,（五）逐步回归法,首先计算被解释变量对每一个解释变量的回归方程，这些回归方程叫做,基本回归方程,。对每一个基本回归方程进行统计检验，并根据经济理论分析这些回归方程，从中选出最合适的基本回归方程，然后再逐一增加其它的解释变量，重新再作回归。根据这个新加的解释变量的,边际贡献,（样本决定系数的增加量）和标准差，并考察对每个回归系数的影响，作如下的分析判断：,第一,，如果新加进的解释变量,改进了,R,2,，并且其它回归系数在统计上仍是显著的，那么，就可以认为新加进去的解释变量是有用的，作为模型中的解释变量予以保留。,第三,、如果新加进的解释变量,不仅改进了,R,2,，,并且,主要是显

展开阅读全文

违背古典假定的计量经济模型(新)

最新文档