潘省初计量经济学——第五章课件

资源描述

1潘省初计量经济学第五章234第一节误设定采用OLS法估计模型时，实际上有一个隐含的假设，即模型是正确设定的。这包括两方面的含义：函数形式正确和解释变量选择正确。在实践中，这样一个假设或许从来也不现实。我们可能犯下列三个方面的错误：l 选择错误的函数形式选择错误的函数形式l遗漏有关的解释变量遗漏有关的解释变量l包括无关的解释变量包括无关的解释变量从而造成所谓的“误设定”问题。5一.选择错误的函数形式这类错误中比较常见的是将非线性关系作为线性关系处理。函数形式选择错误，所建立的模型当然无法反映所研究现象的实际情况，后果是显而易见的。因此，我们应当根据实际问题，选择正确的函数形式。6 我们在前面各章的介绍中采用的函数形式以线性函数为主，上一章还介绍了因变量和解释变量都采用对数的双对数模型，下面再介绍几种比较常见的函数形式的模型，为读者的回归实践多提供几种选择方案。这几种模型是：半对数模型双曲函数模型多项式回归模型71.半对数模型半对数模型半对数模型指的是因变量和解释变量中一个为对数形式而另一个为线性的模型。因变量为对数形式的称为对对数数-线线性性模模型型(log-lin model)。解释变量为对数形式的称为线线性性-对对数数模模型型(lin-log model)。我们先介绍前者，其形式如下：对数-线性模型中，斜率的含义是Y的百分比变动，即解释变量X变动一个单位引起的因变量Y的百分比变动。这是因为，利用微分可以得出：8 这表明，斜率度量的是解释变量X的单位变动所引起的因变量Y的相对变动。将此相对变动乘以100，就得到Y的百分比变动，或者说得到Y的增长率。由于对数-线性模型中斜率系数的这一含义，因而也叫增增长长模模型型(growth model)。增长模型通常用于测度所关心的经济变量（如GDP）的增长率。例如，我们可以通过估计下面的半对数模型得到一国GDP的年增长率的估计值，这里t为时间趋势变量。9线性-对数模型的形式如下：与前面类似，我们可用微分得到因此这表明上式表明，Y的绝对变动量等于乘以X的相对变动量。因此,线性-对数模型通常用于研究解释变量每变动1%引起的因变量的绝对变动量是多少这类问题。102.双曲函数模型双曲函数模型双曲函数模型的形式为：不难看出，这是一个仅存在变量非线性的模型，很容易用重新定义的方法将其线性化。双曲函数模型的特点是，当X趋向无穷时，Y趋向，反映到图上，就是当X趋向无穷时，Y将无限靠近其渐近线（Y=）。双曲函数模型通常用于描述著名的恩格尔曲线和菲利普斯曲线。113.多项式回归模型多项式回归模型多项式回归模型通常用于描述生产成本函数，其一般形式为：其中Y表示总成本，X表示产出，P为多项式的阶数，一般不超过四阶。多项式回归模型中，解释变量X以不同幂次出现在方程的右端。这类模型也仅存在变量非线性，因而很容易线性化，可用OLS法估计模型。12二.遗漏有关的解释变量模型中遗漏了对因变量有显著影响的解释变量的后果是：将使模型参数估计量不再是无偏估计量。三.包括无关的解释变量模型中包括无关的解释变量，参数估计量仍无偏，但会增大估计量的方差，即增大误差。注有关上述两点结论的说明请参见教科书P112-113。13四.选择解释变量的四条原则在模型设定中的一般原则是尽量不漏掉有关的解释变量。因为估计量有偏比增大误差更严重。但如果方差很大，得到的无偏估计量也就没有多大意义了，因此也不宜随意乱增加解释变量。在回归实践中，有时要对某个变量是否应该作为解释变量包括在方程中作出准确的判断确实不是一件容易的事，因为目前还没有行之有效的方法可供使用。尽管如此，还是有一些有助于我们进行判断的原则可用，它们是：14选择解释变量的四条原则选择解释变量的四条原则 1.理论：从理论上看，该变量是否应该作为解释变量包括在方程中？2.t检验：该变量的系数估计值是否显著？3.：该变量加进方程中后，是否增大？4.偏倚：该变量加进方程中后，其它变量的系数估计值是否显著变化？如果对四个问题的回答都是肯定的，则该变量应该包括在方程中；如果对四个问题的回答都是“否”，则该变量是无关变量，可以安全地从方程中删掉它。这是两种容易决策的情形。15 但根据以上原则判断并不总是这么简单。在很多情况下，这四项准则的判断结果会出现不一致。例如，有可能某个变量加进方程后，增大，但该变量不显著。在选择变量的问题上，应当坚定不移地根据理论而不是满意的拟合结果来作决定，对于是否将一个变量包括在回归方程中的问题，理论是最重要的判断准则。如果不这样做，产生不正确结果的风险很大。在这种情况下，作出正确判断不是一件容易的事，处理的原则是将理论准则放在第一位。16*五、模型的选择五、模型的选择上一段讨论了某个解释变量应否包括在模型中的几条原则。实践中，要解决的一个问题是如何从大量的潜在解释变量的集合中选择一个最合适的子集，以得到一个正确设定的模型。上个世纪六十年代后相当一段时间，人们使用逐步回归法来解决解释变量的选择问题。这种由计算机机械挑选变量的做法如今已不流行了。目前比较通行的做法是从少量精心设定的备选模型中选择一个。计量经济学家就此提出了很多基于统计学的选择标准，我们这里讨论其中几种，如表51所示。17令RSSj表示第j个模型（有kj个解释变量）的残差平方和，并定义为第j个模型的的估计值。我们用表示包含全部k个解释变量的模型的估计值。18表51 选择回归模型的准则准则计算公式 19 1.准则准则希尔（Theil）的准则基于如下假设：所考虑的模型中有一个是正确模型。对于正确模型，对于不正确模型，。因此，选择最小的模型一般就能选出正确模型。由于最小化与最大化是一回事，我们习惯上称该准则为最大准则。这个准则的主要问题是，一个包括正确模型的所有解释变量但同时也包括一些无关变量的模型也会给出，在这种情况下，我们所选择的其实并非正确模型。当备选模型包含大量无关变量时，选出正确模型的概率较低。20 2.基于预测的均方误差最小的三个准则基于预测的均方误差最小的三个准则希尔的准则是基于回归的标准误差最小，下列三个准则则是基于预测的均方误差（MSE）最小。这三个准则是：马娄斯（Mallows）的准则霍金（Hocking）的准则阿美米亚（Amemiya）的PC准则假设正确的方程有k个解释变量，我们考虑的方程有个解释变量，问题是如何选择k1以及具体的k1个解释变量的集合。在上述三个预测准则中，这是通过使的均方误差达到最小实现的，其中是Y的未来值，而是预测值。21上述三个准则都是基于预测的均方误差最小，但在估计预测的均方误差时采用的假设有所不同，因而形成各自的计算公式，孰优孰劣，并无定论，在实践中可根据所用软件提供的输出结果选用其中一个作为模型选择的准则。具体做法是比较备选的几个模型的、或PC值，选其中最小的即可。在三个预测准则的情况下，我们感兴趣的是改善预测的MSE，只要能改善，可以去掉某些变量，即便是正确模型中包括它们也在所不惜。22 3.赤池信息准则（赤池信息准则（AIC）赤池信息准则（AkaikesInformationCriterion,AIC）是一个更一般的准则，它可以应用于任何一个可用极大似然法估计的模型。对于我们这里的应用，AIC的计算公式为与赤池信息准则类似的还有施瓦茨信息准则（Schwarzinformationcriterion，SIC）：上述两个准则与前述准则一样，可用于模型选择，其值也是越小越好。23六.检验误设定的RESET方法前面给出了选择解释变量的四条原则。可是，有时这些原则不能提供足够的信息使研究人员确信其设定是最恰当的，在这种情况下，可考虑使用一些更正规的检验方法来比较不同估计方程的性质。这类方法相当多，这里就不一一列出，仅介绍拉姆齐（J.B.Ramsey）的回归设定误差检验法（RESET法,Regression Specification Error Test）。24 RESET检验法的思路 RESET检验法的思路是在要检验的回归方程中加进等项作为解释变量，然后看结果是否有显著改善。如有，则可判断原方程存在遗漏有关变量的问题或其它的误设定问题。直观地看，这些添加的项是任何可能的遗漏变量或错误的函数形式的替身，如果这些替身能够通过F检验,表明它们改善了原方程的拟合状况，则我们有理由说原方程存在误设定问题。另一方面,等项形成多项式函数形式，多项式是一种强有力的曲线拟合装置，因而如果存在（函数形式方面的）误设定，则用这样一个装置可以很好地代表它们。25RESET检验法的步骤拉姆齐RESET检验的具体步骤是：(1)用OLS法估计要检验的方程，得到 (2)由上一步得到的值（i=1,2,n），计算，然后用OLS法估计：(3)用F检验比较两个方程的拟合情况（类似于上一章中联合假设检验采用的方法），如果两方程总体拟合情况显著不同，则我们得出原方程可能存在误设定的结论。使用的检验统计量为：26其中：RSSM为第一步中回归（有约束回归）的残差平方和，RSS为第二步中回归（无约束回归）的残差平方和，M为约束条件的个数，这里是M=3。应该指出的是，拉姆齐RESET检验仅能检验误设定的存在，而不能告诉我们到底是哪一类的误设定，或者说，不能告诉我们正确的模型是什么。但该方法毕竟能给出模型误设定的信号，以便我们去进一步查找问题。另一方面，如果模型设定正确，RESET检验使我们能够排除误设定的存在，转而去查找其它方面的问题。27例:误设定检验为了检验第三章例3.7的模型设定是否正确，采用RESET方法，用例3.7中回归方程中得到的拟合值，计算，然后估计加上这一项作为解释变量的方程，EViews结果如下：28表5-2RESET检验RamseyRESETTest:F-statistic44.48853Prob.F(1,15)0.0000TestEquation:DependentVariable:CtMethod:LeastSquaresSample:19922009VariableCoefficientStd.Errort-StatisticProb.C653.995113.2042549.529150.0000Yt0.3626640.03429610.574670.0000FITTED2-0.0006730.000101-6.6699720.0000R-squared0.993746Meandependentvar1172.337AdjustedR-squared0.992912S.D.dependentvar243.5071S.E.ofregression20.50091Akaikeinfocriterion9.029827Sumsquaredresid6304.310Schwarzcriterion9.178223Loglikelihood-78.26845Hannan-Quinncriter.9.050289F-statistic1191.711Durbin-Watsonstat0.993814Prob(F-statistic)0.00000029根据表5-2，辅助回归结果如下（括号内数字为标准误差）：例3.7方程的RSS=25002.28。有了上述结果，计算检验统计量：查F表，5%显著性水平下的临界值，由于F=44.48864.28，故拒绝无误设定的原假设。30事实上，我们可以直接从EViews输出结果（表5.2）第二行中看到这一F值，以及与之相应的P值，即得到44.4885这个F值的概率非常小，小数点后4位还是0，当然小于0.05，因而拒绝无误设定的原假设。考虑到这里模型的误设定可能是漏掉了有关的解释变量，我们把价格指数作为解释变量加入方程，重新估计模型，得（与第四章例4.1相同）：31对上述模型重新进行RESET检验，结果如下（为节约篇幅，仅列出F检验统计值行）：表5-3RESET检验根据表5-3可知，检验统计量F=3.753，对应的P值为0.073，大于0.05，故接受无误设定的原假设。F-statistic3.752960Prob.F(1,14)0.073232第二节多重共线性应用OLS法的一个假设条件是；矩阵X的秩=K+110作为存在严重多重共线性的标准,特别在解释变量多的情形应当如此。需要指出的是，所有VIF值都低，并不能排除严重多重共线性的存在，这与使用相关系数矩阵检验的情况相似。40四解决多重共线性的方法思路：加入额外信息。具体方法有以下几种：增加数据对模型施加某些约束条件删除一个或几个共线变量将模型适当变形1增加数据多重共线性实质上是数据问题，因此，增加数据就有可能消除或减缓多重共线性，具体方法包括增加观测值、利用不同的数据集或采用新的样本。41例：需求函数Yt=1+2Xt+3Pt+ut 在时间序列数据中，收入（X）和价格（P）往往是高度相关的，用时间序列数据估计往往会产生多重共线性。然而，在横截面数据中，则不存在这个问题，因为某个特定时点P为常数。如果取一横截面样本（如从5000个家庭取得的数据），则可用来估计 Yi=1+2Xi+ui 然后将得到的估计值作为一个约束条件（2=）施加于时间序列数据的回归计算中，即估计 Yt-Xt =1+3Pt+ut，得到，。422对模型施加某些约束条件在存在多重共线性的模型中，依据经济理论施加某些约束条件，将减小系数估计量的方差，如在CobbDouglas生产函数中加进规模效益不变的约束，可解决资本和劳动的高度相关而引起的多重共线性问题。3删除一个或几个共线变量这样做，实际上就是利用给定数据估计较少的参数，从而降低对观测信息的需求，以解决多重共线性问题。删除哪些变量，可根据假设检验的结果确定。应注意的是，这种做法可能会使得到的系数估计量产生偏倚，因而需要权衡利弊。434将模型适当变形例1某商品的需求函数为：其中：Q=需求量，X=收入，P=该商品的价格，P*=替代商品的价格在实际数据中，P和P*往往呈同方向变动，它们之间高度相关，模型存在多重共线性。如果我们仅要求在知道两种商品的相对价格变动时，对需求量进行预测，则可将需求函数变为：就可以解决多重共线性问题。44例2有滞后变量的情形 Yt=1+2Xt+3 Xt-1+ut 一般而言，Xt和Xt 1往往高度相关，将模型变换为：Yt=1+2（Xt-Xt 1）+3Xt-1+ut 其中3=3+2 经验表明：Xt和Xt 1的相关程度要远远小于和Xt和Xt 1的相关程度，因而这种变换有可能消除或减缓多重共线性。455主成分法可将共线变量组合在一起形成一个综合指数(变量)，用它来代表这组变量。构造综合指数的最常用方法是主成分法。主成分法的计算相当复杂，这里不做介绍。主成分的特点是，各主成分之间互不相关，并且，用很少几个主成分就可以解释全部X变量的绝大部分方差，因而在出现多重共线性时，可以用主成分替代原有解释变量进行回归计算，然后再将所得到的系数还原成原模型中的参数估计值。46五.处理多重共线性问题的原则1.多重共线性是普遍存在的，轻微的多重共线性问题可不采取措施。3.如果模型仅用于预测，则只要拟合好，可不处理多重共线性问题，存在多重共线性的模型用于预测时，往往不影响预测结果。2.严重的多重共线性问题，一般可根据经验或通过分析回归结果发现。如影响系数的符号，重要的解释变量t 值很低。要根据不同情况采取必要措施。47（1）E(ut)=0,t=1,2,n.扰动项均值为0 （2）Cov(ui,uj)=E(uiuj)=0,ij.扰动项相互独立（3）Var(ut)=E(ut)=2,t=1,2,n.常数方差（4）ut N(0,2).正态性对于（1），我们可论证其合理性。而第（4）条，也没有多大问题。大样本即可假定扰动项服从正态分布。而对于（2），（3）两条，则无法论证其合理性。实际问题中，这两条不成立的情况比比皆是。下面将讨论它们不成立的情况，即异方差性和自相关的情形。第三节异方差性回顾我们应用OLS法所需假设条件，其中大部分是有关扰动项的统计假设，它们是：48一异方差性及其后果1定义若Var(ut)=常数的假设不成立，即 Var(ut)=常数，则称扰动项具有异方差性。2 什么情况下可能发生异方差性问题？解释变量取值变动幅度大时，常数方差的假设往往难以成立。异方差性主要发生在横截面数据的情况，时间序列问题中一般不会发生，除非时间跨度过大。49例：Yi=+Xi+ui 其中：Y=指定规模和组成的家庭每月消费支出 X=这样的家庭的每月可支配收入设X的N个观测值取自一个家庭可支配收入的横截面样本。某些家庭接近于勉强维持生存的水平，另一些家庭则有很高的收入。不难设想，低收入家庭的消费支出不大可能离开他们的均值E(Y)过远，太高无法支持，太低则消费将处于维持生存的水平之下。因此，低收入家庭消费支出额的波动应当较小，因而扰动项具有较小的方差。而高收入家庭则没有这种限制，其扰动项可能有大得多的方差。这就意味着异方差性。50 3异方差性的后果（1）参数估计量不再具有最小方差的性质异方差性不破坏OLS估计量的无偏性，但不再是有效的。事实上，异方差性的存在导致OLS估计量既不是有效的，也不具有渐近有效性。这有两层含义。首先，小样本性质BLUE的丧失意味着存在着另外的线性无偏估计量，其抽样方差小于OLS估计量的方差。其次，渐近有效性这一大样本性质的丧失，意味着存在着另外的一致估计量，其抽样分布当样本容量增大时，向被估计的回归参数收缩的速度要比OLS估计量快。51（2）系数的显著性检验更为严重的是，在异方差性的情况下，矩阵主对角元素不再是OLS估计量方差的无偏估计量，从而导致系数的置信区间和假设检验结果不可信赖。例如在双变量模型中，如果倾向于低估的真实方差，则置信区间可能要比实际的窄，给我们一个错误信息，好象得到的点预测值很精确。同样，在异方差性的情况下，假设检验也会以错误的结果将我们带入歧途。例如，被检验的系数实际上不是统计上显著的，而由于矩阵的主对角元素低估了OLS估计量的相应方差，检验结果却表明其显著。52二异方差性的检验异方差性后果的严重性意味着我们在实践中必须了解是否存在异方差性。常用的检验方法有：斯皮尔曼等级相关检验法(Spearman Rank Relation test)戈德弗尔德匡特检验法(Goldfeld Quandt test)格里瑟检验法（Glesjer test）帕克检验法（Park test）怀特检验法 (Whites General Heteroscedasticity test)布鲁奇帕根检验法(Breusch-Pagan Test)531.戈德弗尔德匡特检验法基本思路：假定随Yt的数值大小变动。检验步骤：（1）将数据分为三组：小Yt值组，中Yt值组，大Yt值组（数据项大致相等）（2）对小Yt值组估计模型，给出（3）对大Yt值组估计模型，给出 54 （4）H0：H1：（或）检验统计量为F0 =F（n3-k-1,n1-k-1）若F0Fc，则拒绝H0，存在异方差性。55例5：S=+Y+u 其中：S=储蓄 Y=收入设 195160年，=0.01625 197079年，=0.9725 F0=0.9725/0.01625=59.9 查表得:d.f.为（8，8）时，5%Fc=3.44 F0Fc 因而拒绝H0。结论：存在异方差性。562.怀特检验法怀特检验法(WhitesGeneralHeteroscedasticityTest)怀特提出的检验异方差性的方法在实践中用起来很方便，下面用一个三变量线性模型扼要说明其检验步骤。设模型如下：White检验步骤如下：（1）用OLS法估计（1）式，得到残差ei；（2）进行如下辅助回归即残差平方对所有原始变量、变量平方以及变量交叉积回归，得到R2值；57（3）进行假设检验原假设H0：不存在异方差性（即方程（2）全部斜率系数均为零）备择假设H1：存在异方差性(即H0不成立)怀特证明了下面的命题：在原假设H0成立的情况下，从（2）式得到的R2值与观测值数目（n）的乘积（nR2）服从自由度为k的2分布，自由度k为(2)式中解释变量的个数。即nR22(k)因此，怀特检验的检验统计量就是nR2，其抽样分布为自由度为k的2分布。检验步骤类似于t检验和F检验。583布鲁奇布鲁奇-帕根检验法帕根检验法设模型满足扰动项均值为0的假设，因而OLS估计量无偏且一致。检验该模型是否存在异方差性的原假设为：59检验的思路是将对异方差性的检验转换为对是否与一个或多个解释变量相关的检验。如果不成立，则的期望值可以表示为各解释变量的函数，简单的方法是假定线性函数：其中v是均值为0的误差项。这里的因变量是原回归方程（5.15）中误差项的平方。同方差性的原假设（5.16）转换为：60要检验此假设，可用我们在第四章中介绍的检验全部斜率系数为0的F检验，唯一的问题是作为因变量的无法观测，可以用原模型（5.15）回归得到的OLS残差平方代替之，要估计的方程变为：相应的检验统计量为61其中是（5.19）式回归得到的决定系数，以区别于原方程（5.15）回归的决定系数。我们也可以计算LM检验统计量来检验原假设（5.18):此检验通常称为布鲁奇布鲁奇-帕根异方差性检验帕根异方差性检验（BP检验）。62下面总结一下BP检验的步骤：（1）用OLS法估计模型（5.15），得到OLS残差序列，计算序列；（2）对方程（5.19）执行OLS回归，保存该回归的值；（3）计算F或LM统计值，若大于临界值，则拒绝原假设，判断存在异方差性。63三广义最小二乘法1消除异方差性的思路基本思路：变换原模型，使经过变换后的模型具有同方差性，然后再用OLS法进行估计。对于模型 Yt=0+1X1t+k Xkt+ut （1）若扰动项满足 E(ut)=0，E(uiuj)=0,ij，但 E(ut2)=t2 常数.也就是说，该模型只有同方差性这一条件不满足，则只要能将具有异方差性的扰动项的方差表示成如下形式：64 由于所以变换后模型的扰动项的方差为常数，可以应用OLS法进行估计，得到的参数估计量为BLUE。但这里得到的OLS估计量是变模后模型（2）的OLS估计量。对于原模型而言，它已不是OLS估计量，称称为为广广义最小二乘估计量（义最小二乘估计量（GLS估计量）。估计量）。其中为一未知常数，表示一组已知数值，则用t去除模型各项，得变换模型:652 广义最小二乘法广义最小二乘法(Generalized least squares)下面用矩阵形式的模型来推导出GLS估计量的一般计算公式。设GLS模型为（1）满足 E(u）=0，E(uu)=2，X 非随机，X的秩=K+1n,其中为正定矩阵。66 根据矩阵代数知识可知，对于任一正定矩阵，存在着一个满秩（非退化，非奇异）矩阵P P，使得用P-1左乘原模型（1）（对原模型进行变换）：令Y*=P-1Y，X*=P-1X，u*=P-1u，得到 Y*=X*+u*（2）下面的问题是，模型（2）的扰动项u*是否满足OLS法的基本假设条件。67我们有68这表明，模型（2）中的扰动项u*满足OLS法的基本假设，可直接用OLS估计，估计量向量这就是广义最小二乘估计量（GLS估计量）的公式，该估计量是BLUE。从上述证明过程可知，我们可将GLS法应用于为任意正定矩阵的情形。69如果只存在异方差性，则其中我们显然有7071四、解决异方差问题的方法四、解决异方差问题的方法1.可行广义最小二乘法（可行广义最小二乘法（FGLS法）法）广义最小二乘法从理论上解决了扰动项存在异方差性的情况下模型的估计问题，但在实践中是否可行呢?从GLS估计量的公式可知，要计算GLS估计值，我们必须知道矩阵。而实际问题中矩阵极少为已知。因此，在实践中直接应用GLS法基本上不可行。72但在很多情况下，我们可以根据实际问题提供的信息估计矩阵，再应用GLS法，这种方法称为可行广可行广义最小二乘法义最小二乘法（FeasibleGeneralizedLeastSquares,FGLS）。例如在仅存在异方差性的情况下，如果在实际问题中，研究人员确信可以准确估计异方差性的结构，如扰动项方差与某个解释变量成正比，就可以采用FGLS法。由于FGLS法的核心是估计矩阵，因此亦称为估计的广义最小二乘法估计的广义最小二乘法（EstimatedGeneralizedLeastSquares,EGLS）。73FGLS法的第一步是确定异方差性的具体形式，也就是找出决定扰动项方差与某组已知数值之间关系的函数形式，然后用这个关系得到每个扰动项方差的估计值，从而得到矩阵的估计值，最后计算FGLS估计量：74例1 Yt=1+2Xt+ut t=1,2,n.其中 Y=家庭消费支出 X=家庭可支配收入我们在前面已分析过，高收入家庭有较大的扰动项方差，因此不妨假定扰动项方差与可支配收入成正比，即 Var(ut)=Xt ,t=1,2,n.式中是一未知常数，由于Xt为已知，相当于，而相当于，因此应用GLS法，即可得出的FGLS估计量。75 在上例中我们假设扰动项方差与解释变量的取值成正比，这种假设是否真正合理呢？根据经验和分析做出的这种假设，虽然有一定道理，但未免显得过于武断，这方面还可做一些比较细致的工作。Glesjer检验法不仅可检验异方差性的存在，还可用于提供有关异方差形式的进一步信息，对于确定矩阵很有用，下面我们扼要说明格里瑟检验法的思路和步骤。76格里瑟检验法的思路格里瑟检验法的思路是假定扰动项方差与解释变量之间存在幂次关系，方法是用对被认为与扰动项方差有关的解释变量回归，确定和该解释变量的关系。由于与该解释变量之间关系的实际形式是未知的，因此需要用该解释变量的不同幂次进行试验，选择出最佳拟合形式。具体步骤如下：77(1)因变量Y对所有解释变量回归，计算残差et （t=1,2,n）（2）对所选择解释变量的各种幂次形式回归，如然后利用决定系数，选择拟合最佳的函数形式。（3）对1进行显著性检验，若显著异于0，则表明存在异方差性，否则再试其它形式。78 例2 Yt=1+2X1t+k Xkt+ut 假设我们根据经验知道扰动项方差与Xjt有关，并用格里瑟法试验，得出：则在大多数应用中，由于通过矩阵运算计算相对复杂，因而对于仅存在异方差性的问题，通常采用另一种等价的方法加权最小二乘法加权最小二乘法（WLS）。79加权最小二乘法加权最小二乘法对于仅存在异方差性的问题，其矩阵是一个对角矩阵，即在这种情况下应用广义最小二乘法，也就是在原模型两端左乘矩阵变换原模型，再对变换后的模型应用普通最小二乘法进行估计。80这种作法实际上等价于在代数形式的原模型 Yt=0+1X1 t+k X k t+u t 的两端除以 t，得变换模型：相当于在回归中给因变量和解释变量的每个观测值都赋予一个与相应扰动项的方差相联系的权数，然后再对这些变换后的数据进行OLS回归，因而被称为加权最小二乘法（WLS法,Weighted Least Squares）。81 加权最小二乘法是FGLS法的一个特例，在矩阵为对角矩阵这种特殊情形下，我们既可以直接应用矩阵形式的可行广义最小二乘估计量公式得到FGLS估计值，亦可避开矩阵运算，采用加权最小二乘法得到其WLS估计值，两者结果完全相同，无论你称之为FGLS估计值还是WLS估计值，二者是一码事。例例:其中：Y=R&D支出，X=销售额采用美国1988年18个行业的数据估计上述方程，结果如下（括号中数字为t值）：82 这里是横截面数据，由于行业之间的差别，可能存在异方差性。假设应用格里瑟法试验，得到异方差性形式为：将原模型（1）的两端除以，得83 用OLS法估计（2）式，结果如下（括号中数字为t值）：与（1）式的结果比较，两个方程斜率系数的估计值相差不大，但采用WLS法估计的比直接用OLS法估计的系数更为显著。842.仍采用仍采用OLS法估计系数，法估计系数，但采用但采用OLS估计量标准估计量标准误差的异方差性一致估计值代替其误差的异方差性一致估计值代替其OLS估计值估计值怀特（H.White）在1980年提出的产生OLS估计量的异方差性一致标准误差的方法，为解决异方差性问题提供了另一种途径。怀特的贡献是解决了异方差性造成系数的置信区间和假设检验结果不可信赖的问题，该后果是由于方差的OLS估计量不再是无偏估计量而造成的。85我们用简单线性回归模型对怀特方法作一说明。在异方差的情况下，的方差是可以证明，将涉及所有的，而不是一个共同的。这意味着回归软件包所报告的作为的方差估计值有两个错误。第一，它用的不是方差的正确公式（5.25）；第二，它用估计一个共同的，而事实上诸是不同的。86怀特的方法是在（5.25）式中用取代，这里是第i个OLS残差，即请注意，我们并不能用得到的一致估计量，因为在这种情况下，每个要估计的参数仅有一个观测值，当样本增大时，未知的的数目也在同步增加。怀特得到的是的一致估计量，它是的加权平均。同样的分析适用于多元回归OLS估计量的情况，在这种情况下，用怀特方法得到的第K个OLS回归系数的方差的异方差性一致估计值由下式给出：87其中是从对方程中所有其它解释变量回归得到的OLS残差的平方，为原多元回归模型的第i个OLS残差。很多回归软件包提供诸方差的怀特异方差性一致估计值以及对应的稳健t统计值（robustt-statistics）。例如，使用EViews，先点击Quick，选择EstimateEquation，再击Options，从下拉菜单中选其中的一个选项White，即可得到诸方差的异方差性一致估计值。88通过使用诸方差的怀特异方差性一致估计值代替其OLS估计值，我们解决了异方差性造成系数的置信区间和假设检验结果不可信赖的问题，从而也就解决了在异方差性存在的情况下能否使用OLS法估计方程的问题。结论是我们仍可用OLS法估计方程的系数，因为尽管存在异方差性，系数的OLS估计量毕竟还是无偏和一致估计量，应该说还是具有良好性质的估计量。只不过方差-协方差矩阵不能再用OLS法估计，而要采用怀特之类的方法，得到一致估计量，如怀特的异方差性一致估计量。89这类估计量的性质不是“最好”，但它们对于某些假设条件（在这里是同方差性）的违背不敏感，这类的估计量称为稳健估计量稳健估计量（robustestimators）。与我们前面介绍的FGLS法相比，本段介绍的解决异方差性的方法的优越之处在于，不需要知道异方差性的具体形式。因此，在异方差性的基本结构未知的情况下，建议仍采用OLS法估计系数，而采用其方差的稳健估计量，如怀特的异方差性一致估计量。90五、实例五、实例表5-4给出世界31个国家2008年居民人均消费支出和人均国民总收入的数据（以2000价格计算）。使用表5-4中的数据回归如下方程：OLS回归结果如下（括号中数字为标准误差）：由于是各国的横截面数据，有可能存在异方差性，我们用本节介绍的几种方法检验之。911格里瑟法检验格里瑟法检验我们用上面的OLS回归得到的残差的绝对值对解释变量的不同幂次回归，得到下列结果（括号中数字为t值）：92不难看出，这些回归中大部分的斜率系数的t值绝对值大于2，表明其显著异于0，因此拒绝同方差性的原假设。932戈德弗尔德匡特检验戈德弗尔德匡特检验我们对因变量C的观测值进行排序后，去掉中间的11个观测值，然后用前10个和后10个观测值分别进行回归。第一个回归得到第2个回归得到在原假设H0下，检验统计量94分子分母的自由度均为10-2=8，查F表，5%显著性水平下的临界值，由于F=86.443.44，故拒绝原假设，表明存在异方差性。3怀特检验怀特检验在本例中，该检验基于，对Y、Y2回归，其EViews结果如表5-5所示：95表5-5怀特检验结果96由表中第二行看出，检验统计量为服从自由度为2的分布，对应的P值为0.047，在5显著性水平上拒绝同方差性的原假设。4布鲁奇帕根检验布鲁奇帕根检验在本例中，该检验基于对Y回归，其EViews结果如表5-6所示：97表5-6布鲁奇帕根检验结果98由输出结果可知，检验统计量为服从自由度为1的分布，对应的P值为0.024，在5显著性水平上拒绝同方差性的原假设。由上面的检验结果可知，所有检验结果都拒绝同方差性的原假设，因而表明模型存在异方差性。995怀特异方差性一致标准误差估计值怀特异方差性一致标准误差估计值由于异方差性的存在，我们采用OLS法估计方程，得到的方差估计值不再是无偏的，从而导致系数的置信区间和假设检验结果不可信赖。为解决这个问题，我们采用怀特异方差性一致标准误差估计值代替之。应用EViews，得到如下结果：100表5-7White异方差性一致标准误差101据此写出方程的回归结果如下：不难看出，解释变量的异方差性一致标准误差大于用OLS法估计的标准误差，但这并不是必然的，对于其它数据集来说，未必如此。1026加权最小二乘法加权最小二乘法在前面格里瑟法试验方程中，第一个方程的最高，故模型异方差形式为将原模型两端除以Yi，回归结果如下（括号中数字为标准误差）：对上述回归结果进行怀特检验，得到检验统计值nR2=0.958，对应的P值为0.620，故接受同方差性的原假设，说明模型已消除异方差性。103第四节自相关一定义若Cov(ui,uj)=E(uiuj)=0,ij不成立，即线性回归模型扰动项的方差协方差矩阵的非主对角线元素不全为0，则称为扰动项自相关，或序列相关（Serial Correlation）。二自相关的原因及后果1原因自相关主要发生在时间序列数据的情形，因而亦称为序列相关，主要有以下两种原因：104（1）冲击的延期影响（惯性）在时间序列数据的情况下，随机冲击（扰动）的影响往往持续不止一个时期。例如，地震、洪水、罢工或战争等将在发生期的后续若干期中影响经济运行。微观经济中也与此类似，如一个工厂的产量，由于某种外部偶然因素的影响（如某种原材料的供应出了问题），该厂某周产量低于正常水平，那么，随后的一周或几周中，由于这种影响的存在或延续，产量也很可能低于正常水平（即扰动项为负）。不难看出，观测的周期越长，这种延期影响的严重性就越小，因此，年度数据比起季度数据来，序列相关成为一个问题可能性要小。105 （2）误设定如果忽略了一个有关的解释变量，而该变量是自相关的，则将使扰动项自相关，不正确的函数形式也将导致同样后果。在这些情况下，解决的方法是纠正误设定。本章后面将介绍的纠正自相关的方法都不适用于这种情况的自相关。1062后果自相关的后果与异方差性类似。（1）在扰动项自相关的情况下，尽管OLS估计量仍为无偏估计量，但不再具有最小方差的性质,即不是BLUE。（2）OLS估计量的标准误差不再是真实标准误差的无偏估计量，使得在自相关的情况下，无法再信赖回归参数的置信区间或假设检验的结果。107三自相关的检验1检验一阶自相关的德宾沃森检验法（DurbinWatson test）（1）一阶自相关自相关的最简单模式为：其中称为自相关系数（-11），这种扰动项的自相关称为一阶自相关，即扰动项仅与其前一期的值有关。0 正自相关 0 负自相关 =0 无自相关108 在一阶自相关模式中，假定t具有以下性质：E(t)=0,E(t)=2=常数，E(ij)=0,ij,t服从正态分布。在计量经济学中，具备上述性质的量称为白噪声（White noise），表示为 t=White noise或t=白噪声109（2）德宾沃森检验法(DurbinWatson d test)统计软件包和研究报告在提供回归结果时通常都给出DW（或d）统计量的值，该统计量是从OLS回归的残差中计算得来的，它被用于一阶自相关的检验，计算公式为：110 DW和一阶自相关系数的估计值之间存在以下近似关系（具体推导过程见书上P135136)：由于-1 1，因而0 DW 4。不难看出，直观判断准则是，当DW统计量接近2时，则无自相关，DW值离2越远，则自相关存在的可能性越大。111DW检验的缺陷我们当然期望有一张能够给出相应的n、k和值下各种DW临界值的表（就象t检验，F检验一样），使得我们可以按常规假设检验那样根据临界值作出判断。不幸的是，DW统计量的分布依赖于解释变量的具体观测值（即依赖于X X矩阵）。因此不象t、F检验那样，有一张能够给出DW临界值的表。为解决这一问题，德宾和沃森证明，DW统计量的真实分布位于两个极限分布之间，这两个分布分别称为下分布和上分布，如下图所示：112概率密度下分布上分布 0 A B C D DW值每个分布的95%临界水平用A，B，C，D表示。113 现假设DW统计量的值位于A的左边，则不管这种情况下的DW统计量服从何种分布（上，下或中间），无自相关的原假设将被拒绝。与此类似，若DW统计量的值位于D的右边，则亦可拒绝无自相关的原假设。若DW统计量的值位于B和C之间，则可接受原假设。而当DW统计量的值位于A和B之间或C和D之间时，则无法得出结论。上述分析可以概括为：DWD 存在自相关 BDWC 无自相关 ADWB或CDW2，则令DW=4-DW，按上述准则进行判别。若DW2117 例：DW=3.5，则 DW=4-3.5=0.5 查表（n=30,k=2,=5%）得：dL=1.28 DW=0.5 1.28 结论：存在自相关。1182.布鲁奇戈弗雷检验法布鲁奇戈弗雷检验法DW检验法的优点是简单方便，各类回归软件包的回归输出中都会提供DW值，通常为判断是否存在一阶自相关提供了直观的依据。可是DW检验法除了我们上面讨论过的存在无结论区的缺陷外，还有一些使用范围上的限制：（1）只能检验一阶自相关；（2）在方程的解释变量中包括滞后因变量（如Yt-1、Yt-2等）时，用DW法容易产生偏差；（3）当回归中无常数项时，也不宜采用DW法。119针对DW检验法的上述缺陷和限制，计量经济学家提出了不少检验扰动项自相关的方法，其中用得最广泛的是布鲁奇（T.S.Breusch）和戈弗雷（L.G.Godfrey）在20世纪70年代末期提出的方法，由于该方法源自拉格朗日乘数原理，因此也被称为拉格朗日乘数法（LM法）。布鲁奇和戈弗雷的思路是用原模型的OLS残差et对et-1以及原模型中的诸解释变量进行回归，检验统计量是nR2，它在原假设（et-1的系数为0）下的分布是自由度为1的分布。120布鲁奇戈弗雷检验法解决了DW法的缺陷和限制，用起来也不复杂。该方法的优势在于它不仅可检验一阶自相关，而且很容易推广到高阶自相关的检验。考虑回归模型A式中诸X也可以包括滞后因变量。121我们要检验的是：，即扰动项不存在任何阶数的自相关。LM检验步骤如下：(1)用OLS法估计A式，得到最小二乘残差；(2)然后估计下面的方程：计算常规R2统计值.122（3）检验是否所有的系数都等于0。这里通常不用F检验而用检验，因为LM检验是大样本检验。检验统计量为nR2，该统计量服从自由度为P的分布，即LM检验的缺点是，滞后长度P不能先验地确定，需要反复试，可以考虑用赤池和施瓦茨信息准则来选择滞后长度。123四、消除自相关的方法四、消除自相关的方法从自相关的定义和所造成的后果来看，自相关与异方差性有很多类似之处。这不是偶然的，它们都涉及扰动项的方差-协方差矩阵等于的假设条件遭到了破坏。因此可以将它们归为同一类问题：非球非球形扰动项形扰动项（Non-sphericaldisturbances）。由于这个原因，消除自相关的方法也与异方差性类似，一是采用FGLS法，二是仍用OLS法，但使用方差-协方差矩阵的稳健估计值。1241.FGLS法法我们在上一节介绍时提到，FGLS法的核心是估计矩阵。对于单纯异方差性的情况，只涉及主对角线元素的估计，结合实际问题提供的有关异方差性基本结构的信息，就有可能估计出矩阵。自相关的情况下，需要估计的元素要多得多，事实上，由于是对称矩阵，要估计的元素个数是。在只有n个观测值的情况下，不存在可行的估计方法。因此需要做某种假设以简化问题，使得我们可以用很少的参数来表示矩阵中的各协方差，估计出这些参数后，也就估计出了矩阵。其中最著名的是假设扰动项的自相关模式为一阶自相关，我们下面就来讨论消除一阶自相关的方法。125 如果实际问题的自相关模式为一阶自相关，则只要知道，就可以完全消除自相关，下面用双变量模型来说明，但同样的原理适用于多个解释变量的情形。设 Yt=+Xt+ut （1）ut=ut-1+t 其中t是白噪声，且0。（1）式两端取一期滞后，得 Yt-1=+Xt-1+ut-1 （2）126 （2）式两端乘以，得 Yt-1=+Xt-1+ut-1 （3）（1）-（3），得：Yt-Yt-1=(1-)+(Xt-Xt-1)+(ut -ut-1)（4）（4）式中的扰动项为 ut-ut1=t，从而满足标准假设条件。127令 Yt=Yt-Yt-1 Xt=Xt-Xt-1 =(1-)，有 Yt=+Xt+t （5）若为已知，我们就可用OLS法直接估计（5）式，否则需要先估计。在未知的情况下，通常用下列方法估计：科克伦奥克特法希尔德雷斯卢法128（1）科克伦奥克特法（CochraneOrcutt）科克伦奥克特法是一个迭代过程，步骤如下：估计原模型（1）式），计算OLS残差et（t=1,2,n）。et对et-1回归，即估计et=et-1+t，得到的估计值用产生然后估计 Yt=+Xt+t ，得到和的估计值和。重新计算残差，返回第步。此过程不断修改，和，直至收敛。129（2）希尔德雷斯卢法（Hildrethlu）此方法实际上是一种格点搜索法（Grid search）,即在的预先指定范围（如-1至1）内指定格点之间距离（如0.01），然后用这样产生的全部值（-1.00，-0.99，1.00）产生 Yt=Yt-Yt1 Xt=Xt-Xt1然后估计 Yt=+Xt+t 产生最小标准误差的值即作为的估计值，用该值得到的和即为原模型的系数估计值。1302.仍用仍用OLS法估计系数，但使用方差法估计系数，但使用方差-协方差矩阵的稳协方差矩阵的稳健估计值健估计值 Newey和West1987年给出了OLS估计量一个简单的异方差性和自相关一致方差协方差矩阵，无须规定序列相关的函数形式。该方法在怀特用OLS残差平方替代方差思路的基础上进行了拓展，加上了OLS残差的积其中p是我们希望假定的序列相关的最大阶数。Newey和West方法允许给高阶的协方差项赋予递减的权重。EViews中也提供了Newey和West方法。131五、实例五、实例表5-8给出我国1985-2009年农村居民人均消费支出和人均纯收入及农村居民消费价格指数的数据。OLS回归结果如下（括号中数字为标准误差）：其中，CR=农村居民人均不变价消费支出（1985=100）；YR=农村居民人均不变价纯收入（1985=100）；下面对模型进行自相关的检验。1321DW检验检验模型DW值为0.366，查临界值表（n=25，k=1，=5%）得dL=1.288，由于DW=0.366dL，故存在一阶自相关。下面我们再检验是否存在高阶自相关。2布鲁奇戈弗雷检验（布鲁奇戈弗雷检验（LM检验）检验）采用布鲁奇戈弗雷法检验四阶（P=4）自相关，结果如表5-9所示。133表5-9LM法检验结果134根据表5.9的结果，我们有：检验统计量nR2=17.028，由于相应的P值为0.0019，因而拒绝无序列相关的原假设。但从结果中看到，et-2、et-3、et-4的t值都不显著，如此看来，模型仅存在一阶自相关。1353科克伦奥克特法科克伦奥克特法现在我们应用科克伦奥克特法消除原模型一阶自相关，用原模型回归中得到的OLS残差对其滞后值回归得到：由此可知，相关系数因此，科克伦奥克特法的第二步产生下面的回归结果：1363科克伦奥克特法科克伦奥克特法现在我们应用科克伦奥克特法消除原模型一阶自相关，用原模型回归中得到的OLS残差对其滞后值回归得到：由此可知，相关系数因此，科克伦奥克特法的第二步产生下面的回归结果：137采用科克伦奥克特法消除一阶自相关后，DW值为1.373，比OLS回归中0.366的DW值有了明显改善，为了检验变换后模型是否还存在自相关，再应用LM法进行一阶自相关检验，结果如下：检验统计量nR2=2.633，由于相应的P值为0.1047，因而接受无序列相关的原假设，表明原模型的自相关已被消除。1384Newey-West 异方差和自相关一致标准误差异方差和自相关一致标准误差采用NeweyWest异方差和自相关一致标准误差的输出结果见表5-11。139表5-11Newey-West异方差和自相关一致标准误差140根据结果，我们有从回归结果可知，标准误差大于OLS法得到的值，需要再次指出，对于其它的数据集而言，并不必然如此。141第五节第五节随机解释变量随机解释变量本节讨论解释变量为非随机量的假设不成立的情况。为简单起见，我们以双变量模型为例来讨论，结论同样适用于多元线性回归模型。第(4)条假设是一个比较强的假设，它表明解释变量X是非随机的，即在重复抽样的情况下取固定值，因而与各期扰动项无关。由此，我们证明了最小二乘估计量的无偏性，我们也不难证明最小二乘估计量的一致性。142 由统计学得知，一致性（即估计量是一致估计量）的充分条件是：对于OLS估计量，我们有对于任何n成立，并且当n趋向无穷时，有143 因此，的一致估计量，即也就是说，如果满足第(4)条假设，即Xt为非随机的，则OLS估计量既是无偏的，又是一致的。144当假设条件(4)有所减弱时情况会怎样呢？可以证明：（1）即使解释变量是随机的，只要每每一一个个Xt都独立于所所有有的的扰动项ut(t=1,2,n),则我们在证明无偏性时所用的式子，t=1,2,n中的权数kt将独立于相应的扰动项ut，因而无偏性和一致性仍将成立。（2）如果再减弱一点，我们只有Xt独立于相相应应的的扰动项ut（即解释变量与扰动项同期无关），则无偏性不再成立，但一致性仍将成立。145（3）若上述两条均不满足，即X和u相关，则OLS估计量既是有偏的，又是不一致的。这很容易从（5.38）式推出。因为这意味着OLS不再是一个可以接受的估计量。在这种情况下，需要找出另外的估计量来解决这个问题，我们将在后面的第六章和第七章中结合分布滞后模型和联立方程模型中随机解释变量的具体情况进一步讨论。

展开阅读全文

潘省初计量经济学——第五章课件

最新文档