Eviews基本回归模型

资源描述

单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第三章基本回归模型,经济计量研究始于经济学中的理论假设，根据经济理论设定变量间的一组关系，如消费理论、生产理论和各种宏观经济理论，对理论设定的关系进行定量刻画，如消费函数中的边际消费倾向、生产函数中的各种弹性等进行实证研究。单方程回归是最丰富多彩和广泛使用的统计技术之一。本章介绍,EViews,中,基本回归技术的使用，说明并估计一个回归模型，进行简单的特征分析并在深入的分析中使用估计结果。随后的章节讨论了检验和预测，以及更高级，专业的技术，如加权最小二乘法、二阶段最小二乘法,(TSLS),、,非线性最小二乘法、,ARIMA/ARIMAX,模型、,GMM,（,广义矩估计）、,GARCH,模型和定性的有限因变量模型。这些技术和模型都建立在本章介绍的基本思想的基础之上。,1,对于本章及随后章节所讨论的技术，可以使用下列的经济计量学教科书作为参考。下面列出了标准教科书,(,逐渐变难,),：,(1),Pindyck,，,Rubinfeld,(1991), Econometric Models and Economic Forecasts, ,经济计量模型和经济预测,，第三版。,(2) Johnston,和,DiNardo,(1997),，,Economtric,Methods, ,经济计量方法,，第四版。,(3) Greene (1997),，,Economtric,Analysis, ,经济计量分析,，第三版。,(4) Davidson,和,MacKinon,(1993),，,Estimation and Inference in Econometrics , ,经济计量学中的估计和推断,。,2,3.1,创建方程对象,EViews,中的单方程回归估计是用方程对象来完成的。为了创建一个方程对象,:,从主菜单选择,Object/New Object/Equation,或,Quick/Estimation Equation ,，,或者在命令窗口中输入关键词,equation,。,在随后出现的方程说明对话框中说明要建立的方程，并选择估计方法。,3,3.2,在,EViews,中,对方程进行说明,当创建一个方程对象时，会出现如下对话框：,在这个对话框中需要说明三件事：,方程说明，估计方法，估计使用的样本。,在最上面的编辑框中，可以说明方程：因变量（左边）和自变量（右边）以及函数形式。,有两种说明方程的基本方法：,列表法和公式法,。列表法简单但是只能用于不严格的线性说明；公式法更为一般，可用于说明非线性模型或带有参数约束的模型。,4,3.2,.1,列表法,说明线性方程的最简单的方法是列出方程中要使用的变量列表。首先是因变量或表达式名，然后是自变量列表。例如，要说明一个线性消费函数，用一个常数,c,和收入,inc,对消费,csp,作回归，在方程说明对话框上部输入：,csp,c inc,注意回归变量列表中的序列,c,。,这是,EViews,用来说明回归中的常数而建立的序列。,EViews,在,回归中不会自动包括一个常数，因此必须明确列出作为回归变量的常数。内部序列,c,不出现在工作文档中，除了说明方程外不能使用它。,在上例中，常数存储于,c(1),，,inc,的系数存储于,c(2),，即,回归方程形式为：,csp,= c(1)+c(2)*inc,。,5,在统计操作中会用到,滞后序列,，可以使用与滞后序列相同的名字来产生一个新序列，把滞后值放在序列名后的括号中。,csp,c,csp(-1) inc,相当的回归方程形式为：,csp,=,c(1)+,c(2),csp(-1)+c(3),inc,。,通过在滞后中使用关键词,to,可以包括一个连续范围的滞后序列。例如：,csp,c csp(-1 to -4) inc,这里,csp,关于常数，,csp(-1),，,csp(-2),，,csp(-3),，,csp(-4),，和,inc,的回归。,在变量列表中也可以包括,自动序列,。例如：,log(csp,) c log(csp(-1),log,(inc+inc(-1)/2),相当的回归方程形式为：,log(csp,) = c(1)+c(2),log(csp(-1)+c(3),log(inc+inc(-1)/2),6,3.2.2,公式法说明方程,当列表方法满足不了要求时，可以用公式来说明方程。许多估计方法（但不是所有的方法）允许使用公式来说明方程。,EViews,中的公式是一个包括回归变量和系数的数学表达式。要用公式说明一个方程，只需在对话框中变量列表处输入表达式即可。,EViews,会在方程中添加一个随机附加扰动项并用最小二乘法估计模型中的参数。,7,用公式说明方程的好处是可以使用不同的系数向量。要创建新的系数向量，选择,Object/New Object,并从主菜单中选择,Matrix-Vector-,Coef,为系数向量输入一个名字。然后，选择,OK,。在,New Matrix,对话框中，选择,Coefficient Vector,并说明向量中应有多少行。带有系数向量图标,的对象会列在工作文档目录中，在方程说明中就可以使用这个系数向量。例如，假设创造了系数向量,a,和,beta,，,各有一行。则可以用新的系数向量代替,c,：,log(csp,)=a(1)+ beta(1)* log(csp(-1),8,3.3,在,EViews,中估计方程,3.3.1,估计方法,说明方程后，现在需要选择估计方法。单击,Method,：,进入对话框，会看到下拉菜单中的估计方法列表：,标准的单方程回归用最小二乘估计。其他的方法在以后的章节中介绍。采用,OLS,，,TSLS,，,GMM,，和,ARCH,方法估计的方程可以用一个公式说明。非线性方程不允许使用,binary,，,ordered,，,censored,，,count,模型，或带有,ARMA,项的方程。,9,3.3.2,估计样本,可以说明估计中要使用的样本。,EViews,会用当前工作文档样本来填充对话框。,如果估计中使用的任何一个序列的数据丢失了，,EViews,会临时调整观测值的估计样本以排除掉这些观测值。,EViews,通过在样本结果中报告实际样本来通知样本已经被调整了。,在方程结果的顶部,EViews,报告样本已经得到了调整。从,1978,年,2002,年期间的,25,个观测值中,EViews,使用了,24,个观测值。,10,3.3.3,估计选项,(,Options,),EViews,提供很多估计选项。这些选项允许进行以下操作：对估计方程加权，计算异方差性，控制估计算法的各种特征。,11,3.4,方程输出,在方程说明对话框中单击,OK,钮后，,EViews,显示估计结果,：,根据矩阵的概念,标准的回归可以写为：,其中,:,y,是因变量观测值的,T,维向量，,X,是解释变量观测值的,T,k,维矩阵，,T,是观测值个数,，,k,是解释变量个数,，,是,k,维系数向量，,u,是,T,维扰动项向量。,12,3.4.1,系数结果,1.,回归系数,(Coefficient),系数框描述了系数,的估计值。最小二乘估计的系数,b,是由以下的公式计算得到的,如果使用列表法说明方程，系数会列在变量栏中相应的自变量名下；如果是使用公式法来说明方程，,EViews,会,列出实际系数,c(1), c(2), c(3),等等。,对于所考虑的简单线性模型，系数是在其他变量保持不变的情况下自变量对因变量的边际收益。系数,c,是回归中的常数或者截距,-,它是当其他所有自变量都为零时预测的基本水平。其他系数可以理解为假设所有其它变量都不变，相应的自变量和因变量之间的斜率关系。,13,例,3.1:,本例是用中国,1978,年,2006,年的数据建立的居民消费方程：,cs,t,=,c,0,+,c,1,inc,t,+,u,t,其中,:,cs,是居民消费,；,inc,是可支配收入。方程中,c,0,代表自发消费，表示收入等于零时的消费水平；而,c,1,代表了边际消费倾向，,0,c,1,1,，,即收入每增加,1,元，消费将增加,c,1,元。从,系数中可以看出边际消费倾向是,0.73,。也即,1978,年,2006,年中国居民可支配收入的,73%,用来消费。,14,2,.,标准差,(Std.Error),标准差项报告了系数估计的标准差。标准差衡量了系数估计的统计可信性,-,标准差越大，估计中的统计干扰越大。,估计系数的协方差矩阵是由以下公式计算得到的：,这里是残差。而且系数估计值的标准差是这个矩阵对角线元素的平方根。可以通过选择,View/Covariance Matrix,项来察看整个协方差矩阵。,其中,15,3. t-,统计量,t,统计量是由系数估计值和标准差之间的比率来计算的，它是用来检验系数为零的假设的。,4,.,概率,（,P,值,）,结果的最后一项是在误差项为正态分布或系数估计值为渐近正态分布的假设下,指出,t,统计量与实际观测值一致的概率。,这个概率称为边际显著性水平或,P,值。给定一个,P,值，可以一眼就看出是拒绝还是接受实际系数为零的双边假设。例如，如果显著水平为,5%,，,P,值小于,0.05,就可以拒绝系数为零的原假设。,对于例,1,的结果，系数,inc,的零假设在,1%,的显著水平下被拒绝。,16,3.4.2,方程,统计量,1.,R,2,统计量,R,2,统计量衡量在样本内预测因变量值的回归是否成功。,R,2,是自变量所解释的因变量的方差。如果回归完全符合，统计值会等于,1,。如果结果不比因变量的均值好，统计值会等于,0,。,R,2,可能会由于一些原因成为负值。例如，回归没有截距或常数，或回归包含系数约束，或估计方法采用二阶段最小二乘法或,ARCH,方法。,EViews,计算,R,2,的公式为,：,，,其中，是残差，是因变量的均值。,17,2.,R,2,调整,使用,R,2,作为衡量工具存在的一个问题，即在增加新的自变量时,R,2,不会减少。在极端的情况下，如果把样本观测值都作为自变量，总能得到,R,2,为,1,。,R,2,调整后的记为，消除,R,2,中对模型没有解释力的新增变量。计算方法如下：,从不会大于,R,2,，,随着增加变量会减小，而且对于很不适合的模型还可能是负值。,18,3.,回归标准差,(S.E. of regression),回归标准差是在残差的方差的估计值基础之上的一个总结。计算方法如下：,4.,残差平方和,残差平方和可以用于很多统计计算中，为了方便，现在将它单独列出：,19,5.,对数似然函数值,EViews,可以作出根据系数的估计值得到的对数似然函数值（假设误差为正态分布）。似然比检验可通过观察方程严格形式和不严格形式的对数似然值之间的差异来进行。,对数似然计算如下：,20,6. Durbin-Watson,统计量,D-W,统计量衡量残差的一阶序列相关性，计算方法如下：,作为一个规则，如果,DW,值小于,2,，证明存在正序列相关。在例,1,的结果中，,DW,值很小，表明残差中存在序列相关。关于,Durbin-Watson,统计量和残差序列相关更详细的内容参见“序列相关理论”。,对于序列相关还有更好的检验方法。在 “序列相关的检验”中，我们讨论,Q,统计量和,LM,检验，这些都是比,DW,统计量更为一般的序列相关检验方法。,21,7.,因变量均值和标准差,（,S.D,）,y,的均值和标准差由下面标准公式算出：,8. AIC,准则,(,Akaike,Information Criterion),计算公式如下：,其中,l,是对数似然值,我们进行模型选择时，,AIC,值越小越好。例如，可以通过选择最小,AIC,值来确定一个滞后分布的长度。,22,9. Schwarz,准则,Schwarz,准则是,AIC,准则的替代方法,:,10. F,统计量和边际显著性水平,F,统计量检验回归中所有的系数是否为零,(,除了常数或截距,),。对于普通最小二乘模型，,F,统计量由下式计算：,在原假设为误差正态分布下，统计量服从,F(,k,1 ,T,k,),分布。,23,F,统计量下的,P,值，即,Prob(F,-statistic),是,F,检验的边际显著性水平。如果,P,值小于所检验的边际显著水平，比如说,0.05,，则拒绝所有系数都为零的原假设。对于例,1,，,P,值为零，因此，我们拒绝回归系数为零的原假设。注意,F,检验是一个联合检验，即使所有的,t,统计量都是不显著的，,F,统计量也可能是高度显著的。,24,3.5,方程操作,3.5.1,方程视图,以三种形式显示方程：,EViews,命令形式，带系数符号的代数方程，和有系数估计值的方程。,可以将这些结果剪切和粘贴到支持,Windows,剪贴板的应用文档中。,25, Estimation Output,显示方程结果。, Actual, Fitted, Residual,以图表和数字的形式显示因变量的实际值和拟合值及残差。,Actual, Fitted, Residual Table,以表的形式来显示这些值。,26, Gradients and Derivatives.,描述目标函数的梯度和回归函数的导数计算的信息。详细内容参见附录,E,， “,梯度和导数”。, Covariance Matrix,以表的形式显示系数估计值的协方差矩阵。要以矩阵对象保存协方差矩阵，可以使用,cov,函数。, Coefficient Tests, Residual Tests, and Stability Tests,这些是,“定义和诊断检验”中要详细介绍的内容。,27,3.5.2,方程过程, Specify/Estimate.,编辑方程说明、改变估计方法、估计样本。, Forecast .,用估计方程的预测。, Make Model,创建一个与被估计方程有关的未命名模型。, Update,Coefs,from Equation,把方程系数的估计值放在系数向量中。, Make,Regressor,Group,创建包含方程中使用的所有变量的未命名组（常数除外）。, Made Residual Series.,以序列形式保存回归中的残差。, Make Derivative Group,创建包含回归函数关于其系数的导数的组。, Made Gradient Group,创建包含目标函数关于模型的系数的斜率的组。,28,1.,回归方程的函数形式,下面讨论几种形式的回归模型：,（,1,）双对数线性模型（不变弹性模型）,（,2,）半对数模型,（,3,）双曲函数模型,（,4,）多项式回归模型,所有这些模型的一个重要特征是：它们都是参数线性模型，但是变量却不一定是线性的。,(1),双对数线性方程,双对数线性模型估计得到的参数本身就是该变量的弹性。如设,Q,t,为产值，,P,t,为价格，在,log(,Q,t,)=,+,log(,P,t,) +,u,t,的估计式中，,P,增加,1%,时，,Q,大约增加,%,，,所以,相当于,Q,t,的价格弹性。,3.6,线性回归方程的应用实例,29,推导,当,t,+1,期的,P,比上一期增加,1%,时，有,log(,Q,t,+1,) =,+,log(,P,t,1.01) =,+,log(,P,t,)+,log(1.01),= log(,Q,t,) +,log(1.01),移项得，,log(,Q,t+,1,) log(,Q,t,) =,log(1.01),，即,，还原得,因此，,P,变化,1%,时，,Q,大约变化,%,。,例,3.3,:,下面建立我国居民消费的收入弹性方程：,log(,csp,t,) =,0.25,+ 0.,908,log(,inc,t,),t =(1.66) (55.05),R,2,= 0.99 D.W. = 0.45,其中,csp,t,是,城镇居民消费,，,inc,t,是居民消费可支配收入。,30,方程中消费的收入弹性为,0.93,，说明我国居民可支配收入每增加,1%,，将使得居民消费增加,0.93%,。,31,(2),半对数模型,线性模型与对数线性模型的混合就是半对数模型,或,半对数模型包含两种形式，分别为：,（,3.2.10,）,（,3.2.11,）,半对数模型也是线性模型，因为参数是以线性形式出现在模型中的。而且，虽然原来的变量,x,和,y,之间是非线性关系，但变量,x,（或,y,）经过对数变换后，变量,ln(,x,),和,y,之间（或变量,x,和,ln(,y,),之间）是线性关系，因此可以称其为半对数线性模型。类似双对数模型，半对数模型也可以使用,OLS,估计。,32,半对数模型（,3.2.10,）和（,3.2.11,）中的回归系数具有直观的意义：,，（,3.2.12,）,即：,1,表示,x,变化,1%,导致,y,绝对量的变化量；,1,表示,x,的变化,1,单位导致,y,变化的百分比。特别地，如果在半对数模型式（,3.2.11,）中,x,取为,t,（年份），变量,t,按时间顺序依次取值为,1,，,2,，,，,T,，则,t,的系数度量了,y,的年均增长速度，因此，半对数模型（,3.2.11,）又称为增长模型。对于增长模型，如果,1,为正，则,y,有随时间向上增长的趋势；如果,1,为负，则,y,有随时间向下变动的趋势，因此,t,可称为趋势变量。宏观经济模型表达式中常有时间趋势，在研究经济长期增长或确定性趋势成分时，常常将产出取对数，然后用时间,t,作解释变量建立回归方程。,33,例,3.4:,我们建立半对数线性方程，估计我国实际,GDP,（,支出法，样本区间：,1978,2002,年）的长期平均增长率，模型形式为,其中：,GDP,P,t,表示剔出价格因素的实际,GDP,t,。,方程中时间趋势变量的系数估计值是,0.094,，说明,1978,2002,年我国实际,GDP,的年平均增长率为,9.4%,。,F,值或,R,2,表明模型拟合效果很好，,D.W.,显示模型存在（正的）自相关。,34,(3),双曲函数模型,形如下式的模型称为双曲函数模型,这是一个变量之间是非线性的模型，因为,X,t,是,以倒数的形式进入模型的，但这个模型却是参数线性模型，因为模型中参数之间是线性的。这个模型的显著特征是随着,X,t,的无限增大，,（,1/,X,t,）,接近于零。,35,例,3.5,美国菲利普斯曲线,利用美国,1955,1984,年的数据（附录,E.2,），,根据菲利普斯曲线，即通货膨胀率,t,和失业率,U,t,的反向关系，建立双曲函数：,估计结果表明，菲利普斯曲线所描述的,t,和,U,t,的反向关系并不存在。之所以出现这样的背离，主要是因为,20,世纪,70,年代出现石油危机，从而引发了“滞胀”，通货膨胀伴随着高失业率。如果考虑到通货膨胀预期的影响，则可以在模型中引入代表通货膨胀预期的变量，比如用通货膨胀前期值来代表。,36,含有通货膨胀预期的菲利普斯曲线估计结果为,可以看出，加入通货膨胀预期因素后，模型的拟合效果很好，而且这时的模型体现出了失业率和通货膨胀率之间的显著的反向变动关系。,37,2.,虚拟变量的应用,例,3.6,：工资差别,为了解工作妇女是否受到了歧视，可以用美国统计局的“当前人口调查”中的截面数据研究男女工资有没有差别。这项多元回归分析研究所用到的变量有：,W,雇员的工资（美元,/,小时）,1,；,若雇员为妇女,SEX =,0,；男性,ED ,受教育的年数,AGE ,雇员的年龄,1,；,若雇员不是西班牙裔也不是白人,NONWH =,0,；,其他,1,；,若雇员是西班牙裔,HISP =,0,；,其他,38,对,206,名雇员的样本所进行的研究得到的回归结果为（括号内是,t,统计量的值）：,（,22.10,）（,-3.86,）,R,2,= 0.068 D.W.=1.79,反映雇员性别的虚拟变量,SEX,在显著性水平,1%,下显著。因为工资的总平均是,9.60,美元，该虚拟变量告诉我们，妇女的平均工资为,8.12,美元，或比总平均低,1.48,美元。,39,在回归模型中加入年龄,AGE,和受教育年数,ED,以及种族或民族，性别虚拟变量仍然是显著的：,（,-3.38) (-4.61) (8.54) (4.63) (-1.07) (0.22),R,2,=0.367 D.W.=1.78,40,最后考虑年龄,AGE,与工资,W,之间非线性关系的可能性时，男女差别还是显著存在的。这一点可以由下列回归结果看出,：,(-4.59) (-4.50) (7.98) (-1.22) (0.28) (3.87) (-3.18),R,2,=0.398 D.W.=1.75,这个回归模型的年龄,AGE,项说明，在其他条件不变的情况下，雇员的工资率随着他的年龄的增长而增长（系数为,0.62,），,但是增加的速度越来越慢（,-0.0063,）。,进一步的研究表明，工资在雇员的年龄为,49.2,岁时达到最大，之后逐年下降。,41,例,3.7,季节虚拟变量,当使用含有季节因素的经济数据进行回归分析时，可以对数据进行季节调整消除原数据带有的季节性影响，也可以使用虚拟变量描述季节因素，进而可以同时计算出各个不同季度对经济变量的不同影响。如果用虚拟变量，这时包含了,4,个季度的,4,种分类，需要建立,3,个虚拟变量。用,Q,i,表示第,i,个季度取值为,1,，其他季度取值为,0,的季节虚拟变量，显然,Q,1,+,Q,2,+,Q,3,+,Q,4,= 1,，,如果模型中包含常数项，则只能加入,Q,1,，,Q,2,，,Q,3,，,否则模型将因为解释变量的线性相关而无法估计，即导致虚拟变量陷阱问题。当使用月度数据时，方法与上述类似，但需要有,11,个虚拟变量。,42,图,3.1-1,社会消费品零售总额,RS,图,3.1-2 GDP,通过图,3.1,，可以看出,1995,年,1,季度,2003,年,1,季度的季度,GDP,和社会消费品零售额,RS,存在明显的季节因素（数据见附录,E,表,E.4,），,GDP,通常逐季增加，也有一些年份中第二季度高于第三季度。,RS,在第一季度增加，第二季度减小，第三季度略有上升，第四季度达到高峰。,43,下面利用季度数据对我国的国民生产总值,GDP,和社会消费品零售额,RS,进行回归分析，分别考虑不包含和包含虚拟变量的情形。不包含虚拟变量的回归结果为,（,3.3.9,）,t,= (2.53) (14.9),R,2,= 0.88,D.W.,=2.13,使用虚拟变量的回归方程结果为,t,= (-4.82) (17.93) (7.58) (6.14) (52.83),（,3.3.10,）,R,2,= 0.99,D.W.,= 1.99,44,可以看出包含虚拟变量的方程明显地改进了拟合能力。这种季节调整方法是以季节变动要素不变并且服从于加法模型为前提，否则应该首先运用,X-12,或其他方法对数据进行季节调整。,图,3.2,SL,的实际曲线（实线）和拟合曲线（虚线）,(,左、右图分别由式,(3.3.9),，,(3.3.10),得到,),45,3.7,估计中存在的问题,如果自变量具有高度共线性，,EViews,在计算回归估计时会遇到困难。在这种情况下，,EViews,会,产生一个显示错误信息对话框 “奇异矩阵”。出现这个错误信息后，应该检查回归变量是否是共线的。如果一个回归变量可以写作其他回归变量的线性组合，则回归变量是完全共线的。在完全共线的情况下，回归变量矩阵,X,不是列满秩的，不能计算,OLS,估计值。,46,3.8,定义和诊断检验,经验研究经常是一种相互影响的过程。这一过程从估计关系的定义开始。选择定义常含有几个选择：变量，连接这些变量的函数，以及当数据是时间序列时表示变量间关系的动态结构。,不可避免地，在初始定义的恰当性方面存在不确定性。一旦估计了方程，,EViews,提供了评价方程定义质量的工具。随着改进，检验结果将影响所选择的定义，这一过程将重复下去，直到方程定义恰当为止。,本节描述了在方程对象的,View,中关于定义检验统计量的多个菜单。我们试图提供足够的统计方法来进行这些检验，但是实际考虑的许多描述是不完全的，建议查阅标准统计和经济计量学参考资料。,47,下面描述的每一检验过程包括假设检验的,原假设,定义。检验指令输出包括一个或多个检验统计量样本值和它们的联合概率值（,P,值,）。,P,值说明在原假设为真的情况下，样本统计量绝对值的检验统计量大于或等于临界值的概率。,P,值度量的是犯第一类错误的概率，即拒绝正确的原假设的概率，,P,值越大，错误地拒绝原假设的可能性就越大；,P,值越小，拒绝原假设时就越放心。例如，如果,P,值在,0.01,和,0.05,之间，原假设在,5%,显著性水平被拒绝而不是在,1%,水平。切记：对每一检验都有不同假设和分布结果。例如，有些检验统计量有确切的有限的样本分布（常为,t,或,F,分布）。其它是服从近似分布的大样本检验统计量。每一检验的内容都不同，将分别描述。,48,其它检验在其它章节讨论。它们包括单位根检验、,Granger,因果检验和,Johansen,协整检验。,方程对象菜单的,View,中给出三种检验类型选择来检验方程定义。包括系数检验、残差检验和稳定性检验：,49,3.8,.,1,系数检验,系数检验对估计系数的约束进行评价，包括对遗漏变量和冗余变量特殊情况的检验。,一、,Wald,检验,系数约束条件检验,1,.,Wald,检验原理,Wald,检验没有把原假设定义的系数限制加入回归，通过估计这一无限制回归来计算检验统计量。,Wald,统计量计算无约束估计量如何满足原假设下的约束。如果约束为真，无约束估计量应接近于满足约束条件。下面给出计算,Wald,检验统计量的一般公式。,50,对于一个线性回归模型,一个线性约束：,式中,R,是一个已知的,q,k,阶矩阵，,r,是,q,维向量。,Wald,统计量简写为，,b,为没有加入约束得到的参数估计值：,W,在,H,0,下服从渐近,2,(,q,),分布。进一步假设误差独立同时服从正态分布，我们就有一确定的、有限的样本,F-,统计量,是约束回归的残差向量。,F,统计量比较有约束和没有约束计算出的残差平方和。如果约束有效，这两个残差平方和差异很小，,F,统计量值也应很小。,EViews,显示,2,和,F,统计量以及相应的,P,值。,51,2.,如何进行,Wald,系数检验,为介绍如何进行,Wald,系数检验，我们考虑一个例子。生产函数的数学形式为,在最初提出的,C-D,生产函数中，假定参数满足,+,=1,，也就是假定研究对象满足规模报酬不变。,Q,为产出，,K,为资本投入，,L,为,劳动力投入。很容易推出参数,分别是资本和劳动的产出弹性。那么由产出弹性的经济意义，应该有,即当资本与劳动的数量同时增长,倍时，产出量也增长,倍。,1937,年，提出了,C-D,生产函数的改进型，即取消了,+,=1,的假定，允许要素的产出弹性之和大于,1,或小于,1,，即承认研究对象可以是规模报酬递增的，也可以是规模报酬递减的，取决于参数的估计结果。,52,例,3.8,Cobb-Douglas,生产函数估计形式如下：,利用美国主要金属工业企业的数据（,27,个企业的数据），,C-D,生产函数估计结果如下：,(1),53,从结果看,LogL,和,logK,的系数和小于,1,，但为确定这种差异是统计相关的，我们常进行有约束的,Wald,系数检验。选择,View/Coefficient Tests/,Wald,-Coefficient Restrictions,，,在编辑对话框中输入约束条件。约束条件应表示为含有估计参数和常数（不可以含有序列名）的方程，系数应表示为,c(1),，,c(2),等等，除非在估计中已使用过一个不同的系数向量。为检验,+,=1,的规模报酬不变的假设，在对话框中输入下列约束：,c(2) + c(3) = 1,单击,OK,，,EViews,显示,Wald,检验如下结果,（,原假设：约束条件有效,）：,EViews,显示,F,统计量和,2,统计量及相应的,P,值。,2,统计量等于,F,统计量乘以检验约束条件数。本例中，仅有一个约束条件，所以这两个检验统计量等价。它们的,P,值表明我们可以确定地接受规模报酬不变的原假设。,54,下面考虑检验多个约束条件的情况。例如，改变前面的,C-D,生产函数为非线性形式，我们估计一个如下形式的生产函数,检验约束条件：。这个非线性模型的估计结果如下：,55,检验多个约束条件，应用逗号隔开约束条件。在方程对话框中选择,View/Coefficient tests/,Wald,Coefficient Restrictions,。在,Wald,检验对话框中输入如下约束条件：,c(4)=0,，,c(5) = 0,，,c(6)=0,，,结果如下：,检验结果是不能拒绝原假设，表明,(1),式的,Cobb-Douglas,生产函数是这一问题较适当的方程定义形式。,56,二、遗漏变量,(Omitted Variables),检验,1,.,遗漏变量检验原理,这一检验能给现有方程添加变量，而且询问添加的变量对解释因变量变动是否有显著作用。,原假设,H,0,是添加变量不显著,。,检验的输出是,F,统计量和似然比（,LR,）,统计量及各自,P,值，以及在备选假设下无约束模型估计结果。,F,统计量基于约束和无约束回归残差平方和之差。,LR,统计量由下式计算：,L,r,和,L,u,是约束和无约束回归对数似然函数的最大值。在,H,0,下，,LR,统计量服从渐近,2,分布，自由度等于约束条件数，即加入变量数。,57,注意：,(1),遗漏变量检验要求在原始方程中和检验方程中观测值数相等。如果要加入变量的任一序列与原方程样本相比，含有缺失观测值（当加入滞后变量时这种情况常见），检验统计量将无法建立。,(2),遗漏变量检验可应用于线性,LS,，,TSLS,，,ARCH,，,Binary, Ordered, Censored, Count,模型估计方程。只有通过列表法列出回归因子定义方程而不能通过公式，检验才可以进行。,2,.,如何进行遗漏变量检验,选择,View/Coefficient Tests/Omitted VariablesLikelihood Ration,，,在打开的对话框中，列出检验统计量名，用至少一个空格相互隔开。,58,例如：原始回归为：,log(q) c log(L) log(k),。,输入：,K L,EViews,将显示含有这两个附加解释变量的无约束回归结果，而且显示,原假设：新添变量系数为,0,的检验统计量。输出的结果如下：,对数似数比统计量就是,LR,检验统计量且渐进服从于,2,分布，自由度等于添加回归因子数。,本例中，检验结果不能拒绝原假设，即添加变量不显著。,59,三、冗余,(Redundant Variables),变量,1.,冗余变量检验原理,冗余变量检验可以检验方程中一部分变量的统计显著性。更正式，可以确定方程中一部分变量系数是否为,0,，从而可以从方程中剔出去。原假设：被检验变量系数为,0,。冗余变量检验可以应用于线性,LS,，,TSLS,，,ARCH,（,仅均值方程），,Binary, Ordered, Censored, Count,模型估计方程。只有以列表法列出回归因子形式，而不是公式定义方程，检验才可以进行。,2,.,如何进行冗余变量检验,选择,View/Coefficient Tests/Redundant Variablelikelihood Ratio,，,在对话框中，输入每一检验的变量名，相互间至少用一空格隔开。,60,例如：原始回归为,log(Q,) c log(L) log(K) K L,如果输入增加的变量,K,和,L,，,EViews,显示去掉这两个回归因子的约束回归结果，以及检验,原假设：被检验变量系数为,0,的统计量。结果如下：,检验统计量是,F,统计量和对数似然比。如果误差是独立正态分布随机变量，,F,统计量有确定有限样本,F,分布，分子自由度为原假设下系数约束条件数，分母自由度为总回归自由度。,LR,检验是渐近检验，服从,2,分布。,61,3.8.2,残差检验,EViews,提供了对估计方程残差的序列相关，正态性，异方差性和自回归条件异方差性检验。,62,(1),相关图和,Q,统计量,(2),平方残差相关,图,(3),残差直方图和正态检验,显示残差直方图和残差的描述统计量，包括检验残差正态性的,Jarque-Bera,统计量。如果残差服从正态分布，直方图应呈钟型，,J-B,统计量应不显著。也适用于,LS,，,TSLS,，,非线性,LS,等模型残差。选择,View/Residual Tests/Histogram Normality,显示直方图和,J-B,统计量。在,原假设,:,残差正态分布,下，,J-B,统计量应服从,2,分布，自由度为,2,。,(4),序列相关,LM,检验,(5) ARCH LM,检验,(6) White,异方差性检验,63,3.8.3,定义和稳定性检验,一个推荐的经验方法是把观测值区间,T,分为,T,1,和,T,2,两部分。,T,1,个观测值用于估计，,T,2,个观测值用于检验和评价。把所有样本数据用于估计，有利于形成最好的拟合，但没有考虑到模型检验，也无法检验参数不变性，估计关系的稳定性。检验预测效果要用估计时未用到的数据，建模时常用,T,1,区间估计模型，用,T,2,区间检验和评价效果。对于子区间,T,1,和,T,2,的相对大小，没有太明确的规则。有时可能会出现明显的结构变化的转折点，例如战争，石油危机等。当看不出有转折点时，常用的经验方法是用,85%-90%,的数据作估计，剩余的数据作检验。,EViews,提供了一些检验统计量选项，它们检查模型参数在数据的不同子区间是否平稳。,64,1. Chow,分割点检验,Chow,分割点检验的思想是对每一个子样本区间估计方程，看估计方程中是否存在显著差异。显著差异说明关系中存在结构变化。例如，可以使用这个检验来检查石油危机前后的能源需求函数是否一样。,为进行检验，把数据分为两个或多个子样本区间，每一子区间包含的观测值数应大于方程参数，这样才使得方程能被估计。,Chow,分割点检验基于比较利用整个样本估计方程获得的残差平方和及利用每一子区间样本估计方程获得的残差平方和之间的差别。,对,Chow,分割点检验，,EViews,提供了两个检验统计量。,F,统计量和对数似然比（,LR,）,统计量,，,F,统计量基于对约束和非约束残差平方和的比较。在最简单情况下（一个分割点），计算如下：,65,Chow,分割点检验的原假设,:,不存在结构变化。,Chow,分割点检验的主要缺陷是，如果每一个子区间要求至少和被估计参数一样多的样本数，那么这里就存在一个问题，比如说，要检验战争和和平时期的结构变化，但是战争时期的样本数较少。下面要讨论的,Chow,预测检验可以解决这个问题。,其中,:,是整个样本期间估计的残差平方和；是第,i,个子区间的残差平方和；,T,是观测值数；,k,是方程参数个数，这一公式可以扩展为多于一个分割点。,66,为了进行,Chow,分割点检验，选择,View/Stability Tests/Chow Breakpoint Test,出现对话框以后，填入间断点的日期。比如，如果方程的数据是从,1978,到,2002,年,，,填入,1994,，则被定义成两个子区间：一个是,1978,到,1993,，另一个是,1994,到,2002,。,例,3.9,我们利用,Chow,检验来判断例,3.1,所建立的消费函数的稳定性。,20,世纪,90,年代前的中国仍然处于卖方市场，虽然居民收入水平增幅较大，但商品供给有限，而且当时的利息率较高，因而居民收入更加倾向于储蓄增值而不是立即消费。,1994,年我国开始了全面的体制改革和制度创新，随着国有企业体制改革的推进和大量非国有企业的兴起并日益壮大，国内商品市场日益繁荣，商品品种更加丰富，使得居民收入用于消费的部分增加。不妨以,1994,年为假想的间断点，用,Chow,检验判断,1994,之前和之后的两段时期消费函数是否产生了显著的差异。,该结果是拒绝原假设,（不存在结构变化）,：即,1994,前后存在结构变化。,67,Chow,预测检验先估计了包括,T,1,区间子样本的所有样本观测值的模型，然后用同样的模型去估计,T,1,区间样本的因变量的值。如果两个估计值差异很大，就说明模型可能不稳定。检验适用于最小二乘法和二阶段最小二乘法。,EViews,给出,F,统计量计算如下：,这里用所有样本观测值估计方程的残差平方和，是用,T,1,子样本进行估计方程的残差平方和，,k,是被估计参数的个数。当误差是独立同正态分布时，,F,统计量服从精确的有限样本的,F,分布。,2. Chow,预测检验,68,选择,View/Stability Test /Chow Forecast Test,进行,Chow,预测检验。对预测样本开始时期或观测值数进行定义。数据应在当前观测值区间内。,仍以例,3.1,所建立的消费函数为例，定义,1994,作为预测区间第一个分割点,。,检验重新估计,19781994,的方程，并且使用这个结果来计算剩余时期的预测误差。结果如下：,对数似然比（,LR,）,统计量拒绝原假设，中国的消费函数在,1994,年前后有结构变化，但,F,统计量不能拒绝原假设。,注意：本例说明两种,Chow,检验产生相同的结果。但有时也会产生相反的结果。,69,3.9,EViews,中的方程预测,为说明一个被估计方程的预测过程，我们仍然考虑例,3.1,中的模型，如果要对此模型的预测功能进行评价，可以用,1978,1999,年的,22,年数据进行参数估计，用,2000,2002,年的数据作为检验性数据，考察实际值和预测值的差别。,70,用,1978,2004,年的,22,年数据进行参数估计的结果：,71,3.9.1,如何进行预测,为预测该方程的实际消费,csp,，在方程的工具栏中按,Forecast,按钮，或选择,Procss,/ Forecast ,。,这时会出现对话框：,72,我们应提供如下信息：,1.,序列名,预测后的序列名,将所要预测的因变量名填入编辑框中。,EViews,默认了一个名字，但可以将它变为任意别的有效序列名。这个名字应不同于因变量名，因为预测过程会覆盖已给定的序列值。,S.E.,（,Optional,）,如果需要，可以为该序列的预测标准差提供一个名字。如果省略该项，预测标准误差将不被保存。,GARCH,（,Optional,）,对用,ARCH,估计的模型，还可以保存条件方差的预测值（,GARCH,项）。见,6,章对,GARCH,估计的讨论。,73,2.,预测方法,动态,(Dynamic),从预测样本的第一期开始计算多步预测。,静态,(Static),利用滞后因变量的实际值计算一步向前,(one-step-ahead),预测的结果。,结构,(Structural),预测时,EViews,将忽略方程中的任何,ARMA,项。若不选此项，在方程中有,ARMA,项时，动态与静态方法都会对残差进行预测。但如果选择了,Structural,，,所有预测都会忽略残差项而只对模型的结构部分进行预测。,样本区间,(Sample range),必须指定用来做预测的样本。如果缺选，,EViews,将该样本置为工作文件样本。如果指定的样本超出估计方程所使用的样本区间,(,估计样本,),，那么会使,EViews,产生样本外预测。,注意：需要提供样本外预测期间的解释变量值。对静态预测，还必须提供滞后因变量的数值。,74,3,.,输出,可以选择以图表或数值，或者二者同时的形式来观察预测值。注意：预测值被保存在,csf,序列中。因为,csf,序列是一个标准的,EViews,序列，所以可以利用序列对象的所有标准工具来检验预测结果。,75,比较实际值,csp,和预测拟合值,cspf,:,76,对于没有包含在预测样本中的数值，会有两种选择。作为缺省，,EViews,将用其因变量的实际值充填，另一种是不选择,Insert,actuals,for out-of-sample,，,预测样本外的数值将都赋予“,NA”,。,于是，这些规则的结果是被预测序列中的所有数据在预测过程中将被覆盖，被预测序列的已存值将会丢失。,77,3.9.2,预测误差和,预测效果评估,假设真实的模型由下式给定：,这里,u,t,是独立同分布，均值为零的随机扰动项，,是未知参数向量。下面我们放松,u,t,是独立的限制。,生成,y,的真实模型我们尚不知道，但我们得到了未知参数,的估计值,b,。,设误差项均值为零，可以得到,y,的预测方程：,该预测的误差为实际值与预测值之差,78,假设我们利用,1979,2004,的样本数据估计出的,cs,方程，然后分别进行,2005,2006,关于,csp,的预测。如果选中,Forecast evaluation (,预测效果评估,),，,EViews,将显示预测效果评估的统计结果表：,79,注意,：,如果预测样本中没有因变量的实际值数据,，,EViews,不能进行预测效果评估。,假设预测样本为,j,=,T,+1,T,+2, ,T,+,h,，,T,为实际估计用样本长度，用和,y,t,分别表示,t,期的实际值与预测值。计算出的预测误差统计结果如下所示：,Root Mean Squared Error,均方根误差,Mean Absolute Percentage Error,平均绝对误差,Mean Absolute Percentage Error,平均相对误差,Theil,Inequality Coefficient,泰尔不等系数,80,前两个预测误差统计量由因变量规模决定。它们应该被作为相对指标来比较同样的序列在不同模型中的预测结果，误差越小，该模型的预测能力越强。,后两个统计值是相对量。泰尔,(,Theil,),不等系数总是处于,0,和,1,之间，这里,0,表示与真实值完全拟合。,预测均方差可以分解为：,式中分别为和,y,的平均值和标准差，,r,为和,y,的相关系数。该比值被定义为：,81,Bias Proportion,偏差比,Variance Proportion,方差比,Covariance Proportion,协方差比,偏差比表明预测均值与序列实际值的偏差程度；方差比表明预测方差与序列实际方差的偏离程度；协方差比衡量非系统误差的大小。,注意：偏差比、方差比和协方差比之和为,1,。,如果预测结果好，那么偏差比和方差比应该较小，协方差比较大。,82,3.9.4,含有滞后因变量的预测,在方程等号的右边出现滞后变量时，预测变得更为复杂。例如，我们可以在原来的形式后面引入,csp,的一阶滞后：,csp,c inc csp,(-1),83,1.,动态预测,如果选择动态预测，,EViews,将从预测样本的起始日期开始，对,y,进行多步预测。对如上只指定一个滞后变量的情况：,预测样本的初始值将使用滞后变量,y,的实际值。因此，如果,y,的实际样本值是,T,个，我们从,T,+1,开始预测，即,T,+1,是第一个预测值，,EViews,将计算,这里,y,T,是预测样本开始前一期的滞后内生变量值，这就是一步向前预测。随后的,h,个预测值，,k,= 1 , 2 , ,h,，将使用前期,y,的预测值,：,84,2.,静态预测,静态预测对因变量进行一系列的一步向前预测：,EViews,采用滞后内生变量的实际值，通过下式对,k,=0 , 1 , 2 , ,h,计算每一个预测值：,静态预测要求外生变量和任何滞后内生变量在预测样本中的观测值可以获得。如上，如果需要，,EViews,将对预测样本进行调整以解释滞后变量的前期样本。如果没有某期数据，对应该期的预测值为,NA,。,它并不会对以后预测产生影响。,85,动态预测和静态预测的比较,86,3.9.5,带有公式的预测方程,EViews,可以提供对方程左边的因变量是某个表达式的情况，预测这个表达式的功能。而且如果公式中的第一个序列，能从表达式求解出来，那么,EViews,还可以提供预测公式中第一个序列的功能。,87,例如，假设估计如下定义的方程：,log(cs) c log(cs(-1) log(inc),当选择,Forecast,按钮，预测对话框显示如下，注意该对话框提供了两种预测序列以供

展开阅读全文

Eviews基本回归模型

最新文档