《基本回归模型》PPT课件

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,ECONOMETRICS,第,六,章基本回归模型,单方程回归是最丰富多彩和广泛使用的统计技术之一。本章介绍EViews中基本回归技术的使用，说明并估计一个回归模型，进行简单的特征分析，并在深入的分析中使用估计结果。,计量经济学的一些更高级、专业的技术，如加权最小二乘法、二阶段最小二乘法(TSLS)、非线性最小二乘法、ARIMA/ARIMAX模型、GMM（广义矩估计）、GARCH模型和定性的有限因变量模型等，这些技术和模型都建立在本章介绍的基本思想的基础之上。,11/26/2024,1,主要内容,6.1 创建方程对象,6.2 在EViews中对方程进行说明,6.3 在EViews中估计方程, 6.4 方程输出,6.5 方程操作,6.6 回归模型的其它函数形式,6.7 估计中存在的问题,6.8 定义和诊断检验,6.9,EViews中的方程预测,11/26/2024,2,6.1 创建方程对象,EViews中的单方程回归估计是用方程对象来完成的。创建一个方程对象的方法: 从主菜单选择,Object/New Object/Equation,或,Quick/Estimation Equation ,，或者在,命令,窗口中输入关键词,equation,。,在随后出现的方程说明对话框中说明要建立的方程，并选择估计方法。下面我们详细介绍在EViews中如何说明方程。EViews将在方程窗口中估计方程并显示结果。,11/26/2024,3,6.2,在,EViews,中对方程进行说明,当创建一个方程对象时，会出现如下对话框：,在这个对话框中需要说明三件事：,方程说明，估计方法，估计使用的样本。,在最上面的编辑框中，可以说明方程：因变量（左边）和自变量（右边）以及函数形式。,有两种说明方程的基本方法：,列表法,和,公式法,。列表法简单但是只能用于不严格的线性说明；公式法更为一般，可用于说明非线性模型或带有参数约束的模型。,11/26/2024,4,6.2,.1,列表法,说明线性方程的最简单的方法是列出方程中要使用的变量列表。,首先是因变量或表达式名，然后是自变量列表。,例如，要说明一个线性消费函数，用一个常数,c,和收入,inc,对消费,cs,作回归，在方程说明对话框上部输入：,cs c inc,注意回归变量列表中的序列,c,，这是EViews用来说明回归中的常数而建立的序列。EViews在回归中不会自动包括一个常数，因此必须明确列出作为回归变量的常数。内部序列,c,不出现在工作文档中，除了说明方程外不能使用它。,在上例中，常数存储于c(1)，,inc,的系数存储于c(2)，即回归方程形式为：,cs = c(1)+c(2)*inc。,11/26/2024,5,在实际操作中会用到,滞后序列,，可以使用与滞后序列相同的名字来产生一个新序列，把滞后值放在序列名后的括号中。,cs,c,cs(-1) inc,相当的回归方程形式为：,cs =,c(1)+,c(2),cs(-1)+c(3),inc。,通过在滞后中使用关键词 to 可以包括一个连续范围的滞后序列。例如：cs c cs(-1 to -4) inc,这是cs关于常数，cs(-1)，cs(-2)，cs(-3)，cs(-4)，和inc的回归。,在变量列表中也可以包括,自动序列,。例如：,log(cs) c log(cs(-1),log,(inc+inc(-1)/2),相当的回归方程形式为：,log(cs) = c(1)+c(2),log(cs(-1)+c(3),log(inc+inc(-1)/2),10/5/2022,6,6.2.2,公式法说明方程,当列表方法满足不了要求时，可以用公式来说明方程。许多估计方法（但不是所有的方法）允许使用公式来说明方程。,EViews中的公式是一个,包括回归变量和系数的数学表达式,。要用公式说明一个方程，只需在对话框中变量列表处输入表达式即可。EViews会在方程中添加一个随机附加扰动项并用最小二乘法估计模型中的参数。,11/26/2024,7,用公式说明方程的,好处,是,可以使用不同的系数向量,。要创建新的系数向量，选择Object/New Object 并从主菜单中选择Matrix-Vector-Coef , 为系数向量输入一个名字，然后选择OK。在New Matrix对话框中，选择Coefficient Vector 并说明向量中应有多少行。带有系数向量图标,的对象会列在工作文档目录中，在方程说明中就可以使用这个系数向量。例如，假设创造了系数向量A和BETA，各有一行。则可以用新的系数向量代替 c ：,log(cs)=A(1)+ BETA(1)* log(cs(-1),10/5/2022,8,6.3,在,EViews,中估计方程,估计方法,说明方程后，现在需要选择估计方法。单击,Method,：进入对话框，会看到下拉菜单中的估计方法列表：,标准的单方程回归用最小二乘估计。其他的方法在以后的章节中介绍。采用OLS，TSLS，GMM和ARCH方法估计的方程可以用一个公式说明。非线性方程不允许使用binary，ordered，censored，count模型，或带有ARMA项的方程。,11/26/2024,9,6.3.2,估计样本,可以说明估计中要使用的样本。EViews会用,当前工作文档样本,来填充对话框。,如果估计中使用的任何一个序列的数据丢失了，EViews会临时调整观测值的估计样本以排除掉这些观测值。EViews通过在样本结果中报告实际样本来通知样本已经被调整了。,在方程结果的顶部, EViews报告样本已经得到了调整。从1978年,2002年期间的25个观测值中, EViews使用了24个观测值。,11/26/2024,10,6.3.3,估计选项,EViews提供很多估计选项。这些选项允许进行以下操作：对估计方程加权，计算异方差性，控制估计算法的各种特征。,11/26/2024,11,6.4,方程输出,在方程说明对话框中单击OK钮后，EViews显示估计结果,：,根据矩阵的概念, 标准的回归可以写为：,其中:,y,是因变量观测值的,T,维向量，,X,是解释变量观测值的,T,k,维矩阵，,T,是观测值个数，,k,是解释变量个数，,是,k,维系数向量，,u,是,T,维扰动项向量。,11/26/2024,12,系数框描述了系数,的估计值。最小二乘估计的系数,b,是由以下的公式计算得到的,如果使用列表法说明方程，系数会列在变量栏中相应的自变量名下；如果是使用公式法来说明方程，EViews会列出实际系数 c(1), c(2), c(3) 等等。,对于所考虑的简单线性模型，系数是在其他变量保持不变的情况下自变量对因变量的边际收益。系数,c,是回归中的常数或者截距-它是当其他所有自变量都为零时预测的基本水平。其他系数可以理解为假设所有其它变量都不变，相应的自变量和因变量之间的斜率关系。,1.,回归系数,(Coefficient),6.4.1,系数结果,11/26/2024,13,例6.1:,本例是用中国1978年2002年的数据建立的城镇消费方程：,cs,t,=,c,0,+,c,1,inc,t,+,u,t,其中:,cs,是城镇居民消费；,inc,是可支配收入；,c,1,代表了边际消费倾向，,0,c,1,1,，即收入每增加1元，消费将增加,c,1,元。从系数中可以看出边际消费倾向是0.514。也即1978年2002年中国城镇居民可支配收入的51,.4,%用来消费。,11/26/2024,14,2,.,标准误差,(Std.Error),标准,误,差主要用来,衡量回归系数估计的统计可信性,-,-标准,误,差越大，估计中的统计干扰越大。,估计系数的协方差矩阵是由以下公式计算得到的：,这里是残差，而且系数估计值的标准误差是这个矩阵对角线元素的平方根。可以通过选择,View/Covariance Matrix,项来察看整个协方差矩阵。,其中,10/5/2022,15,3. t-,统计量(t-Statistic),t统计量是由系数估计值和标准误差之间的比率来计算的，它是用来检验系数为零的假设的。,4. 概率（P值）(Prob.),结果的最后一项是在误差项为正态分布或系数估计值为渐近正态分布的假设下, 指出 t 统计量与实际观测值一致的概率。,这个概率称为边际显著性水平或 P 值。给定一个 P 值，可以一眼就看出是,拒绝,还是不拒绝实际系数为零的双边假设。例如，如果显著水平为5% ，P 值小于0.05就可以拒绝系数为零的原假设。,对于例1的结果，系数,inc,的零假设在1%的显著水平下被拒绝。,10/5/2022,16,6.4.2,方程,统计量,1. R2,统计量(R-squared),R,2,统计量衡量在样本内预测因变量值的回归是否成功。,R,2,是自变量所解释的因变量的方差。如果回归完全符合，统计值会等于1。如果结果不比因变量的均值好，统计值会等于0。,R,2,可能会由于一些原因成为负值。例如，回归没有截距或常数，或回归包含系数约束，或估计方法采用二阶段最小二乘法或ARCH方法。,EViews计算,R,2,的公式为,：,，,其中，是残差，是因变量的均值。,11/26/2024,17,2.,调整的,R,2,(Adjusted R-squared),使用,R,2,作为衡量工具存在的一个问题，即在增加新的自变量时,R,2,不会减少。在极端的情况下，如果把样本观测值都作为自变量，总能得到,R,2,为1。,R,2,调整后的记为，消除,R,2,中对模型没有解释力的新增变量。计算方法如下：,从不会大于,R,2,，随着增加变量会减小，而且对于很不适合的模型还可能是负值。,10/5/2022,18,3.,回归标准误差,(S.E. of regression),回归标准误差是在残差的方差的估计值基础之上的一个总结。计算方法如下：,4.,残差平方和(Sum squared resid),残差平方和可以用于很多统计计算中，为了方便，现在将它单独列出：,10/5/2022,19,5.,对数似然函数值(Log likelihood),EViews可以作出根据系数的估计值得到的对数似然函数值（假设误差为正态分布）。似然比检验可以通过观察方程严格形式和不严格形式的对数似然值之间的差异来进行。,对数似然值计算公式如下：,10/5/2022,20,6. DW,统计量,(Durbin-Watson stat),D-W 统计量衡量残差的序列相关性，计算方法如下：,作为一个规则，如果,DW,值接近2，证明不存在序列相关。在例1的结果中，,DW,值很小，表明残差中存在序列相关。关于Durbin-Watson统计量和残差序列相关更详细的内容参见“序列相关理论”。,对于序列相关还有更好的检验方法。在 “序列相关的检验”中，我们讨论Q统计量和 LM检验，这些都是比DW统计量更为一般的序列相关检验方法。,10/5/2022,21,7.,因变量均值和标准差,（Mean/S.D. dependent var）,y,的均值和标准差由下面标准公式算出：,8.,赤池信息准则,(Akaike Info Criterion),计算公式如下：,其中,l,是对数似然值,我们进行模型选择时，,AIC值越小越好,。例如，可以通过选择最小AIC值来确定一个滞后分布的长度。,10/5/2022,22,9. 施瓦茨,准则,(,Schwarz,Criterion,),SC准则是AIC准则的替代方法:,10. F,统计量及其P值,F-statistic/Prob,（,F-statistic）,F统计量检验回归中所有的系数是否为零(除了常数或截距)。对于普通最小二乘模型，F统计量由下式计算：,在原假设为误差正态分布下，统计量服从,F(,k,1 ,T,k,),分布。,10/5/2022,23,F统计量下的P值，即Prob(F-statistic)，是F检验的边际显著性水平。如果P值小于所检验的边际显著水平，比如说0.05，则拒绝所有系数都为零的原假设。对于例1，P值几乎为零，因此，我们拒绝回归系数为零的原假设。注意F检验是一个联合检验，即使所有的t统计量都是不显著的，F统计量也可能是高度显著的。,11/26/2024,24,6.5,方程操作,6.5.1,方程视图,Representations,以三种形式显示方程：EViews命令形式，带系数符号的代数方程，和有系数估计值的方程。,可以将这些结果剪切和粘贴到支持Windows剪贴板的应用文档中。,11/26/2024,25, Estimation Output显示方程结果。, Actual, Fitted, Residual以图表和数字的形式显示因变量的实际值、拟合值及残差。,Actual, Fitted, Residual Table 以表的形式来显示这些值。,10/5/2022,26, Gradients and Derivatives.描述目标函数的梯度和回归函数的导数计算的信息。, Covariance Matrix以表的形式显示系数估计值的协方差矩阵。, Coefficient Tests, Residual Tests, and Stability Tests,这些是 “定义和诊断检验”中要详细介绍的内容。,11/26/2024,27,6.5.2,方程过程, Specify/Estimate. 编辑方程说明、改变估计方法、估计样本。, Forecast . 用估计方程的预测。, Make Modle 创建一个与被估计方程有关的未命名模型。, Update Coefs from Equation 把方程系数的估计值放在系数向量中。, Make Regressor Group 创建包含方程中使用的所有变量的未命名组（常数除外）。, Made Residual Series. 以序列形式保存回归中的残差。, Make Derivative Group 创建包含回归函数关于其系数的导数的组。, Made Gradient Group 创建包含目标函数关于模型的系数的斜率的组。,11/26/2024,28,下面讨论几种形式的回归模型：,（1）双对数线性模型（不变弹性模型）,（2）半对数模型,（3）双曲函数模型,（4）多项式回归模型,所有这些模型的一个重要特征是：它们都是参数线性模型，但是变量却不一定是线性的。,(1),双对数线性方程,双对数线性模型估计得到的参数本身就是该变量的弹性。如设,Q,t,为需求量，,P,t,为价格，在方程,log(,Q,t,)=,+,log(,P,t,) +,u,t,的估计式中，,P,增加1%时，,Q,大约增加,%，,所以,相当于,Q,t,的价格弹性。,6.6,回归模型的其它函数形式,11/26/2024,29,推导,当,t,+1,期的,P,比上一期增加1%时，有,log(,Q,t,+1,) =,+,log(,P,t,1.01) =,+,log(,P,t,)+,log(1.01),= log(,Q,t,) +,log(1.01),移项得，,log(,Q,t+,1,) log(,Q,t,) =,log(1.01),，即,，还原得,因此，,P,变化1%时，,Q,大约变化,%。,例6.2,:,下面建立我国城镇消费的双对数线性方程：,log(,CS,t,)=,-,0.,81,+ 0.,848,log(,INC,t,) + 0.,376,log(C,PI,t-,1,),t=(-3.04) (13.74) (2.57),R,2,= 0.998 D.W. = 1.33,其中,CS,t,是城镇居民消费，,INC,t,是城镇居民可支配收入，,C,PI,t,是消费价格指数。,10/5/2022,30,方程中消费的收入弹性为0.848，说明我国城镇居民收入每增加1%，将使得城镇居民消费增加0.848%。消费的价格弹性为0.376，说明前一年的物价每增加1%，将使得城镇居民消费增加0.376%。,10/5/2022,31,(2),半对数模型,线性模型与对数线性模型的混合就是半对数模型,半对数方程又称增长模型，通常用来估计因变量的平均增长率。如果,x,取“时间”,t,，即按时间顺序依次取值为1，2，,T,，变量,t,的系数,1,度量了,ln(,y,),随时间向前推进产生的变化。如果,1,为正，则有随时间向上增长的趋势；如果,1,为负，则有随时间向下的趋势，因此,t,可称为趋势变量，而且,是,y,的平均增长率。宏观经济模型表达式中常有时间趋势，在研究经济长期增长或确定性趋势成分时，常常将产出取对数，然后用时间t作解释变量建立回归方程。,10/5/2022,32,例6.3:,我们建立半对数线性方程，估计我国实际,GDP,（支出法，样本区间：19782003年）的长期平均增长率，模型形式为,其中：,GDP,P,t,表示剔出价格因素的实际,GDP,t,。方程中时间趋势变量的系数估计值是0.0815，说明我国实际GDP（支出法）年平均增长率为8.15%。F值或R,2,表明模型拟合效果很好，D.W.显示模型存在（正的）自相关。,10/5/2022,33,(3) 双曲函数模型,形如下式的模型称为双曲函数模型,Y,t,=,b,1,+,b,2,(1/,X,t,) +,u,t,这是一个变量之间是非线性的模型，因为Xt 是以倒数的形式进入模型的，但这个模型却是参数线性模型，因为模型中参数之间是线性的。这个模型的显著特征是随着,X,t,的无限增大，,（1/,X,t,）,接近于零。,11/26/2024,34,例6.4,美国菲利普斯曲线,利用美国19541984年的数据，根据菲利普斯曲线，即通货膨胀率,t和失业率Ut的反向关系，建立双曲函数：,估计结果表明，菲利普斯曲线所描述的,t,和,U,t,的反向关系并不存在。之所以出现这样的背离，主要是因为20世纪70年代出现石油危机，从而引发了“滞胀”，通货膨胀伴随着高失业率。如果考虑到通货膨胀预期的影响，则可以在模型中引入代表通货膨胀预期的变量，比如用通货膨胀前期值来代表。,10/5/2022,35,含有通货膨胀预期的菲利普斯曲线估计结果为,可以看出，加入通货膨胀预期因素后，模型的拟合效果很好，而且这时的模型体现出了失业率和通货膨胀率之间的显著的反向变动关系。,10/5/2022,36,6.7,估计中存在的问题,如果自变量具有高度共线性，EViews 在计算回归估计时会遇到困难。在这种情况下，EViews会产生一个显示错误信息对话框 “奇异矩阵”。出现这个错误信息后，应该检查回归变量是否是共线的。如果一个回归变量可以写作其他回归变量的线性组合，则回归变量是完全共线的。在完全共线的情况下，回归变量矩阵,X,不是列满秩的，不能计算OLS估计值。,11/26/2024,37,6.8,定义和诊断检验,经验研究经常是一种相互影响的过程，这一过程从模型中变量关系的定义开始。选择定义常含有几个选择：变量，连接这些变量的函数，以及当数据是时间序列时表示变量间关系的动态结构。,不可避免地，在初始定义的恰当性方面存在不确定性。一旦估计了方程，EViews提供了评价方程定义质量的工具。随着改进，检验结果将影响所选择的定义，这一过程将重复下去，直到方程定义恰当为止。,本节描述了在方程对象的View中关于定义检验统计量的多个菜单。我们试图提供足够的统计方法来进行这些检验，但是实际考虑的许多描述是不完全的，建议查阅标准统计和经济计量学参考资料。,11/26/2024,38,下面描述的每一检验过程包括假设检验的原假设定义。检验指令输出包括一个或多个检验统计量样本值和它们的联合概率值（P值）。,P值,说明在原假设为真的情况下，所得到的样本结果会象实际观测结果那么极端或更极端的概率。P值是反映实际观测到的数据与原假设之间不一致程度的一个概率值，P值越大，错误地拒绝原假设的可能性就越大；,P值越小，拒绝原假设时就越放心。,例如，如果P值在0.01和0.05之间，原假设在5%被拒绝而不是在1%水平。切记：对每一检验都有不同假设和分布结果。例如，有些检验统计量有确切的有限的样本分布（常为 t 或 F分布），其它是服从近似分布的大样本检验统计量。每一检验的内容都不同，将分别描述。,10/5/2022,39,其它检验在后面有关章节讨论。它们包括单位根检验、Granger因果检验和Johansen协整检验。,方程对象菜单的View中给出三种检验类型选择来检验方程定义。包括,系数检验,、,残差检验,和,稳定性检验,：,11/26/2024,40,6.8,.,1,系数检验,系数检验对估计系数的约束进行评价，包括对遗漏变量和冗余变量特殊情况的检验。,一、,Wald,检验系数约束条件检验,1,.,Wald,检验原理,Wald检验没有把原假设定义的系数限制加入回归，通过估计这一无限制回归来计算检验统计量。Wald统计量计算无约束估计量如何满足原假设下的约束。如果约束为真，无约束估计量应接近于满足约束条件。下面给出计算Wald 检验统计量的一般公式。,11/26/2024,41,对于一个线性回归模型,一个线性约束：,式中,R,是一个已知的,q,k,阶矩阵，,r,是,q,维向量。Wald统计量简写为：,W,在,H,0,下服从渐近,2,(,q,),分布。进一步假设误差独立同时服从正态分布，我们就有一确定的、有限的样本F-统计量,是约束回归的残差向量。,F统计量比较有约束和没有约束计算出的残差平方和。如果约束有效，这两个残差平方和差异很小，F统计量值也应很小。,EViews显示,2,和F统计量以及相应的P值。,10/5/2022,42,2.,如何进行,Wald,系数检验,为介绍如何进行Wald系数检验，我们考虑一个例子。生产函数的数学形式为,在最初提出的C-D生产函数中，假定参数满足,+,=1,，也就是假定研究对象满足规模报酬不变。,Q,为产出，,K,为资本投入，,L,为,劳动力投入。很容易推出参数,分别是资本和劳动的产出弹性。那么由产出弹性的经济意义，应该有,即当资本与劳动的数量同时增长,倍时，产出量也增长,倍。1937年，提出了C-D生产函数的改进型，即取消了,+,=1,的假定，允许要素的产出弹性之和大于1或小于1，即承认研究对象可以是规模报酬递增的，也可以是规模报酬递减的，取决于参数的估计结果。,10/5/2022,43,例,6.5,Cobb-Douglas生产函数估计形式如下：,利用美国主要金属工业企业的数据（27个企业的数据），C-D生产函数估计结果如下：,(1),10/5/2022,44,从结果看LogL和logK的系数和小于1，但为确定这种差异是统计相关的，我们常进行有约束的Wald系数检验。选择,View/Coefficient Tests/Wald-Coefficient Restrictions,，在编辑对话框中输入约束条件。约束条件应表示为含有估计参数和常数（不可以含有序列名）的方程，系数应表示为c(1)，c(2)等等，除非在估计中已使用过一个不同的系数向量。为检验,+,=1,的规模报酬不变的假设，在对话框中输入下列约束：,c(2) + c(3) = 1,单击OK，EViews显示Wald检验如下结果（,原假设：约束条件有效,）：,EViews显示F统计量和,2,统计量及相应的P值。,2,统计量等于F 统计量乘以检验约束条件数,。本例中，仅有一个约束条件，所以这两个检验统计量等价。它们的P值表明我们不拒绝规模报酬不变的原假设。,10/5/2022,45,下面考虑检验多个约束条件的情况。例如，改变前面的C-D生产函数为非线性形式，我们估计一个如下形式的生产函数,检验约束条件：。这个非线性模型的估计结果如下：,10/5/2022,46,检验多个约束条件，应用逗号隔开约束条件,。在方程对话框中选择View/Coefficient tests/Wald Coefficient Restrictions。在Wald检验对话框中输入如下约束条件：c(4)=0， c(5) = 0，c(6)=0，结果如下：,检验结果是不能拒绝原假设，表明(1)式的Cobb-Douglas生产函数是这一问题较适当的方程定义形式。,10/5/2022,47,二、遗漏变量,(Omitted Variables),检验,1,. 遗漏变量检验原理,这一检验能给现有方程添加变量，而且询问添加的变量对解释因变量变动是否有显著作用。,原假设,H,0,是添加变量不显著,。,检验的输出是 F 统计量和对数似然比（LR）统计量及各自P值，以及在备选假设下无约束模型估计结果。F统计量基于约束和无约束回归残差平方和之比。LR统计量由下式计算：,L,r,和,L,u,是约束和无约束回归对数似然函数的最大值。在,H,0,下，LR统计量渐近服从,2,分布，自由度等于约束条件数，即加入变量数。,10/5/2022,48,注意：,(1),遗漏变量检验要求在原始方程中和检验方程中观测值个数相等,。如果要加入变量的某一序列与原方程样本相比，含有缺失观测值（当加入滞后变量时这种情况常见），检验统计量将无法建立。,(2) 遗漏变量检验可应用于线性LS, TSLS, ARCH, Binary, Ordered, Censored, Count模型估计方程。,只有通过列表法列出回归因子定义方程而不能通过公式，检验才可以进行,。,2,. 如何进行遗漏变量检验,选择,View/Coefficient Tests/Omitted VariablesLikelihood Ration,，在打开的对话框中，列出每一个检验统计量名，相互之间用空格隔开。,10/5/2022,49,例如：原始回归为： log(q) c log(L) log(k) 。输入：K L,EViews将显示含有这两个附加解释变量的无约束回归结果，而且,显示,原假设：新添变量系数为0,的检验统计量,。输出的结果如下：,对数似数比统计量就是LR检验统计量且渐进服从于,2,分布,，自由度等于添加回归因子数。,本例中，检验结果不能拒绝原假设，即添加变量不显著。,10/5/2022,50,三、冗余,(Redundant Variables),变量,1. 冗余变量检验原理,冗余变量检验可以检验方程中一部分变量的统计显著性，即确定方程中一部分变量系数是否为0，从而判断该变量是否可以从方程中剔出去。,原假设：被检验变量系数为0,。冗余变量检验可以应用于线性LS，TSLS，ARCH（仅均值方程）， Binary， Ordered，Censored，Count模型估计方程。,只有以列表法列出回归因子形式，而不是公式定义方程，检验才可以进行,。,2,. 如何进行冗余变量检验,选择View/Coefficient Tests/Redundant Variablelikelihood Ratio，在对话框中，输入每一个检验的变量名，相互间至少用一空格隔开。,10/5/2022,51,例如：原始回归为,ls log(Q) c log(L) log(K) K L,如果输入增加的变量K和L ，EViews显示去掉这两个回归因子的约束回归结果，以及检验,原假设：被检验变量系数为0,的统计量。结果如下：,检验统计量是F统计量和对数似然比。如果误差是独立正态分布随机变量，F-统计量服从F分布，分子自由度为原假设下系数约束条件数，分母自由度为总回归自由度。LR检验是渐近检验，服从,2,分布。,10/5/2022,52,6.8.2,残差检验,EViews提供了对估计方程残差的序列相关，正态性，异方差性和自回归条件异方差性检验。,11/26/2024,53,(1) 相关图和Q,统计量,(2) 残差平方相关,图,(3) 直方图和正态检验,显示直方图和残差的描述统计量，包括检验正态分布的Jarque-Bera统计量。如果残差服从正态分布，直方图应呈钟型，J-B统计量应不显著。也适用于LS，TSLS，非线性LS等模型残差。选择View/Residual Tests/Histogram Normality显示直方图和J-B统计量。在,原假设：残差服从正态分布,成立的条件,下，J-B统计量应服从自由度为2的,2,分布。,(4) 序列相关LM检验,(5) ARCH LM检验,(6) White异方差性检验,10/5/2022,54,6.8.3,稳定性检验,一个推荐的经验方法是把观测值区间,T,分为,T,1,和,T,2,两部分。,T,1,个观测值用于估计，,T,2,个观测值用于检验和评价。把所有样本数据用于估计，有利于形成最好的拟合，但没有考虑到模型检验，也无法检验参数不变性，估计关系的稳定性。检验预测效果要用估计时未用到的数据，建模时常用,T,1,区间估计模型，用,T,2,区间检验和评价效果。对于子区间,T,1,和,T,2,的相对大小，没有太明确的规则。有时可能会出现明显的结构变化的转折点，例如战争，石油危机等。当看不出有转折点时，常用的经验方法是用85%-90%的数据作估计，剩余的数据作检验。,EViews提供了一些检验统计量选项，它们检查,模型参数在数据的不同子区间是否平稳,。,11/26/2024,55,1. Chow,分割点检验,Chow分割点检验的思想是对每一个子样本区间估计方程，看估计方程中是否存在显著差异。有显著差异说明关系中存在结构变化。例如，可以使用这个检验来检查石油危机前后的能源需求函数是否一样。,为进行检验，把数据分为两个或多个子样本区间，每一子区间包含的观测值数应大于方程参数，这样才使得方程能被估计。,Chow分割点检验基于比较利用整个样本估计方程获得的残差平方和及利用每一子区间样本估计方程获得的残差平方和之间的差别,。,对Chow分割点检验，EViews提供了两个检验统计量。,F统计量,和,对数似然比（LR）统计量,，,F统计量基于对约束和非约束残差平方和的比较。在最简单情况下（一个分割点）,F统计量,计算如下：,10/5/2022,56,Chow分割点检验的,原假设:不存在结构变化,。,Chow分割点检验的主要缺陷是，如果每一个子区间要求至少和被估计参数一样多的样本数，那么这里就存在一个问题，比如说，要检验战争与和平时期的结构变化，但是战争时期的样本数较少。后面将要讨论的Chow预测检验可以解决这个问题。,其中:,是整个样本期间估计的残差平方和；是第,i,个子区间的残差平方和；,T,是观测值数；,k,是方程参数个数，这一公式可以扩展为多于一个分割点的情形。,10/5/2022,57,为了进行Chow分割点检验，选择View/Stability Tests/Chow Breakpoint Test出现对话框以后，填入间断点的日期。比如，如果方程的数据是从1950到1994，填入1960，则被定义成两个子区间：一个是1950到1959，另一个是1960到1994。,例6.6,我们利用Chow检验来判断例6.1所建立的消费函数的稳定性。20世纪90年代前的中国仍然处于卖方市场，虽然居民收入水平增幅较大，但商品供给有限，而且当时的利息率较高，因而居民收入更加倾向于储蓄增值而不是立即消费。1994年我国开始了全面的体制改革和制度创新，随着国有企业体制改革的推进和大量非国有企业的兴起并日益壮大，国内商品市场日益繁荣，商品品种更加丰富，使得居民收入用于消费的部分增加。不妨以1994年为假想的间断点，用Chow检验判断1994之前和之后的两段时期消费函数是否产生了显著的差异。,该结果是拒绝原假设：,存在结构变化,。,10/5/2022,58,Chow预测检验先估计了包括,T,1,区间子样本的所有样本观测值的模型，然后用同样的模型去估计,T,2,区间样本的因变量的值。如果实际值和预测值差异很大，就说明模型可能不稳定。检验适用于最小二乘法和二阶段最小二乘法。,EViews给出F统计量计算如下：,这里用所有样本观测值估计方程的残差平方和，是用,T,1,子样本进行估计方程的残差平方和，,k,是被估计参数的个数。当误差是独立同正态分布时，F统计量服从精确的有限样本的F分布。,2. Chow,预测检验,10/5/2022,59,选择,View/Stability Test /Chow Forecast Test,进行Chow预测检验，对预测样本开始的时期或观测值数进行定义，数据应在当前观测值区间内。,仍以例6.1所建立的消费函数为例，定义1994年作为预测区间的第一个观察值。利用19781993年的数据重新估计方程，并且使用该方程来计算剩余时期的预测误差。检验结果如下：,对数似然比（LR）统计量拒绝原假设：中国的消费函数在1994年前后有结构变化，但F统计量不能拒绝原假设。,注意：本例说明两种Chow检验产生相同的结果。但有时也会产生相反的结果。,10/5/2022,60,6.9,EViews,中的方程预测,为说明一个被估计方程的预测过程，我们从一个估计的线性回归方程开始。我们将利用美国1947Q011995Q01国内生产总值（GDP）、消费（CS）和投资（INV）数据进行方程预测。,11/26/2024,61,6.9.1,如何进行预测,为预测该方程的GDP，在方程的工具栏中按,Forecast,按钮，或选择Proc/ Forecast 。这时会出现下表：,11/26/2024,62,我们应提供如下信息：,1. 序列名,预测后的序列名,将所要预测的因变量名填入编辑框中。EViews默认了一个名字，但可以将它变为任意别的有效序列名。这个名字应不同于因变量名，因为预测过程会覆盖已给定的序列值。,S.E.（Optional）,如果需要，可以为该序列的预测标准差提供一个名字。如果省略该项，预测标准误差将不被保存。,GARCH（Optional）,对用ARCH估计的模型，还可以保存条件方差的预测值（GARCH项）。,10/5/2022,63,2.,预测方法,动态(Dynamic),从预测样本的第一期开始计算多步预测。,静态(Static),利用滞后因变量的实际值计算一步向前,(one-step-ahead)预测的结果。,结构(Structural),预测时EViews将忽略方程中的任何ARMA项。若不选此项，在方程中有ARMA项时，动态与静态方法都会对残差进行预测。但如果选择了Structural，所有预测都会忽略残差项而只对模型的结构部分进行预测。,样本区间(Sample range),必须指定用来做预测的样本。如果缺选，EViews将该样本置为工作文件样本。如果指定的样本超出估计方程所使用的样本区间(估计样本)，那么会使EViews产生样本外预测。,注意：需要提供样本外预测期间的解释变量值。对静态预测，还必须提供滞后因变量的数值。,10/5/2022,64,3,. 输出,可以选择以图表或数值，或者二者同时的形式来观察预测值。注意：预测值被保存在GDPF序列中。因为GDPF序列是一个标准的EViews序列，所以可以利用序列对象的所有标准工具来检验预测结果。,10/5/2022,65,我们可以比较GDP的实际值和动态预测拟合值GDPFD、静态预测拟合值GDPFS，可以看出一步向前静态预测比动态预测要更为准确，因为对每个时期，在形成GDP的预测值时使用的,是GDP(-1)的实际值。,10/5/2022,66,对于没有包含在预测样本中的数值，会有两种选择。作为缺省，EViews将用其因变量的实际值填充；另一种是不选择Insert actuals for out-of-sample，预测样本外的数值都将赋予“NA”，于是，这样设置的结果是被预测序列中的所有数据在预测过程中将被覆盖，被预测序列的已存值将会丢失。,11/26/2024,67,6.9.2,预测误差和,预测效果评估,假设真实的模型由下式给定：,这里,u,t,是独立同分布，均值为零的随机扰动项，,是未知参数向量。下面我们放松,u,t,是独立的限制。,生成,y,的真实模型我们尚不知道，但我们得到了未知参数,的估计值,b,。设误差项均值为零，可以得到,y,的预测方程：,该预测的误差为实际值与预测值之差,11/26/2024,68,假设我们利用1947:021993:04的样本数据估计得出GDP方程，然后分别进行1947:021995:01和1994:011995:01关于GDP的动态预测。如果选中Forecast evaluation (预测效果评估)， EViews将显示预测效果评估的统计结果表：,10/5/2022,69,注意,：如果预测样本中没有因变量的实际值数据，,EViews不能进行预测效果评估。,假设预测样本为,t,=,T,+1,T,+2, ,T,+,h,，,T,为实际值样本长度，用和,y,t,分别表示,t,期的预测值与实际值。计算出的预测误差评价指标如下所示：,Root Mean Squared Error,均方根误差,Mean Absolute Error,平均绝对误差,Mean Absolute,Percent Error,平均相对误差,Theil Inequality Coefficient,泰尔不等系数,10/5/2022,70,前两个预测误差统计量由因变量绝对数值大小决定。它们作为评价指标应该用来比较同样的序列在不同模型中的预测效果，误差越小，该模型的预测能力越强。,后两个统计值是相对量。泰尔(Theil)不等系数总是处于0和1之间，数值越小，预测精度越高，值为0时表示与真实值完全拟合。,预测均方误差MSE可以分解为：,式中分别为和,y,的平均值和标准差，,r,为和,y,的相关系数。据此有以下定义：,10/5/2022,71,Bias Proportion,偏差比,Variance Proportion,方差比,Covariance Proportion,协方差比,偏差比表明预测均值与序列实际均值的偏差程度；方差比表明预测方差与序列实际方差的偏离程度；协方差比衡量非系统误差的大小。,注意：偏差比、方差比和协方差比之和为1。,如果预测结果好，那么偏差比和方差比应该较小，协方差比应该较大。,10/5/2022,72,6.9.3,含有滞后因变量的预测,在方程等号的右边出现滞后变量时，预测变得更为复杂。例如，我们可以在原来的形式后面引入y的一阶滞后：,y c x z y,(-1),1.动态预测,如果选择动态预测，EViews将从预测样本的起始日期开始，对y进行多步预测。对上式只指定一个滞后变量的情况：,11/26/2024,73,预测样本的初始值将使用滞后变量,y,的实际值。因此，如果,y,的实际样本值是,T,个，我们从,T,+1开始预测，即,T,+1是第一个预测值，EViews将计算,这里,y,T,是预测样本开始前一期的滞后内生变量值，这就是一步向前预测。随后的,h,个预测值，,k,= 1 , 2 , ,h,，将使用前期,y,的预测值：,这种预测方法显著地不同于静态的一步向前预测。在估计方程中，如果有,y,的其它滞后变量，需要对如上运算进行修改。,10/5/2022,74,2.,静态预测,静态预测对因变量进行一系列的一步向前预测：,EViews采用滞后内生变量的实际值，通过下式对,k,=0 , 1 , 2 , ,h,计算每一个预测值：,静态预测要求外生变量和任何滞后内生变量在预测样本中的观测值可以获得,。如上，如果需要，EViews将对预测样本进行调整以解释滞后变量的前期样本。如果没有某期数据，对应该期的预测值为NA，它并不会对以后预测产生影响。,10/5/2022,75,带有公式的预测方程,EViews可以提供对方程左边的因变量是某个表达式的情况下，,预测这个表达式,的功能。而且如果公式中的第一个序列能从表达式求解出来，那么EViews还可以提供,预测公式中第一个序列,的功能。,11/26/2024,76,例如，假设估计如下定义的方程：,log(gdp) c log(cs) log(gdp(-1),当选择Forecast按钮，预测对话框显示如下，注意该对话框提供了两种预测序列以供选择：表达式 log(gdp) 与第一个序列gdp。,10/5/2022,77,但是，如果将方程定义为：,x+1/x=c(1)+c(2)*y,EViews就不能求解出第一个序列X，而只能预测表达式了。预测对话框如下：,10/5/2022,78,案例分析,提出问题：,改革开放以来随着中国经济的快速发展，居民的消费水平也不断增长。但全国各地区经济发展速度不同，居民消费水平也有明显差异。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素，并分析影响因素与消费水平的数量关系，可以建立相应的计量经济模型去研究。,研究范围：,全国各省市2002年城市居民家庭平均每人每年消费截面数据模型。,11/26/2024,79,理论分析：,影响各地区城市居民人均消费支出的因素有多种，但从理论和经验分析，最主要的影响因素应是居民收入。从理论上说可支配收入越高，居民消费越多，但边际消费倾向大于0，小于1。,建立模型：,其中：,Y,城市居民家庭平均每人每年消费支出(元),X,城市居民人均年可支配收入(元),11/26/2024,80,数据：,从2003年中国统计年鉴中得到,地区,城市居民家庭平均每人每年消费支出(元),Y,城市居民人均年可支配收入(元),X,北京,天津,河北,山西,内蒙古,辽宁,吉林,黑龙江,上海,江苏,浙江,安徽,福建,江西,山东,河南,湖北,10284.60,7191.96,5069.28,4710.96,4859.88,5342.64,4973.88,4462.08,10464.00,6042.60,8713.08,4736.52,6631.68,4549.32,5596.32,4504.68,5608.92,12463.92,9337.56,6679.68,5234.35,6051.06,6524.52,6260.16,6100.56,13249.80,8177.64,11715.60,6032.40,9189.36,6334.64,7614.36,6245.40,6788.52,11/26/2024,81,（接上页数据表）,地区,城市居民家庭平均每人每年消费支出(元),Y,城市居民人均年可支配收入(元),X,湖南,广东,广西,海南,重庆,四川,贵州,云南,西藏,陕西,甘肃,青海,宁夏,新疆,5574.72,8988.48,5413.44,5459.64,6360.24,5413.08,4598.28,5827.92,6952.44,5278.04,5064.24,5042.52,6104.92,5636.40,6958.56,11137.20,7315.32,6822.72,7238.04,6610.80,5944.08,7240.56,8079.12,6330.84,6151.44,6170.52,6067.44,6899.64,11/26/2024,82,估计参数,具体操作：使用,EViews,软件包。估计结果：,假定模型中随机扰动满足基本假定，可用OLS法。,11/26/2024,83,表示为,11/26/2024,84,11/26/2024,85,4. 经济意义检验：,估计的解释变量的系数为0.758511，说明城镇居民人均可支配收入每增加1元，人均年消费支出平均将增加0.758511元。这符合经济理论对边际消费倾向的界定。,11/26/2024,86,点预测：,西部地区的城市居民人均年可支配收入第一步争取达到1000美元（按当时汇率即人民币8270元），,代入估计的模型得,第二步再争取达到1500美元（即人民币12405元），利用所估计的模型可预测这时城市居民可能达到的人均年消费支出水平,经济预测,11/26/2024,87,平均值区间预测上下限,：,区间预测,11/26/2024,88,即是说,：,平均值置信度95%的预测区间为（6393.03，6717.23）元,。,平均值置信度95%的预测区间为（9292.33，10090.83）元,。,个别值区间预测（略）,11/26/2024,89,

展开阅读全文

《基本回归模型》PPT课件

最新文档