第四章 设定误差

上传人:孙哥 文档编号:172243370 上传时间:2022-12-02 格式:DOCX 页数:35 大小:272.51KB
返回 下载 相关 举报
第四章 设定误差_第1页
第1页 / 共35页
第四章 设定误差_第2页
第2页 / 共35页
第四章 设定误差_第3页
第3页 / 共35页
点击查看更多>>
资源描述
第四章 模型的设定误差我们已经知道 OLS 方法是计量经济学的重要估计工具,是回归模型参数估 计的核心方法。该方法经常用于对大量数据集的分析,因为它是在对方程做出最 简单的一组假定条件下推导出来的。并且,由此得到的参数估计不仅具有令人满 意的统计性质,还能得到一系列统计分布,这为进一步的统计推断建立了基础。 但是,上述所做的一切,即建立的样本回归模型距离真实的理论模型相差多远? 包括变量和模型的函数形式。对这一类问题的分析就是模型的设定误差分析。本章主要内容:1、设定误差的概念。2、设定误差的表现类型。变量引起的设定误差遗漏变量、多余变量3、测量误差解释变量具有测量误差、被解释变量具有测量误差、解释 变量和被解释变量均具有测量误差。4、设定误差的检验。内容可参见教材,庞皓,计量经济学,科学出版社,2005 年,第九章。节 设定误差概述一、什么是设定误差一个计量经济模型能否正确地描述和解释经济现象(被解释变量)与影响因 素(解释变量)之间存在的真实的客观关系,被称为模型的设定问题。计量经济模型是对变量间经济关系因果性的设想,若所设定的回归模型是 “正确”的,主要任务是对所选模型的参数进行估计和假设检验。但是如果对计量 模型的各种诊断或检验总不能令人满意,这时应把注意力集中到模型的设定方 面。考虑如下问题:所建模型是否遗漏了重要的变量?是否包含了多余的变量?所选模型的函数形式是否正确?随机扰动项的设定是否合理?被解释变量和解释变量的数据收集是否有误差(测量误差)?所有这些,在计量经济学中被统称为设定误差。在设定模型时包括以下内容,模型中解释变量的构成、模型的函数形式以及 随机扰动项的若干假定等。如果关于这些内容的设定与客观实际(真实模型)不 一致,利用计量经济模型来描述经济变量的关系时,就会产生误差,我们把这种 误差称为设定误差。二、设定误差的类型从误差来源看,设定误差主要包括1、变量的设定误差 包括遗漏相关变量(欠拟合),误选无关变量(过拟合)。2、变量数据的测量误差计量经济模型使用了不准确的经济变量数据。3、模型函数形式的设定误差“真实”的模型为Y 二 AX 久 X 卩2 eu(4.1)12但却将模型设定为Y = p +p X +p X + u(4.2)0 1 1 2 24、随机扰动项的设定误差本章主要讨论1、2两种误差。三、出现设定误差的原因归纳起来,经典线性回归模型应包含以下基本假定假定 1:干扰项的均值为零。假定 2:同方差性或方差相等。假定 3:各个干扰项无自相关。假定 4: X 和 u 的协方差为零。ii假定 5:无多重共线性。假定 6:回归模型对参数是线性的。假定7:在重复抽样中 X 的值是固定的(非随机)。假定 8:观测次数必须大于待估计的参数个数。假定 9:解释变量要有变异性(即样本中, X 的取值不能完全相同)。i假定 10:模型没有设定误差。在建模中,古典假设常常不能完全满足,这就导致了建立的计量经济模型总 是存在这样或那样的模型设定方面的问题。出现设定误差的原因是多方面的,主要有1、数据来源渠道可能不畅当数据很难取得,可能被迫将具有重要经济意义的变量排斥在模型之外(遗 漏变量),随机扰动项的异方差性、自相关性从广义的角度看是一种模型设定误 差(遗漏变量)所引起的。2、不知道变量应当以什么确切的函数形式出现在回归模型中3、事先并不知道所研究的实证数据中所隐含的真实模型究竟是什么样4、其它原因(1)当随机扰动项与一个或多个解释变量存在相关性时,用计量经济模型 描述变量间的经济关系时,会产生设定误差。(2)测量误差(搜集数据过程中的登记误差、数据加工整理过程中的整理 误差以及其它统计误差等)的存在,也会产生设定误差。在获取统计数据的过程 中(这本身属于统计学家的工作),由于可能会受到各种因素的影响或干扰,使 得样本数据存在着一定的误差。这些误差既包括登记性误差,也包括代表性误差 (抽样过程中所形成的误差)。登记性误差还包括统计误差和对数据整理的误差。 我们把这些误差统称为测量误差。测量误差的存在对计量经济学建模会有一些影 响。测量误差主要表现在对变量的影响,分为解释变量的测量误差、被解释变量 的测量和解释变量与被解释变量同时存在测量误差等几种情况。(3)一些随机因素引起的设定误差,自然灾害的干扰、经济大的波动等导 致经济结构发生较大变化。第二节 设定误差的后果设定误差的存在会对模型形成不良的后果,以下讨论变量设定误差(欠拟合、 过拟合)、变量数据测量误差的后果。一、变量设定误差的后果1、相关解释变量遗漏(欠拟合)的后果 相关解释变量的遗漏,会使得参数估计量为有偏的,且非一致。设正确模型为 Y二B + P X + P X + u 模型误设为 其中,则模型i 1 2 2i3Y = a + a X + vi 122i iv =P X + ui 33i i中的a的OLS估计量为23i(4.3)(4.4)(4.4)Z(X - X)(Y - Y)Z(X - X)22i(4.5)将(4.3)代入(4.5),解得aE(X - X )(Y - Y)a =22 i-2 E(X X )22 i_2_E(X X )(P +P X +P X + u )-(P +P X +P X + u )=2212233i12233iE(X X )2_2 i2 _e(X - X)P,X - X+ P,X - X ) + (u - u)=2i222i2i 33i3ii iE(X X )22 i2EP x2 + P Ex x + Ex (u 一 u )2 2 i32 i 3i2 titEx 22i_(4.6)Ex xEx (u 一 u )P + P2i 3i +2 i1 -23 Ex2Ex22 i2i对(4.6)式两边求期望和极限概率,得(4.7)Lp(4.8)2e( a)= e卩 +p EX2凡 + Ex2i (ui- ui)邛 223 Ex2L人 Q D COV (X , XP lim a = p + p23十缶 占n” 223 Var(X )Var(X )2 i2 i同理,可以对a进行类似的讨论(略)。1注意,v 二 B X + ui33 i i:.Cov (v , X ) = Cov (P X + u , X )i2 i3 3 ii 2 i=Cov (P X , X ) + Cov (u , X )*33 i 2 ii 2 i在*式中,虽然Cov (u , X ) = 0,但如果X与X相关,i 2 i3 i21则 Cov (P X , X ) =P Cov (X , X )主 03 3 i2 i33 i 2 i另外,(4.7 )式的第二项求期望也不为零。归纳起来,X 3的遗漏将导致如下后果(1)如果漏掉的X3与X2相关,则分别在小样本下求期望,在大样本下求概率极限,有E (OL ) H P ;E (OL ) H P11 2 2且P lim( ol ) h P ;P lim( ol ) h Pn * I】n *222i3i又(4.7)和(4.8)式的第二项-工x x n兰。Cov (X , X ) n2i 3i在n T&时也不趋于零。即 OLS 估计量在小样本下有偏, OLS 估计量是非一致的。(2) 如果X3与X2不相关,即丫七.x3. = 0,的估计量即便满足无偏3221 3i2性与一致性;但这时O1的估计却是有偏的(证略)。o 2(3)0的方差Var (&)= l为有偏估计。22S X 22 i、X 2-由于 Var (P)二 Y 3 yo 2 = o 2-Y2(乙 X2)(乙 X2)(乙 XX )2 “V(乙 XX )2232 3厶 X21 一 号=5 2乙X 2乙X 223o 2o 2u =()是无偏估计。S2乂 x 2 1 r 2 丿x2 (1 h)2i 232 iS 2 S 2X2 X3如果 X3 与 X2 相关,有 Var(& ) H Var(0 )。3 2 2 2如果X3与X2不相关,也有Var(0 ) H Var(P )。3 2 2 2(4) 遗漏变量乙的模型,即(4.4)式中的随机扰动项v的方差估计量3i& 2 = RSS /(n - 2)=工 e2 /(n - 2)将是有偏的,即: E(&2) 工&2ivuvv5)与方差相关的检验论。特别注意两点第一,若 X 与 X 相关32似乎有 Var (oc ) Var 022r2 丰 0,有 Var23(B),&c 2即: v &2 = RSS /(n-3)/ 工 x 2 二 0;vvuu第二,若X与X不相关,有r2 = 0或工x x32232 i 3 if2 i似乎分别有E(a )=0 ; Var(a ) =Var(0 )2 2 2 2若这两个等式成立,意味着尽管变量 X3 在理论上分析是有关的变量,但从所选模型中略去似乎也不会导致什么危害。这种认识实际也不正确,因为& 2vx22i2 RSS n - 2& 2 RSS n - 3Var (a ) = v = v是 Var (0 ) = u2乙x 2乙x 22 乙x 2乙2ix22ix22i2、无关解释变量误选(过拟合)的后果无关解释变量误选会损失估计量的有效性。设正确模型为:Y二卩+卩X +ui12 2i i模型误设为:Y =o +o X +o X + v1 12 2i3 3i i则模型(4.10)中的o的OLS估计量为2入S x y S x 2 - S x y S x xa =2 i i 3 i3 i i2 i 3 i2Sx2 Sx2 一 (Sx Sx )22i3i2i 3i将(4.9)式的离差形式y =0 x + (u -U)代入(4.11)i 2 2 ii(4.9)(4.10)(4.11)式,整理得32的有偏估计。所以,即使X与X不相关,也有Var(0 )丰Var(a )。2X2)(X (u - U) - (X X )( X(U - U)3i2i i2373ii乙X2乙X2 - (乙X乙X)22i3i2i3i易证:E(& ) = E祁+2 2(Sx 2 )Ex(U - U) - ( Sx X )Sx(U - u )c*oo 3i3i3ii (Sx2 )(Sx2 ) - ( Sx X)22i3i2i 3i同理可以证明 E( “ ) = P1 1且为一致估计量Plim & = P ; Plim & = Pn ”22n ” I】其中 Plim & = P的证明见附录1。n ”22但&不是有效估计量。因为9Var (& )=2工a 2vS2X 2 (1- j2ia2 工 x 2 (1 r 2) )2i23S 2 S2X2 X3Va( d )=o);2v ;2i23Va( P )=2a 2US x 22 iVa( d ) a 2 Sx2 (1 r 2)1 a 22 = v203 =- v-Va( P )a 2 ,Sx2(1 - r2) a 22u 2i23u0 r2 Var (P )2322由此可以看出,无关变量X 3的误选将导致如下后果(1)误选无关变量时参数的0LS估计量是无偏,且为一致性的。即E (d ) = P , E(d ) = P = 0, p lim d = P 和 p lim d = P = 011331133n sn TsE (d ) = P , p lim d = P2222n T8(2) 随机误差方差的估计仍为无偏估计,即E62)=a2。vu(3) 通常的区间估计和假设检验程序依然有效。(4) 一般地说,d将不是有效估计量,此结论对也成立。2 1注意,通常的区间估计和假设检验程序虽依然有效,但随着d (i = 2,3)的方i差增大,接受错误假设(原假设)的概率会较高。3、遗漏相关变量和误选无关变量的比较如果是遗漏相关变量,将导致参数估计量有偏且不一致如果是误选无关变量,虽然参数估计量具有无偏性、一致性,但会损失参数 估计量的有效性。若建模时注重检验的无偏性、一致性,宁愿误选无关变量也不愿遗漏相关变 量。若建模时注重估计量的有效性,有时可能宁愿删除相关变量。相比之下,遗漏相关变量的后果要比误选无关变量严重。因此,模型的设定实际是对偏误与有效进行权衡,偏爱哪一方取决于模型的 研究目的。二、测量误差的后果计量经济研究中需要运用大量的观测数据,在搜集相关的数据时,经常遇到所搜集的数据不能确实地反映变量间经济行为的情况。在计量经济模型中使用了经济变量不准确的数据时,则称模型中包含了测量误差。测量误差将会影响计量 经济分析的结果。1、被解释变量有测量误差。为了说明测量误差的后果,设正确的回归模型为Y * =a + P X +卩(412)ii i其中,Y*为被解释变量的理论值;X为解释变量,由于Y*是不可观测的,iii而只能通过下列测量过程得到其样本数据Y = Y* +8。i iiY = ( a + P X +y)+8iiii=a + PX +(卩 +8 ) =a + PX + v(4.13)ii iii其中,v二卩+8是一个合成误差项,包含着总体干扰项和观测误差项。 i i i为简单起见,假定(卩)=(8 ) = 0 ; Cov (X,卩)二 0iii iCov(X,8 ) = 0(即Y*的观测误差与X不相关)i iiiCov(卩,8 ) = 0(即总体干扰项与观测误差不相关)i i有以上假定,则由(4.12)、(4.13)估计的P为无偏估计n观测误差不影响 OLS估计的无偏性。但从(4.12)、(4.13)估计的P的方差和标准差不同a 2模型(4.12) Var (p)二亍乙X2ia2a2 +a 2模型显然,后者大于前者。(4.13) Var(p)二 y :二 _乙x 2乙x 2ii2、解释变量有测量误差。设正确的回归模型为Y =a + B X * + 卩(4.14)ii i其中,X*为解释变量的理论值;且X*是不可观测的,可利用一个可观测的变量iiiX = X * +3(4.15)iii其中,3是X*的测量误差,且3N(0Q2)。于是,我们估计的不是(4.14),而是i ii3(4.16)Y =a + 0(X 一3)+ 卩=a + 0 X +(卩-0 3) =a + 0 X + zii i i ii ii i ii i i其中:z =卩-0 3是方程与观测两种误差的一个混合。i i i i若假定:E(3) = 0; Cov(卩,3)= 0; E(z) = 0ii ii但是,Cov(z,X)=0不能成立。因为i*)i iCov(z,X ) = Ez -E(z 川(X -E(X ) = E(y-03)(X* +3 -Xi iiiii二E(卩-03 )3 二 E(-032) =-0Qii ii(X = X* +3, E(X) = E(X* +3) = X*)i i i由于古典假定不成立,OLS估计0既不满足无偏性,也不满足一致性。1若样木容量无限增大,OLS估计0仍是有偏的Plim 0 = 01(证被解释古扎和解释变量均济学下差。474页)3、解释变量与被解释变量均有测量误差。设正确的回归模型为Y * =a + 0 X * + p(4.17)ii i其中:Y*、X*分别为被解释变量、解释变量的理论值,且Y*、X*都是不iiii可观测的,只能通过下列测量过程得到样本数据:Y 二 Y* +88 N(0,c2)(4.18)i i ii8X 二 X* +33 N(0,c2)(4. 19)iiii3Cov (8 , X )二 0; Cov(8 , 3 )二 0; Cov(8 , X )二 0i ii ii i其中:Y是Y*的测量结果;8是Y*的测量误差;i ii iX 是X*的测量结果;3 是X*的测量误差;iii iCov(, ) = 0; Cov(, X ) = 0i ii i且各误差都没有序列相关于是,我们估计的不是(4.17),而是:Y = a + B(X co ) + u + + BX + u + 卩3ii i i i将(4.17)、(4.18)、y* =卩 x * + (u 一 u)iiiy = y* + ( )i iix = x* + (o o)i i(4.20)i i ii(4.19)分别以离差形式表示:(4.21)(4.22)(4.23)对(4.20)式采用OLS,有将(4.22)i、(4.23)式代入,并在大样本下,有 卩VarX*卩i VarX * +c 2i o(4.24)(注:(4.24) 因为(4.24) 回归参数。C 21 +C 2X *式的证明过程见附录)式中0,表明当存在测量误差时,0LS法常常会低估真实的o X *第三节 设定误差的检验以下讨论变量设定误差(欠拟合、过拟合)、变量数据测量误差的检验。 一、变量设定误差的检验 对变量设定误差的检验须在经济理论指导下进行,不可抛弃经济理论而进行 假设检验。对于是否误选无关变量的检验,只要针对无关变量系数的期望值为零的假 设,用t检验或F检验,对无关变量系数作显著性检验即可。对于遗漏变量设定误差的检验有多种方法,例如 DW 检验、拉格朗日乘数 检验、一般性检验(RESET)等。1、误选无关变量(过拟合)的检验(复习t检验、F检验)基本思想:用假设检验对无关变量系数的显著性进行检验。Y二卩+卩X +卩X +卩X +卩 i二1,2,,ni12 2 i3 3 iK Kii(1) t检验.检验X是否为无关变量,即检验k H :卩二 0; H :卩 H 00 k1 kzt 二一kt(n - k)se (卩)k(2) F检验.检验X , X是否为无关变量,即检验23H :卩二卩二0; H :卩(j二2,3)不全等于零0231 jH成立,用F-统计量对假设进行检验。02、相关解释变量遗漏的检验 相关变量遗漏的检验相对而言要复杂一些。以下仅讨论一些常用的检验方 法。(1) DW 检验。基本思想:遗漏的相关变量应包含在随机扰动项中,那么回归所得的残差 序列就会呈现单侧的自相关性,因此可从自相关性的角度检验相关变量的遗漏。从遗漏变量的模型看,可以认为遗漏变量模型是无遗漏变量模型的一个特 例:被遗漏变量X3的系数为0。女口:正确模型:Y =卩+卩X +卩X + u为无约束模型;i 12 2i3 3i i误设模型:Y =a +a X + v为受约束模型。i 12 2ii DW 检验的具体步骤*对回归模型运用OLS法得残差序列ei设 H :无遗漏变量; H :有遗漏变量0 1按遗漏解释变量的递增次序对残差序列e进行排序。例如:设遗漏变量z,i为了将残差序列e按照遗漏变量z值的递增次序排序。首先用genr命令生成z1i和e1,然后在只有残差序列e1和遗漏变量z1的Workfile画面中,点击Proc T Sort Current Page进入下一画面,点击Yes进入另一画面后,在sort keys的选项中键入z1,并点 击OK,则对e1按z1值的递增次序进行了排序。过程见下:Uui ck OptiSmt b:dJTiple.Load ri urktile rase .RerL:dJTie L.iji-rent rage .Unly ijtlstGicturEd. worktlies may be 5or比worktlie strucutire.S t rue tj 工r e./ Re e iL.ijitent rase.ApperLil to L.ijitent rase.zti ubszti ubs Torkifile: CHAPTEView ProcObject Print SaveRange: 1978 2003 - 2Sample: 1978 2003 -:Lunt ran t Luit en t Fase.C i:ipy.i,1 Ex tr ac t fr om Cijit ent F ageImport卜Export卜L.ijitent raseVieA Proc Object Print Save Details+i1- Show Fejlrh Store Delete Genr Sampley7i-i 2Liu:-iSample: ly/H 2UUdDisplay Filter:Lwrit 1 nuing thi e sor t willmH ETievsFile Edi t Obj ect Vi ew Fro c Qui ck 01 i otle Wi niow Helpgenr zl=z genr el=eTorkfile: CHAPTER T DATA (CASE)20050522 .Hi亡w|Prcit|objFtt| Print|知亡|Det日ils+卜| Ehd凹| F亡tth|Etor亡| D亡I亡t已|百亡nr|三日mple|Range: 1978 20032日mplE:仰Ei 2ED326 obs26 obsDisplay Filter: *ce1 resid z1按z1值的升序(Ascendinobs-1488100330.6961Sort orkfile Series-1378.000-1319.900-1237.000-1214.100-1034.100-983.2000-648.700034.97917-90.53828-176.6785373.478644.07581203.9509-671.98802650.5000054.81085对排序后的残差序列e,计算d统计量i-1d 二区(e - e )2ii=23)查 Durbin-Watson 表,得 d , dlu注:实际可以按更简单的步骤讨论(见例)(a )0 d d n u存在一阶正自相关Lt(b )4 - d d 4 n u存在一阶负自相关Lt(c ) d d 4 - d n u不存在自相关UUt若 d 显著,则拒绝原假设(存在自相关),回归模型存在模型设定误差(可 能遗漏了重要的解释变量),否则接受原假设,模型无设定误差。例:对下表的数据设定总生产成本函数,准备使用如下的三个备选模型(1) Y 二卩 +卩 X + 卩 X 2 + 卩 X 3 + ui 12 i 3 i 4 i i(2) Y 二卩 + 卩 X + 卩 X 2i12 i3 i(3) Y 二卩 + 卩 Xi12 i其中,只有(1)为真实模型,试用 DW 法检验模型设定误差。序号总成本(Y)产出(X)1193122262324034244452575626067274782978935091042010三个模型分别代入数据后的回归结果Y 二 141.767 + 63.487X -12.962X2 + 0.939X3iiiise 二(6.375) (4.778) (0.9856)(0.0592)t二(22.238) (13.285) (-13.151) (15.861)R2 二 0.9983R2 二 0.9975 DW 二 2.70Y = 222.383 - 8.0250X + 2.542X 2iii2)3)se = (23.488) (9.809) (0.869)厂=(9.468) (-0.818) (2.925)R 2 = 0.9284R 2 = 0.9079 DW = 1.038Y = 166.467 +19.933Xiise = (19.201) (3.066)t =(8.752) (6.502)R 2 = 0.8409 R 2 = 0.8210 DW = 0.716对上述模型的DW统计量的分析及查表情况如下模型(1)有 DW=2.70,当 n=10、k=3、a =5%时 dL=0.525, dU=2.016, 不能表明存在显著的自相关关系,接受H,表示没有遗漏的变量。模型(3)有 DW=0.716,当 n=10、k =1、a =5%时,dL=0.879, dU =1.320, 显然存在正的自相关,拒绝H0,表明存在遗漏变量。模型(2)有 DW=1.038,当 n=10, k=2, a =5%时 dL=0.697, dU =1.641。显然有 0.6971.0381.641,属于无法确定的区域。采用修正的 DW 检验法进行检验,即扩大拒绝区域, 可依据 DW=1.038 x 2(约束条件个数),则拒绝H,认为受约束模型不成立,存在遗漏变 量。否则,接受H。,认为受约束模型成立,无遗漏变量。案例分析 问题:分析影响中国进口量的主要因素(数据见下页) 设定模型。IM =a +a GDP + y(1)t 1 2 t t其中:IMt是进口总额,GDPt是国内生产总值。 分析:模型是否有变量设定误差(进行变量设定误差检验) 有人认为,货物与服务的进口量受到一国的生产规模、货物与服务的进口价 格、汇率等其他影响因素,而不能只仅用GDP来解释商品进口的变化。因此,设定的回归模型应该为IMt邙 i+0 2 f(GDPt) +0 3g(Exchanget) + ut(2)其中,GDP为国内生产总值,f (GDP)为GDP的线性函数。Exchange为美元 兑换人民币的汇率,g ( Exchange)为Exchange的线性函数。如果是这样,回归 模型(1)的设定式中可能遗漏了变量。那么GDP、Exchange的某些函数、以及 两者的线性组合是否是被遗漏的重要变量呢?分析:IM= f (GDP)基本关系图对模型(1)进行回归 , 有回归结果IM =1067.337+ 0.2307GDP + ettt或:IM =1067.337+ 0.2307GDPttSE = (792.2620)(0.0142)t =(-2.0288)(16.2378)R2 = 0.9230,R2 = 0.9195, DW = 0.5357, F = 263.6657 DW 检验由于遗漏变量 Exchange 或 GDP 已经按从小到大顺序排列,因此,无需重 新计算 d 统计量.对n=24和k=1,5%的(德宾-沃森)d-统计量的临界值为dL=1.273和 dU=1.466。模型(1)的DW=0.5357,表明存在正的自相关,存在显著的遗漏变 量现象。重新估计模型如下Dependent Variable: IMMethod: Least SquaresDate: 03/06/08 Time: 23:41Sample (adjusted): 1981 2003Included observations: 23 after adjustmentsVariableCoefficientStd. Errort-StatisticProb.C-224.36321892.132-0.1185770.9069GDP1.1482590.1514337.5826060.0000GDP(-1)-0.8224440.147359-5.5812130.0000EXCHANGE-4.2907468.348744-0.5139390.6135EXCHANGE-0.0186370.008353-2.2311620.0386R-squared0.978691Mean dependent var8434.222Adjusted R-squared0.973956S.D. dependent var9025.326S.E. of regression1456.525Akaike info criterion17.59515Sum squared resid38186370Schwarz criterion17.84200Log likelihood-197.3443F-statistic206.6799Durbin-Watson stat1.962659Prob(F-statistic)0.000000其中,Exchange系数的统计意义不显著,剔除后有Dependent Variable: IMMethod: Least SquaresDate: 03/06/08 Time: 23:53Sample (adjusted): 1981 2003Included observations: 23 after adjustmentsVariableCoefficientC-1159.179GDP1.142897GDP(-1)-0.815842EXCHANGE -0.022569Std. Error511.03960.1481190.1439280.003291t-Statistic-2.2682767.716070 -5.668420-6.857844Prob.0.03520.00000.00000.0000R-squared0.978378Adjusted R-squared0.974965S.E. of regression1428.041Sum squared resid38746720Log likelihood-197.5118Durbin-Watson stat2.047965Mean dependent var8434.222S.D. dependent var9025.326Akaike info criterion17.52277Schwarz criterion17.72024F-statistic286.5846Prob(F-statistic)0.000000可以认为,这时模型无变量设定误差。LM 检验按照LM检验步骤,首先生成残差序列(用EE表示),用EE对全部解释变量(包括遗漏变量)进行回归,有如下结果Dependent Variable: EEMethod: Least SquaresDate: 08/07/05 Time: 00:05Sample (adjusted): 1981 2003cuIncluded observations: 23 after adjustmentsVariableCoefficientStd. Errort-StatisticProb.C448.1584511.03960.8769540.3915GDP0.9122010.1481196.158568.00GDP-1)-0.8158420.143928-5.6684200.0000EXCHANGED-0.0225690.003291-6.8578440.0000R-squared727360Mean dependent var-37.56087Adjusted R-squared0.684312S.D. dependent var2541.62417.52277177202416.89632.14型施 criterione计篦 lilnRi2讯23x0.72736.主1氐72928,查表tiEti 四(2)矽7.37776,显然 16.72928瓦 7.T76F-statistic)0.025结论是拒绝H,受约束模型不成立,即确实存在遗漏变量。 0(3)残差图示法(补充)。 该方法能帮助我们初步判断是否有相关变量的遗漏或函数形式的设定偏误。 我们曾在考察模型是否存在异方差、自相关时用过该方法。许多情况下,异方差 性、自相关性往往是由于模型设定时遗漏了重要的解释变量引起的。对所设定的模型进行LS回归,得到估计的残差序列;t做出e与时间t或某解释变蜃的散点图,考察是否有规律地在变动,以判断是tt否遗漏了重要的解释变量或选取了错误的函数形式。残差序列变化图(a)趋势变化(b)循环变化注意,趋势变化是模型设定时可能遗漏了一随着时间的推移而持续上升的变量循环变化是模型设定时可能遗漏了一随着时间的推移而呈现循环变化的变模型函数形式设定偏误(残差序列往往表现出某种有规律的特征)例如,一元回归模型中,真实模型呈幂函数形式,但却选取了线性函数进行回归。残差序列呈现先正、后负、再正的变化特征。regression error specification检验的基本思想:如果事先知道遗漏了哪个变量,只需将此变量引入模型, 估计并检验其参数是否显著不为零即可。问题是我们并不知道遗漏了哪个变量, 这时可寻找一个替代变量Z来进行上述检验(替代变量Z通常选用所设定模型被 解释变量拟合值Y若干次幂的线性组合)。若模型估计所得的残差包含着遗漏的 相关变量,那么这个残差可用被解释变量拟合值的线性组合近似表示。若这个线 性组合是显著的,则认为原模型的设定有误。由于可引入若干个替代变量去判断 是否有多个变量被遗漏,所以该方法被称为一般性设定偏误检验.一般性检验(RESET )的基本步骤:先用 OLS 法对模型(1)进行估计Y =卩 +卩 X + +卩 X +u (1)丿 J J 2i“k ki iYi注:这里空遗漏的变量可被认为是2次幕、3次幕等形式(分别te得检验也存合值Y、争议和改进若残差e与拟合僮之间存在某种函数关系,iiiii则可用拟合值若干次幂的线性组合充当工具变量;i用被解释变量的拟合值Y线性组合,测度残差中是否包含着遗漏的相关变量。i例如:丫 =卩 +卩 X +卩 X +5 Y2+5 Y3+5 Y4 +v i 12 2ik ki 1 i 2 i 3 i i利用约束条件的假设检验原理,可构造如下检验假设例:表4.2.1 19782001年中国商品进口与国内生产总值国内生产总值GDP(亿元)商品进口M(亿美元)国内生产总值GDP(亿元)商品进口M(亿美元)19783624.1108.9199018547.9533.519794038.2156.7199121617.8637.919804517.8200.2199226638.1805.919814862.4220.2199334634.41039.619825294.7192.9199446759.41156.119835934.5213.9199558478.11320.819847171.0274.1199667884.61388.319858964.4422.5199774462.61423.7198610202.2429.1199878345.21402.4198711962.5432.1199982067.461657198814928.3552.7200089442.22250.9198916909.2591.4200195933.32436.1资料来源:中国统计年鉴(1995、2000、2002)。构造原假设H : 6 = 0 ; j = 1,2,3o j然后,用F统计量进行检验,其统计量为:(RSS- RSS ) J(R 2F =无约束有约束=无约束1 - R 2 无约束 (R 2无约束1 - R 2无约束-R 2) J有约束)n - (k + J )-RSS有m=十RSS n - (k + J )( 无约束/、(RSS - RSS丿 3F =无约束有约束=RSS 订 n - (k + 3 )无约束RSS、R2分别为残差平方和、可决系数。:J为约束条件的个数。做结论:若F值大于F临界值,则拒绝原假设,表明模型存在某种形式的设定误差。注: 其中下面进行 RESET 检验对有约束的回归模型进行估计M =152.910 + 0.020GDP tt R2 = 0.948在原回归模型中加入Mf、M,后重新进行估计,得:MM =-3.860+0.072GDP- 0.003劝2 - 0.700劝3ttt(-0.085)(8.270)(-6.457)(6.692)R 2 = 0.984(R 2无约束-R 2) J有约束-R2 丿n-(k + J)无约束(0.984 - 0.948)/2 22.522 .5(1 - 0.984)/(24 - 4)在 a=5%下,查得临界值 F0.05(2, 20)=3.49。判断。拒绝原模型与引入新变量的模型可决系数无显著差异的假设,表明原 模型确实存在遗漏相关变量的设定偏误。一般性检验(RESET)也可用来检验函数形式设定偏误的问题。例如,在一元回归中,假设真实的函数形式是*)Y p +p X +p X2 + p X3 +卩01 12 13 1如设定为线性模型(注:对解释变量而言),就意味着遗漏了相关变量 X12、X13 等。因此,在一元回归模型中,可通过检验(*)式中X的各高次幕参数的显著性 来判断是否将非线性模型误设成了线性模型。对多元回归模型,非线性函数可能是关于若干个或全部解释变量的非线性, 这时一元回归检验的程序已不适用(太多的高次幂及交叉项,易损失自由度、存 在共线性)。但可按遗漏变量的程序进行检验。例如,欲估计模型为Y=p+卩1Xl+卩2%+卩但却怀疑真实的函数形式是非线性的。这时,只需以估计出的 的若干次幂为“替代”变量(包含了高次幂及交叉项的信息),估计如下模型八八Y p +p X +p X +丫 Y2 +丫 Y3 + 卩0 1 1 2 2 1 2 再判断各“替代”变量的参数是否显著地不为零即可。(3)同期相关性的豪斯曼(Hausman)检验由于在遗漏相关变量的情况下(特别是遗漏变量与其它变量存在共线性) 往往导致解释变量与随机扰动项出现同期相关性,即Cov(X , u )丰0,从而使jk jOLS 估计量有偏且非一致。因此,对模型遗漏相关变量的检验可以用模型是否出现解释变量与随机扰动项同期相关性的检验来替代。这就是豪斯曼检验(1978)的主要思想。当Cov(X ,u )丰0 (或者解释变量与随机扰动项同期相关时),通过工具变量 jk j法(IV)可得到参数的一致估计量。当解释变量与随机扰动项同期无关时,OLS估计量就可得到参数的一致估 计量。因此,只须检验IV估计量与OLS估计量是否存在显著的差异性,以检验 解释变量与随机扰动项是否同期无关,进而判别模型是否存在着遗漏相关变量的 情况。分析一元线性回归模型Y=P0+P1X+所检验的假设是H0: X与卩无同期相关。设一元样本回归模型为Y =0 +0 X + ei 0 1 i i以Z为工具变量,则IV估计量为 Z zy工z (0 x + e )冷 工ze*)0 =,i i =中 1 i i =0 +y i i乙zx乙zx1 乙z xi ii ii i其屮,卩为OLS估计量。(*)式表明,当且仅当Zziei=0 ,IV估计量与OLS估计量无差异,即工具变量与OLS 估计的残差项无关。Hausman 检验的具体步骤: 假设 H0: X 与 u 无同期相关。求Y关于X与Z的OLS回归式Y = 0 + 0 x +yzi 12 ii利用估计对Y进行显著性检验。若Y显著地不等于0,则表明工具变量Z与采用OLS估计Y=0广0 2X+u的残差同期相关。进而说明X与u同期相关, 故拒绝原假设,表明存在遗漏相关变量的情况,否则,接受原假设。在实际检验中,豪斯曼检验主要针对多元回归进行,具体操作也有变动。它不是直接对工具变量回归,而是对以各工具变量为自变量、分别以各解释变量为因变量进行回归。设Y二卩+卩X +i122+ p X + ukk通常把这个模型称为有约束模型。.首先,建立各解释变量为因变量、各工具变量为自变量的辅助方程X = f (z , Z , Z ) i = 2,3, ki23m进行回归,分别得到X (i = 2,3 , k )i其次,对如下无约束的回归方程进行回归八八Y =卩+ 卩 X + p X + y X + y Xi
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸设计 > 毕设全套


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!