《设定误差》PPT课件

资源描述

1,第九章设定误差与测量误差(Specification Error and Measurement Error),2,在前面的章节中，我们考虑回归模型时，我们隐含地假定了所选择的模型“是对现实的真实反映”，即它正确地反映了所研究的系统的运行机制。用专业术语讲，就是假定所选模型中不存在设定误差。但完全正确的模型设定只有理论意义，在实践中也许永远达不到。我们只是希望找到一个能够合理反映现实的模型,即一个好的模型。,3,传统建模方法的过程,（1）根据有关经济理论的阐释或社会经济实践的惯常经验，选择模型应当包含的变量及模型具体的函数形式，构建理论模型。（2）收集相关变量的样板观测数据，采用一定的计量经济学方法，对模型参数进行估计，求出理论模型的样本估计式。（3）对模型样本估计式进行理论检验，统计检验及计量经济学检验，如果检验结果能满足先验假设的要求，模型估计式便被接受。,4,实际经济问题范围广泛，类型多样，经济理论难易对所有对象都给出具体的阐释，实践经验也不总是能够提供可以借鉴的参照。在这种情况下，理论模型的构建就将因缺乏依据而不能令人信服。即使所研究的问题有相关理论的说明或实际经验的参考，但对于某个具体的经济现象，有其特殊性，是否一定符合理论与经验的常规，还是一个有待证明的问题。有时虽然能根据经济理论和实际经验构建出一个好的理论模型，但由于数据资料不满足要求，参数估计困难等原因，使其不具有实用性。,计量经济模型的传统建模方法的缺陷,5,“好的”模型具有的特性,一、简单性模型永远无法完全把握现实，并非越复杂的模型越能反映现实，在建模过程中一定程度的抽象或简化反而是更易操作和抓住关键。二、可识别性对于给定的一组数据，每个参数只有一个估计值。,6,三、拟合优度回归分析的基本思想是用模型中所包含的变量来尽可能地解释被解释变量的变化。因此，拟合优度越高，则认为模型就越好。四、理论一致性无论拟合优度多高，一旦模型中的一个或多个参数的符号有误，该模型就不是一个好的模型。五、预测功效 Friedman: 对模型的真实性的唯一重要的检验是预测值与经验值的比较。即：模型预测越准确，模型越好！,7,如果模型不是“好”模型，那就要考虑模型的设定是否正确，具体来说：是否遗漏了重要的变量？是否包含了多余的变量？模型的函数形式是否正确？随机扰动项的设定是否合理？数据收集是否有误差?,8,模型设定误差,变量的设定误差模型函数的设定误差随机扰动项的设定误差变量数据的测量误差,本章主要讨论：变量的设定误差变量数据的测量误差,9,一、变量设定误差的后果,第一节设定误差,变量设定误差主要有两类：相关变量的遗漏（欠拟合）无关变量的误选（过拟合）,10,1、遗漏相关变量（欠拟合）的后果把采用遗漏了重要解释变量的模型进行估计而带来的偏误，称为遗漏相关变量误差。假定真实模型为： Yi =1 +2 X2i +3X3i + ui 但因某种原因遗漏了解释变量 X3，而将模型设为： Yi =1 +2X2i + vi,11,1.如果遗漏的解释变量 X3和含有的X2相关，则1和2 的OLS估计值是有偏的，且非一致的，且偏离程度随着相关程度的增加而增大。 2.如果遗漏的解释变量 X3 和含有的X1不相关， 2 的估计值是无偏误的，但截距项1 的估计值依然是有偏误的。,12,2、引入无关变量（过拟合）的后果把采用误选了无关解释变量的模型进行估计而带来的偏误，称为引入无关变量误差。假定真实模型为： Yi =1 +2 X2i + ui 而加入了无关解释变量 X3，模型被设定为： Yi =1 +2 X2i + 3 X3i + vi,这时，参数的OLS估计量是无偏的和一致的，但不是有效估计量。,13,1.遗漏相关变量，则系数既有偏误且非一致、随机误差的估计不正确、假设检验无效； 2.包含无关变量，依然给出真实模型中的系数的无偏且一致估计量、随机误差的估计正确、假设检验有效；唯一代价是：系数的方差估计变大了！,总结,虽然误选无关变量不如遗漏相关变量的后果严重，但我们也不能下结论：与其略掉相关变量，不如包含无关变量。因为增加无关变量将导致估计量的方差增大，引起参数估计精度下降，并且将引发多重共线性的问题，还将导致自由度的损失！,14,第二节设定误差的检验,引入无关变量的检验模型误选了无关解释变量的检验，比较简单，只要针对变量系数为零的假设，用 t 检验或 F 检验，对变量系数作显著性检验即可判断哪些变量是无关变量。,15,遗漏相关变量的检验模型遗漏重要解释变量的检验要相对复杂，方法主要有： (1) DW检验 (2) 拉格朗日乘数检验 (3) 一般性检验除此之外，还有似然比检验、沃尔德检验、豪斯曼检验等。,16,一、DW检验,基本思想：遗漏的相关变量应包含在随机扰动项中，那么回归所得的残差序列就会呈现自相关性。,以,为例。,因此可从自相关性的角度检验相关变量的遗漏。,17,DW检验步骤如下： 1、对设定的回归模型运用OLS估计得残差序列 ei ； 2、假设 H0:未遗漏相关变量，H1:遗漏相关变量； 3、计算DW统计量：,4、查DW表，得临界值dL和dU，进行判断，如果DW值显著，则拒绝原假设，表明遗漏了重要的解释变量，否则，表明没有遗漏。,18,二、拉格朗日乘数检验,基本思想：遗漏的相关变量应包含在随机扰动中，因此回归所得的残差序列应与遗漏的相关变量呈现出某种依存关系，所以对残差序列与相关变量进行回归，若相关变量具有统计显著性，则认为存在遗漏相关变量形成的设定误差。,19,拉格朗日乘数检验步骤如下： 1、对设定的回归模型运用OLS估计得残差序列 ei ； 2、用ei对全部的解释变量（包括遗漏变量）进行回归，得可决系数R2； 3、假设 H0:未遗漏相关变量，H1:遗漏相关变量； 4、构造检验统计量nR2 ，在大样本情况下， nR2x2(m)，m为受约束变量的个数 5、进行判断：若nR2x2a(m) ，则拒绝原假设，表明遗漏了重要的解释变量，否则，表明没有遗漏。,20,三、一般性检验,一般性检验（RESET, regression specification error test)是拉姆齐(Ramsey)于1969年提出的一种检验方法基本思想：在事先不知道遗漏哪个变量的情况下，可寻找一个替代变量 Z 来检验。若模型回归所得的残差包含着遗漏的相关变量，那么这个残差可用被解释变量拟合值的某个函数近似表示。因此替代变量 Z 通常选用所设定模型被解释变量拟合值的若干次幂的线性组合，若这个线性组合是显著的，则认为存在遗漏相关变量。,21,一般性检验步骤如下： 1、对设定的回归模型,2、以的线性组合作为替代变量(工具变量)，通常选择的平方、立方和四次方的线性组合，对下列模型进行估计：,运用OLS估计得被解释变量拟合值,（1）,（2）,（实际上，认为,22,3、构造原假设 H0：,然后用F统计量进行检验。,其中RSSR和RR2分别是对(1)式回归得到的残差平方和与拟合优度，RSSU和RU2分别是对(2)式回归得到的残差平方和与拟合优度，J 为约束条件的个数，在这里 J=3;,4、若F统计量的值大于临界值，则拒绝H0，表明有设定误差，否则，表明无设定误差。,23,对F统计量的说明,若F较小，意味着RSSR与RSSU接近，即ui与vi接近，从而都接近于零，即原假设H0 成立，反之若F较大，表明原假设不成立，所以可用F统计量检验。式子中除以J和n-(k+J)是为了分别消除约束个数和自由度的影响。,所以,故,因为,24,注意到,于是,25,第三节测量误差,在计量经济模型中，由于变量使用了不准确的数据，而导致的模型误差称为测量误差。主要原因有：（1）理论误差。汇总数据可能只是理论值的近似而形成理论误差；（2）登记误差。由于虚报或误报而产生登记误差；（3）统计误差。由于统计口径不一致或误解指标含义而产生统计误差；（4）整理误差。由于汇总计算而产生的数据整理误差。,26,一、测量误差的后果,1、被解释变量的测量误差设真实的模型为,其中Yi* 为被解释变量的理论值，Xi为解释变量的理论值。,假设由于某种原因，被解释变量的观测值 Yi 与理论值之间存在一个测量误差 ei ，即,（1）,27,于是上述模型相应变为,为使问题简化，假定,且 ui 和 ei 是不相关的，于是,因此，如果用OLS分别估计(1)和(2)式，得,(2),28,由于,所以当被解释变量存在测量误差时，将会增大回归系数估计值的误差，并且误差幅度随着测量误差的增大而增大。,对于(1)式,对于(2)式,29,2、解释变量的测量误差设真实的模型为,其中Yi 、Xi*分别为被解释变量和解释变量的理论值。,假设解释变量的观测值Xi 与理论值之间存在一个测量误差 ei ，即,（1）,则（1）式变为,30,由于,所以,(2),31,这说明模型(2)中解释变量 Xi 与随机误差项 vi 是相关的，在这种情况下，如果运用OLS估计系数，则,32,由于 Xi 与 vi 的相关性，上式右边第二项不为零，所以,这表明，当模型中解释变量存在测量误差时，系数的最小二乘估计将是一个有偏估计。,33,二、测量误差的检验,豪斯曼(Hausman)1978年提出了一种检验测量误差的方法。基本思想：如果存在测量误差，则测量误差应反映在残差中，将残差作为解释变量加入到模型中进行回归，其参数估计量应显著。,34,检验步骤如下：（1）对所研究的回归模型，无论是否存在观测误差，先采用OLS法得到参数估计量；（2）对可能存在测量误差的解释变量，选择与其相关的工具变量，将该解释变量对选择的工具变量进行回归，得到残差；（3）将残差加入第（1）步中的回归表达式，再次进行OLS估计，得残差的参数估计值；（4）对残差的参数估计值进行检验，若显著则认为该解释变量确实存在测量误差，反之则没有。,35,本章重点,1.变量设定误差和数据测量误差的后果； 2.设定误差的检验：DW检验、拉格朗日乘数检验、一般性检验; 3.测量误差的检验：豪斯曼检验。,36,例利用表1资料，试分析影响中国进口量的主要因素。,表1 影响中国进口量的主要因素,37,38,39,一、模型设定,设定模型为:,LS IM C GDP,用最小二乘估计:,40,先用图形诊断,（1）绘制et-1与et 的散点图：,SCAT e(-1) e,GENR e=resid,41,（2）绘制et的图形：,点击：View/actual,fitted,residual/residual graph,从以上图形看出，存在自相关, 可能遗漏了重要的相关变量。,LS IM C GDP,42,因为n24，k1，取显著性水平0.05时，查表得dL1.273， dU1.446，而00.5357DWdL，所以,二、DW检验,(1)在命令窗口键入：,（2）检验：,存在遗漏变量现象。,LS IM C GDP,43,三、校正,(1)在命令窗口键入：,LS IM C GDP GDP（-1）ZH ZH*ZH,ZH的系数在统计上不显著，剔除。,44,(2)在命令窗口键入：,LS IM C GDP GDP（-1）ZH*ZH,因为n23，k3，取显著性水平 0.05时，查表得 dL1.078， dU1.66，而 22.048DW4-dL，所以,已不存在自相关,表明模型无变量设定误差。,45,四、拉格朗日乘数检验,设定模型为:,(1)、用最小二乘估计:,LS IM C GDP,GENR e=resid,生成残差序列：,(2)、用残差序列E对所有解释变量进行回归：,LS E C GDP GDP（-1）ZH*ZH,（3）检验：,因为nR2=23*0.72736=16.72928,查表得 X20.025(2)=7.37776,显然,16.729287.37776,故拒绝假设H0:未遗漏相关变量,表明有遗漏相关变量,46,47,五、一般性检验,设定模型为:,(1)、用最小二乘估计:,LS IM C GDP,生成序列,：GENR Y1=-1607.337+0.230696*GDP,(2)、选择Y1的2、3、4次方的线性组合对下列模型作估计：,LS IM C GDP Y12 Y13 Y14,48,（3）检验：,因为n24，k2，J=3,取显著性水平0.05时，查表得临界值F0.05(J,n-(k+J)=F0.05(3,19)= 3.13, 由于 F= 650.77953.13,所以拒绝H0,表明有遗漏相关变量,49,六测量误差的检验Hausman检验,（1）先对原方程进行回归,LS IM C GDP,50,（2）怀疑自变量GDP有测量误差，找出该变量的工具变量 GNI（国民总收入数据见P261），将GDP关于GNI回归，用 “GENR RES=resid”生成残差序列 “RES”,51,（3）将该残差变量加入原回归模型的自变量中，重新做回归。,LS IM C GDP RES,（4）对残差变量 RES 的系数进行 t 检验，显著。原假设为 H0：GDP不存在测量误差。应拒绝H0，表明GDP有测量误差。,52,作业,P260思考题9.3,P262练习题9.4,9.5,

展开阅读全文

《设定误差》PPT课件

最新文档