资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,本章探讨问题,本章将深化探讨以下问题:,(1) 自相关有什么性质?,(2) 自相关的理论与实际结果是什么?,(3) 由於非自相关假设与不行视察的扰动项ui有关,那么,如何推断在给定状况下存在自相关?简言之,在实际中,如何诊断自相关?,(4) 假如發现自相关的後果比较严峻,如何採取措施加以补救?,本章对自相关的探讨在很多方面与上一章的异方差问题相类似。在存在异方差和自相关的状况下,一般最小二乘法估计量,尽管是线性的和无偏的,但却不是有效的。也即,它们都不是最优线性无偏估计量BLUE。,自相关是模型设定的一种错误,假如模型设定正確,残差确定是一个随机的序列除了均值、方差的特征,还有依次上的特征,好模型的残差不应当在依次上表现出“模式”,过度拟合的模型可能也不会有自相关现象,残差可能表现出的“不正確”模式:异方差(主要是空间上的不平稳);自相关(主要是时间上的不平稳),10.1 自相关的性质,在时间(如在时间序列数据中)或者空间(如在横截面数据中)按依次所列视察值序列的视察值之间存在着相关,两个不同误差项ui和uj的乘积的期望为零。即,经典模式假定任一视察值的扰动项不受其他视察值的扰动项的影响。,如,在探讨产出对劳动和资本投入回来(也即生产函数)的季度时间序列数据时,譬如说,某一季度工人罢工影响了产出,但却没有理由设想这一“中断”会持续到下一个季度。换言之,假如本季度产出降低,但并不意味着下一季度产出也下降。类似地,在分析家庭消费支出与家庭收入的横截面数据时,一个家庭收入增加对其消费支出的影响并不会影响另一个家庭的消费支出。,但是假如存在这種依靠关係,便产生了自相关问题。,自相关图示一例,此图中,视察残差与前一期残差之间的关係,假如不存在时间上的相关,实际值序列会在依次上随机地分佈在趋势线两侧,此图中,明显存在非随机情形,连续出现在趋势线下侧,连续出现在趋势线上侧,产生自相关的缘由1:惯性,大多数经济时间序列的一个显著特徵就是惯性(inertia)或者说是迟缓性(sluggishness)。,时间序列,例如国民生产总值、就业、货币供应、价格指数等等,都呈现周期或循环(在经济活动中重複發生或者自我维持波动)。当经济恢復起先时,由萧条的底部起先,大多数的经济序列向上移动。在向上移动的过程中,序列某一时点的值会大於其前期值。这裏有一種“动力”存在,接着向上,直到某些事务發生(例如税收的增加或者利率的提高或者两者同时增加)才使序列移动减慢下来。,在涉刚好间系列数据的回来方程中,连续的视察值之间很可能是相关的。,实际中,很多经济变量都会产生滞後影响,如物价指数、基建投资、国民收入、消费、货币发行量等都有确定的滞後性。如前期消费额对後期消费额一般会有明显的影响。,消费支出对收入的回来分析中,常常会发觉当期的消费支出除了依靠于其他变量外,还依靠于前期的消费支出,用模型表示为: 。 出现这种现象的缘由是由于心理、技術及制度上等等的缘由,消费者不轻易变更他们的消费习惯。这个模型中就出现了序列相关。,较长时段看“惯性”,事物的节奏不确定以季节为律,如经济现象的周期性。,中国经验的三次经济周期,1st上升 1981-1988。1988下到1989上,经济周期到顶峰,经济过热,物价两位数的通货膨胀。 :/ wyzxsx /Article/Class22/200905/86012.html,下降周期 1989-1991转向市场体制後的第一个下降周期和第一个生产过剩危机。并非如此单纯的缘由,2nd上升 1992-1994。上升特殊迅猛,因为背後有很强的政治性。到1994上,经济过热,当时的利率提高到了接近14%。,下降1995-1999。利率上升,国内需求下降;汇率贬值,海外市场被打开,1994是整个世界消化了中国国内的经济危机。内需企业减员增效;外需企业开足马力,利润丰厚。2000上经济经济回升但下半年起又起先下滑。,3rd上升2002-2007。20022007年大部分产业供过于求,价格下滑。房地产相关产业价格快速上升。2003後出现了一冷一热,凡是汽车、手机、彩电、空调、服装这一类产业价格在一路下跌,而房地产、钢铁、水泥、原油这一类产业价格在一路上升。,下降2008。随着大宗商品石油钢铁煤价格暴跌,重工业企业亏损严峻,外需市场萎靡。经济下滑刺激政府的四万亿,大搞基建又会导致部分重工业产能过剩。内需消费市场远没有打开。,中国人口週期波动,1949後,由于社会稳定、生活条件和卫生条件改善,人口快速增长,形成第一个高峰期;50年头末到60年头初,由于天灾人祸,1960年人口出现负增长,形成第一个低谷期;60年头前期到70年头中期持续了10多年的高强度生育,形成其次个高峰期;70年头中期起先,国家推行支配生育政策,使人口诞生率下降,形成其次个低谷期,到90年头,由于人口惯性,其次个高峰期内诞生的人口逐步进入婚育年龄,又形成第三个高峰期。,产生自相关的缘由2:模型设定误差,形如图10-1a到d的自相关的發生并非因为连续视察值之间相关,而是由於回来模型未“正確”设定。,模型的不恰当设定意味着或是由於本应包括在模型中的重要变量未包括进模型中(这是过低设定的情形),或是模型选择了错误的函数形式本应当运用对数线性模型但却用了线性变量模型(LIV)。,假如發生这样的模型设定误差(model specification errors),则从不正確的模型中得到的残差将会呈现系统模式。一个简洁的检验方法是将略去的变量包括到模型中,判定残差是否仍旧呈现系统模式。假如它们并不存在着显著模式,那么系列相关可能是由於模型设定的错误。,菜贱伤农,低需求弹性,高供应弹性,产量波动,蛛网现象的缘由,政府提倡因素加重了波动,自然波动,即气候的影响,可能存在政府限价的问题,菜贵伤城的缘由在于流通环节,与农业无关,产生自相关的缘由3:蛛网现象The cobweb phenomenon,很多农产品供应呈现蛛网现象,即供应对价格的反应滞後了一个时期,因为供应决策的实现须要确定的时间。因此,农夫本年度的支配受上一年价格影响,供应函数:,供应t=B1+B2Pt-1+ut,假设在t期末,价格Pt竟然低於Pt-1,於是,在(t+1)末时期,农户们确定比t时期少生产一些。明显,在这種情形下,扰动项ut并不设想它是随机的,因为,假如农夫在第t年生产多了,则他们很可能会在第(t+1)年少生产一些,这样下去,就会形成蛛网模式。,产生自相关的缘由4:数据处理Data manipulation,在实证分析中,通常原始数据是要经过加工的。例如,在季度数据的时间序列回来中,数据通常是通过月度数据推导而来的,即将3个月的数据简洁加总并除以3。这样平均的结果,消退了月度数据的波动性,而这種“平滑”过程本身就可能导致扰动项的系统模式,从而引入自相关。,须要指出的是:虽然大多数经济时间序列都因在一个时期内或者上升或者下降而表现出正的自相关,而不像图10-2b那样表现为一上一下的恒常运动。,自相关可能是负的,也可能是正的。,图10-2中二散点图,横轴是前一期的误差项,纵轴是本期的误差项,10.2自相关的後果,(1) 最小二乘估计量仍旧是线性的和无偏的。,(2) 但却不是有效的。OLS估计量并不是 BLUE。,(3)OLS估计量的方差是有偏的。有时候,用来计算方差和OLS估计量标准差的公式会严峻低估真实的方差和标准差,从而导致t值变大。这会使得从表面上看某个系数显著不为零,但是事实却并非如此。,(4) 因此,通常所用的t检验和F检验一般来说是不行靠的。,(5) 计算得到的误差方差=RSS/d.f.(残差平方和/自由度),是真实方差的有偏估计量,在有些情形下,它很可能是低估了真实的方差。,(6) 因此,通常计算的R2不能测度真实R2。,(7) 通常计算的预料的方差和标准差可能也是无效的。,自相关产生的後果与异方差产生的後果很相像,也是严峻的。,10.3 自相关的诊断,并不知道误差的s2的真实值,因为真实的ui无法视察,不但不知道真实的ui是什么,而且假如它们是相关的,我们也不知道其产朝气制:仅仅有它们的替代物ei,与异方差情形一样,不得不依据从标准OLS法中得到的ei 来“瞭解”自相关存在与否,10.3.1图示检验法,把给定的回来模型干脆用OLS估计参数,求出残差项et ,再描绘et的散点图,依据散点图推断et 的相关性。残差et的散点图通常有两种绘制方式 。,e,t,e,t-,1,e,t,与,e,t,-1,的关系,用(et-1 ,et)(t = 1,2,n)作散点图,假如大部分点落在第、象限,表明随机误差项ut存在着正的序列相关。,e,t,-1,e,t,的散点图,假如大部分点落在第、象限,那么随机误差项ut 存在着负自相关,e,t-,1,e,t,e,t,与,e,t,-1,的关系,按时序绘制回来残差项et的图形,假如et(t=1,2,n)随着t 的变更逐次有规律地变更,呈现锯齿形或循环形态的变更,就可断言et 存在相关,表明存在着序列相关;假如et 随着t的变更逐次变更并不断地变更符号,那么随机误差项ut 存在负的序列相关,t,e,t,et,的分布,假如et 随着t 的变更逐次变更并不频繁地变更符号,而是幾个正的et 後面跟着幾个负的,则表明随机误差项存在ut 正的序列相关,e,t,的分布,t,e,t,1,0.3.1,图形法,表10-2的解读,et=Yt-Yt是按时间依次排列的,它应当随机分佈,但在本例中,出现了“模式”,模式:整体上表现出来的规律,一般不会是随机的。或者说,随机现象本身不会有什么规律可言,既然有规律,就不是随机,假如是随机分佈,D一列的每个数值也是随机出现的,图10-4中,et和et-1的组合构成点,每个点的坐标是本期的残差与上一期的残差,假如模型符合CLRM假设,这些点的分佈应当体现出随机特徵,但图10-4中体现出的是明显的正相关,DW检验,DW检验是J. Durbin(杜宾)和G. S. Watson(沃特森)于1951年提出的一种适用于小样本的检验方法。DW检验只能用于检验随机误差项具有一阶自回来形式的序列相关问题。这种检验方法是建立经济计量模型中最常用的方法,一般的计算机软件都可以计算出DW值。,10.3.2 DW检验,留意分子、分母的加总範围,逐次残差差的平方和对残差平方和的比值,假如et和et-1都是独立的标准正态随机变量,则依据方差的性质:var(X+Y)=var(X)+var(Y)乱上加乱等于更乱,假如计算平均值,d的分子为2,分母仍旧为1,d=2,假如et和et-1具有相关性,即它们之间存在线性关系(并非严格的线性关系),正相关时,d变小,负正相关时,d变大。,神来之笔!(数据演示参见“精要10例题”),d公式中的相关程度,et和et-1之间的相关程度越高,则(et-et-1)2越接近0(正相关时),或者接近4 (负相关时),假如et和et-1之间的相关程度降低,则(et-et-1)2会渐渐远离0或4 。,因此,自相关系数可以依据“积矩法”计算,公式为10.9协方差除以二变量各自的标准差乘积,而et和et-1同为标准正态分布的随机变量,分母可以改为et2,d,统计量的假设,1. 回来模型包括一个截距项。因此,d统计量无法用来判定那些通过原点的回来模型的自相关问题。,2. 变量X是非随机变量,即在重複取样中是固定的。,3. 扰动项ut的产朝气制是:,ut= ut1+vt -11,这表明在t时期内的扰动项或者说误差项依靠於它的第(t-1)期的值以及一个纯粹的随机项(vt),依靠过去值的程度是由来测度,4.说明变量中不包含因变量的滞後值,马尔可夫,链,在给定当前学问或信息的状况下,只有当前的状态用来预料将来, 过去(即当前以前的歷史状态)对於预料将来(即当前以後的将来状态)是无关的。p(xh|xs,st)=p(xh|xt), ht,一只青蛙在荷叶上跳来跳去,目的是吃虫子,它下一次跳向哪片叶子与它以前所停留过的叶子没有什么关係,而只与它目前的位置有关,因为虫子的出现是随机的,以人名命名一種现象:帕累托,贝叶斯,有时是用人名命名一種方法,D-W,检验的步骤,(1) 进行OLS回来并獲得残差ei。,(2) 依据方程(10-5)计算d值,(3) 给定样本容量及说明变量的个数,从D-W表中查到临界的dL和dU。,(4) 依据表10-3中的规则进行判定,DW 检验决策规则,误差项,u,1,u,2,u,n,间存在负相关,d,L,DW,不能判定是否有自相关,d,U,DW,d,L,误差项,u,1,u,2,u,n,间无自相关,d,U,DW,d,U,不能判定是否有自相关,d,L,DW,d,U,误差项,u,1,u,2,u,n,间存在正,相,关,DW,d,L,DW检验的缺点和局限性, 有两个不能確定的区域,一旦DW值落在这两个区域,就无法推断。这时,只有增大样本容量或选取其他方法。, DW统计量的上、下界表要求n15,这是因为样本假如再小,利用残差就很难对自相关的存在性做出比较正確的诊断。, DW检验不适应随机误差项具有高阶序列相关的检验。, 只适用于有常数项的回来模型并且说明变量中不能含滞後的被说明变量。,10.4补救措施:广义差分方程Generalized difference equation,ut= ut1+vt,则ut ut1 =vt,假如知道相邻两个残差是怎样相依为命的,即值,即可消退之,由于可以取-1到1之间的任何值,故称“广义”, “差分”则指相邻两个数据的差,小气的Prais-Winston变换,舍不得第一项之缺失,就外推一个,假如样本量很大,何患此区区?,爬行的科学,不放过任何一点可能的进步,10.5 如何估计,常常干脆运用=1,从d统计量估计,从OLS残差估计,本课程思想与方法概要,找寻经济现象的数量规律,对经济学理论进行计量,基于CLRM假定,由OLS测得二元或多元模型,对模型的牢靠性进行检验,CLRM假定被突破的若干情形与对策,如何找寻牢靠模型?,最简洁的二元模型,总体规律及其随机设定,u的性质,总体不行知,只能以样本推想,运用OLS,多元模型更常用,有类似的假设,但稍多,为什么有那么多假设?,从志向模型出發,逆推其志向的初试状态,一个志向的模型,能够说明的因素与形式都应包含在模型中,只能剩下纯粹的随机因素,即残差不能存在任何模式。比如,残差与X的变更无关,本期(或本地)的残差与其他时期(或地区)的残差无关,自变量之间不能相互说明,模型是否牢靠?各参数,来自样本的模型是不是偶然的?,必定性隐藏在偶然性背後。“路遥知马力”,幾遥先至知?偶然性的度量方法是个体现象与总体现象的平均偏离程度se,估计量的性质,BLUE是CLRM志向假设下的志向估计量,给定95的牢靠程度,运用se为材料,可以算出一个临界值,进行置信区间法的假设检验,检验自变量X对因变量Y是不是有影响。,也可以运用se,依据基本规律,计算“牢靠程度”,模型是否牢靠?整个模型,判定系数:可由模型说明的Y差异在Y的总差异中所占的比重=ESS/TSS=ESS/(ESS+RSS),各自变量合在一起对Y是否有影响,须运用F检验。原理:假如可说明的差异假如比不行说明的差异大很多,模型整体就是有效的。F统计量的分布,查概率可以推断是否拒绝零假设,回来模型的函数形式,针对特定的经济现象,可以对模型进行一些变换,以使模型能够反映出更准確的经济意义,对数变换常见,虚拟变量回来,自变量中包含虚拟变量,一个?多个?二态?多态?,大体相像而局部相异的规律,因变量也可以是虚拟变量,CLRM假定被突破1,模型形式的错误:过低拟合、过度拟合、错误的形式、不恰当的变量或不真实的数据,怎样检验?怎样补救?,CLRM假定被突破2,自变量之间可以相互说明,var(b2)公式供应了一个很有效的分析框架,如何补救?,CLRM假定被突破3,异方差,後果很严峻,t检验、F检验不再可信,多出现于截面数据,推广的最小二乘法:用已知的条件标准差对原数据的各组进行不同比例的“缩减”,可消退异方差;假设异方差的模式,再消去该模式,可降低异方差的程度,CLRM假定被突破4,自相关,後果也很严峻,在数学机制上与异方差相像,d统计量,假如et与et-1不相关,d确定接近2,否则,假如et与et-1高度相关,接近0或者4,补救措施:依据自相关的程度,运用广义差分方法,把“异”消退或减弱,实习报告要求,不得抄袭,独立探讨、写作,数据运用到2011年。不少于5000字,不能运用二元模型,必需是多元模型,尽量充分地运用本课程学过的学问、方法,运用eviews等软件,保留输出结果,可以多画图,但必需有技術化推断,放假前电子版交各班学习委员,请学委转發邮箱f_w_z163 其自动回复可验证是否收到,实习报告大致结构,要选择一个自己感爱好的领域,可以翻阅核心期刊後部期刊,获得一些启發,1. 经济学理论,有关探讨的综述,2. 模型设定、数据来源,3. 实际验算,说明运算结果,调整模型,4. 结论。验证一个经济学理论,或者说明一个理论在某些时间或地点的具体表现,
展开阅读全文