资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,第8章 虚拟变量和滞后变量,8.1,虚拟变量,8.2,滞后变量,1,8.1虚拟变量,问题的提出,虚拟变量的定义,虚拟变量的引入,方式,虚拟变量的特殊应用,模型中引入虚拟变量的作用,虚拟变量设置的原则,2,问题的提出,经济变量,定性变量,定量变量,建立和应用计量经济学模型时,除了要考虑定量变量的影响外,经常还要考虑定性变量的影响。例如,职业对个人收入的影响、战争与和平对发展经济的影响、繁荣与萧条对就业的影响、文化程度对工资的影响、自然灾害对农业生产的影响、季节对销售量的影响等。所以需要考虑在模型中引入定性变量。,3,虚拟变量的定义,虚拟变量(dummy variables),是一种离散结构的量,用来描述所研究变量的发展或变异而建立的一类特殊变量,常用来表示职业、性别、季节、灾害、经济结构变化、受教育程度等定性变量的影响。,习惯上用表示虚拟变量,虚拟变量的取值通常为,0,和,1,。,4,虚拟变量的引入,虚拟变量在模型中可以作自变量,也可以作因变量。,虚拟变量的引入方式,加法方式,乘法方式,一般,方式,虚拟变量模型应用举例,5,1 反常情况,0 正常情况,Y=b,0,+b,1,X+b,2,D+u,反常情况:,Y=,(,b,0,+b,2,),+b,1,X+u,正常情况:,Y=b,0,+b,1,X+u,1、加法方式,D,=,X,Y,b,0,b,2,虚拟变量与其它自变量之间的关系是相加关系,,称这种引入虚拟变量方式为加法方式,其作用在,于调整模型中的截距,正常,反常,6,1 反常情况,0 正常情况,Y=b,0,+b,1,X+b,11,DX+u,反常情况:,Y=b,0,+,(,b,1,+b,11,),X+u,正常情况:,Y=b,0,+b,1,X+u,2、乘法方式,D,=,X,Y,b,0,正常,反常,虚拟变量与其它自变量之间的关系是相乘关系,,这种引入虚拟变量方式为乘法方式,其作用在,于调整模型中的斜率。,7,1 反常情况,0 正常情况,Y=b,0,+b,01,D+b,1,X+b,11,D X+u,反常情况:,Y=,(,b,0,+b,01,),+,(,b,1,+b,11,),X+u,正常情况:,Y=b,0,+b,1,X+u,3、一般方式,D,=,X,Y,b,0,b,01,正常,反常,虚拟变量与其它自变量之间的关系既是相加关系,又是相乘关系,这种引入虚拟变量方式为一般方,式,其作用在于调整模型中的截距和斜率。,8,虚拟变量的特殊应用,1调整季节波动,2检验模型的结构稳定性,3分段回归,4混合回归,9,1调整季节波动,使用虚拟变量也可以反映季节因素的影响。例如,利用季度数据分析某公司利润,y,与销售收入,x,之间的相互关系时,为研究四个季度对利润的季节性影响,引入三个虚拟变量(设第1季度为基础类型):,10,例,用虚拟变量处理季节数据模型,中国1982-1988年市场用煤销售量(,y,t,)季节数据(中国统计年鉴1987,1989)见,表,11,表,中国市场用煤销售量季节数据,年与季度,y,t,t,D,4,D,3,D,2,年与季度,y,t,t,D,4,D,3,D,2,1982.1,2599.8,1,0,0,0,1985.3,3159.1,15,0,1,0,1982.2,2647.2,2,0,0,1,1985.4,4483.2,16,1,0,0,1982.3,2912.7,3,0,1,0,1986.1,2881.8,17,0,0,0,1982.4,4087.0,4,1,0,0,1986.2,3308.7,18,0,0,1,1983.1,2806.5,5,0,0,0,1986.3,3437.5,19,0,1,0,1983.2,2672.1,6,0,0,1,1986.4,4946.8,20,1,0,0,1983.3,2943.6,7,0,1,0,1987.1,3209.0,21,0,0,0,1983.4,4193.4,8,1,0,0,1987.2,3608.1,22,0,0,1,1984.1,3001.9,9,0,0,0,1987.3,3815.6,23,0,1,0,1984.2,2969.5,10,0,0,1,1987.4,5332.3,24,1,0,0,1984.3,3287.5,11,0,1,0,1988.1,3929.8,25,0,0,0,1984.4,4270.6,12,1,0,0,1988.2,4126.2,26,0,0,1,1985.1,3044.1,13,0,0,0,1988.3,4015.1,27,0,1,0,1985.2,3078.8,14,0,0,1,1988.4,4904.2,28,1,0,0,12,由于受取暖用煤的影响,每年第四季度的销售量大大高于其它季度。图7.1.7给出了直接用,y,t,对,t,回归的拟合直线。数据拟合效果不好。鉴于是季节数据,初步设三个季节变量如下:,13,在EViews软件中,生成D2数据的EViews命令是GENR D2=SEAS(2),D3、D4类似。以时间t为解释变量(1982年1季度取t=1,EViews命令是:GENR T=TREND(1981:1))的煤销售量(yt)模型回归结果如表所示。,表,回归结果,14,由于,D,3,,,D,2,的系数没有显著性,剔除虚拟变量,D,3,,,D,2,,得煤销售量(,y,t,)模型,回归结果,如,表,7.1.6,所示。,表,回归结果,15,16,2检验模型的结构稳定性,利用不同的样本数据估计同一形式的计量经济模型,可能会得到不同的估计结果。如果估计的参数之间存在着显著差异,则称模型结构是不稳定的,反之则认为是稳定的。,模型结构的稳定性检验主要有两个用途:一是分析模型结构对样本变化的敏感性,如多重共线性检验;二是比较两个(或多个)回归模型之间的差异情况,即分析模型结构是否发生了显著变化。,利用一些特定的统计检验(如邹氏检验法,是美国计量经济学家邹至庄教授于1960年提出的一种检验两个或两个以上计量经济模型间是否存在差异的统计方法),可以检验模型结构的稳定性问题,使用虚拟变量也可以得到相同的检验结果。,设根据同一总体两个样本估计的回归模型分别为,17,18,为“相异回归”(Dissimilar regressions)。,上述情况中,只有第(1)种情况模型结构是稳定的,其余情况都表明模型结构不稳定。,3分段回归,19,20,回归系数反映了奖金的提高程度。使用虚拟变量既能如实描述不同阶段的经济关系,又未减少估计模型时的样本容量,保证了模型的估计精度。,4混合回归,建估计模型时,样本容量越大则估计误差越小。如果能同时获得变量的时序数据和横截面数据(简称为TSCS数据),是否可以将它们“混合”成一个样本来估计模型?只要模型参数不随时间而改变,并且在各个横截面之间没有差异,就可以使用混合样本估计模型。,例,表 为我国城镇居民1998年、1999年全年人均消费支出和可支配收入的统计资料(单位:元年)。试使用混合样本数据估计我国城镇居民消费函数。,21,表,2,我国城镇居民人均消费支出和可支配收入统计资料,收入,等级,1998年,1999年,消费支出,Y,收入,X,D,消费支出,Y,收入,X,D,困难户,2214.47,2198.88,0,2327.54,2325.70,1,最低收入户,2397.60,2476.75,O,2523.10,2617.80,1,低收入户,2979.27,3303.17,O,3137.34,3492.27,1,中等偏下户,3503.24,4107.26,0,3694.46,4363.78,1,中等收入户,4179.64,5118.99,0,4432.48,5512.12,1,中等偏上户,4980.88,6370.59,0,5347.09,6904.96,1,高收入户,6003.21,7877.69,0,6443.33,8631.94,1,最高收入户,7593.95,10962.1,0,8262.42,12083.79,1,22,23,表,回归结果,24,这表明1998年、1999年我国城镇居民消费函数并没有显著差异。因此,可以将两年的样本数据合并成一个样本,估计城镇居民的消费函数,结果如下:,回归结果,25,26,虚拟变量的特殊应用,调整季节波动,检验模型结构的稳定性,分段回归,27,模型中引入虚拟变量的作用,可以描述和测量定性因素的影响,提高模型的精度,便于处理异常数据,28,虚拟变量设置原则,在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:如果有,m,种互斥的属性类型,在模型中引入,m-1,个虚拟变量。,举例,29,第二节滞后变量,问题的提出,滞后变量的概念,产生滞后效应的原因,滞后变量模型,滞后变量模型,的作用,滞后变量模型的参数估计,30,在经济运行过程中,广泛存在时间滞后效应。某个经济变量不仅受到同期各种因素的影响,而且也受到过去时期的各种因素甚至自身的过去值的影响。为了使模型更接近于真实的经济过程,需要引入过去时期的,具有滞后作用的变量。,在模型中考虑了过去时期的,具有滞后作用的变量,也就是考虑了时间因素的作用,使静态分析成为了动态分析,这在理论上和方法上都是一个进步,模型也更接近于真实的经济过程。,问题的提出,31,滞后效应与滞后变量,因变量受到自身或另一经济变量的前几期值影响的现象称为滞后效应。通常称过去时期的,具有滞后作用的变量叫做滞后变量(Lagged Variable)。,X,的滞后值,滞后变量的概念,32,产生滞后效应的原因,心理原因,在经济转型变革时期,人们往往由于心理定势,而不能及时适应新的变化,表现为行为决策滞后。,技术原因,投入和产出之间总是存在时间滞后。,制度原因,契约因素:合同,定期存款,管理因素:管理层次过多,信息不灵,33,滞后变量模型,定义:带有滞后变量的模型称为滞后变量模型。,Y,t,=b,0,+b,1,Y,t-1,+b,2,Y,t-2,+b,j,Y,t-j,+a,0,X,t,+a,1,X,t-1,+a,2,X,t-2,+a,k,X,t-k,+u,式中:,Y,t-j,:因变量的第,j,期滞后,X,t-k,:自变量的第,k,期滞后,有限分布滞后模型(滞后期取值有限),分布滞后模型,(自变量滞后),无限分布滞后模型(滞后期取值无限),自回归模型(包括因变量滞后),34,假定影响因变量,Y,的仅仅是具有滞后分布结构的自变量,X,。,Y,t,=a,0,+b,0,X,t,+b,1,X,t-1,+b,2,X,t-2,+b,s,X,t-k,+u,b,0,:为短期乘数,表示本期,X,对,Y,的线性作用大小,b,i,:为延期乘数或动态乘数,表示解释变量在各滞后期变动一个单位对,Y的影响,即x的滞后影响。,如果,b=,b,i,存在,i=0,1,2,k,b,称为长期分布或总分布乘数。表示,X,变动一个单位时,由于滞后效应而形成的对,Y值的总的影响。,分布滞后模型,35,对分布滞后模型直接采用OLS不适宜,没有先验准则确定滞后期长度;,如果滞后期较长,有效样本观察值较少,将缺少足够的自由度进行估计和统计检验;,同名变量滞后值之间可能存在高度线性相关,即模型存在严重多重共线性。,分布滞后模型的参数估计,36,1、经验加权法,经验加权法是给滞后变量,X,t,X,t-1,X,t-2,X,t-s,指定权数。权数的类型有:,(1)递减型。假定权数是递减的,即认为,X,的近期值对,Y,的影响较远期值为大。越是远期滞后,影响越小。设滞后期,s,=3,,递减权数取为,1,1,1,1,1,2 4 6 8,Y,t,=a,0,+b,0,X,t,+b,1,X,t-1,+b,2,X,t-2,+b,3,X,t-3,+u,令,Y,t,=a,0,+a,1,W,+u,37,(2)矩型。假定权数都是
展开阅读全文