资源描述
8.1 时间序列平稳性和单位根检验时间序列平稳性和单位根检验Stationary Time Serial and Unit Root Test一、时间序列的平稳性一、时间序列的平稳性二、单整序列二、单整序列三、单位根检验三、单位根检验 经典时间序列分析模型:经典时间序列分析模型:包括包括MA、AR、ARMA模型模型 平稳时间序列模型平稳时间序列模型 分析时间序列自身的变化规律分析时间序列自身的变化规律 现代时间序列分析模型:现代时间序列分析模型:分析时间序列之间的结构关系分析时间序列之间的结构关系 单位根检验、协整检验是核心内容单位根检验、协整检验是核心内容 现代宏观计量经济学的主要内容现代宏观计量经济学的主要内容一、一、时间序列的平稳性时间序列的平稳性Stationary Time Series问题的提出问题的提出 经典计量经济模型常用到的数据有:经典计量经济模型常用到的数据有:时间序列数据时间序列数据(time-series data);截面数据截面数据(cross-sectional data)平行平行/面板数据面板数据(panel data/time-series cross-section data)时间序列数据是最常见,也是最常用到的数据时间序列数据是最常见,也是最常用到的数据。经典回归分析暗含着一个重要假设:经典回归分析暗含着一个重要假设:数据是平稳的。数据是平稳的。数据非平稳,大样本下的统计推断基础数据非平稳,大样本下的统计推断基础“一致一致性性”要求要求被破怀。被破怀。数据非平稳,往往导致出现数据非平稳,往往导致出现“虚假回归虚假回归”(Spurious Regression)问题。)问题。表现为两个本来没有任何因果关系的变量,却有很高的表现为两个本来没有任何因果关系的变量,却有很高的相关性。相关性。例如:例如:如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现出较高的可决系数。2 2、平稳性的定义、平稳性的定义 假定某个时间序列是由某一假定某个时间序列是由某一随机过程随机过程(stochastic process)生成的,即假定时间序生成的,即假定时间序列列Xt(t=1,2,)的每一个数值都是从一个)的每一个数值都是从一个概率分布中随机得到,如果满足下列条件:概率分布中随机得到,如果满足下列条件:均值均值E(XE(Xt t)=)=是是与时间与时间t 无关的常数;无关的常数;方差方差Var(XVar(Xt t)=)=2 2是是与时间与时间t 无关的常数;无关的常数;协方差协方差Cov(XCov(Xt t,X,Xt+kt+k)=)=k k 是是只与时期间隔只与时期间隔k有关,与有关,与时间时间t 无关的常数;无关的常数;则称该随机时间序列是则称该随机时间序列是平稳的(平稳的(stationary),而该随机过程是一而该随机过程是一平稳随机过程(平稳随机过程(stationary stochastic process)。宽平稳、广义平稳宽平稳、广义平稳 白噪声(白噪声(white noise)过程是平稳的:过程是平稳的:Xt=t ,tN(0,2)随机游走(随机游走(random walk)过程是非平稳的:过程是非平稳的:Xt=Xt-1+t,tN(0,2)Var(Xt)=t2 随机游走的随机游走的一阶差分(一阶差分(first difference)是平稳是平稳的:的:Xt=Xt-Xt-1=t,tN(0,2)如果一个时间序列是非平稳的,它常常可通过如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列。取差分的方法而形成平稳序列。二、平稳性的图示判断二、平稳性的图示判断10 平稳随机过程的均值和方差函数是常数,意味着平稳时间序列的取值必然围绕一个水平的中心趋势,以相同的发散程度分布。根据这一点,可以从数据分布图形直接对数据是否平稳进行判断。例如当时间序列数据的连线图形出现类似图8.1.1a的情况时,就肯定不是平稳时间序列,因为这两种图形表明时间序列数据都没有不变的中心趋势,或者说中心趋势是变化的,而且也没有稳定的方差。11 多数经济时间序列有上升或下降的趋势性,而不是围绕不变水平波动。例如图8.1.1b中的时间序列数据就是有明显的上升趋势的时间序列数据。不符合平稳性定义,但围绕稳定上升趋势的形态与平稳数据是相似的,预测作用也相似。把这种数据排除在平稳序列之外,平稳序列的应用价值必然受到很大限制。12 这个问题可以通过对平稳性概念的扩展解决。方法是把数据的趋势部分看成先分离出来,然后根据分离趋势后的纯随机部分判定平稳性。例如一个时间序列t 时刻的随机变量可以表示为 ,其中 是一个平稳序列,那么该序列去掉时间趋势 之后的部分就是平稳的,称为“趋势平稳”。趋势平稳时间序列中的时间趋势既可以是线性,也可以是非线性的。tttYtt13自相关图检验 原理:平稳时间序列过程的自协方差,或由协方差计算的自相关函数,应该很小、很快趋向于0,具有截尾或拖尾特征。这些特征正是判断时间序列平稳性的重要依据。由于自相关是相对量指标,方便横向比较和建立一般标准,因此通常利用自相关函数进行判断。利用自相关函数判断时间序列平稳性的首要问题是计算自相关函数。14 自相关函数是以协方差函数为基础定义的 ,其中 和 分别为协方差和方差函数。因为只有时间序列的一个实现,因此不可能根据随机变量协方差、方差的定义计算,只能用样本,也就是时间序列观测值的时间平均代替总体平均,时间矩代替总体矩,得到自相关函数的估计。0/kk),(kttkYYCov0()tVar Y15 自相关函数最好的估计方法是样本自相关函数:其中:0kknYYYYntkttk1)(210()nttYYn16 对不同的k分别计算出样本自相关函数 的值以后,可以描绘出对应不同k的 的分布图形,根据图形的特征判断时间序列是否平稳。当样本自相关函数的值(对不同k)有许多落在临界值范围外时,初步判断有非平稳性。常用计量分析软件都有给出序列相关图的功能,因此运用相关图检验时间序列的平稳性非常方便。kk三、平稳性的单位根检验三、平稳性的单位根检验 (unit root test)1 1、DFDF检验检验(Dicky-Fuller Test)通过上式判断通过上式判断XtXt是否有单位根是否有单位根,就是时间序列就是时间序列平稳性的平稳性的单位根检验单位根检验。tttXX1tttXX1tttttXXX11)1(随机游走,非平稳随机游走,非平稳对该式回归,如果确实对该式回归,如果确实发现发现=1,则称随机变,则称随机变量量XtXt有一个有一个单位根单位根。等价于通过该式判断等价于通过该式判断是否存在是否存在=0。一般检验模型一般检验模型tttXX1tttXX1零假设零假设 H0:=0备择假设备择假设 H1:0可通过可通过OLS法下的法下的t检验完成。检验完成。但是,在零假设(序列非平稳)下,即使在大样但是,在零假设(序列非平稳)下,即使在大样本下本下t统计量也是有偏误的(向下偏倚),通常的统计量也是有偏误的(向下偏倚),通常的t 检验无法使用。检验无法使用。Dicky和和Fuller于于1976年提出了这一情形下年提出了这一情形下t统计统计量服从的分布(这时的量服从的分布(这时的t统计量称为统计量称为 统计量统计量),),即即DF分布分布。由于由于t统计量的向下偏倚性,它呈现围绕小于零均统计量的向下偏倚性,它呈现围绕小于零均值的偏态分布。值的偏态分布。如果如果t临界值,则拒绝零假设临界值,则拒绝零假设H0:=0,认为,认为时间序列不存在单位根,是平稳的。时间序列不存在单位根,是平稳的。单尾检验2 2、ADFADF检验(检验(Augment Dickey-Fuller test)为什么将为什么将DFDF检验扩展为检验扩展为ADFADF检验?检验?DF检验假定时间序列是由具有白噪声随机误差检验假定时间序列是由具有白噪声随机误差项的一阶自回归过程项的一阶自回归过程AR(1)生成的。但在实际检生成的。但在实际检验中,时间序列可能由更高阶的自回归过程生验中,时间序列可能由更高阶的自回归过程生成,或者随机误差项并非是白噪声,用成,或者随机误差项并非是白噪声,用OLS法法进行估计均会表现出随机误差项出现自相关,进行估计均会表现出随机误差项出现自相关,导致导致DF检验无效。检验无效。如果时间序列含有明显的随时间变化的某种趋如果时间序列含有明显的随时间变化的某种趋势(如上升或下降),也容易导致势(如上升或下降),也容易导致DF检验中的检验中的自相关随机误差项问题。自相关随机误差项问题。ADFADF检验模型检验模型tmiitittXXX11tmiitittXXX11tmiitittXXtX11零假设零假设 H0:=0 备择假设备择假设 H1:500-2.58-2.23-1.95-1.61 25-3.75-3.33-3.00-2.62 50-3.58-3.22-2.93-2.60 100-3.51-3.17-2.89-2.58 250-3.46-3.14-2.88-2.57 500-3.44-3.13-2.87-2.57 500-3.43-3.12-2.86-2.57 25 3.41 2.97 2.61 2.20 50 3.28 2.89 2.56 2.18 100 3.22 2.86 2.54 2.17 250 3.19 2.84 2.53 2.16 500 3.18 2.83 2.52 2.16 2 500 3.18 2.83 2.52 2.16 模型 统计量 样本容量 0.01 0.025 0.05 0.10 25-4.38-3.95-3.60-3.24 50-4.15-3.80-3.50-3.18 100-4.04-3.73-3.45-3.15 250-3.99-3.69-3.43-3.13 500-3.98-3.68-3.42-3.13 500-3.96-3.66-3.41-3.12 25 4.05 3.59 3.20 2.77 50 3.87 3.47 3.14 2.75 100 3.78 3.42 3.11 2.73 250 3.74 3.39 3.09 2.73 500 3.72 3.38 3.08 2.72 500 3.71 3.38 3.08 2.72 25 3.74 3.25 2.85 2.39 50 3.60 3.18 2.81 2.38 100 3.53 3.14 2.79 2.38 250 3.49 3.12 2.79 2.38 500 3.48 3.11 2.78 2.38 3 500 3.46 3.11 2.78 2.38 一个简单的检验过程:一个简单的检验过程:同时估计出上述三个模型的适当形式,然后通过同时估计出上述三个模型的适当形式,然后通过ADF临界值表检验零假设临界值表检验零假设H0:=0。只要其中有一个模型的检验结果拒绝了零假设,就只要其中有一个模型的检验结果拒绝了零假设,就可以认为时间序列是平稳的;可以认为时间序列是平稳的;当三个模型的检验结果都不能拒绝零假设时,则认当三个模型的检验结果都不能拒绝零假设时,则认为时间序列是非平稳的。为时间序列是非平稳的。3 3、例:检验、例:检验1978-20001978-2000年间中国支出法年间中国支出法GDPGDP时间序列的平稳性时间序列的平稳性 例例8.1.6检验检验19782006年间中国实际支出法国年间中国实际支出法国内生产总值内生产总值GDPC时间序列的平稳性。时间序列的平稳性。下面演示的是检验下面演示的是检验19782000年间中国支出法年间中国支出法国内生产总值国内生产总值GDPC时间序列的平稳性。时间序列的平稳性。方法原理和过程是一样的,例方法原理和过程是一样的,例8.1.6可以作为同可以作为同学的练习。学的练习。21101.150.10093.027.22933.1011ttttGDPGDPGDPTGDP (-1.26)(1.91)(0.31)(8.94)(-4.95)首先检验模型首先检验模型3,经过偿试,模型,经过偿试,模型3取取2阶滞后:阶滞后:需进一步检验模型需进一步检验模型2。LM(1)=0.92,LM(2)=4.16 系数的系数的t临界值,临界值,不能拒绝存在单位根不能拒绝存在单位根的零假设。的零假设。时间T的t统计量小于ADF临界值,因此不能拒绝不存在趋势不能拒绝不存在趋势项的零假设项的零假设。小于小于5%显著性水平下自由度分别为显著性水平下自由度分别为1与与2的的 2分布的临界值,可见不存分布的临界值,可见不存在自相关性,因此该模型的设定是在自相关性,因此该模型的设定是正确的。正确的。检验模型检验模型2,经试验,模型,经试验,模型2中滞后项取中滞后项取2阶:阶:21115.165.1057.045.357ttttGDPGDPGDPGDP (-0.90)(3.38)(10.40)(-5.63)LM(1)=0.57 LM(2)=2.85 常数项的t统计量小于AFD分布表中的临界值,不能拒绝不能拒绝不存常数项的零假设。不存常数项的零假设。LM检验表明模型残差不存在自相关性,因此该模型的设定是正确的。GDPt-1参数值的t统计量为正值,大于临界值,不能拒绝存在不能拒绝存在单位根的零假设单位根的零假设。需进一步检验模型需进一步检验模型1。检验模型检验模型1 1,经试验,模型,经试验,模型1中滞后项取中滞后项取2阶:阶:GDPt-1参数值的t统计量为正值,大于临界值,不能拒绝不能拒绝存在单位根的零假设。存在单位根的零假设。211194.1701.1063.0ttttGDPGDPGDPGDP (4.15)(11.46)(-6.05)LM(1)=0.17 LM(2)=2.67 LM检验表明模型残差项不存在自相关性,因此模型的设定是正确的。可断定中国支出法可断定中国支出法GDP时间序列是非平稳的。时间序列是非平稳的。ADFADF检验在检验在EviewsEviews中的实现中的实现ADFADF检验在检验在EviewsEviews中的实现中的实现ADFADF检验在检验在EviewsEviews中的实现中的实现检验检验GDPPGDPPADFADF检验在检验在EviewsEviews中的实现中的实现检验检验GDPPGDPP从从GDPP(-1)的参数值看,的参数值看,其其t统计量的值统计量的值大于临界值,大于临界值,不能拒绝存在不能拒绝存在单位根的零假单位根的零假设。同时,由设。同时,由于时间项于时间项T的的t统计量也小于统计量也小于ADF分布表中分布表中的临界值,因的临界值,因此不能拒绝不此不能拒绝不存在趋势项的存在趋势项的零假设。需进零假设。需进一步检验模型一步检验模型2。ADFADF检验在检验在EviewsEviews中的实现中的实现检验检验GDPPGDPPADFADF检验在检验在EviewsEviews中的实现中的实现检验检验GDPPGDPP从从GDPP(-1)的参数值看,的参数值看,其其t统计量的值统计量的值大于临界值,大于临界值,不能拒绝存在不能拒绝存在单位根的零假单位根的零假设。同时,由设。同时,由于常数项的于常数项的t统统计量也小于计量也小于ADF分布表中分布表中的临界值,因的临界值,因此不能拒绝不此不能拒绝不存在趋势项的存在趋势项的零假设。需进零假设。需进一步检验模型一步检验模型1。ADFADF检验在检验在EviewsEviews中的实现中的实现检验检验GDPPGDPPADFADF检验在检验在EviewsEviews中的实现中的实现GDPPGDPP从从GDPP(-1)的参数值看,的参数值看,其其t统计量的统计量的值大于临界值大于临界值,不能拒值,不能拒绝存在单位绝存在单位根的零假设。根的零假设。至此,可断至此,可断定定GDPP时时间序列是非间序列是非平稳的。平稳的。ADFADF检验在检验在EviewsEviews中的实现中的实现检验检验GDPPGDPP从从GDPP(-1)的的参数值看,其参数值看,其t统统计量的值大于临界计量的值大于临界值,不能拒绝存在值,不能拒绝存在单位根的零假设。单位根的零假设。同时,由于时间项同时,由于时间项项项T的的t统计量也小统计量也小于于AFD分布表中分布表中的临界值,因此不的临界值,因此不能拒绝不存在趋势能拒绝不存在趋势项的零假设。需进项的零假设。需进一步检验模型一步检验模型2。在在1%置信度下。置信度下。从从GDPP(-1)的的参数值看,其统参数值看,其统计量的值大于临计量的值大于临界值,不能拒绝界值,不能拒绝存在单位根的零存在单位根的零假设。同时,由假设。同时,由于常数项的于常数项的t统计统计量也小于量也小于AFD分分布表中的临界值,布表中的临界值,因此不能拒绝不因此不能拒绝不存在趋势项的零存在趋势项的零假设。需进一步假设。需进一步检验模型检验模型1。从从GDPP(-1)的参数值看,的参数值看,其统计量的值其统计量的值大于临界值,大于临界值,不能拒绝存在不能拒绝存在单位根的零假单位根的零假设。至此,可设。至此,可断定断定GDPP时间序列是非时间序列是非平稳的。平稳的。ADFADF检验在检验在EviewsEviews中的实现中的实现检验检验2 2GDPPGDPP从从2GDPP(-1)的参数值看,的参数值看,其统计量的值其统计量的值小于临界值,小于临界值,拒绝存在单位拒绝存在单位根的零假设。根的零假设。至此,可断定至此,可断定2GDPP时时间序列是平稳间序列是平稳的。的。GDPP是是I(2)过程。过程。*4 4、平稳性检验的其它方法、平稳性检验的其它方法 PP检验检验(Phillips-Perron)检验模型中不引入滞后项,以避免自由度损失降低检检验模型中不引入滞后项,以避免自由度损失降低检验效力。验效力。直接采用直接采用Newey-West一致估计式作为调整因子,修正一致估计式作为调整因子,修正一阶自回归模型得出的统计量。一阶自回归模型得出的统计量。一种非参数检验方法一种非参数检验方法tttxtx1 霍尔工具变量方法霍尔工具变量方法 用工具变量法估计用工具变量法估计ADF检验模型。检验模型。用用Xt-k和和Xt-i-k作为作为yt-1和和Xt-i的工具变量。的工具变量。检验统计量仍然服从检验统计量仍然服从ADF分布。分布。tmiitittXXtX11 DF-GLS 方法方法(Elliott,Rothenberg,Stock,ERS)去势(趋势、均值)。去势(趋势、均值)。对去势后的序列进行对去势后的序列进行ADF型检验。型检验。采用采用GLS估计检验模型。估计检验模型。证明具有更良好的性质。证明具有更良好的性质。KPSS方法方法(Kwiatkowski,Philips,Schmidt,Shin)检验趋势平稳检验趋势平稳 非参数检验方法非参数检验方法 其它方法其它方法 LMC(Leybourne,McCabe)Ng-PerronEviews Eviews 中提供的检验方法中提供的检验方法Eviews Eviews 中提供的滞后阶数选择中提供的滞后阶数选择四、单整、趋势平稳与差分平稳四、单整、趋势平稳与差分平稳1 1、单整、单整(integrated Serial)如果一个时间序列经过一次差分变成平稳的,如果一个时间序列经过一次差分变成平稳的,就称原序列是就称原序列是一阶单整(一阶单整(integrated of 1)序列)序列,记为记为I(1)。一般地,如果一个时间序列经过一般地,如果一个时间序列经过d次差分后变次差分后变成平稳序列,则称原序列是成平稳序列,则称原序列是d 阶单整阶单整(integrated of d)序列)序列,记为,记为I(d)。例如上述人均例如上述人均GDPGDP序列,即为序列,即为I(2)I(2)序列。序列。I(0)代表一平稳时间序列。代表一平稳时间序列。现实经济生活中只有少数经济指标的时间序列现实经济生活中只有少数经济指标的时间序列表现为平稳的,如利率等表现为平稳的,如利率等;大多数指标的时间序列是非平稳的,例如,以大多数指标的时间序列是非平稳的,例如,以当年价表示的消费额、收入等常是当年价表示的消费额、收入等常是2阶单整的,阶单整的,以不变价格表示的消费额、收入等常表现为以不变价格表示的消费额、收入等常表现为1阶单整。阶单整。大多数非平稳的时间序列一般可通过一次或多大多数非平稳的时间序列一般可通过一次或多次差分的形式变为平稳的。次差分的形式变为平稳的。但也有一些时间序列,无论经过多少次差分,但也有一些时间序列,无论经过多少次差分,都不能变为平稳的。这种序列被称为都不能变为平稳的。这种序列被称为非单整的非单整的(non-integrated)。2 2、趋势平稳与差分平稳随机过程、趋势平稳与差分平稳随机过程 含有一阶自回归的随机过程:含有一阶自回归的随机过程:如果如果=1,=0,Xt成为一带位移的随机游走过程。根据成为一带位移的随机游走过程。根据的正的正负,负,Xt表现出明显的上升或下降趋势。这种趋势称为表现出明显的上升或下降趋势。这种趋势称为随机性随机性趋势(趋势(stochastic trend)。如果如果=0,0,Xt成为一带时间趋势的随机变化过程。根据成为一带时间趋势的随机变化过程。根据的正负,的正负,Xt表现出明显的上升或下降趋势。这种趋势称为表现出明显的上升或下降趋势。这种趋势称为确确定性趋势(定性趋势(deterministic trend)。如果如果=1,0,则,则Xt包含有确定性与随机性两种趋势。包含有确定性与随机性两种趋势。tttXtX1 判断一个非平稳时间序列的趋势是随机性的还是确定判断一个非平稳时间序列的趋势是随机性的还是确定性的,可通过性的,可通过ADF检验中所用的第检验中所用的第3个模型进行。个模型进行。该模型中已引入了表示确定性趋势的时间变量,即该模型中已引入了表示确定性趋势的时间变量,即分离出了确定性趋势的影响。分离出了确定性趋势的影响。如果检验结果表明所给时间序列有单位根,且时间如果检验结果表明所给时间序列有单位根,且时间变量前的参数显著为零,则该序列显示出随机性趋变量前的参数显著为零,则该序列显示出随机性趋势;势;如果没有单位根,且时间变量前的参数显著地异于如果没有单位根,且时间变量前的参数显著地异于零,则该序列显示出确定性趋势。零,则该序列显示出确定性趋势。差分平稳过程和趋势平稳过程差分平稳过程和趋势平稳过程 具有随机性趋势的时间序列通过差分的方法消除随具有随机性趋势的时间序列通过差分的方法消除随机性趋势。该时间序列称为机性趋势。该时间序列称为差分平稳过程(差分平稳过程(difference stationary process);具有确定性趋势的时间序列通过除去趋势项消除确具有确定性趋势的时间序列通过除去趋势项消除确定性趋势。该时间序列称为定性趋势。该时间序列称为趋势平稳过程(趋势平稳过程(trend stationary process)。
展开阅读全文