资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2015-6-14,#,数据分析方法及软件应用,授课教师:赵,晖 副教授,北京交通大学,2015,年,5,月,时间序列分析,6.1,时间序列分析概述,6.2,数据准备,6.3,时间序列的图形化观察及检验,6.4,时间序列的预处理,(,重点,),6.5,简单回归分析法和趋势外推法,(,自学,),6.6,指数平滑法,(,重点,),6.7,ARIMA,模型分析,(,自学,),6.8,季节调整法,(,自学,),6.1,时间序列分析概述,6.1.1,时间序列的相关概念,6.1.2,时间序列分析的一般步骤,6.1.3 SPSS,时间序列分析的,特点,时间序列分析是研究事件发展变化规律的一种量化分析方法。,一般情况下,那些依时间先后顺序排列起来的一系列有相同内涵的数据通信都可以称为时间序列。,时间序列与一般的统计数据的不同之处在于:这是一些有严格先后顺序的数据。,大多数情况下它们往往存在某种前后相承的关系,而非互相独立的。时间序列分析就是包含了针对这种独特数据特点而形成和发展起来的一系列统计分析方法的一个完整的体系。,6.1.1,时间序列分析概述,6.1.2,时间序列分析的一般步骤,(,重点,),数据的准备阶段;,数据的观察及检验阶段:,总体把握时间序列发展变化的特征,以便选择恰当的模型进行分析,包括图形方法和统计检验方法;,数据的预处理阶段:,一方面能够使序列的特征体现得更加明显,利于分析模型的选择;另一方面使数据满足于模型的要求;,数据分析和建模阶段:,根据时间序列的特征和分析的要求,选择恰当的模型进行数据建模和分析;,模型的评价阶段:,与模型分析的目标相结合评价是否达到了分析的目的以及效果如何;,模型的实施应用阶段,。,可分为时域分析和频域分析两类,具体有,:,简单回归分析法,适合序列间结构分析和较长期的预测,;,趋势外推法,适用于精度要求不很高的中长期趋势预测,;,自回归移动平均,(ARMA),模型,常用于对随机性波动较频繁序列的短期预测,对于非平稳的序列可用,ARIMA,模型,;,谱分析方法,适用于那些高频波动数据。,6.1.3,时间序列分析的特点,SPSS,的时间序列分析是分散在,Data,、,Transform,、,Analyze,、,Graph,四个功能菜单当中。,在,Data,和,Transform,中实现对时间序列数据的定义和必要处理,以适应各种分析方法的要求;,在,分析,预测,中主要提供了几种时间序列的分析方法,包括指数平滑法、,ARIMA,模型和季节调整方法;,在,分析,预测,中提供了时间序列分析的图形工具,包括序列图,(Sequence),、自相关函数和偏自相关函数图等。,另外,也可利用,分析,预测,频谱,分析模块进行简单的谱分析。,6.2,数据准备,SPSS,的数据准备,包括数据文件的建立、时间定义和数据期间的指定。其中数据文件的建立与一般,SPSS,数据文件的建立方法相同,每一个变量将对应一个时间序列数据,且不必建立标志时间的变量。具体操作这里不再赘述,仅重点讨论时间定义的操作步骤。,SPSS,的时间定义功能用来将数据编辑窗口中的一个或多个变量指定为时间序列变量,并给它们赋予相应的时间标志,具体操作步骤是:,1),选择菜单,:,DataDefine Dates,,出现窗口:,2),个案为,(Cases Are),框提供了多种时间形式,可根据数据的实际情况选择与其匹配的时间格式和参数。并在第一个个案为框中输入起初日期。,至此,完成了,SPSS,的时间定义操作。,SPSS,将在当前数据编辑窗口中自动生成标志时间的变量。同时,在输出窗口中将输出一个简要的日志,说明时间标志变量及其格式和包含的周期等。,数据期间的选取可通过,SPSS,的,数据,选择,个案,(Select Cases),功能实现。,6.3,时间序列的图形化观察及检验,6.3.1,图形化观察及检验目的,6.3.2,图形化观察工具,6.3.3,时间序列的检验方法,6.3.4,图形化观察和检验的基本操作,6.3.5,图形化观察的应用,举例,6.4.1,图形化及检验目的,时间序列分析的第一步,是对其发展变化的特征有一个初步的总体把握。通过图形化观察和检验能够把握时间序列的诸多特征,如时间序列的发展趋势是上升还是下降,还是没有规律的上下波动;时间序列的变化的周期性特点;时间序列波动幅度的变化规律;时间序列中是否存在异常点,时间序列不同时间点上数据的关系等。,通过图形化观察和检验应把握以下几点,:,时间序列的正态性,,考察数据是否符合正态分布;,时间序列的平稳性,,是要了解时间序列数据适合于什么样的模型,能否直接用来建立模型等;,时间序列的周期性,,是指随着时间的推移序列呈现出有规律的周期性波动;,时间序列的其他特性,,如异常值、簇集性等。,6.3.2,图形化观察工具,序列图(,Sequence,),一,个平稳的时间序列在水平方向平稳发展,在垂直方向的波动性保持稳定,非平稳性的表现形式多种多样,主要特征有:趋势性、异方差性、波动性、周期性、季节性、以及这些特征的交错混杂等。,序列图还可用于对序列异常值的探索,以及体现序列的“簇集性”。,异常值是,那些由于外界因素的干扰而导致的与序列的正常数值范围偏差巨大的数据点。,“簇集性”是,指数据在一段时间内具有相似的水平,在不同的水平间跳跃性变化,而非平缓性变化。,直方图,(Histogram),直方图,是体现序列数据分布特征的一种图形,通过直方图可以了解序列的平稳性、正态性等特征。,自相关函数图和偏自相关函数图,(ACF,PACF),所谓,自相关是指序列与其自身经过某些阶数滞后形成的序列之间存在某种程度的相关性。对自相关的测度往往采用自协方差函数和自相关函数。偏自相关函数是在其他序列给定情况下的两序列条件相关性的度量函数。,自相关函数图和偏自相关函数图对识别时间序列的各种非平稳性和确定时序模型中的参数有非常重要的作用。,各种时间序列的自相关函数图和偏自相关函数图通常有一定的特征和规律:,1),白噪声序列,的各阶自相关函数和偏自相关函数值在理论上均为,0,。但实际当中序列多少会有一些相关性,但一般会落在置信区间内,同时没有明显的变化规律。,2),具有趋势性的非平稳时间序列,,序列的各阶自相关函数值显著不为零,同时随着阶数的增大,函数值呈缓慢下降的趋势;偏自相关函数值则呈明显的下降趋势,很快落入置信区间。,3),异方差的非平稳时间序列,,其各阶自相关函数显著不为零,且呈现出正负交错,缓慢下降的趋势;偏自相关函数值也呈正负交错的形式,且下降趋势明显。,4),具有周期性的非平稳时间序列,,其自相关函数呈明显的周期性波动,且以周期长度及其整数倍数为阶数的自相关和偏自相关函数值均显著不为零。,5),非周期的波动性时间序列,,自相关函数值会在一定的阶数之后较快的趋于零,而偏自相关函数则会很快的落入到置信区间内。,谱密度图,(Spectral),谱,密度图用于序列周期性的检验,它是时间序列频域分析中识别序列隐含周期性的有效方法。谱分析法重在对序列当中的周期成分进行识别,从而达到对序列进行认识和分解的目的。,互相关图,(Cross correlations),对,两个互相对应的时间序列进行相关性分析的实用图形工具。互相关图是依据互相关函数绘制出来的。是不同时间序列间不同时期滞后序列的相关性。,6.3.3,时间序列的检验方法,通常序列的非平稳性可通过,序列图、自相关函数图和偏自相关函数图大致分辨出来。但有时还需要一些定量的检验方法。,参数检验法。,基本思路是,将序列分成若干子序列,并分别计算子序列的均值、方差、相关函数。根据平稳性假设,当子序列中数据足够多时,各统计量在不同序列之间不应有显著差异。如果差值大于检验值,则认为序列具有非平稳性。,游程检验法。,游程检验是一个非参数检验方法,其基本思路是,将序列的数值按一定规则重新分组形成两类。游程则为时间序列中同类数据连在一起的子序列个数。一般认为,平稳性的或随机性的序列中不应出现许多同类数据连续出现的情况,也不应出现两类数据反复交替出现的情形。也就是说游程不能太多,也不能太少,。,6.3.4,图形化观察和检验的基本操作,1.,绘制序列图的基本操作,1),分析,预测,序列,图。,2),将需绘图的序列变量选入,变量,Variables,框。,3),在,时间轴标签,Time Axis Labels,框中指定横轴(时间轴)标志变量。该标志变量默认的是日期型变量。,4),在,转换,Transform,框中指定对变量进行怎样的变化处理。其中,Natural log transform,表示对数据取自然对数,,Difference,表示对数据进行,n,阶,(,默认,1,阶,),差分,,Seasonally difference,表示对数据进行季节差分,。,5),单击,时间线,Time Lines,按钮定义序列图中需要特别标注的时间点,给出了无参考线,(No reference Lines),、每一个更改的线,(Line at each change of),、在日期上的线,(Line at date),三项供选择,。,6),单击,格式,Format,按钮定义图形的格式,可选择横向或纵向序列图;对于单变量序列图,可选择绘制线图或面积图,还可选择在图中绘制序列的均值线;对多变量的序列图,可选择将不同变量在同一时间点上的点用直线连接起来。,2.,绘制自相关函数图和偏自相关函数图的操作,1),分析,预测,自,相关。,2),将需绘制的序列变量选入,变量,Variables,框。,3),在,输出,Display,框选择绘制哪种图形,其中,Autocorrelations,表示绘制自相关函数图;,Partial autocorrelations,表示绘制偏自相关函数图。一般可同时绘制两种图形。,4),单击,选项,Options,按钮定义相关参数,其中,Maximum Number of Lags,表示相关函数值包含的最大滞后期,即时间间隔,h,。一般情况下可选择两个最大周期以上的数据。在,Standard Error Method,框中指定计算相关系数标准差的方法,它将影响到相关函数图形中的置信区间,。,其中,Independence model,表示假设,序列,是白噪声的过程;,Bartlettsapproximation,表示,根据,Bartlett,给,出的估计自相关系数和偏自相关系数方差的近似式计算方差。该方法适合当序列是一个,k-1,阶的移动平均过程,且标准差随阶数的增大而增大的情况。,5),选中,Display autocorrelation at periodic lags,表示只显示时间序列周期整数倍处的相关函数值。一般如果只考虑序列中的周期因素可选中该项,否则该步可略去。,3.,绘制互相关图的基本操作,1),分析,预测,互,相关图。,2),把需绘图的序列变量选到,Variables,框中。,要求两个序列均具有平稳性。,6.3.5,图形化观察应用举例,1,、利用模拟序列数据:,1),以各种序列绘制序列图;,2),以各种序列绘制自相关函数图和偏自相关函数图。,2,、利用海关总出口额数据,绘制出口总额和外汇储备的一阶逐期差分后的序列互相关图。,以,各种,序列,绘制序列,图,时间序列分析(模拟序列数据),.sav,具有上升趋势的非平稳序列,平稳序列的序列图示例,具有异方差性的非平稳序列,具有波动性的非平稳序列,具有周期性的非平稳序列,非平稳序列差分处理后变为平稳序列,2),以各种序列绘制自相关函数和偏自相关函数图,正态白噪声的自相关函数,正态白噪声的,偏自相关函数,正态白噪声的,自相关函数图,正态白噪声,的偏,自相关函数图,一个上升趋势序列的,自相关函数图,一个上升趋势序列,的偏,自相关函数图,一个异方差序列的,自相关函数图,一个异方差序列,的偏,自相关函数图,一个周期性序列的,自相关函数图,一个周期性序列,的偏,自相关函数图,一个非周期的波动性序列的,自相关函数图,一个非周期的波动性序列,的偏,自相关函数图,2.,绘制互相关图的操作举例,时间序列分析(总出口额),.sav,互相关图,6.4,时间序列的预处理,6.4.1,预处理的目的和主要方法,6.4.2,预处理的基本操作,6.4.3,预处理的应用举例,6.4.1,预处理的目的和主要方法,通过数据的观察和检验阶段实现对序列变化特征的把握后,就可根据数据的特点和分析的需要对数据进行必要的变换处理。,预处理的目的可大致归纳为两个方面:,第一,使序列的特征体现得更加明显,利于分析模型的选择;,第二,使数据满足于某些特定模型的要求。,序列的预处理主要包括以下几个方面:,序列缺失数据的处理,序列数据的变换处理,数据,变换主要包括序列的平稳化处理和序列的平滑处理等,。序列的平衡化处理目的是使处理后的序列成为平稳序列。均值平稳化一般采用差分,(Difference),处理,方差平稳化一般用,Box-Cox,变换处理。,1),差分是一种通过逐项相减消除前后期数据相关性的方法,,可大致剔除序列中的趋势性,使数据在水平方向基本平稳。,差分不一定是相邻项之间的运算,也可以在有一定跨度的时间点之间进行。,季节差分,(Seasonal difference),就是一个典型的代表。对于既有趋势性又有季节性的序列,可同时进行差分和季节差分处理。,另外,还可以通过序列取对数以及对序列进行标准化、中心化、归一化处理等方法进行数据变换。它们可使偏态分布的序列变成对称的分布,可消除序列中的异方差性,可使变量间的非线性变换关系转换成为线性关系,在时间序列数量级很大的时候会起到显著改善计算精度的作用。,6.4.2,预处理的基本操作,序列缺失数据处理的基本操作,转换,替换,缺失值,;,把需处理的变量选择到新变量框中,在名称和方法框中,在名称后输入处理新生成的变量名,在方法中选择处理缺失值的替代方法,并单击更改按钮。,注意,若序列中第一个或最后一个数据为缺失值,只能用序列均值和线性趋势法处理。,缺失值处理的操作过程,时间序列分析(模拟序列数据),.sav,2.,序列数据变换的基本操作,SPSS,提供了专门进行时间序列数据变换的模块,其中包含,:,差分和季节差分等平稳化方法,移动平均和移动中位数等平滑方法,以及生成新序列的变换方法。基本操作步骤如下:,转换,创建,时间序列,;,把需处理的变量选择到新变量框中,在名称和函数框中,在名称后输入处理新生成的变量名,在函数中选择转换处理方法,在顺序后输入相应的阶数,并单击更改按钮。,用平滑法进行数据转换的操作,时间序列分析(模拟序列数据),.sav,6.5,简单回归法和趋势外推,法(自学,看书),6.5.1,概述,6.5.2,应用举例,6.6,指数平滑法,6.6.1,指数平滑法的基本思想,6.6.2,指数平滑法的模型,6.6.3,指数平滑法的基本操作,6.6.4,指数平滑法的应用举例,6.6.1,指数平滑法的基本思想,研究时间序列的一个重要目的是预测。移动平均是利用已知值的某种平均值进行预测的方法。移动平均包括简单移动平均法和加权移动平均法,而权数的确定较为繁琐。,指数平滑法,通过对权数的改进,使其在处理时简单易行,其基本思想也是用序列过去值的加权平均数来预测未来的值,且通过权数的大小体现事物发展中不同时期间与现实联系的紧密程度。它的目标是使预测值和观测值之间的均方误差,(MSE),达到最小。,6.6.2,指数平滑法的模型,3),三次,(,三重,),指数平滑法,包括布朗三次指数平滑,还有其它几个常用模型:,阻尼趋势模型,:适用于处理具有一个逐渐消失的线性趋势成分,但不含季节成分的时间序列数据。它与,ARIMA(1,1,2),模型类似。,简单季节模型,:适用于处理含有不随时间变化的季节成分,但不含趋势成分的时间序列数据,它与,SARIMA(0,1,1) (0,1,1)s,模型类似。,Winters,相乘性模型,:适用于处理包含线性趋势成分,且包含一个依赖序列水平的季节成分的时间序列数据。,6.6.2,指数平滑法的基本操作,由于指数平滑法要求数据中不能存在缺失值,因此在用,SPSS,进行指数平滑法分析前,应对数据序列进行缺失值填补。,SPSS,指数平滑法的基本操作步骤如下:,1),选择菜单,分析,预测,创建模型,在,弹出窗口中方法中选择指数平滑,。,时间序列分析(彩电出口),.sav,2),把,待分析的变量选择到因变量框中。,3),点击,条件按钮中选择合适的模型。包括非季节的简单指数平滑模型、霍特模型、温特线性模型及多种季节性模型。,4),在统计量、图表等子对话框中,选择需要输出的统计量和图表。,6.6.3,指数平滑法的应用,举例,利用,1992,年初,2002,年底共,11,年彩电出口量(单位:“台”)的月度数据,建立几种指数平滑模型,对彩电出口量的变化趋势进行分析和预测。,1.,首先绘制和观察彩电出口量的序列图,2.,模型一:简单指数平滑模型,3.,模型二:,Brown,线性趋势模型,4.,模型三:,Winters,可加性,模型,时间序列分析(彩电出口),.sav,彩电出口量序列,图,简单指数平滑模型,简单指数平滑模型输出的统计量,参数估计值,均方根误差,简单指数平滑模型输出的残差自相关函数和偏,自相关函数,简单指数平滑法拟合效果图,Brown,线性趋势模型,均方根误差,比简单指数平滑模型的小些,参数估计值,输出的统计量,残差自相关函数和偏自相关函数图,具有明显的季节性,Brown,线性趋势模型拟合效果图,Winters,可加性,模型,预测设定,均方根误差,比前面两个模型的更小,参数估计值,输出的统计量,残差自相关函数和偏自相关函数图,季节性趋势已消除,Winters,可加性模型拟合效果图,更佳,可进一步用其它平滑模型对其进行拟合。,6.7 ARIMA,模型,6.7.1 ARIMA,模型的基本原理,6.7.2 ARIMA,模型的基本操作,6.7.3 ARIMA,模型实例分析,ARIMA(,自回归综合移动平均,),是时间序列分析中最为常用的模型,,也称之为,Box-Jekins,模型,或带差分的自回归移动平均模型。,ARIMA,模型可以对含有季节成分的时间序列数据进行分析,它,包含三个主要的参数,自回归阶数,(p),、差分阶数,(d),、移动平均阶数,(q),,一般模型的形式记为,ARIMA(p,d,q),。,6.8,季节分解模型,6.8.1,季节分解法概述,6.8.2,季节分解模型的基本操作,6.8.3,季节分解模型实例分析,时间序列是对某一统计指标,按照指定的时间间隔,搜集整理的一组统计数据,.,一个时间序列可能,包含,4,种变动因素,:,长期趋势变动、季节性变动、循环性变动和不规则变动,。但并不是所有的时间序列都会同时含有这,4,种变动因素。,数据分析,方法及,软件应用,Questions & Answers,
展开阅读全文