第一讲时间序列分析

资源描述

,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,时间序列分析,1,从统计学的内容来看，统计所研究和处理的是一批有“实际背景”的数据，尽管数据的背景和类型各不相同，但从数据的形成来看，无非是,横剖面数据和纵剖面数据两类(或者叫做静态数据和动态数据)。,横剖面数据是由若干相关现象在某一时点上所处的状态组成的，它反映一定时间、地点等客观条件下诸相关现象之间存在的内在数值联系。研究这种数据结构的统计方法是多元统计分析。,纵剖面数据是由某一现象或若干现象在不同时刻上的状态所形成的数据，它反映的是现象以及现象之间关系的发展变化规律性。研究这种数据的统计方法就是时间序列分析。,2,时间序列分析是用随机过程理论和数理统计学的方法，研究随机数据序列所遵从的统计规律，以用于解决实际问题。,由于在大多数的问题中，随机数据都是依照时间先后顺序排列的，故称为时间序列。它包括一般统计分析，统计模型的建立与推断，以及关于随机序列的最优预测、控制和滤波等。,时间序列分析在第二次世界大战前就已应用于经济预测。二次大战中和战后，在军事科学、空间科学、气象预报和工业自动化等部门的应用更加广泛。近年来多维时间序列分析的研究有所进展。,3,第一节时间序列分析的一般问题,4,一、时间序列的含义,从统计意义上讲，所谓时间序列就是将某一个指标在不同时间上的不同数值，按照时间的先后顺序排列而成的数列。这种数列由于受到各种偶然因素的影响，往往表现出某种随机性，彼此之间存在着统计上的依赖关系。,5,一、时间序列的含义,例1、国际航线旅客客票数.图1给出某国际航空公司19491960年间客票月总数(单位：千张)的时间序列曲线直观上看，每年有一次大的峰值和一次小的降值并且逐年不断增加。,6,一、时间序列的含义,例2，图2是我国铁路客流员的统计曲线，记录了19711981年客票月总数从铁路客流量的时间序列曲线上可见，每年都有一次较大的峰值，大约是在1、2月份，也就是每年的春节前后有一次最大的峰值,时间序列分析的任务就是根据以往的数据找出变化规律，预报将来的客流量。,7,8,一、时间序列的含义,如表1中列出的是某地电风扇1994年到1996年间各月的销售量(单位：万台)，按时间顺序排成一个数列，就是一个时间序列。相对于时间的数据图如图1所示。,9,电风扇月销售量数据图,10,按时间次序排列的随机变量序列,X,1,，X,2,，X,i,，X,N,（1.1）,称为时间序列。,如果用,x,1,，x,2,，x,i,，x,N,（1.2）,分别表示随机变量X,1,，X,2,，X,i,，X,N,的观察值，则称（1.2）是时间序列（1.1）的N个观测样本，这里N为观测样本的个数。,11,从系统意义上看，时间序列就是某一系统在不同时间(地点、条件等)的响应。这个定义从系统运行的观点出发，不仅指出时间序列是按一定顺序排列而成的；这里的“一定顺序”既可以是时间顺序，也可以是具有各种不同意义的物理量，如代表长度、温度，速度或其它单调递增地取值的物理量。可见，时间序列只强调顺序的重要性，而并非强调必须以时间顺序排列。,例如：材料裂纹长度与其承受的压力有关，将材料裂纹长度按其所受压力周期数排列，也是一个时间序列(见表2)，其散点图见,图2。,12,材料裂纹长度与其承受的压力,13,时间序列是所研究系统的历史行为的客观记录，因而它包含了系统结构特征及其运行规律。,时间序列分析是根据观察数据的特点为数据建立尽可能合理的统计模型，然后利用模型的统计特性去研究和认识系统的结构特征(如周期波动的周期、振幅、趋势的种类等)；揭示其运行规律，进而用以预测、控制其未来行为；修正和重新设计系统(如改变其周期、参数)，使之按照新的结构运行。,时间序列的一个目的是用变量过去的观测值来预测同一变量的未来值。,14,综上所述，时间序列具有如下特点：,序列中的数据或数据点的位置依赖于时间，即数据的取值依赖于时间的变化，但不一定是时间t的严格函数。,每一时刻上的取值或数据点的位置具有一定的随机性，不可能完全准确地用历史值预测。,前后时刻(不一定是相邻时刻)的数值或数据点的位置有一定的相关性，这种相关性就是系统的动态规律性。,从整体上看，时间序列往往呈现某种趋势性或出现周期性变化的现象,。,15,下面看一个时间序列的数据例子。我们希望能够从这个数据找出一些规律，并且建立可以对未来的销售额进行预测的时间序列模型。,例1,某企业从1990年1月到2002年12月的销售数据（单位：百万元）。该数据有按照时间顺序的按月记录，共156个观测值。数据如下。,二、时间序列的分解,16,图1,某企业从1990年1月到2002年12月的销售数据图（单位：百万元）,17,图1就是由该数据得到的一个时间序列图。从这个点图可以看出。总的趋势是增长的，但增长并不是单调上升的；有涨有落。大体上看，这种升降不是杂乱无章的，和季节或月份的周期有关系。当然，除了增长的趋势和季节影响之外，还有些无规律的随机因素的作用。,这个只有一种随着时间变化的变量（销售额）的序列一般称为,纯粹时间序列（pure time series）,。,18,时间序列的组成部分,从例1可以看出，该时间序列可以有三部分组成：,趋势(trend),、,季节(seasonal),成分和无法用趋势和季节模式解释的,随机干扰,(,disturbance,)。,例1数据的销售额就可以用这三个成分叠加而成的模型来描述。一般的时间序列还可能有,循环或波动(Cyclic, or fluctuations),成分；循环模式和有规律的季节模式不同，周期长短不一定固定。比如经济危机周期，金融危机周期等等。,19,一个时间序列可能有趋势、季节、循环这三个成分中的某些或全部再加上随机成分。,因此，如果要想对一个时间序列本身进行较深入的研究，把序列的这些成分分解出来、或者把它们过滤掉则会有很大的帮助。,如果要进行预测，则最好把模型中的与这些成分有关的参数估计出来。,20,对例1的时间序列通过软件进行分解，则可以轻而易举地得到该序列的趋势、季节和误差成分。,下面的图2表示了去掉季节成分，只有趋势和误差成分的序列的一条曲线。图3用两条曲线分别描绘了纯趋势成分和纯季节成分。图4用两条曲线分别描绘了纯趋势成分和纯误差成分。这些图直观地描述了对于带有几种成分的时间序列的分解。,21,图2,去掉季节成分，只有趋势和误差成分的例1的时间序列,22,图3,例1的时间序列分解出来的纯趋势成分和纯季节成分两条曲线。,23,图4,例1的时间序列分解出来的纯趋势成分和纯误差成分两,条曲线,24,三、时间序列的主要分类,1,按所研究的对象的多少分，有,一元时间序列,和,多元时间序列,。,前面例子中，我们所研究的只是某种商品销售量这一数列，即为一元时间序列；但是，如果我们所研究的对象不仅仅是这一数列，而是多个变量，如是按年、月顺序排列的气温、气压、雨量数据，每个时刻t对应着多个变量，则这种序列为多元时间序列。多元时间序列不仅描述了各个变量的变化规律，而且还揭示了各变量间相互依存关系的动态规律性。,25,2,按时间的连续性可将时间序列分为,离散时间序列,和,连续时间序列两种。,如果某一序列中的每一个序列值所对应的时间参数为间断点，则该序列就是一个离散时间序列；,如果某一序列中的每个序列值所对应的时间参数为连续函数，则该序列就是一个连续时间序列。,我们主要研究离散时间序列，并用X,t,表示，对于连续时间序列，可通过等间隔采样使之转化为离散时间序列后加以研究。,26,3按序列的统计特性分,有,平稳时间序列和非平稳时间序列两类。,如果一个时间序列的概率分布与时间t无关，则称该序列为严格的(狭义的)平稳时间序列。如果序列的一、二阶矩存在，而且对任意时刻t满足：,(1)均值为常数,(2)协方差为时间间隔的函数,则称该序列为宽平稳时间序列，也叫广义平稳时间序列，如图3所示,。,27,注意：,我们以后所研究的时间序列主要是宽平稳时间序列。如果不明确提出严平稳，所谓的平稳即指宽平稳。反之，不具有平稳性即序列均值或协方差与时间有关的序列称之为非平稳序列，如图1、图2所示。,图3 列车运行数量平稳化后数据图,28,4按序列的分布规律来分，,有高斯型(Gaussian)时间序列,和,非高斯型(nonGaussian)时间序列,。,服从高斯分布(正态分布)的时间序列叫做高斯型时间序列，否则叫做非高斯型时间序列。本书所介绍的模型多数是假设服从高斯分布的高斯型时序模型。对于一些非高斯序列，往往通过适当变换，则可近似地看成是高斯型时间序列。,29,四、随机过程、时间序列,为什么在研究时间序列之前先要介绍随机过程？因为时间序列是由相应随机过程产生的。我们从随机过程的理论来理解和认识时间序列的一般规律。对时间序列的认识才会更深刻。,自然界中事物变化的过程可以分成两类。一类是确定型过程，一类是非确定型过程。,30,确定型过程即可以用关于时间,t,的函数描述的过程。例如，真空中的自由落体运动过程，电容器通过电阻的放电过程，行星的运动过程等。,非确定型过程即不能用一个（或几个）关于时间,t,的确定性函数描述的过程。换句话说，对同一事物的变化过程独立、重复地进行多次观测而得到的结果是不相同的。,31,例如，对河流水位的测量。其中每一时刻的水位值都是一个随机变量。如果以一年的水位纪录作为实验结果，便得到一个水位关于时间的函数,xt,。这个水位函数是预先不可确知的。只有通过测量才能得到。而在每年中同一时刻的水位纪录是不相同的。,32,随机过程：由随机变量组成的一个有序序列称为随机过程，记为,x,(,s,t,) ,s,S,t,T,。其中,S,表示样本空间，,T,表示序数集。对于每一个,t,t,T,x,(,t,) 是样本空间,S,中的一个随机变量。对于每一个,s,s,S,x,(,s, ) 是随机过程在序数集,T,中的一次实现。,随机过程简记为 ,x,t, 或,x,t,。随机过程也常简称为过程。,33,随机过程一般分为两类。一类是离散型的，一类是连续型的。如果一个随机过程,x,t,对任意的,t,T,都是一个连续型随机变量，则称此随机过程为连续型随机过程。如果一个随机过程,x,t,对任意的,t,T,都是一个离散型随机变量，则称此随机过程为离散型随机过程。本课程只考虑离散型随机过程。,34,严（强）平稳过程：一个随机过程中若随机变量的任意子集的联合分布函数与时间无关，即无论对,T,的任何时间子集（,t,1,t,2, ,tn,）以及任何实数,k, (,ti,+,k,),T,i,= 1, 2, ,n,都有,F,(,x,(,t,1) ,x,(,t,2), ,x,(,tn,) ),=,F,(,x,(,t,1 +,k,),x,(,t,2 +,k,), ,x,(,tn,+,k,) ),成立，其中,F,() 表示,n,个随机变量的联合分布函数，则称其为严平稳过程或强平稳过程。,35,严平稳意味着随机过程所有存在的矩都不随时间的变化而变化。严平稳的条件是非常严格的，而且对于一个随机过程，上述联合分布函数不便于分析和使用。因此希望给出不象强平稳那样严格的条件。若放松条件，则可以只要求分布的主要参数相同。如只要求从一阶到某阶的矩函数相同。这就引出了宽平稳概念。,36,如果一个随机过程,m,阶矩以下的矩的取值全部与时间无关，则称该过程为,m,阶平稳过程。比如,E,x,(,t,i,) = E,x,(,t,i,+,k,) =,Var,x,(,t,i,) = Var,x,(,t,i,+,k,) =,2 ,Cov,x,(,t,i,),x,(,t,j,) = Cov,x,(,t,i,+,k,),x,(,t,j,+,k,) =,i,j,2,其中,2,和,ij,2,为常数，不随,t, (,t,T,);,k, ( (,t,r,+,k,),T,r,=,i,j,) 变化而变化，则称该随机过程 ,x,t, 为二阶平稳过程（协方差平稳过程）。该过程属于宽平稳过程。,37,如果严平稳过程的二阶矩为有限常数值，则其一定是宽平稳过程。反之，一个宽平稳过程不一定是严平稳过程。但对于正态随机过程而言，严平稳与宽平稳是一致的。这是因为正态随机过程的联合分布函数完全由均值、方差和协方差所惟一确定。我们简称二阶平稳过程为平稳过程。,38,时间序列：随机过程的一次实现称为时间序列，也用,x,t,或,x,t,表示。,与随机过程相对应，时间序列分类如下，,39,时间序列中的元素称为观测值。,xt,既表示随机过程，也表示时间序列。,xt,既表示随机过程的元素随即变量，也表示时间序列的元素观测值。在不致引起混淆的情况下，为方便，,xt,也直接表示随机过程和时间序列。,随机过程与时间序列的关系如下所示：,40,某河流一年的水位值，,x,1,x,2, ,x,T-1,x,T,，可以看作一个随机过程。每一年的水位纪录则是一个时间序列，,x,1,1,x,2,1, ,x,T-1,1,x,T,1,。而在每年中同一时刻（如t = 2时）的水位纪录是不相同的。,x,2,1,x,2,2, ,x,2,n, 构成了,x,2取值的样本空间。,例如，要记录某市日电力消耗量，则每日的电力消耗量就是一个随机变量，于是得到一个日电力消耗量关于天数,t,的函数。而这些以年为单位的函数族构成了一个随机过程 ,x,t,t,= 1, 2, 365。因为时间以天为单位，是离散的，所以这个随机过程是离散型随机过程。而一年的日电力消耗量的实际观测值序列就是一个时间序列。,41,自然科学领域中的许多时间序列常常是平稳的。如工业生产中对液面、压力、温度的控制过程，某地的气温变化过程，某地100年的水文资料，单位时间内路口通过的车辆数过程等。但经济领域中多数宏观经济时间序列却都是非平稳的。如一个国家的年GDP序列，年投资序列，年进出口序列等。,42,为便于计算，先给出差分定义。,差分：时间序列变量的本期值与其滞后值相减的运算叫差分。差分分为一阶差分和高阶差分。,首先给出差分符号。对于时间序列,x t,，一阶差分可表示为,43,44,45,下面介绍两种基本的随机过程,白噪声（white noise）过程,白噪声过程：对于随机过程,x,t,t,T, 如果E(,x,t,) = 0, Var (,x,t,) =,2,t,T,; Cov (,x,t,x,t,+ k,) = 0, (,t,+,k,),T,k,0 , 则称,xt,为白噪声过程。,46,47,白噪声是平稳的随机过程，因其均值为零，方差不变，随机变量之间非相关。显然上述白噪声是二阶宽平稳随机过程。如果,x,t, 同时还服从正态分布，则它就是一个强平稳的随机过程。,白噪声源于物理学与电学，原指音频和电信号在一定频带中的一种强度不变的干扰声。,48,2. 随机游走（random walk）过程,对于下面的表达式,x,t,=,x,t,-1,+,u,t,(,2.3),如果,u,t,为白噪声过程，则称,x,t,为随机游走过程。,49,“随机游走”一词首次出现于1905年自然（Nature）杂志第72卷Pearson K.和Rayleigh L.的一篇通信中。该信件的题目是“随机游走问题”。文中讨论寻找一个被放在野地中央的醉汉的最佳策略是从投放点开始搜索。,50,51,人们为了根据时间序列揭示所研究现象的动态规律性，产生了一系列分析研究时间序列的方法。,最朴素的动态思想认为现象的未来行为与现在的行为有关，于是，人们便用现象的现在值作为其下一时刻的预测值。这种方法对于平稳发展变化的现象来说，是可行的。,52,一、时间序列数据的采集,对于所研究系统来说，相应于时间的连续性，系统在不同时刻上的响应常常是时间t的连续函数。为了数字计算处理上的方便，往往只按照一定的时间间隔对所研究系统的响应进行记录和观察，我们称之为采样。相应地把记录和观察的时间间隔称为采样间隔，并用表示。,53,例如，对某市场某种水果的价格每隔一天进行一次记录，则采样间隔为一天(1天或24小时)，每个观察值也称为采样值，第k个采样值为X,k,，也就是连续函数X(t)的值X(t,0,十k)。如图4所示。,54,注意：,在对时间序列X(t)的采样过程中，取不同的采样间隔可以得到不同的数字时间序列X,t,，t1，2。采样间隔既可以相等，也可以不等。我们这里只讨论等间隔采样，因此，在本书中将“采样间隔相等”作为建立时间序列的一条重要原则。,55,采样间隔处理？,如前所述，时间序列包含了系统的全部信息，因而人们可以藉以研究系统的动态结构和运行规律。但是，采样得到的离散时间序列X,t,失去了X(t)在t,0,+(i-1)和t,0,+i之间的值，即这个区间内系统的信息在采样之后丢失了。显然，在合理的范围内，采样间隔越小，采样值就越多，信息损失就越小，数据处理量越大，处理时间、人力、财力消耗越大。相反，采样间隔越大，采样值越少，处理时间、人力、财力消耗越小，但信息损失越大。因此，选择合适的采样间隔是建立时间序列的关键，理想的采样间隔就是既没有损失信息，也没有出现信息冗余。在实际中，研究者只能根据所研究系统的具体特性和经验，在不过分减少信息损失和不过分增加数据量之间作出合理选择。,56,二、离群点的检验与处理,离群点(Outlier)是指一个时间序列中，远离序列一般水平的极端大值和极端小值。因此，也称之为奇异值，有时也称其为野值。如图5所描述的是1949年到1997年间，我国的人口自然增长率(X,t,)。从图形中可以直观地看出，1960年的人口自然增长率大大低于其它年份的自然增长率。从序列来看，X,12,(即1960年的观察值)远离了序列X,t,，我们称X,12,为离群点。,57,概括地说，是由于系统受外部干扰而造成的。但是，形成离群点的系统外部干扰是多种多样的。,首先可能是采样中的误差，如记录仪出现偏误、工作人员出现笔误、计算差错等，都有可能产生极端大值或极端小值。,其次可能是被研究现象本身由于受各种偶然非正常的因素影响而引起的，例如，在人口死亡序列中，由于某年发生了地震，使得该年的死亡人数急剧增加，形成了离群点；在股票价格序列中，由于受某项政策出台或某种谣传的刺激，都会出现极增、极减现象，表现为序列中的离群点。,58,不论是何种原因引起的离群点，对以后的时间序列分析都会造成一定的影响。从造成分析中的困难来看，统计分析人员是不希望序列中出现离群点的，离群点会直接影响模型的拟合精度，甚至会得到一些虚假的信息。例如，两个相距很近的离群点将在谱分析中产生许多虚假的频率。,因此，离群点往往被分析人员看作是一个“坏值”。但是，从获得信息来看，离群点提供了很重要的信息，它不仅提示我们认真检查采样中是否有差错，在进行时间序列分析前，认真确认序列，而且，当确认离群点是由于系统受外部突发因素刺激而引起的时候，它会提供关于系统稳定性、灵敏性等重要信息。,59,在时间序列分析中，将离群点分为四种类型进行处理。,第一种是加性离群点,(Additive Outlier)，造成这种离群点的干扰，只影响该干扰发生的那一个时刻T上的序列值，即X,T,，而不影响该时刻以后的序列值，X,T+1,，X,T+2,，；,第二种是更新离群点,(InnovationalOutlier)，造成离群点的干扰不仅作用于X,T,，而且影响T时刻以后序列的所有观察值X,T+1,，X,T+2,，它的出现意味着一个外部干扰作用于系统的开始，并且其作用方式与系统的动态模型有关；,第三种是水平移位离群点,(Level Shift Outlier)，造成这种离群点的干扰是在某一时刻T，系统的结构发生了变化，并持续影响T时刻以后的所有行为，在数列上往往表现出T时刻前后的序列均值发生水平位移；,第四种是暂时变更离群点,(Temporary Change Outlier)，造成这种离群点的干扰是在T时刻干扰发生时具有一定初始效应，以后随时间根据衰减因子的大小呈指数衰减的一类干扰事件。,60,检验离群点并对其进行处理的方法,显然，在得到时间序列以后，首先要检验是否存在离群点，如果存在的话，还需要进一步判明在何时出现了离群点，以及所出现的离群点属于何种类型。检验离群点并对其进行处理的方法很多，但归纳起来大致有两类：,一是根据数据取值进行检查，如果某一时刻的数值超出了一定的范围，则认为该点是一个离群点，并用一定的方法进行剔点(剔除离群点)处理；,另一类是对数据进行模型分析，然后根据拟合模型后的剩余序列计算特定的统计量，测出显著的离群点及其类型，并用相应的模型进行修正，然后再对修正模型的剩余序列重复上述程序，依次测出各个离群点。关于后一类分析方法通常也称为干预分析法，有兴趣的读者可参阅有关参考书目，下面仅就前一类方法作一些简单介绍。,61,三、缺损值的补足,在采集时间序列时，有时会由于仪器故障，操作失误，观测问题等种种原因，引起在某些观测点上未能记录下来观测值，这种缺少的观测值称为缺损值(Missing Value)这种缺损值在使用次级资料时也会出现。当序列中存在缺损值时，就破坏了系统运行的连续性，违背了时间序列“顺序的重要性”原则。,严格地说，我们不能依据一个“残缺”的序列进行分析，即使强制性地进行了分析，其结果也是无意义的，可是，由于时间的不可逆性，我们又无法重新观测，因此，我们所能做的就是依据其运动轨迹或变化趋势，运用一定的方法对缺损值进行估计、推测，以补足缺损的数值,。,62,具体估算、推测方法很多，如增长量推算法、发展速度推算法、比例推算法、平滑法、插值估算法等等，分析人员可根据具体序列选择运用。,此外，在对一序列进行分析之前，还要对序列中的每一个数据的指标口径、计算范围、计算方法、计量单位等进行认真检查，对经济时间序列来说，还必须检查计算价格等方面是否一致。若存在不一致，则要运用科学的方法进行调整，使整个序列中的每一个数据除时间属性不同之外，其所代表的实际意义完全一致。,63,注意：,时间序列分析不是做数学游戏，也不是做数学练习，因此，不能盲目地对一个序列建立模型进行分析。在建模分析之前，对所研究的时间序列进行认真检查和科学地预处理，也就是建立一个规范的时间序列是十分重要的，是做好时间序列分析的基础。分析研究人员千万不可忽视。,64,下面我们以前述我国人口自然增长率为例，简要说明建立时间序列的一般过程。就人口增长率来说，它是报告期人口的自然增减数与报告期内平均人口数之比。显然，相应于时间的连续性，它是时间的连续函数，但是我们没有必要对每时每刻的人口变动都进行了解和掌握。从一般管理的需要和人口变动往往含有周期性这一特点考虑，该序列用自然年度(即1月至12月)为采样间隔，也叫年度序列。既然是自然年度序列，那么序列中不仅不允许出现其它间隔(如半年、五年等)的序列值，而且年间隔也必须是自然年度，而不能是其它年度。,65,时间间隔确定之后，指标的计算范围在同一序列中也必须保持一致。该序列习惯叫“我国人口数”，实际上是以境内为核算范围的，而不是以领土内为核算范围的。也就是说，只是大陆人口数，而不包括港、澳、台地区的人口数。因此，虽然1997年香港已经回归祖国，但是为了保持序列值计算范围的一致性，在计算1997年的人口自然增长率时，不能包含香港特别行政区的人口情况。,66,注意：一致性,就指标的计算方法来说，计算平均人口数的方法很多，用各种方法计算的结果也不完全一致，在同一序列中，各年的平均人口数必须采用相同的计算方法，本序列是用,(年初人口数+年末人口数)/2,来计算的。,至于指标口径，也必须一致。如出生人数是指活产婴儿数，即离开母体有生命现象的活婴数总和。凡出生后有呼吸、心跳、脐带蠕动、随意肌抽动等现象之一者，皆称为活产。出生后有上述一种生命现象但随后死亡者，也列入出生人数之中，同时也计入死亡人数之中。,这样，使序列中的每个数据除时间属性不同之外，其所代表的实际意义完全一致。,67,根据图5可以看出，1960年的人口自然增长率极端异常，从数值上看为 4.57，下面我们用第一种方法来检测该序列是否存在离群点。,68,我们对原序列作一次指数平滑。设平滑常数为“=0.3，并取k=6，根据(1.2.1)式， , ,的数据如图6所示。,69,第三节确定性时序分析方法概述,70,时间序列预测技术就是通过对预测目标自身时间序列的处理，来研究其变化趋势的。当我们刚接触到某一个观测序列时，会觉得它是杂乱无章，无规律可循的。其实不然，大量事实表明，一个时间序列往往是以下几类变化形式的叠加或耦合：,(1)长期趋势变动。它是指时间序列朝着一定的方向持续上升或下降，或停留在某一水平上的倾向，它反映了客观事物的主要变化趋势。,(2)季节变动。即指一年或更短的时间之内，由于受某种固定周期性因素(如自然、生产、消费等季节性因素)的影响而呈现出有规律的周期性波动。,71,(3)循环变动。通常是指周期为一年以上，由非季节因素引起的涨落起伏波形相似的波动。,(4)不规则变动。通常它分为突然变动和随机变动。所谓突然变动是指战争、自然灾害或是其它社会因素等意外事件引起的变动。随机变动是指由于大量的随机因素产生的宏观影响。根据中心极限定理，通常认为随机变动近似服从正态分布。,72,通常用T,t,表示长期趋势项，S,t,表示季节变动趋势项，C,t,表示循环变动趋势项，R,t,表示随机干扰项。常见的确定性时间序列模型有以下几种类型：,73,其中y,t,是观测目标的观测记录，,如果在预测时间范围以内，无突然变动且随机变动的方差较小，并且有理由认为过去和现在的历史演变趋势将继续发展到未来时，可用一些经验方法进行预测，具体方法如下：,74,1、移动平均法,75,它表明最近N期序列值的平均值作为未来各期的预测结果。一般N取值范围：5,N,200。当历史序列的基本趋势变化不大且序列中随机变动成分较多时，N的取值应较大一些。否则N的取值应小一些。,在有确定的季节变动周期的资料中，移动平均的项数应取周期长度。选择最佳N值的一个有效方法是，比较若干模型的预测误差。均方预测误差最小者为好。,76,当预测目标的基本趋势与某一线性模型相吻合时，常用二次移动平均法，但序列同时存在线性趋势与周期波动时，可用趋势移动平均法建立预测模型：,77,2、指数平滑法,78,3、时间回归法,79,4、季节周期预测法,由于气候条件、社会风俗习惯等原因，许多预测对象表现出明显的季节周期波动。如蔬菜销量、服装、电风扇的销售量，某城市用电量，用水量等都呈现出一定的季节性波动。有的以年度为周期，有的以季度、月、日为周期，总之这些序列容易观察到它的周期性，当周期性不甚明显时，可用序列的自相关函数来帮助识别。,季节周期预测与上述各种方法类似，首先建立预测模型，常用的模型有两种： (i)乘法型季节模型(ii)加法型季节模型,80,(i)乘法型季节模型,(ii)加法型季节模型,81,从总体上来说，确定性时序分析方法刻画了序列的主要趋势，且直观、简单，易于计算，便于运用。但是，相对说来，刻画较为粗略，其假定，尤其是对于时间函数模型来说，比较严格，现实问题很难完全满足。,82,

展开阅读全文

第一讲 时间序列分析

最新文档

第一讲时间序列分析