状态空间模型和卡尔曼滤波

上传人:小*** 文档编号:243808771 上传时间:2024-09-30 格式:PPT 页数:30 大小:458.50KB
返回 下载 相关 举报
状态空间模型和卡尔曼滤波_第1页
第1页 / 共30页
状态空间模型和卡尔曼滤波_第2页
第2页 / 共30页
状态空间模型和卡尔曼滤波_第3页
第3页 / 共30页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,11,章 状态空间模型和卡尔曼滤波,20,世纪,60,年代初,由于工程控制领域的需要,产生了卡尔曼滤波,(Kalman Filtering),算法,。,进入,70,年代,人们明确提出了状态空间模型的标准形式,并开始将其应用到经济领域。,80,年代以后,状态空间模型已成为一种有力的建模工具。计量经济学领域中的诸多问题,如可变参数模型、时间序列分析模型、季节调整模型、景气指数的建立、不可观测变量的估计等都能转化为状态空间模型的形式,从而可以利用卡尔曼滤波来得出相应的估计及进行预测。,在一般的统计模型中出现的变量都是可以观测到的,这些模型以反映过去经济变动的时间序列数据为基础,利用回归或时间序列分析等方法估计参数,进而预测未来的值。状态空间模型的特点是提出了“状态”这一概念。实际上,无论是工程控制问题中出现的某些状态(如导弹轨迹)还是经济系统所存在的某些状态都是一种不可观测的变量,正是这种观测不到的变量反映了系统所具有的真实状态,所以被称为状态向量。这种含有不可观测变量的模型被称为,UC,模型,(Unobservable Component Model),,,UC,模型通过通常的回归方程式来估计是不可能的,必须利用状态空间模型来求解。状态空间模型建立了可观测变量和系统内部状态之间的关系,从而可以通过估计各种不同的状态向量达到分析和观测的目的。,11.1,状态空间模型,一、状态空间模型的定义,状态空间模型,(State Space Model),一般应用于多变量时间序列。设,y,t,是包含,k,个经济变量的,k,1,维可观测向量。这些变量与,m,1,维向量,t,有关,,t,被称为状态向量。定义量测方程,(Measurement Equation),为,(11.1.1),式中,T,表示样本长度,,Z,t,是,k,m,矩阵,,d,t,是,k,1,向量,,t,是,k,1,向量,是均值为,0,,协方差矩阵为,H,t,的连续的不相关扰动项,即,(11.1.2),一般地,,t,的元素是不可观测的,然而可表示成一阶马尔可夫,(Markov),过程。下面定义转移方程,(Transition Equation),为,(11.1.3),式中,T,t,是,m,m,矩阵,,c,t,是,m,1,向量,,R,t,是,m,g,矩阵,,t,是,g,1,向量,是均值为,0,,协方差矩阵为,Q,t,的连续的不相关扰动项,即,(11.1.4),若使上述的状态空间模型成立,还需要满足下面两个假定:,(1),初始状态向量,0,的均值为,a,0,,,协方差矩阵为,P,0,,,即,(11.1.6),(2),在所有的时间区间上,扰动项,t,和,t,是相互独立的,而且它们和初始状态,0,也不相关,即,(11.1.7),且,(11.1.8),量测方程中的矩阵,Z,t,d,t,H,t,与转移方程中的矩阵,T,t,c,t,R,t,Q,t,统称为系统矩阵。如不特殊指出,它们都被假定为非随机的。因此,尽管它们能随时间改变,但是都是可以预先确定的。对于任一时刻,t,,,y,t,能够被表示为当前的和过去的,t,和,t,及初始向量,0,的线性组合,所以模型是线性的。,例,1,一阶移动平均模型,MA(1),(11.1.9),通过定义状态向量,t,=(,y,t,t,),可以写成状态空间形式,(11.1.10),(11.1.11),这种形式的特点是不存在量测方程噪声。,对于任何特殊的统计模型,,t,的定义是由结构确定的。它的元素一般包含具有实际解释意义的成分,例如趋势或季节要素。状态空间模型的目标是,所建立的状态向量,t,包含了系统在时刻,t,的所有有关信息,同时又使用尽可能少的元素。所以如果状态空间模型的状态向量具有最小维数,则称为,最小实现,(Minimal Realization),。,对一个好的状态空间模型,最小实现是一个基本准则。,然而,对于任一特殊问题的状态空间模型的表示形式却不是惟一的,这一点很容易验证。考虑通过定义一个任意的非奇异矩阵,B,,,得到新的状态向量,*,t,=,B,t,。,用矩阵,B,左乘转移方程,(11.1.3),,得到,(11.1.12),式中,T,*,t,=,BT,t,B,-,1,,,c,*,t,=,Bc,t,,,R,*,t,=,BR,t,。,相应的量测方程是,(11.1.13),式中,Z,*,t,=,Z,t,B,-,1,。,例,2,二阶自回归模型,AR(2),(11.1.14),考虑两个可能的状态空间形式,(,k,=1,m,=2),是,(11.1.15),(11.1.16),换一种形式,(11.1.17),系统矩阵,Z,t,,,H,t,,,T,t,,,R,t,,,Q,t,依赖于一个未知参数的集合。状态空间模型的一个主要的任务就是估计这些参数,如在例题中的,MA,和,AR,模型的参数。为了和模型中的其它参数,如,c,t,或,d,t,相,区别,这些参数被称为超参数,(Hyperparameters),。,超参数确定了模型的随机性质,而在,c,t,和,d,t,中,出现的参数仅影响确定性的可观测变量和状态的期望值。,二、,可变参数模型的状态空间表示,通常的回归模型可用下式表示,即,(11.1.18),式中,y,t,是因变量,,x,t,是,1,m,的解释变量向量,,是待估计的未知参数向量,,t,是扰动项。这种回归方程式的估计方法一般是使用普通最小二乘法,(,OLS)、,工具变量法等计量经济模型的常用方法。但是不管用其中的哪一种方法,所估计的参数在样本期间内都是固定的。,近年来,我国由于经济改革、各种各样的外界冲击和政策变化等因素的影响,经济结构正在逐渐发生变化,而用以往的,OLS,等固定参数模型表现不出来这种经济结构的变化,因此,需要考虑采用可变参数模型,(Time-varying Parameter Model),。,下面利用状态空间模型来构造可变参数模型。,量测方程:,(11.1.19),转移方程:,(11.1.20),(11.1.21),在,(11.1.19),式中,可变参数,t,是不可观测变量,必须利用可观测变量,y,t,和,x,t,来,估计。,t,对应于,(11.1.1),中的状态向量,t,,,与,(11.1.1),相对应,,Z,t,=,x,t,,,d,t,=,0,。,在,(11.1.20),式中假定参数,t,的变动服从于,AR(1),模型(也可以简单地扩展为,AR(,p,),模型)。与,(11.1.3),相对应,,T,t,=,,,c,t,=,0,,,R,t,=,I,m,。根据,(11.1.21),式,t,和,t,是相互独立的,且服从均值为,0,,方差为,2,和协方差矩阵为,Q,的正态分布。,当一个模型被表示成状态空间形式,(State Space Form,,,缩写为,SSF),就可以对之应用一些重要的算法来求解。这些算法的核心是,Kalman,滤波。,Kalman,滤波是在时刻,t,基于所有可得到的信息计算状态向量的最理想的递推过程。,Kalman,滤波的主要作用是,当扰动项和初始状态向量服从正态分布时,能够通过预测误差分解来计算似然函数,从而可以对模型中的所有未知参数进行估计,并且当新的观测值一旦得到,就可以利用,Kalman,滤波连续地修正状态向量的估计。,11.2,卡尔曼滤波,设,Y,T,表示在时刻,T,所有可利用信息的集合,即,Y,T,=,y,T,y,T-,1,y,1,。,状态向量的估计问题根据信息的多少分为三种类型:,(1),当,t,T,时,超出样本的观测区间,是对未来状态的估计问题,称为,预测,(Prediction),;,(2),当,t,=,T,时,估计观测区间的最终时点,即对现在状态的估计问题,称为,滤波,(Filtering),;,(3),当,t,T,时,是基于利用现在为止的观测值对过去状态的估计问题,称为,光滑,(Smoothing),。,进一步,假定,a,tt-1,和,P,tt-1,分别表示以利用到,t,1,为止的信息集合,Y,T-,1,为条件的状态向量,t,的条件均值和条件误差协方差矩阵,即,在本节假定系统矩阵,Z,t,H,t,T,t,R,t,和,Q,t,是已知的,设初始状态向量,0,的均值和误差协方差矩阵的初值为,a,0,和,P,0,,,并假定,a,0,和,P,0,也是已知的。,考虑状态空间模型,(11.1.1),、,(11.1.3),,设,a,t-1,表示基于信息集合,Y,T-,1,的,t,-1,的估计量,,P,t 1,表示估计误差的,m,m,协方差矩阵,即,(11.2.1),当给定,a,t-1,和,P,t 1,时,,t,的条件分布的均值由下式给定,即,(11.2.2),在,11.3,节中将要证明在扰动项和初始状态向量服从正态分布的假设下,,t,的条件分布的均值,a,tt-1,是在最小均方误差意义下的一个最优估计量。估计误差的协方差矩阵是,(11.2.3),方程,(11.2.2),、,(11.2.3),叫预测方程,(Prediction Equations),。,一旦得到新的观测值,y,t,,,就能够修正,t,的估计,a,tt-1,,,更新方程,(Updating Equations),是,(11.2.4),和,(11.2.5),其中,(11.2.6),上述的,(11.2.2)(11.2.6),一起构成,Kalman,滤波,的公式。,Kalman,滤波的初值可以按,a,0,和,P,0,或,a,10,和,P,10,来指定。这样每当得到一个观测值时,,Kalman,滤波提供了状态向量的最优估计。当所有的,T,个观测值都已处理,,Kalman,滤波基于信息集合,Y,T,,,产生当前状态向量和下一时间期间状态向量的最优估计。这个估计包含了产生未来状态向量的最优预测所需的所有信息。,预测误差,(11.2.23),被称为新息,(Innovations),,,因为它代表了最后观测的新信息。从更新方程,(11.2.4),中可以看出,新息,v,t,对修正状态向量的估计量起到了关键的作用。,在正态假定下,根据 是最小均方误差意义下的最优估计量,可以推断,v,t,的,均值是零向量。进一步地,从,(11.2.23),式容易看出,(11.2.24),式中,F,t,由,(11.2.6),式给定。在不同的时间区间,新息,v,t,是,不相关的,即,(11.2.25),在上一节讨论利用,Kalman,滤波递推公式求状态向量的估计量时,假定状态空间模型的系统矩阵,Z,t,H,t,T,t,R,t,和,Q,t,是,已知的。但实际上系统矩阵是依赖于一个未知参数的集合,这些未知参数用向量,表示,并被称为超参数。本节对于状态空间模型的量测方程,(11.1.1),和转移方程,(11.1.3),中含有未知参数的情况,介绍超参数的估计方法。,11.3,状态空间模型超参数的估计,11.3.1,极大似然估计和预测误差分解,在许多问题中,特别在关于正态分布的各种估计问题中,极大似然法是最常用的方法,这主要表现在极大似然估计量常具有某些优良的性质。这里我们采用极大似然法来估计未知的超参数。,极大似然法的原理是建立在观测值,y,1,y,T,是,独立地且具有同样的分布,于是它们的联合密度函数被给定为,(11.3.1),式中,P,(,y,t,),是第,t,个观测值集合的,(,联合,),概率密度函数。一旦得到观测值,,L,(,y,;,),就可以被解释为极大似然函数,并且可以通过关于,使函数,L,(,y,;,),达到最大来求出极大似然估计。,然而经济时间序列的一个重要特征是观测值是不独立的,因此不能用,(11.3.1),式,于是利用条件概率密度函数来代替联合密度函数,(11.3.2),式中,P,(,y,t,Y,t,-1,),表示,y,t,以,时刻,t,-1,的信息集合为条件的条件分布,即,Y,t,-1,=,y,t-,1,y,t-,2,y,1,,,P,(,y,t,Y,t,-1,)=,P,(,y,t,y
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!