第01章序列的统计量、检验和分布

资源描述

,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,1,第一章序列的统计量、检验和分布,EViews,提供序列的各种统计图、统计方法及过程。当用前述的方法向工作文件中读入数据后，就可以对这些数据进行统计分析和图表分析。,EViews,可以计算一个序列的各种统计量并可用表、图等形式将其表现出来。视图包括最简单的曲线图，一直到核密度估计。,2,打开工作文件，双击一个序列名，即进入序列的对话框。单击“,view”,可看到菜单分为四个区，第一部分为序列显示形式，第二和第三部分提供数据统计方法，第四部分是转换选项和标签。,3,1.1,描述统计量,以直方图显示序列的频率分布。直方图将序列的长度按等间距划分，显示观测值落入每一个区间的个数。,同直方图一起显示的还有一些标准的描述统计量。这些统计量都是由样本中的观测值计算出来的。如图,(,例,1.1),：,4,例,1.3,中,GDP,增长率的统计量：,5,均值,(mean),即序列的平均值,用序列数据的总和除以数据的个数。,中位数,(median),即从小到大排列的序列的中间值。是对序列分布中心的一个粗略估计。,最大最小值,(max and min),序列中的最大最小值。,标准差,(Standard Deviation),标准差衡量序列的离散程度。计算公式如下,N,是样本中观测值的个数，是样本均值。,6,偏度,（,Skewness,）,衡量序列分布围绕其均值的非对称性。计算公式如下,是变量方差的有偏估计。如果序列的分布是对称的，,S,值为,0,；正的,S,值意味着序列分布有长的右拖尾，负的,S,值意味着序列分布有长的左拖尾。例,1.1,中,X,的偏度为,0,，说明,X,的分布是对称的；而例,1.3,中,GDP,增长率的偏度是,0.78,，说明,GDP,增长率的分布是不对称的。,7,峰度,（,Kurtosis,）,度量序列分布的凸起或平坦程度，计算公式如下,分布的凸起程度大于正态分布；如果,K,值小于,3,，序列分布相对于正态分布是平坦的。例,1.1,中,X,的峰度为,2.5,，说明,X,的分布相对于正态分布是平坦的；而例,1.3,中,GDP,增长率的峰度为,2.14,，说明,GDP,增长率的分布相对于正态分布也是平坦的。,意义同,S,中,，,正态分布的,K,值为,3,。如果,K,值大于,3,，,8,Jarque-Bera,检验,检验序列是否服从正态分布。统计量计算公式如下,S,为偏度，,K,为峰度，,k,是序列估计式中参数的个数。,在正态分布的原假设下，,J-B,统计量是自由度为,2,的,2,分布。,J-B,统计量下显示的概率值（,P,值）是,J-B,统计量超出原假设下的观测值的概率。如果该值很小，则拒绝原假设。当然，在不同的显著性水平下的拒绝域是不一样的。例,1.1,中,X,的,J-B,统计量下显示的概率值（,P,值）是,0.92,，接受原假设,X,服从正态分布；而例,1.3,中,GDP,增长率的的,J-B,统计量的概率值（,P,值）是,0.455,，也接受原假设,说明,GDP,增长率服从正态分布。,9,1.2,均值、中位数、方差的假设检验,这部分是对序列均值、中位数、方差的假设检验。在序列对象菜单选择,View/tests for descriptive stats/simple hypothesis tests,，就会出现下面的序列分布检验对话框：,10,1.,均值检验,如果不指定序列,x,的标准差，,EViews,将在,t,统计量中使用该标准差的估计值,s,。,是,x,的样本估计值,，,N,是,x,的观测值的个数。在原假设下，如果,x,服从正态分布，,t,统计量是自由度为,N,-1,的,t,分布,。,原假设是序列,x,的期望值,m,，备选假设是,m,，即,11,如果给定,x,的标准差，,EViews,计算,t,统计量：,是指定的,x,的标准差。,要进行均值检验，在,Mean,内输入,值。如果已知标准差，想要计算,t,统计量，在,右边,的框内输入标准差值。可以输入任何数或标准,EViews,表达式，下页我们给出检验的输出结果。,12,这是检验例,1.7,中,GDP,增长率的均值，,检验,H,0,：,X,=,10%,，,H,1,：,X,10%,。,表中的,Probability,值是,P,值（边际显著水平）。在双边假设下，如果这个值小于检验的显著水平，如,0.05,则拒绝原假设。这里我们不能拒绝原假设。,13,2.,方差检验,检验的原假设为序列,x,的方差等于,2,，备选假设为双边的，,x,的方差不等于,2,，即,EViews,计算,2,统计量，计算公式如下,N,为观测值的个数，为,x,的样本均值。在原假设下，如果,x,服从正态分布，,2,统计量是服从自由度为,N,-1,的,2,分布,。,要,进行方差检验，在,Variance,处填入在原假设下的方差值。可以填入任何正数或表达式。,14,3,.,中位数检验,原假设为序列,x,的中位数等于,m,，备选假设为双边假设，,x,的中位数不等于,m,，即,EViews,提供了三个以排序为基础的无参数的检验统计量。方法的主要参考来自于,Conover,（,1980,）和,Sheskin,（,1997,）。,进行中位数检验，在,Median,右边的框内输入中位数的值，可以输入任何数字表达式。,15,1.3,分布函数,EViews,提供了几种对数据进行初步分析的方法。在,1.1,我们已列出了几种图来描述序列分布特征。在本节，列出了几种散点图且允许我们可以用有参数或无参数过程来做拟合曲线图。,这些图包含着复杂计算和大量的特殊操作，对某些完全技术性的介绍，不必掌握所有细节。,EViews,中设置的缺省值除了对极特殊的分析外，对一般分析而言是足够用的。直接点击,ok,键接受缺省设置，就可以轻松的展现出每个图。,16,1,.,3.1,序列分布图,本节列出了三种描述序列经验分布特征的图。,1.CDFSurvivorQuantile,图,这个图描绘出带有加或减两个标准误差带的经验累积分布函数，残存函数和分位数函数。在序列菜单中或组菜单中选择,View/Distribution/CDFSurvivorQuantile,时,(,组菜单的,Multiple Graphs,中,),，就会出现下面的对话框：,17,其中，,Cumulative Distribution(,累积分布,),操作用来描绘序列的经验累积函数（,CDF,）。,CDF,是序列中观测值不超过指定值,r,的概率,Survivor(,残存,),操作用来描绘序列的经验残存函数,18,Quantile(,分位数,),操作用来描绘序列的经验分位数。对,0,q,1,X,的分位数,x,(,q,),满足下式：,，且,分位数函数是,CDF,的反函数，可以通过调换,CDF,的横纵坐标轴得到。,All,选项包括,CDF,，,Survivor,和,Quantile,函数。,Saved matrix name,可以允许把结果保存在一个矩阵内。,Include standard errors(,包括标准误差,),操作标绘接近,95%,的置信区间的经验分布函数。,19,工作文件,1_3.wf1,中,GDP,增长率的分布图,20,2.QuantileQuantile,图,QuantileQuantile(QQ,图,),对于比较两个分布是一种简单但重要的工具。这个图标绘出一个被选序列的分位数分布相对于另一个序列的分位数分布或一个理论分布的异同。如果这两个分布是相同的，则,QQ,图将在一条直线上。如果,QQ,图不在一条直线上,则这两个分布是不同的,。,当选择,View/Distribution Graphs/Quantile-Quantile.,下面的,QQ Plot,对话框会出现,:,21,可以选与如下的理论分布的分位数相比较,:,Normal(,正态,),分布：钟形并且对称的分布,.,Uniform(,均匀,),分布：矩形密度函数分布,.,Exponential(,指数,),分布：联合指数分布是一个有着一条长右尾的正态分布,.,Logistic(,逻辑,),分布：除比正态分布有更长的尾外是一种近似于正态的对称分布,.,Extreme value(,极值,),分布：,I,型极小值分布是有一条左长尾的负偏分布,它非常近似于对数正态分布,.,可以在工作文件中选择一些序列来与这些典型序列的分位数相比较，也可以在编辑框中键入序列或组的名称来选择对照的序列或组，,EViews,将针对列出的每个序列计算出,QQ,图。,22,下图是,GDP,增长率和指数分布的,Q-Q,图：,23,3.Kernel Density,（,核密度,）,这个视图标绘出序列分布的核密度估计。一个序列的分布的最简单非参数密度估计是直方图。通过选,View/Descriptive Statistics/Histogram and Stats,可以得到直方图，直方图对原点的选择比较敏感并且是不连续的。下图是,GDP,增长率序列分布的直方图,:,24,核密度估计用“冲击”代替了直方图中的“框”，所以它是平滑的。平滑是通过给远离被估计的点的观测值以小的权重来达到的。,一个序列,X,在点,x,的核密度估计为：,这里，,N,是观测值的数目，,h,是带宽（或平滑参数），,K,是合并为一体的核函数。,25,当选,View/Distribution Graphs/Kernel Density,会出现下面的核密度对话框：,要展现核密度估计，需要指定如下几项：,26,(1)Kernel(,核,),核函数是一个加权函数，它决定冲击的形状。,EViews,针对核函数,K,提供如下操作,:,Epanechnikov(default),Triangular,（,三角形,）,Uniform(Rectangular),（,均匀分布,）,Normal(Gaussian),（,正态分布,）,Biweight(Quartic),Triweight,Cosinus,这里,u,是核函数的辐角，,I,(.),是指示函数，辐角为真时，它取,1,，否则取,0,。,27,(2),Bandwidth,（带宽）,带宽,h,控制密度估计的平滑程度；带宽越大，估计越平滑。带宽的选取在密度估计中非常重要，缺省设置是一种基于数据的自动带宽，,这里,N,是观测值的数目；,s,是标准离差；,R,是序列的分位数间距；因子,k,是标准带宽变换，标准带宽变换用来调整带宽以便对不同的核函数自动密度估计有大致相当的平滑。,也可以自定带宽，先点击,User Specified,，在下面的对话框中键入一个非负数。,28,下图是,GDP,增长率序列分布的核密度估计,:,29,1.3.2,带有拟合线的散点图,通过,view/Graph/Scatter,打开一个组的视图菜单包括四种散点图。,1.Simple Scatter,（,简单散点图,）,其第一个序列在水平轴上，其余的在纵轴上。,2.Scatter with Regression(,回归散点图,),在组中对第一个序列及第二个序列进行总体变换来进行二元回归，选择,Regression,后出现对话框：,30,工作文件,1_5.wf1,中的居民消费和,GDP,的带回归线的散点图,31,下面是针对二元拟合的序列变换：,None,Logarithmic,Inverse,Power,Box-Cox,Polynomial,在编辑框中来指定参数,a,b,。如果变换是不可以的，会出现错误提示，对多项式,(Polynomial),的阶数定的过高。,EViews,会自动降低阶数以避免共线性。,点击,ok,后，,EViews,拟合出一条回归线，可以在,Fitted Y series,编辑框中键入一个名称保存这个拟合的序列。,32,Robustness lterations(,稳健叠代,),最小二乘法对一些无关观测值的存在非常敏感，稳健叠代操作就是产生一种对残差平方的加权形式，使无

展开阅读全文

第01章序列的统计量、检验和分布

最新文档