序列的统计量、检验和分布.ppt

上传人:w****2 文档编号:16589619 上传时间:2020-10-16 格式:PPT 页数:43 大小:676KB
返回 下载 相关 举报
序列的统计量、检验和分布.ppt_第1页
第1页 / 共43页
序列的统计量、检验和分布.ppt_第2页
第2页 / 共43页
序列的统计量、检验和分布.ppt_第3页
第3页 / 共43页
点击查看更多>>
资源描述
1 第一章 序列的统计量、检验和分布 EViews提供序列的各种统计图 、 统计方法及过程 。 当用前述的方法向工作文件中读入数据后 , 就可以对 这些数据进行统计分析和图表分析 。 EViews可以计算一个序列的各种统计量并可用表 、 图等形式将其表现出来 。 视图包括最简单的曲线图 , 一直 到核密度估计 。 2 打开工作文件,双击一个序列名,即进入序列的对话 框。单击“ view”可看到菜单分为四个区,第一部分为序列 显示形式,第二和第三部分提供数据统计方法,第四部分是 转换选项和标签。 3 1.1 描述统计量 以直方图显示序列的频率分布 。 直方图将序列的长度按 等间距划分 , 显示观测值落入每一个区间的个数 。 同直方图一起显示的还有一些标准的描述统计量。这些 统计量都是由样本中的观测值计算出来的。如图 (例 1.1): 4 例 1.3中 GDP增长率的统计量: 5 均值 (mean) 即序列的平均值 ,用序列数据的总和除以数 据的个数 。 中位数 (median) 即从小到大排列的序列的中间值。是对 序列分布中心的一个粗略估计。 最大最小值 (max and min) 序列中的最大最小值。 标准差 (Standard Deviation) 标准差衡量序列的离散程度。 计算公式如下 2 11 1 yy N s i N i N 是样本中观测值的个数, 是样本均值。 y 6 偏度 ( Skewness) 衡量序列分布围绕其均值的非对称 性。计算公式如下 3 1 1 yy N S i N i 是变量方差的有偏估计。如果序列的分布 是对称的, S值为 0;正的 S值意味着序列分布有长的右拖尾,负 的 S值意味着序列分布有长的左拖尾。例 1.1中 X的偏度为 0,说明 X的分布是对称的;而例 1.3中 GDP增长率的偏度是 0.78,说明 GDP增长率的分布是不对称的。 NNs /)1( 7 峰度 ( Kurtosis) 度量序列分布的凸起或平坦程度, 计算公式如下 4 1 1 yy N K i N i 分布的凸起程度大于 正态分布;如果 K值小于 3,序列分布相 对于正态分布是平坦的。例 1.1中 X的峰度为 2.5,说明 X的分 布相对于正态分布是平坦的;而例 1.3中 GDP增长率的峰度为 2.14 ,说明 GDP增长率的分布相对于正态分布也是平坦的。 意义同 S中 , 正态分布的 K 值为 3。如果 K 值大于 3, 8 Jarque-Bera 检验 检验序列是否服从正态分布。统计 量计算公式如下 22 3 4 1 6 KS kNJB S为偏度 , K为峰度 , k是序列估计式中参数的个数 。 在正态分布的原假设下, J-B统计量是自由度为 2的 2 分 布。 J-B统计量下显示的概率值( P值)是 J-B统计量超出原 假设下的观测值的概率。如果该值很小,则拒绝原假设。当 然,在不同的显著性水平下的拒绝域是不一样的。例 1.1中 X 的 J-B统计量下显示的概率值( P值)是 0.92,接受原假设 , X 服从正态分布;而例 1.3中 GDP增长率的的 J-B统计量的概率 值( P值)是 0.455 ,也接受原假设 , 说明 GDP增长率服从正态 分布。 9 1.2 均值、中位数、方差的假设检验 这部分是对序列均值、中位数、方差的假设检验。在序 列对象菜单选择 View/tests for descriptive stats/simple hypothesis tests,就会出现下面的序列分布检验对话框: 10 1. 均值检验 mH mH : : 1 0 如果不指定序列 x 的标准差, EViews将在 t 统计量中使 用该标准差的估计值 s 。 N i i xxNsNs mxt 1 2 1 1, 是 x 的样本估计值 , N是 x的观测值的个数。在原假设下, 如果 x服从正态分布, t 统计量是自由度为 N-1的 t分布 。 x 原假设是序列 x 的期望值 m ,备选假设是 m ,即 11 如果给定 x的标准差, EViews计算 t 统计量: N mxt 是指定的 x的标准差。 要进行均值检验 , 在 Mean内输入 值 。 如果已知标准差 , 想要计算 t统计量 , 在 右边 的框内输入标准差值 。 可以输入任何 数或标准 EViews表达式 , 下页我们给出检验的输出结果 。 12 这是检验例 1.7中 GDP增长率的均值, 检验 H0: X=10%, H1: X10% 。 表中的 Probability值是 P值(边际显著水平)。 在双边假设下,如果这个值小于检验的显著水平,如 0.05则拒 绝原假设。这里我们不能拒绝原假设。 13 2. 方差检验 检验的原假设为序列 x 的方差等于 2,备选假设为双边的, x 的方差不等于 2 ,即 21 2 0 v a r: v a r: xH xH EViews计算 2统计量,计算公式如下 N i i xxNs sN 1 22 2 2 2 1 1,1 N为观测值的个数 , 为 x的样本均值 。 在原假设下 , 如果 x 服从正态分布 , 2 统计量是服从自由度为 N-1的 2分布 。 要 进行方差检验,在 Variance处填入在原假设下的方差值。 可以填入任何正数或表达式。 x 14 3. 中位数检验 原假设为序列 x的中位数等于 m,备选假设为双边假设, x的中位数不等于 m,即 mxm e dH mxm e dH : : 1 0 EViews提供了三个以排序为基础的无参数的检验统计量。 方法的主要参考来自于 Conover( 1980)和 Sheskin( 1997)。 进行中位数检验,在 Median右边的框内输入中位数的值, 可以输入任何数字表达式。 15 1.3 分布函数 EViews提供了几种对数据进行初步分析的方法。在 1.1 我们已列出了几种图来描述序列分布特征。在本节,列出了 几种散点图且允许我们可以用有参数或无参数过程来做拟合 曲线图。 这些图包含着复杂计算和大量的特殊操作,对某些完全 技术性的介绍,不必掌握所有细节。 EViews中设置的缺省值 除了对极特殊的分析外,对一般分析而言是足够用的。直接 点击 ok键接受缺省设置,就可以轻松的展现出每个图。 16 1.3.1 序列分布图 本节列出了三种描述序列经验分布特征的图。 1. CDFSurvivorQuantile图 这个图描绘出带有加或减两个标准误差带的经验累积分布 函数,残存函数和分位数函数。在序列菜单中或组菜单中选择 View /Distribution/ CDFSurvivorQuantile 时 ( 组菜单的 Multiple Graphs中 ),就会出现下面的对话框: 17 其中 , Cumulative Distribution(累积分布 )操作用来描 绘序列的经验累积函数 ( CDF) 。 CDF是序列中观测值不 超过指定值 r 的概率 )()( rxpr obrF x Survivor(残存 )操作用来描绘序列的经验残存函数 )(1)()( rFrxpr obrS xx 18 Quantile(分位数 ) 操作用来描绘序列的经验分位数 。 对 0 q 1, X 的分位数 x(q) 满足下式: qxxpr ob q )( )( qxxpr ob q 1)( )(,且 分位数函数是 CDF的反函数 , 可以通过调换 CDF的横纵 坐标轴得到 。 All选项包括 CDF, Survivor和 Quantile函数 。 Saved matrix name可以允许把结果保存在一个矩阵内 。 Include standard errors(包括标准误差 )操作标绘接近 95%的置信区间的经验分布函数。 19 工作文件 1_3.wf1中 GDP增长率的分布图 20 2. QuantileQuantile图 QuantileQuantile ( QQ图 )对于比较两个分布是一种简单 但重要的工具。这个图标绘出一个被选序列的分位数分布相对于 另一个序列的分位数分布或一个理论分布的异同。如果这两个分 布是相同的,则 QQ图将在一条直线上。如果 QQ图不在一条直线 上 ,则这两个分布是不同的 。 当选择 View/Distribution Graphs/Quantile-Quantile. 下面的 QQ Plot对话框会出 现 : 21 可以选与如下的理论分布的分位数相比较 : Normal(正态 )分布:钟形并且对称的分布 . Uniform(均匀 )分布:矩形密度函数分布 . Exponential(指数 )分布:联合指数分布是一个有着一条 长右尾的正态分布 . Logistic(逻辑 )分布:除比正态分布有更长的尾外是一种 近似于正态的对称分布 . Extreme value(极值 )分布: I型极小值分布是有一条左长 尾的负偏分布 ,它非常近似于对数正态分布 . 可以在工作文件中选择一些序列来与这些典型序列的分 位数相比较 , 也可以在编辑框中键入序列或组的名称来选择 对照的序列或组 , EViews将针对列出的每个序列计算出 QQ 图 。 22 下图是 GDP增长率和指数分布的 Q-Q图: 23 3. Kernel Density( 核密度 ) 这个视图标绘出序列分布的核密度估计 。 一个序列的 分布的最简单非参数密度估计是直方图 。 通过选 View/ Descriptive Statistics/Histogram and Stats可以得到直方图 , 直方图对原点的选择比较敏感并且是不连续的 。 下图是 GDP 增长率序列分布的直方图 : 24 核密度估计用 “ 冲击 ” 代替了直方图中的 “ 框 ” , 所以 它是平滑的 。 平滑是通过给远离被估计的点的观测值以小的 权重来达到的 。 一个序列 X 在点 x 的核密度估计为: 这里, N是观测值的数目, h是带宽(或平滑参数), K是 合并为一体的核函数。 N i i h XxK Nhxf 1 )(1)( 25 当选 View/Distribution Graphs/Kernel Density 会出现下 面的核密度对话框: 要展现核密度估计,需要指定如下几项: 26 (1) Kernel(核 ) 核函数是一个加权函数,它决定冲击的形状。 EViews针对核函数 K提供如 下操作 : Epanechnikov(default) Triangular ( 三角形 ) Uniform(Rectangular) ( 均匀分布 ) Normal(Gaussian) ( 正态分布 ) Biweight(Quartic) Triweight Cosinus 11 uIu )1()1(43 2 uIu 121 uI 221e x p21 u 111615 22 uIu 113235 32 uIu 12c os4 uIu 这里 u是核函数的辐角, I (.)是指示函数,辐角为真时,它取 1,否则取 0。 27 (2) Bandwidth(带宽) 带宽 h控制密度估计的平滑程度;带宽越大,估计越平滑。 带宽的选取在密度估计中非常重要,缺省设置是一种基于数据 的自动带宽, 34.1/,m in 9.0 5/1 RskNh 这里 N是观测值的数目; s是标准离差; R是序列的分位数 间距;因子 k是标准带宽变换 , 标准带宽变换用来调整带宽以便 对不同的核函数自动密度估计有大致相当的平滑 。 也可以自定带宽 , 先点击 User Specified, 在下面的对话框 中键入一个非负数 。 28 下图是 GDP增长率序列分布的核密度估计 : 29 1.3.2 带有拟合线的散点图 通过 view/Graph/Scatter打开一个组的视图菜单包括四种散 点图。 1. Simple Scatter( 简单散点图 ) 其第一个序列在水平轴上,其余的在纵轴上。 2. Scatter with Regression(回归散点图 ) 在组中对第一个序 列及第二个序列进行总 体变换来进行二元回归, 选择 Regression后出现 对话框: 30 工作文件 1_5.wf1中的居民消费和 GDP的带回归线的散点图 31 下面是针对二元拟合的序列变换: None Logarithmic Inverse Power Box-Cox Polynomial y x ylog xlog y1 x1 ay bx ay a )1( bxb )1( bxxx ,1 2 在编辑框中来指定参数 a,b。 如果变换是不可以的 , 会出现错 误提示 , 对多项式 (Polynomial)的阶数定的过高 。 EViews会自动降 低阶数以避免共线性 。 点击 ok后, EViews拟合出一条回归线,可以在 Fitted Y series 编辑框中键入一个名称保存这个拟合的序列。 32 Robustness lterations(稳健叠代 ) 最小二乘法对一些无关观测值的存在非常敏感,稳健叠代操 作就是产生一种对残差平方的加权形式,使无关的观测值在估计 参数时被加最小的权数。 2 1 )( ii N i i bxayr 这里 xi , yi 是变形后的序列,权值 r 通过下式得到: o t h e r w i s e mef o rmer ii i 0 16)361( 222 其中 : ei yi a bxi , m是 |ei| 的中间数,大的残差的观测值 给一个小权数。选择叠代次数应是一个整数。 33 3. Scatter with Nearest Neighber Fit(最邻近拟合散点图 ) 这是一种带宽基于最邻近点的局部回归。简而言之,对样本 中的每一数据点,它拟合出一条局部的并经加权的回归线。局部 是说只用邻近点也就是样本的子集来一步步回归,加权是说邻近 点越远给越小的权数。当选择后,会出现如下的对话框: 34 因为要靠子样本点周围的点来进行局部回归 , 并来求 拟合值 , 因此 specification操作就是确定选择识别周围进 行回归的观测值的规则 。 Bandwidth span( 带宽范围 ) 用来决定在局部回归中应包括哪些观测值 , 可以选 取在 0, 1之间的一个数 。 Polynomial degree(多项式次数 ) 选择多项式的次数来拟合每一局部回归 。 ( 1) Specification (说明操作) 35 (2) Method 操作 可以选择在样本中的每一个数据点作局部回归或在 数据点的子集中作局部回归 。 Exact(full sample) 在样本中的每一数据点都作局 部回归 Cleveland subsampling 在选取的子样本中进行回 归 , 可以在编辑框中键入子样本的大小 。 36 工作文件 1_5.wf1中的居民消费和 GDP的最邻近点拟合的散点图 37 4. Scatter with Kernel Fit(核拟合分布) 这也是一种局部回归拟合 , 不过是无参数的 。 另外与最邻 近回归拟合相比 , 区别主要体现在局部带宽的选取上 。 最邻近 拟合的有效带宽可以有很多种 , 而核拟合则固定带宽且局部的 观测值通过核函数来加权 。 局部核回归拟合通过选取参数 使加权残差平方和最小。 h XxKXxXxYxm iN i k ikii 1 2 10 N是观测值的个数 , h是带宽 ( 或光滑参数 ) , K是核函数 。 注意:对于不同的 x, 的估计值不同。 38 打开 Scatter with kernel fit,出现下面的对话框: Regression用来指定局部回归的形式 , 指定多项式的阶数 k。 Nadaraya-Watson操作设置 k=0。 Local linear操作设置 k=1。对于高阶多项式,应使用 Local polynomial 操作,可在下面编辑框中输入 k的值。 39 工作文件 1_5.wf1中的居民消费和 GDP的核拟合的散点图 使用 Local polynomial 操作, k=2。 40 Kernel用来定义核函数,这里的核函数用来在每个局部回归中 给观测值加权,对核函数的操作前面已经介绍过。核心函数如下: Epanechnikov(default) Triangular Uniform(Rectangular) Normal(Gaussian) Biweight(Quartic) Triweight Cosinus )1()1(43 2 uIu 在这里 I 是指示器, 1表示真, 2表示假。带宽 h 决定每个局 部回归的观测值的权数。越大越平滑。 12c os4 uIu 113235 32 uIu 111615 22 uIu 221e xp21 u 121 uI 11 uIu 41 1.4 相关矩阵及协方差矩阵 在组中可以显示了组中各序列的相关矩阵及协方差矩 阵。 Common Sample使任何缺数据的序列都被排除在相关 及协方差计算之外。 Pairwise Samples用相关序列的所有无丢失观察值计算。 此方法使用样本的最大数 ,但可能导致不确定矩阵。 42 1.5 交叉相关 交叉相关( Cross correlation and Correligrams) 显示组中头两个序列的交叉相关。序列 X 与 Y 的交叉相关 的计算公式如下: 00 yyxx xy xy cc lc lr 2,1,0 l 2,1,0 3,2,1,0 1 1 l T xxyy l T yyxx lc ltt lT t ltt lT t xy 注意与自相关不同,交叉相关不必围绕滞后期对称。交 叉相关图中的虚线是二倍的标准差,近似计算。 43 居民消费( CS)和 GDP的交叉相关系数
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!