面板数据的F检验固定效应检验

上传人:jin****ng 文档编号:196886026 上传时间:2023-04-01 格式:DOCX 页数:28 大小:67.83KB
返回 下载 相关 举报
面板数据的F检验固定效应检验_第1页
第1页 / 共28页
面板数据的F检验固定效应检验_第2页
第2页 / 共28页
面板数据的F检验固定效应检验_第3页
第3页 / 共28页
点击查看更多>>
资源描述
面板数据模型(PANEL DATA)F检验,固定效应检验1. 面板数据定义。时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面 数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross sec tion data或混合数据(pool da ta)。面板数据是同时在时间和截 面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面(cross section) 上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖 面(longi tudinal sec tion)上看是一个时间序列。面板数据用双下标变量表示。例如y. /i = 1, 2,,N; t = 1, 2,,Ti tN表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,y, , (i = 1,i .2, ,N)是横截面上的N个随机变量;若固定i不变,y(t = 1, 2,,T)是纵剖面 上的一个时间序列(个体)。图1N=7,T=50的面板数据示意图例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产 总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时 间序列。面板数据由30个个体组成。共有330个观测值。对于面板数据y, , i = 1, 2,,N; t = 1, 2,,T来说,如果从横截面上看,每个变 i t量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel dat a)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡 面板数据 (unbalanced panel da ta)。注意:EViwes 3.1、4.1、5.0既允许用平衡面板数据也允许用非平衡面板数据估计模型。例1 (file:panel02): 1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均 消费(不变价格)和人均收入数据见表1和表2。数据是7年的,每一年都有15个数据, 共105组观测值。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费和收入的面板 数据从纵剖面观察分别见图2和图3。从横截面观察分别见图4和图5。横截面数据散点图 的表现与观测值顺序有关。图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音 字母顺序排序的。表11999-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格)地区人均消费1996199719981999200020012002CP-AH(安徽)3282.4663646.1503777.4103989.5814203.5554495.1744784.364CP-BJ(北京)5133.9786203.0486807.4517453.7578206.2718654.43310473.12CP-FJ(福建)4011.7754853.4415197.0415314.5215522.7626094.3366665.005CP-HB(河北)3197.3393868.3193896.7784104.2814361.5554457.4635120.485CP-HLJ (黑龙江)2904.6873077.9893289.9903596.8393890.5804159.0874493.535CP-JL(吉林)2833.3213286.4323477.5603736.4084077.9614281.5604998.874CP-JS(江苏)3712.2604457.7884918.9445076.9105317.8625488.8296091.331CP-JX(江西)2714.1243136.8733234.4653531.7753612.7223914.0804544.775CP-LN(辽宁)3237.2753608.0603918.1674046.5824360.4204654.4205402.063CP-NMG (内蒙古)2572.3422901.7223127.6333475.9423877.3454170.5964850.180CP-SD(山东)3440.6843930.5744168.9744546.8785011.9765159.5385635.770CP-SH(上海)6193.3336634.1836866.4108125.8038651.8939336.10010411.94CP-SX(山西)2813.3363131.6293314.0973507.0083793.9084131.2734787.561CP-TJ(天津)4293.2205047.6725498.5035916.6136145.6226904.3687220.843CP-ZJ(浙江)5342.2346002.0826236.6406600.7496950.7137968.3278792.210资料来源:中国统计年鉴1997-2003。表21999-2002年中国东北、华北、华东15个省级地区的居民家庭人均收入数据(不变价格)地区人均收入1996199719981999200020012002IP-AH (安徽)4106.2514540.2474770.4705178.5285256.7535640.5976093.333IP-BJ (北京)6569.9017419.9058273.4189127.9929999.70011229.6612692.38IP-FJ (福建)4884.7316040.9446505.1456922.1097279.3938422.5739235.538IP-HB (河北)4148.2824790.9865167.3175468.9405678.1955955.0456747.152IP-HLJ (黑龙江)3518.4973918.3144251.4944747.0454997.8435382.8086143.565IP-JL (吉林)3549.9354041.0614240.5654571.4394878.2965271.9256291.618IP-JS (江苏)4744.5475668.8306054.1756624.3166793.4377316.5678243.589IP-JX (江西)3487.2693991.4904209.3274787.6065088.3155533.6886329.311IP-LN (辽宁)3899.1944382.2504649.7894968.1645363.1535797.0106597.088IP-NMG (内蒙古)3189.4143774.8044383.7064780.0905063.2285502.8736038.922IP-SD (山东)4461.9345049.4075412.5555849.9096477.0166975.5217668.036IP-SH(上海)7489.4518209.0378773.10010770.0911432.2012883.4613183.88IP-SX(山西)3431.5943869.9524156.9274360.0504546.7855401.8546335.732IP-TJ(天津)5474.9636409.6907146.2717734.9148173.1938852.4709375.060IP-ZJ(浙江)6446.5157158.2887860.3418530.3149187.28710485.6411822.00资料来源:中国统计年鉴1997-2003。图215个省级地区的人均消费序列(纵剖面)图315个省级地区的人均收入序列(file:4panel02)图4 15个省级地区的人均消费散点图图515个省级地区的人均收入散点图(7个横截面叠加)(每条连线表示同一年度15个地区的消费值)(每条连线表示同一年度15个地区的收入值)用 CP 表示消费,IP 表示收入。AH, BJ,町,HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、 辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。15个地区7年人均消费对收入的面板数据散点图见图6和图7。图6中每一种符号代表一个 省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图7中每一种符号代 表一个年度的截面散点图(共7个截面)。相当于观察7个截面散点图的叠加。图6 用15个时间序列表示的人均消费对收入的面板数据图7 用7个截面表示的人均消费对收入的面板数据(7个截面叠加)为了观察得更清楚一些,图8给出北京和内蒙古1996-2002年消费对收入散点图。从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古2002年 的收入与消费规模还不如北京市1996年的大。图9给出该15个省级地区1996和2002年的 消费对收入散点图。可见6年之后15个地区的消费和收入都有了相应的提高。图8北京和内蒙古1996-2002年消费对收入时序图 图91996和2002年15个地区的消费对收入散点图2.面板数据的估计。用面板数据建立的模型通常有3种。即混合估计模型、固定效应模型和随机效应模型。2.1混合估计模型。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显 著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(0LS)估计参数。如果从时间和截面看模型截距都不为零,且是一个相同的常数,以二变量模型为例,则建立 如下模型,yit = a +b1xit+eit,1 = 1,2,,N; t =】,2,,T(1)a和R不随i, t变化。称模型(1)为混合估计模型。以例1中15个地区1996和2002年数据建立关于消费的混合估计模型,得结果如下:图10EViwes估计方法:在打开工作文件窗口的基础上,点击主功能菜单中的Objects键,选NewObject功能,从而打开New Object (新对象)选择窗。在Type of Object选择区选择Pool(混合数据库),点击OK键,从而打开Pool (混合数据)窗口。在窗口中输入15个地区 标识AH(安徽)、BJ (北京)、ZJ(浙江)。工具栏中点击Sheet键,从而打开Series List (列写序列名)窗口,定义变量CP?和IP?,点击OK键,Pool (混合或合并数据库)窗 口显示面板数据。在Pool窗口的工具栏中点击Estimate键,打开Pooled Estimation (混 合估计)窗口如下图。图11在Dependent Variable (相依变量)选择窗填入CP?;在Common coefficients (系数相同) 选择窗填入IP?; Cross section specific coefficients (截面系数不同)选择窗保持空 白;在Int ercep t(截距项)选择窗点击Common;在Weigh ting(权数)选择窗点击No weigh ting。 点击Pooled Estimation (混合估计)窗口中的OK键。得输出结果如图10。相应表达式是=129.6313 +0.7587 IPit(2.0)(79.7)R2 = 0.98, SSE = 4824588, t = 1.99r0.05 (103)15个省级地区的人均支出平均占收入的76%。如果从时间和截面上看模型截距都为零,就可以建立不含截距项的(a = 0)的混合估计模 型。以二变量模型为例,建立混合估计模型如下,y = b1 x.t+e.i = 1, 2,,N; t = 1, 2,,it1 it itT(2)对于本例,因为上式中的截距项有显著性(t = 2.0 t () = 1.99),所以建立截距项0.05 (103)为零的混合估计模型是不合适的。EViwes估计方法:在Pooled Estimation (混合估计)对话框中Intercept (截距项)选择 窗中选None,其余选项同上。2.2固定效应模型。在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可 以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型(fixed effects regression model)。固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model)、时刻固定效应模型(t ime fixed effec ts regression model)和时刻个体固定效 应模型(time and entity fixed effec ts regression model )。下面分别介绍。(1)个体固定效应模型。个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列(个体) 截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么就应该建立个体 固定效应模型,表示如下,yit = bixit+g1Wi+ g2 W2+ +$ Wn +0,t = 1, 2,,T其中W =ie., i = 1, 2,,N; t = 1, 2,,T,表示随机误差项。y., x., i = 1, 2,,N; t ititit=1, 2,,T分别表示被解释变量和解释变量。模型(3)或者表示为y = g +b x +e , i = 1 (对于第1个个体,或时间序列),t = 1, 2,111 litItyt = g2 +di x2t +e21,i = 2 (对于第2个个体,或时间序列),t二1, 2,T yN t = gN +bi xn t +e n t,i = N (对于第N个个体,或时间序列),t = 1, 2,,T写成矩阵形式,y = (1x) +e = g +x b +e1 1111 1 y = (1x) +e = g + x b +eNNNNNN上式中y., g.,e.,X.都是N1阶列向量。b为标量。当模型中含有k个解释变量时,b为kT iiii阶列向量。进一步写成矩阵形式,=+ b +上式中的元素1, 0都是T1阶列向量。面板数据模型用OLS方法估计时应满足如下5个假定条件:(1) E(e.t|x x ,xa.) = 0。以x x ,x a.为条件的e的期望等于零。it i1i2iT ii1 i2iT iit(2) (x x ,x ), ( y y ,y ), i = 1, 2,,N分别来自于同一个联合分i1i2iTi1 i2iT布总体,并相互独立。(3) (x. , e.)具有非零的有限值4阶矩。itit(4) 解释变量之间不存在完全共线性。(5) Cov(e. e. |x. , x. , a.) = 0, t】s。在固定效应模型中随机误差项e.在时间上是非it is it is iit自相关的。其中X.代表一个或多个解释变量。it对模型(1)进行OLS估计,全部参数估计量都是无偏的和一致的。模型的自由度是NT -1-N。当模型含有k个解释变量,且N很大,相对较小时,因为模型中含有k + N个被估 参数,一般软件执行OLS运算很困难。在计量经济学软件中是采用一种特殊处理方式进行 OLS估计。估计原理是,先用每个变量减其组内均值,把数据中心化(entity-demeaned),然后用变 换的数据先估计个体固定效应模型的回归系数(不包括截距项),然后利用组内均值等式计 算截距项。这种方法计算起来速度快。具体分3步如下。(1)首先把变量中心化(en tit y-demeaned)。仍以单解释变量模型(3)为例,则有-gi+bi+,.=1,2,其中-,-i = 1, 2,,N。公式(1)、(4)相减得,- b(x -) + (e1 itit令(y.-) 一it(x.t-)=,(e,-)it-,上式写为用OLS法估计(1)、(6)式中的R,结果是一样的,但是用(6)式估计,可以减少被估 参数个数。(2)用OLS法估计回归参数(不包括截距项,即固定效应)。在k个解释变量条件下,把用向量形式表示,则利用中心化数据,按0LS法估计公式计算个体固定效应模型中回归参数估计量的方差协方差矩阵估计式如下,()=()-1其中=,是相对于的残差向量。(3) 计算回归模型截距项,即固定效应参数gj。以例1 (file:panel02)为例得到的个体固定效应模型估计结果如下:注意:个体固定效应模型的EViwes输出结果中没有公共截距项。图12EViwes 估计方法:在 EViwes 的 Pooled Estimation对话框中 Intercept 选项中选 Fixed effec ts。其余选项同上。(1) 个体固定效应模型的EViwes输出结果中没有公共截距项。(2) EViwes输出结果中没有给出描述个体效应的截距项相应的标准差和t值。不认为截距 项是模型中的重要参数。(3) 当对个体固定效应模型选择加权估计时,输出结果将给出加权估计和非加权估计两种 统计量评价结果。(4) 输出结果的联立方程组形式可以通过点击View选Represen tat ions功能获得。(5) 点击View选Wald Coefficient Tests功能可以对模型的斜率进行Wald检验。(6) 点击 View 选 Residuals/Table, Graphs, Covariance Matrix, Correlation Matrix 功能可以分别得到按个体计算的残差序列表,残差序列图,残差序列的方差协方差矩阵,残 差序列的相关系数矩阵。(7) 点击Procs选Make Model功能,将会出现估计结果的联立方程形式,进一步点击Solve 键,在随后出现的对话框中可以进行动态和静态预测。输出结果的方程形式是=+ x = 479.3 + 0.70 x安徽itit(55.0)二亠+ x 二 1053.2 + 0.70 x北京 2t2t(55.0)=+ x = 714.2 + 0.70 x浙江 15t15t(55.0)R2 = 0.99, SSE = 2270386, t = 1.98r0.05 (88)从结果看,北京、上海、浙江是消费函数截距(自发消费)最大的3个地区。相对于混合估计模型来说,是否有必要建立个体固定效应模型可以通过F检验来完成。 原假设H0:不同个体的模型截距项相同(建立混合估计模型)。备择假设H1:不同个体的模型截距项不同(建立个体固定效应模型)。F统计量定义为:F=其中SSE, SSE分别表示约束模型(混合估计模型)和非约束模型(个体固定效应模型)的 ru残差平方和。非约束模型比约束模型多了 N-1个被估参数。(混合估计模型给出公共截距项。)注意:当模型中含有k个解释变量时,F统计量的分母自由度是NT-N-k。用上例计算,已知 SSE = 4824588, SSE = 2270386,ruF= = = = 7.15F= 1.810.05(14, 89)因为F= 7.15 F () = 1.81,所以,拒绝原假设。结论是应该建立个体固定效应模型。0.05(14, 89)(2)时刻固定效应模型。时刻固定效应模型就是对于不同的截面(时刻点)有不同截距的模型。如果确知对于不同的 截面,模型的截距显著不同,但是对于不同的时间序列(个体)截距是相同的,那么应该建 立时刻固定效应模型,表示如下,y =bx +a + a D + +a D +e , i = 1, 2, ,it1 it 122T T itN(10)其中D =te., i = 1, 2,,N; t = 1, 2,,T,表示随机误差项。y. , x., i = 1, 2,,N; t iti tit=1, 2,,T分别表示被解释变量和解释变量。模型(10)也可表示为yi1 =a +b x + e ,11 i1i11 i1t = 1,(对于第1个截面),i =】,2,yi2(a1+a)2+b1 Xi2+ ei2,t = 2,(对于第2个截面),i=1, 2,yiT(a1+%)+b1 XiT+ eiT,t = T,(对于第T个截面),i=1, 2,如果满足上述模型假定条件,对模型(2)进行0LS估计,全部参数估计量都具有无偏性和致性。模型的自由度是N T -T-1。图13EViwes 估计方法:在 Pooled Estimation (混合估计)窗 口中的 Dependent Variable (相 依变量)选择窗填入CP?;在Common coefficients (系数相同)选择窗填入IP?和虚拟变 量 D1997, D1998, D1999, D2000, D2001, D2002 ;在 Cross sec tion spec if ic coefficie nts(截面系数不同)选择窗保持空白;在Int ercep t (截距项)选择窗点击Common;在Weigh ting(权数)选择窗点击No weigh ting。点击Pooled Es tima ti on (混合估计)窗口中的OK键。以例1为例得到的时刻固定效应模型估计结果如下:=+ x = 108. 5057 + 0.7789X1996i1i1(1.5)(74.6)=+ x = 108. 5057 +28. 1273 + 0.7789x1997i2i2(1.5)(0.4)(74.6)=+ x = 108. 5057 -199.8213 + 0.7789 x2002i7i7(1.5)(0.4)(74.6)R2 = 0.9867, SSE = 4028843, t = 1.98r0.05 (97)相对于混合估计模型来说,是否有必要建立时刻固定效应模型可以通过F检验来完成。H0:对于不同横截面模型截距项相同(建立混合估计模型)。Hj对于不同横截面模型的截距项不同(建立时刻固定效应模型)。F统计量定义为:F= =(11)其中SSE,SSE分别表示约束模型(混合估计模型的)和非约束模型(时刻固定效应模型的) ru的残差平方和。非约束模型比约束模型多了T-1个被估参数。注意:当模型中含有k个解释变量时,F统计量的分母自由度是NT-T- k。用上例计算,已知 SSE= 4824588,SSE= 4028843,ruF= = = = 3.19F= 2.20.05 (6, 87)因为F= 3.19F () = 2.2,拒绝原假设,结论是应该建立时刻固定效应模型。0.05(14, 89)(3) 时刻个体固定效应模型。时刻个体固定效应模型就是对于不同的截面(时刻点)、不同的时间序列(个体)都有不同截距的模型。如果确知对于不同的截面、不同的时间序列(个体)模型的截距都显著地不相 同,那么应该建立时刻个体效应模型,表示如下,yit =1 it 1b1圮+叩2+%片悟凡坞闪2+$ WN+eit,i,2,,N,七二1,2,,T(其中虚拟变量(注意不是从1开始)(注意是从1开始)e.t,it1, 2,,N; t = 1, 2,,T,表示随机误差项。y , x ,i t it(i = 1, 2,,N;1, 2,,T)分别表示被解释变量和解释变量。模型也可表示为+g +b x1 1 11+ e11,1, i = 1(对于第1个截面、第1个个体)21+g +b x2 1 21+ e21,1, i = 2(对于第1个截面、第2个个体)yN1+gN+b x1 N1+ eN1,1,(对于第1个截面、个个体)12(a1+a)2+g +b x1 1 12+ e12,2,(对于第2个截面、个个体)y22(a1+a)2+g +b x2 1 22+ e22,2,(对于第2个截面、个个体)yN2 =(a1 +a2)+gN +b1xN2 + eN2,t = 2, i = N (对于第 2 个截面、第 N 个个体) y T = (a +aT) +g +b x + eT,t = T, i = 1 (对于第 T 个截面、第 1IT1 T1 1 121T个个体)y = (a1 +aT) +g2 +b1 x + et = T, i = 2 (对于第 T 个截面、第 22 1 11 2 1 222 1个个体) yNT = (a1 +aT)+gN +b1 xNT + eNT,t = T, i = N (对于第 T 个截面、第 N 个个体)如果满足上述模型假定条件,对模型(12)进行OLS估计,全部参数估计量都是无偏的和一 致的。模型的自由度是NT - N-T。注意:当模型中含有k个解释变量时,F统计量的分母 自由度是NT- N -T- k+1。以例1为例得到的截面、时刻固定效应模型估计结果如下:图14EViwes 估计方法:在 Pooled Estimation (混合估计)窗 口中的 Dependent Variable (相 依变量)选择窗填入CP?;在Common coefficients (系数相同)选择窗填入IP?和虚拟变 量 D1997, D1998, D1999, D2000, D2001, D2002 ;在 Cross sec tion spec if ic coefficie nts(截面系数不同)选择窗保持空白;在Intercept (截距项)选择窗中选Fixed effects;在Weigh ting (权数)选择窗点击No weigh ting。点击Pooled Es tima tion (混合估计)窗口中的OK键。注意:(1)对于第1个截面(t=1) EViwes输出结果中把(a +g.), (i = 1, 2,,N)估计在1i起。(2)对于第2,,T个截面(t =1) EViwes输出结果中分别把( +a (t = 2,,T) 估计在一起。输出结果如下:二 +1996x =537.9627 + 0.6712x,11 11(1996年安徽省)二 +1996x = 1223.758 + 0.6712x,21 21(1996年北京市)年安徽省)市)二 +199719972002R2 = 0.9932,SSErx = 98.91126 + 06712x,11 11x = 98. 91126 +1223.758 + 0.6712,21 21(1997(1997年北京x = (183.3882 +870.4197) + 0.6712x ,(2002 年浙江省)15,715,12045670, t = 1.980.05 (83)相对于混合估计模型来说,是否有必要建立时刻个体固定效应模型可以通过F检验来完成。H0:对于不同横截面,不同序列,模型截距项都相同(建立混合估计模型)。片:不同横截面,不同序列,模型截距项各不相同(建立时刻个体固定效应模型)。F统计量定义为:F=(13)其中SSE, SSE分别表示约束模型(混合估计模型的)和非约束模型(时刻个体固定效应模ru型的)的残差平方和。非约束模型比约束模型多了 N+T个被估参数。注意:当模型中含有k个解释变量时,F统计量的分母自由度是NT-N-T- k+1。用上例计算,已知 SSE= 4824588, SSE= 2045670,ruF= = = = 5.6F= 1.640.05 (20, 81)因为F= 5.6 F () = 1.64,拒绝原假设,结论是应该建立时刻个体固定效应模型。0.05(14, 89)(4) 随机效应模型在固定效应模型中采用虚拟变量的原因是解释被解释变量的信息不够完整。也可以通过对误 差项的分解来描述这种信息的缺失。y = a + b x +it1 iteit其中误差项在时间上和截面上都是相关的,用3个分量表示如下。e = u + v +ititwit(15)其中u N(0, S2)表示截面随机误差分量;v N(0, S2)表示时间随机误差分量;w. N(0,iutvits 2)表示混和随机误差分量。同时还假定u, v, w.之间互不相关,各自分别不存在截面自 witit相关、时间自相关和混和自相关。上述模型称为随机效应模型。随机效应模型和固定效应模型比较,相当于把固定效应模型中的截距项看成两个随机变量。一个是截面随机误差项(u), 个是时间随机误差项(v)。如果这两个随机误差项都服 it从正态分布,对模型估计时就能够节省自由度,因为此条件下只需要估计两个随机误差项的均值和方差。假定固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应,而且对均值的离差分别是u和v ,固定效应模型就变成了随机效应模型。it为了容易理解,先假定模型中只存在截面随机误差项u,不存在时间随机误差分量(v),ity = a+ b x + (w + u) = a + b xit1 itit i1 it+e.(16)it截面随机误差项u是属于第个个体的随机波动分量,并在整个时间范围(t = 1,2,,T)i保持不变。随机误差项u, w.应满足如下条件:iitE(u) =0,iE(w ) = 0itE(w 2) = s 2,itwE(u 2)= s 2,iuE(w. uj) =0,包括所有的 i, t, joit JE(w w ) =0, i 1 j, t i s it jsE(u u) =0, i i ji j因为根据上式有 e = w + uitit i所以这种随机效应模型又称为误差分量模型(errorcomponentmodel)。有结论,E(e. ) = E(w. +u) = 0,itit j(16)式,y. = a + b x. + (w. + u),也可以写成 y.it1 ititiitit =(a + u.)ib1 xit+w.。服从正态分itE(eite.)is=E(w + u )(w + u) = E(w w + u w + w uit iis iit isi isit iu 2) =s 2, t 1 siu(ei1,ei2,e )iT布的截距项的均值效应a被包含在回归函数的常数项中。uE(eit2)=E(w +u )2 = s 2 +s 2,it jw uW = E(ee)=i i=s 2 I+s 2 11w (TT) u (T1)(T1)其中I)是(TT)阶单位阵,1(T1)是(T 1)阶列向量。因为第i期与j期观测值是相互独立的,所以NT个观测值所对应的随机误差项的方差与协方差矩阵V是V = = AW = I AWNN其中INN表示由(T1)阶列向量为元素构成的单位阵,其中每一个元素1或0都是(T1)阶列 向量。A表示科罗内克积(Kronecker product)。其运算规则是A AB =NK检验个体随机效应的原假设与检验统计量是H: S2 = 0。(混合估计模型)0 uH : S2 1 0。(个体随机效应模型)1 uLM=其中表示由个体随机效应模型计算的残差平方和。表示由混合估计模型计算的残差平方和。 统计量LM服从1个自由度的C2分布。可以对随机效应模型进行广义最小二乘估计。以观测值方差的倒数为权。为了求权数,必须 采用两阶段最小二乘法估计。因为各随机误差分量的方差一般是未知的,第一阶段用普通最 小二乘估计法对混合数据进行估计(采用固定效应模型)。用估计的残差计算随机误差分量 的方差。第二步用这些估计的方差计算参数的广义最小二乘估计值。如果随机误差分量服从 的是正态分布,模型的参数还可以用极大似然法估计。仍以例1为例给出随机效应模型估计结果如下:图15注意:随机效应模型EViwes输出结果中含有公共截距项。图16以例1为例,用个体随机效应模型和混合模型计算的统计量的值是LM = = =8.75(24.4)2 = 5209F = 3.840.05 (1)因为F= 5209 F ()= 3.84,所以拒绝原假设,结论是应该建立个体随机效应模型。0.05 (1)假定截面截距和时间截距都是随机的。分别服从均值为a和a ,方差为s 2和s 2的正态分布。uvuv随机误差项将由3部分组成,并有方差。Var(e ) = Var(u) + Var(v) + Var(w ) =s 2 +s 2+s 2ititituv w当S2和s 2都等于零,随机效应模型退化为固定效应模型。uv随机效应模型和固定效应模型哪一个更好些?实际是各有优缺点。随机效应模型的好处是节 省自由度。对于从时间序列和截面两方面上看都存在较大变化的数据,随机效应模型能明确 地描述出误差来源的特征。固定效应模型的好处是很容易分析任意截面数据所对应的因变量 与全部截面数据对应的因变量均值的差异程度。此外,固定效应模型不要求误差项中的个体 效应分量与模型中的解释变量不相关。当然,这一假定不成立时,可能会引起模型参数估计 的不一致性。(5)回归系数不同的面板数据模型当认为对于不同个体,解释变量的回归系数存在显著性差异时,还可以建立回归系数不同的 面板数据模型。EViwes 估计方法:在 Pooled Estimation (混合估计)窗 口中的 Dependent Variable (相 依变量)选择窗填入CP?;在Common coefficients (系数相同)选择窗保持空白(如果需 要估计时刻固定效应也可输入虚拟变量D1997, D1998, D1999, D2000, D2001, D2002); 在 Cross sec ti on spec if ic coefficien ts (截面系数不同)选择窗填入 IP?;在 In tercept(截距项)选择窗中选Fixed effec ts (也可以做其他选择);在Weigh ting (权数)选择 窗点击No weigh ting (也可以做其他选择)。点击Pooled Es tima tion (混合估计)窗口中 的0K键。图17=+ x = 161.62 + 0.76 x安徽itit(9.1)二亠+ x 二 36.22 + 0.81 x北京 2t2t(31.0) =+ x = 1328.26 + 0.63 x浙江 15t15t(21.1)R2 = 0.995, SSE = 1409247r用EViwes建立面板数据估计模型步骤。利用19962002年15个省级地区城镇居民家庭年人均消费性支出和年人均收入数据(不变 价格数据)介绍面板数据模型估计步骤。(1)建立混合数据库(Pool)对象。首先建立工作文件。在打开工作文件窗口的基础上,点击EViwes主功能菜单上的Objects 键,选New Object功能(如图18),从而打开New Object (新对象)选择窗。在Type of Object选择区选择Pool (合并数据库),并在Name of Object选择区为混合数据库起名 Pool01 (初始显示为Un tit led)。如图19,点击0K键,从而打开混合数据库(Pool)窗口。在窗口中输入15个地区的标识AH (安徽)、BJ (北京)、ZJ (浙江),如图20。1819图20(2)定义序列名并输入数据。在新建的混合数据库(Pool)窗口的工具栏中点击Sheet键(第2种路径是,点击View键, 选Spreadsheet (stacked data)功能),从而打开Series List (列写序列名)窗口,定义 时间序列变量CP?和IP? (?符号表示与CP和IP相连的15个地区标识名)如图21。点击 0K键,从而打开混合数据库(Pool)窗口,(点击Edit+-键,使EViwes处于可编辑状态) 输入数据。输入完成后的情形见图22。图22所示为以截面为序的阵列式排列(st acked da ta)。点击0rder+-键,还可以变换为 以时间为序的阵列式排列。工作文件也可以以合并数据(Pool data)和非合并数据的形式用复制和粘贴的方法建立。图21图22(3)估计模型图23点击Estimation键,随后弹出Pooled Estimation (混合估计)对话窗(见图23)。先对Pooled Estimation (混合估计)对话窗中各选项功能给以解释。Dependent Variable (相依变量)选择窗:用于填写被解释变量。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸设计 > 毕设全套


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!