《计量经济学》第十六章:综列数据方法及其应用课件

上传人:痛*** 文档编号:243890547 上传时间:2024-10-01 格式:PPT 页数:28 大小:335.96KB
返回 下载 相关 举报
《计量经济学》第十六章:综列数据方法及其应用课件_第1页
第1页 / 共28页
《计量经济学》第十六章:综列数据方法及其应用课件_第2页
第2页 / 共28页
《计量经济学》第十六章:综列数据方法及其应用课件_第3页
第3页 / 共28页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,第十六章,综列数据方法及其应用,第十六章综列数据方法及其应用,16.1,综列数据简介,1.,跨越时间的两种横截面数据集,独立混合横截面,:是在不同时点(经常但并不一定是不同的年份)从一个大总体里进行随机抽样的结果。从统计学的观点看,这些数据集有一个重要的特点:它们都是由独立抽取的观测值构成的。,综列数据,(,panel data,),集,:,是指同一截面单元集上的重复观察值(,repeated observations on the same set of cross-section units,),16.1综列数据简介 1.跨越时间的两种横截面数据集,一个独立混合横截面(,independently pooled cross section,)和单一个随机样本的差异在于,在不同时点上对总体进行抽样很可能导致观测点(即观测结果)不是同分布(,identically distributed,)的情形。,综列数据集,虽然兼有横截面和时间序列的因次,但在一些重要方面却不同于独立混合横截面。如我们要在不同时间跟踪(或试图跟踪)相同的一些个人、家庭、厂家、城市、省份或别的什么单元,例如,在一个时点上,从某总体中随机地收集了一些人的个人工资、工作小时、学历和其他因素的一个综列数据集,那么,在以后的若干个时点上,要对同样的这些人反复采访,以便得到同样一群人在不同年份里的工资、工作小时、学历等数据。,一个独立混合横截面(independently pooled,现在综列数据正越来越多的被经济研究所使用。一些著名的综列数据组有:,(1),动态收入综列研究(,PSID,),。由密歇根大学的社会研究所于,1968,年开始主持,研究所每年收集大约,5000,个家庭的各种社会经济和人口统计变量。,(2),收入和参与项目调查(,SIPP,),。这个类似,PSID,的调查由商业部人口普查局主持,每年将对被访问者就其经济状况进行四次调查。,还有许多其他的调查被不同的政府机构所采用。,现在综列数据正越来越多的被经济研究所使用。一些著名的综列数据,2.,综列数据类型,平衡综列数据,(,balanced panel,):对,N,个横截面单元(个人、厂商、城市等等)的每一个都有同样的,T,期数据。,非平衡综列数据,(,unbalanced panel,):如果各个综列单元的观测次数不相同时,我们就称之为,非平衡综列,。,2.综列数据类型平衡综列数据(balanced panel),3.,综列数据的,优势,既然综列数据与一定时期内的个人、企业、州、国家等有关,那么这些单元中一定存在着差异性。,通过时间序列和横截面数据的混合,综列数据提供,“,更加有价值的数据,变量之间增加了多变性和减少了共线性,并且提高了自由度和有效性。,”,通过对重复横截面数据的研究,综列数据更适用于,变化中的动态,的研究。,综列数据能够更好的检测和度量单纯使用横截面数据或时间序列数据所无法观测到的影响。,综列数据能够使我们对更加复杂的行为模型进行研究。,通过使数据适用于数千个单元,综列数据能够将偏差降到最低,而这种偏差可能是由于我们将个人或企业情况加总到更大的集合体中所产生的。,3.综列数据的优势 既然综列数据与一定时期内的个人、企业、,4.,综列数据模型,y,it,=,截面单元,i,在时间,t,的因变量的值;,i=1,n,;,t=1,T,x,j,it,=,单元,i,在时间,t,的第,j,个解释变量的值;,假设:有,k,个解释变量,即,j=1,k,;有,n,个横截面,即,i=1,n,;时间指标,t=1,T,记第,i,个横截面的数据为,式中,y,为,nT,维,,x,为,nT,k,维,,u,为,nT,维。,4.综列数据模型式中y为nT维,x为nTk维,u为nT,5.,综列数据:一个解释性的例子,格伦费尔德(,Y.Grunfeld,)投资理论,:,企业的实际价值(,X,2,)和实际资本存量(,X,3,)是如何决定实际总投资(,Y,)。,横截面单元:四个公司,即通用电气(,GE,)、通用汽车(,GM,)、美国钢铁(,US,)以及威斯汀豪斯电气公司。,时间区间:,20,年,,19351954,年。,样本总数:,80,。,一个先验的结论是,Y,与,X,2,和,X,3,正相关。,假设,X,是非随机的,而且误差项遵从经典假设,即,u,N(0,2,),5.综列数据:一个解释性的例子 格伦费尔德(Y.Grunfe,(,1,),所有系数都不随时间和个体而变化,最简单的方法(也可能是自然的方法)就是不考虑和时间的混合数据,只是对通常的,OLS,回归进行估计。即将每个公司的,20,次观测值逐一堆置,于是模型(,5,)中的每个变量总共可以得到,80,次观测值。,OLS,结果如下:,se = (29.6124) (0.0137) (0.0493),t = (,2.1376) (8.0188) (6.1545),(,6,),R,2,= 0.7565 D-W= 0.2187,n = 80 df = 77,(1)所有系数都不随时间和个体而变化最简单的方法(也可能是自,(,2,),斜率系数不变而截距随个体而变化:固定效应或最小二乘虚拟变量(,LSDV,)回归模型,将每个公司或每个横截面单元的个体性考虑进来的一种方法是,假定截距随每个公司变化但斜率系数仍然不变。为了看到这一点,我们将模型(,5,)写成:,注意到我们将下标,i,加到了截距项上,这就表明四个公司的截距是不同的。这种差异可能是由于每个公司的特性所引起的,比如管理者风格或管理者哲学,。,模型(,7,)就是为人熟知的,固定效应,(回归)模型(,FEM,)。,(2) 斜率系数不变而截距随个体而变化:固定效应或最小二乘虚,虚拟变量方法,(,7,)式可以写成:,其中,如果观测值属于,GM,,则,D,2i,=1,,否则为,0,;如果观测值属于,US,,则,D,3i,=1,,否则为,0,;如果观测值属于威斯汀豪斯,则,D,4i,=1,,否则为,0,。由于我们用的是四个公司,因此只需用,3,个虚拟变量。换言之,,1,代表,GE,的截距,而,2,、,3,、,4,以及级差截距系数就能够说明,GM,、,US,和威斯汀豪斯的截距相对于,GE,的截距有多大的不同。,模型(,8,)称为最小二乘虚拟变量(,LSDV,)模型,。,虚拟变量方法 (7)式可以写成:,(,3,),斜率系数不变而截距随个体和时间而变化,为了考虑这种可能性,我们将(,6,)和(,10,)合并,如下所示:,(3)斜率系数不变而截距随个体和时间而变化为了考虑这种可能性,(,4,),所有系数随个体而变化,这里,我们假定所有个体单元或横截面单元的截距和斜率系数是不同的。也就是说,,GE,、,GM,、,US,和,WEST,的投资函数都不相同。我们可以容易的将,LSDV,模型扩展来考虑这种情形。,表示级差斜率系数,正如,2,、,3,和,4,表示级差截距。,如果一个或多个系数具有统计显著性,这就是告诉我们一个或多个斜率系数与基准组不同。例如,2,和,1,具有统计显著性,在这种情况下,(,2,+,1,)就给出了通用汽车的,X,2,的斜率系数值。这表明对于,GM,,,X,2,的斜率系数与通用电气这个比较公司是有差异的。,若所有的级差截距和所有的级差斜率系数都具有统计显著性,我们就可以得出这样一个结论,即通用汽车、美国钢铁和威斯汀豪斯的投资函数都是有别于通用电气的。如果事实确实如此,那么估计混合回归模型(,6,)就几乎没有意义了。,(4)所有系数随个体而变化这里,我们假定所有个体单元或横截面,变量,系数,标准误,t,值,p,值,截距,-9.9563,76.3518,-0.1304,0.8966,D2i,-139.5104,109.2808,-1.2766,0.2061,D,3i,-40.1217,129.2343,-0.3104,0.7572,D,4i,9.3759,93.1172,0.1006,0.9201,X,2i,0.0902,0.0424,2.1844,0.0324,X,3i,0.1516,0.0625,2.4250,0.0180,D,2i,X,2i,0.0926,0.0424,2.1844,0.0324,D,2i,X,3i,0.2198,0.0682,3.2190,0.0020,D,3i,X,2i,0.1448,0.0646,2.2409,0.0283,D,3i,X,3i,0.2570,0.1204,2.1333,0.0365,D,4i,X,2i,0.0265,0.1114,0.2384,0.8122,D,4i,X,3i,-0.0600,0.3785,-0.1584,0.8745,R,2,=0.9511 d=1.0896,结论:,Y,与,X,2,和,X,3,显著相关。但是,几个级差斜率系数具有统计显著性。例如对于,GE,,,X,2,的斜率系数为,0.0902,,而,GM,则为,0.1828,(,0.0902+0.0926,)。有趣的是,没有一个级差截距在统计上是显著的。,R2=0.9511 d=1.0896,16.2.,随机效应模型,及其估计方法,综列数据随机效应模型,REM,(,random effects model,)有如下结构:,ECM,的一般假设如下:,E(,i,)=E(,it,)=0,;,E(,i,it,)=0,;,E(,i,J,)=0,,,i,j,E(,it,js,)=0(i,j, t,s) E(,)=,2,I,nT,堆迭模型,16.2. 随机效应模型及其估计方法综列数据随机效应模型RE,其中,,I,是一个,T,1,的单位向量。堆迭模型中所有误差项的方差矩阵为,给定上述假定,可写出各个横截面单元的干扰项的误差协方差,其中,,= E(u,i,u,i,),是,T,T,维矩阵。,表示克罗内克,(Kronecker),积,其中,I是一个T 1的单位向量。堆迭模型中所有误差项的方差,1.,直接采用,GLS,1. 直接采用GL,投资理论(,Grunfeld,,,1958,)的随机效应模型(,REM,),有如下形式:,投资理论(Grunfeld,1958)的随机效应模型(REM,表:投资函数的,REM,估计结果,变量,系数,标准误,t,统计量,p-,值,截距,-73.0353,83.9495,-0.8699,0.3870,X2,0.1076,0.0168,6.4016,0.0000,X3,0.3457,0.0168,13.0235,0.0000,随机效应:,GM,-169.9282,GM,-9.5078,USS,165.5613,Westinghouse,13.87475,R,2,=0.9323(GLS),表:投资函数的REM估计结果 变量系数标准误t统计量p-值截,2.,采用,FGLS,对方程,两边在时间上求平均,得到,2.,有了的,2,和,2,无偏估计,就可得到未知数,和未知矩阵,-1/2,的估计,则可得参数的,FGLS,估计,有了的2和 2无偏估计,就可得到未知数和未知矩阵,16.3.,两时期固定效应模型及其估计方法,综列数据提供的另一方法,是把影响因变量的观测不到的因素分为两类:一类是恒常不变的,另一类则随时间而变。令,i,表示横截面单元,,t,表示时期,我们可将观测到的单一个解释变量的模型写成,其中:,X,it,的下标,i,表示个人、厂商、城市等等,而下标,t,表示时期。变量,(d2)t,是当,t,=1,时等于零而当,t,=2,时等于,1,的一个虚拟变量,它不随,i,而变。因此,,t,=1,的截距是,0,,而,t,=2,的截距离是,0,+,0,。,i,称为,非观测效应,(,unobserved effect,):它概括了影响着的全部观测不到的、在时间上恒定的因素,即意味着尽管不同的个体具有不同的截距系数,但每个个体的截距不随时间而变化。在应用研究中也常常把,i,当做一种,固定效应,(,fixed effect,),意味着在时间上是固定的。,误差,it,常被称为,特异性误差,(,idiosyncratic error,)或时变(,time-varying,)误差,它代表因时间而变且影响着的那些非观测因素。,16.3.两时期固定效应模型及其估计方法综列数据提供的另一方,即对横截面第,i,个观测值,把两年的方程分别写为,从第一个方程减去第二个,得到,非观测效应不再出现于上式:它已被“差分掉”了,而且上式中的截距实际上是截距从,t,=1,到,t,=2,的变化。,我们将方程(,17,)称之为,一阶差分方程,(,first-differenced equation,)。,即对横截面第i个观测值,把两年的方程分别写为,16.4.,多于两期的综列数据分析中的固定效应模型,假定有,N,个个人且每人有,T,=3,个时期的数据,一般的固定效应模型是:,因此,观测的总次数是,3,N,。式(,21,)除截距外,还包含了两(,T,-1,)个时期的虚拟变量,如同平常那样,基期是,t,=1,。第,2,时期的截距是,1,+,2,,如此类推。我们主要感兴趣的是,1,2,k,。,式(,21,)对每个,i,估计一个截矩的方法,是连同诸解释变量在一起,给每一个时期安排一个虚拟变量(也须还给每一个横截面观测(单元)安排有虚拟变量)。,(21),16.4.多于两期的综列数据分析中的固定效应模型假定有N个,(1),差分法,对(,21,)式进行估计式时,如果非观测效应与任一解释变量相关,则对这,3,年数据使用混,OLS,将导致偏误且非一致估计值。此时可考虑用差分法。,如果,i,与,X,itj,相关,则,X,itj,将与复合误差,u,it,=,i,+,it,相关。我们可以取相邻期的差分把,i,去掉。对于,T,=3,的情形,,(21),如果该方程满足经典线性模型假定,则混合,OLS,将给出无偏估计量,并且,t,和,F,统计量可用于假设检验。为使,OLS,是一致的,要求对所有的,j,和,t,=2,和,3,,,it,都与,X,itj,不相关。,(23),(1)差分法 对(21)式进行估计式时,如果非观测效应与任一,(,3,),固定效应估计法,固定效应变换(,fixed effects transformation,),考虑仅有一个解释变量的模型:对每个,i,,,现在对每个,i,求方程在时间上的平均,便得到,如此等等。因,i,在时间上固定不变,故它兼出现在,(24),和,(25),中。如果对每个,i,将,(25),从,(24),减去,我们便获致,(,24,),(,25,),(,26,),(3)固定效应估计法固定效应变换(fixed effects,其中, 是,y,的除去时间均值后的数据(,time-demeaned data,)。固定效应变换又称组内变换(,within transformation,)。,多个解释变量的模型:,对每个,i,的一般除去时间平均后的方程是,我们用混合,OLS,来估计它。此时自由度不是,df,=,NT,k,而是,N(T,1,),k,其中, 是y的除去时间均值后的数据(,15.5,模型设定的检验,1.,拉格朗值检验法,H0,:,2,=0,(或者检验,COV(,i t,i,s,)=0(t,s),),H1,:,2,0,2.,霍斯曼检验,H0,:随机效应与解释变量不相关,H1,:随机效应与解释变量相关,15.5 模型设定的检验,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!