资源描述
在 R 语言中进行面板数据分析面板数据 (Panel Data) 是截面数据与时间序列数据综合起来的一种数据类型。 它有时间序 列和截面两个维度, 当这类数据按两个维度排列时, 是排在一个平面上, 与只有一个维度的 数据排在一条线上有着明显的不同,整个表格像是一个面板,所以把 panel data 译作“面板数据”。面板数据模型的选择通常有三种形式:第一种是混合估计模型( Pooled Regression Model )。如果从时间上看,不同个体之间不存在 显著性差异; 从截面上看, 不同截面之间也不存在显著性差异, 那么就可以直接把面板数据 混合在一起用普通最小二乘法(OLS估计参数。第二种是固定效应模型 (Fixed Effects Regression Model)。如果对于不同的截面或不同的时间 序列, 模型的截距不同, 则可以采用在模型中添加虚拟变量的方法估计回归参数。 该模型刻 画了不同个体的特殊影响,而且这个影响不随样本变化。第三种是随机效应模型( Random Effects Regression Model )。如果固定效应模型中的截距项 包括了截面随机误差项和时间随机误差项的平均效应, 并且这两个随机误差项都服从正态分 布,则固定效应模型就变成了随机效应模型。 该模型刻画了不同个体的特殊影响, 但这个影 响会随样本变化。首先载入程序包和数据library(plm)将数据转成可处理的面板格式,特别要注意标明个体名和时间名pgr - plm.data(data, index = c(firm, year) 先用混合估计模型进行估计gr_pool - plm(LOGOUT LOGLABOR + LOGKA,Pdata = pgr,model = pooling)再用固定效应模型进行估计gr_fe - plm(LOGOUT LOGLABOR + LOGK,AdPata = pgr,model = within)如果要判断固定效应模型是否比混合估计模型更好,可采用F检验pFtest(gr_fe, gr_pool)最后我们用随机效应模型进行估计gr_re - plm(LOGOUT LOGLABOR + LOGK,AdPata = pgr,model = random, random.method = swar)summary(gr_re)Hausman 检验要判断随机效应模型是否与固定效应模型有区别,可采用phtest(gr_re, gr_fe)
展开阅读全文