资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第五章 异方差,异方差,一、异方差的概念,二、产生异方差的原因(来源),三、异方差的后果,四、异方差的检验(诊断),五、异方差的修正,一、异方差的概念,异方差可以表示为,或,即对于不同的样本点,随机误差项的方差不再是常,数,而互不相同,则认为出现了,异方差性,。,违背了模型假定条件,2,二、异方差产生的原因,普遍性:两类数据都有,横截面数据更多。,原因:,1.,按照边错边改学习模型,人们在学习过程中,其行为误差随时间而减少。在这种情形下,方差,i,2,会逐渐变小。例如,随着打字练习小时数的增加,不仅平时打错的个数而且打错的方差都有所下降。,2.,随着收入的增长,人们有更多的备用收入,从而如何支配他们的收入有更大的选择范围。因此,在作出储蓄对收入的回归时,很可能发现,由于人们对其储蓄行为有更多的选择,,i,2,与收入俱增。因此,以增长为导向的公司比之于已发展定型的公司在红利支付方面也可能表现更多的变异。,异方差产生的原因,3.,随着数据采集技术的改进,,i,2,可能减小。例如,有精巧数据处理设备的银行,在他们对账户的每月或每季收支说明书中,比之于没有这种设备的银行,会出现更少的差错。,4.,异方差还会异常值的出现而产生。,5.,异方差还会因为模型的设定错误而产生。,案例分析,例,1,:截面资料下研究居民家庭的储蓄行为,Y,i,=,0,+,1,X,i,+,u,i,Y,i,:,第,i,个家庭的储蓄额,X,i,:,第,i,个家庭的可支配收入,高收入家庭:储蓄的差异较大,低收入家庭:储蓄则更有规律性,差异较小,u,i,的方差呈现单调递增型变化,例,2,:以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:,将居民按照收入等距离分成,n,组,取组平均数为样本观测值。,一般情况下,居民收入服从正态分布,:中等收入组人数多,两端收入组人数少。而人数多的组平均数的误差小,人数少的组平均数的误差大。,所以,样本观测值的,观测误差,随着解释变量观测值的不同而不同,往往引起异方差性。,例,3,:以某一行业的企业为样本建立企业生产函数模型,Y,i,=A,i,1,K,i,2,L,i,3,e,i,被解释变量:产出量,Y,解释变量:资本,K,、劳动,L,、技术,A,,,那么:,每个企业所处的,外部环境,对产出量的影响被包含在随机误差项中。,每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。,这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。,政治环境、社会环境、,技术环境,、,经济环境,等,三、异方差的后果,1,、参数估计量非有效,OLS,估计量仍然具有线性性和无偏性,但不具有有效性,2,、变量的显著性检验失去意义,变量的显著性检验中,,构造了,t,统计量,其他检验也是如此。,3,、模型的预测失效,一方面,由于上述后果,使得模型不具有良好的统计性质;,所以,当模型出现异方差性时,参数,OLS,估计值的变异程度增大,从而造成对,Y,的预测误差变大,降低预测精度,预测功能失效。,三、异方差的检验(诊断),检验思路:,由于,异方差性,就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:,检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的,相关性,及其相关的“,形式,”,。,(一)残差序列分析,(二)戈德菲尔德,-,夸特检验,(三)戈里瑟检验,(四)怀特检验,(一)残差序列分析,(a),(b),(c),(d),(e),(f),(二)戈德菲尔德,-,夸特检验,戈德菲尔德,-,夸特检验是最常用的异方差专门检验方法之一。这种方法适合于检验样本容量较大的线性回归模型的递增或递减型异方差性。,戈德菲尔德,-,夸特检验的原假设为,H,0,:,1,2,=,2,2,=,=,T,2,备择假设:,H,1,:,1,2,2,2,T,2,对于存在递增异方差模型,步骤:首先将样本按,X,值的大小顺序将观测值排列,然后略去居中的,C,个观测值,并将其余的,(T-C),个观测值分成两组,每组,(T-C)/2,个,分别对两个子样本进行回归,并分别获得残差平方和,自由度都为(,T-C)/2-K-1,。,(二)戈德菲尔德,-,夸特检验,计算统计量:,查表求临界值,F,,,如果 ,拒绝原假设,误差项存在明显的递增异方差性;,如果 ,接受原假设,误差项没有明显的异方差性。,(二)戈德菲尔德,-,夸特检验,对于递减异方差性模型,检验的方法相似,只要把前面构造的,F,统计量的分子分母互换,就可以用同样的程序检验模型是否存在递减型的异方差问题。,但该方法的有效性还依赖于,C,的选择,还有,当模型出现多于一个,X,变量时,就可以按任意一个,X,变量的大小顺序将观测值排列。,参看案例分析,(三)戈里瑟检验,(三)戈里瑟检验,通常拟合 和 之间的回归模型:,根据图形中的分布选择,还可以拟合 和 之间的回归模型,(四)怀特检验,怀特检验是通过建立辅助回归模型的方式来判断异方差的。不妨设回归模型为三变量(二元)线性回归模型:,怀特检验的具体步骤为:,(,1,)估计回归模型,得到每一个残差的平方,e,i,2,(,2,)估计辅助回归模型:,即将残差平方关于所有解释变量的一次项、二次项和交叉乘积项进行回归。若继续引入高次项会使自由度下降,故一般只引入二次项。,(四)怀特检验,(,3,)得到辅助回归模型中的可决系数,R,的平方。可以证明,在同方差的假定下,即在原假设为:,渐进的有:,自由度,g,为辅助回归模型中解释变量的个数。,(,4,)对于给定的显著性水平,若 ,则拒绝原假设,模型存在异方差性,反之,则认为不存在异方差性。,(四)怀特检验,在,Eviews,中首先对原模型进行回归,然后在窗口中点击,ViewResidual TestWhite,Heteroskedasticity,.,此时可选择是否包含交叉乘积项,若是原模型只包含一个解释变量,辅助回归模型中就没有交叉乘积项,若是含有两个及两个以上解释变量,就应选择含有交叉乘积项。,参看案例分析,四、异方差的修正,加权最小二乘法,如线性回归模型为,经检验,误差项有如下异方差性,(一)若,i,2,为已知,可以用,i,除模型,(1),各项,得到,令,Y,i,*,=,Y,i,/,i,X,0i,*,=1/,i,X,1i,*,=,X,1i,/,i,X,ki,*,=,X,ki,/,i,u,i,*,=,u,i,/,i,,则上式可化为,Y,i,*,=,0,X,0i,*,+,1,X,1i,*,+,+,k,X,ki,+,u,i,*,(2),则此模型,(2),无异方差,为什么?,四、异方差的修正,加权最小二乘法,(二)若,i,2,为未知,对线性回归模型为,假设误差项的方差正比于,X,1i,2,,即,其中,C,为常数。,可以用,X,1i,除模型,(1),各项,得到,令,Y,i,*,=Y,i,/X,1i,X,1i,*,=1/X,1i,X,2i,*,=X,2i,/X,1i,X,ki,*,=X,ki,/X,1i,u,i,*,=u,i,/X,1i,,则上式可化为,Y,i,*,=,1,+,0,X,1i,*,+,2,X,2i,*,+,+,k,X,ki,*,+,u,i,*,(2),则此模型,(2),无异方差,为什么?,加权最小二乘法,加权最小二乘法,在上述公式中的,=,理解成权重,则构成了“加权最小二乘法”,例,:,参看课本,P125,页案例分析,在研究某地区居民的储蓄倾向时,得到了如表,6,1,所示的数据资料。判断用线性回归模型研究居民储蓄倾向时,误差项是否存在异方差,并给出处理的方法。,n,储蓄,S,收入,I,n,储蓄,收入,n,储蓄,收入,1,2,3,4,5,6,7,8,9,10,11,264,105,90,131,122,107,406,503,431,588,898,8777,9210,9954,10508,10979,11912,12747,13499,14269,15522,16730,12,13,14,15,16,17,18,19,20,21,22,950,779,819,1222,1702,1578,1651,1400,1829,2200,2017,17663,18575,19635,21163,22880,24127,25604,26500,27670,28300,27430,23,24,25,26,27,28,29,30,31,2105,1600,2250,2420,2570,1720,1900,2100,2300,29560,28150,32100,32500,35250,33500,36000,36200,38200,I,与,S,的散点图,对样本进行线性回归的结果,怀特检验结果,残差序列图,戈德菲尔德夸特检验,对第一个样本进行回归结果,戈德菲尔德夸特检验,对第二个样本进行回归结果,F,749990.8/150867.9,4.97,这两个统计量的自由度都为,11,1,1,9,,查表得显著性水平为,0.05,的临界值为,F,(,9,,,9,),3.18,,而,4.973.18,,意味着两个残差平方和有显著差异,也就是原模型误差项有明显的异方差性。,戈里瑟检验,常数项不显著,去掉再回归,戈里瑟检验,戈里瑟检验,戈里瑟检验,由于根据残差序列图可看出回归残差的绝对值有随,X,线性增长的趋势,因此考虑直接对模型做变换为,S/I,的残差序列图,S/i0.5,的残差序列图,S/E,的残差序列图,
展开阅读全文