资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,2,章 一元线性回归模型,模型的建立及其假定条件,最小二乘估计(,OLS,),OLS,回归函数的性质,最小二乘估计量的特性,y,t,的分布和 的分布,的估计,拟合优度的测量,回归参数的显著性检验与置信区间,y,F,的点预测与区间预测,案例分析,相关系数,EViews,操作,file:li-2-1,file:li-2-3,file:case1,第,2,章 一元线性回归模型,1.,模型的建立及其假定条件,一元线性回归模型,y,t,=,0,+,1,x,t,+,u,t,(第,2,版教材第,8,页),(第,3,版教材第,7,页),回归模型的随机误差项中一般包括如下几项内容,(,1,)非重要解释变量的省略,(,2,)人的随机行为,(,3,)数学模型形式欠妥,(,4,)归并误差(粮食的归并)(,5,)测量误差等。,回归模型存在两个特点。,(,1,)回归函数不能百分之百地再现所研究的经济过程。,(,2,)也正是由于这些假定与抽象,才使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。,模型解释变量和误差项,u,t,的,假定条件,如下,:,(1),u,t,是一个随机变量,,u,t,的取值服从概率分布。,(2)E(,u,t,)=0,。,(3),u,i,具有同方差性。,D(,u,t,)=E,u,t,-E(,u,t,),2,=E(,u,t,),2,=,2,。,(4),u,t,为正态分布(根据中心极限定理)。,以上,四个假定条件,可作如下表达。,u,t,N(0,),(第,2,版教材第,11,页),(第,3,版教材第,9,页),模型解释变量和误差项,u,t,的,假定条件,如下,:,(5),u,i,非自相关。,Cov(,u,i,u,j,)=E(,u,i,-E(,u,i,)(,u,j,-E(,u,j,),=E(,u,i,u,j,)=0,,,(,i,j,),。,(6),x,i,是非随机的。,(7),u,i,与,x,i,相互独立。,Cov(,u,i,x,i,)=E(,u,i,-E(,u,i,)(,x,i,-E(,x,i,),=E,u,i,(,x,i,-E(,x,i,)=E,u,i,x,i,-,u,i,E(,x,i,)=E(,u,i,x,i,)=0.,(8),对于多元线性回归模型,解释变量之间不能完全,相关或高度相关(非多重共线性)。,在假定(,1,),(,2,),(,6,)成立条件下有,E(,y,t,)=E(,0,+,1,x,t,+,u,t,)=,0,+,1,x,t,(第,2,版教材第,11,页),(第,3,版教材第,9,页),2.,最小二乘估计(,OLS,),通常,真实的回归直线是观测不到的,。收集样本的目的就是要对这条真实的回归直线做出估计。,(第,2,版教材第,12,页),(第,3,版教材第,10,页),(第,2,版教材第,13,页),(第,3,版教材第,11,页),(第,2,版教材第,14,页),(第,3,版教材第,13,页),谁提出的,OLS,估计方法?,(,C F Gauss,1777-1855,),C F Gauss 1809,年提出,OLS,估计方法,。,例题,2.1,人均鲜蛋需求量,Y,与人均可支配收入,X,关系,OLS,估计结果:,(,第,2,版,教材第,17,页),(,第,3,版,教材第,15,页),(file:li-2-1),3.OLS,回归函数的性质,(,第,2,版,教材第,15,页),(,第,3,版,教材第,13,页),(,第,2,版,教材第,15,页),(,第,3,版,教材第,13,页),3.OLS,回归函数的性质,(,第,2,版,教材第,19,页),(,第,3,版,教材第,18,页),(3),最小方差性,0,1,的,OLS,估计量的方差比其他估计量的方差小。,(,第,2,版,教材第,21,页),(,第,3,版,教材第,19,页),(,第,2,版,教材第,16,页),(,第,3,版,教材第,14,页),(,第,2,版,教材第,30,页),(,第,3,版,教材第,27,页),6,的估计,(,第,2,版,教材第,23,页),(,第,3,版,教材第,28,页),例题,2.1,人均鲜蛋需求量,Y,与人均可支配收入,X,关系,估计结果:,(,第,2,版,教材第,32,页),(,第,3,版,教材第,29,页),(file:li-2-1),7,拟合优度的测量,拟合优度是指回归直线对观测值的拟合程度。,(,第,2,版,教材第,26,页),(,第,3,版,教材第,24,页),(,第,2,版,教材第,26,页),(,第,3,版,教材第,24,页),度量拟合优度的统计量:可决系数(确定系数),R,2,的取值范围是,0,,,1,。,对于一组数据,,TSS,是不变的,所以,RSS,(),,,ESS,()。,RSS,:旧指回归平方和(,r,egression,s,um of,s,quares,),,现指残差平方和(,s,um of,s,quared,r,esiduals,),ESS,:旧指残差平方和(,e,rror,s,um of,s,quares(sum of,squared errors),),,现指回归平方和(,e,xplained,s,um of,s,quares,),(,第,2,版,教材第,27,页),(,第,3,版,教材第,25,页),例题,2.1,人均鲜蛋需求量,Y,与人均可支配收入,X,关系,可决系数,:,(,第,2,版,教材第,28,页),(,第,3,版,教材第,25,页),(file:li-2-1),8,回归参数的显著性检验,与置信区间,(,第,2,版,教材第,32,页),(,第,3,版,教材第,29,页),例题,2.1,人均鲜蛋需求量,Y,与人均可支配收入,X,关系,回归参数的显著性检验,:,H,0,:,1,=0,;,H,1,:,1,0,。在,H,0,成立条件下,,H,0,:,0,=0,;,H,1,:,0,0,。在,H,0,成立条件下,,Prob=P,|,t,|,|,t-Statistic|,检验结果:,回归参数显著不为零。,(,第,2,版,教材第,32,页),(,第,3,版,教材第,29,页),例题,2.1,人均鲜蛋需求量,Y,与人均可支配收入,X,关系,OLS,估计表达式:,(,7.7,)(,4.3,),R,2,=0.67,,,DW=1.32,,,T=11,,(,1988,1998,),(file:li-2-1),例题,2.1,人均鲜蛋需求量,Y,与人均可支配收入,X,关系,真实值,拟合值,残差,S.E.,-S.E.,分析残差的正态分布性,(file:li-2-1),分析残差,(,第,2,版,教材第,33,页),(,第,3,版,教材第,30,页),8,回归参数的,显著性检验与,置信区间,例题,2.1,人均鲜蛋需求量,Y,与人均可支配收入,X,关系,1,的置信区间:,0,的置信区间:,(,第,2,版,教材第,34,页),(,第,3,版,教材第,31,页),(file:li-2-1),8,回归参数的,显著性检验与,置信区间,(,第,2,版,教材第,38,页),(,第,3,版,教材第,34,页),9,y,F,的点预测与区间预测,例题,2.1,人均鲜蛋需求量,Y,与人均可支配收入,X,关系,9.,y,F,的点预测与区间预测,:(,演示,EViews,操作,),(,第,2,版,教材第,39,页),(,第,3,版,教材第,36,页),Y,1999,的点估计值,:,Y,1999,=,10.77+0.005069,1863,=,20.21,Y,2000,的点估计值,:,Y,2000,=,10.77+0.005069,1983,=,20.82,(file:li-2-1),例题,2.1,人均鲜蛋需求量,Y,与人均可支配收入,X,关系,9.,y,F,的点预测,与,区间预测,Y,1999,的置信区间,:,20.2089,2.26,1.4417 16.9507,,,23.4671,Y,2000,的置信区间,:,20.8171,2.26,1.5297 17.3600,,,24.2742,(,第,2,版,教材第,39,页),(,第,3,版,教材第,36,页),Y,1999,的点估计值:,Y,1999,=10.77+0.005069,1863,=,20.21,Y,2000,的点估计值:,Y,2000,=10.77+0.005069,1983,=,20.82,(file:li-2-1),教材,2.8,节 案例分析,人均消费性支出与可支配收入关系,(,第,2,版,教材第,42,页),(,第,3,版,教材第,39,页),整个样本,区间预测的,EViews,操作,(file,:,li-2-3),补充案例,1,:,用回归模型预测木材剩余物,(,file:case1,),伊春林区位于黑龙江省东北部,有森林面积,219,万公顷,木材蓄积量为,2.3,亿,m3,。森林覆盖率为,62.5%,,是我国主要的木材工业基地之一。,1999,年伊春林区木材采伐量为,532,万,m3,。按此速度,44,年之后,,1999,年的蓄积量将被采伐一空。,为缓解森林资源危机,并解决部分职工就业问题,除了做好木材的深加工外,还要充分,利用木材剩余物生产林业产品,如纸浆、纸袋、纸板等。因此预测林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节。,黑龙江省伊春林区,观测点近似服从线性关系。,建立一元线性回归模型如下:,y,t,=,0,+,1,x,t,+,u,t,年剩余物,y,t,和年木材采伐量,x,t,散点图,分析,EViews,输出结果。注意:,S.D.,和,s.e.,的区别。,s.e.,和,SSE,的关系。,=-0.7629+0.4043,x,t,(-0.6)(12.1),R,2,=0.91,T,=16,上述模型的,经济解释,是,对于,伊春林区每采伐,1 m,3,木材,,将平均产生,0.4 m,3,的剩余物。,问题,3,:为什么离群值对回归参数,OLS,估计量的影响大?,10.EViews,操作,附录,1,:怎样建立,EViews,新工作文件。,附录,2,:怎样用,EViews,通过键盘输入,复制、粘贴功能,输入数据。,注意,:,(,1,)变量命名时,字符不得超过,16,个。,(,2,)给变量命名时,避免使用下列名字:,ABS,,,ACOS,,,AR,,,ASIN,,,C,,,CON,,,CNORM,,,COEF,,,COS,,,D,,,DLOG,,,DNORM,,,ELSE,,,ENDIF,,,EXP,,,LOG,,,LOGIT,,,LPT1,,,LPT2,,,MA,,,NA,,,NRND,,,PDL,,,RESID,,,RND,,,SAR,,,SIN,,,SMA,,,SQR,,,THEN,。,附录,3,:,OLS,估计的操作步骤。,QuickEstimate Equation,。,对话框中输入,y c x,。,OK,键。,附录,4,:怎样用,EViews,预测。,11,相关系数,相关(,correlation,),:指两个或两个以上变量间相互关系的程度或强度。,分类:按强度分,完全相关,:变量间存在函数关系。,高度相关,(强相关):变量间近似存在函数关系。,弱相关,:变量间有关系但不明显。,零相关,:变量间不存在任何关系。,完全相关 高度相关、线性相关、正相关 弱相关,(,第,2,版,教材第,28,页),(,第,3,版,教材第,26,页),按变量个数分,简单相关:指两个变量间相关。,按形式分:线性相关,非线性相关,按符号分:正相关,负相关,零相关,复相关(多重相关和偏相关):,指,3,个或,3,个以上变量间的相关。,11,相关系数,非线性相关 负相关 零相关,11.2,简单线性相关的度量,简单线性相关系数,简称相关系数(,correlation coefficient,)。,度量两个变量间的线性相关强度,用,表示。,的随机变量表达式是,(,第,2,版,教材第,28,页),(,第,
展开阅读全文