第三章多元线性回归的简化模型课件

上传人:仙*** 文档编号:241972579 上传时间:2024-08-08 格式:PPT 页数:62 大小:255KB
返回 下载 相关 举报
第三章多元线性回归的简化模型课件_第1页
第1页 / 共62页
第三章多元线性回归的简化模型课件_第2页
第2页 / 共62页
第三章多元线性回归的简化模型课件_第3页
第3页 / 共62页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三章 经典单方程计量经济学模型:多元线性回归模型,.,第一节 为何要用多元模型,考虑下面的例子:,某人试图解释一个人的工资水平的决定,为此,他找到的解释变量为受教育水平,于是他构造了如下的计量模型:,wage,i,=,+edu,i,+,i,(1),这里:wage,i,-第i个人的工资水平,edu,i,第i个人的受教育水平,,i,-随机扰动项。,考虑一下,如果要满足最基本的一致性,这个模型有何缺陷?,.,分析:,显然,除受教育水平外,影响工资水平的还有一个人的工作经历。而工作经历则与受教育水平又相关。,压力仅是砖头1的吗?,砖头1,砖头2,如果为了测定砖头1对桌面的压力,应如何做呢?,.,解决办法:只要在模型(1)中加入新的变量即可,即模型变成如下形式:,wage,i,=,+,1,edu,i,+,2,exper,i,+,i,(2),这里:exper,i,-第i个人的工作经历。,.,应用多元线性回归模型的几个原因:,第一,即使我们所关注的仅是一个解释变量X,1,对被解释变量Y的影响,但如果还存在其它解释变量X,2,、X,3,等也对Y有影响,且同时与X,1,相关,那么此时就应将X,2,、X,3,等一并引入模型,即建立如下新模型:,Y,i,=,+,1,X,1i,+,2,X,2i,+,3,X,3i,+,+,i,(3),.,第二,提高预测准确度。,如果我们要试图解释被解释变量Y的波动,显然,引入更多的解释变量可以使解释更准确,即预测Y更准确。,第三,提高假设检验中所用“仪器”的准确度。比如,有时一个因素虽然与已有的解释变量无关,但你不将其“揪出来”放到模型中去,而将它看作随机扰动项的一部分,它就可能造成扰动项的异方差、自相关等问题。,.,需思考的问题,为什么只要加入另外一些与已有解释变量相关的新解释变量就可保证我们所关注参数的一致性呢?,由于这些新加入的新解释变量与原解释变量是相关的,这不会对原解释变量的参数估计形成影响吗?,如果直观的理解上述问题,留待后面章节。,.,第二节 多元线性回模型的参数估计,1.基本模型设定,Y=,+,1,X,1,+,2,X,2,+,3,X,3,+,k,X,k,+,i,(3),这里:Y,i,-被解释变量,X,ji,-第j(j=1,2,k)个解释变量,,i,N(0,,2,)。,2.要估计的参数,、,1,、,2,、,3,k,,还有,2,。,.,特别要注意:,第一,万不可忘记,我们同时要估计参数,2,。(回想一下,为什么?),第二,要估计的参数,并不一定是我们实际应用中所一定关注的参数。,比如,实际中,我们可能只关注x,1,的参数,1,,因而其他参数估计的准确性,我们并不关心。,.,3.估计的方法,普通最小二乘法(OLS),最大似然法(ML),矩估计(MON),我们只关注OLS法。,.,4.最小二乘估计结果,要求:尽可能看懂课本P58-59页的推导过程;但必须要记住这个结果。,.,这里,这里,Y,1,、X,11,等是你调查所得的样本,我们即用它们进行估计。,X中的第一列全为1,记为向量I,它实际上指的是常数项,后面的变量,显然无论你哪次调查,它都取1。,.,5.多元线性回归模型的矩阵样本表达式,Y=X,+(5),这里:=(,1,,,2,n,),T,=(,1,2,k,),.,最小二乘法的几何解释,Y,X,1,X,2,e,含义:解释变量x1、x2组成一个向量空间,OLS法实际是在寻找被解释变量到这个空间的最短距离。,从图上可见,残差项e与解释变量、被解释变量的估计值均是垂直的。,在统计上,垂直即表示不相关,或相关系数为0。,.,第三节 估计参数的优劣与推断,一.模型估计出来后面临的两个问题,(1)估计出的参数的“精确度”;,(2)从实际应用来看,某一个或某几个解释变量是否真的对被解释变量具有重要影响。,回忆一下,这与一元的情形是否相同?各自要做的具体工作是什么?,.,二.模型的假设,1.一个完美多元模型的条件,(1)回想一下,一元模型的条件有哪几条假设?,(2)多元情形的条件,各个解释变量之间不能完全相关(即不能出现某一个解释变量是另外其他解释变量线性组合的情形),.,例如,为了研究一国的吉尼系数,某人在封闭经济中建立了如下模型:,jc,t,=,+,1,y,t,+,2,c,t,+,3,I,t,+,t,这里:jc是t时期的吉尼系数,y、c、I分别为产出、消费与投资。,试分析一下,这个模型有何问题?,.,扰动项无条件均值为0、扰动项同方差、扰动项序列不相关。,即:E(,i,)=0,,D(,i,)=,2,,cov(,i,j,)=0,(I,j=1,2,n),任何一个解释变量均与扰动项不相关。,即:cov(X,ji,j,)=0,i=1,k;j=1,n,注意,这里的不相关,指的是样本意义上的,。,扰动项服从正态分布。,此条在大样本情形下可以不考虑,实际应用中,大部分情况下不予考虑。,.,2.满足上述条件的结果,(1)用OLS法估计出的参数是:无偏、一致和有效的,(2)所有的常规假设检验也是有效的。,要求:最好能了解一下课本P63页中关于估计参数性质的推导;但必须对上述两条记住。,.,三.估计参数的一致性问题,1.OLS估计的参数满足一致性的条件,(1)再重复一次:一致性是对估计参数的最基本与实际应用中最通常的要求,但样本必须足够大。,(2)所有的关于无偏、一致、有效的直观解释与一元的情形完全相同。,(3)只要、两个假设成立,且样本数量足够大,那么参数就会满足一致性。,.,(4)注意,这与课本有区别,课本要求各解释变量间不相关,实际只要不完全相关即可。,2.为何即使各个解释变量间存在一定程度相关,参数仍会满足一致性呢?,数学解释:,注:最后一步利用大数定律。,.,直观解释:首先,一致性要求的是,随着调查样本容量的增大,我们的参数估计量具有“越来越靠近”真实值的特征,或统计意义上说,具有偏离真实值的可能性越来越小的特征。,而只要解释变量间不是完全相关,一般来说,随着样本容量的增大,我们总能发现关于所关注的解释变量对被解释变量进行解释的更多信息,即,对这个解释变量作用的认识越来越清晰,这就是一致性,。,.,四.假设检验问题,1.模型的形式及检验的内容,(1)假定模型具有如下形式:,Y=,+,1,X,1,+,2,X,2,+,3,X,3,+,k,X,k,+,i,(6),(2)与一元线性回归模型的区别,假设检验多了一个对多个解释变量的联合显著性检验,即几个解释变量合起来,是否对被解释变量具有显著影响。,即使对单个解释变量的显著性进行检验,T检验这个,“仪器”的构造也有所不同,了,。,.,2.拟合优度或方程总体显著性检验,(1)二者具有相当强的一致性,故一般检验均是针对于后者的,,对于前者,只给出一个具体值,。,(2)检验目的:都是看一下,所有的解释变量作为一个总体,是否对被解释变量的波动具有明显的影响,或形成了显著的解释能力。,.,(3)拟合优度(可决系数),回想一下,一元线性回归模型是哪个指标?,多元线性回归模型与一元的一样:,该统计量越接近于1,模型的拟合优度越高。,.,问题:,在应用过程中发现,如果在模型中增加一个解释变量,R,2,往往增大(,Why?,),这就给人,一个错觉,:,要使得模型拟合得好,只要增加解释变量即可,。,但是,现实情况往往是,由增加解释变量个数引起的R,2,的增大与拟合好坏无关,,R,2,需调整。,.,调整后的可决系数,其中:,n-k,-1为残差平方和的自由度,,n,-1为总体平方和的自由度。,在eviews估计结果中,是Adjusted R-squared这一指标,比通常的R,2,小,应用中可记作ADR。,这里各个平方和、平方和关系,以及平方和的自由度必须记住,.,.,(4)解释变量联合显著性检验,H,0,:,=,1,=,2,=,k,=0(,原假设,),H1:,、,j,不全为0 (,备择假设,),所用“仪器”:,服从自由度为(,k,n,-,k,-1)的,F,分布,.,给定显著性水平,,可得到临界值,F,(,k,n-k-,1),,由样本求出统计量,F,的数值,通过,F,F,(,k,n-k-,1)或 F,F,(,k,n-k-,1),来拒绝或接受原假设H,0,。,直观解释,被解释变量的波动,(总平方和)=,已解释的被解释变量估计值的波动,(回归平方和)+,未解释的残差的波动,(残差平方和),具体推导过程见课本66页。,“仪器”的构造思想是这样的:如果这些解释变量联合起来真的对被解释变量的波动具有显著的解释能力,那么,,已解释的波动与未解释的波动之比应比较大,。,但无论是已解释的波动也好,未解释的波动也罢,这种波动受组成“仪器”的模块的可自由变动的随机变量个数的影响。显然,自由变动的随机变量越多,波动就越大,故要去掉这种个数所带来的影响。,.,小概率事件的判断,x,y,Y=f(x):密度函数,F,(,k,n-k-,1),想一下,这个小概率事件的面积所处位置可以任意选择吗?为何选择尾部?,要从两点思考上述问题:一是直观上“仪器”的构造;二是“密度”的含义。,Eviews上的判断,见前页。,.,3.单个解释变量系数的显著性检验,(1)检验目的:仍与一元的一样,看一下某一个解释变量是否对被解释变量真的具有重要影响?,(2)检验原假设H,0,:,i,=0,i=1,k。,(3)检验所用的“准确”的“仪器”:,服从于标准正态分布。,.,这里,其直观含义是:你所调查的第i个解释变量的变异程度。也就是说,你调查的第i个解释变量样本的差异程度。,比如,如果你在调查一个城市人群的消费行为时,如果你仅集中于某一个具有共同人群特征的小区,那么你的样本的差异程度就小。它所带来的问题是,如果你研究的是一个城市的总体,那么,实际你这样调查是得不到多少信息的,。,R,2,j,的含义是,第i个解释变量与其他解释变量之间的相关程度。可见,解释变量之间的相关程度虽不会影响参数估计的准确性,但会影响假设检验的有效性。,注:这个“仪器”须记住。,.,(4)相对不太准确的“仪器”,即是用,2,的估计值来代替,2,。此时得到的“仪器”的分布,服从于自由度为n-k-1的T分布。,这里n是样本数量,k是解释变量的个数。,这个,“,仪器”也要记住,.,(5)检验的标准,不太严格的来看,如果T的绝对值大于等于2,那么就可认为小概率事件发生,即拒绝原假设。,它的经济含义就是说,第i个解释变量对被解释变量在统计上有着显著的影响,即它是影响被解释变量的重要因素。,.,样本容量问题:一个原则是,样本越多越好,但最小不能小于未知参数的个数。见课本,64,页。,.,第四节 非线性模型的线性化,回想一下,我们所说的“模型是线性的”指的是相对什么的?是相对于解释变量吗?还是相对于未知参数?,.,在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。,如著名的,恩格尔曲线,(Engle curves),表现为,幂函数曲线,形式、宏观经济学中的,菲利普斯曲线,(,Pillips cuves,)表现为,双曲线,形式等。,但是,大部分非线性关系又可以通过一些简单的数学处理,使之化为数学上的线性关系,从而可以运用线性回归的方法进行计量经济学方面的处理。,.,在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。,如著名的,恩格尔曲线,(Engle curves),表现为,幂函数曲线,形式、宏观经济学中的,菲利普斯曲线,(,Pillips cuves,)表现为,双曲线,形式等。,但是,大部分非线性关系又可以通过一些简单的数学处理,使之化为数学上的线性关系,从而可以运用线性回归的方法进行计量经济学方面的处理。,.,一、模型的类型与变换,1、倒数模型、多项式模型与变量的直接置换法,例如,,描述税收与税率关系的,拉弗曲线,:,抛物线,s=a+b r+c r,2,c0,s:税收;r:税率,设X,1,=r,X,2,=r,2,,则原方程变换为,s=a+b X,1,+c X,2,c0,.,2、幂函数模型、指数函数模型与对数变换法,例如,,,Cobb-Dauglas生产函数,:幂函数,Q=AK,L,Q:产出量,K:投入的资本;L:投入的劳动,方程两边取对数:,ln Q=ln A+,ln K+ln L,.,3、复杂函数模型与级数展开法,方程两边取对数后,得到:,(,1,+,2,=1,),Q:产出量,K:资本投入,L:劳动投入,:替代参数,,1、,2,:分配参数,例如,,,常替代弹性CES生产函数,将式中,ln(,1,K,-,+,2,L,-,),在,=0,处展开台劳级数,取关于,的线性项,即得到一个线性近似式。,如取,0,阶、,1,阶、,2,阶项,可得,.,如果可以台劳展开,那么一个一般性模型均可线性化。,.,二、非线性回归实例,例,建立中国城镇居民食品消费需求函数模型。,根据需求理论,居民对食品的消费需求函数大致为,Q,:居民对食品的需求量,,X:,消费者的消费支出总额,P,1,:食品价格指数,,P,0,:居民消费价格总指数。,零阶齐次性,,当所有商品和消费者货币支出总额按同一比例变动时,需求量保持不变,(*),(*),为了进行比较,将同时估计(*)式与(*)式。,.,根据,恩格尔定律,,居民对,食品的消费支出,与居民的,总支出,间呈,幂函数,的变化关系:,首先,确定具体的函数形式,对数变换:,考虑到,零阶齐次性,时,(*),(*),(*)式也可看成是对(*)式施加如下约束而得,因此,,对(*)式进行回归,就意味着原需求函数满足零阶齐次性条件,。,.,X:人均消费,X1:人均食品消费,GP:居民消费价格指数,FP:居民食品消费价格指数,XC:人均消费(90年价),Q:人均食品消费(90年价),P0:居民消费价格缩减指数(1990=100),P:居民食品消费价格缩减指数(1990=100,.,中国城镇居民人均食品消费,特征:,消费行为在,19811995,年间表现出较强的一致性,1995,年之后呈现出另外一种变动特征。,建立,19811994,年中国城镇居民对食品的消费需求模型:,(9.03)(25.35)(-2.28)(-7.34),.,按,零阶齐次性,表达式回归:,(,75.86,),(52.66)(-3.62),为了比较,改写该式为:,发现与,接近。,意味着:,所建立的食品需求函数满足零阶齐次性特征,.,第五节 实例,计量经济学是一门应用学科,因而学会如何在实际应用中构建一个模型,并对模型的优劣进行评判,对模型的结果会进行分析至关重要。,为此,首先要学会如何报告一个eviews 估计结果。,.,1.如何对eviews的结果进行观察,Dependent Variable:GDP,Method:Least Squares,Date:04/27/10 Time:17:14,Sample:1996Q1 2005Q1,Included observations:37,VariableCoefficientStd.Errort-StatisticProb.,C4165.1698219.1530.5067640.6157,M01.7041276.0605760.2811820.7803,M125.956762.34420911.072720.0000,M2-9.9840981.466353-6.8087960.0000,R-squared0.841557Mean dependent var-585.8468,Adjusted R-squared0.827153S.D.dependent var49151.45,S.E.of regression20434.64Akaike info criterion22.78966,Sum squared resid1.38E+10Schwarz criterion22.96381,Log likelihood-417.6087F-statistic 58.42561,Durbin-Watson stat2.116550Prob(F-statistic)0.000000,看最后一列prob,它对应的就是概率,若很小,表示小概率事件发生。,.,2.对于一个eviews结果,在应用写作中应如何报告?,第一,不要直接将上面表拷贝;,第二,可以写成如下形式:,GDP=4165.17+1.70M,0,+25.96M,1,-9.98M,2,(7),(0.51)(0.28)(11.07)(-6.81),R,2,=0.84,括号中是T统计值。,一个原则是,你要从eviews一个回归结果中选取你需要的指标,目的在于你要告诉别人,你的模型的参数估计结果与假设检验情况。,.,3.如何对一个eviews 结果进行解释?,答:第一,对其进行统计解释,主要是告诉别人,从统计指标来看,你所关注的解释变量对被解释变量到底有无显著影响。,第二,从经济意义上进行解释,主要是分析一下,如果你所关注的解释变量对被解释变量有显著影响,那么具体影响是多少?这说明了什么?,而如果你所关注的解释变量对被解释变量没有显著影响,那么这背后的原因又是什么?,.,仍以式(7)为例。,如果我们关注的是货币供应M1对的变化对GDP的影响,那么我们可做如下简单分析:,从统计指标上来看,首先,由于M1系数的T统计值为11.07,远大于2,因而表明货币供应M1的变化对产出有着显著的影响。,从回归的具体结果来看,如果M1增加1个单位,那么将导致GDP增加25.96个单位。,.,特别注意:你要报告哪一些指标,取决于你的分析目的。比如,如果式(,7,)中你所关注的是模型总体对,GDP,的解释力度,或你要用这个模型进行预测,那么你应当关注哪些指标?,.,这里是一位同学的毕业论文的一部分,试找出他(她)在写作上存在的问题。,示例,。,.,本章练习题,1.答:假设见课本P56-57页。,(1)无偏性:假设1、假设2中的随机扰动项是0均值、假设3。,(2)有效性:所有假设。,(3)一致性:假设1与假设3。,注意:由此可见,一致性是我们对估计参数“准确性”的最一般要求。,.,2.答:t检验用于检验某一个解释变量是否对被解释变量具有显著的影响,F检验则用于检验所有的解释变量联合起来,是否对被解释变量具有显著影响。,3.答:直观上可以这样理解,因为OLS法所要追求的就是残差平方和的最小化,因而如果对模型施加约束,那么就意味着我们只能在一个较小范围内寻找最小化。这就相当于局部极小值与全局最小值的问题。,当这个约束是无效或是虚假的时候,二者相近或相等。,.,4.答:违背了解释变量完全相关的假定。如果要改进,那么,我们可以试着去掉其他x4,前提是我们要假设x4不影响大学生的学习成绩,如果我们还能在x4中找到影响大学生成绩的因素,那么仍将其放在模型中作为一个新的解释变量。,5.答:对式(b)进行简单的变形后,再利用OLS进行估计,可知,式(a)、(b)的OLS结果完全一致。,当对模型b施加某种约束时,那么模型b的R,2,小于模型a的。(想一下R,2,的计算公式及问题3),.,6.答:具体证明过程,你可自己利用OLS法的参数计算公式、离差公式,一步步代入即可。,本题的直观意义告诉我们:对于一个多元线性回归模型来说,即使解释变量相关,那么,它对估计的未知参数的估计结果也没有任何影响!因为式(,2,)的,V,i,的含义即在于剔除了,x,2,后的,x,1,对,Y,的影响。,“上帝归上帝,恺撒归恺撒”!,.,7.答,:(1)利用课本P58-59页推导即可,此时,。,(2)第一个式不成立了,后面两个仍成立。具体证明可用两种方法:一是OLS的几何含义;二是课本P58页式子(3.2.2),分别对 求导即可得到。,.,8.答:具体计算可自己试作一下。,三者的区别是,(a)、(b)分别是有约束的回归,(c)则是无约束的回归。它们的好坏的区别在于,你所提前施加的约束是否是真实的?如果是真实的,说明你更多的利用了已有的信息,因而估计会更有效。否则,估计的效率会降低。,.,9.提示:,第一,n=15。回顾前面的要求,必须知道各个平方和、各个平方和的关系,以及各个平方和的自由度。,第二,用课本P66-67公式计算。,第三,用F检验。,第四,用P68页,式(3.3.7),并配合查F表。,.,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!