《计量经济学》

上传人:无*** 文档编号:157744030 上传时间:2022-09-30 格式:DOC 页数:45 大小:1.27MB
返回 下载 相关 举报
《计量经济学》_第1页
第1页 / 共45页
《计量经济学》_第2页
第2页 / 共45页
《计量经济学》_第3页
第3页 / 共45页
点击查看更多>>
资源描述
计量经济学第一章 计量经济学概论 11、什么是计量经济学?据说在经济学中,应用数学方法的历史可追溯到三百多年前的英国古典政治经济学的创始人威廉配第的政治算术的问世(1676年)。“计量经济学”一词,是挪威经济学家弗里希(RFrisch)在1926年仿照“生物计量学”一词提出的。 生物计量学一词是“Biometrics”,而计量经济学是“Econometrics”。随后1930年成立了国际计量经济学学会,在1933年创办了计量经济学杂志。我们应如何理解“计量经济学”的含义?弗里希在计量经济学的创刊词中说到:“用数学方法探讨经济学可以从好几个方面着手,但任何一方面都不能与计量经济学混为一谈。计量经济学与经济统计学决非一码事;它也不同于我们所说的一般经济理论,尽管经济理论大部分都具有一定的数量特征;计量经济学也不应视为数学应用于经济学的同义语。经验表明,统计学、经济理论和数学这三者对于真正了解现代经济生活中的数量关系来说,都是必要的,但各自并非是充分条件。而三者结合起来,就有力量,这种结合便构成了计量经济学。” 张寿,于清文计量经济学第8页,上海交通大学出版社1984年版。后来美国著名计量经济学家克莱因也认为:计量经济学是数学、统计技术和经济分析的综合。也可以说,计量经济学不仅是指对经济现象加以测量,而且表明是根据一定的经济理论进行计量的意思。计量经济学的基本内容和用途可由下图1表示:计量经济学的基础是一整套建立在数理统计理论上的计量方法,属于计量经济学的“硬件”,其主要内容如下:普通最小二乘法 工具定量法 单一方程 最大似然法 广义最小二乘法 方法 识别方法 联立方程 有限信息估计法计量经济学方法 估计方法 完全信息估计法检验 应用预测 经济理论事实 理论模型 统计数据数理统计 计量经济学模型精炼数据计量经济学技术 利用计量经济学技术和精练数据作 计量经济学模型的估计和检验 理论检验预测政策评价图1。计量经济学方法从上面的介绍可看出,计量经济学的主要用途或目的主要有两个方面:l 理论检验。这是计量经济学用途最为主要的和可靠的方面。这也是计量经济学本身的一个主要内容。l 预测应用。从理论研究和方法的最终目的看,预测(包括政策评价)当然是计量经济学最终任务,必须注意学习和了解,但其预测的可靠性或有效性是我们应十分注意的。12、计量经济学的发展l 国外发展情况。计量经济学首先主要用于微观经济分析,宏观经济理论出现后,在宏观经济方面的应用发展很快,同时,由于计算机的出现和迅速发展,更加促进了计量经济学的发展,特别是二十世纪6080年代初期,可以说是西方经济学中发展最快的一个领域。当然,也存在一些问题。l 国内发展情况。上世纪五十年代未,有人开始过研究,但很快就中断了。直到70年代未,才恢复有关研究和学习,80年代后期是快速发展时期。同样,存在一些重大的问题。13、计量经济学的学习方法问题 与一般的数学方法相比,计量经济学方法有十分重要的特点和意义:l 研究对象发生了较大变化。即从研究确定性问题转向非确定性问题,其对象的性质和意义将发生巨大的变化。因此,在方法的思路上、方法的性质上和方法的结果上,都将出现全新的变化。l 研究方法发生根本变化。计量经济学方法的基础是概率论和数理统计,是一种新的数学形式。学习中要十分注意其基本概念和方法思路的理解和把握,要充分认识其方法与其它数学方法的根本不同之处。l 研究的结果发生了变化。我们应该知道,计量经济学模型的结论是概率意义上的,也可以说是不太确定的。但真正要理解其不确定性的含义,并不那么简单,学习中需要始终关注这一点。第二章 回归分析概论21、引言一般来说,对于处于一个经济系统中的各种变量来说,从它们之间的关系性质看,可分为两大类:(1) 变量之间具有完全确定的数量关系。(例子)一般说来,如果变量与变量之间存在着某种函数关系,那么,其数学形式可以写成 Y=)或F(Y,)=0注意:这种关系的相对性,图形上的解释等。(2) 变量之间具有非确定性的数量关系。(例子)一般的,如果如果变量与变量之间存在着某种非确定性的依赖关系,其数学形式可写成 Y=,u)或F(Y,u)=0一般来说,对于非确定性的变量关系,只能通过大量的观察,来寻找它们之间的统计性规律。注意:上式中随机变量u的含义,随机变量与普通变量的根本区别。回归模型中,为什么仅仅加进一个随机项?还保留普通变量呢?说到底,回归分析的根本思路仍是确定性的,或者说是线性的。模型的某种程度上的条件的确放松了,但本质并没有根本性的改变。这些都是我们在学习的过程中,必须去反复思考、认识的难点。l 回归分析的主要内容:(1)从经济理论和数据出发,建立计量经济学模型的具体形式,并确定参数的估计值;(2)对所确定的估计值进行统计检验(显著性检验和置信区间);(3)对计量经济学模型及估计的主要假设进行检验;(4)利用模型对经济理论或实际过程进行假设检验、分析预测和政策模拟,并给出其预测精度估计。22、回归概念的意义一个例子“回归”一词,最早来源于生物学。在这里一般是指变量之间非确定性相互依赖关系统计关系或概率关系。同时,回归分析更是指一种分析问题的思路或方法论。下面我们通过一个例子,具体解释“回归”或回归分析的意义或思路。第一种情况(最简单的情况):在一块田里做实验。 第二种情况(较为复杂的情况):在5块田里做实验。 第三种情况(最为实际的情况):在所有的田里做实验。 23、拟合一条曲线的准则一般来说,变量之间的数量关系不是线性的,而是非线性的,但由于方法的限制,我们只能采用线性的方法来处理。因此,这里就产生了一个拟合的准则的问题。我们的思路是:一个好的拟合回归直线应当是使其拟合的总误差达到最小。亦即 总的拟合误差:由于在其计算中可能出现正负号的问题,最终我们正确测量总误差的方法是,因此,使总的拟合误差达到最小就等价于使拟合误差的平方和达到最小。当拟合一条曲线的准则是采用使拟合误差平方和达到最小时,我们就称之为“最小二乘准则”。由此形成的拟合方法则称之为“最小二乘法”。 24、最小二乘法预演下面我们只是根据22中第一种情况,来预演一下最小二乘法的推导过程。假设我们已知系数a,b,且有关系 i=1,2,3,n那么,其拟合误差为 1,2,3,n根据最小二乘准则,构造其拟合误差的平方和 然后对Q(a,b)求导数,由于其导数的非负性,故Q的极小值是存在的,根据求极值方法,要使Q达到最小,则参数a,b应满足条件 即有 亦即 经过整理可得到 解此二元一次方程,可得 如果设 则方程的解可以写成 其中这就是利用最小二乘法求出的拟合曲线的参数。直线方程 也称之为回归方程(Y关于X的),这里有一个问题,即最小二乘法是否能够唯一地确定了一条使拟合误差平方和达到最小准则下的拟合直线呢? 一般来说,这里所介绍的最小二乘法也称之为古典最小二乘法或普通最小二乘法(OLS)。第一、 二章 作业 1、简述计量经济学的定义、研究对象和研究思路。 2、谈谈你对确定性(简单性)与不确定性(复杂性)的理解或认识。3、简述“回归方法”的基本思路。 4、试分析对于任何两个变量的散点图,是否都能用最小二乘法唯一的确定一条拟合直线?请找出最小二乘法的不足之处。 第三章 回归分析原理 31、一元线性回归数学模型按理说,在研究某一经济现象时,应该尽量考虑到与其有关各种有影响的因素或变量。但作为理论的科学研究来说,创造性地简化是其的基本要求,从西方经济学的基本理论中,我们可以看到在一般的理论分析中,至多只包含二、三个 变量的数量关系的分析或模型。这里所讨论的一元线性回归数学模型,是数学模型的最简单形式。当然要注意的是,这里模型讨论是在真正回归意义上来进行的,也可称之为概率意义上的线性模型。在非确定性意义上,或概率意义上讨论问题,首先要注意一个最基本的概念或思路问题,这就是总体和样本的概念。我们的信念是任何事物在总体上总是存在客观规律的,虽然我们无论如何也不可能观察或得到总体,严格说来,总体是无限的。而另一方面,我们只可能观察或得到的是样本,显然样本肯定是总体的一部分,但又是有限的。实际上概率论和数理统计的基本思想和目的,就是希望通过样本所反映出来的信息来揭示总体的规律性,这种想法或思路显然存在重大的问题。但另一方面,我们也必须承认,为了寻找总体的规律或客观规律,只能通过样本来进行,因为我们只可能得到样本。在前面我们已经知道,用回归的方法和思路处理非确定性问题或散点图,实际上存在一些问题,亦即只有在某些情况下,回归的方法才是有效的。因此,在建立真正回归意义上建立其有效方法时,必须作出相应的假设条件。l 基本假设条件:(1)假设概率函数或随机变量的分布对于所有值,具有相同的方差 ,且 是一个常数,亦即=。(2)假设的期望值位于同一条直线上,即其回归直线为 = 等价于 这个假设是最核心的假设,它实际上表明与之间是确定性的关系。(3)假设随机变量是完全独立的,亦即32、随机项或误差项的含义 一元线性回归模型的一般形式为 是一随机项或误差项,它的存在表明对的影响是随机的,非确定性的。所以,对于每一个值来说,是一个概率分布,而不是一个值或几个值。正是由于的出现,使我们的方法或思路发生巨大的变化,这是我们必须充分注意的。l 那么,究竟包含了什么意义或内容呢?概括地说来主要有:(1) 模型中被忽视了的影响因素;(2) 变量的测量误差,这种误差主要来自统计数据本身的误差;(3) 随机误差。社会经济现象中涉及到人的主观因素和行为,还有历史的、文化的等因素,这些因素一般来说是难以量化的、多变的;(4) 模型的数量关系误差。即数学形式所带来的误差。一般来说,模型中的常数项也可以包含某些较为固定的误差。但是值得指出的是,如果能够包含上述所有的内容,那它的分布及其性质将是十分复杂的,任意的。前面的假设条件的核心正是限制了的分布形式,因此,实际上并不能包含如此多的内容或负担。另外,上面4个方面中,我们最主要的是要第4个问题,这也正是经济学研究所要真正解决的问题。一般来说,所有的经济数学模型的误差也就是这4个方面,或者说是存在的主要问题,对此我们必须要有清醒和深入的认识。 33、一元线性回归模型的参数估计我们已知道,总体意义上真正的回归模型是未知的,我们的任务是如何通过样本观察值给出总体真正回归模型的最好估计。我们必须理解和认识总体回归模型和样本回归模型的区别和关系,必须反反复复地去认识、体会。假设总体真正的回归直线是 它是由总体回归模型 显然,上面的模型是想象的、理论上的,实际上是找不到的,它们实际上就是所谓客观规律。而样本的回归直线为 它是来自于样本的回归模型 注意总体和样本模型的区别和联系,无限和有限,相同和不同等。下面我们同样根据最小二乘准则,建立真正回归意义上的最小二乘法:对样本模型 假设其估计的回归模型为 因此,其残差则为 所以,其残差平方和为 根据前面的结果,我们有 其中 到此样本回归模型的参数就估计出来了。对于这个结果需要注意的是,这里的 , 都是的函数,而是随机变量,因此,从理论上说,随机变量,而不是一个或几个固定的值,是一个概率分布。正因为如此,回归的结果实际上也不是确定的,而是概率意义上的。接着我们关心的是,这个估计结果怎么样?是否可用样本回归模型来推断或替代总体回归模型呢?因此,我们必须进一步讨论,的性质,亦即讨论样本回归模型的性质。 34、估计值的性质(1) 估计值的线性性质。所谓线性性是指估计值,是观测值的线性函数。证明: 而 其中同理可证:= 其中 所以,是线性函数(应注意线性性的意义和作用)。(2) 估计值的无偏性。所谓无偏性是指估计值,的期望值等于总体回归模型参数,的值。亦即 ,。证明:通过计算可知 , 其中所以有 同理可证 (3)有效性(或称,具有最小方差性)。所谓有效性主要是指最小二乘估计,在所有线性无偏估计中,其方差是最小的。证明的基本思路是: ,证明(略)。上面三个性质是最小二乘估计的主要性质,理论上说已达到最好的结果了。因此,满足这三条的估计也称作最优线性无偏估计。值得注意的是,这里的最优只是相对所有线性估计中而言的,而不包括非线性估计。也可以说在很多的情况下,肯定存在比最小二乘估计更好的估计值,这一点必须要认识清楚。还有一点,最小二乘估计的性质实际上与其假设条件是密切相关的,没有这样假设就没有这样的性质,因此,我们还要看看其假设条件到底是什么意思,要进一步去认识假设条件。 35、最小二乘估计,的显著性检验与置信区间所谓显著性检验实际上就是对检验估计值与总体参数值差别大小的方法。也就是数理统计中的“假设检验”的方法一种实际应用。这里再一次指出,参数估计之所以要进行检验,是因为这里的,是随机变量。根据“假设检验”的要求,我们要想办法求出,的概率分布函数,又由于它们是的线性函数,则首先要知道的分布。因此,我们只能假设服从正态分布(根据大数定理和中心极限定理,在大样本情况下并不失一般性)。假设服从正态分布,又因,是的线性函数,所以,也是服从正态分布的。只要计算出,的方差,我们就可得到 在上面的分布函数中,除了, 不可能知道外,我们必须解决未知数估计值,才可能继续进行显著性检验。1、 建立随机变量方差的估计值采用一定的办法是可以解决估计值的,下面给出其推理过程,并证明其估计值是一个无偏估计。设: 所以 而 (1) 又(2) 代入 则有 由此我们就有 因此,进一步则有 下面我们分别计算上式右边每一项的期望值: 其中 ( 注意其中 )因此,我们最终得到 如果我们定义 ,那么就是的无偏估计,亦即有 。 但是我们还不能证明 是最小方差估计,这是十分遗憾的。 2、 最小二乘估计值,的显著性检验现在我们可以开始对,检验了。我们应该认识到,通过样本得到具体估计值, 只是一个值,或者说只是无穷个可能值中的一个,此时我们并不了解它们的精度和可靠性。因此,显著性检验实际上是检验,与,之间的差距和可靠性。具体的检验方法就是“假设检验”的方法。我们从数理统计中知道,一般假设检验中用来进行检验的统计量(实际上就是一种随机变量)主要有二个,即Z统计量和T统计量。(1)应用Z统计量的条件是:已知而无论样本的大小,或者未知但样本足够的大(n至少大于30)。 已知 则我们有N(0 ,1) N(0 ,1)当然如果未知,但样本数大于30,则在上式中用替代即可。(2)应用T统计量的条件:当方差未知,且样本小于30时。已知 则我们有 = t(n-k) =t(n-k)这里的n是样本的个数,k是模型中变量的个数,n-k是自由度。到此假设检验的基本工作基本上做好了,需要指出的是,统计量的设计一方面是把特殊的分布函数转化成标准的分布形式,另一方面把需要检验的对象同时也明确起来了。上面统计量分子正好反映了我们检验的意义。在“假设检验”的实际应用中,一个十分重要的问题是如何确定总体意义上的,的值。我们知道“总体”概念说到底只是一个设想,一个信念而已,我们不可能知道,的具体值,但我们又要依据,具体值才能判断或检验,是否是可接受的或误差不大。这个问题或矛盾怎么解决呢?这实际上是一个深刻的方法论问题。简单地说,我们只能用假设、或者具体地说是用理论假说的数量结论来替代,的具体值,也就是“假设检验”方法中作出“零假设”的主要依据;当然在把回归模型作为预测用途时,也可以把其他主观或经验的判断作为“零假设”的依据。这样我们就可看到,所谓“假设检验”中原来希望检验,与 ,之间差异的想法或思路,已经转变为检验,是否与理论假说或其他主观判断和经验相符。这一转变是深刻的和巨大的,这里,已变成了检验的标准,由被动变为主动,而理论假说或其他主观判断则变成了被检验对象。这一转变所说明是问题是很多的、深刻的,应该好好认识和体会。“假设检验”的具体过程(例子):略3、总体参数,置信区间的估计通过“假设检验”方法或显著性检验,虽然证实了估计值,的显著性,但还没有说明它们就完全正确估计了真实总体参数,至多只能说明,是它们的一种可能的值,其它更多的可能性显然是存在的,或许其它的值更好或更合适,因为,只是来自一组样本的估计结果。因此,为了确定,是怎样接近真实总体的参数,我们期望构造一个区间来具体加以说明,亦即建立一个围绕估计值,的一定限制范围,来推断总体参数,在一定置信度下落在此区间。所谓置信(或称置信水平)度实际上与显著性的意义类似,只是数量的大小相反而已。例如,对于的T统计量,有 =t(n-k)先确定其置信度如95%和自由度(n-k),然后通过t分布表找出临界值的值。则我们有 即 所以,置信度是95%的置信区间为 我们可以看出,置信区间的长度与置信度的大小是密切相关的,其长度与置信度的大小是成正比的。这种关系也是值得思考的。36、预测值问题的分析 所谓预测问题就是对于已估计的计量经济学模型来说,相对于一给定的X值,例如,其预测值的性质和效果如何?再来回顾一下我们建立回归模型的过程及其性质。根据最小二乘法我们从样本模型 找到了它的回归直线我们已对 ,作了检验并通过后,应该可以根据上式来进行预测了,亦即对于,可得到,亦即我们要具体考察性质,实际上主要是分析它的误差性质,我们可以通过不同角度的分析来进行。我们可以从两种角度来看待的误差。一是把看成是总体回归线(即)的估计值;二是把看成是(即)的估计值。下面来具体分析:(1)如果把看成是总体回归线即的近似值,则有什么样的性质呢。首先可以证明的是是的无偏估计。现证明如下: 然后,我们来看看 方差的性质和具体形式: (具体计算过程参看4344页)从方差的计算结果可看出,如果离样本观测值的距离越大,则的方差也就越大。这实际上说明回归的基本思想实际上是归纳的思路,亦即我们的不能脱离样本或经验的范围太远,否则模型的预测值的方差将增大,预测将将变得更加不可靠。这个结果也许使我们对归纳法及思想的局限性或存在的问题有了一个数学上的解释。同时这个结果也把回归模型预测的类型分为两类,第一类称之为“内插检验”亦即这时的必须在样本所限定的区间内,言外之意是对经验之内的情况,回归模型的预测效果是比较可靠的。第二类称之为“外推预测”,这时的是在样本区间的外面,这时的预测值的误差方差显然是较大的,亦即“外推预测”是十分不可靠的。(2)如果把看作真正总体或的预测估计值,其性质和结果又会什么变化呢?这里要注意的是,这时不仅可能有抽样误差的存在,而且还可能由随机项而引起随机误差的出现,它们将使得不同于。下面我们来具体看看这种情况下的期望值和方差: 对于给定的,有 则 取其期望值,则有 这个结论是否与上面的情形是一样的呢?是否能说是的无偏估计呢?看来是有问题的,其问题的关键是是什么?是一个随机变量?还是一个确定的值?不同的理解就会有不同的结论。再来看看此时的方差又有什么变化: =从上面的结果可清楚看出,总体的与样本的估计值之间的方差,要比与总体回归线的方差大,准确地说大。这是一个十分重要的结论,可具体表示为 预测误差的方差=抽样误差的方差+随机误差项的方差这个结论表明,人为降低预测误差只能在抽样误差的方差方面作出努力,而其存在的随机误差是无法避免或改变的。通过上面的讨论和计算,我们就可以进一步对进行显著性检验和计算其置信区间。下面只介绍T统计量检验的情形,对于构造的T统计量为 t(n-k) 具有n-k个自由度具体的检验过程和置信区间的推导过程这里就省略了。值得指出地是,在进行用于预测值的检验时,与前面的假设检验是有较大区别的,这里需要关心的不是理论的假说结果,而是回归模型预测值的具体精度,是精度而不是数量的性质,亦即是量而不是质的问题。第三章 作业1、 知下列数据:有关英国车祸次数与有执照汽车数的数据 年份: 1947 48 49 50 51 52 53 5 4 55 56 57车祸次数:166 153 177 201 216 208 227 238 268 268 274有执照的 352 373 411 441 462 490 529 577 641 692 743汽车数请利用最小二乘法求出回归方程,并进行显著性检验和置信区间估计。2、 证明最小二乘估计值的无偏性,即。3、 请具体说明最小二乘估计 具有无偏性和最小方差性的意义(意义和存在问题)。4、 试分析说明最小二乘估计方法中主要假设条件的作用。5、 试分析说明参数估计显著性检验的基本思路。6、 设服从正态分布,请证明,。7、 如何认识回归模型的预测值误差的性质。 第四章 多元线性回归模型 41、引言 前面我们以一元线性回归模型为例,阐述了回归分析的基本原理及具体内容。一般来说,在纯理论研究中,变量的个数往往较少,少则二个多则三个,因此,一元线性回归模型在纯理论研究中应用较多,也较为有效、有意义。但在实际问题的研究和预测中,一元线性回归模型就不够了。一般来说,变量的个数将增多。因此,我们应进一步阐述多元回归模型问题。一般数学理论告诉我们,对于线性问题来说,一元和多元问题本质上是一样的,也就是说,它们的基本原理、具体内容根本上是一样的,结论也是一样的。显然这既说明线性方法的优势所在,同时也是它的问题所在。因为一般来说,一元问题和多元问题之间是有本质区别的,因此,在我们学习多元线性回归模型方法时,也应同时考虑更深层次的方法论问题。下面,我们来具体讨论有关内容。 42、多元线性回归模型及其假设所谓多元线性回归是指描述一个因变量与二个以上的自变量之间线性关系的一种方法。本质上它是一元线性回归模型的自然扩展。一般来说,如果某一因变量与k个自变量之间的联系是线性关系,那么,它们之间的回归模型一般形式可表示为 其样本模型为 为了后面的推导方便,我们把其样本模型写成矩阵的形式: 其中 对于多元回归模型来说,其主要假设条件有: (1) ;(2) ;(3) 是一个确定的矩阵;(4) 的秩小于n,即。 这里要指出的是,即表明之间无共线性,由此,有 亦即存在,这个结果将在参数估计公式中起重要的作用。根据上面的情况,我们有 而 则这表明:的协方差矩阵和的协方差矩阵是完全相同的,亦即有 由此可以看出,上面的主要假设条件与一元回归时的情形基本上是一样的。43、最小二乘估计 对于总体多元回归模型可设其样本回归模型为 其中 根据最小二乘法的基本思路,我们有 那么, 然后求上式的极小值,即对求导数,则有由此我们有 根据假设,存在,最后我们得到 这就是多元的最小二乘法的参数估计公式。44估计值的特征我们将看到,对于多元线性回归模型的估计值,同样具有很好的性质,即线性性、无偏性和最小方差性(有效性)。下面分别来讨论。1、 估计值的线性性。证明: 如果令 那么有, 亦即是的线性函数。2、 计值的无偏性。根据 ,我们有 所以,这表明所有的都是无偏估计值。3、 估计值的最小方差性(略)。45、多元回归估计值的显著性检验和置信区间一般来说,由于多元的缘故,多元回归估计值的显著性检验的内容显然要复杂得多,具体说是检验的对象多、不同性质的问题多、难度大等。下面我们只能简要地介绍一下有关内容。1、 解释变量的显著性检验。这个内容与前面的一样,只是在检验的数量上要多一些而已。即: 构造假设:具体检验过程与前面几乎是一样的,故这里省略。2、 总体显著性检验。所谓总体显著性检验就是检验k个解释变量对的影响程度。为此,我们首先构造假设:而其对应假设则是 不是所有的 这就是说,如果假设成立,则说明所有的真实参数都为零,亦即同这些解释变量之间的线性关系是完全不成立的。当然,如果否定这一假设,就可以肯定这k个解释变量对的影响是显著的(只是从总体上说,并不能肯定每一个解释变量的影响都是显著的)。为了进行此检验,需要构造新的统计量,为此需要对总的离差平方和进行分解(注意这里的分析思路与相关系数检验类似)。注意: ,证明过程较为复杂,这里省略。在相关系数一章中,将有一个简单的证明形式。亦即:总的离差平方和=回归平方和+残差平方和。正是这个结果的意义使我们能够构造出新的统计量。同时,根据数理统计理论,可判断出具有k个自由度(k是的个数),而具有n-k个自由度。由此我们就可构造出F统计量: 具体的检验过程这里就省略了。3、 检验回归系数中部分系数的显著性问题。 假设回归模型为 如果我们知道不仅受上述k-1个变量的影响,还受到另外lk个变量的影响,这时上面的回归模型就应该变为 这时就出现了两个注意的问题。(1)、各个对的影响,即其单个解释变量的显著性检验;(2)、是否同时对有显著性的影响。前一个问题已讨论过了。现在我们来讨论后一个问题。构造假设 其对应假设 : 不是所有的再来构造新的统计量,其基本思路与前面的F检验是类似的,假设令那么,就有这里,k,L表示模型中解释变量的个数。值得注意地是,在上式中和显然是相同的,对在两个式子中是不相同的,因为估计其的回归模型中的解释变量个数是不同的。由此我们得到统计量 由此通过假设检验,推断解释变量中那些部分的解释变量对的影响程度如何。具体的检验过程这里省略。4、回归系数之间关系的检验。所谓回归系数之间的关系检验,就是检验是否与有一定的关系,例如,=,等,其中为某一常数。(!)、对于=的情况,需要构造假设其对应假设 如果假设服从正态分布,那么则有 由此,对于不同的样本容量可以构造Z,T统计量,例如构造T统计量为 (2)而对于的情况,此时可以构造假设 及其对应假设 类似地,在小样本的情况下,可以构造T统计量 具体的检验过程这里省略。46、预测显著性检验完成后,就可以利用其估计模型对进行预测了,并给出其置信区间。其具体内容与一元回归模型的情形大同小异,这里就不作介绍了。请注意其预测值方差形式的变化:47、多元线性回归存在的问题多元线性回归方法是我们 研究具有多个解释变量问题的有用工具。当然,我们也应该清醒地认识到,多元线性回归方法存在的问题显然要比一元线性回归更加复杂。下面我们根据多元回归的性质,指出可能出现的几个主要问题,以便引起我们的注意。1、 外推预测隐藏的危险。在一元回归模型中,我们已经知道,对于的情况,模型预测的效果一般是较好的,即这时经验归纳的结果是较为有效的,称之为“内插检验”,而对于的情况,则模型的效果可能是很不稳定的,称之为“外推预测”,这时表示预测的要求实际上超出了经验归纳的有效范围,显然,这时的预测值仅是一种猜测而已。实际上对于多元回归模型来说,这个问题就显得更加危险。因为这时每个解释变量的最大值和最小值所构成的点集包络线区域(多个区域的交集),才是模型预测有效的范围或条件,亦即预测值在这个区域内时,模型的预测结果才可能是较为有效的。一旦某一个不在这个区域,即使其它的都在这个区域,其预测值也只能是一个外推预测的结果,是非常不可靠的。因此,在多元回归的情况下,判断其预测值的有效性要复杂得多,我们必须十分注意到这一点。2、 多重共线性问题。所谓“多重共线性”是指解释变量之间存在某种线性关系。显然,如果多元回归模型中的解释变量存在“多重共线性”,其最小二乘估计的结果是无效的。亦即是不存在的。要注意地是,实际中解释变量之间是否存在多重共线性并不是一目了然的,往往可能由于很小的误差而使这种线性关系并不明显。所以,如果稍不注意,就很难发现多重共线性问题的存在,从而会大大影响估计值的准确性、有效性,严重时将导致估计值失去其意义。(举例说明)观察多重共线性问题应注意的几个方面:(1)对解释变量之间的关系应充分了解,在具体建立模型之前就应该考虑是否可能产生多重共线性问题的可能性。例如,可事先计算各解释变量之间的相关系数,进行具体考察。(2)对样本数据应进行仔细地观察,力争尽早看出问题,或者做到初步认识是否发生此问题的可能性。(3)在得到估计值后,如果其效果不好,应首先想到多重共线性问题影响的可能性、或影响的程度。特别是在解释变量较多的情况下,更应如此。一般来讲,解释变量之间总是存在一定程度上的共线性关系,变量越多可能性越大。因此,我们最终关系的是它们共线性的程度,而并非有无共线性问题本身。3、 虚变量(Dummy Variables)。在回归分析中,我们经常遇到的解释变量不仅一般用来表示数量的变量,而且还有一类用来表示某种属性的变量,例如,有关性别、种类、地区、战争、地震、罢工、政变和政府经济政策的变化等。这种通常表示有或没有某种性质的变量称之为“虚变量”。一般用-1,0,1等来表示有或没有这种属性。下面讲一个例子:战争时期和和平时期的消费函数。先假设 (战争时期) (和平时期)其中,这里假设两个时期的边际消费倾向是相同的,实际上我们可以用一个式子表示这两个关系式,即 其中 0表示战争时期的年份,1表示和平时期的年份。因此有 由此有 上面为了区别战争时期与和平时期,我们仅引入了一个虚变量。实际上也可以考虑引入两个虚变量的方法。这时回归模型可以写成其中 同样这里的0表示战争时期的年份,1表示和平时期的年份。并且如果我们假设虚变量样本是开始是两年和平时期,随后是三年战争时期,接着又是和平时期构成,那么其样本矩阵可表示为: 从中可看出,即表明和是完全共线的。因此,这时是不能使用最小二乘法的。要解决这样的问题就要另想办法。利用“虚变量”的一般原则是,如果一个质的变量需要表示m种可能性,那么最多就只能引入m-1个虚变量。根据这个原则,在上面的例子中,就只能引入一个虚变量。如果不遵守这个原则,我们就可能掉入所谓“虚变量陷阱”,即完全多重共线性的情形。关于如何应用“虚变量”方法,需要讨论更多的问题,必须另外进行讨论。第四章 作业 1、试与一元线性回归模型比较,阐述多元线性回归模型所产生的不同问题及其原因。 第五章 回归的扩展5、1引言一般来说,线性回归模型的数学含义可表示为: 是的线性函数: 即 或者是的线性函数:即根据上面的关系,我们就可写出其线性回归函数的一般形式为: 这种形式的回归模型的估计和检验问题,我们已经讨论过了。在许多实际问题中,变量之间更加一般的关系形式是非线性关系的。我们注意到在非线性关系中,有许多情况是可以通过简单的变量变换,就可以转变为线性回归关系,从而这类非线性关系的问题也可应用前面所讲的方法来解决。因此,解决非线性回归模型的基本思路,就是通过一定的转换,将非线性形式转换成线性的形式,然后加以解决。 5、2变量之间的非线性关系一般来说,被解释变量与解释变量之间的一般形式可写成: 其中可以是的k个已知的非线性函数。因此,如果已知,那么我们则可通过变换的方法使之转化为线性函数关系,如令 那么,就有因此,如果给出一组样本,我们就可得到相应的,并通过最小二乘法得到回归方程的估计式 上面只是一般的讨论或原则,建立非线性模型的最大困难在于确立的具体函数形式。一般来说,对于单个解释变量与之间的非线性关系,可以用样本的散点图的方法,来确定适当的非线性形式或函数,而对于与多个解释变量之间非线性关系的确立就十分不容易了。下面我们给出经济分析中常用的非线性函数的类型(主要是单个解释变量的情况):1、幂函数 2、双曲线函数 3、指数函数 4、对数函数 5、S型曲线 其他函数形式的性质及其变换形式(略) 下面我们再介绍一种常见的非线性关系形式,既以解释变量构成的多项式形式: 这时可令 那么,我们就得到了一个典型的多元线性回归模型 由此我们就可以利用最小二乘法来进行处理了。 53参数为非线性的情况在许多经济现象中,存在着具有不变弹性的经济变量之间的相关关系问题。例如商品的销售量与其销售价格之间的关系,产量与其各生产要素之间的关系问题等。这类问题模型的一般形式可表示为: 这里的是相对于的不变弹性。因为根据弹性的定义有 又 注意随机项的形式,这时满足通常的假设条件,即 下面我们对原方程进行变换,即对原方程两边取对数形式,则有 若设则上式变成 这样我们就可以对上式应用最小二乘法了。例子:我们来看看柯布道格拉斯生产函数通过理论分析和大量观察,专家们发现劳动者的数量L和生产资料(资本)的数量K与产出的数量Q之间具有下列的关系 这就是著名的柯布道格拉斯生产函数。其经济含义是十分丰富的。(1) 一般说来当 时,规模报酬递增;当 时,规模报酬不变;当 时,规模报酬递减。(2) 产出弹性劳动和资本的产出弹性为(3) 边际技术替代率 (4) 替代弹性 下面我们对生产函数进行参数估计:若已知某生产部门的Q、L、K的历史观察数据,那么我们其生产函数两边取对数有 再令 故有 则利用最小二乘法即可计算出参数的估计值(具体计算过程省略)。 总之,对于非线性回归模型问题,实际上最重要、最困难的,并不是非线性形式的线性转换方式,而是原有的非线性回归模型如何建立,这才是最困难的,也是经济学研究的关键和困难之处。 第六章 相关系数检验 一般来说,在回归模型的基本假设中,有一个假设条件是最为重要的,这就是假设变量之间在概率意义上存在线性关系;亦即=或=0。这里的“概率意义”,虽说与确定意义有差别,但由于概率意义的前提必须承认规律的存在;故我认为,这里的“线性关系”与确定意义下的“线性关系”并无根本性的区别。因此,我们可以说,概率意义上的线性关系仍是一般意义上的线性思路或方法,只是分析的条件有所放松而已。现在我们要问,在建立回归模型时,这个假设条件成立吗?显然需要进行检验,需要建立一种检验方法。 61、建立相关系数检验方法的基本思路 实际上,建立相关系数检验方法的基本思路是较为简单和清晰的。其基本思路是:建立一种方法(),希望此方法在测定被解释变量Y的总的变化中,推出回归直线能够解释的部分有多大;即通过两者之比的大小,来推断回归模型效果的好坏。下面简要介绍其方法的建立过程:首先,我们有Y的总的变化可表示为 : 回归直线能够解释的部分: 由此我们可以得到,回归直线没有(或不能)解释的部分为:因而我们有Y的总的变差=其中,=0(注意:,另外 )。所以,我们最终有Y的总的变差=亦即,Y的总的变差=回归直线能够解释的部分部分+回归直线不能够解释的部分 显然这个结论是十分重要的,在计量经济学中已有许多类似的结果。没有这样的结果,我们的方法就建立不起来,也没有什么意义了。我们也应进一步思考,为什么会有这样好的结果呢?这实际上正是线性方法或线性思想的特征或优势所在。 62、相关系数的计算和特征根据建立相关系数的基本思路,我们用表示相关系数,则有=已由解释变量说明的部分Y的总的变差=由此可知: 当时,达到最大值,即=1; 当时,达到最小值,即=0;所以 。还能够写成其它形式,如,代入 ,而,再代入则有还可以写成另一个形式R= , 这时,R=-1时,称之为完全负相关,而R=1时,称之为完全正相关。除了相关系数外,还有其他相关系数,如偏相关系数和复相关系数,它们都是涉及到多元回归问题的。其中,所谓偏相关系数是指度量在其他所有变量保持不变的条件下,任意两个变量之间的相关程度的系数。而复相关系数是指多个变量的相关系数中,例如 ,对于其中的变量的复相关系数是指除以外的其它变量对的相关程度的度量(具体内容这里略去)。63、相关系数的应用相关系数的意义主要是在概率意义上反映了解释变量与被解释变量之间的线性相关程度,亦即检验假设 = 或 =0相关系数最大的不足是不能给出变量之间的因果关系,亦即不能揭示变量之间相互依赖的确切关系。正因为如此,相关系数高的原因是多种多样:(1) Y和X分别互为变化的原因;(2) Y和X同时互为变化的原因;(3) 量Y和X的变化是由另一个变量W引起的,而它们之间实际上并无直接的因果关系;(4) 变量X、Y之间的相关可能纯粹是偶然的巧合,实际上并无任何因果关系。因此,仅仅知道相关系数的结果是不够的,相关系数或相关分析不能给出X和Y之间是如何关联的。实际上,变量之间的因果关系的确定只能依赖于经济理论或主观的经济分析。另外,在实际应用中,人们往往采用相关系数来判断变量之间的相关程度。值得指出地是,相关系数只是说明变量之间相关程度的充分条件,而不是必要条件。例如,相关系数高的确能说明变量之间的相关程度、或线性相关程度高;但如果相关系数低,则不能说明变量之间的相关程度底,而只能说变量之间的线性相关程度底,完全不能够排除变量之间存在重要的非线性相关关系。一般来说,相关系数低,或回归模型吻合度不好的主要原因有:(1) 模型中各变量之间本来就不存在因果关系;(2) 模型中漏掉了其它重要的变量;(3) 变量之间关系的数学形式不正确(或成非线性关系)。在上述原因中,尤其以第三种原因最为重要和突出,其解决的主要方式是回归模型的建立应以经济理论模型为依据,或建立模型前重视理论模型的分析。 第六章 作业 1、简述建立相关系数方法的基本思路,并指出相关系数检验存在的问题。 第七章 异方差检验 71、随机项的异方差性在回归模型估计过程中,有一个重要的假设,即假设其随机项具有相同的方差:常数。这一假设又称之为随机项的齐次方差性或同方差性,我们可以从其散点图中看出这一假设下样本分布的一般状态(图1)因此,当假设不成立时,那么则有 常数这时我们就称随机项具有异方差性。如果存在异方差,则不是常数,一般可表示成 这就是说,异方差的形式取决于和的关系。简单地说,异方差的种类可大致分为三大类,即递增的异方差、递减的异方差、复杂形式的异方差等(如图所示)。(1) 当增加,的方差也增加时,为异方差递增的形式(图2);(2)当增加时,是递减的,为异方差递减的形式(图3);(3)与之间无明显的关系,或复杂的关系(图4)。社会经济现象是异常复杂的,一般来说,齐次方差性假设是不成立的。我们关心的是异方差程度的大小,如果异方差程度严重时,最小二乘法就不再适用了。72、异方差的性质在回归分析中,如果存在异方差则会造成严重的后果,下面我们讨论异方差条件下,最小二乘估计的有关性质:1、 参数估计值仍具有无偏性。以一元线性回归模型为例,我们有 注意, ,所以我们有 同理,对也可类似地证明。从证明过程中可以看出,由于没有用到齐次方差性假设,故无偏性仍然成立。2、不再具有最小方差性(有效性)。在异方差存在的条件下,估计值的方差不再是一个有限的常数,故估计值的方差并非最小(证明过程省略)。3、参数的显著性检验将失去意义。 在异方差存在的情况下,由于参数估计值的方差并不是一个有限数,而是随着解释变量的值域的增加而增加,显然此时显著性检验将失去其意义,其置信区间也将变得不确定了。4、预测失败。一般来说,在异方差存在的情况下,由于其参数估计值的方差较大,将使得模型的预测值的方差增大。因为预测值的方差既包括随机项的方差,又包括参数估计值的方差,异方差的存在,将直接影响到这些方差的大小。73、异方差性的检验由于异方差存在的严重影响,必须对异方差进行检验,以便提出解决的方法。下面介绍几种检验异方差的常用方法。1、图示法。这个方法较为简单。首先进行OLS估计,然后分别对随机项的估计值与或的散点图,并根据其散点图来直观地判断是否存在异方差,亦即观察相对于或的变化来说,是否有明显的规律性。其它方法这里省略。对于异方差性的检验无疑是十分重要的,特别是对于用横切面数据构造回归模型时,更要注意异方差的存在。74、克服异方差性的方法其一般方法的思路是,寻找合理的变换,通过变换原有的模型,使变换后模型的随机项满足齐次方差性假设,然后再用OLS进行估计。具体方法是一般的假设,是常数,若 ,则为齐次性方差;若 ,且不为常数,则说明存在异方差,此时就有 ,设原来的回归模型为 其中假设 ,则此模型是一个有异方差的模型,如果我们用 去乘以模型两边,则有这样原模型则已变成了一个齐次方差性的模型,这时就可利用OLS进行参数估计了。总之,异方差的存在是由许多因素造成的,除了模型的数学形式的错误外,另一个重要的因素可能是由于省略了重要的解释变量所造成的,或者是由于错误地确定了解释变量而引起的。如果是这两种情况,则应首先解决这个问题。不然,即使经过上面的变换,消除了异方差,也无济于事,其参数的估计值仍然是错误的,亦即是个“假异方差”问题。第七章 作业 1、简要回答异方差存在的后果。 第八章 序列相关检验 在回归分析方法中,还有一个重要的假设条件是假设回归模型中的随机项是独立的或不相关的,即=0 , 。 显然这个假设是对复杂客观经济现象高度抽象的简化,实际上任何前后期的经济变量总是相互关联的。因此,在实际问题的分析中,常常出现与此假设相违背的情况是不奇怪的。如果之间存在相关性,则称为序列相关,亦即 , 。81、随机项序列相关的性质一般来说,在以时间序列数据作样本时,由于经济变量的基本特点,出现序列相关
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!