资源描述
计量经济学 Econometrics,Tel:13972286169 E_mail:,课程介绍,计量经济学是在经济理论的指导下通过数学和统计方法对经济关系进行分析以寻求经济现象所具有的数量规律的一门经济学学科。,以建立、检验和运用计量经济模型为核心,在介绍基本原理基础上,重点分析回归分析在实际应用中会遇到的三大问题(多重共线形、异方差、自相关)的检验与解决方法,最后介绍对不同类型数据的各种回归分析模型。,掌握建模思路、经济模型的参数估计和检验; 初步掌握计量经济学软件包Excel和Eviews软件的操作和基本技术; 在此基础上,能够独立完成一个小型计量经济模型的全过程。,课程说明,考核方式 使用教材与参考文献 计量经济学基础(第4版),古扎拉蒂,费剑平、孙春霞等译,中国人民大学出版社2005年版。 计量经济学导论:现代观点,J.M.伍德里奇,费剑平、林相森 译,中国人民大学出版社。 计量经济学入门,黄少敏,北京大学出版社。 计量经济模型与经济预测(第4版),Robert S.Pindyck & Daniel L.Rubinfeld,钱小军等 译,机械工业出版社。 数据分析与Eviews应用,易丹辉,中国统计出版社2002年版。,教育家B. F. Skinner,“如果我们将学过的东西忘得一干二净时,最后剩下来的东西就是教育的本质了。” 所谓“剩下来的东西”,其实就是自学的能力,也就是举一反三或无师自通的能力。,第一章 绪论,2学时,基本要求 通过本章的学习,了解计量经济学建立和发展的背景,在经济学科中的重要地位;理解计量经济学的概念;掌握经济数据的类别,实证经济分析的步骤。 本章重点:实证经济分析的步骤 本章难点:计量经济学概念的理解,第一章 绪论 提纲,第一节 计量经济学简介 一、计量经济学产生 二、什么是计量经济学 三、计量经济学的地位 四、如何学习计量经济学 第二节 实证经济分析的步骤,第一节 计量经济学简介,一、计量经济学产生 1、经济学的科学化,经济学是科学吗?,科学方法,2、经济学的应用,例,在经济衰退中,有人说: 1)需要削减工资,因为那将增加企业的利润,并因而刺激生产; 2)需要增加工资,因为那将刺激消费者的需求,因而刺激生产; 3)需要削减利息率,因为那将刺激开设新企业; 4)需要提高利息率,因为那将增加银行存款,并因而给予银行增加贷款的能力。 “增工资”与“减工资” 、“ 削减利息率”与“提高利息率”相互矛盾,如何选择? 分开看,四种措施都有其道理,但是决策者却无所适从。因为这些措施都是纯理论概念,既没有定量化,也没有比较各种措施的相对力度。,弗瑞希认为:经济理论只在纯定性基础上工作,而不设法定量测度不同因素影响的重要性,实际上不可能得出和辩护任何“结论”,1929年大危机使企业需要研究、预测市场,政府需要探讨政策干预的效果。但面临同样问题,于是发展出比较适用于分析经济资料的统计方法,形成了经济学中的一个独立领域-计量经济学。,但统计学是通识教育,存在适用性问题: 主要用于自然科学(受控),不完全适用于社会科学(非受控); 不够深入,不足以应付各种经济资料。,对经济理论的验证与进一步应用,需要分析实际经济资料。因此,统计学成为必需。,宏观分析阶段,1926,弗瑞希、丁伯根创立计量经济学 1930,国际计量经济学会成立 1933, Econometrica 杂志创刊,微观分析阶段,创立阶段,1930年代,侧重于个别商品供给与需求的计量,基本上属于个量分析或微观分析,1940 年代以来,范围扩大到整个经济体系,其特征是处理总量数据。很多至今还在英、美等西方国家运行的模型正是那个时期开发的。,Ragnar Frisch Norway,Jan Tinbergen the etherlands,二、什么是计量经济学,计量经济学,经济学,数学,统计学,在经济理论的指导下通过用数学和统计方法对经济关系进行分析以寻求经济现象所具有的数量规律的一门经济学学科(离开经济学,模型将是一堆无用的数学符号),以建立、检验和运用计量经济模型为核心(随机方程)。,与其他学科的区别,运用抽象的方法,借助数学函数和几何图形得出经济学概念与理论,先经济行为公理化,然后演绎推理,虽有方程式,但没有赋予具体数值;经济关系绝对准确确定,不可能用统计资料验证。,以统计资料作为记述现实经济变动过程的手段;不验证经济理论、预测、政策评价,(国外称广义计量经济学)=计量经济学+优化理论+投入产出+技术经济学等一切涉及经济的数量分析方面的各个学科的综合。,经济统计学,中国的数量经济学,数理经济学,计量经济学是经济预测的科学,基于以下共识:世界运行是有规律的,人们行为所产生的纷繁复杂的经济数据是这些规律的表象,计量经济学的任务就是分析这些表象数据,找到其背后的规律。 计量经济学从根上说,是对经验规律的认识以及将这些规律推广为经济学“定律”的系统性努力,这些“定律”被用来进行预测,即关于什么可能发生或者什么将会发生的预测。因此,广义地说,计量经济学可以称为经济预测的科学。,计量经济学的艺术成分,计量经济学虽然以科学原理为基础,但仍保留了一定的艺术成分,主要体现在试图找出一组合适的假设,这些假设既严格又现实,使得我们能够使用可获得的数据得到最理想的结果,而现实中这种严格的假设条件往往难以满足。 “艺术”成分的存在使得计量经济学有别于传统的科学,是使人对它提供准确预测的能力产生怀疑的主要原因。,三、计量经济学的地位,克莱因(R.Klein):“计量经济学已经在经济学科中居于最重要的地位”,“在大多数大学和学院中,计量经济学的讲授已经成为经济学课程表中最有权威的一部分”。 萨缪尔森(P.Samuelson) :“第二次大战后的经济学是计量经济学的时代”。,举例,某个房地产代理商想研究房屋售价和房屋特征之间的关系,这些特征包括:房屋的面积、到市中心的距离、卧室的数量、卫生间的数量、小区容积率、平均每户停车位数、是否可观海(山)等等。该代理商想知道,房屋的这些特征对售价有什么影响。他可以建立一个模型:,四、如何学习计量经济学,多重共线性;异方差;自相关,若资料与理论一致,则接受理论,利用估计好的模型; 若不一致,则修正或者推翻理论。,计量经济学检验与修正,验证、预测、政策评价,第二节 实证经济分析的步骤,Keynes消费理论:平均说来,当人们收入增多时,他们倾向于消费,但其增长的程度并不和收入增长的程度一样多。,横截面数据;时间序列数据;混合横截面数据;面板数据,ols;极大似然估计;pls C= 282.2434+ 0.758511Y (0.9825) (20.54),理论或假说陈述,数学模型设定,计量模型设定,获取数据,参数估计与假设检验,数据来源,国家统计局网站 中国人民银行网站 外汇管理局网站 中国统计年鉴各期 中国资讯行统计数据库 中国经济信息中心 .,数据类别,横截面数据:随机抽样;数据排序不影响计量分析。 时间序列数据 趋势性:数据与时间有关,因为过去的事件可以影响到未来,而且行为滞后在社会科学中相当普遍。 季节性 混合横截面数据 不同时间点都是随机抽样:同一数据单位在不同点同时出现纯属偶然 目的:分析一项新政策的影响;扩大样本容量 面板数据 同一横截面数据的数据单位都被跟踪了一段特定的时期 可控制观测单位本身具有而我们又观测不到的特征,三要素,经济理论 经济数据 统计方法,理 论,模 型,计量经济模型,事 实,数 据,加工好的数据,统计理论,计量经济技术,使用计量经济技术,用加工好的数据, 估计计量经济模型,结构分析,预 测,政策评价,练习,某空调生产商请你为他研究价格上涨对空调需求量的影响,你将如何做?简述思路。 课后学习章节:引言 预习章节:附录A.7-教材下册P844,第二章 统计基础知识复习,4学时,基本要求 通过本章的学习,理解总体数字特征的含义;掌握样本估计量的计算公式,估计量的四大性质,假设检验方法,第一类错误、第二类错误和p值的含义。 本章重点:点估计、假设检验方法 本章难点:置信区间、第一类错误与第二类错误、p值的含义,第二章 统计基础知识复习 提纲,一、总体的数字特征数 二、样本的数字特征统计量 三、通过样本估计总体 1、点估计 2、区间估计 3、假设检验,一、总体的数字特征数,随机变量:表示总体的数量特征。依概率不同而取不同值的变量,取值由随机实验的结果决定。如计算抛10次硬币正面朝上的次数 1、期望值 2、方差 3、协方差 4、相关系数,例:女儿期待父亲钓多少鱼回家?,数学期望是最容易发生的,因而是可以期待的。它反映数据集中的趋势。,二、样本的数字特征统计量,样本:简单随机抽样,每个个体有同等入选样本的机会 n元随机变量(x1,x2,xn),独立同分布 每一次具体抽样所得的数据,就是n元随机变量的一个观察值。 1、样本均值 2、样本方差 3、样本协方差 4、样本相关系数,中心极限定理,给定某一变量,无论该变量服从什么样的分布,当其样本规模增大时,其样本均值的分布就会趋于正态分布。,N(0,1),t(n-1),三、通过样本估计总体,样本是总体的一部分,是对总体随机抽样后得到的集合。 对观察者而言,总体是不了解的,了解的只是样本的具体情况。 我们所要做的就是通过对这些具体样本的情况的研究,来推知整个总体的情况。,Xn+1,Xn,X1,样本,总体,例:灯泡寿命期望值的估计,某灯泡厂某天生产了一大批灯泡,从中抽取了10个进行寿命试验,获得数据如下(单位:小时),问该天生产的灯泡的平均寿命是多少?,1、点估计,方法:最小二乘估计、极大似然估计等方法,如何选择最佳估计量-估计量的性质,对总体的数量特征可以提出若干估计量。所谓估计量的特性指的是衡量一个统计量用以估计总体参数的好坏标准。我们构造一个统计量时,它们就应当具有这些优良性,否则就不采用它来估计总体参数。估计量的优良性可从四个方面进行衡量: 无偏性,有效性 方差最小 一个无偏有效估计量的取值在可能范围内最密集于附近。即,它以最大的概率保证估计量的取值在真值附近摆动。,均方误最小性 在很多情况下,我们被迫在偏差的大小与方差的大小(即无偏与有效性)之间作出抉择。 有时,一个方差极小的有偏估计比一个方差极大的无偏估计可能更为我们所追求。 此时,估计量的均方误为我们在两者之间的权衡提供了一个有效的尺度。 一致性,4支比赛用枪的抽样结果,一次射击就是一次抽样。 哪些是无偏估计? 哪些是有偏估计? 哪些是有效估计? 哪些是无偏有效估计?,对区间估计的形象比喻,我们经常说某甲的成绩“大概80分左右”,可以看成一个区间估计问题。(某甲的成绩为被估计的参数) P(1 2 )=大概的准确程度( 1-) 如:P(75 85 )=95%=1-5%,“大概80分左右”,冒险率(假设检验中叫显著水平),下限,上限,2、区间估计,用点估计估计参数,即使是无偏有效的估计量,也会由于样本的随机性,使得由样本计算出的估计值并不恰恰是真值。而且即使等于真值,由于真值未知,我们也不能肯定这种相等。那么,究竟相差多少?于是问题等价为:在给定可靠程度下,指出被估计参数所在的可能值的范围,就是参数的区间估计问题。 具体作法是找出两个统计量1(x1,xn)与2 (x1,xn),使 P(1 2 )=1- (1 , 2)称为置信区间, 1-称为置信度(置信系数), 称为冒险率(测不准的概率),一般等于5%或1%。,期望值的区间估计-中心极限定理的应用,n30正态分布 n30 t分布,5%,1.96,例:新生儿体重的区间估计,假设新生儿(男)的体重服从正态分布。随机抽取12名新生儿,测得体重如下表,试以95%的置信度估计新生儿(男)的平均体重。,3、假设检验,有时候我们感兴趣的问题具有确定的yes 或no 的答案。比如,工作培训计划是否有效地提高了工人的工作效率?女性在求职时是否受到歧视?运用样本数据设计一套方法来回答这类问题就是假设检验。 所谓假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。,假设检验采用的逻辑推理方法是反证法。 先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。 判断结果合理与否,是基于“小概率事件不易发生”这一原理的 概率很小的事件在一次抽样试验中几乎是不可能发生的。若在原假设的前提下,居然发生了小概率事件,则说明原假设是错误的,于是否定原假设。,思路,提出假设 根据该假设,找到小概率事件 抽样,看小概率事件是否发生 如果发生,表示假设是错的。 如果没有发生,表示假设不是错的。,步骤,1、设定假设条件 原定假设H0: =0 替代假设H1: 0 2、决定用哪种检验 若n30,用Z检验;若n临界值,则否定原定假设;-小概率事件发生 若|统计值|临界值,则不能否定原定假设,例:女婴体重变化的假设检验,从1999年出生的女婴中随机地抽取20名,测得平均体重=3160克,标准差=300克,根据已有的统计资料新生女婴的平均体重=3140克,问1999年与过去新生女婴的体重是否有变化(=0.01) ?,两类错误,由于我们作出判断的依据是一组样本,结论却是对于总体的,即由局部=全面,由特殊=一般,由个别=整体,在作出拒绝或接受原假设之后,我们可能作出了正确的决定,也可能产生了错误,但是我们不能确定是否产生了错误。然而我们可以计算产生I 类误差或II 类误差的概率。 第 I 类错误:原定假设本是正确的,而检验结果却否定了它。出现该错误的概率是(失误率、显著性水平)。-弃真 第 II 类错误:原定假设本是错误的,而检验结果却没有否定它。出现该错误的概率是。-纳伪,自然我们希望犯两类错误的概率都越小越好。但对一定的样本容量n,一般都不能作到犯这两类错误的概率同时都小。由于减小 =增大 ,或者减小 =增大 ,于是我们面临抉择,计量经济学中常常愿意使犯”第一类错误“的概率较小,因为我们提出假设时往往就希望拒绝它,拒绝错了的概率就较小 。而不考虑 。因此,拒绝H0是坚决有力的(冒险率是确定的),而不拒绝H0则是无可奈何的(冒险率是没有确定的)。,不能同时减小犯两类错误概率的图示,p-value,一般软件在做统计或回归分析的时候,都直接以统计值为临界值计算出对应的概率,称做p-value。表示否定原定假设失误的可能性,即精确的失误率、显著水平、显著程度。 若p-value小到可以接受的水平,则否定原假设;否则,不能否定原假设。,思考题,为什么有人热衷于买彩票? 为什么有人热衷于买车? 以上两种现象有矛盾吗? 课后学习章节:附录A.7-教材下册P844 预习章节:第1、2、3章,第3章 回归分析的基本方法:ols,4学时,教学要求,基本要求 通过本章的学习,了解“回归”名称的由来,理解总体回归函数与样本回归函数的含义,掌握最小二乘法的思路与推导过程,理解OLS估计量的性质。 本章重点:最小二乘法的思路与推导过程 本章难点:总体回归函数与样本回归函数的关系,引子:中国旅游业收入将超过3000亿美元?,从2004年中国国际旅游交易会上获悉,到2020年,中国旅游业总收入将超过3000亿美元,相当于国内生产总值的8-11%。(资料来源国际金融报2004-11-25第二版) 是什么决定性的因素能使中国旅游业总收入到2020年达到3000亿美元? 旅游业的发展与这种决定性因素的数量关系究竟是什么? 怎样具体测定这种数量关系?,应当考虑的问题,确定作为研究对象的经济变量 (如中国旅游业总收入) 分析影响研究对象的主要因素 (如中国居民收入的增长) 分析各种影响因素与所研究经济现象的相互关系 (决定相互联系的数学关系式) 确定所研究的经济问题与影响因素间的具体数量关系 (需要特定的方法进行参数估计) 分析并检验所得数量结论的可靠性 (需要统计检验) 运用数量研究结果作经济分析和预测 (对数量分析的实际应用),第3章 提纲,第一节 简单回归模型的设定 一、模型概念 二、其他条件不变概念 三、总体回归函数 第二节 简单回归模型的估计:ols 一、ols的推导 二、样本回归函数 三、ols估计量的性质,第一节 简单回归模型的设定,理论陈述:在其他条件不变的情况下,y如何随着x变化 数理模型:y=f(x) 计量模型: -简单回归模型,一、模型概念,1、因果关系 y-因变量,被解释变量 x-自变量,解释变量 -参数,系数,因变量与自变量一定是要有因果关系的,且方向不能搞反,沙尘暴,西北风力 土地开发状况 草木生长情况 防风眼镜销量 皮鞋价格,因此,一定要根据经济理论来选择变量,2、其他条件如何表示-统计关系,u-误差,表示除x之外影响y的其他因素。可视为观测不到的因素。 显然的问题是:为什么不把这些变量明显地引进到模型中来,而以随即扰动项来替代?理由是多方面的: (1)真正的关系是Y = f (X1, X2, ),但X2, X3, 相对不重要或难以辨认或欠缺数据,用u代表之。 (2)两变量之间的关系可能不是严格线性的,u反映了与直线的偏差。 (3)经济行为是随机的,我们能够用 Y=+X 解释“典型”的行为,而用u来表示个体偏差。 (4)总会出现测量误差, 使得任何精确的关系不可能存在。 (5)节省原则,3、函数关系,若其他因素被看作保持不变,则x对y具有线性影响。 1-斜率参数 0-截距参数,二、其他条件不变概念,怎样能在保持其他因素固定的同时又忽略所有这些其他因素,以得到x对y在其他条件不变下的影响呢? 解决方法之一:采用实验数据-在保持其他条件u固定的前提下,做实验。用得到的实验数据(x,y)来估计模型中的参数。,问题是经济数据绝大部分是非实验数据,且现实经济做实验的难度极大,如之奈何?,解决方法之二:u可以变化,但必需与x毫不相干。此时,只需满足如下假定即可: 零条件均值假定E(u|x)=E(u)=0 含义:对任何给定的x值,其他因素的平均值是相等的。如不管受教育的年数为多少,平均能力水平是一样的。则满足该假设。 为方便起见,只要模型中有截距项,则假设E(u)=0是合理的。因为若不为0,总能够通过重新定义模型中的截距项,使截距包含E(u),从而使得假设E(u)=0成立。,三、总体回归函数,零条件均值假定E(u|x)=E(u)=0成立的前提下,,含义:说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。,总体回归线,解释变量取给定值时因变量的条件期望值的轨迹。 对应于解释变量X的给定值都有Y的一个子总体,连接这些子总体的均值就得到了总体回归线。,回归的含义,古典意义:高尔顿遗传学的回归概念(父母身高与子女身高的关系) 现代意义:一个因变量对若干解释变量依存关系的研究 目的:由解释变量去估计因变量的平均值,一个虚构的例子-教材P25,目的:研究一个由60个家庭组成的假想社会,其家庭消费支出与收入的关系。即如果知道了家庭的周收入,能否预测该家庭的平均周消费支出水平。 理论陈述:凯恩斯消费理论 数理模型 计量模型 数据:把所有家庭的支出、收入数据找到,然后按收入分组,寻找其关系。,分析,(1)由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同; (2)由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的。因此,给定收入X的值Xi,可得消费支出Y的条件期望值 E(Y|X=Xi) (3)描出散点图发现:随着收入的增加,消费“平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上,此即 总体回归线,由于找到了所有的数据,我们仅仅通过观察图形就轻而易举的发现了变量之间的依存关系-一条唯一且确定的总体回归线,若找不到所有数据,怎么办?,消费水平均值预测,“一个家庭周消费支出的期望值是多少?” 计算无条件期望值=所有家庭周支出的求和平均=121.2美元(“无条件”含义-并不关心收入水平) “一个周收入为140美元的家庭的周消费支出的期望值是多少?” 计算条件期望值E(Y|X=140)=17+0.6*140=101美元-对家庭收入为140的支出的最佳均值预测,因此,对收入水平(解释变量)的了解能使我们相对于在不了解时更好地预测消费支出(因变量)的均值。-回归分析的本质:了解被预测变量的影响因素能提高预测质量。,个别家庭的消费水平预测,“一个周收入为90美元的家庭的周消费支出的实际值是多少?” 先利用总体回归函数求出一个周收入为90美元的家庭的周消费支出的期望值/平均值E(Y|X=140)=17+0.6*90=71美元 再求出i-只有求助于巫婆神汉了,科学,迷信,第二节 简单回归模型的估计:ols,总体回归函数的确定需要了解总体情况,而事实上总体是不可知的; 现实的情况只能是在一次观测中得到总体的一个样本(xi,yi),i=1,n 问题:能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似信息? 因此我们的任务:需要通过样本来估计总体 方法:最小二乘法ols,极大似然估计法等,一、ols的推导,我们的目标是使拟合出来的直线在某种意义上是最佳的,直观地看,也就是要求估计直线尽可能地靠近各观测点。 ols思想:找到一条直线,使得样本点到该直线的纵向距离和最小。为克服偏差距离正负相抵,并突出偏差较大的点的作用,应计算样本点到该直线的纵向距离的平方和,并使其最小。,数学推导,求解这一最小化问题,根据极小化的一阶条件:,可得到以下正规方程(Normal equation) :,解上述正规方程组得到估计值:,称为最小二乘估计量(OLS估计)。,二、样本回归函数,因此,ols是选择一条直线,使其残差平方和达到最小值的方法。,样本回归线,样本回归函数与总体回归函数,总体回归函数是固定然而未知的 样本回归函数是总体回归函数的一个样本估计,是从一组给定的数据样本中得来的。所以新的样本会产生新的不同的斜率和截距,即新的样本回归函数。,误差与残差,误差出现在总体回归模型中;误差是无法观测的 残差出现在样本回归模型中;残差可以从数据中计算出来,虚构的例子-教材P33,表2.4样本,利用ols得样本回归函数 表2.5样本,利用ols得样本回归函数,真实案例3-1,研究目的:为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 理论陈述:凯恩斯消费理论 模型设定:模型的被解释变量Y选定为“城市居民每人每年的平均消费支出”, “城市居民每人每年可支配收入”作为解释变量X 。 样本数据:2002年横截面数据,2002年样本数据的结果,观察变量分布,确定模型形式 估计参数,以2005年数据作为新样本,新的样本回归函数:,三、ols估计量的性质,高斯-马尔可夫定理:在五大假设条件满足的前提下,用ols估计出来的参数是最好的、线性的、无偏差的估计值(BLUE, The Best Linear Unbiased Estimator) 。 含义:用ols方法估计出来的样本回归线是非常“接近”总体回归线的,尽可能忠实地反映了总体回归线,在其满足五大假定的前提下。尽管总体回归线永远不得而知。,复习:第1、2、3章 预习:第5章,第4章 回归结果的统计检验,2学时,前一章的回归结果可信吗?,尽管在众多估计方法中,ols估计的样本回归线是BLUE,但这个最优的估计本身是否令人满意呢? 样本回归线是否很好的代表了样本点的信息? 回归方程整体上有意义吗?有可能出现所有自变量同时都不能解释因变量的情况吗? 各个自变量的系数是否有意义?,第四章 提纲,第一节 方程的方差分析ANOVA 一、总平方和TSS、解释平方和ESS、残差平方和RSS 二、拟合优度 第二节 回归方程的整体显著性检验:F检验 第三节 单个参数的统计意义检验:t检验 一、ols估计量的分布 二、t检验,第一节 方程的方差分析ANOVA,一、总平方和TSS、解释平方和ESS、残差平方和RSS,TSS=ESS+RSS(证明略) Y的样本值围绕其均值的总变异(total variation)可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS)。,二、拟合优度,1=ESS/TSS + RSS/TSS 拟合优度、判定系数 是解释变异与总变异之比,表示Y的样本变异被自变量X解释的部分。衡量了样本回归线与样本点之间的拟合程度。 R2越接近1,说明实际观测点离样本线越近,拟合优度越高。 实际值与拟合值的样本相关系数的平方。 1 0,不必太在意其大小。在社会科学中,过低是正常的。过低并不表示回归方程是没有用的。 仅在要利用回归方程做预测时,才要求较高的拟合优度。,案例3-1,本例中可决系数为0.935685,说明所建模型整体上对样本数据拟合较好,即解释变量“城市居民人均年可支配收入”对被解释变量“城市居民人均年消费支出”的绝大部分差异作出了解释。,第二节 回归方程的整体显著性检验:F检验,既然拟合优度不能用来判断,那么该用什么来判断回归方程是否有用? 1、假设检验 H0:回归方程无用(所有k个自变量都不能解释Y,参数都=0) H1:回归方程有用 2、 3、查找临界值:根据允许的误差(显著性水平),查找F 4、计算F值 5、若F F ,则否定原假设,说明方程整体是显著的; 若F F,则不能否定原假设。,F检验的p-value,一般计量经济软件都报告关于方程整体显著性的F检验的p-value(失误率),即否定原假设失误的概率。 若p-value 我们允许的显著性水平,则否定原假设,说明方程整体是显著的。,案例3-1,本例中F=421.9023,F检验的p-value=0.0000000,说明方程整体是显著的。,第三节 单个参数的统计意义检验,若方程通过F检验,只能说明有些自变量对因变量Y有解释作用,但具体哪些自变量有显著的解释力,而哪些又没有呢? 这就要看其参数(系数)是否有统计意义,是否显著的不等于0。 变量的显著性检验所应用的方法是数理统计学中的假设检验。 计量经济学中,主要是针对变量的参数真值是否为零来进行显著性检验的。,任务:利用ols估计量的分布来做假设检验。 原假设 H0:1=0 备择假设H1: 10,一、ols估计量的分布,1、期望值:在满足一系列假定的前提下,具无偏性,无偏性是ols估计量的统计性质,但并没有告诉我们从特定的样本中得到的估计值是什么。我们的希望是,如果得到的样本是“典型”的,那么我们的估计值就会“接近于”总体值。不幸的是,我们总有可能得到点估计远离总体值的不幸样本,而且我们永远也不可能确知情况是否如此。,了解预期的估计值是以总体值为中心而分布的,2、标准差:在满足一系列假定的前提下,,了解预期的估计值究竟距离总体值有多远,二、t检验,1、原假设 H0:1=0 备择假设 H1:10 2、 3、查找临界值:根据允许的误差(显著性水平),查找临界值t/2,n-2 4、由样本计算t值 5、 若|t| t/2 ,则拒绝原假设,说明1显著不等于0,对应的自变量对因变量有显著影响; 若|t| t/2,则不能否定原假设,说明1可能等于0,对应的自变量对因变量没有显著影响。,案例3-1,临界值 拒绝H0:1=0 。这表明,城市人均年可支配收入对人均年消费支出有显著影响。 不能拒绝H0: 0=0,t检验的p-value,一般计量经济软件都报告关于方程参数的总体值是否为0的t检验的p-value(失误率),即否定原假设失误的概率。 若p-value 我们允许的显著性水平,则否定原假设,说明参数显著不为0,对应的自变量对因变量有显著的解释作用。,思考题,如何检验原假设 H0:1=1 备择假设 H1:11 对于简单一元回归模型,F检验与t检验有何联系? 复习:第5章 预习:第6章,
展开阅读全文