计量经济学第二章

上传人:彧*** 文档编号:240748161 上传时间:2024-05-04 格式:PPT 页数:134 大小:6.11MB
返回 下载 相关 举报
计量经济学第二章_第1页
第1页 / 共134页
计量经济学第二章_第2页
第2页 / 共134页
计量经济学第二章_第3页
第3页 / 共134页
点击查看更多>>
资源描述
第二章简单线性回归模型引子引子:中国旅游业总收入将超过中国旅游业总收入将超过30003000亿美元吗亿美元吗?未来我国旅游需求将快速增长,根据中国政府所制定的远景目标,到未来我国旅游需求将快速增长,根据中国政府所制定的远景目标,到20202020年,中年,中国入境旅游人数将达到国入境旅游人数将达到2.12.1亿人次;国际旅游外汇收入亿人次;国际旅游外汇收入580580亿美元,国内旅游收入亿美元,国内旅游收入25002500亿美元。到亿美元。到20202020年,中国旅游业总收入将超过年,中国旅游业总收入将超过30003000亿美元,相当于国内生产亿美元,相当于国内生产总值的总值的8%8%至至11%11%。(来源:(来源:20082008年中国旅行社发展研究咨询报告年中国旅行社发展研究咨询报告)(参考现状:第一产业占(参考现状:第一产业占GDPGDP的的15%15%,建筑业占,建筑业占GDP GDP 的的7%7%)什么什么决定性因素能使中国决定性因素能使中国旅游业总收入超过旅游业总收入超过30003000亿美元亿美元?旅游业旅游业的发展与这种决定性因素的数量关系究竟是什么?的发展与这种决定性因素的数量关系究竟是什么?怎样怎样具体测定旅游业发展与这种决定性因素的数量关系具体测定旅游业发展与这种决定性因素的数量关系?2需要研究经济变量之间数量关系的需要研究经济变量之间数量关系的方法方法研究对象:研究对象:中国旅游业总收入中国旅游业总收入影响影响研究对象的主要因素:研究对象的主要因素:中国居民的收入水平中国居民的收入水平、入境旅游人数入境旅游人数等等相互关系:相互关系:旅游业总收入(旅游业总收入(Y Y)与与居民平均收入(居民平均收入(X1X1)或者或者入境旅游人数入境旅游人数(X2X2)有怎样的数量关系呢?有怎样的数量关系呢?思考:具体应该如何表现?思考:具体应该如何表现?为了不使问题复杂化为了不使问题复杂化,我们先在某些标准的我们先在某些标准的(古典的古典的)假定条件下,用最简单的模假定条件下,用最简单的模型,对最简单的变量间数量关系加以型,对最简单的变量间数量关系加以讨论。讨论。确定具体的数量关系:估计参数确定具体的数量关系:估计参数分析所得数量结论的可靠性:统计检验分析所得数量结论的可靠性:统计检验实际应用:经济分析和预测实际应用:经济分析和预测3本章主要讨论的问题:本章主要讨论的问题:回归分析与回归函数的基本概念回归分析与回归函数的基本概念线性回归模型参数的估计线性回归模型参数的估计回归方程拟合优度的度量回归方程拟合优度的度量回归系数的区间估计和假设检验回归系数的区间估计和假设检验回归模型预测回归模型预测4第一节回归分析与回归函数5一、一、相关分析与回归分析相关分析与回归分析 (对统计学的回顾对统计学的回顾)1 1、经济变量之间的相互、经济变量之间的相互关系关系v确定性的关系确定性的关系函数关系函数关系v不确定性不确定性的关系的关系相关相关关系关系v没有没有关系关系Y=f(X)Y=fY=f(X)+(X)+(为随机变量为随机变量)可用数学方法计算可用数学方法计算可用可用统计统计方法分析方法分析不用分析不用分析62 2、相关关系、相关关系相关关系的描述相关关系的描述散点图(坐标图、散布图)散点图(坐标图、散布图)函数关系相关关系(线性)相关关系(非线性)没有关系最直观的描述方式7相关关系的类型相关关系的类型从从涉及的变量数量看涉及的变量数量看 简单相关简单相关 多重相关多重相关(复相关)(复相关)从从变量相关关系的表现形式看变量相关关系的表现形式看 线性相关线性相关散布图接近一条直线散布图接近一条直线 非线性非线性相关相关散布图接近一条曲线散布图接近一条曲线8相关关系的类型相关关系的类型从从变量相关关系变化的方向变量相关关系变化的方向看看正相关正相关变量同方向变化,同增同减变量同方向变化,同增同减 负相关负相关变量反方向变化,一增一减变量反方向变化,一增一减 不相关不相关从从变量的相关程度变量的相关程度看看 完全完全相关相关 不完全相关不完全相关 不相关不相关93 3、相关程度的度量、相关程度的度量相关系数相关系数10从总体中随机抽取一定数量的样本,计算样本相关系数11样本样本相关系数:相关系数:相关系数较为简单,也可以在一定程度上测定变量间的数量关系,但是对于具体研究变量间的数量规律性还有局限性。注意:样本相关系数是随抽样而变动的随机变量,统计显著性有待检验。12对对相关系数的正确理解和使用相关系数的正确理解和使用计计量量经经济济学学关关心心的的问问题题:是经济变量间的因果关系以及隐藏在随机性后面的具体统计规律性。回归分析方法回归分析方法13回归的古典意义古典意义:高尔顿遗传学的回归概念高尔顿遗传学的回归概念 (父母身高与子女身高的关系父母身高与子女身高的关系)子女的身高有向人的平均身高子女的身高有向人的平均身高 回归回归 的的趋势趋势160165170175180185140 150 160 170 180 190 200子女身高父母身高4 4、回归分析、回归分析14回归的现代现代意义意义:回归是关于因变量(Y)对另一个或多个自变量(X)的依存关系的研究;用适当的数学模型去表达和估计变量之间的平均变化关系;回归的目的是要根据自变量的数值去估计因变量的总体平均值。回归(Regression)是计量经济学的主要工具。15例子:姚明身高例子:姚明身高2.26米,姚明的子女会有多高呢?米,姚明的子女会有多高呢?160165170175180185140 150 160 170 180 190 200子女身高子女身高父母身高父母身高226散点图散点图(scatterdiagram)2.01米米 可信吗?可信吗?因此,一旦知道了父母的身高,就可以按照上述关系式(回归线)因此,一旦知道了父母的身高,就可以按照上述关系式(回归线)来预测子女的来预测子女的平均身高平均身高(而不是具体身高)。(而不是具体身高)。1617概念概念YX18x Y19每每月月家家庭庭可可支支配配收收入入X2000250030003500400045005000550060006500131215301631184320372277246929243515352113401619172619742210238828893338372139541400171317862006232525263090365038654108每每1548175018352265241926813156380240264345月月1688181418852367252228873300408741654812家家173819851943248526653050332142984380庭庭180020412037251527993189365443124580消消19022186207826892887335338424413费费220021792713291335344074支支231222982898303837104165出出2316292331673834Y Y238730533310249831873510268932861591191520922586275430393396385340364148举例:假如已知由100个家庭构成的总体的数据 (单位:元)二、总体回归函数(二、总体回归函数(PRFPRF)E(Y|)20家庭消费支出的条件期望与家庭收入的关系的图形 1 1.总体总体回归函数的概念回归函数的概念 212 2.总体总体回归函数回归函数的表现形式的表现形式PRF223.3.如何理解总体如何理解总体回归函数回归函数v作作为为总总体体运运行行的的客客观观规规律律,总总体体回回归归函函数数是是客客观观存存在在的的,但但在在实实际际的的经经济济研研究究中中总总体体回回归归函函数数通通常常是是未未知知的的,只只能能根根据据经经济济理理论论和和实实践践经经验验去去设设定定。计计量量经经济济学学研研究究中中“计计量量”的的根根本本目目的的就就是是要要寻寻求求总总体体回回归函数。归函数。v我们所设定的计量模型实际就是在设定总体回归函数的具体形式。我们所设定的计量模型实际就是在设定总体回归函数的具体形式。v总体回归函数中总体回归函数中 Y Y 与与 X X 的关系可以是的关系可以是线性线性的,也可以是的,也可以是非线性非线性的的。23“线性”的判断计量经济学中,线性回归模型的“线性”有两种解释:就变量而言是线性的Y的条件期望(均值)是X的线性函数;就参数而言是线性的Y的条件期望(均值)是参数的线性函数。例如:对变量、参数均为“线性”对变量“非线性”,对参数“线性”对变量“线性”,对参数“非线性”注意:在计量经济学中,线性回归模型主要指就参数而言是“线性”的,因为只要对参数而言是线性的,都可以用类似的方法去估计其参数,都可以归于线性回归。2425q是是未知影响因素未知影响因素的代表的代表(理论的模糊性理论的模糊性)q是是无法取得数据无法取得数据的已知影响因素的代表的已知影响因素的代表(数据欠缺数据欠缺)q是是众多细小影响因素众多细小影响因素的综合代表的综合代表(非系统性影响非系统性影响)q模型模型可能存在可能存在设定误差设定误差(变量、函数形式的设定)变量、函数形式的设定)q模型模型中变量可能存在中变量可能存在观测误差观测误差(变量数据不符合实际变量数据不符合实际)q变量变量可能有内在可能有内在随机性随机性(人类经济行为的内在随机性人类经济行为的内在随机性)26四、样本回归函数(四、样本回归函数(SRFSRF)27XYSRF样本回归函数样本回归函数的函数形式的函数形式28样本回归函数的样本回归函数的特点特点q样样本本回回归归线线不不唯唯一一:SRFSRF随随抽抽样样波波动动而而变变化化,每每次次抽抽样样都都能能获获得得一一个个样样本本,就就可可以以拟合一条样本拟合一条样本回归线。回归线。q样样本本回回归归函函数数的的函函数数形形式式应应与与设设定定的的总总体体回归函数回归函数的函数的函数形式一致形式一致。q样样本本回回归归线线只只是是样样本本条条件件均均值值的的轨轨迹迹,还还不不是是总总体体回回归归线线,它它至至多多只只是是未未知知的的总总体体回归线的近似表现回归线的近似表现。29SRF1SRF2YX样本回归函数与总体回归函数的关系样本回归函数与总体回归函数的关系30SRFPRFX对样本回归的理解对样本回归的理解31总体回归函数样本回归函数回归分析的回归分析的目的目的32第二节简单线性回归模型的最小二乘估计33 一、简单线性回归的基本假定一、简单线性回归的基本假定341.1.对模型和变量的假定对模型和变量的假定3536373839二、普通最小二乘法(二、普通最小二乘法(OLSOLS)(Ordinary Ordinary Least Least SquaresSquares)402.2.正规方程和估计正规方程和估计式式用克莱姆法则求解得以观测值表现的OLS估计式41取偏导数并令其为0,可得正规方程或整理得即用离差表现的用离差表现的OLSOLS估计估计式式42 3.3.OLSOLS回归线的数学性质回归线的数学性质(见教材(见教材P33-P34P33-P34,证明过程用到,证明过程用到OLSOLS正规方程的结论,但与基本假定无关正规方程的结论,但与基本假定无关)43444.OLS4.OLS估计式的统计性质估计式的统计性质回顾第回顾第1 1章:参数估计式的优劣需要有评价的标准章:参数估计式的优劣需要有评价的标准 参数参数无法通过观测直接确定,只能通过样本估计,但无法通过观测直接确定,只能通过样本估计,但因存在因存在抽样波动抽样波动,参参数估计值不一定等于总体参数的真实值。数估计值不一定等于总体参数的真实值。参数估计参数估计方法及所确定的估计式不一定完备,方法及所确定的估计式不一定完备,不一定能不一定能得到总体参数的真得到总体参数的真实值,需要对估计方法作评价与选择。实值,需要对估计方法作评价与选择。比较不同估计方法的估计结果时,需要有一定的评价标准比较不同估计方法的估计结果时,需要有一定的评价标准 基本要求:基本要求:参数估计值应尽可能地接近总体参数的真实值参数估计值应尽可能地接近总体参数的真实值估计准则:估计准则:“尽可能地接近尽可能地接近”原则原则决定于参数估计式的统计性质:无偏性、有效性、一致性等。决定于参数估计式的统计性质:无偏性、有效性、一致性等。45(1)(1)无偏性无偏性4647 概 率 密 度 估计值 偏倚图2(2)(2)有效性有效性前提:样本相同、用不同的方法估计参数,可以找到若干个不同的无偏估计式。目标:努力寻求其抽样分布具有最小方差的估计式。(见图3)既是无偏的同时又具有最小方差特性的估计式,称为最佳(有效)估计式。4849概率密度图 3估计值(3)3)渐近性质(大样本性质)渐近性质(大样本性质)5051概率密度估计值图 452OLSOLS估计式的统计性质估计式的统计性质高斯定理高斯定理5354OLSOLS估计量的精度(标准误差)估计量的精度(标准误差)vOLS估计量是样本数据的函数,若样本改变,则估计量也会改变,估计量是样本数据的函数,若样本改变,则估计量也会改变,一个直观的想法是,若估计量随样本改变而变化的程度很低,即其标一个直观的想法是,若估计量随样本改变而变化的程度很低,即其标准误差(准误差(standarderror)很小,则说明该估计量)很小,则说明该估计量“很可靠很可靠”,或其,或其精度高精度高“重方法重方法”。v根据根据CLRM的假设,可以计算的假设,可以计算OLS估计量的标准误:估计量的标准误:自由度55第三节拟合优度的度量56拟合优度概念拟合优度概念样本回归线是对样本数据的一种拟合。q不同的模型(不同函数形式)可拟合出不同的回归线q相同的模型用不同方法估计参数,可以拟合出不同的回归线57拟合的回归线与样本观测值总是有偏离。样本回归线对样本观测数据拟合的优劣程度称为拟合优度。如何度量拟合优度呢?拟合优度的度量建立在对Y的总变差分解的基础上。一、总变差的分解一、总变差的分解58YX59变差分解的图示变差分解的图示(以某一个观测值为例以某一个观测值为例)二、可决系数二、可决系数60可决系数的作用可决系数的作用61一个直观感受一个直观感受巴伦坦图(巴伦坦图(BallentineBallentine)YXYXYXY=X62可决系数与相关系数可决系数与相关系数的的联系联系63可决系数与相关系数的区别可决系数与相关系数的区别可决系数相关系数就模型而言就两个变量而言说明解释变量对被解释变量的解释程度说明两变量线性依存程度度量的不对称的因果关系度量的对称的相关关系64运用可决系数时应注意:运用可决系数时应注意:q可决系数只是说明列入模型的所有解释变量对被解释变量的联合的影响程度,不说明模型中每个解释变量的影响程度(在多元中)q如果回归的主要目的是经济结构分析,不能只追求高的可决系数,而是要得到总体回归系数可信的估计量。可决系数高并不一定每个回归系数都可信任。q如果研究的主要目的只是为了预测被解释变量的值,不是为了正确估计回归系数,一般可考虑有较高的可决系数。65回顾:常用的统计分布回顾:常用的统计分布66回顾:常用的统计分布回顾:常用的统计分布67回顾:常用的统计分布回顾:常用的统计分布68回顾:常用的统计分布回顾:常用的统计分布69回顾:常用的统计分布回顾:常用的统计分布70回顾:常用的统计分布回顾:常用的统计分布各种分布的图形和分位数71回顾:常用的统计分布回顾:常用的统计分布各种分布的图形和分位数72回顾:常用的统计分布回顾:常用的统计分布73回顾:常用的统计分布回顾:常用的统计分布74第四节回归系数的区间估计和假设检验7576一、一、OLSOLS估计的分布性质估计的分布性质77线性特征78 79 80 分布函数分布函数8182 二二、回归系数的区间估计、回归系数的区间估计83怎样正确理解置信区间怎样正确理解置信区间?8485样本容量充分大样本容量较小Z将接近标准正态分布服从t分布三种情况标准正态分布868788年份19951996199719981999200020012002200320042005Y14.414.414.414.717.016.318.018.518.219.317.1X847.3821.0884.2903.7984.11035.31200.91289.81432.91539.01633.6899091三、回归系数的假设检验三、回归系数的假设检验92统计量 t0(大概率事件)(小概率事件)1.1.假设检验的基本思想假设检验的基本思想q在某种条件下,在一次抽样中,大概率事件出现被认为是合理的,而小概率事件被认为基本不会发生,如果小概率事件竟然发生了,认为是不合理的。q在事先作出的某种原假设成立的条件下,利用样本构造适当统计量(一次抽样的结果),并确定统计量的抽样分布。给定显著性水平,构造一个小概率事件。如果在一次抽样中该小概率事件竟然发生,就认为原假设不真实,从而拒绝原假设,不拒绝备择假设。反之,如果大概率事件发生,则不拒绝原假设。93双侧检验与双侧检验与单侧检验单侧检验94(c)单侧检验(右侧)(b)单侧检验(左侧)a临界值0拒绝域a 0 临界值拒绝域a/2临界值0 临界值拒绝域a/2拒绝域(a)双侧检验2.2.回归系数的检验方法回归系数的检验方法9596用用 P P 值判断参数的显著性值判断参数的显著性 P值统计量 t97用用p p值值判断参数显著性的方法判断参数显著性的方法9899100假设检验假设检验101第五节回归模型预测102经过模型的估计、检验,得到一系列重要的数据,为了简明、清晰、规范地表述这些数据,计量经济学通常采用以下规范化的方式:例如:回归结果为103 一、回归分析结果的报告一、回归分析结果的报告=24.4545+(6.4138)(0.0357)标准误差SEt=(3.8128)(14.2605)t统计量df=8可决系数和自由度F=202.87DW=2.3F统计量 DW统计量 二、被解释变量平均值预测二、被解释变量平均值预测1.1.基本思想基本思想经估计的计量经济模型可用于:经济结构分析、经济预测、政策评价、验正理论。q运用计量经济模型作预测:指利用所估计的样本回归函数作预测工具,用解释变量的已知值或预先测定的值,对预测期或样本以外的被解释变量的数值作出定量的估计。q计量经济预测是一种条件预测:检验回归模型可靠模型设定的关系式不变,并且所估计的参数不变解释变量在预测期的取值已作出预测 104预测的类型预测的类型q对被解释变量Y的预测分为:平均值平均值预测预测和个别值个别值预测预测q对被解释变量Y的预测又分为:点点预测预测和区间预测区间预测平均值预测个别值预测区间预测点预测区间预测105预测值、平均值、个别值的相互预测值、平均值、个别值的相互关系关系106点预测值真实平均值个别值YX2.Y2.Y平均值的点预测平均值的点预测1073.Y3.Y平均值的区间预测平均值的区间预测108109构建平均值的预测区间构建平均值的预测区间110三、被解释变量个别值预测三、被解释变量个别值预测111112构建个别值的预测区间构建个别值的预测区间113被解释变量被解释变量Y Y区间预测的特点区间预测的特点114被解释变量被解释变量Y Y区间预测的特点区间预测的特点(续续)115各种预测值的关系各种预测值的关系116SRFY个别值的预测区间Y平均值的预测区间第六节案例分析117案例案例1:1:中国各地区城市居民人均年消费中国各地区城市居民人均年消费支出和支出和可支可支配收入关系的分析配收入关系的分析(截面数据截面数据)118提出问题:改革开放以来随着中国经济的快速发展,居民的消费水平也不断增长。但全国各地区经济发展速度不同,居民消费水平也有明显差异。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。研究范围:全国各省市2002年城市居民家庭平均每人每年消费截面数据模型。119数据:从2002年中国统计年鉴中得到120地 区城市居民家庭平均每人每年消费支出(元)Y城市居民人均年可支配收入(元)X北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南湖北10284.607191.965069.284710.964859.885342.644973.884462.0810464.006042.608713.084736.526631.684549.325596.324504.685608.9212463.929337.566679.685234.356051.066524.526260.166100.5613249.808177.6411715.606032.409189.366334.647614.366245.406788.52(接上页数据表)121地 区城市居民家庭平均每人每年消费支出(元)Y城市居民人均年可支配收入(元)X湖南广东广西海南重庆四川贵州云南西藏陕西甘肃青海宁夏新疆5574.728988.485413.445459.646360.245413.084598.285827.926952.445278.045064.245042.526104.925636.406958.5611137.207315.326822.727238.046610.805944.087240.568079.126330.846151.446170.526067.446899.641222005年中国各地区城市居民人均年消费支出和可支配收入 地 区城市居民家庭平均每人每年消费支出(元)Y城市居民人均年可支配收入(元)X北 京13244.2 17653 天 津9653.2612638.6 河 北6699.679107.09 山 西6342.638913.91 内蒙古6928.69136.79 辽 宁7369.279107.55 吉 林6794.718690.62 黑龙江6178.018272.51 上 海13773.4118645 江 苏8621.8212318.6 浙 江12253.7416293.8 安 徽6367.678470.68 福 建8794.4112321.3 江 西6109.398619.66 山 东7457.3110744.8123 河 南6038.028667.97湖 北6736.568785.94 湖 南7504.999523.97 广 东11809.8714769.9 广 西7032.89286.7 海 南5928.798123.94 重 庆8623.2910243.5 四 川6891.278385.96 贵 州6159.298151.13 云 南6996.99265.9 西 藏8617.119431.18 陕 西6656.468272.02 甘 肃6529.28086.82 青 海6245.268057.85 宁 夏6404.318093.64 新 疆6207.527990.15数据来源:2006年中国统计年鉴估计估计参数参数124假定模型中随机扰动满足基本假定,可用OLS法。具体操作:使用EViews软件,估计结果是:Dependent Variable:YMethod:Least SquaresDate:07/18/07 Time:23:07Sample:1 31Included observations:31VariableCoefficientStd.Errort-StatisticProb.C346.0514305.77701.1317120.2670X0.7284520.02885825.242210.0000R-squared0.956468 Mean dependent var7773.217Adjusted R-squared0.954966 S.D.dependent var2183.308S.E.of regression463.3225 Akaike info criterion15.17706Sum squared resid6225364.Schwarz criterion15.26958Log likelihood-233.2445 F-statistic637.1691Durbin-Watson stat1.372730 Prob(F-statistic)0.000000表示为:125=346.0514+(305.777)(0.028858)t=(1.131712)(25.24221)n=31F=637.1691DW=1.37模型模型检验检验126 经济预测经济预测127128129第二章 小结130“简单线性回归模型简单线性回归模型”讲课小结讲课小结1.变量间的关系分为函数关系与相关关系。相关系数是对变量间线性相关程度的度量。2.现代意义的回归是一个被解释变量对若干个解释变量依存关系的研究,回归的实质是由固定的解释变量去估计被解释变量的平均值。3.总体回归函数(PRF)是将总体被解释变量Y的条件均值表现为解释变量X的某种函数。样本回归函数(SRF)是将被解释变量Y的样本条件均值表示为解释变量X的某种函数。总体回归函数与样本回归函数的区别与联系。1314.随机扰动项是被解释变量实际值与条件均值的偏差,代表排除在模型以外的所有因素对Y的影响。5.简单线性回归的基本假定:对模型和变量的假定、对随机扰动项u的假定(零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定)6.普通最小二乘法(OLS)估计参数的基本思想及估计式;OLS 估计式的分布性质及期望、方差和标准误差;OLS估计式是最佳线性无偏估计式。1327.对回归系数区间估计的思想和方法。8.拟合优度是样本回归线对样本观测数据拟合的优劣程度,可决系数是在总变差分解基础上确定的。可决系数的计算方法、特点与作用。9.对回归系数假设检验的基本思想。对回归系数t检验的思想与方法;用P值判断参数的显著性。10.被解释变量平均值预测与个别值预测的关系,被解释变量平均值的点预测和区间预测的方法,被解释变量个别值区间预测的方法。11.运用EViews软件实现对简单线性回归模型的估计和检验。133第二章 THE END!134
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 活动策划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!