第8章-虚拟变量回归

上传人:妈**** 文档编号:242967450 上传时间:2024-09-13 格式:PPT 页数:70 大小:1.74MB
返回 下载 相关 举报
第8章-虚拟变量回归_第1页
第1页 / 共70页
第8章-虚拟变量回归_第2页
第2页 / 共70页
第8章-虚拟变量回归_第3页
第3页 / 共70页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,金融计量学,2,第八章,虚拟变量回归,金融计量学,引子,:,定性因素对房地产价格有显著影响吗,不断走高的房地产价格已经成为人们关注的重点。很多研究认为,影响商品房价格的因素有多个方面,。,有关研究表明,1,,影响商品房价格的因素可分为两类:一类是,比较容易量化的定量因素,。,例如:成本费用因素,、,房地产供求因素,、,经济因素,、,人口因素等,。,另一类则是,不易量化的定性因素。,例如:,社会因素,、,区域因素,、,个别因素,、,房地产投机因素,、,自然因素等。,这些因素的基本特征则是,不易量化的定性因素。,3,1.,徐静,;,武乐杰,房地产价格影响因素的解释结构模型分析,金融经济, 2009,年,10,期,显然,,在研究房地产价格影响机理时,需要分析那些不易量化的定性因素对房地产价格是否真的有显著影响。,能否把定性的因素也引入计量经济模型中呢,?,怎样才能在模型中有效地表示这些定性因素的作用呢?,4,5,问题的一般性描述,在前面各章的分析中,被解释变量主要是受可以直接度量的定量因素的影响,如收入、产出、商品需求量、价格、成本、资金、人数等。但现实经济生活中,影响被解释变量变动的因素,除了可以直接观测数据的定量变量外,可能还包括一些本质上为定性因素的影响,例如性别、种族、职业、季节、文化程度、战争、自然灾害、政府经济政策的变动等。,在实际的经济分析中,这些定性因素有时具有不可忽视的重要作用。例如,研究居民收入水平时,职业、性别、文化程度、就业的地域等因素,通常是值得考虑的影响因素。,因此,在计量经济学的建模中,有必要,将定量因素和定性因素同时纳入,回归,模型之内。,6,本章要研究的主要问题是:,1.,如何将作为解释变量的定性因素引入回归模型?,2.,这些定性解释变量在回归模型中有何特殊的作用?,7,8,第八章 虚拟变量回归,本章主要讨论,:,虚拟变量,虚拟解释变量的回归,虚拟被解释变量的回归,(,选讲,不包括,),9,第一节 虚拟变量,本节基本内容,:,基本概念,虚拟变量设置规则,10,一、基本概念,定量因素:可直接测度、数值性的因素。,定性因素:属性因素,表征某种属性存在与否的,非数值性的因素。,基本思想:,直接在回归模型中加入定性因素存在诸多的困难,(那些困难?),是否可将这些定性因素进行量,化,以达到定性因素能与定量因素有着相同作用,之目的。,11,计量经济学中,将取值为,0,和,1,的人工变量称为虚拟变量。虚拟变量也称:哑元变量、定性变量等等。通常用字母,D,或,DUM,加以表示(英文中虚拟或者哑元,Dummy,的缩写)。,对定性变量的量化可采用虚拟变量的方式实现。,虚拟变量的定义,12,虚拟变量的设置规则涉及三个方面,:,1.“0”,和“,1”,选取原则,2.,属性(状态、水平)因素与设置虚拟变量,数量的关系,3.,虚拟变量在回归分析中的角色以及作用等,方面的问题,二、,虚拟变量,设置规则,13,“,0,”,和,“,1,”,选取原则,虚拟变量取“,1”,或“,0”,的原则,应从分析问题的目的出发予以界定。,从理论上讲,虚拟变量取“,0”,值通常代表比较的基础类型;而虚拟变量取“,1”,值通常代表被比较的类型。,“,0”,代表基期(比较的基础,参照物);,“,1”,代表报告期(被比较的效应)。,14,例如,比较收入时考察性别的作用。当研究男性收入是否高于女性时,是将女性作为比较的基础(参照物),故有男性为“,1”,,女性为“,0”,。,例,1,问题,:,为何只选,0,、,1,,选,2,、,3,、,4,行吗?为什么?,15,定性因素的属性既可能为两种状态,也可能为多种状态。例如,性别(男、女两种)、季节(,4,种状态),地理位置(东、中、西部),行业归属,所有制,收入的分组等。,属性的状态(水平)数与虚拟变量数量的关系,16,1,.,若定性因素具有,个 相互排斥属性,(,或几个水平,),,当回归模型有截距项时,只能引入,个虚拟变量;,2.,当回归模型无截距项时,则可引入 个虚拟变量;否则,就会陷入“虚拟变量陷阱”。,(为什么?),虚拟变量数量的设置规则,17,研究居民住房消费支出 和居民可支配收入 之间的,数量关系。回归模型的设定为:,现在要考虑城镇居民和农村居民之间的差异,如何办?,为了对 “城镇居民”、“农村居民”进行区分,分析,各自在住房消费支出 上的差异,设 为城镇,;,为农村,则模型为,(,模型有截距,“居民属性”定性变量只有两个相互排斥,的属性状态( ),故只设定一个虚拟变量。,),一个例子,(,虚拟变量陷阱,),18,若对两个相互排斥的属性 “居民属性” ,仍然,引入 个虚拟变量,则有,则模型(,1,)为,则对任一家庭都有: ,,即产生完全共线,陷入了“虚拟变量陷阱”。,“虚拟变量陷阱”的实质是:,完全多重共线性,。,综上可知:,1.,引入虚拟变量的个数与两个因素有关;一是定性变量的属性多少,一是有无截距项;,2.,对虚拟变量的运用要谨慎,虚拟变量的使用得当常能发挥积极的作用,但在模型中引入虚拟变量的数量要适当,引入的虚拟变量的数量过度,则可能带来负面的影响。,19,20,虚拟变量既可作为被解释变量,也可作为解释,变量,分别称其为虚拟被解释变量和虚拟解释变量。,虚拟被解释变量的研究是当前计量经济学研究的,前沿领域,如,MacFadden,、,Heckmen,等人的微观计,量经济学研究,大量涉及到虚拟被解释变量的分析。,本课程只是讨论虚拟解释变量的问题,虚拟变量在回归模型中的角色,21,第二节 虚拟解释变量的回归,本节基本内容,:,加法类型,乘法类型,虚拟解释变量综合应用,22,在计量经济学中,通常引入虚拟变量的方式分为,加法方式和乘法方式两种:即,对上式可,分解为:,实质,:,加法方式引入虚拟变量改变的是截距;,乘法方式引入虚拟变量改变的是斜率。,23,以加法方式引入虚拟变量时,主要考虑的问,题是定性因素的属性和引入虚拟变量的个数。,分为四种情形讨论:,(,1,)解释变量只有一个定性变量而无定量变量,而且定性变量为两种相互排斥的属性;,(,2,)解释变量分别为一个定性变量(两种属性)和一个定量解释变量;,一、加法类型,24,(,3,)解释变量分别为一个定性变量(两种以上属性)和一个定量解释变量;,(,4,)解释变量分别为两个定性变量(各自分别是两种属性)和一个定量解释变量;,思考:,四种加法方式引入虚拟变量会产生什么效应?,25,(,1,)一个两种属性定性解释变量而无定量变量的情形,农村,26,(,2),一个定性解释变量(两种属性)和一个定量解释变量的情形,城市,农村,27,共同的特征:截距发生改变(?),28,(,3,)一个定性解释变量(两种以上属性)和一个定量解释变量的情形,29,30,(,4,)两个定性解释变量(均为两种属性)和一个定量解释变量的情形,31,夏季、农村居民,冬季、农村居民,32,上述图形的前提条件是什么?,33,运用,OLS,得到回归结果,再用,t,检验讨论因素,是否对模型有影响。,加法方式引入虚拟变量的一般表达式,:,基本分析方法,:,条件期望。,34,加法方式引入虚拟变量的主要作用为:,1.,在有定量解释变量的情形下,主要改变方程,截距;,2.,在没有定量解释变量的情形下,主要用于方,差分析。,35,基本思想,以乘法方式引入虚拟变量时,是在所设立的模型中,将虚拟,解释变量与其它解释变量的乘积,作为新的解释变量出现在,模型中,以达到其调整设定模型斜率系数的目的。或者将模,型斜率系数表示为虚拟变量的函数,以达到相同的目的。,乘法引入方式,:,(,1,)截距不变;,(,2,)截距和斜率均发生变化;,分析手段:,仍然是条件期望。,二、乘法类型,36,模型形式:,例:研究消费支出 受收入 、年份状况 的影响,(,1,)截距不变的情形,37,(,2,)截距和斜率均发生变化,例,同样研究消费支出,、,收入 、年份状况 间的影,响关系。,模型形式:,38,不同截距、斜率的组合图形,重合回归:截距斜率均相同,平行回归:截距不同斜率相同,共点回归:截距相同斜率不同,交叉(不同)回归:截距斜率均不同,39,三、虚拟解释变量综合应用,所谓综合应用是指将引入虚拟解释变量的加法方,式、乘法方式进行综合使用。,基本分析方式仍然是条件期望分析。,本节主要讨论,(,1,)结构变化分析;,(,2,)交互效应分析;,(,3,)分段回归分析,40,(,1,)结构变化分析,结构变化的实质是检验所设定的模型在样本期内是否为同一模型。显然,平行回归、共点回归、不同的回归三个模型均不是同一模型。,平行回归模型的假定是斜率保持不变(加法类型,包括方差分析);,共点回归模型的假定是截距保持不变(乘法类型,又被称为协方差分析);,不同的回归的模型的假定是截距、斜率均为变动的(加法、乘法类型的组合)。,41,例:比较改革开放前、后我国居民(平均)“储,蓄,收入”总量关系是否发生了变化?,模型的设定形式为 :,42,显然,只要 、 不同时为零,上述模型就能刻画改革开放前后我国居民储蓄收入模型结构是否发生变化。,回归方程:,43,问题:,1.,本例中,平行、共点回归、不同的回归三模型的经济学背景解释是什么?,2.,如何进行结构变化判断?,3.,是否可对,(2),、,(3),分别进行,OLS,估计?为什么?,4.,若分别对,(2),、,(3),进行,OLS,估计应注意什么?,44,(,2,)交互效应分析,交互作用,:,一个解释变量的边际效应有时可能要依赖于另一个解释变量。为此,,Klein,和,Morgen,(1951),提出了有关收入和财产在决定消费模式上相互作用的假设。他们认为消费的边际倾向不仅依赖于收入,而且也依赖于财产的多少,较富有的人可能会有不同的消费倾向。,45,为了捕获该影响,设 。假设边际消费倾向,依赖于财产 。一个简单的表示方法就是 。代入消费函数,有:,由于 捕获了收入和财产之间的相互作用而被称为交互作用项。,显然,刻画交互作用的方法,在变量为数量,(,定量,),变量时, 是以乘法方式引入虚拟变量的。,46,例,:,是否发展油菜籽生产与是否发展养蜂生产的差异对农副产品总收益的影响研究。,模型设定为,:,(,1,)式中,以加法形式引入虚拟变量暗含何假设,?,47,(,1,)式以加法形式引入,暗含的假设为:,菜籽生产和养蜂生产是分别独立地影响农副品生产,总收益。但是,在发展油菜籽生产时,同时也发展,养蜂生产,所取得的农副产品生产总收益,可能会,高于不发展养蜂生产的情况。即在是否发展油菜籽,生产与养蜂生产的虚拟变量 和 间,很可能,存在着一定的交互作用,且这种交互影响对被解释,变量农副产品生产收益会有影响。,48,问题:,如何刻画同时发展油菜籽生产和养蜂生产的交互作用?,基本思想,:,在模型中引入相关的两个变量的乘积。,区别之处,在于,上页定义中的交互效应是针对数量变量,而现在是定性变量,又应当如何处理,?,49,为了反映,交互效应,,将(,1,)变为:,同时发展油菜籽和,养蜂生产:,发展油菜籽生产:,发展养蜂生产:,基础类型:,50,如何检验交互效应是否存在?,若拒绝原假设,即交互效应对 产生了影响(应该引入模型)。,51,作用,:,提高模型的描述精度。,虚拟变量也可以用来代表数量因素的不同阶段。,分段线性回归就是类似情形中常见的一种。,一个例子,:,研究不同时段我国居民的消费行为。,实际数据表明,,,1979,年以前,我国居民的消费支,出 呈缓慢上升的趋势;从,1979,年开始,居民消,费支出为快速上升趋势。,如何刻画我国居民在不同时段的消费行为?,(,3,),分段回归分析,52,基本思路:,采用乘法方式引入虚拟变量的手段。显然,,1979,年是一个转折点,可考虑在这个转折点作为虚拟变量设定的依据。若设 ,1979,,当 时可引入虚拟变量。(为什么选择,1979,作为转折点?),53,(,t,1955,,,1956,,,,,2004),依据上述思路,有如下描述我国居民在不同时段消费行为模型:,居民消费趋势方程:,54,1979,年之前,回归模型的斜率为 ;,1979,年之前,回归模型的斜率为,;,若统计检验表明, 显著不为零,则我国居民的消费行为在,1979,年前后发生了明显改变。,分析,55,第三节 案例分析,为了考察改革开放以来中国居民的储蓄存款与收入的关系是否已发生变化,以城乡居民人民币储蓄存款年底余额代表居民储蓄( ),以国民总收入,GNI,代表城乡居民收入,分析居民收入对储蓄存款影响的数量关系,并建立相应的计量经济学模型 。,56,表,8.1,国民总收入与居民储蓄存款 单位:亿元,数据来源:,根据中国统计年鉴和中经网统计数据库数据整理。,年 份,国民总收入,(,GNI),城乡居民人民币储蓄存款年底余额(,Y),城乡居民人民币储蓄存款增加额(,YY),年,份,国民总收入,(,GNI),城乡居民人民币储蓄存款年底余额,(,Y),城乡居民人民币储蓄存款增加额(,YY),1978,3645.2,210.6,NA,1995,59810.5,29662.3,8143.5,1979,4062.6,281.0,70.4,1996,70142.5,38520.8,8858.5,1980,4545.6,399.5,118.5,1997,78060.8,46279.8,7759.0,1981,4889.5,532.7,124.2,1998,83024.3,53407.5,7615.4,1982,5330.5,675.4,151.7,1999,88479.2,59621.8,6253.0,1983,5985.6,892.5,217.1,2000,98000.5,64332.4,4976.7,1984,7243.8,1214.7,322.2,2001,108068.2,73762.4,9457.6,1985,9040.7,1622.6,407.9,2002,119095.7,86910.6,13233.2,1986,10274.4,2237.6,615.0,2003,135174.0,103617.3,16631.6,1987,12050.6,3073.3,835.7,2004,159586.7,119555.4,15929.4,1988,15036.8,3801.5,728.2,2005,184088.6,141051.0,21496.8,1989,17000.9,5196.4,1374.2,2006,213131.7,161587.3,20544.0,1990,18718.3,7119.8,1923.4,2007,251483.2,172534.2,10967.1,1991,21826.2,9241.6,2121.8,2008,302853.4,217885.4,45353,1992,26937.3,11759.4,2517.8,2009,340320,260771.3,42885.9,1993,35260.0,15203.5,3444.1,2010,399759.5,303302.5,42417.1,1994,48108.5,21518.8,6315.3,2011,472115,343635.9,40333.4,57,为了研究,1978,2011,年期间城乡居民储蓄存款随收入的变化规律是否有变化,考证城乡居民储蓄存款、国民总收入随时间的变化情况,如图所示:,58,从,上,图中,尚无法得到居民的储蓄行为发生明显改变的详尽信息。若取居民储蓄的增量(,YY,),并作时序图,如下,。从图,中,可以看出,城乡居民的储蓄行为表现出了明显的阶段特征:在,1996,年、,2000,年、,2005,年、,2007,年和,2009,年有五个明显的转折点。,59,再从城乡居民储蓄存款增量与国民总收入之间关系的散布图看(,下,图),也呈现出了相同的阶段性特征。,为了分析居民储蓄行为在,1996,年,2011,年不同时期的数量关系,以,1996,、,2000,、,2005,、,2007,、,2009,年度的五个转折点作为依据,分别引入虚拟变量,D,1,、,D,2,、,D,3,、,D,4,、,D,5,,这五个年度所对应的,GNI,分别为,70142.5,,,98000.5,,,184088.6,,,251483.2,和,340320,亿元。据此,我们设定了如下以加法和乘法两种方式同时引入虚拟变量的的模型:,60,61,对上式进行回归后,有:,62,R,2,=0.975981,F=176.0794 DW=2.8659,由于,各虚拟变量前,的参数估计量的,t,值均大于临界值,,表明各解释变量的斜率系数在显著性水平,或,下显著地不等于,0,。于是,,居民人民币储蓄存款年增加额的回归模型分别为:,63,64,表明六个时期居民储蓄增加额的回归方程在统计意义上确实有很大不同。,1996,年以前国民总收入每增加,1,亿元,平均说来居民储蓄存款的增加额为,0.1327,亿元,居民储蓄增加额随国民总收入增长的变动相对稳定。,1996,年以后随着国民总收入的增长居民储蓄存款的增加额在不同年份有增有减,呈现出明显的周期性变化。上述模型同城乡居民储蓄存款与国民总收入之间的散布图吻合,与这一时段中国的实际经济运行状况也是相符的,。,65,需要指出的是,在上述建模过程中,主要是从教学的目的出发,说明运用虚拟变量的规则和方法,没有考虑通货膨胀等因素,也没有考虑时间序列数据的特殊问题。而在实证分析中,储蓄函数还应当考虑如通货膨胀、消费行为变动等其他因素,以及平稳性问题,。,66,1.,虚拟变量是人工构造的取值为,0,和,1,的作为属性变量代表的变量。,2.,虚拟变量个数的设置有一定规则:在有截距项的模型中,若定性因素有 个相互排斥的类型,只能引入 个虚拟变量,否则会陷入所谓“虚拟变量陷阱”,产生完全的多重共线性。,第八章 小 结,67,3.,在计量经济模型中,加入虚拟解释变量的途径有两种基本类型:一是加法类型;二是乘法类型。以加法方式引入虚拟变量改变的是模型的截距;以乘法方式引入虚拟变量改变的是模型的斜率。,4.,解释变量只有一个分为两种相互排斥类型的定性变量而无定量变量的回归,称为方差分析模型。,68,5.,解释变量包含一个分为两种类型定性变量的回归时,只使用了一个虚拟变量;解释变量包含一个两种以上类型的定性变量的回归时,定性变量有 种类型,依据虚拟变量设置规则引入了 个虚拟变量。,6.,解释变量包含两个(或 个)定性变量的回归中,可选用了两个(或 个)虚拟变量去表示,这并不会出现“虚拟变量陷阱”。,69,7.,以乘法形式引入虚拟解释变量的主要作用在于:对回归模型结构变化的检验;定性因素间交互作用的影响分析;分段线性回归等。,70,THANKS,第八章 结 束 了!,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!