第8章-虚拟变量回归课件

上传人:仙*** 文档编号:241647802 上传时间:2024-07-12 格式:PPTX 页数:89 大小:1.46MB
返回 下载 相关 举报
第8章-虚拟变量回归课件_第1页
第1页 / 共89页
第8章-虚拟变量回归课件_第2页
第2页 / 共89页
第8章-虚拟变量回归课件_第3页
第3页 / 共89页
点击查看更多>>
资源描述
1第八章虚拟变量回归计量经济学.2不断走高的房地不断走高的房地产价格已价格已经成成为人人们关注的重点。关注的重点。很多研究很多研究认为,影响商品房价格的因素有多个方面。,影响商品房价格的因素有多个方面。有关研究表明,影响商品房价格的因素可分有关研究表明,影响商品房价格的因素可分为两两类:一:一类是比是比较容易量化的容易量化的定量因素定量因素。例如:成本。例如:成本费用因素、房地用因素、房地产供求因素、供求因素、经济因素、人口因素等。因素、人口因素等。另一另一类则是不易量化的是不易量化的定性因素定性因素。例如:社会因。例如:社会因素、区域因素、个素、区域因素、个别因素、房地因素、房地产投机因素、自然因投机因素、自然因素等。素等。这些因素的基本特征些因素的基本特征则是是不易量化不易量化的定性因素。的定性因素。引子引子:定性因素定性因素对房地房地产价格有价格有显著影响著影响吗?.3显然,在研究房地然,在研究房地产价格影响机理(用模型)价格影响机理(用模型)时,需要分析那些不易量化的定性因素需要分析那些不易量化的定性因素对房地房地产价格是否价格是否真的有真的有显著影响。著影响。能否把定性的因素也引入能否把定性的因素也引入计量量经济模型中呢模型中呢?怎怎样才能在模型中有效地表示才能在模型中有效地表示这些定性因素的作用呢?些定性因素的作用呢?引子引子:定性因素定性因素对房地房地产价格有价格有显著影响著影响吗?.4问题的一般性描述的一般性描述在前面各章的分析中,被解在前面各章的分析中,被解释变量主要是受可以量主要是受可以直接度量的定量因素的影响,如收入、直接度量的定量因素的影响,如收入、产出、商品需出、商品需求量、价格、成本、人数等。求量、价格、成本、人数等。但但现实经济生活中,影响被解生活中,影响被解释变量量变动的因素,的因素,除了可以直接除了可以直接观测数据的定量数据的定量变量外,可能量外,可能还包括一包括一些本些本质上上为定性因素定性因素的影响,例如性的影响,例如性别、种族、种族、职业、季季节、文化程度、文化程度、战争、自然灾害、政府争、自然灾害、政府经济政策的政策的变动等。等。.5问题的一般性描述的一般性描述在在实际的的经济分析中,分析中,这些些定性因素定性因素有有时具有不具有不可忽可忽视的重要作用。的重要作用。例如,研究某个企例如,研究某个企业的的销售水平,售水平,产业属性(制属性(制造造业、零售、零售业)、所有制(私)、所有制(私营、非私、非私营)、地理位)、地理位置(置(东、中、西部)、管理者的素、中、西部)、管理者的素质等是等是值得考得考虑的的重要影响因素,但重要影响因素,但这些因素共同的特征是表示些因素共同的特征是表示某种属某种属性的性的(是(是定性定性定性定性描述的),描述的),不能直接用数据精确描述的不能直接用数据精确描述的变量量。.6本章要研究的主要本章要研究的主要问题是:是:1.1.如何将作如何将作为解解释变量的定性因素引入回量的定性因素引入回归模型?模型?2.2.这些定性解些定性解释变量在回量在回归模型中有何特模型中有何特殊的作用?殊的作用?.7第八章第八章 虚虚拟变量回量回归 本章主要本章主要讨论:虚虚拟变量量 虚虚拟解解释变量的回量的回归 虚虚拟被解被解释变量的回量的回归(选讲,不包括不包括).8第一第一节 虚虚拟变量量本本节基本内容基本内容:基本概念基本概念 虚虚拟变量量设置置规则.9一、基本概念一、基本概念定量因素定量因素定量因素定量因素:可直接:可直接测度、数度、数值型的因素,型的因素,GDP、M2。定性因素定性因素定性因素定性因素:属性因素属性因素属性因素属性因素,是不能直接,是不能直接测定的、表征定的、表征某种属性或状某种属性或状态存存在与否的非数在与否的非数值性的因素,如男性性的因素,如男性或女性、城市居民或非城市居民、或女性、城市居民或非城市居民、高高中低收入群体。中低收入群体。基本思想:基本思想:直接在回直接在回归模型中加入定性因素存在模型中加入定性因素存在诸多的困多的困难,是否可将是否可将这些定性因素些定性因素进行量化,以达到定性因素能行量化,以达到定性因素能与定量因素有着相同作用之目的。与定量因素有着相同作用之目的。.10计量量经济学中,将取学中,将取值为0和和1的人工的人工变量(人量(人为构造)称构造)称为虚虚拟变量,量,也称也称哑元元变量量、定性定性变量量。通常用字母通常用字母D或或DUM表示(英文中虚表示(英文中虚拟或或哑元元Dummy的的缩写)。写)。对定性定性变量的量化可采用虚量的量化可采用虚拟变量的方式量的方式实现。定性因素通常具有若干定性因素通常具有若干类型或水平,需要型或水平,需要选用适用适当数量的虚当数量的虚拟变量加以描述。量加以描述。虚虚拟变量的定量的定义.11通常虚通常虚拟变量的取量的取值为0 和和1;当虚当虚拟变量取量取值为0,即,即D=0时,表示某种属性或,表示某种属性或状状态不出不出现或不存在,即不是某种或不存在,即不是某种类型;型;当虚当虚拟变量取量取值为1,即,即D=1时,表示某种属性或,表示某种属性或状状态出出现或存在,即是某种或存在,即是某种类型;型;例如例如例如例如,构造政府,构造政府经济政策人工政策人工变量,当量,当经济政策政策不不变时,虚,虚拟变量取量取值为0,当,当经济政策改政策改变时,虚虚拟变量取量取值为1;这种做法种做法实际上是一种上是一种变换或映射,将不能精确或映射,将不能精确计量的定性因素的水平或状量的定性因素的水平或状态变换为用用 0 和和 1 来来定量描述。定量描述。虚虚拟变量的定量的定义.12在在计量量经济学模型中引入虚学模型中引入虚拟变量,可以使我量,可以使我们同同时兼兼顾定量因素和定性因素的影响和作用。但定量因素和定性因素的影响和作用。但是,虚是,虚拟变量的量的设置需遵循以下三个置需遵循以下三个规则:1、“0”和和“1”选取原取原则;2、属性(状、属性(状态、水平)因素与、水平)因素与设置虚置虚拟变量量数量的关系;数量的关系;3、虚、虚拟变量在回量在回归分析中的角色以及作用等分析中的角色以及作用等方面的方面的问题;二、二、虚虚拟变量量设置置规则.13“0 0”和和“1 1”选取原取原则l虚虚拟变量取量取“1”或或“0”的原的原则,应从分析从分析问题的目的出的目的出发予以界定,要注意区分所代表的是予以界定,要注意区分所代表的是基基础类型型还是是比比较类型型。l从理从理论上上讲,虚,虚拟变量取量取“0”值通常代表比通常代表比较的的基基础类型型;而虚;而虚拟变量取量取“1”值通常代表被通常代表被比比较的的类型型。“0”代表基期(比代表基期(比较的基的基础,参照物);,参照物);“1”代表代表报告期(被比告期(被比较的效的效应)。)。.14例如,比例如,比较政府政府经济政策政策变动对居民收入居民收入X与消与消费Y关系的影响。此关系的影响。此时是在政府是在政府经济政策不政策不变的基的基础上上进行比行比较,模型和虚,模型和虚拟变量可以量可以设定定为当当Dt=0时,Yt=a0+Xt+ut,这里里的的a0为基基础类型型(政政府府经济政政策策不不变)时模模型型的的截截距距。当当Dt=1时,Yt=a0+a1+Xt+ut,这里里的的(a0+a1)为比比较类型型(政政府府经济政政策策变动)时模模型型的的截截距距,为与与基基础类型型相相比比较的差异截距系数。的差异截距系数。,基,基础类型(政府型(政府经济政策不政策不变),比,比较类型(政府型(政府经济政策政策变动).15例如,比例如,比较收入收入时考察性考察性别的影响。当研究男的影响。当研究男性收入是否高于女性性收入是否高于女性时,是将女性作,是将女性作为比比较的基的基础(基(基础类型,参照物),故有男性型,参照物),故有男性为“1”,女,女性性为“0”。问题:为何只何只选0 0、1 1,选2 2、3 3、4 4行行吗?为什么?什么?.16定性因素的属性既可能定性因素的属性既可能为两种状两种状态,也可能,也可能为多多种状种状态。例如,性。例如,性别(男、女两种)、季(男、女两种)、季节(4 4种种状状态),地理位置(),地理位置(东、中、西部),行、中、西部),行业归属,属,所有制,收入的分所有制,收入的分组等。等。属性的状属性的状态(水平)数与虚(水平)数与虚拟变量数量的关系量数量的关系.17若定性因素具有若定性因素具有m个(个(m2)相互排斥属性相互排斥属性(水平水平):1、当回、当回归模型有截距模型有截距项时,只能引入,只能引入m-1个虚个虚拟变量;否量;否则,就会陷入,就会陷入“虚虚拟变量陷阱量陷阱”,产生完全共生完全共线性。性。2、当回、当回归模型无截距模型无截距项时,则可引入可引入m个虚个虚拟变量,量,不会不会导致完全共致完全共线性,性,该情形下虚情形下虚拟变量参数的估量参数的估计结果,果,实际上是上是D=1时的被解的被解释变量量样本均本均值。(为什么什么?见相关参考教材)相关参考教材)虚虚拟变量数量的量数量的设置置规则.18研究居民住房消研究居民住房消费支出支出Yi和居民可支配收入和居民可支配收入Xi之之间的数量关系。回的数量关系。回归模型的模型的设定定为:现在要考在要考虑城城镇居民和居民和农村居民之村居民之间的差异,如的差异,如何何办?为了了对“城城镇居民居民”、“农村居民村居民”进行区行区分,分析各自在住房消分,分析各自在住房消费支出支出Yi上的差异,上的差异,设 Di=1为城城镇居民居民;Di=0为农村居民,村居民,则模型模型为(模型有截距,(模型有截距,“居民属性居民属性”定性定性变量只有两个相互量只有两个相互排斥的属性状排斥的属性状态(m=2),故只),故只设定一个虚定一个虚拟变量。)量。)一个例子一个例子(虚虚拟变量陷阱量陷阱).19若若对两个相互排斥的属性两个相互排斥的属性“居民属性居民属性”,仍然引,仍然引入入m=2个虚个虚拟变量,量,则有有则模型(模型(1 1)为则对任一家庭都有:任一家庭都有:、,即,即产生完全共生完全共线,陷入了,陷入了“虚虚拟变量陷阱量陷阱”。“虚虚拟变量陷阱量陷阱”的的实质是:是:完全多重共完全多重共线性性。.20若考若考虑季季节因素(春夏秋冬,四个因素(春夏秋冬,四个类型)型)对某种某种商品商品销量量Y的影响,如果建立如下模型:的影响,如果建立如下模型:其中其中有截距有截距项的模型中,引入的模型中,引入m=4个虚个虚拟变量,量,则有有也就是也就是说,构成,构成OLS估估计解解释变量数据矩量数据矩阵X的向量的向量 e、X、D1、D2、D3、D4线性相关,即完全共性相关,即完全共线性,性,OLS估估计无法无法获得。得。.21解解释变量完全量完全共共线性性.22实际上此上此时只需只需设置置m-1=3个虚个虚拟变量即可,比如量即可,比如因因为D1、D2、D3已已经构成春夏秋冬四个构成春夏秋冬四个类型的完型的完备选择(当前三者都(当前三者都为0时即代表冬季),而即代表冬季),而这样也可以避也可以避免虚免虚拟变量陷阱。量陷阱。但是,在无截距但是,在无截距项的模型中,引入的模型中,引入m=4个虚个虚拟解解释变量不会量不会导致它致它们间的的线性无关(即不存在不全性无关(即不存在不全为0的一的一组常数常数c1、c2、c3、c4使得使得c1D1+c2D2+c3D3+c4D4=0,不不会会引起多重共引起多重共线性(性(不会不会落入虚落入虚拟变量量设置陷阱)。置陷阱)。.23n每一每一定性定性变量量(qualitative variable)所需的虚所需的虚拟变量个数要比量个数要比该定性定性变量的量的状状态类别数数少少1。即如。即如果有果有m种状种状态,只在模型中引入,只在模型中引入m-1个虚个虚拟变量。量。n例如,季例如,季节定性定性变量有春、夏、秋、冬量有春、夏、秋、冬4种状种状态,只需要只需要设置置3个虚个虚变量:量:如果如果设置第置第4个虚个虚变量,量,则出出现“虚虚拟变量陷井量陷井”。.24综上可知:上可知:1 1、引引入入虚虚拟变量量的的个个数数与与两两个个因因素素有有关关;一一是是定性定性变量的属性多少,一是有无截距量的属性多少,一是有无截距项;2 2、对虚虚拟变量量的的运运用用要要谨慎慎,虚虚拟变量量的的使使用用得得当当常常能能发挥积极极的的作作用用,但但在在模模型型中中引引入入虚虚拟变量量的的数数量量要要适适当当,引引入入的的虚虚拟变量量的的数数量量过度度,则可能可能带来来负面的影响。面的影响。.25在在计量量经济模型中,虚模型中,虚拟变量可量可发挥多方面的作用:多方面的作用:1.可作可作为属性因素的代表,如性属性因素的代表,如性别、所有制等;、所有制等;2.可作可作为某些非精确某些非精确计量的数量因素的代表,如受量的数量因素的代表,如受教育程度、管理者素教育程度、管理者素质等;等;3.可作可作为某些偶然因素或政策因素的代表,如某些偶然因素或政策因素的代表,如战争、争、自然灾害、自然灾害、经济转型等;型等;4.可作可作为时间序列分析中季序列分析中季节(月份)的代表;(月份)的代表;5.可以可以实现分段回分段回归,研究斜率、截距的,研究斜率、截距的变动,或,或比比较两个回两个回归模型的模型的结构差异等。构差异等。虚虚拟变量在回量在回归模型中的角色模型中的角色.26虚虚拟变量既可作量既可作为被解被解释变量,也可作量,也可作为解解释变量,分量,分别称其称其为虚虚拟被解被解释变量量和和虚虚拟解解释变量量。在在计量量经济学中,把含有虚学中,把含有虚拟变量的模型称量的模型称为虚虚拟变量模量模型型。常用虚常用虚拟变量模型量模型分三分三类:解解释变量中包含虚量中包含虚拟变量,作用是假定其他因素都不量,作用是假定其他因素都不变时,只研究定性只研究定性变量是否使被解量是否使被解释变量表量表现出出显著差异;著差异;解解释变量中包含定量量中包含定量变量和虚量和虚拟变量,研究定量量,研究定量变量和虚量和虚拟变量同量同时对被解被解释变量的影响;量的影响;被解被解释变量本身量本身为虚虚拟变量的模型,是被解量的模型,是被解释变量本身取量本身取值为0 0和和1 1的模型,适用于的模型,适用于对某社会某社会经济现象象进行行“是是”与与“否否”的判断。的判断。虚虚拟变量在回量在回归模型中的角色模型中的角色.27模型中包含模型中包含虚虚拟被解被解释变量量的研究是当前的研究是当前计量量经济学研究的前沿学研究的前沿领域,如域,如麦克法登(麦克法登(MacFadden)、)、海克曼(海克曼(Heckmen)等人的微等人的微观计量量经济学研究,学研究,大量涉及到虚大量涉及到虚拟被解被解释变量的分析。量的分析。本本课程只是程只是讨论虚虚拟解解释变量量的的问题。虚虚拟变量在回量在回归模型中的角色模型中的角色.28第二第二节 虚虚拟解解释变量的回量的回归本本节基本内容基本内容:加法加法类型型 乘法乘法类型型 虚虚拟解解释变量量综合合应用用.29在在计量量经济学中,通常引入虚学中,通常引入虚拟变量的方式分量的方式分为加法方式和乘法方式两种:即加法方式和乘法方式两种:即实质:加法方式引入虚加法方式引入虚拟变量改量改变的是的是截距截距;乘法方式引入虚乘法方式引入虚拟变量改量改变的是的是斜率斜率。.30以加法方式引入虚以加法方式引入虚拟变量量时,主要考,主要考虑的的问题是是定性因素的属性和引入虚定性因素的属性和引入虚拟变量的个数。量的个数。以加法以加法类型引人虚型引人虚拟解解释变量的模型如下式:量的模型如下式:Yt 1+2*Xt+3*Dt+ut (8.3)在式(在式(8.3)所)所设定的定的计量量经济模型中,虚模型中,虚拟解解释变量与其他解量与其他解释变量是相加关系。量是相加关系。以加法形式引人虚以加法形式引人虚拟解解释变量,量,从从计量量经济模型模型的意的意义看,其作用是改看,其作用是改变了了设定模型的定模型的截距水平截距水平。一、加法一、加法类型型.31分分为四种情形四种情形讨论:1.1.解解释变量只有一个定性量只有一个定性变量而无定量量而无定量变量,而量,而且定性且定性变量量为两种相互排斥的属性;两种相互排斥的属性;2.2.解解释变量量分分别为一一个个定定性性变量量(两两种种属属性性)和和一个定量解一个定量解释变量;量;3.3.解解释变量分量分别为一个定性一个定性变量(两种以上属性)量(两种以上属性)和一个定量解和一个定量解释变量;量;4.4.解解释变量分量分别为两个定性两个定性变量(各自分量(各自分别是两是两种属性)和一个定量解种属性)和一个定量解释变量;量;一、加法一、加法类型型.32思考:思考:四种加法方式引入虚四种加法方式引入虚拟变量会量会产生什么效生什么效应?.331.1.一个两种属性定性解一个两种属性定性解释变量而无定量量而无定量变量的情形量的情形方差分析模型上式(上式(8.4)的意)的意义是,假是,假设其他因素(包括文化其他因素(包括文化程度、程度、职业、性、性别等)保持不等)保持不变的条件下,的条件下,研究城研究城镇居民和居民和农村居民的收入是否存在差村居民的收入是否存在差别。(8.4)方差分析方差分析:又称:又称变异数分析,用于两个及两个以上异数分析,用于两个及两个以上样本均数差本均数差别的的显著性著性检验。.341.1.一个两种属性定性解一个两种属性定性解释变量而无定量量而无定量变量的情形量的情形城城镇非城非城镇当当ui满足古典假足古典假设时,由式(由式(8.4)有)有城城镇居民的年平均收入居民的年平均收入非城非城镇居民的年平均收入居民的年平均收入即在式(即在式(8.4)中,截距)中,截距项0给出了非城出了非城镇居民的年居民的年平均可支配收入水平,而另一系数平均可支配收入水平,而另一系数1则表明城表明城镇居居民年平均可支配水平不同于非城民年平均可支配水平不同于非城镇居民年平均可支居民年平均可支配收入的部分。配收入的部分。.351.1.一个两种属性定性解一个两种属性定性解释变量而无定量量而无定量变量的情形量的情形为了了检验城城镇居民和非城居民和非城镇居民的年均可支配居民的年均可支配收入是否有收入是否有显著差著差别,可构造假,可构造假设H0:1=0即城即城镇与非城与非城镇居民年均可支配收入无差居民年均可支配收入无差别。对式(式(8.4)回)回归,依据,依据1估估计值的的t检验是否是否显著,著,可作出接受或不能接受可作出接受或不能接受H0假假设的判断。的判断。.362.2.一个定性一个定性变量(两种属性)和一个定量解量(两种属性)和一个定量解释变量的情形量的情形(8.4)模型式(模型式(8.7)的意)的意义在于描述收入和城在于描述收入和城乡差差别对居居民消民消费支出的影响。式(支出的影响。式(8.7)由一个定量解)由一个定量解释变量量X和一个分和一个分为两种两种类型的虚型的虚拟解解释变量量组成。注意成。注意这里里一个定性一个定性变量具有两种量具有两种类型,只使用了一个虚型,只使用了一个虚拟变量量。.城城镇居民居民农村居民村居民372.2.一个定性一个定性变量(两种属性)和一个定量解量(两种属性)和一个定量解释变量的情形量的情形当式(当式(8.7)中的)中的ut服从古典假定服从古典假定时,基,基础类型(型(农村居民消村居民消费支出)和比支出)和比较类型(城型(城镇居民消居民消费支出)支出)分分别为:其中,其中,1为差异截距系数。差异截距系数。.38共同的特征:共同的特征:截距截距发生改生改变(?)(?)式(式(8.7)可表示)可表示为图8.1,表明非城,表明非城镇居民与城居民与城镇居民居民两种两种类型收入函数的斜率相型收入函数的斜率相间(均(均为),而截距水而截距水平不同。平不同。这说明,城明,城镇居民和非城居民和非城镇居民在消居民在消费支出支出水平上,存在着水平上,存在着规模模为1的差异,而由的差异,而由收入因素而收入因素而产生的平均消生的平均消费支出水平支出水平变化却是相同的化却是相同的。图8.1.39构造原假构造原假设H0:1=0在原假在原假设下,下,对参数参数1的的t检验,可以,可以进行消行消费支出是否存在城支出是否存在城乡差异的差异的检验。.模型形式:模型形式:考考虑以下模型:以下模型:(8.10)其中,其中,Yi为年医年医疗保健保健费用支出;用支出;Xi为居民的年可支居民的年可支配收入;配收入;模型式(模型式(8.10)是描述居民的年医)是描述居民的年医疗保健保健费用支出与用支出与居民可支配收入(定量居民可支配收入(定量变量)和受教育程度(定性量)和受教育程度(定性变量)量)间的因果关系。定性因素(受教育的程度)划分的因果关系。定性因素(受教育的程度)划分为三种三种类型:型:高中以下、高中、大学及大学以上高中以下、高中、大学及大学以上。403.3.一个定性一个定性变量(两种以上属性)和一个定量解量(两种以上属性)和一个定量解释变量的量的情形情形.41当式(当式(8.10)服从古典假定)服从古典假定时,有以下几种,有以下几种类型。型。(1)基基础类型型高中以下教育高中以下教育 E(Yi|Xi,D2=0,D3=0)1+Xi(2)比比较类型型1)高中教育高中教育 E(Yi|Xi,D2=1,D3=0)(1+2)+Xi2)大大专及以上及以上 E(Yi|Xi,D2=1,D3=1)(1+3)+Xi这表明,三种不同教育程度居民的医表明,三种不同教育程度居民的医疗保健保健费用年均用年均支出的起点水平(截距)不同,截距差异系数分支出的起点水平(截距)不同,截距差异系数分别为2和和3。.42对式(式(8.10)进行回行回归,检验原假原假设H0:2=0和和H0:3=0的的t检验可以可以发现与比与比较基准基准组(高中以下教(高中以下教育水平)相比,另两种育水平)相比,另两种类型截距的差异在型截距的差异在统计上是否上是否存在存在显著差异。关于著差异。关于2=3=0 的的联合假合假设检验,也,也可由方差分析或可由方差分析或F检验完成。完成。.434.4.两个定性解两个定性解释变量(均量(均为两种属性)和一个定量解两种属性)和一个定量解释变量的情形量的情形(8.14).当式(当式(8.14)满足古典假足古典假设时,有以下几种,有以下几种类型。型。(1)基基础类型型 冬季冬季农村村销量量(2)比比较类型型1)冬季城市冬季城市销量量2)夏季夏季农村村销量量3)夏季城市夏季城市销量量模模型型式式(8.14)是是以以冬冬季季农村村啤啤酒酒销量量为基基础类型型,并并假假设不不同同季季节居居民民的的啤啤酒酒需需求求函函数数只只是是有有不不同同的的截截距距,相相对于于收收入入的的斜斜率率系系数数 相相同同。用用t检验分分别检验 1和和 2的的的的统计显著著性性,可可验证两个定性两个定性变量量对截距是否有截距是否有显著影响。著影响。44.45上述上述图形的前提条件是什么?形的前提条件是什么?.46运用运用OLS得到回得到回归结果,再用果,再用t检验讨论因素因素是否是否对模型有影响。模型有影响。加法方式引入虚加法方式引入虚拟变量的一般表达式量的一般表达式:基本分析方法基本分析方法:条件期望条件期望。.47加法方式引入虚加法方式引入虚拟变量的主要作用量的主要作用为:1.1.在有定量解在有定量解释变量的情形下,主要改量的情形下,主要改变方程方程 截距;截距;2.2.在没有定量解在没有定量解释变量的情形下,主要用于方量的情形下,主要用于方 差分析。差分析。.48基本思想基本思想以以乘乘法法方方式式引引入入虚虚拟变量量时,是是在在所所设立立的的模模型型中中,将将虚虚拟解解释变量量与与其其它它解解释变量量的的乘乘积,作作为新新的的解解释变量量出出现在在模模型型中中,以以达达到到其其调整整设定定模模型型斜斜率率系系数数的的目目的的。或或者者将模型斜率系数表示将模型斜率系数表示为虚虚拟变量的函数,以达到相同的目的。量的函数,以达到相同的目的。乘法引入方式乘法引入方式:(1 1)截距不)截距不变;(2 2)截距和斜率均)截距和斜率均发生生变化;化;分析手段:分析手段:仍然是仍然是条件期望条件期望。二、乘法二、乘法类型型.49模型形式:模型形式:例:研究消例:研究消费支出支出Y受收入受收入X、年份状况、年份状况D的影响的影响(1 1)截距不)截距不变的情形的情形.50(2 2)截距和斜率均)截距和斜率均发生生变化化例,同例,同样研究消研究消费支出支出Y受收入受收入X、年份状况、年份状况D间的影响关系的影响关系模型形式:模型形式:.51三、虚三、虚拟解解释变量量综合合应用用所所谓综合合应用是指将引入虚用是指将引入虚拟解解释变量的加法量的加法方式、乘法方式方式、乘法方式进行行综合使用。合使用。基本分析方式仍然是基本分析方式仍然是条件期望分析条件期望分析。本本课主要主要讨论(1 1)结构构变化分析;化分析;(2 2)交互效)交互效应分析;分析;(3 3)分段回)分段回归分析分析.52例如:比例如:比较改革开放前、后我国居民(平均)改革开放前、后我国居民(平均)“储蓄蓄收入收入”总量关系是否量关系是否发生了生了变化?化?模型的模型的设定形式定形式为:1 1)改革开放前)改革开放前2 2)改革开放前)改革开放前其中,其中,Y为储蓄蓄总额(亿元);元);X为收入收入总额(亿元);元);u1t、u2t为随机随机扰动项。(1 1)结构构变化分析化分析.53如果我如果我们分分别对式(式(8.19)和式()和式(8.20)在不同的)在不同的时间区区间内回内回归,则可能得到以下四种可能得到以下四种结果:果:1.1 1,2 2,表明表明这两个回两个回归模型是相同的,或称模型是相同的,或称为重重合回合回归;2.11,2 2,表明表明这两个回两个回归模型模型仅在位置水平上(即在位置水平上(即截距水平上)存在差异,或称截距水平上)存在差异,或称为平行回平行回归;3.1 1,2 2,表,表明明这两个回两个回归模型具有相同的位置水平模型具有相同的位置水平(或起点相同)而(或起点相同)而变化速率不等,或称化速率不等,或称为共点回共点回归;4.11,2 2,表明,表明这两个回两个回归模型完全不相同,或称模型完全不相同,或称为不同的回不同的回归。以上四种情形可用以上四种情形可用图示法描述(示法描述(图8.2)。)。.54不同截距、斜率的不同截距、斜率的组合合图形形重合回重合回归:截距斜率均相同:截距斜率均相同平行回平行回归:截距不同斜率相同:截距不同斜率相同共点回共点回归:截距相同斜率不同:截距相同斜率不同交叉(不同)回交叉(不同)回归:截距斜率均不同:截距斜率均不同.55结构构变化的化的实质是是检验所所设定的模型在定的模型在样本期内本期内是否是否为同一模型。同一模型。显然,平行回然,平行回归、共点回、共点回归、不、不同的回同的回归三个模型均三个模型均不是同一模型不是同一模型。平行回平行回归模型的假定是斜率保持不模型的假定是斜率保持不变(加法(加法类型,型,包括方差分析);包括方差分析);共点回共点回归模型的假定是截距保持不模型的假定是截距保持不变(乘法(乘法类型,型,又被称又被称为协方差分析);方差分析);不同的回不同的回归的模型的假定是截距、斜率均的模型的假定是截距、斜率均为变动的(加法、乘法的(加法、乘法类型的型的组合)。合)。.56现在的在的问题是,当我是,当我们运用运用样本数据本数据对式式(8.19)和式()和式(8.20)进行回行回归后,如何界定所得后,如何界定所得结果在果在统计意意义上属于哪一种上属于哪一种类型呢?型呢?这时可采用以可采用以乘法形式引人虚乘法形式引人虚拟变量的方法。量的方法。例如,例如,对于改革开于改革开放前后放前后储蓄收入模型,可蓄收入模型,可设定定为其中,其中,Y为储蓄蓄总额(亿元);元);X为收入收入总额;D 为虚虚拟变量,量,.57在式(在式(8.21)中,以乘法形式引入了虚)中,以乘法形式引入了虚拟变量所形量所形成的解成的解释变量量为DtXt,以加法形式引人虚,以加法形式引人虚拟变量所形量所形成的解成的解释变量是量是Dt。当式(。当式(8.21)满足古典假定足古典假定时:1)改革开放前:)改革开放前:2)改革开放后:)改革开放后:它它们分分别是改革开放前和改革开放后的平均是改革开放前和改革开放后的平均储蓄函数。蓄函数。.58与式(与式(8.19)及式()及式(8.20)相比,有:)相比,有:11,21;11+2,21+2。在式(在式(8.21)中,)中,2称称为截距差异系数,截距差异系数,2称称为斜率差异系数,分斜率差异系数,分别代表改革开放前后代表改革开放前后储蓄函数蓄函数截距与斜率所存在的差异。当利用截距与斜率所存在的差异。当利用改革开放前后的改革开放前后的数据数据估估计式(式(8.21)时,等价于分,等价于分别对式(式(8.19)和)和式(式(8.20)两个)两个储蓄函数蓄函数进行估行估计。.59(2 2)交互效)交互效应分析分析交互作用交互作用:当分析解当分析解释变量的影响量的影响时,大多数情形只是分析,大多数情形只是分析了解了解释变量自身量自身变动对被解被解释变量的影响作用,而没量的影响作用,而没有深入分析解有深入分析解释变量量间的相互作用的相互作用对被解被解释变量的影量的影响。响。前面前面讨论的分析两个定性的分析两个定性变量量对被解被解释变量影响量影响的虚的虚拟变量模型中,暗含着一个假定:量模型中,暗含着一个假定:两个定性两个定性变量量是分是分别独立地影响被解独立地影响被解释变量的。量的。.60(2 2)交互效)交互效应分析分析交互作用交互作用:但是在但是在实际经济活活动中,中,两个定性两个定性变量量对被解被解释变量的影响可能存在一定的交互作用,即一个解量的影响可能存在一定的交互作用,即一个解释变量的量的边际效效应有有时可能要依可能要依赖于另一个解于另一个解释变量量。为描述描述这种交互作用,可以把两个虚种交互作用,可以把两个虚拟变量的乘量的乘积以加以加法形式引人模型。法形式引人模型。.61例例:是否是否发展油菜籽生展油菜籽生产与是否与是否发展养蜂生展养蜂生产的的差异差异对农副副产品品总收益的影响研究。收益的影响研究。模型模型设定定为:(1 1)式中)式中,以加法形式引入虚以加法形式引入虚拟变量暗含何假量暗含何假设?(2 2)交互效)交互效应分析分析.62(1)式以加法形式引入,暗含的假)式以加法形式引入,暗含的假设为:菜籽生菜籽生产和养蜂生和养蜂生产是分是分别独立地影响独立地影响农副品副品生生产总收益。但是,在收益。但是,在发展油菜籽生展油菜籽生产时,同,同时也也发展养蜂生展养蜂生产,所取得的,所取得的农副副产品生品生产总收益,可收益,可能会高于不能会高于不发展养蜂生展养蜂生产的情况。即在是否的情况。即在是否发展油展油菜籽生菜籽生产与养蜂生与养蜂生产的虚的虚拟变量量D2和和D3间很很可能存可能存在着一定的交互作用,且在着一定的交互作用,且这种交互影响种交互影响对被解被解释变量量农副副产品生品生产收益会有影响。收益会有影响。(2 2)交互效)交互效应分析分析.63问题:如何刻画同如何刻画同时发展油菜籽生展油菜籽生产和养蜂生和养蜂生产的的交互作用?交互作用?基本思想:基本思想:在在模型中引入相关的两个模型中引入相关的两个变量的乘量的乘积。区区别之之处在于,上在于,上页定定义中的交互效中的交互效应是是针对数量数量变量,而量,而现在是定性在是定性变量量,又又应当如何当如何处理理?(2 2)交互效)交互效应分析分析.64为了反映了反映交互效交互效应,将(,将(1 1)变为:同同时发展油菜籽和展油菜籽和养蜂生养蜂生产:发展油菜籽生展油菜籽生产:发展养蜂生展养蜂生产:基基础类型:型:.65如何如何检验交互效交互效应是否存在?是否存在?若拒若拒绝原假原假设,即交互效,即交互效应对Y产生了影响(生了影响(应该引入模型)。引入模型)。.66有的社会有的社会经济现象的象的变动,会在解,会在解释变量达到某量达到某个个临界界值时发生突生突变,为了区分不同了区分不同阶段的截距和段的截距和斜率可利用虚斜率可利用虚拟变量量进行行分段回分段回归。作作用用:提高模型的描述精度。提高模型的描述精度。虚虚拟变量也可以用来代表数量因素的不同量也可以用来代表数量因素的不同阶段段。(3 3)分段回)分段回归分析分析.67例如,某公司例如,某公司为了激励公司了激励公司销售人售人员,按其,按其销售售额的一定比例的一定比例计提提奖励,但是励,但是销售售额在某一目在某一目标水水平平X*以下和以上以下和以上时计提提奖励的方法不同。当励的方法不同。当销售售额高于高于X*时,计提提奖励励额与与销售售额的比例要高于的比例要高于销售售额低于低于X*时的比例,也就是高于的比例,也就是高于X*时,奖励励额与与销售售额的的线性关系更性关系更为陡峭(陡峭(图8.3)。)。为了确切地描了确切地描述述奖励励额度(度(Y)与)与销售售额(X)间的关系,需要分的关系,需要分两段两段进行回行回归。这种分段回种分段回归可以用虚可以用虚拟变量来量来实现。(3 3)分段回)分段回归分析分析.68基本思路:基本思路:采用乘法方式引入虚采用乘法方式引入虚拟变量的手段量的手段。设虚虚拟变量量D为则奖励励额度(度(Yt)与)与销售售额(Xt)间的关系式可以的关系式可以统一地表示一地表示为式中,式中,Yt为奖励励额;Xt为销售售额;X*为已知的已知的销售目售目标临界水平。利用界水平。利用统计资料估料估计式式(8.1)的参数,就)的参数,就可以得到不同斜率和截距的回可以得到不同斜率和截距的回归方程。方程。(3 3)分段回)分段回归分析分析.69(1)销售售额低于低于X*时:E(Yt|Xt,D=0)0+1Xt(2)销售售额不低于不低于X*时:E(Yt|Xt,D=1)0+1Xt+2(Xt-X*)整理可得:整理可得:E(Yt|Xt,D=1)(0-2 X*)+(1+2)Xt (3 3)分段回)分段回归分析分析.70(3 3)分段回)分段回归分析分析图8.3 奖励励额与与销售售额的关系的关系.71第三第三节案例分析案例分析为了了考考察察改改革革开开放放以以来来中中国国居居民民的的储蓄蓄存存款款与与收收入入的的关关系系是是否否已已发生生变化化,以以城城乡居居民民人人民民币储蓄蓄存存款款年年底底余余额代代表表居居民民储蓄蓄(Y),以以国国民民总收收入入(GNI)代代表表城城乡居居民民收收入入,分分析析居居民民收收入入对储蓄蓄存存款款影影响响的的数数量量关关系系,并并建建立立相相应的的计量量经济学学模模型型 。.72表表8.1 8.1 国民国民总收入与居民收入与居民储蓄存款蓄存款 单位:位:亿元元数据来源:数据来源:根据中国根据中国统计年年鉴和中和中经网网统计数据数据库数据整理。数据整理。年年 份份国民国民总收入收入(GNI)城城乡居民人民居民人民币储蓄蓄存款年底余存款年底余额(Y)城城乡居民人民居民人民币储蓄存款增加蓄存款增加额(YY)年年 份份国民国民总收入收入(GNI)城城乡居民人民居民人民币储蓄存款年蓄存款年底余底余额 (Y)城城乡居民人民居民人民币储蓄存款增加蓄存款增加额(YY)19783645.2210.6NA199559810.529662.38143.519794062.6281.070.4199670142.538520.88858.519804545.6399.5118.5199778060.846279.87759.019814889.5532.7124.2199883024.353407.57615.419825330.5675.4151.7199988479.259621.86253.019835985.6892.5217.1200098000.564332.44976.719847243.81214.7322.22001108068.273762.49457.619859040.71622.6407.92002119095.786910.613233.2198610274.42237.6615.02003135174.0103617.316631.6198712050.63073.3835.72004159586.7119555.415929.4198815036.83801.5728.22005184088.6141051.021496.8198917000.95196.41374.22006213131.7161587.320544.0199018718.37119.81923.42007251483.2172534.210967.1199121826.29241.62121.82008302853.4217885.445353199226937.311759.42517.82009340320260771.342885.9199335260.015203.53444.12010399759.5303302.542417.1199448108.521518.86315.32011472115343635.940333.4.73为了了研研究究19782011年年期期间城城乡居居民民储蓄蓄存存款款随随收收入入的的变化化规律律是是否否有有变化化,考考证城城乡居居民民储蓄蓄存存款款、国国民民总收收入入随随时间的的变化情况,如化情况,如图所示:所示:.74从从上上图中,尚无法得到居民的中,尚无法得到居民的储蓄行蓄行为发生明生明显改改变的的详尽信尽信息。若取居民息。若取居民储蓄的增量(蓄的增量(YY),并作),并作时序序图如下如下。从。从图中中可以可以看出,城看出,城乡居民的居民的储蓄行蓄行为表表现出了明出了明显的的阶段特征:在段特征:在1996年、年、2000年、年、2005年、年、2007年和年和2009年有五个明年有五个明显的的转折点。折点。.75再从城再从城乡居民居民储蓄存款增量与国民蓄存款增量与国民总收入之收入之间关系的散布关系的散布图看看(下下图),也呈),也呈现出了相同的出了相同的阶段性特征。段性特征。.为了了分分析析居居民民储蓄蓄行行为在在1996年年-2011年年不不同同时期期的的数数量量关关系系,以以1996、2000、2005、2007、2009年年度度的的五五个个转折折点点作作为依依据据,分分别引引入入虚虚拟变量量D1、D2、D3、D4、D5,这五五个个年年度度所所对应的的GNI分分别为70142.5、98000.5、184088.6、251483.2和和340320亿元元。据据此此,我我们设定定了了如如下下以以加加法法和和乘乘法法两两种种方方式式同同时引入虚引入虚拟变量的的模型:量的的模型:76 .77 对上式上式进行回行回归后,有:后,有:.78.由由于于各各虚虚拟变量量前前的的参参数数估估计量量的的t值均均大大于于临界界值,表表明明各各解解释变量量的的斜斜率率系系数数在在显著著性性水水平平或或下下显著著地地不不等等于于0。于于是是,居居民民人人民民币储蓄蓄存存款款年年增增加加额的回的回归模型分模型分别为:79.80表表明明六六个个时期期居居民民储蓄蓄增增加加额的的回回归方方程程在在统计意意义上上确确实有有很很大大不不同同。1996年年以以前前国国民民总收收入入每每增增加加1亿元元,平平均均说来来居居民民储蓄蓄存存款款的的增增加加额为0.1317亿元元,居居民民储蓄蓄增增加加额随随国国民民总收收入入增增长的的变动相相对稳定定。1996年年以以后后随随着着国国民民总收收入入的的增增长居居民民储蓄蓄存存款款的的增增加加额在在不不同同年年份份有有增增有有减减,呈呈现出出明明显的的周周期期性性变化化。上上述述模模型型同同城城乡居居民民储蓄蓄存存款款与与国国民民总收收入入之之间的的散散布布图吻吻合合,与与这一一时段段中中国国的的实际经济运行状况也是相符的运行状况也是相符的。.81需需要要指指出出的的是是,在在上上述述建建模模过程程中中,主主要要是是从从教教学学的的目目的的出出发,说明明运运用用虚虚拟变量量的的规则和和方方法法,没没有有考考虑通通货膨膨胀等等因因素素,也也没没有有考考虑时间序序列列数数据据的的特特殊殊问题。而而在在实证分分析析中中,储蓄蓄函函数数还应当当考考虑如如通通货膨膨胀、消消费行行为变动等等其其他他因因素素以以及及平平稳性性问题。.821.虚虚拟变量是人工构造的取量是人工构造的取值为0和和1的作的作为属性属性变量代表的量代表的变量。量。2.虚虚拟变量个数的量个数的设置有一定置有一定规则:在有截距:在有截距项的的模型中,若定性因素有模型中,若定性因素有m个相互排斥的个相互排斥的类型,只型,只能引入能引入m-1个虚个虚拟变量,否量,否则会陷入所会陷入所谓“虚虚拟变量陷阱量陷阱”,产生完全的多重共生完全的多重共线性。性。第八章第八章 小小 结.833.3.在在计量量经济模型中,加入虚模型中,加入虚拟解解释变量的途径有量的途径有两种基本两种基本类型:一是加法型:一是加法类型;二是乘法型;二是乘法类型。型。以加法方式引入虚以加法方式引入虚拟变量改量改变的是模型的截距;的是模型的截距;以乘法方式引入虚以乘法方式引入虚拟变量改量改变的是模型的斜率。的是模型的斜率。4.4.解解释变量只有一个分量只有一个分为两种相互排斥两种相互排斥类型的定性型的定性变量而无定量量而无定量变量的回量的回归,称,称为方差分析模型。方差分析模型。.845.5.解解释变量包含一个分量包含一个分为两种两种类型定性型定性变量的回量的回归时,只使用了一个虚,只使用了一个虚拟变量;解量;解释变量包含一个量包含一个两种以上两种以上类型的定性型的定性变量的回量的回归时,定性,定性变量有量有m种种类型,依据虚型,依据虚拟变量量设置置规则引入了引入了m-1个个虚虚拟变量。量。6.6.解解释变量包含两个(或量包含两个(或k个)定性个)定性变量的回量的回归中,中,可可选用了两个(或用了两个(或k个)虚个)虚拟变量去表示,量去表示,这并并不会出不会出现“虚虚拟变量陷阱量陷阱”。.857.7.以乘法形式引入虚以乘法形式引入虚拟解解释变量的主要作用在于:量的主要作用在于:对回回归模型模型结构构变化的化的检验;定性因素;定性因素间交互交互作用的影响分析;分段作用的影响分析;分段线性回性回归等。等。.86第八章第八章 结 束束 了!了!.上机上机实验安排安排14、15周周四周周四5-8节到院机房(紫竹到院机房(紫竹225)上)上课5、6节营销1、2,营销5(学号(学号38-53)7、8节营销3、4,营销5(学号(学号56-70)注:注:16周周四提前到周周四提前到15周周四周周四87.881、由lnX=1时X=2.7183,也就是说,人均收入每增加2.7183倍,平均意义上各国的期望寿命会增加9.39岁。若为富国时,Di=1,则平均意义上,富国的人均收入每增加2.7183倍,其期望寿命就会减少3.36岁,但其截距项的水平会增加23.52,达到21.12的水平。但从统计检验结果看,对数人均收入lnX对期望寿命Y的影响并不显著。方程的拟合情况良好,可进一步进行多重共线性等其他计量经济学的检验。2、若Di=1代表富国,则引入Di(1nXi-7)的原因是想从截距和斜率两个方面考证富国的影响,其中,富国的截距为21.12(-2.40+3.367),斜率为6.03(9.39-3.36),因此,当富国的人均收入每增加2.7183倍,其期望寿命会增加6.03岁。3、对于贫穷国,设定Di=1为贫穷国,Di=0为富国,则引入的虚拟解释变量的形式为Di(7-lnx);对于富国,回归模型形式不变。4、.此课件下载可自行编辑修改,此课件供参考!此课件下载可自行编辑修改,此课件供参考!部分内容来源于网络,如有侵权请与我联系删除!部分内容来源于网络,如有侵权请与我联系删除!
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!