计量经济学第八章虚拟变量回归

上传人:仙*** 文档编号:240911170 上传时间:2024-05-17 格式:PPT 页数:40 大小:559KB
返回 下载 相关 举报
计量经济学第八章虚拟变量回归_第1页
第1页 / 共40页
计量经济学第八章虚拟变量回归_第2页
第2页 / 共40页
计量经济学第八章虚拟变量回归_第3页
第3页 / 共40页
点击查看更多>>
资源描述
计量经济学第八章虚拟变量回归计量经济学第八章虚拟变量回归计量经济学第八章虚拟变量回归计量经济学第八章虚拟变量回归1 引子引子:1、男女大学生的消费真有差异吗、男女大学生的消费真有差异吗?对在校生的对在校生的消费行为消费行为进行调查进行调查,发现在校生的消费行为呈现发现在校生的消费行为呈现多元化的结构多元化的结构。人际交往消费、手机类消费、衣着。人际交往消费、手机类消费、衣着类消费、化妆品类消费、电脑类消费、旅游类消费占有较大的比例;而食品类消费、学习用品类消费不突显。为了类消费、化妆品类消费、电脑类消费、旅游类消费占有较大的比例;而食品类消费、学习用品类消费不突显。为了了解男、女生在了解男、女生在消费支出结构上消费支出结构上的差异,应当如何建立模型?的差异,应当如何建立模型?面临的问题:面临的问题:如何把性别(男、女生)这样的非数量变量引入方程?如何把性别(男、女生)这样的非数量变量引入方程?2020/11/262 问题的一般性描述问题的一般性描述 前面讨论的回归模型中,所遇的变量均为定量变量(可直接测度、数值性)。前面讨论的回归模型中,所遇的变量均为定量变量(可直接测度、数值性)。例如:例如:GDPGDP,工资,收入、受教育年数,销售额等,工资,收入、受教育年数,销售额等.在实际建模时,一些定性变量具有不可忽视的重要影响。在实际建模时,一些定性变量具有不可忽视的重要影响。例如:研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营、非私营)、地理位置(东、例如:研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者的素质、不同的收入水平等是值得考虑的重要影响因素,但这些因素共同的特征是定性描述的。中、西部)、管理者的素质、不同的收入水平等是值得考虑的重要影响因素,但这些因素共同的特征是定性描述的。面临的面临的问题:在同时考虑定量和定性因素的条件下,依据现有的回归分析知识,如何对非定量因素进行回归分问题:在同时考虑定量和定性因素的条件下,依据现有的回归分析知识,如何对非定量因素进行回归分析?析?2020/11/263 一、基本概念一、基本概念 1 1、定量因素、定性因素定量因素、定性因素 定量因素:可直接测度、数值性的因素。定量因素:可直接测度、数值性的因素。定性(属性)因素定性(属性)因素:表示某种属性存在与否的非数值性因素:表示某种属性存在与否的非数值性因素.2 2、虚拟变量的定义、虚拟变量的定义 虚拟变量:取值为虚拟变量:取值为0、1的人工(特殊)变量的人工(特殊)变量。注:虚拟变量的同位语有:哑元变量、定性变量等等。通常用字母注:虚拟变量的同位语有:哑元变量、定性变量等等。通常用字母 D 或或DUM加以表示(英文中虚拟或者哑元加以表示(英文中虚拟或者哑元Dummy的缩写)。的缩写)。第一节第一节 虚拟变量虚拟变量 问题:直接在回归模型中加入定性因素存在诸多的困难,能否采用问题:直接在回归模型中加入定性因素存在诸多的困难,能否采用“虚拟变量虚拟变量”对定性变量进行量化,以达到对定性变量进行量化,以达到定性因素能与定量因素有着相同作用之目的?定性因素能与定量因素有着相同作用之目的?2020/11/264 虚拟变量的设置规则是在回答虚拟变量的设置规则是在回答“如何如何”问题。其规则涉及到以下的三个方面问题。其规则涉及到以下的三个方面:1 1、“0”“0”和和“1”“1”的选取原则的选取原则;2 2、属性(状态、水平)因素与设置虚拟变量数量的关系、属性(状态、水平)因素与设置虚拟变量数量的关系;3 3、虚拟变量在回归分析中的角色及作用等方面的问题、虚拟变量在回归分析中的角色及作用等方面的问题.具体说明如下:具体说明如下:二、虚拟变量的设置规则(原则)二、虚拟变量的设置规则(原则)2020/11/265 1 1、虚拟变量的、虚拟变量的“0”“0”和和“1”“1”选取原则选取原则 取取“0”或或“1”应从分析问题的目的出发予以界定。应从分析问题的目的出发予以界定。“0”“0”代表基期(比较的基础,参照物)代表基期(比较的基础,参照物)“1”“1”代表报告期(被比较的效应)。代表报告期(被比较的效应)。例如,比较收入时欲考察例如,比较收入时欲考察性别(定性变量)的作用(性别(定性变量)的作用(差异)差异).当研究男性收入是否高于女性时,当研究男性收入是否高于女性时,是将女性作为比较的基础(参照物),故设是将女性作为比较的基础(参照物),故设男性为男性为“1”“1”,女性为,女性为“0”“0”。2020/11/266 定性因素的属性既可能为两种状态,也可能为多种状态。定性因素的属性既可能为两种状态,也可能为多种状态。例如,性别(男、女两种)、季节(例如,性别(男、女两种)、季节(4 4种状态),地理位置(东、中、西部),行业归属,所有制,收入的分种状态),地理位置(东、中、西部),行业归属,所有制,收入的分组等组等。2 2、属性因素(状态、水平)与虚拟变量数量的关系属性因素(状态、水平)与虚拟变量数量的关系2020/11/267 定性因素定性因素D如何选取?其设置规则为:如何选取?其设置规则为:1)定性因素有)定性因素有m(m=2,3,4,)个相互排斥类型(或特征、水平)个相互排斥类型(或特征、水平),当回归模型有截距项时,模型中只能引入,当回归模型有截距项时,模型中只能引入(m-1)个虚拟变量,否则会陷入)个虚拟变量,否则会陷入“虚拟变量陷阱虚拟变量陷阱”(产生完全共线)。(为什么?)(产生完全共线)。(为什么?)2)回归模型无截距项时,则引入)回归模型无截距项时,则引入m个虚拟变量。个虚拟变量。注:注:“虚拟变量陷阱虚拟变量陷阱”的实质:完全多重共线性。的实质:完全多重共线性。2020/11/268 例(例(一个陷入一个陷入“虚拟变量陷阱虚拟变量陷阱”实例)研究实例)研究居民住房消费支出居民住房消费支出Y Yi i、居民可支配收入、居民可支配收入X Xi i之间的数量关系,回归模型之间的数量关系,回归模型设定设定为:为:现在要考虑城镇居民和农村居民之间的差异,如何办?现在要考虑城镇居民和农村居民之间的差异,如何办?为了对为了对“城镇居民城镇居民”、“农村居民农村居民”进行区分,分析各自在住房消费支出进行区分,分析各自在住房消费支出 Y Yi i 上的差异,设上的差异,设 只设定一个虚拟变量原因:模型有截距,只设定一个虚拟变量原因:模型有截距,“居民属性居民属性”定性变量只有两个相互排斥的属性状态(定性变量只有两个相互排斥的属性状态(m=2),故只设),故只设定一个虚拟变量。定一个虚拟变量。2020/11/269则模型为则模型为 若在量化只有两个相互排斥属性的若在量化只有两个相互排斥属性的“居民属性居民属性”定性变量时,引入定性变量时,引入 m=2 个虚拟变量。个虚拟变量。模型为模型为 任一家庭都有:任一家庭都有:D1+D2=1,即,即 D1+D2-1=0(完全共线),就(完全共线),就陷入了陷入了“虚拟变量陷阱虚拟变量陷阱”,产生完全共线。,产生完全共线。城镇城镇农村农村2020/11/2610 第二节第二节 虚拟解释变量的回归虚拟解释变量的回归 在计量经济学中,通常引入虚拟变量的方式分为:加法方式和乘法方式两种:即在计量经济学中,通常引入虚拟变量的方式分为:加法方式和乘法方式两种:即实质实质:加法方式引入虚拟变量改变的是截距;加法方式引入虚拟变量改变的是截距;乘法方式引入虚拟变量改变的是斜率。乘法方式引入虚拟变量改变的是斜率。虚拟变量模型:含有虚拟变量的模型称为虚拟变量模型。虚拟变量模型:含有虚拟变量的模型称为虚拟变量模型。2020/11/2611 以加法方式引入虚拟变量时,主要考虑的问题是定性因素的属以加法方式引入虚拟变量时,主要考虑的问题是定性因素的属性和引入虚拟变量的个数。性和引入虚拟变量的个数。分为四种情形讨论:分为四种情形讨论:(1 1)解释变量只有一个定性变量而无定量变量,而且定性变量)解释变量只有一个定性变量而无定量变量,而且定性变量为两种相互排斥的属性;为两种相互排斥的属性;(2 2)解释变量分别为一个定性变量(两种属性)和一个定量解)解释变量分别为一个定性变量(两种属性)和一个定量解释变量;释变量;(3 3)解释变量分别为一个定性变量(两种以上属性)和一个定)解释变量分别为一个定性变量(两种以上属性)和一个定量解释变量;量解释变量;(4 4)解释变量分别为两个定性变量(各自分别是两种属性)和)解释变量分别为两个定性变量(各自分别是两种属性)和一个定量解释变量。一个定量解释变量。一、加法类型一、加法类型2020/11/2612 1、一个两种属性定性解释变量而无定量变量的情形一个两种属性定性解释变量而无定量变量的情形2020/11/2613 2 2、一个定性解释变量(两种属性)和一个定量解释变量的情形、一个定性解释变量(两种属性)和一个定量解释变量的情形2020/11/2614XY共同的共同的特征:截距发生改变特征:截距发生改变2020/11/2615 3 3、一个定性解释变量(两种以上属性)和一个定量解释变量的情形、一个定性解释变量(两种以上属性)和一个定量解释变量的情形2020/11/26162020/11/2617 4 4、两个定性解释变量(均为两种属性)和一个定量解释变量的情形、两个定性解释变量(均为两种属性)和一个定量解释变量的情形2020/11/26182020/11/2619XYD1=0,D2=0D1=1,D2=0D1=1,D2=0D1=1,D2=12020/11/2620加法方式引入虚拟变量的一般表达式加法方式引入虚拟变量的一般表达式:基本分析方法基本分析方法:条件期望。条件期望。运用用OLSOLS得到回归结果,再用得到回归结果,再用t-t-检验讨论因素是否对模型有影响检验讨论因素是否对模型有影响.2020/11/2621 基本思想基本思想:以乘法方式引入虚拟变量时,以乘法方式引入虚拟变量时,是在所设立的模型是在所设立的模型中,将虚拟解释变量与其它解释变量(中,将虚拟解释变量与其它解释变量(X Xi i 或为或为D Di i)的乘积,作为新)的乘积,作为新的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的(以下仅讨论虚拟解释变量的(以下仅讨论虚拟解释变量D Di i与与X Xi i乘积作为新变量的情况)。乘积作为新变量的情况)。二、乘法类型二、乘法类型 目的:调整设定模型的斜率系数。目的:调整设定模型的斜率系数。乘法引入方式可分为两种情形讨论乘法引入方式可分为两种情形讨论 (1 1)截距不变;)截距不变;(2 2)截距和斜率均发生变化;)截距和斜率均发生变化;分析手段:仍然是条件期望。分析手段:仍然是条件期望。2020/11/2622(1 1)截距不变的情形)截距不变的情形模型形式:模型形式:例:研究消费支出例:研究消费支出Y Y 受到收入受到收入X X、年份状况、年份状况D D 的影响。的影响。2020/11/2623 (2 2)截距和斜率均发生变化)截距和斜率均发生变化模型形式:模型形式:例:研究消费支出例:研究消费支出Y Y、收入收入X X、年份状况、年份状况D D 间的影响关系。间的影响关系。比较:发生了那些变化?比较:发生了那些变化?2020/11/2624例:改革开放前、后(平均)例:改革开放前、后(平均)“储蓄储蓄收入收入”模型:模型:加法方式引入加法方式引入D:为了区别改革开放前、后储蓄起点的情况(即两:为了区别改革开放前、后储蓄起点的情况(即两 模型的截距变化)模型的截距变化)乘法方式引入乘法方式引入D:为了区别改革开放前、后:为了区别改革开放前、后“储蓄储蓄“关于关于”收入收入”的相对变化情况(即两模型的斜率系数变化)的相对变化情况(即两模型的斜率系数变化)2020/11/2625三、虚拟解释变量综合应用三、虚拟解释变量综合应用 所谓综合应用是指将引入虚拟解释变量的加法方式、所谓综合应用是指将引入虚拟解释变量的加法方式、乘法方式进行综合使用。乘法方式进行综合使用。可以讨论:可以讨论:结构变化分析(结构变化分析(关于两个回归模型的比较关于两个回归模型的比较););因素间的因素间的交互效应分析;交互效应分析;分段回归分析分段回归分析以下仅对以下仅对结构变化分析、分段回归分析结构变化分析、分段回归分析进行讨论:进行讨论:2020/11/26261、结构变化分析(回归模型的比较)、结构变化分析(回归模型的比较)通过对模型的参数检验,可以检验模型是否有不同的结构。即通过对模型的参数检验,可以检验模型是否有不同的结构。即定性变量定性变量D的引入,是否影响不同类型(属性)模型的的引入,是否影响不同类型(属性)模型的 1)平均水平(截距项)?)平均水平(截距项)?2)相对变化(斜率系数)?)相对变化(斜率系数)?3 3)平均水平(截距项)和相对变化(斜率系数)?)平均水平(截距项)和相对变化(斜率系数)?2020/11/2627其中:Yi为第 i 个家庭的消费水平;Xi为第 i 个家庭的收入水平。则D=1:则D=0:例如:城镇居民家庭与农村居民家庭的消费函数不仅在截距上例如:城镇居民家庭与农村居民家庭的消费函数不仅在截距上有差异,边际消费倾向可能也会有所不同。模型可以记为有差异,边际消费倾向可能也会有所不同。模型可以记为2020/11/2628 1 1)城镇、农村居民家庭的消费行为完全一样(截距和斜率系数相等)城镇、农村居民家庭的消费行为完全一样(截距和斜率系数相等)2 2)城镇、农村居民家庭的消费函数是截距变动模型(截距不相等)城镇、农村居民家庭的消费函数是截距变动模型(截距不相等)3 3)城镇、农村居民家庭的消费函数是斜率变动模型(斜率系数不相等)城镇、农村居民家庭的消费函数是斜率变动模型(斜率系数不相等)4)城镇、农村居民家庭的消费函数是截距和斜率变动模型(截距、斜率不等)城镇、农村居民家庭的消费函数是截距和斜率变动模型(截距、斜率不等)通过对上述两个模型的截距、斜率系数检验(比较),可以判断我们讨论的模型属于以下何种类型:通过对上述两个模型的截距、斜率系数检验(比较),可以判断我们讨论的模型属于以下何种类型:2020/11/2629一般:一般:分别回归,有以下四种情况:分别回归,有以下四种情况:2020/11/2630不同截距、斜率的组合图形不同截距、斜率的组合图形重合回归:截距斜率均相同重合回归:截距斜率均相同平行回归:截距不同斜率相同平行回归:截距不同斜率相同共点回归:截距相同斜率不同共点回归:截距相同斜率不同 交叉(不同)回归:截距斜率均不同交叉(不同)回归:截距斜率均不同2020/11/2631 3、分段回归分析(提高模型的描述精度)、分段回归分析(提高模型的描述精度)虚拟变量也可以用来代表数量因素的不同阶段。分段线性回归就是类似情形中常见的一种。虚拟变量也可以用来代表数量因素的不同阶段。分段线性回归就是类似情形中常见的一种。2020/11/2632 例例:设设Y表示奖金、表示奖金、X表示销售额。当销售额低于表示销售额。当销售额低于X*时,奖金与时,奖金与销售额呈某种线性关系;当销售额高于销售额呈某种线性关系;当销售额高于X*时,奖金与销售额呈更加时,奖金与销售额呈更加陡峭的线性关系。如图:陡峭的线性关系。如图:.X*X Y2020/11/2633 例例1:中国城镇居民家庭的储蓄函数:中国城镇居民家庭的储蓄函数 根据我国城镇居民家庭根据我国城镇居民家庭19551985年人均收入年人均收入 和人均储蓄和人均储蓄 的数据资料(以的数据资料(以1955年的物价水平为年的物价水平为100),建立储蓄模型:),建立储蓄模型:第四节第四节 案例分析案例分析用最小二乘法得估计结果为:用最小二乘法得估计结果为:模型隐含着一个重要假定,我国城镇居民家庭的储蓄行为在模型隐含着一个重要假定,我国城镇居民家庭的储蓄行为在1955年至年至1985年期间是不变的。年期间是不变的。假定未必能够成立,因为与居民储蓄有关的许多重要因素在假定未必能够成立,因为与居民储蓄有关的许多重要因素在1979年以后发生了明显变化,主要表现为:年以后发生了明显变化,主要表现为:2020/11/2634 1)在在经经济济体体制制改改革革之之前前,我我国国居居民民的的收收入入一一直直在在低低水水平平上上徘徘徊徊,大大多多数数居居民民家家庭庭的的收收入入仅仅能能维维持持温温饱饱,因因而而平平均储蓄倾向很低,积蓄很少;均储蓄倾向很低,积蓄很少;1979年年后后,我我国国居居民民的的收收入入水水平平迅迅速速提提高高,与与此此同同时时,居居民民储储蓄蓄也也在在大大幅幅增增长长(由由此此看看来来前前、后后两两时时期期,居居民民的储蓄行为有显著差异);的储蓄行为有显著差异);2)在在改改革革开开放放前前的的大大多多数数年年份份,我我国国的的消消费费品品市市场场存存在在严严重重短短缺缺的的现现象象。消消费费者者既既使使有有钱钱也也难难以以买买到到所所需需的的商商品,而不得不把钱暂时存起来。因此,这一时期储蓄带有品,而不得不把钱暂时存起来。因此,这一时期储蓄带有“非自愿非自愿”的性质;的性质;1979年年之之后后,消消费费品品市市场场日日趋趋丰丰富富,消消费费者者储储蓄蓄的的主主要要目目的的之之一一是是购购买买高高档档耐耐用用消消费费品品,储储蓄蓄不不再再具具有有“被被迫迫”性质。性质。为了验证为了验证改革开放前、后改革开放前、后城镇居民储蓄行为的变化,引入城镇居民储蓄行为的变化,引入建立如下截距和斜率同时变动模型:建立如下截距和斜率同时变动模型:2020/11/2635 用最小二乘法得:t=(2.18)(8.1)(3.9)(-9.2)1979年以后:而在19791985年期间,城镇居民边际储蓄倾向高达0.256,即收入增加一元,储蓄平均增加0.256元。1979年以前:估计结果表明:1979年之前,我国城镇居民的边际储蓄倾向仅为0.004,即收入增加一元储蓄平均增加4厘;2020/11/2636 一、虚拟变量:取值为一、虚拟变量:取值为0、1的人工(特殊)变量(记为的人工(特殊)变量(记为D)二、虚拟变量的设置原则二、虚拟变量的设置原则 1、定性因素有、定性因素有m个相互排斥的类型或特征,有截距、无截距的模型中分别只能引入个相互排斥的类型或特征,有截距、无截距的模型中分别只能引入 m-1个、个、m个虚拟变量,个虚拟变量,否则会陷入否则会陷入“虚拟变量陷阱虚拟变量陷阱”(产生完全共线);(产生完全共线);小小 结结 2、虚拟变量取、虚拟变量取“0”或或“1”应从分析问题的目的出发予以界定应从分析问题的目的出发予以界定(多以(多以“0”代表基础类);代表基础类);3、虚拟变量在单一方程中,可以作为解释变量,也可以作为被解释变量。、虚拟变量在单一方程中,可以作为解释变量,也可以作为被解释变量。2020/11/2637 三、三、加入虚拟变量的两种基本途径:加法类型、乘法类型。加入虚拟变量的两种基本途径:加法类型、乘法类型。1、加法类型、加法类型 其作用:设定模型的截距水平变动其作用:设定模型的截距水平变动 2、乘法类型、乘法类型 其作用:设定模型的斜率变动其作用:设定模型的斜率变动 特别(加法、乘法):设定模型的截距、斜率同时变动特别(加法、乘法):设定模型的截距、斜率同时变动 四、乘法类型引入虚拟变量的主要作用:四、乘法类型引入虚拟变量的主要作用:1、关于两个回归模型的比较、关于两个回归模型的比较(结构变化结构变化);2、因素间的交互效应影响的分析;、因素间的交互效应影响的分析;3、提高模型对现实经济现象的描述精度、提高模型对现实经济现象的描述精度(分段回归分析分段回归分析)。2020/11/2638 第第 八八 章章 结结 束束 了!了!2020/11/2639谢谢!谢谢!谢谢!谢谢!40
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!