第六章虚拟变量回归模型(最新)

上传人:仙*** 文档编号:245190553 上传时间:2024-10-07 格式:PPT 页数:37 大小:249.50KB
返回 下载 相关 举报
第六章虚拟变量回归模型(最新)_第1页
第1页 / 共37页
第六章虚拟变量回归模型(最新)_第2页
第2页 / 共37页
第六章虚拟变量回归模型(最新)_第3页
第3页 / 共37页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第五章 简要总结:各模型的斜率值B2含义,线性回归模型:,解释变量每变动一个单位,被解释变量变动的绝对量,双对数模型:,解释变量每变动一个百分点,被解释变量变动的百分数,对数-线性模型:,解释变量每变动一个单位,被解释变量均值的(瞬时)增长率,线性-对数模型:,解释变量相对变动一个百分点,被解释变量变动的绝对量,倒数模型:,解释变量的倒数每变动一个单位,被解释变量变动的绝对量,第六章 虚拟变量回归,模型,一、虚拟变量的基本含义,二、虚拟变量的引入,方式,三、虚拟变量的设置原则,四、虚拟变量在季节分析中的应用,五、因变量是虚拟变量的模型:LPM,总结,一个实际案例:虚拟变量的引入,2,一、虚拟变量的基本含义,许多经济变量是,可以,用数值加以,定量度量,的,,如:,商品需求量、价格、收入、产量等,这类变量一般称为,定量变量,但也有一些影响经济变量的因素,无法定量度量,,,如:“,职业”、“性别”对收入的影响,“战争”、“自然灾害”对,GDP,的影响,“季节”对某些产品(如冷饮)销售的影响等等。,为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”,,3,这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“,0”,或“,1”,的人工变量,通常,将定性变量,称为,虚拟变量,(,dummy variables,),,或,二元变量,二分变量,分类变量,指标变量,.,记为,D,。,(不要用X作为虚拟变量符号),例如,,反映,文,化,程度,的虚拟变量可取为,:,1,,本科学历,D=,0,,非本科学历,一般地,在虚拟变量的设置中:,基础类型、肯定类型取值为,1,;,比较类型,否定类型取值为,0,。,4,概念:,解释变量只,含有虚拟变量的模型,称,为,方差分析,(,analysis-of variance:ANOVA,),模型,。,Y=B1+B2*D+,Y为职工薪金,,D,i,=,1,女性;,D,i,=,0,男性,而,同时含有一般解释变量与虚拟变量的模型,称为,协,变量模型,(,analysis-of,co,variance:AN,C,OVA,),模型,。,一个以,工龄和,性别,虚拟变量,为解释变量,考察企业职工薪金的模型:,其中:,Y,i,为企业职工的薪金,,X,i,为工龄,,Di=,1,女性;,D,i,=,0,男性;,方差分析模型中参数的含义,E(Y,|D,=0)=B1+B2(0)=B1,E(Y,|D,=1)=B1+B2(1)=B1+B2,B1:企业男性职工的平均薪金,B2:企业女性职工的平均薪金与男性职工的差异,称为,差别截距系数.,B1+B2:企业女性职工的平均薪金,二、虚拟变量的引入,方式,虚拟变量做为解释变量引入模型有两种基本方式:,加法方式,和,乘法方式,。,企业男职工的平均薪金为:,上述企业职工薪金模型中“性别”虚拟变量的引入采取了加法方式。,1,、加法方式,7,企业女职工的平均薪金函数为:,几何意义:,假定,2,0,,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差,2,。,可以通过传统的回归检验,对,2,的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。,0,2,8,例题,6-1,:男女食品支出和税后收入的关系。,P134,(方差分析模型:,6-4,)被解释变量:食品支出,解释变量:性别:女性=1,男性=0,结论:因为B2回归结果不显著,表明男、女平均食品支出差异不显著,(协变量模型:,6-9,)被解释变量:食品支出;P138,解释变量:税后收入:X、性别:D,9,(,6-23,),被解释变量:食品支出;,解释变量:税后收入、性别、税后收入,*,性别,10,1,、分别写出(,6-4,)、(,6-9,)的估计方程。,2,、进一步写出男性、女性的估计方程。,3,、根据估计结果,解释偏回归系数含义。,Dependent Variable:Y,VariableCoefficientStd.Errort-StatisticProb.,C3176.833233.044613.631870.0000,SEX-503.1667329.5749-1.5267140.1578,R-squared0.189026,(,6-4,)被解释变量:食品支出;解释变量:性别,Dependent Variable:Y,VariableCoefficientStd.Errort-StatisticProb.,C2673.667233.044611.472770.0000,SEX2503.1667329.57491.5267140.1578,R-squared0.189026,性别赋值:男性,=1,,女性,=0,;,性别赋值:男性,=0,,女性,=1,;,11,Dependent Variable:Y,VariableCoefficientStd.Errort-StatisticProb.,C1506.244188.00968.0115290.0000,INCOME,0.0589820.0061179.6417450.0000,SEX-228.9868107.0582-2.1388990.0611,R-squared0.928418,(,6-9,)被解释变量:食品支出;,P138,解释变量:税后收入、性别,12,例,2,:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。,教育水平考虑,三个层次(或分类),:高中以下,,高中,,大学及其以上,模型可设定如下:把“高中以下”作为基准水平,这时需要引入,两个,虚拟变量:,13,在,E(,i,),=0,的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:,高中以下:,高中:,大学及其以上:,假定,3,2,,其几何意义:,14,可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。,例,4,:,如,在上述职工薪金的例中,再引入代表“学历”的虚拟变量,D,2,:,本科及以上学历,本科以下学历,职工薪金的回归模型可设计为:,15,男性,女性,女职工本科以下学历的平均薪金:,女职工本科以上学历的平均薪金:,于是,不同性别、不同学历职工的平均薪金分别为:,男职工本科以下学历的平均薪金:,男职工本科以上学历的平均薪金:,16,2,、乘法方式,加法方式引入虚拟变量,考察:,截距的不同,,,许多情况下:往往是斜率就有变化,,或斜率、截距同时发生变化,。,斜率的变化可通过以乘法的方式引入虚拟变量来测度,。,17,18,例,5,:,根据消费理论,消费水平,C,主要取决于收入水平,Y,,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。,即以乘法方式引入虚拟变量。,这里,虚拟变量,D,以与,X,相乘的方式引入了模型中,从而可用来考察消费倾向的变化。,假定,E(,i,),=0,,,上述模型所表示的函数可化为:,正常年份:,反常年份:,如,设,消费模型可建立如下:,19,当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量,。,例,,,考察,1990,年前后的中国居民的总储蓄,-,收入关系是否已发生变化。,下表中给出了中国,19792001,年以城乡储蓄存款余额代表的居民储蓄以及以,GNP,代表的居民收入的数据。,20,21,以,Y,为储蓄,,X,为收入,可令:,1990,年前:,Y,i,=,1,+,2,X,i,+,1i,i=1,2,n,1,1990,年后:,Y,i,=,1,+,2,X,i,+,2i,i=1,2,n,2,则有可能出现下述四种情况中的一种:,(1),1,=,1,,且,2,=,2,,即两个回归相同,称为,一致,回归,(,Coincident Regressions,);,(2),1,1,但,2,=,2,,即两个回归的差异仅在其截距,称为,平行回归,(,Parallel Regressions,),;,(3),1,=,1,,但,2,2,,即两个回归的差异仅在其斜率,称为,并发回归,或,汇合回归,(,Concurrent Regressions,),;,(4),1,1,,且,2,2,,即两个回归完全不同,称为,相异回归,(,Dissimilar Regressions,)。,22,将,n,1,与,n,2,次观察值合并,并用以估计以下回归:,D,i,为引入的虚拟变量:,于是有:,可分别表示,1990,年,后期,与,前期,的储蓄函数。,23,在统计检验中,如果,4,=0,的假设被拒绝,则说明两个时期中储蓄函数的斜率不同。,具体的回归结果为:,(-6.11)(22.89)(4.33)(-2.55),由,3,与,4,的,t,检验可知:参数显著地不等于,0,,强烈显示出两个时期的回归是相异的,,储蓄函数分别为:,1990,年前:,1990,年后:,=0.9836,24,例题,6-1,:男女食品支出和税后收入的关系。P134,(,6-4,)被解释变量:食品支出;P135,解释变量:性别,(,6-9,)被解释变量:食品支出;P138,解释变量:税后收入、性别,25,(,6-23,),被解释变量:食品支出;P143,解释变量:税后收入、性别、税后收入,*,性别,26,1,、写出(,6-23,)的估计方程。P145,2,、进一步写出男性、女性的估计方程。,3,、解释偏回归系数含义。,27,Dependent Variable:Y,VariableCoefficientStd.Errort-StatisticProb.,C1432.577248.47825.7654040.0004,INCOME,0.0615830.0083497.3760910.0001,SEX-67.89322350.7645-0.1935580.8513,XD-0.0062940.012988-0.4845950.6410,R-squared0.930459,(,6-24,)P145,三、虚拟变量的设置原则,虚拟变量的个数须按以下原则确定:,每一定性变量所需的虚拟变量个数要比该定性变量的类别数少,1,,即如果定性变量有,m,个,分类,,只在模型中引入,m-1,个虚拟变量。,例,。,已知冷饮的销售量,Y,除受,k,种定量变量,X,k,的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季,(“季节”有四个分类),的影响,只需引入三个虚拟变量即可:,28,则冷饮销售量的模型为:,在上述模型中,若再引入第四个虚拟变量,则冷饮销售模型变量为:,29,如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则式中的:,显然,,(,X,D,),中的第,1,列可表示成后,4,列的线性组合,参数无法唯一求出。,这就是所谓的“,虚拟变量陷井,”,,应避免。,30,四、,虚拟变量在季节分析中的应用,季节调整:,把季节成分从一个时间序列中剔除的过程,称为消除季节成分或季节调整。,方法,:虚拟变量法,得到季节调整的时间序列操作步骤,:,1,、根据引入虚拟变量的季节调整回归模型求得因变量的估计值,2,、用,y,的实际值减去,y,的估计值,求得残差,e,3,、最后,用残差值,e,加上,y,均值,即得到经季节调整后的时间序列。,五、,因变量是虚拟变量:线性概率模型,此处主要讨论作为因变量的虚拟变量是二分变量(或二元变量),即因变量只有两种情形,如,人的性别为“男”、“女”,考试分为“及格”、“不及格”,等等。,如教材中第,149,页,,举例:房子获得贷款与个人年收入模型,Y=B,1,+B,2,X+,其中,,Y=1,表示申请到房贷;,Y=0,,表示没有申请到房贷,则斜率系数,B2,的含义:,自变量 变动一个单位,引起的,y=1,的概率的变化。,线性概率模型存在的问题,1,、虽然因变量赋值为,1,或,0,,但无法保证其
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!