资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,金融计量经济第五讲,虚拟变量模型和Probit、Logit模型,1,第一节 虚拟变量的一般应用,一、虚拟变量及其作用,1.定义:取值为0和1的人工变量,表示非量化(定性)因素对模型的影响,一般用符号D表示。例如:政策因素、地区因素、心理因素、季节因素等。,2.作用:,描述,和,测量,定性因素的影响;,正确反映经济变量之间的相互关系,提高模型的,精度;,便于处理,异常,数据。,2,二、虚拟变量的设置原则,引入虚拟变量一般取0和1。,对定性因素一般取级别数减1个虚拟变量。例子1:性别因素,二个级别(男、女)取一个虚拟变量,D=1表示男(女),D=0表示女(男)。,例子2:季度因素,四个季度取3个变量。,小心“虚拟变量陷阱”!,3,三、虚拟变量的应用,1、在常数项引入虚拟变量,改变截距。,对上式作OLS,得到参数估计值和回归模型:,(5.2)相当于两个回归模型:,4,5,2、在斜率处引入虚拟变量,改变斜率。,作OLS后得到参数估计值,回归模型为:,同样可以写成二个模型:,可考虑同时在截距和斜率引入虚拟变量:,6,7,3、虚拟变量用于季节性因素分析。,取,原模型若为,则引入虚拟变量后的模型为:,回归模型可视为:,8,例题:美国制造业的利润销售额行为,模型:,利用19651970年六年的季度数据,得结果:,括号内为t统计值。,显然,三季度和四季度与一季度差异并不明显,重新回归,仅考虑二季度,有结果:,9,4、引用虚拟变量处理“时间拐点”问题。,常见的情况:,a.若T,0,为两个时间段之间的某个拐点,虚拟变量为:,b.用虚拟变量表示某个特殊时期的影响;,模型中虚拟变量可放在截距项或斜率处。,10,5、分阶段计酬问题。,若工作报酬与业务量挂钩,且不同业务量提成比例不一样(递增),设S1、S2为二个指标临界点,工资模型为:,11,S1,S2,S0,D1=1,D2=1,12,作OLS得到参数估计值后,三个阶段的报酬回归模型为:,13,例子:佣金与销售额的关系:,模型:,样本回归函数:,14,附录:Chow检验(邹氏检验),Chow检验有二个内容,断点检验和预测检验。和虚拟变量模型作用有相近之处的是断点检验(Chow Breakpoint Test)。,步骤:在回归分析结果窗口,点ViewStabiliti TestChow Breakpoint Test,注:邹氏应是邹至庄。,15,例1:储蓄余额与国民收入的关系,CXYE=-1878.817965+5.965038605*GMSR+812.1046287*D1,19521977:,CXYE=-1066.71+5.965*GMSR,19781990:,CXYE=-1878.82+5.965*GMSR,16,GMSR,17,虚拟变量用于斜率,CXYE=-1217.425+5.209*GMSR+1.13*(D1*GMSR),19521977:,CXYE=-1217.425+6.339*GMSR,19781990:,CXYE=-1217.425+5.209*GMSR,18,GMSR,CXYE,19,应用例题1:Hedonic住宅价格模型,也称特征价格模型。其核心认为住宅价格由若干hedonic(可享受的)特征构成,包括房屋建筑特征、区位特征、社区特征等。,该模型常用于计算住宅价格指数。,一般形式:,20,利用杭州市2004年二手房交易数据作一回归:,21,应用例题2:股息税削减对股价的影响,背景资料,2005年6月14日,财政部、税务总局发文,规定对个人投资者从上市公司取得的股息红利所得,暂减按50%计入个应纳税所得额(红利税从20%降为10%)。,利用事件分析法分析该政策对股价有无显著影响,即政策出台前后股票有无异常收益。时间窗口为发布日及前后各二天。,模型:,其中:表示第i个股票的日收益率,表示上证A股指数的日收益率。D1-D5分别是时间窗口的虚拟变量。,22,复旦大学经济学院的研究生张立早*将普通股分为,不受政策影响、受政策影响和未来有影响,三组,发现股息税削减政策对第二、三组都有显著影响,且政策出台前二天的股价涨幅较大。,说明什么问题?,政策效应?!,内幕消息?,(用虚拟变量表示时间窗口,同样可以分析事件效应,比传统的事件分析法要简便。),*,2006年10月28-29日南京财大会议论文。,23,例3:应用虚拟变量分析股市的“日历效应”,周内效应,周末效应,日内效应,节日效应,24,离散选择模型,(discrete choice models),以虚拟变量为,被解释变量,的模型被称之为离散选择模型。,离散选择模型,除了应用于主要的交通需求问题之外,教育及职业的选择、消费者商品的需求,以及居住地点的选择等方面。,国内常用的离散选择模型有,Logit模型、Probit模型。,2000 年度诺贝尔经济学奖获得者詹姆斯赫克曼(J ames Heckman)教授和丹尼尔麦克法登(Daniel McFadden)教授,其微观经济计量的成果的主要工具就是离散选择模型。,25,第二节 虚拟被解释变量模型,问题1:对于商业银行,企业贷款可能出现违约,也就是说一家企业贷款后有违约和不违约两种可能,如何甄别?(李萌,2005),问题2:证券投资者在特定时期内的投资选择是买或不买,如何确定这样的选择?(王冀宁等,2003),问题3:上市公司出现经营问题,可能成为ST、PT,是什么原因导致这样的结果?,26,虚拟变量作为被解释变量,这类模型称离散被解释变量数据计量经济学模型(Models with Discrete Dependent Variables),或:离散选择模型(DCM,Discrete Choice Model),仅取0与1的离散选择模型称为二元选择模型,这是本讲需要介绍的主要内容。,27,原始模型:,其中Y为观测值取1和0的虚拟被解释变量,X为解释变量。,模型的样本形式:,因为 ,所以,令:,于是有:,即有:,28,但因为,模型具有明显的异方差性,故而用模型(5.8)直接进行参数估计是不合适的。,另外,由于要求 亦难以达到。,实际应用中,用效用模型来求参数估计值:,其中:,29,效用模型的极大似然估计,一般情况下离散选择模型用Probit或Logit模型,二者都是对称函数。假如Y的概率分布函数为 ,则有:,30,所以有似然函数:,或者:,对数似然函数为:,对数似然函数最大化的一阶条件为,参数估计由上式求出。其中 为密度函数。,31,Probit和Logit模型,Probit模型中随机误差项服从标准正态分布,有,概率密度函数是,Logit模型将逻辑(logistic)分布作为随机误差项的概率分布而推导得到的,有,32,Probit和Logit模型的参数估计,李子奈书中将两类模型参数估计分为二种情况:“重复观测值不可以得到”和“可以得到”。前者的参数估计可以用模型(5.13)式来求得,用“完全信息的极大似然法”估计参数。,若重复观测值可以得到,则采用广义最小二乘法估计参数:,其中 表示随机误差项的方差协方差矩阵,实际应用中一般用估计值来代替。,33,Probit和Logit模型的,变量显著性检验,两种模型用于显著性检验的统计量为Wald统计量、LR统计量(最大似然比)和LM统计量(拉格朗日乘子),这几个指标软件包中均有。,零假设为:,备择假设为:,Wald统计量:其中,LR、LM统计量:,其中 分别为零假设和备选假设情况下似然函数值的估计量。,34,z,-5,-4,-3,-2,-1,0,1,2,3,4,5,0,.2,.4,.6,.8,1,P,logistic函数,logistic函数曲线,P=F(Z),35,Probit和Logit模型的参数估计,Eviews中,点quickEstimate Equation,在Method中选择BINARY,再在上方选择方法(probitlogitextreme value 三选一),在变量框中依次输入被解释变量、解释变量即可。,36,例:中国ST上市公司结构分析,利用上市公司公告信息讨论ST公司的影响因素。样本中有ST公司,也有非ST公司,另有ST*公司。,37,VariableCoefficientStd.Errorz-StatisticProb.,C3.433275 1.315134 2.610590 0.0090,X1-4.1141962.436005 -1.688911 0.0912,X2-1.2622740.385405 -3.2751850.0011,X3-0.5489980.615274 -0.8922810.3722,Mean dependent var0.500000 S.D.dependent var0.504219,S.E.of regression0.324276 Akaike info criterion0.710744,Sum squared resid5.888658 Schwarz criterion0.850367,Log likelihood-17.32233 Hannan-Quinn criter.0.765358,Restr.log likelihood-41.58883 Avg.log likelihood-0.288705,LR statistic(3 df)48.53301,McFadden R-squared0.583486,Probability(LR stat)1.64E-10,Obs with Dep=030 Total obs60,Obs with Dep=130,利用Probit模型回归的结果:,38,利用Logit模型回归结果:,Variabl Coefficient Std.Error z-Statistic Prob.,C5.659853043032.290320194592.471206015820.013465821841,X1-6.745127444924.22751913908-1.595528541210.110594092827,X2-2.149184424440.682649060615-3.148300566770.00164222739827,X3-1.275613330131.29404037889-0.9857600666410.324250865967,Mean dependent var0.5 S.D.dependent var0.50421948409,S.E.of regression0.320813610998 Akaike info criterion0.716712990946,Sum squared resid5.7635968880 Schwarz criterion0.856335961761,Log likelihood-17.5013897284,Hannan-Quinn criter.,0.77132721047,Restr.log likelihood-41.5888308336,Avg.log likelihood-0.291689828807,LR statistic(3 df)48.1748822104 McFadden R-squared0.579180530503,Probability(LR stat),1.95459759489e-10,Obs with Dep=030 Total obs60,Obs with Dep=130,39,Many thanks,40,
展开阅读全文