倾向值匹配模型-(PSM模型)课件

上传人:痛*** 文档编号:251897027 上传时间:2024-11-11 格式:PPT 页数:46 大小:616.04KB
返回 下载 相关 举报
倾向值匹配模型-(PSM模型)课件_第1页
第1页 / 共46页
倾向值匹配模型-(PSM模型)课件_第2页
第2页 / 共46页
倾向值匹配模型-(PSM模型)课件_第3页
第3页 / 共46页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,编辑母版文本样式,第二级,第三级,第四级,第五级,精选ppt,*,单击此处编辑母版标题样式,编辑母版文本样式,第二级,第三级,第四级,第五级,精选ppt,*,单击此处编辑母版标题样式,编辑母版文本样式,第二级,第三级,第四级,第五级,精选ppt,*,单击此处编辑母版标题样式,编辑母版文本样式,第二级,第三级,第四级,第五级,精选ppt,*,单击此处编辑母版标题样式,编辑母版文本样式,第二级,第三级,第四级,第五级,精选ppt,*,单击此处编辑母版标题样式,编辑母版文本样式,第二级,第三级,第四级,第五级,精选ppt,*,单击此处编辑母版标题样式,编辑母版文本样式,第二级,第三级,第四级,第五级,精选ppt,*,单击此处编辑母版标题样式,编辑母版文本样式,第二级,第三级,第四级,第五级,精选ppt,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,二级,三级,四级,五级,精选ppt,*,倾向值匹配法(,PSM,),1,精选ppt,Q,:为什么要使用,PSM,?,A,:解决样本选择偏误带来的内生性问题,例:上北大有助于提高收入吗?,样本选择偏误:考上北大的孩子本身就很出色(聪明、有毅力、能力强,),解决方法:样本配对,2,精选ppt,配对方法,同行业(一维配对),同行业、规模相当(二维配对),同行业、规模相当、股权结构相当、,(多维配对)?,PSM,:把多个维度的信息浓缩成一个(降维:多维到一维),3,精选ppt,配对过程中的两个核心问题(,1,),Q1,:哪个样本更好一些?,A1:Sample2,较好:比较容易满足共同支撑假设(,common support assumption,),4,精选ppt,配对过程中的两个核心问题(,2,),Q2,:,stu c1,c2,c3,三人中,谁是,stu PK,的最佳配对对象?,A2,:,stu c3,是最佳配对对象,比较容易满足平行假设(,balancing assumption,),5,精选ppt,ATT,(,Average Treatment Effect on the Treated,)平均处理效应的衡量,运用得分进行样本匹配并比较,估计出,ATT,值。,ATT=EY(1)-Y(0)|T=1,Y(1):Stu PK,上北大后的年薪,Y(0):Stu PK,假如不上北大的年薪,可观测数据,不可观测数据,采用配对者的收入来代替,ATT=12W-9W=3W,6,精选ppt,实例介绍,7,精选ppt,实例介绍,研究问题:培训对工资的效应,基本思想:分析接受培训行为与不接受培训行为在工资表现上的差异。但是,现实,可以观测到的,是处理组接受培训的事实,而如果处理组没有接受培训会怎么样是,不可观测的,,这种状态称为反事实。匹配法就是为了解决这种不可观测的事实的方法。,8,精选ppt,实例介绍,分组:在倾向值匹配法中,根据处理指示变量将样本分为两个组。,处理组,,在本例中就是在,NSW,(国家支持工作示范项目)实施后接受培训的组;,控制组,,在本例中就是在,NSW,实施后不接受培训的组。,研究目的:通过对处理组和对照组的匹配,在其他条件完全相同的情况下,通过接受培训的组(处理组)与不接受培训的组(控制组)在工资表现上的差异来判断接受培训的行为与工资之间的因果关系。,9,精选ppt,变量定义,变量,定义,treat,接受培训(处理组)表示,1,,没有接受培训(控制组)表示,0,age,年龄,educ,受教育年数,black,种族虚拟变量,黑人时,,black=1,hsip,民族虚拟变量,西班牙人时,,hsip=1,marr,婚姻状况虚拟变量,已婚,,marr=1,re74,1974,年实际工资,re75,1975,年实际工资,10,精选ppt,变量定义,re78,1978,年实际工资,u74,当在,1974,年失业,,u74=1,agesq,age*age,educsq,educ*educ,re74sq,re74*re74,re75sq,re75*re75,u74blcak,u74*blcak,11,精选ppt,倾向打分,12,精选ppt,OLS,回归结果,工资的变化到底是来自个体的异质性,性还是培训?,13,精选ppt,倾向打分,1.,设定宏变量,(1),设定宏变量,breps,表示重复抽样,200,次,命令:,global breps 200,(2),设定宏变量,x,,表示,age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black,命令:,global x age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black,14,精选ppt,倾向打分,2.,通过,logit,模型进行倾向打分,命令:,pscore treat$x,pscore(mypscore)blockid(myblock)comsup numblo(5)level(0.05)logit,注,:$,表示引用宏变量,15,精选ppt,pscore,结果,16,精选ppt,倾向值分布,17,精选ppt,倾向值分布,18,精选ppt,block,中样本的分布,19,精选ppt,block,中的描述性统计,20,精选ppt,运用得分进行样本匹配并比较,21,精选ppt,方法一:最邻近方法(,nearest neighbor matching,),含义:最邻近匹配法是最常用的一种匹配方法,它把控制组中找到的与处理组个体倾向得分差异最小的个体,作为自己的比较对象。,优点:按处理个体找控制个体,所有处理个体都会配对成功,处理组的信息得以充分使用。,缺点:由于不舍弃任何一个处理组,很可能有些配对组的倾向得分差距很大,也将其配对,导致配对质量不高,而处理效应,ATT,的结果中也会包含这一差距,使得,ATT,精确度下降。,22,精选ppt,方法一:最邻近方法(,nearest neighbor matching,),命令,set seed 10101,(产生随机数种子),attnd re78 treat$x,comsup boot reps($breps)dots logit,23,精选ppt,方法一:最邻近方法(,nearest neighbor matching,),24,精选ppt,方法二:半径匹配法(,radius matching,),半径匹配法是事先设定半径,找到所有设定半径范围内的单位圆中的控制样本,半径取值为正。随着半径的降低,匹配的要求越来越严。,25,精选ppt,方法二:半径匹配法(,radius matching,),命令,set seed 10101,attr re78 treat$x,comsup boot reps($breps)dots logit radius(0.001),26,精选ppt,方法二:半径匹配法(,radius matching,),27,精选ppt,方法三:分层匹配法(,stratification matching,),内容:分层匹配法是根据估计的倾向得分将全部样本分块,使得每块的平均倾向得分在处理组和控制组中相等。,优点:,Cochrane,Chambers,(,1965,)指出五个区就可以消除,95%,的与协变量相关的偏差。这个方法考虑到了样本的分层问题或聚类问题。就是假定:每一层内的个体样本具有相关性,而各层之间的样本不具有相关性。,缺点:如果在每个区内找不到对照个体,那么这类个体的信息,会丢弃不用。总体配对的数量减少。,28,精选ppt,方法三:分层匹配法(,stratification matching,),命令,set seed 10101,atts re78 treat,pscore(mypscore)blockid(myblock)comsup boot reps($breps)dots,29,精选ppt,方法三:分层匹配法(,stratification matching,),30,精选ppt,方法四:核匹配法(,kernel matching,),核匹配是构造一个虚拟对象来匹配处理组,构造的原则是对现有的控制变量做权重平均,权重的取值与处理组、控制组,PS,值差距呈反向相关关系。,31,精选ppt,方法四:核匹配法(,kernel matching,),命令,set seed 10101,attk re78 treat$x,comsup boot reps($breps)dots logit,32,精选ppt,方法四:核匹配法(,kernel matching,),33,精选ppt,psmatch2,34,精选ppt,匹配变量的筛选,1.,设定宏变量,设定宏变量,x,,表示,age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black,命令:,global x age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black,35,精选ppt,匹配变量的筛选,2.,初步设定,logit treat$x,36,精选ppt,匹配变量的筛选,3.,逐步回归,stepwise,pr(0.1):logit treat$x,37,精选ppt,ps,值的计算,psmatch2 treat$x,out(re78),倾向得分的含义是,在给定,X,的情况下,样本处理的概率值。利用,logit,模型估计样本处理的概率值。概率表示如下:,P(x)=PrD=1|X=ED|X,38,精选ppt,匹配处理组,最近邻匹配,命令:,psmatch2 treat$x,(,if soe=1,),out(re78)neighbor(2)ate,半径匹配,命令:,psmatch2 treat$x,out(re78)ate radius caliper(0.01),核匹配,命令:,psmatch2 treat$x,out(re78)ate kernel,39,精选ppt,匹配处理组,满足两个假设:,A,共同支撑假设,B,平行假设,40,精选ppt,ATT,(平均处理效应的衡量),以半径匹配为例:,psmatch2 treat$x,out(re78)ate radius caliper(0.01),1,2,3,1,、处理组平均效应(,ATT,),2,、控制组平均效应(,ATU,),3,、总体平均效应(,ATE,),41,精选ppt,ATT,(平均处理效应的衡量),匹配前后变量的差异对比,命令:,pstest re78$x,(,pstest re78$x,both graph,),42,精选ppt,匹配前后密度函数图,twoway(kdensity _ps if _treat=1,legend(label(1 Treat)(kdensity _ps if(_wei!=1&_wei!=.),legend(label(2 Control),xtitle(Pscore)title(After Matching),twoway(kdensity _ps if _treat=1,legend(label(1 Treat)(kdensity _ps if _treat=0,legend(label(2 Control),xtitle(Pscore)title(Before Matching),43,精选ppt,运用,bootstrap,获得,ATT,标准误,命令:,bootstrap,reps(#):psmatch2 treat$x,out(re78),在统计分析中,样本较少,采用,bootstrap,,可以减少小样本偏误。,步骤:首先,从原始样本中可重复地随机抽取,n,个观察值,得到经验样本;然后采用,PSM,计算改经验样本的平均处理效果,ATT,;将
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!