包含虚拟变量的回归分析

上传人:沈*** 文档编号:195289405 上传时间:2023-03-16 格式:PPT 页数:42 大小:244KB
返回 下载 相关 举报
包含虚拟变量的回归分析_第1页
第1页 / 共42页
包含虚拟变量的回归分析_第2页
第2页 / 共42页
包含虚拟变量的回归分析_第3页
第3页 / 共42页
点击查看更多>>
资源描述
第七讲第七讲 包含虚拟变量的回归分析包含虚拟变量的回归分析Regression Analysis with Dummy Variables 一、什么是虚拟变量?一、什么是虚拟变量?二、自变量中包含虚拟变量二、自变量中包含虚拟变量三、因变量为虚拟变量三、因变量为虚拟变量一、什么是虚拟变量?一、什么是虚拟变量?什么是虚拟变量?什么是虚拟变量?变量的分类变量的分类n 定类定类/类别变量(类别变量(nominal/categorical variable)n 定序定序/有序变量(有序变量(ordinal variable)n 定距定距/定量变量(定量变量(interval variable)a.问题:如何在计量分析中使用定类变量和定序变量问题:如何在计量分析中使用定类变量和定序变量什么是虚拟变量?什么是虚拟变量?o 对于只有两种取值的定类变量,可以用对于只有两种取值的定类变量,可以用0和和1表示这两种取值表示这两种取值。这样的变量称为。这样的变量称为虚拟变量(虚拟变量(dummy variable)或或二分变量二分变量(binary variable)。其中,赋值为。其中,赋值为0的一组称为的一组称为对照组(对照组(reference group)或或基准组(基准组(benchmark group)o 注意:变量名的选择注意:变量名的选择 非亚洲国家非亚洲国家亚洲国家亚洲国家;非党员非党员中共党员中共党员;男性男性女性女性,Asia,CCP,female010101什么是虚拟变量?什么是虚拟变量?o 对于有多个取值的定类变量,可构造多个虚拟变量来表示对于有多个取值的定类变量,可构造多个虚拟变量来表示o 用用east、central、west三个虚拟变量表示不同地区三个虚拟变量表示不同地区o 用用sx、jy、qt三个虚拟变量表示本科生毕业后的状态三个虚拟变量表示本科生毕业后的状态 东部或中部东部或中部西部西部;东部或西部东部或西部中部中部;中部或西部中部或西部东部东部,0,1,0,1,0,1westcentraleast 升升学学或或就就业业其其他他情情况况;未未就就业业就就业业;未未升升学学升升学学,0,1,0,1,0,1qtjysx什么是虚拟变量?什么是虚拟变量?o 对于定序变量和定距变量,也可以用虚拟变量表示对于定序变量和定距变量,也可以用虚拟变量表示o 学习成绩(定序变量)学习成绩(定序变量)o 年收入(定距变量,但通过划分收入区间将之转换为虚拟变量)年收入(定距变量,但通过划分收入区间将之转换为虚拟变量)其他其他不及格不及格;其他其他及格及格;其他其他良好良好;其他其他优秀优秀,0,14,0,13,0,12,0,11gggg 其其他他万万元元以以上上;其其他他万万元元;其其他他万万元元;其其他他万万元元以以下下,010,14,0105,13,051,12,01,11iiiin 自变量中包含一个虚拟变量自变量中包含一个虚拟变量n 自变量中包含多个虚拟变量自变量中包含多个虚拟变量n 交互项交互项二、自变量中包含虚拟变量二、自变量中包含虚拟变量自变量中包含一个虚拟变量自变量中包含一个虚拟变量自变量仅为一个虚拟变量自变量仅为一个虚拟变量o 如果自变量仅为一个虚拟变量,实际上是以自变量为分类依如果自变量仅为一个虚拟变量,实际上是以自变量为分类依据,分析因变量的均值差异据,分析因变量的均值差异类类的的均均值值存存在在显显著著差差异异是是统统计计显显著著的的,说说明明两两若若的的均均值值为为:时时,当当虚虚拟拟变变量量的的均均值值为为:时时,当当虚虚拟拟变变量量对对于于DDYEYDDYEYDuDY10010)1|(1)0|(0,自变量中包含一个虚拟变量自变量中包含一个虚拟变量例题例题7_1:工资差异:工资差异美美元元为为已已婚婚劳劳动动者者的的平平均均工工资资美美元元为为未未婚婚劳劳动动者者的的平平均均工工资资美美元元女女性性的的平平均均工工资资为为美美元元男男性性的的平平均均工工资资为为576731844844)320()250(731844594512107107)300()210(512107.semarried.wage.sefemale.wage 自变量中包含一个虚拟变量自变量中包含一个虚拟变量自变量包含定距变量和一个虚拟变量自变量包含定距变量和一个虚拟变量o 此时,虚拟变量的回归系数表示在控制其它自变量的情况下此时,虚拟变量的回归系数表示在控制其它自变量的情况下,两组之间的差异,两组之间的差异o 例题例题7_2:课本:课本p217,例,例分分比比没没有有计计算算机机的的学学生生高高的的学学生生的的成成绩绩平平均均而而言言相相同同,拥拥有有计计算算机机和和如如果果两两个个学学生生的的1570)0105.0()094.0()057.0()33.0(0087.0447.0157.026.1.ACThsGPAseACThsGPAPCcolGPA 自变量中包含一个虚拟变量自变量中包含一个虚拟变量自变量包含定距变量和一个虚拟变量自变量包含定距变量和一个虚拟变量o 虚拟变量可用于政策分析,虚拟变量取值为虚拟变量可用于政策分析,虚拟变量取值为0的一组称为的一组称为控控制组或对照组(制组或对照组(control group),取值为,取值为1的一组称为的一组称为实验组实验组(experimental group)或或处理组(处理组(treatment group)o 例题例题7_3:课本:课本p218,例,例自变量中包含多个虚拟变量自变量中包含多个虚拟变量o 自变量中包含多个虚拟变量可分为三种情况自变量中包含多个虚拟变量可分为三种情况o 每个虚拟变量代表不同的分类每个虚拟变量代表不同的分类o 若干个虚拟变量代表同一种分类,且这种分类是定类的若干个虚拟变量代表同一种分类,且这种分类是定类的o 若干个虚拟变量代表同一种分类,且这种分类是定序的若干个虚拟变量代表同一种分类,且这种分类是定序的自变量中包含多个虚拟变量自变量中包含多个虚拟变量每个虚拟变量代表不同的分类每个虚拟变量代表不同的分类例题例题7_4:性别和婚姻状况对工资的影响(课本:性别和婚姻状况对工资的影响(课本p220,例)例)o 引入性别和婚姻状况两个虚拟变量引入性别和婚姻状况两个虚拟变量o 上述结果表明,性别对工资有显著影响,但婚姻状况没有上述结果表明,性别对工资有显著影响,但婚姻状况没有显著影响。这一模型可能存在问题,即假定婚姻状况的影显著影响。这一模型可能存在问题,即假定婚姻状况的影响对于男性和女性是相同的。进一步的分析应考虑婚姻状响对于男性和女性是相同的。进一步的分析应考虑婚姻状况的影响存在性别差异。况的影响存在性别差异。_cons .4 41 17 77 78 83 37 7 .0 09 98 88 86 66 62 2 4 4.2 23 3 0 0.0 00 00 0 .2 22 23 35 55 55 57 7 .6 61 12 20 01 11 16 6 tenursq -.0 00 00 05 57 74 44 4 .0 00 00 02 23 34 47 7 -2 2.4 45 5 0 0.0 01 15 5 -.0 00 01 10 03 35 55 5 -.0 00 00 01 11 13 34 4 tenure .0 03 31 12 29 96 62 2 .0 00 06 68 84 48 82 2 4 4.5 57 7 0 0.0 00 00 0 .0 01 17 78 84 42 26 6 .0 04 44 47 74 49 99 9 expersq -.0 00 00 05 53 39 99 9 .0 00 00 01 11 12 22 2 -4 4.8 81 1 0 0.0 00 00 0 -.0 00 00 07 76 60 03 3 -.0 00 00 03 31 19 96 6 exper .0 02 26 69 95 53 35 5 .0 00 05 53 32 25 58 8 5 5.0 06 6 0 0.0 00 00 0 .0 01 16 64 49 90 07 7 .0 03 37 74 41 16 63 3 educ .0 07 79 91 15 54 47 7 .0 00 06 68 80 00 03 3 1 11 1.6 64 4 0 0.0 00 00 0 .0 06 65 57 79 95 52 2 .0 09 92 25 51 14 43 3 married .0 05 52 29 92 21 19 9 .0 04 40 07 75 56 61 1 1 1.3 30 0 0 0.1 19 95 5 -.0 02 27 71 14 45 56 6 .1 13 32 29 98 89 94 4 female -.2 29 90 01 18 83 38 8 .0 03 36 61 11 12 21 1 -8 8.0 04 4 0 0.0 00 00 0 -.3 36 61 11 12 27 79 9 -.2 21 19 92 23 39 96 6 lwage Coef.Std.Err.t P|t|95%Conf.Interval 自变量中包含多个虚拟变量自变量中包含多个虚拟变量每个虚拟变量代表不同的分类每个虚拟变量代表不同的分类例题例题7_4:性别和婚姻状况对工资的影响(课本:性别和婚姻状况对工资的影响(课本p220,例)例)o虚拟变量的定义虚拟变量的定义o如果有如果有n种分类,则回归时只能引入种分类,则回归时只能引入n-1个虚拟变量,否则会造成完全共个虚拟变量,否则会造成完全共线性。未引入的即为对照组。下面是以单身男性为对照组的回归结果线性。未引入的即为对照组。下面是以单身男性为对照组的回归结果:其其他他已已婚婚女女性性;其其他他单单身身女女性性;其其他他已已婚婚男男性性;其其他他单单身身男男性性,0,1,0,1,0,1,0,1mfsfmmsmlwageCoef.Std.Err.tPt95%Conf.Intervalmm0.2127 0.0554 3.8400 0.0000 0.1039 0.3214 sf-0.1104 0.0557-1.9800 0.0480-0.2199-0.0008 mf-0.1983 0.0578-3.4300 0.0010-0.3119-0.0846 自变量中包含多个虚拟变量自变量中包含多个虚拟变量每个虚拟变量代表不同的分类每个虚拟变量代表不同的分类例题例题7_4:性别和婚姻状况对工资的影响(课本:性别和婚姻状况对工资的影响(课本p220,例)例)o 不同性别和婚姻状况个体的样本回归方程不同性别和婚姻状况个体的样本回归方程 edu.lwageedu.lwageedu.lwageedu.lwage0790198.032100790110.032100790213.0321007903210已婚女性:已婚女性:单身女性:单身女性:已婚男性:已婚男性:单身男性:单身男性:自变量中包含多个虚拟变量自变量中包含多个虚拟变量每个虚拟变量代表不同的分类每个虚拟变量代表不同的分类例题例题7_4:性别和婚姻状况对工资的影响(课本:性别和婚姻状况对工资的影响(课本p220,例)例)o 根据研究关注问题的不同,可以选择不同的对照组。根据研究关注问题的不同,可以选择不同的对照组。下面是下面是以已婚女性为对照组的回归结果:以已婚女性为对照组的回归结果:lwageCoef.Std.Err.tPt95%Conf.Intervalsm0.1983 0.0578 3.4300 0.0010 0.0846 0.3119 mm0.4109 0.0458 8.9800 0.0000 0.3210 0.5009 sf0.0879 0.0523 1.6800 0.0940-0.0149 0.1908 自变量包含多个虚拟变量自变量包含多个虚拟变量若干个虚拟变量代表同一种分类,且这种分类是定类的若干个虚拟变量代表同一种分类,且这种分类是定类的例题例题7_5:工资的地区差异:工资的地区差异o northcen=1表示中北部地区表示中北部地区o west=1表示西部地区表示西部地区o south=1表示南部地区表示南部地区o other_region=1表示其他地区表示其他地区o 同样地,如果有同样地,如果有n种分类,回归时只能引入种分类,回归时只能引入n-1个虚拟变量!个虚拟变量!自变量中包含多个虚拟变量自变量中包含多个虚拟变量若干个虚拟变量代表同一种分类,且这种分类是定类的若干个虚拟变量代表同一种分类,且这种分类是定类的例题例题7_5:工资的地区差异:工资的地区差异以其他地区为对照组以其他地区为对照组lwageCoef.Std.Err.tPtnorthcen-0.0783 0.0563-1.39 0.1650 south-0.1048 0.0527-1.99 0.0470 west0.0218 0.0624 0.35 0.7270 educ0.0890 0.0075 11.86 0.0000 exper0.0418 0.0052 8.00 0.0000 expersq-0.0007 0.0001-6.25 0.0000 _cons0.1918 0.1125 1.70 0.0890 自变量中包含多个虚拟变量自变量中包含多个虚拟变量若干个虚拟变量代表同一种分类,且这种分类是定类的若干个虚拟变量代表同一种分类,且这种分类是定类的例题例题7_5:工资的地区差异:工资的地区差异以南部为对照组以南部为对照组lwageCoef.Std.Err.tPtnorthcen0.0265 0.0512 0.52 0.6040 west0.1266 0.0574 2.21 0.0280 other_region0.1048 0.0527 1.99 0.0470 educ0.0890 0.0075 11.86 0.0000 exper0.0418 0.0052 8.00 0.0000 expersq-0.0007 0.0001-6.25 0.0000 _cons0.0870 0.1072 0.81 0.4170 自变量包含多个虚拟变量自变量包含多个虚拟变量若干个虚拟变量代表同一种分类,且这种分类是定序的若干个虚拟变量代表同一种分类,且这种分类是定序的例题例题7_6:法学院排名对起薪的影响(课本:法学院排名对起薪的影响(课本p224,例),例)o 共引入共引入6个虚拟变量表示法学院排名个虚拟变量表示法学院排名排名前排名前10top10=1排名排名11-25r11_25=1排名排名26-40r26_40=1排名排名41-60r41_60=1排名排名61-100r61_100=1排名排名100以后以后bottom=1自变量中包含多个虚拟变量自变量中包含多个虚拟变量若干个虚拟变量代表同一种分类,且这种分类是定序的若干个虚拟变量代表同一种分类,且这种分类是定序的例题例题7_6:如果有:如果有n种排序,回归时引入的虚拟变量数目应少于种排序,回归时引入的虚拟变量数目应少于n,下面,下面是以排名在是以排名在100名以后的为对照组的回归结果名以后的为对照组的回归结果lsalaryCoef.Std.Err.tPttop100.6996 0.0535 13.08 0.0000 r11_250.5935 0.0394 15.05 0.0000 r26_400.3751 0.0341 11.01 0.0000 r41_600.2628 0.0280 9.40 0.0000 r61_1000.1316 0.0210 6.25 0.0000 LSAT0.0057 0.0031 1.86 0.0660 GPA0.0137 0.0742 0.19 0.8540 llibvol0.0364 0.0260 1.40 0.1650 lcost0.0008 0.0251 0.03 0.9730 _cons9.1653 0.4114 22.28 0.0000 自变量中包含多个虚拟变量自变量中包含多个虚拟变量若干个虚拟变量代表同一种分类,且这种分类是定序的若干个虚拟变量代表同一种分类,且这种分类是定序的例题例题7_6:以排名在:以排名在26-60名的为对照组名的为对照组o另外,参看课本另外,参看课本p223,例,例lsalaryCoef.Std.Err.tPttop100.3733 0.0437 8.55 0.0000 r11_250.2766 0.0323 8.56 0.0000 r61_100-0.1732 0.0240-7.22 0.0000 bottom-0.2994 0.0269-11.14 0.0000 LSAT0.0049 0.0032 1.53 0.1290 GPA0.0596 0.0759 0.78 0.4340 llibvol0.0436 0.0270 1.62 0.1090 lcost0.0103 0.0260 0.39 0.6940 _cons9.3214 0.4402 21.18 0.0000 交互项交互项含有虚拟变量之间的交互项(含有虚拟变量之间的交互项(interaction term)例题例题7_7:性别和婚姻状况对工资的影响:性别和婚姻状况对工资的影响femalemarriedfemale_married单身男性单身男性000已婚男性已婚男性010单身女性单身女性100已婚女性已婚女性111marriedfemalemarriedfemalemarriedfemale _,0,1,0,1单身单身已婚已婚;男性男性女性女性交互项交互项含有虚拟变量之间的交互项含有虚拟变量之间的交互项例题例题7_7:性别和婚姻状况对工资的影响:性别和婚姻状况对工资的影响o 以单身男性为对照组以单身男性为对照组 _cons .3 32 21 13 37 78 81 1 .1 10 00 00 00 09 9 3 3.2 21 1 0 0.0 00 01 1 .1 12 24 49 90 04 41 1 .5 51 17 78 85 52 21 1 tenursq -.0 00 00 05 53 33 31 1 .0 00 00 02 23 31 12 2 -2 2.3 31 1 0 0.0 02 22 2 -.0 00 00 09 98 87 74 4 -.0 00 00 00 07 78 89 9 tenure .0 02 29 90 08 87 75 5 .0 00 06 67 76 62 2 4 4.3 30 0 0 0.0 00 00 0 .0 01 15 58 80 03 31 1 .0 04 42 23 37 71 19 9 expersq -.0 00 00 05 53 35 52 2 .0 00 00 01 11 10 04 4 -4 4.8 85 5 0 0.0 00 00 0 -.0 00 00 07 75 52 22 2 -.0 00 00 03 31 18 83 3 exper .0 02 26 68 80 00 06 6 .0 00 05 52 24 42 28 8 5 5.1 11 1 0 0.0 00 00 0 .0 01 16 65 50 00 07 7 .0 03 37 71 10 00 05 5 educ .0 07 78 89 91 10 03 3 .0 00 06 66 69 94 45 5 1 11 1.7 79 9 0 0.0 00 00 0 .0 06 65 57 75 58 85 5 .0 09 92 20 06 62 2female_mard -.3 30 00 05 59 93 31 1 .0 07 71 17 76 67 7 -4 4.1 19 9 0 0.0 00 00 0 -.4 44 41 15 58 83 38 8 -.1 15 59 96 60 02 24 4 married .2 21 12 26 67 75 57 7 .0 05 55 53 35 57 72 2 3 3.8 84 4 0 0.0 00 00 0 .1 10 03 39 92 23 3 .3 32 21 14 42 28 84 4 female -.1 11 10 03 35 50 02 2 .0 05 55 57 74 42 21 1 -1 1.9 98 8 0 0.0 04 48 8 -.2 21 19 98 85 59 9 -.0 00 00 08 84 41 14 4 lwage Coef.Std.Err.t P|t|95%Conf.Interval 交互项交互项含有虚拟变量之间的交互项含有虚拟变量之间的交互项例题例题7_7:不同性别和婚姻状况个体的回归方程:不同性别和婚姻状况个体的回归方程o 另外,参看课本另外,参看课本p226,例,例 edu.lwageedu.lwageedu.lwageedu.lwage0790301.0213.0110.032100790110.032100790213.0321007903210已婚女性:已婚女性:单身女性:单身女性:已婚男性:已婚男性:单身男性:单身男性:交互项交互项含有虚拟变量与定距变量的交互项含有虚拟变量与定距变量的交互项o 考虑模型:考虑模型:o 上述模型假定男性和女性工资方程的截距不同,但受教上述模型假定男性和女性工资方程的截距不同,但受教育年限的斜率系数对于男性和女性都是相同的育年限的斜率系数对于男性和女性都是相同的femalelwageeducmaleueducfemalelwage 100 交互项交互项含有虚拟变量与定距变量的交互项含有虚拟变量与定距变量的交互项o 考虑模型:考虑模型:o 上述模型假定男性和女性工资方程的截距不同,而且受上述模型假定男性和女性工资方程的截距不同,而且受教育年限的斜率系数对于男性和女性也不同。教育年限的斜率系数对于男性和女性也不同。femalelwageeducmaleueducfemaleeducfemalelwage _1100 交互项交互项含有虚拟变量与定距变量的交互项含有虚拟变量与定距变量的交互项例题例题7_8:教育收益率的性别差异(课本:教育收益率的性别差异(课本p228,例),例)_cons .3 38 88 88 80 06 6 .1 11 18 86 68 87 71 1 3 3.2 28 8 0 0.0 00 01 1 .1 15 55 56 63 38 88 8 .6 62 21 19 97 73 32 2 tenursq -.0 00 00 05 59 9 .0 00 00 02 23 35 52 2 -2 2.5 51 1 0 0.0 01 12 2 -.0 00 01 10 05 52 2 -.0 00 00 01 12 28 8 tenure .0 03 31 18 89 96 67 7 .0 00 06 68 86 64 4 4 4.6 65 5 0 0.0 00 00 0 .0 01 18 84 41 12 2 .0 04 45 53 38 81 14 4 expersq -.0 00 00 05 58 80 04 4 .0 00 00 01 10 07 75 5 -5 5.4 40 0 0 0.0 00 00 0 -.0 00 00 07 79 91 16 6 -.0 00 00 03 36 69 91 1 exper .0 02 29 93 33 36 66 6 .0 00 04 49 98 84 42 2 5 5.8 89 9 0 0.0 00 00 0 .0 01 19 95 54 45 5 .0 03 39 91 12 28 83 3 female_educ -.0 00 05 55 56 64 45 5 .0 01 13 30 06 61 18 8 -0 0.4 43 3 0 0.6 67 70 0 -.0 03 31 12 22 25 52 2 .0 02 20 00 09 96 62 2 educ .0 08 82 23 36 69 92 2 .0 00 08 84 46 69 99 9 9 9.7 72 2 0 0.0 00 00 0 .0 06 65 57 72 29 96 6 .0 09 99 90 00 08 88 8 female -.2 22 26 67 78 88 86 6 .1 16 67 75 53 39 94 4 -1 1.3 35 5 0 0.1 17 76 6 -.5 55 55 59 92 28 89 9 .1 10 02 23 35 51 17 7 lwage Coef.Std.Err.t P|t|95%Conf.Interval _cons .4 41 16 66 69 91 1 .0 09 98 89 92 27 79 9 4 4.2 21 1 0 0.0 00 00 0 .2 22 22 23 34 42 25 5 .6 61 11 10 03 39 94 4 tenursq -.0 00 00 05 58 85 52 2 .0 00 00 02 23 34 47 7 -2 2.4 49 9 0 0.0 01 13 3 -.0 00 01 10 04 46 63 3 -.0 00 00 01 12 24 41 1 tenure .0 03 31 17 71 13 39 9 .0 00 06 68 84 45 52 2 4 4.6 63 3 0 0.0 00 00 0 .0 01 18 82 26 66 63 3 .0 04 45 51 16 61 16 6 expersq -.0 00 00 05 58 82 27 7 .0 00 00 01 10 07 73 3 -5 5.4 43 3 0 0.0 00 00 0 -.0 00 00 07 79 93 35 5 -.0 00 00 03 37 71 19 9 exper .0 02 29 94 43 32 24 4 .0 00 04 49 97 75 52 2 5 5.9 92 2 0 0.0 00 00 0 .0 01 19 96 65 58 85 5 .0 03 39 92 20 06 63 3 educ .0 08 80 01 19 96 67 7 .0 00 06 67 75 57 73 3 1 11 1.8 87 7 0 0.0 00 00 0 .0 06 66 69 92 21 17 7 .0 09 93 34 47 71 16 6 female -.2 29 96 65 51 11 1 .0 03 35 58 80 05 55 5 -8 8.2 28 8 0 0.0 00 00 0 -.3 36 66 68 85 52 24 4 -.2 22 26 61 16 69 96 6 lwage Coef.Std.Err.t P|t|95%Conf.Interval 交互项交互项含有虚拟变量与定距变量的交互项含有虚拟变量与定距变量的交互项o 上述分析表明,男性和女性工资方程的截距项存在显著差上述分析表明,男性和女性工资方程的截距项存在显著差异,但受教育年限的斜率系数不存在显著差异。因此,应异,但受教育年限的斜率系数不存在显著差异。因此,应该选择不含交互项的回归方程。该选择不含交互项的回归方程。交互项交互项含有虚拟变量与定距变量的交互项含有虚拟变量与定距变量的交互项o 利用虚拟变量和其它变量的交互项可以用来检验两组之间利用虚拟变量和其它变量的交互项可以用来检验两组之间是否有相同的回归系数是否有相同的回归系数例题例题7_9(课本(课本p230-233):大学运动员成绩的影响因素):大学运动员成绩的影响因素o H0意味着三类因素对男女运动员成绩的影响是相同的意味着三类因素对男女运动员成绩的影响是相同的0:0,0,0,0:_753117531076543210中中至至少少有有一一个个不不等等于于、HHutothrsfemaletothrshspercfemalehspercsatfemalesatfemalecumgpa 交互项交互项例题例题7_9(课本(课本p230-233)o 检验两组回归方程是否完全相同的假设检验通常被称为检验两组回归方程是否完全相同的假设检验通常被称为邹检邹检验(验(Chow test),),同学们不用刻意去记它,只要知道它是一同学们不用刻意去记它,只要知道它是一种特殊的种特殊的F检验就可以了检验就可以了的的动动员员的的回回归归方方程程是是相相同同即即不不能能认认为为男男女女大大学学运运的的水水平平上上拒拒绝绝,至至少少可可以以在在,,132.3)358,4(18.8)1/()1(/)(473663516.0,4059.0001.022222H%FknRqRRF,q,knRRurrurrur 交互项交互项例题例题7_9(课本(课本p230-233)o 也可以只对斜率的组间差异进行检验,即考察三个解释变量对也可以只对斜率的组间差异进行检验,即考察三个解释变量对不同性别大学运动员成绩的影响是否存在显著差异不同性别大学运动员成绩的影响是否存在显著差异同同的的截截距距不不同同,但但斜斜率率是是相相大大学学运运动动员员回回归归方方程程的的可可以以认认为为男男女女结结合合前前面面的的检检验验结结果果,方方程程的的斜斜率率是是相相同同的的。员员回回归归可可以以认认为为男男女女大大学学运运动动,无无法法拒拒绝绝,中中至至少少有有一一个个不不等等于于、,08.2)358,3(531)1/()(/)(373663983.0,4059.00:;0,0,0:_01.0227531753076543210HF.knR1qRRF,q,knRRHHutothrsfemaletothrshspercfemalehspercsatfemalesatfemalecumgpa2ur2r2urrur 交互项交互项例题例题7_9(课本(课本p230-233)o 因此,最终的模型可设定为因此,最终的模型可设定为utothrshspercsatfemalecumgpa 43210 n 线性概率模型线性概率模型n Logit模型和模型和Probit模型模型三、因变量为虚拟变量三、因变量为虚拟变量线性概率模型线性概率模型线性概率模型(线性概率模型(linear probability model,LPM)线线性性概概率率模模型型影影响响为为线线性性,因因此此称称为为的的条条件件概概率率的的对对模模型型假假定定的的概概率率的的改改变变量量。上上述述改改变变一一个个单单位位导导致致的的,度度量量了了其其他他条条件件不不变变时时从从而而即即:的的条条件件概概率率。的的条条件件期期望望等等于于也也就就是是说说,。因因此此:的的条条件件概概率率为为则则的的条条件件概概率率为为是是一一个个虚虚拟拟变变量量,记记若若有有对对于于YXYXXXXYPYYYPYPYPYEYPYYPYYXXXYEuXXXYjjkkkkkk1)X|1(1)X|1(0)X|1(11)X|1()X|()X|1(10)X|1(1)X|(221102211022110 线性概率模型线性概率模型线性概率模型(线性概率模型(linear probability model,LPM)个个百百分分点点她她参参加加工工作作的的概概率率下下降降妇妇女女的的年年龄龄增增加加一一岁岁,表表明明其其它它条条件件不不变变,若若个个百百分分点点率率提提高高一一年年,她她参参加加工工作作的的概概妇妇女女的的受受教教育育年年限限提提高高,表表明明其其它它条条件件不不变变,若若,不不参参加加工工作作,参参加加工工作作女女:譬譬如如,对对于于一一个个已已婚婚妇妇520250350530_013243210.ukidsageeduincomehusbandworkwork 线性概率模型线性概率模型线性概率模型存在的主要问题线性概率模型存在的主要问题o 自变量对因变量的边际影响可能不是常数自变量对因变量的边际影响可能不是常数o 概率的估计值很可能小于概率的估计值很可能小于0或大于或大于1o 通常不满足同方差假定通常不满足同方差假定a.尽管如此,线性概率模型仍有很多应用,特别适用于自变尽管如此,线性概率模型仍有很多应用,特别适用于自变量在其样本均值附近变化时对因变量的影响量在其样本均值附近变化时对因变量的影响线性概率模型线性概率模型例题例题7_10:妇女的劳动力市场参与(课本:妇女的劳动力市场参与(课本p234-236)例题例题7_11:拘捕率(课本:拘捕率(课本p236,例),例)Logit模型和模型和Probit模型模型Logit模型和模型和Probit模型模型o当因变量为虚拟变量时,更为常用的方法是使用当因变量为虚拟变量时,更为常用的方法是使用logit模型或模型或probit模模型。与线性概率模型相比,这两个模型的概率估计值严格介于型。与线性概率模型相比,这两个模型的概率估计值严格介于0到到1之之间,而且自变量的变化对因变量的边际影响不是常数。间,而且自变量的变化对因变量的边际影响不是常数。o通过通过logit模型和模型和probit模型得到的系数的符号及其显著性与线性概率模型得到的系数的符号及其显著性与线性概率模型相同,但对系数的解释有所不同。另外,模型相同,但对系数的解释有所不同。另外,logit模型和模型和probit模型模型采用的是极大似然估计法。采用的是极大似然估计法。o本课程对本课程对logit模型和模型和probit模型不做要求,但这两个模型应用很广,模型不做要求,但这两个模型应用很广,有兴趣的同学可参看课本节,有兴趣的同学可参看课本节,p548-559推广推广o当因变量为多分类变量时,可使用当因变量为多分类变量时,可使用mlogit或或mprobit模型模型o当因变量为定序变量时,可使用当因变量为定序变量时,可使用ologit或或oprobit模型模型Logit模型和模型和Probit模型模型例题例题7_11:Logit模型的结果模型的结果arr86Coef.Std.Err.zPzpcnv-0.8805 0.1222-7.20 0.0000 avgsen0.0266 0.0352 0.76 0.4490 tottime-0.0139 0.0282-0.49 0.6220 ptime86-0.1403 0.0313-4.49 0.0000 qemp86-0.1992 0.0283-7.04 0.0000 black0.8239 0.1174 7.02 0.0000 hispan0.5215 0.1086 4.80 0.0000 _cons-0.46410.0947-4.90 0.0000 Logit模型和模型和Probit模型模型例题例题7_11:Probit模型的结果模型的结果arr86Coef.Std.Err.zPzpcnv-0.5276 0.0709-7.44 0.0000 avgsen0.0169 0.0212 0.80 0.4230 tottime-0.0093 0.0169-0.55 0.5820 ptime86-0.0857 0.0181-4.72 0.0000 qemp86-0.1204 0.0170-7.10 0.0000 black0.4966 0.0715 6.95 0.0000 hispan0.3090 0.0648 4.77 0.0000 _cons-0.2844 0.0573-4.96 0.0000 习题习题
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!