资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第七章,Stata,与模型的设定,主要内容:,1,、,遗漏变量的,检,检验,2,、,解释变量个,数,数的选择,3,、,多重共线性,与,与逐步回归,法,法,4,、,极端数据的,诊,诊断与处理,5,、,虚拟变量的,处,处理,6,、,经济结构变,动,动的,Chow,检验,实验,7-1,遗漏变量的,检,检验,一、实验基,本,本原理,二、实验数,据,据和实验内,容,容,根据统计资,料,料得到了美,国,国工资的横,截,截面数据,,变,变量主要包,括,括:,wage=,工资,,educ=,受教育年限,,,,,exper=,工作经验年,限,限,,tenure=,任职年限,,lwage=,工资的对数,值,值。完整的,数,数据在本书,附,附带光盘的,data,文件夹的,“wage1.dta,”,”,工作文件中,。,利用,wage1,的数据,分,别,别利用,Link,方法和,Ramsey,方法检验模,型,型,是否遗漏了,重,重要的解释,变,变量。,三、实验操,作,作指导,1.,使用,Link,方法检验遗,漏,漏变量,Link,方法进行检,验,验的基本命,令,令语句为:,linktest if in,cmd_options,在这个命令,语,语句中,,linktest,是进行,Link,检验的基本,命,命令,,if,是表示条件,的,的命令语句,,,,,in,是范围语句,,,,,cmd_options,表示,Link,检验的选项,应,应该与所使,用,用的估计方,法,法的选项一,致,致,例如检,验,验之前使用,的,的回归,regress,命令,则此,处,处的选项应,与,与,regress,的选项一致,。,。,例如,利用,wage1,的数据,检,验,验模型,是否遗漏了,重,重要的解释,变,变量,应该,输,输入以下命,令,令:,use c:datawage1.dta,clear,reg lwageeducexpertenure,linktest,第一个命令,表,表示打开数,据,据文件,wage1,,第二个命,令,令语句是对,模,模型进行回,归,归估计,第,三,三个命令就,是,是进行遗漏,变,变量的,Link,检验,检验,结,结果如图,7.1,所示。,从第二个表,格,格中,可以,看,看到,hatsq,项的,p,值为,0.018,,拒绝了,hatsq,系数为零的,假,假设,即说,明,明被解释变,量,量,lwage,的拟合值的,平,平方项具有,解,解释能力,,所,所以可以得,出,出结论原模,型,型可能遗漏,了,了重要的解,释,释变量。,为了进一步,验,验证添加重,要,要变量是否,会,会改变,Link,检验的结果,,,,我们生成,受,受教育年限,educ,和工作经验,年,年限,exper,的平方项,,重,重新进行回,归,归并进行检,验,验,这时输,入,入的命令如,下,下:,gen educ2=educ2,gen exper2=exper2,reg lwageeducexpertenure educ2 exper2,linktest,第一个命令,语,语句的作用,是,是生成变量,educ2,,使其值为,变,变量,educ,的平方;第,二,二个命令语,句,句的作用是,生,生成变量,exper2,,使其值为,变,变量,exper,的平方;第,三,三个命令语,句,句的作用是,对,对进行回归,估,估计,;,第四个命令,就,就是进行遗,漏,漏变量的,Link,检验,检验,结,结果如图,7.2,所示。,2.,使用,Ramsey,方法检验遗,漏,漏变量,Ramsey,方法进行检,验,验的基本命,令,令语句为:,estatovtest,rhs,在这个命令,语,语句中,,estatovtest,是进行,Ramsey,检验的命令,语,语句,如果,设,设定,rhs,,则在检验,过,过程中使用,解,解释变量,,如,如果不设定,rhs,,则在检验,中,中使用被解,释,释变量的拟,合,合值。,例如,利用,wage1,的数据,使,用,用,Ramsey,方法检验模,型,型,是否遗漏了,重,重要的解释,变,变量,应该,输,输入以下命,令,令:,use c:datawage1.dta,clear,reg lwageeducexpertenure,estatovtest,在这组命令,语,语句中,第,一,一个命令的,功,功能是打开,数,数据文件,,第,第二个命令,是,是对模型进,行,行回归估计,,,,第三个命,令,令就是进行,遗,遗漏变量的,Ramsey,检验,检验,结,结果如图,7.3,所示。,在图,7.3,中,第一个,图,图表仍然是,回,回归结果,,第,第二部分则,是,是,Ramsey,检验的结果,,,,不难发现,Ramsey,检验的原假,设,设是模型不,存,存在遗漏变,量,量,检验的,p,值为,0.0048,,拒绝原假,设,设,即认为,原,原模型存在,遗,遗漏变量。,为了进一步,验,验证添加重,要,要变量是否,会,会改变,Ramsey,检验的结果,,,,我们采取,Link,检验中的方,法,法,生成受,教,教育年限,educ,和工作经验,年,年限,exper,的平方项,,重,重新进行回,归,归并进行检,验,验,这时输,入,入的命令如,下,下:,gen educ2=educ2,gen exper2=exper2,reg lwageeducexpertenure educ2 exper2,estatovtest,这里不再赘,述,述这些命令,语,语句的含义,,,,调整之后,的,的检验结果,如,如图,7.4,所示,可以,发,发现此时检,验,验的,p,值为,0.5404,,无法拒绝,原,原假设,即,认,认为模型不,再,再存在遗漏,变,变量。,实验,7-2,解释变量个,数,数的选择,一、实验基,本,本原理,好的经济理,论,论的标准通,常,常是希望通,过,过更为简洁,的,的模型来更,加,加精确地描,述,述复杂的经,济,济现象,但,是,是这两个目,标,标通常是矛,盾,盾的,因为,通,通过增加解,释,释变量的个,数,数可以提高,模,模型的精确,程,程度,但是,同,同时也牺牲,了,了模型的简,洁,洁性。因此,,,,在现实的,经,经济研究过,程,程中,通常,使,使用信息准,则,则来确定解,释,释变量的个,数,数,较为常,用,用的信息准,则,则有两个:,(,1,)赤池信息,准,准则,又称,为,为,AIC,准则,其基,本,本思想是通,过,过选择解释,变,变量的个数,,,,使得如下,目,目标函数最,小,小。,在这个公式,中,中,,e,代表残差序,列,列,,n,代表样本数,量,量,,K,代表解释变,量,量的个数。,通,通过这个目,标,标函数可以,看,看出,第一,项,项是对拟合,优,优度的奖励,,,,即尽可能,地,地使残差平,方,方和变小,,第,第二项是对,解,解释变量个,数,数增多的惩,罚,罚,因为目,标,标函数是解,释,释变量个数,的,的增函数。,(,2,)贝叶斯信,息,息准则,又,称,称为,BIC,准则,其基,本,本思想是通,过,过选择解释,变,变量的个数,,,,使得如下,目,目标函数最,小,小。,在这个公式,中,中,,e,代表残差序,列,列,,n,代表样本数,量,量,,K,代表解释变,量,量的个数。,通,通过这个目,标,标函数可以,看,看出,,BIC,准则与,AIC,准则的唯一,区,区别就是,K,的权重不同,,,,一般来说,ln(n)2,,所以,BIC,更加注重模,型,型的简洁性,。,。,二、实验数,据,据和实验内,容,容:,根据统计资,料,料得到了美,国,国工资的横,截,截面数据,,变,变量主要包,括,括:,wage=,工资,,educ=,受教育年限,,,,,exper=,工作经验年,限,限,,tenure=,任职年限,,lwage=,工资的对数,值,值。完整的,数,数据在本书,附,附带光盘的,data,文件夹的,“wage1.dta,”,”,工作文件中,。,利用,wage1,的数据,来,确,确定,以下两个模,型,型:,模型,和模型,哪个更为合,理,理(其中,educ2,和,exper2,分别为,educ,和,exper,的平方项),。,。,三、实验操,作,作指导,使用信息准,则,则,对模型,进,进行检验的,命,命令如下:,estatic,n(#),在这个命令,语,语句中,,estatic,是进行检验,的,的命令语句,,,,选项,n(#),的功能是指,定,定,BIC,准则中的,n,值,一般使,用,用默认值。,例如,利用,wage1,的数据,获,得,得模型,的,AIC,和,BIC,值,应该输,入,入以下命令,:,:,use c:datawage1.dta,clear,reg lwageeducexpertenure,estatic,第一个命令,表,表示打开数,据,据文件,wage1,,第二个命,令,令语句是对,模,模型进行回,归,归估计,第,三,三个命令就,是,是进行信息,准,准则值的计,算,算,计算结,果,果如图,7.5,所示,,AIC,值为,635.10,,,BIC,值为,652.16,。,为了对比分,析,析,我们仍,然,然采取,Link,检验中的方,法,法,生成受,教,教育年限,educ,和工作经验,年,年限,exper,的平方项,,建,建立新的模,型,型,重新对其进,行,行回归并计,算,算,这时输,入,入的命令如,下,下:,gen educ2=educ2,gen exper2=exper2,reg lwageeducexpertenure educ2 exper2,estatic,这里不再赘,述,述这些命令,语,语句的含义,,,,调整之后,的,的计算结果,如,如图,7.6,所示,可以,发,发现此时计,算,算的,AIC,值为,583.66,,,BIC,值为,609.25,。,通过这两个,模,模型信息准,则,则值的对比,分,分析,可以,得,得出结论,,第,第二个模型,的,的信息准则,值,值更小,所,以,以此模型优,于,于第一个模,型,型。,实验,7-3,多重共线性,与,与逐步回归,法,法,一、实验基,本,本原理,多重共线性,问,问题在多元,线,线性回归分,析,析中是很常,见,见的,其导,致,致的直接后,果,果是方程回,归,归系数估计,的,的标准误差,变,变大,系数,估,估计值的精,度,度降低等。,多,多重共线性,的,的问题对于,Stata,软件来说并,不,不显著,因,为,为,Stata,会自动剔除,完,完全的多重,共,共线性,但,是,是出于知识,的,的完整性,,这,这里还是介,绍,绍一下,Stata,对于多重共,线,线性的识别,和,和处理方法,。,。,多重共线性,的,的诊断方法,主,主要有:,(,1,)直观上说,:,:当模型的,拟,拟合优度非,常,常高且通过,F,检验,但多,数,数解释变量,都,都不显著,,甚,甚至解释变,量,量系数符号,相,相反时,可,能,能存在多重,共,共线性。,(,2,)对由解释,变,变量所组成,的,的序列组进,行,行相关分析,时,时,如果有,些,些变量之间,的,的相关系数,很,很高,则也,反,反映出可能,存,存在多重共,线,线性。,(,3,)使用命令,estatvif,,对膨胀因,子,子进行计算,,,,经验上当,VIF,的均值,=2,且,VIF,的最大值接,近,近或者超过,10,时,通常认,为,为有较为严,重,重的多重共,线,线性。,当确认模型,存,存在多重共,线,线性时,通,常,常有两种解,决,决方法消除,其,其影响:一,种,种是收集更,多,多的数据,,增,增大样本容
展开阅读全文