多元线性回归模型检验及stata软件应用.ppt

上传人:tian****1990 文档编号:2894601 上传时间:2019-12-04 格式:PPT 页数:48 大小:687KB
返回 下载 相关 举报
多元线性回归模型检验及stata软件应用.ppt_第1页
第1页 / 共48页
多元线性回归模型检验及stata软件应用.ppt_第2页
第2页 / 共48页
多元线性回归模型检验及stata软件应用.ppt_第3页
第3页 / 共48页
点击查看更多>>
资源描述
第四章 多元线性回归模型检验,拟合优度检验 方程的显著性检验(总参数的F检验) 变量的显著性检验(单参数的t检验) 构造置信区间,3.2 拟合优度检验,可决系数与调整的可决系数,由于,=0,所以有:,有意思的是:,条件:模型必须有截距项,2. 可决系数,3. 调整的可决系数,在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:,其中:n-k为残差平方和的自由度,n-1为总体平方和的自由度。,一、方程的显著性检验(F检验),方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。,3.3 统计推断,F检验的思想来自于总离差平方和的分解式: TSS=ESS+RSS,如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。 因此,可通过该比值的大小对总体线性关系进行推断。,根据数理统计学中的知识,在原假设H0成立的条件下,统计量,2. 检验统计量,p 值检验法,为了方便起见,将F统计量的值记为F0 计算 pPF F0 称为p 值(pvalue ) 如果p ,则p/2 /2, F0落入不能拒绝域,不能拒绝H0,如果p ,落入拒绝域,应拒绝H0。 准则: 当P 值小于显著性水平时,方程在给定显著性水平下是显著的 当P 值大于显著性水平时,方程在给定显著性水平下是不显著的。,3.关于拟合优度检验与方程显著性检验的关系,二、变量的显著性检验(t检验),2. 检验统计量,(2) t检验统计量,P值检验法(pvalue test),p 值的概念: 为了方便,将 t 统计量的值记为 计算 pPtt 0 称为p 值(pvalue ) 通常的计量经济学软件都可自动计算出p 值,如果p,则p/2 /2, t0落入拒绝域,应拒绝H0,当P 值小于等于给定显著性水平时,所研究的解释变量对被解释变量的影响在该显著性水平下是显著的; 当P 值大于给定显著性水平时,所研究的解释变量对被解释变量的影响在该显著性水平下是不显著的。,4. 两类错误,H0 真 H0 伪 不拒 H0 对 取伪 拒 H0 拒真 对,:拒真。把不应该引入的变量引入模型,导致多列无关变量,造成虽然参数估计值是无偏,但标准差会大。 若不想犯第一类错误,则显著水平需要定得小点。,:取伪。把该引入的变量没有引入模型 遗漏变量 造成参数估计量有偏。,三、参数的置信区间,2. 的置信区间,对称区间,中心是bk,半径是,如何才能缩小置信区间?,增大样本容量n,因为在同样的样本容量下,n越大,t分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小; 提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方和应越小。 提高样本观测值的分散度,一般情况下,样本观测值越分散, 的分母的 的值越大,致使区间缩小。,F值,R2,P值,调整的 R2,T 值,p 值,置信区间,系数,回归平方和,残差平方和,总平方和,标准差,Stata 操作,命令行格式:最常用的方法 use “d:dataauto.dta”, clear /*打开数据库*/ regress y x1 x2 x3 菜单格式: Stata8以后开始有菜单 选择菜单进行操作后,在命令栏里可以看到命令行格式是如何写的。,Stata 操作,读取数据,用use命令调入数据:dta格式数据 use “d:statadataauto.dta”, clear Excel格式数据的读取 直接拷贝,粘贴到stata中 使用Stat transfer把其它格式的数据转成stata格式的数据 读入ASCII格式数据文件:比较麻烦,常见数据格式,Stata 格式:dta 文本格式:txt Excel格式:xls 其它格式:sas、spss、gauss等,Stata的主要功能,数据管理:data management 统计功能:statistics 作图功能:graphics 矩阵运算:matrix 程序设计:programming,数据管理,作图功能,统计功能,数据管理,数据读取 编辑数据 产生或改变变量:gen, egen, 保存数据库 合并和添加数据:merge, append 数据集的重新组织:reshape,调用数据库程序讲解(E:panel),调用数据库程序讲解(E:zhy-apple),相同的变量上下连接,按关键变量横向连接,产生或改变变量,gen replace egen (对gen的扩展,与一些函数结合使用,如mean, count, min, max 等) 产生虚拟变量 tabulate vid, gen(vdummy) Xi: reg y x1 x2 i.vid 变量的命名: 性别:gender 1=female, 0=male 不好 female 1=female, 0=male,调用数据库程序讲解(E:panel),产生变量,bysort hhid: gen order=_n bysort hhid: gen number=_N _n:是产生排序的数列 _N:产生总数,调用数据库程序讲解(E:panel),给数据或变量加注释,Label data “Investment : cfliu 2006” label variable v1 “ county “ label define 与 label values 是一起使用的。 而label variable 是单独使用的。 另外,比如 有个变量 gender 的值 为 0和1,1表示male 0 表示female。 你如果用table gender x1 ,会发现是按照 0 1来显示分类的。 你如果用了 .label define gendervalue 0 female 1 male .label values gender gendervalue 在执行table gender x1 ,则是按照female 和 male来分类的。 但 gender 还是原来的变量类型,如原来是数值型,现在还是。 虽然list sex 显示为female male,但仍然可以按照 0或1来操作.,调用数据库程序讲解(E:zhy-apple),数据集的重新组织,reshape collapse,collapse (mean) c, by (t),调用数据库程序讲解(E:panel),The long-long form,The wide-year long-sex form,The wide-wide form,The long-year wide-sex form,Reshape命令详细解释:包括矩阵转置等,Reshape命令,*From long-long form to long-wide form reshape wide inc, i(hid year) j(sex) string *From long-wide form to long-long form reshape long inc, i(hid year) j(sex) string *From long-long form to wide-long form reshape wide inc, i(hid sex) j(year) *From wide-long form to long-long form reshape long inc, i(hid sex) j(year) *From long-wide form to wide-wide form reshape wide minc finc, i(hid) j(year) *From wide-wide form to long-wide form reshape long minc finc, i(hid) j(year) *From wide-long form to wide-wide form reshape wide inc90 inc91, i(hid) j(sex) string *From wide-wide form to wide-long form reshape long inc90 inc92, i(hid) j(sex) string :如果变量为字符型,如sex的值为f和m,要把inc变量生成finc和minc,则需要用。,Collapse 命令,产生新的数据集 collapse (统计量) 变量, by (变量) collapse (mean) price, by(foreign) collapse (mean) mprice=price (sum) sprice=price, by(foreign) table foreign,c(mean price sum price) replace,统计功能,描述统计 交叉表格 估计,描述统计,Sum x Histogram,twoway (histogram c, title(“消费分析“) xlabel(1000(500)6000) bfcolor(gs5) scatter c y twoway(scatter c y) (qfit c y) twoway(scatter c y) (lfit c y),调用数据库程序讲解(E:panel),作图,表格,Table 可以作四维表格 table foreign,c(n price mean price sd price max price min price) row table year region gender,c(mean price sd price max price min price) by(agegroup) row Tabulate tabulate vid,gen(vidumy) tabulate vid gender,table year if (vcode=vcode_n+1| vcode=vcode_n-1) & vcow=0,c(n vcode),do 文件的编写,编写do文件的作用 记录你的操作过程 减少命令的输入 do 文件的编写 Stata 中的do file编辑器 其它的软件:Textpad,其它一些常用命令,clear drop keep sum des list If 条件 bysort 变量 outreg ereturn list,Outreg 生成像杂志那样的表格,Outreg using 文件名, coefastr p bdec(2) 3aster replace Outreg using 文件名, coefastr se 3aster append bdec(2): 留两位数 Coefastr:给系数加星号 P: 系数下面标P值 Se: 系数下面标标准误差 3aster: 加3个星号,1,5,10。,outreg using table1, coefastr p bdec(2) 3aster replace,outreg using table1, se bdec(2) 3aster replace,ereturn,use d:statadataauto.dta, clear reg mpg price foreign ereturn list,产生滞后变量,gen xlagx _n-1 bysort code: gen xlagx _n-1,滞后1 期:,滞后2 期:,gen xlag2x _n-2,bysort code: gen xlag2x _n-2,发现重复的ID号和变量,sort id list if id=id_n+1 bysort id score x1 x2 y1 y2:gen n=_N List if n1 Duplicates report (variable name) Duplicates list (variable name) Count if id=id_n+1,检查缺失值,nmissing 变量 if npresent 变量 if npresent x1 x2 if y=.,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!