stata软件基本操作和简单的一元线性回归

上传人:hao****an 文档编号:163932607 上传时间:2022-10-23 格式:PPT 页数:18 大小:490.50KB
返回 下载 相关 举报
stata软件基本操作和简单的一元线性回归_第1页
第1页 / 共18页
stata软件基本操作和简单的一元线性回归_第2页
第2页 / 共18页
stata软件基本操作和简单的一元线性回归_第3页
第3页 / 共18页
点击查看更多>>
资源描述
Page 1StataStata基本操作及基本操作及简单的线性回归简单的线性回归邬龙Page 2Stata是世界著名的统计分析软件之一。Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。用Stata绘制的统计图形相当精美。Stata的统计功能很强,除了传统的统计分析方法外,还收集了近20年发展起来的新方法,如Cox比例风险回归,指数与Weibull回归,多类结果与有序结果的logistic回归,Poisson回归,负二项回归及广义负二项回归,随机效应模型等。一、Stata软件介绍Page 3STATA软件的安装 点SetupStata14安装,激活码在txt中,一直下一步 IC版本即可,越高版本运行越慢 开始菜单里找到图标运行程序,第一次输入序列号,不要online注册Page 4Stata界面分析命令在这里输入分析命令在这里输入查看历史命令查看历史命令所有的图表绘制都所有的图表绘制都在在graphs里面里面简单的分析功能在简单的分析功能在Statistics里面里面Page 5数据读入和保存(从Excel)点击data editor(edit)图标进入数据编辑器 复制数据(连同第一行表头),在数据编辑器里粘贴 弹出提示,询问第一行是否要当成变量名称(表头),选左边为是,选第二个为否 点击保存,存为xxx.dta文件,便于以后使用Page 6变量的使用1.查看和更改变量名忘了有哪些变量、想把中文变量名改成其他怎么办?点击红圈的variables manager图标,即可看到有哪些变量,每个变量是什么数据类型(int表示整数,double表示双精度浮点等)例如,可以把右侧变量名(name)改为sale,标签(Label)只是用来显示的,可以还叫销售额,改完后点击apply2.命令行查看数据:输入:list salePage 7变量的使用3.生成新变量,例如想生成变量Y,Y是sale的平方用generate函数即可(简写为gen)gen Y=sale24.删掉变量:drop 变量名Page 8二、一元线性回归Page 9第一节 问题提出Page 10进行回归分析的步骤画出散点图/描述统计模型估计模型检验:R方、t、F检验Page 11第一步 导入数据点击data editor(edit)图标进入数据编辑器复制“时间序列”工作表的消费和收入数据(连同第一行表头,不要第一列),在数据编辑器里粘贴弹出提示,询问第一行是否要当成变量名称(表头),选左边为是点击variables manager按钮,更改变量名为英文,消费为Y,收入为XPage 12第二步描述统计/画散点图(1 1)描述统计)描述统计按钮操作方法1:在data editor数据表窗口中,点击DataDescribe dataSummary statistics,如图所示选择第二个Page 13第二步描述统计/画散点图(1 1)描述统计)描述统计命令操作方法2:若想对现在程序中已粘贴进去的全部数据进行描述,则直接在命令栏输入:summarize,detail注意用英文逗号,然后空格!若只想对某一个变量进行描述,则输入summarize 变量名变量名,detail多个变量直接以空格隔开即可Page 14第二步 画散点图/描述统计(2 2)图形描述)图形描述在命令栏输入:scatter Y X 即可,注意纵轴变量在前扩展:让图形更美观,可自行查阅扩展:让图形更美观,可自行查阅help scatter的帮助文件的帮助文件如:想每个点标上是第几行数据怎么做?如:想每个点标上是第几行数据怎么做?gen n=_nscatter Y X,mlabel(n)Page 15第三步 模型估计设定模型为 一元回归模型的命令为:一元回归模型的命令为:regress Y X,简写,简写reg Y X 即可即可若想做无常数项回归则为:若想做无常数项回归则为:reg Y X,noconstantPage 16第四步 模型检验(1)经济意义检验)经济意义检验斜率 为边际消费倾向,表明人均可支配收入每增加1元时,食品消费平均平均增加0.135元。从经济意义上是合理的。(2)拟合优度检验、)拟合优度检验、t检验和检验和F检验检验P值为0.000,在任何显著性水平下,斜率项和截距项显然不为零,拒绝两系数为零的假设。另外,拟合优度R方表明,食品支出的97.5%的变化也以由收入X的变化来解释,因此拟合情况较好。如果需要查看残差值e,输入scatter e即可,list e可以列出所有ei值,scatter e X可以看ei残差图Page 17回归结果的提供和分析回归结果提供的两种格式回归结果提供的两种格式se:23.8050.4845 0.9655 (1.79)(14.96)tYXR注:括号内数字为 检验值23.8050.4845 0.9655 (2.12)(0.03)YXRse注:括号内数字为标准误(这两种方式都要自己查表找这两种方式都要自己查表找ta/2(n-2)临界值对比临界值对比 当然,除了这些基本信息以外,一般还会列出样本区间、当然,除了这些基本信息以外,一般还会列出样本区间、DW值等重要信息。这会在后面的课程中说明。值等重要信息。这会在后面的课程中说明。Page 18 思考:目前,无论时间序列还是截面数据,我们导入的方式完全一样,做法也完全一样,是否有区别?
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!