Stata简介及基本操作教育课件

上传人:仙*** 文档编号:45989465 上传时间:2021-12-09 格式:PPT 页数:33 大小:538.50KB
返回 下载 相关 举报
Stata简介及基本操作教育课件_第1页
第1页 / 共33页
Stata简介及基本操作教育课件_第2页
第2页 / 共33页
Stata简介及基本操作教育课件_第3页
第3页 / 共33页
点击查看更多>>
资源描述
Stata 简介及基本操作简介及基本操作一、为什么使用一、为什么使用Stata? Stata 是目前在欧美最为流行的计量软件,具有操作是目前在欧美最为流行的计量软件,具有操作简单、功能强大的特点。由于使用简单、功能强大的特点。由于使用Stata 的用户很多,对的用户很多,对于最新的计量方法,常常可以下载由用户写的于最新的计量方法,常常可以下载由用户写的Stata 命令命令程序程序,十分方便。而官方的十分方便。而官方的Stata版本也经常更新,以适应版本也经常更新,以适应计量经济学迅猛发展的需要。计量经济学迅猛发展的需要。 Stata 11 已于已于2009 年出版,但由于在中国普遍使用年出版,但由于在中国普遍使用的仍是的仍是Stata 10,我们主要介绍,我们主要介绍Stata 10。1学习课件1. 面临的问题面临的问题 研究者经常地希望利用多种方法从不同角度对数据进研究者经常地希望利用多种方法从不同角度对数据进行分析,但拥有绝对优势的软件是不存在的,不存在哪个行分析,但拥有绝对优势的软件是不存在的,不存在哪个软件能解决所有的问题。软件能解决所有的问题。 计量经济学发展迅速,新的方法层出不穷,而软件公计量经济学发展迅速,新的方法层出不穷,而软件公司将这些新方法嵌入到软件中是存在滞后的。司将这些新方法嵌入到软件中是存在滞后的。2. 解决方案解决方案 Stata以其操作简单、运行快速而精确,全面的数据管以其操作简单、运行快速而精确,全面的数据管理功能,精致的作图,强大的统计与计量分析功能,简练理功能,精致的作图,强大的统计与计量分析功能,简练标准的程序与矩阵运算功能、丰富的网络资源,在统计学、标准的程序与矩阵运算功能、丰富的网络资源,在统计学、经济学、金融学、心理学、计算机科学、物理、化学等多经济学、金融学、心理学、计算机科学、物理、化学等多个学科领域得到广泛使用。个学科领域得到广泛使用。请浏览:请浏览:http:/ STATA简介:发展历史简介:发展历史 (1)Stata是一个用于数据管理和分析的统计软件,由是一个用于数据管理和分析的统计软件,由Stata公司(公司(StataCorp)研制开发。从)研制开发。从1985开始,先后开开始,先后开发了发了1.1, 1.2,等多个版本。目前等多个版本。目前Stata的最新版本为的最新版本为2009年年7月份推出的月份推出的Stata 11.0。 (2)Stata 11包括四种版本:包括四种版本:Small(小型版)、(小型版)、IC(标(标准版)、准版)、SE(特别版)和(特别版)和MP(多处理器版)。其中属(多处理器版)。其中属MP版本最为强大。版本最为强大。MP版与版与SE版的功能完全相同,但版的功能完全相同,但MP版的版的运算速度比运算速度比SE版的要快很多。用户可以在命令栏输入版的要快很多。用户可以在命令栏输入about 查看所安装的查看所安装的Stata所属的版本。所属的版本。3学习课件 (3)不同版本对样本容量、变量个数、矩阵阶数、宏)不同版本对样本容量、变量个数、矩阵阶数、宏的字符长度等有着不同的限制。以的字符长度等有着不同的限制。以SE版为例,其最大变版为例,其最大变量个数为量个数为32767,最大字符长度为,最大字符长度为244字节,最大矩阵阶数字节,最大矩阵阶数为为11000(即(即1100011000)。)。 Stata默认值为:最大变量个数为默认值为:最大变量个数为5000,最大矩阵阶数,最大矩阵阶数为为400,最大内存为,最大内存为50兆兆(在在Stata10中为中为10m)。如果用户。如果用户需要更多的内存或者更多的变量,可以在命令栏输入如下需要更多的内存或者更多的变量,可以在命令栏输入如下命令进行扩展。命令进行扩展。. set maxvar # (.set maxvar 5000 ). set maxsize # (.set maxsize 1000 ). set memory #m (.set memory 50m )4学习课件4. STATA简介:主要特点与功能简介:主要特点与功能统计分析与计量分析的结合:统计分析与计量分析的结合: (1)单元统计:描述统计、假设检验(参数、非参数)、)单元统计:描述统计、假设检验(参数、非参数)、ANOVA、质量控制、统计作图。、质量控制、统计作图。 (2)多元统计:)多元统计:MANOVA、主成分、因子分析、典型相、主成分、因子分析、典型相关、聚类、判别分析、对应分析、多维标度。关、聚类、判别分析、对应分析、多维标度。 (3)线性回归、非线性回归、工具变量回归、广义线性回)线性回归、非线性回归、工具变量回归、广义线性回归、分位数回归(稳健回归)、系统方程模型(归、分位数回归(稳健回归)、系统方程模型(SUR、联立、联立方程)、离散选择模型(二项选择、排序选择、多项选择、方程)、离散选择模型(二项选择、排序选择、多项选择、条件条件Logit、嵌套、嵌套Logit模型、二元选择模型等)、计数模型模型、二元选择模型等)、计数模型(泊松回归、负二项回归)、截断与归并模型、海克曼选择(泊松回归、负二项回归)、截断与归并模型、海克曼选择模型、逐步回归模型、逐步回归(stepwise)等。等。5学习课件 (4)时间序列分析:时间序列的平滑、相关图、)时间序列分析:时间序列的平滑、相关图、ARIMAX、GARCH、单位根检验、单位根检验、Johansen协整检验、协整检验、VAR、VEC、滚动回归等。、滚动回归等。 (5)面板数据(线性模型、工具变量回归、动态面板、分)面板数据(线性模型、工具变量回归、动态面板、分层混合效应、广义估计方程(层混合效应、广义估计方程(GMM)、随机边界模型等)。)、随机边界模型等)。 (6)调查数据分析)调查数据分析 (7)生存分析)生存分析 (8)蒙特卡洛模拟、自举法)蒙特卡洛模拟、自举法(bootstrap)、刀切法、刀切法(jackknife)6学习课件丰富的网络资源:丰富的网络资源: http:/ http:/www.stata- http:/www.stata-严谨、简练、灵活的程序语言:严谨、简练、灵活的程序语言: Stata提供了严谨、简练而灵活的程序语句,用户可以编提供了严谨、简练而灵活的程序语句,用户可以编写自己的命令和函数,也可以制作自己的对话框和窗口菜写自己的命令和函数,也可以制作自己的对话框和窗口菜单。单。强大的矩阵运算功能:强大的矩阵运算功能:Mata Mata是是Stata的矩阵运算语言,实现各种运算。的矩阵运算语言,实现各种运算。兼容性:兼容性: 在在Stata中可以直接运行其它程序;其他语言编写的程序中可以直接运行其它程序;其他语言编写的程序可以作为插件(可以作为插件(Plugin)直接嵌入到)直接嵌入到Stata中。中。7学习课件二、二、Stata 的窗口的窗口 安装好安装好 Stata 后,点击电脑桌面上的后,点击电脑桌面上的Stata 图标,即可图标,即可打开打开Stata。此时可以看到,在最上方有一排菜单,即。此时可以看到,在最上方有一排菜单,即“File Edit Data Graphics Statistics User Window Help”。在此之下,有四个窗口,分别为:在此之下,有四个窗口,分别为: 左上左上“Review”(历史窗口):此窗口记录着自启(历史窗口):此窗口记录着自启动动Stata以来执行过的命令。以来执行过的命令。 左下左下“Variables”(变量窗口):此窗口记录着目前(变量窗口):此窗口记录着目前Stata 内存中的所有变量。内存中的所有变量。 右上右上“Results”(结果窗口):此窗口显示执行(结果窗口):此窗口显示执行Stata 命令后的输出结果。命令后的输出结果。 右下右下“Command”(命令窗口):在此窗口输入想(命令窗口):在此窗口输入想要执行的要执行的Stata 命令。命令。8学习课件 为了使屏幕分割更美观实用,可以用鼠标将以上窗口为了使屏幕分割更美观实用,可以用鼠标将以上窗口拉到任意大小与位置。然后点击菜单拉到任意大小与位置。然后点击菜单Edit”“Preferences” “General Preferences” “Windowing” “Locksplitter”,就可以锁定当前画面,而在以后重启,就可以锁定当前画面,而在以后重启Stata 时时自动显示这个画面设置。自动显示这个画面设置。9学习课件Stata 的主界面的主界面10学习课件三、三、Stata 操作操作1将数据导入将数据导入Stata 打开打开Stata 软件后,点击软件后,点击Data Data Editor 图标图标,即可打即可打开一个类似开一个类似Excel的空白表格。然后,用的空白表格。然后,用Excel 打开文件打开文件“实验数据实验数据.xls”,复制文件中的相关数据,并粘贴到,复制文件中的相关数据,并粘贴到Data Editor 中。中。 导入数据的另一方法是,点击菜单导入数据的另一方法是,点击菜单“File”“Import”,然后导入各种格式的数据。但这种方法有时不如直接从然后导入各种格式的数据。但这种方法有时不如直接从Excel 表中粘贴数据来得方便直观。表中粘贴数据来得方便直观。11学习课件 关闭关闭 Data Editor 后,即会看到左下方的后,即会看到左下方的“Variables”窗口出现了窗口出现了8 个变量,分别为个变量,分别为year、gdp、index、index1978、gov、pop、deflator、gcons。12学习课件 此时,可以点击此时,可以点击 Save 图标(也可以点击菜单图标(也可以点击菜单“File”“Save”),将数据存为),将数据存为Stata 格式的文件(扩展名为格式的文件(扩展名为dta),),比如比如wanger_law.dta。 这样,以后就可以用这样,以后就可以用Stata 直接打开这个数据集了(不直接打开这个数据集了(不需要再从需要再从Excel 表中粘贴过来)。表中粘贴过来)。 打开的方式有两种。可以点击打开的方式有两种。可以点击Open 图标(也可以点击图标(也可以点击菜单菜单“File”“Open”),然后寻找要打开的),然后寻找要打开的dta 文件的位文件的位置。置。 另外一种方法是在命令窗口输入以下命令(假设文件在另外一种方法是在命令窗口输入以下命令(假设文件在E 盘的根目录)并回车(按盘的根目录)并回车(按Enter 键),键),use E:wagner_law.dta,clear其中,选择项其中,选择项“clear”表示可以替代内存中的已有数据。表示可以替代内存中的已有数据。13学习课件 如果要关闭一个数据集(如果对数据集进行了改动,别如果要关闭一个数据集(如果对数据集进行了改动,别忘了先存盘忘了先存盘Save),以便使用另外一个数据集,可以在命),以便使用另外一个数据集,可以在命令窗口输入:令窗口输入:. clear 这样,内存中所有的当前数据都被清空,然后可以再打这样,内存中所有的当前数据都被清空,然后可以再打开另外一个数据集。开另外一个数据集。14学习课件2变量的标签变量的标签 在变量窗口,每个变量的在变量窗口,每个变量的“名字名字”(Name)旁边显示了)旁边显示了其其“标签标签”(label)。但目前的标签过于简略,缺乏变量的)。但目前的标签过于简略,缺乏变量的解解释信息。释信息。 如果想将变量如果想将变量“gov”的标签改为的标签改为“government expenditures”,可进行如下操作。以鼠标的右键点击变量名,可进行如下操作。以鼠标的右键点击变量名“gov”,然后选择,然后选择“Edit variable label”,输入,输入“government expenditures”即可。此时,再去看变量即可。此时,再去看变量“gov”的标签,就已的标签,就已经改为经改为“government expenditures”。另外,在右上角的结果。另外,在右上角的结果窗口出现了以下一行命令:窗口出现了以下一行命令:. label variable tc government expenditures 这表明,直接在命令窗口输入上面这行命令,也能达到一这表明,直接在命令窗口输入上面这行命令,也能达到一样的效果,但不如直接在变量上点击右键操作方便。样的效果,但不如直接在变量上点击右键操作方便。注意:注意:Stata 中字母的大小写是严格区分的,因此中字母的大小写是严格区分的,因此Stata 建建议对于变量名一律使用小写字母。议对于变量名一律使用小写字母。15学习课件3审视数据审视数据 一个数据集可能很大,而我们常希望看到数据的概貌。一个数据集可能很大,而我们常希望看到数据的概貌。想看数据集中的变量名单、标签等,可以在命令窗口输入:想看数据集中的变量名单、标签等,可以在命令窗口输入:. describe 如果想给整个数据集加上一个标签,以说明这个数据如果想给整个数据集加上一个标签,以说明这个数据集来自集来自“Wagner Law 1978-2009”,可输入命令:,可输入命令:. label data Wagner Law 1978-2009如果再次使用命令如果再次使用命令“describe”,就会看到数据集的标签,就会看到数据集的标签“Wagner Law 1978-2009”。如果想看变量如果想看变量 gov、gcons与与gdp的具体数据,可使用命令的具体数据,可使用命令:. list gov gcons gdp注意:注意:如果数据较长,可用如果数据较长,可用Ctrl+Break终止显示。终止显示。16学习课件 有时我们想对数据集的一部分执行命令,比如只想有时我们想对数据集的一部分执行命令,比如只想看变量看变量gov 与与gdp 的前的前5 个数据,则可输入命令个数据,则可输入命令:. list gov gdp in 1/5 也可以通过逻辑关系来定义数据集的子集。如果要也可以通过逻辑关系来定义数据集的子集。如果要列出所有满足条件列出所有满足条件“year 1995”的变量的变量gov与与gdp 的数的数据,则可以使用以下命令据,则可以使用以下命令:. list year gov gdp if year=1995其中,其中,“=”表示表示“大于等于大于等于”。其他表示关系的逻辑。其他表示关系的逻辑符号为符号为“= =”(等于),(等于),“”(大于),(大于),“”(小于),(小于),“=2001反之,如果只想保留满足反之,如果只想保留满足“year2001”条件的观测值,条件的观测值,而删去所有其他观测值而删去所有其他观测值:. keep if year=200118学习课件5考察变量的统计特征考察变量的统计特征如果想看变量如果想看变量 gov、gcons和和gdp的统计特征,可输入命令的统计特征,可输入命令:. summarize gov gcons gdpVariable Obs Mean Std. Dev. Min Maxgov 3214454.13 19217.2 1122.09 76299.93gcons 3211441.76 12730.41 480 44396.9gdp 3280670.91 94125.313645.218 340506.9满足条件的统计:满足条件的统计:. summarize gov gcons gdp if year2000如果不指明变量,则将显示数据集中所有变量的统计指标。如果不指明变量,则将显示数据集中所有变量的统计指标。summarize如果要显示内存中某些变量之间的相关系数,可输入命令如果要显示内存中某些变量之间的相关系数,可输入命令:. correlate gov gcons pop gdp19学习课件5画图画图 Stata 具有很强的画图功能。如果想看变量具有很强的画图功能。如果想看变量q 的直方图的直方图(假定组宽为(假定组宽为1000),可输入以下命令),可输入以下命令:. histogram q, width(8000) frequency05101520Frequency020000400006000080000government expenditures20学习课件0.00001.00002.00003.00004Density020000400006000080000government expenditureskernel = epanechnikov, bandwidth = 6128.97Kernel density estimate 由于直方图不连续,如果想看连续的经验分布图,可使由于直方图不连续,如果想看连续的经验分布图,可使用以下命令:用以下命令:. kdensity gov21学习课件如果要画如果要画 gov 与与gdp 之间的散点图,则可输入以下命令之间的散点图,则可输入以下命令:scatter gov gdp020000400006000080000government expenditures0100000200000300000400000gdp22学习课件如果想在散点图上同时画出回归直线,可以使用如下命令如果想在散点图上同时画出回归直线,可以使用如下命令:. twoway (scatter gov gdp)(lfit gov gdp)0200004000060000800000100000200000300000400000gdpgovernment expendituresFitted values其中,其中,“lfit”表示表示“linear fit”(线性拟合)。(线性拟合)。23学习课件6生成新变量生成新变量 如果要估计以下方程:如果要估计以下方程:tttgdpgov )ln()ln(10为了估计这个方程,需要在为了估计这个方程,需要在 Stata 中对原变量取对数,中对原变量取对数,可使用命令可使用命令“generate”。. generate lngov=log(gov). generate lngdp=log(gdp). reg lngov lngdp如果要生成如果要生成“虚拟变量虚拟变量”,定义为:定义为:1995119950ttdumtStata命令为:命令为:generate dum=(if year=1995)24学习课件删除变量:删除变量:drop 变量名变量名如:如:drop dum修改变量值修改变量值replace 变量名变量名=表达式表达式 条件条件如:如:replace dum=0 if year=199025学习课件 在执行在执行 Stata 命令时,有时需要调用许多变量,而某些命令时,有时需要调用许多变量,而某些变量名可能很长。此时,如果在命令窗口一一输入变量名,变量名可能很长。此时,如果在命令窗口一一输入变量名,可能较费事。可能较费事。 解决方法之一是:可以直接在左下角的解决方法之一是:可以直接在左下角的“变量窗口变量窗口”单击需要的变量,则该变量名就会显现在命令窗口。单击需要的变量,则该变量名就会显现在命令窗口。 解决方法之二是,如果有以下变量解决方法之二是,如果有以下变量lnq1, lnq2, , lnq30,而只想使用其中的前而只想使用其中的前15 个变量,则可以用个变量,则可以用lnq1-lnq15 来简来简略地表示这略地表示这15 个变量。个变量。 解决方法之三是,用解决方法之三是,用“*”号来节省变量名的书写。号来节省变量名的书写。 假设想将内存中所有以假设想将内存中所有以“ln”开头的变量都去掉,则可开头的变量都去掉,则可输入命令输入命令:. drop ln*26学习课件7Stata 的计算器功能的计算器功能 Stata 也可以作为计算器来使用。只要输入命令也可以作为计算器来使用。只要输入命令“display expression”即可。即可。 比如比如“display log(2)”将计算将计算ln 2。27学习课件8线性回归分析线性回归分析使用使用 OLS 对方程进行估计,可输入命令:对方程进行估计,可输入命令:reg lngov lngdp上表中的上表中的“_cons”表示常数项,表示常数项,“R-squared”显示显示R2 =0.9676,“Adj R-squared”显示显示0.9665。检验整个方程显著性的。检验整个方程显著性的F 统计统计量之量之p 值(值(Prob F)为)为0.0000,显示这个回归方程是高度显,显示这个回归方程是高度显著的。残差平方和为著的。残差平方和为1.77,方程标准差,方程标准差Root MSE为为0.24。28学习课件如果要显示估计系数的协方差矩阵,可输入命令,如果要显示估计系数的协方差矩阵,可输入命令,. . vcevce其中,其中,“vce”vce”表示表示“variance covariance matrix variance covariance matrix estimated”estimated”。在进行回归时,如果不要常数项,可以加上选择项在进行回归时,如果不要常数项,可以加上选择项“noconstant”noconstant”reg lngov lngdp,noconstantreg lngov lngdp,noconstant29学习课件 如果要计算被解释变量的拟合值如果要计算被解释变量的拟合值 ,并将其记为,并将其记为lntchat,可输入命令:可输入命令:. predict lntchaty 如果要计算如果要计算“残差残差”(residual),并将其记为),并将其记为e1,可输入命令:可输入命令:. predict e1,residual 其中,选择项其中,选择项“residual”表示预测残差。表示预测残差。30学习课件9Stata 的日志的日志 如果希望在每次使用如果希望在每次使用 Stata 时,储存其运行结果,时,储存其运行结果,可点击菜单可点击菜单“File”“Log”“Begin”,然后输入日志,然后输入日志(log)的文件名,并存储在你指定的位置。从此以后,)的文件名,并存储在你指定的位置。从此以后,你在你在Stata中的所有操作及其输出结果,都将被记录在中的所有操作及其输出结果,都将被记录在此日志中,直至你选择退出。此日志中,直至你选择退出。 如果要暂时关闭日志(不再记录输出结果),可输如果要暂时关闭日志(不再记录输出结果),可输入命令入命令“log off”。如果要恢复使用日志,可输入命令。如果要恢复使用日志,可输入命令“logon”。如果要彻底退出日志,只要输入命令。如果要彻底退出日志,只要输入命令“log close”即可。如果要查看日志文件中的内容,只要点击即可。如果要查看日志文件中的内容,只要点击存储位置上的日志文件图标即可。存储位置上的日志文件图标即可。31学习课件四、四、Stata 命令库的更新命令库的更新 由于由于 Stata 版本的不同(即使同为版本的不同(即使同为Stata 10),如果你),如果你发现某些命令无法运行,可在命令窗口输入,发现某些命令无法运行,可在命令窗口输入,. update all 这将更新你的这将更新你的 Stata 命令库(包括命令库(包括Stata 的的“ado”程序程序文件与其他可执行文件)。文件与其他可执行文件)。32学习课件五、五、 进一步学习进一步学习Stata 的资源的资源 更多有关更多有关 Stata 的知识,将在本课程以后的内容中逐步的知识,将在本课程以后的内容中逐步介绍。介绍。 有关有关 Stata 的英文参考书包括的英文参考书包括Baum(2006)与与Cameron and Trivedi(2009),中文参考书包括陈传波,中文参考书包括陈传波Stata 十八十八讲讲、劳伦斯、劳伦斯汉密尔顿(汉密尔顿(2008 译)、王群勇(译)、王群勇(2007)、王)、王天夫、李博柏(天夫、李博柏(2008)。)。 加州大学洛杉矶分校(加州大学洛杉矶分校( UCLA ) 网站网站(http:/www.ats.ucla.edu/stat/stata/)提供了大量有关)提供了大量有关Stata的资源及实例(搜索的资源及实例(搜索“Stata UCLA”即可找到此网站)。即可找到此网站)。 当然,当然,Stata 本身的本身的“帮助帮助”(Help)菜单已经包含了详)菜单已经包含了详细的信息。在使用细的信息。在使用Stata 命令时(比如,命令时(比如,reg),宜养成习惯,),宜养成习惯,经常看其对应的帮助信息(输入命令经常看其对应的帮助信息(输入命令“h reg”即可)。即可)。33学习课件
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 基础医学


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!