SAS系统数据管理ppt课件

上传人:风*** 文档编号:240993727 上传时间:2024-05-23 格式:PPT 页数:73 大小:2.01MB
返回 下载 相关 举报
SAS系统数据管理ppt课件_第1页
第1页 / 共73页
SAS系统数据管理ppt课件_第2页
第2页 / 共73页
SAS系统数据管理ppt课件_第3页
第3页 / 共73页
点击查看更多>>
资源描述
第第15章章 数据管理数据管理清华大学经管学院清华大学经管学院 朱世武朱世武ZResdat样本数据:样本数据:SAS论坛:论坛:第15章 数据管理清华大学经管学院 朱世武SAS系统提供的过程按其用途可分为四大类:n数据管理;n基础统计;n数据呈现;n数据访问。和任何一种编程语言一样,SAS系统有一些数据管理过程,用于实现常用的中间操作或数据转换。SAS系统提供的过程按其用途可分为四大类:本章将介绍的数据管理过程:本章将介绍的数据管理过程:数据集排序;数据集转置;改变输出地点;添加观测;数据库复制。本章将介绍的数据管理过程:数据集排序;数据集排序数据集排序 利用SAS的排序过程可以对数据集中的观测重新排序。SAS许多和BY配合使用的语句,如对数据集进行合并的语句或更新语句等,使用前必须先对BY变量进行排序。排序过程句法排序过程句法PROC SORT;BYvariable-1.variable-n;数据集排序 利用SAS的排序过程可以对数据集中的观测重新排序PROC SORT语句语句 PROC SORT;选项说明:DATA=规定被排序数据集,缺省时为最新创建数据集OUT=创建输出数据集,省略时用排序后数据集替换原数据集ASCII规定按ASCII排序SWEDISH规定按Swedish排序NATIONAL规定按习惯排序FORCE强行实施多余排序PROC SORT语句 PROC SORT option-其中:其中:选选项项FORCE强强行行实实施施多多余余排排序序。排排序序并并替替换换原原来来加加索索引引的的或或取取子子集集的的数数据据集集,即即没没有有规规定定OUT=选选项项时时,如如果果没没有有规规定定FORCE,就不能对有索引的数据集进行排序和替换。就不能对有索引的数据集进行排序和替换。没有规定OUT=选项时必须使用FORCE的选项有:nOBS=系统选项;nFIRSTOBS=系统选项;nDATA=数据集中的数据集选项WHERS=;nPROCSORT步用WHERE语句。其中:BY语句语句 BY variable-1variable-n;PROCSORT中必须使用BY语句,BY语句中可以规定任意多个变量。BY语句中规定多个变量时,SORT过程首先按第一个变量排序,然后是第二个变量等。BY语句中可以规定的选项:DESCENDING对变量按下降次序排序。BY语句 BY variable-1应用举例应用举例 例15.1按多变量排序。dataa;setResDat.Idx000001;year=year(date);qtr=qtr(date);month=month(date);procsortdata=aout=b;byyearqtrmonth;run;例中,对上证数据Idx000001按年、季和月排序。应用举例 例15.1 按多变量排序。例15.2按单变量降序排列。procsortdata=ResDat.a600001out=a;bydescendingclpr;procprintdata=a(obs=3)noobs;vardateclpr;run;例中,按收盘价CLPR的降序排列。例15.2 按单变量降序排列。数据集转置数据集转置 转置就是把数据集的观测变为变量,变量变为观测。利用SAS的转置过程可以对数据集进行转置。数据集转置 转置就是把数据集的观测变为变量,变量变为观测转置过程句法转置过程句法 PROC TRANSPOSE;BYvariable-1.variable-n;COPYvariable(s);ID variable;IDLABELvariable;VARvariable(s);转置过程句法 PROC TRANSPOSE DATA=in语句说明:语句说明:PROC TRANSPOSE 语句语句 PROC TRANSPOSE;选项说明:PROC TRANSPOSE 语句 PROC TRANSPOVAR语句和语句和ID语句语句 VAR语句VARvariable-list;VAR语句列出要转置的变量。没有VAR语句时,则没有列在其它语句里的所有数值变量被转置。VAR语句和ID语句 VAR语句ID语句IDvariable;ID语句规定输入数据集中一个变量。ID变量的值为转置后数据集的变量名。在没有选项LET时,ID变量的值在数据集中只能出现一次,使用BY语句,BY组内只包含最后的ID值。ID语句应用举例应用举例 例15.4ID变量的值为转置后数据集的变量名。proctransposedata=ResDat.classout=alet;idname;procprint;run;例中,原数据集CLASS中变量NAME的值为转置后数据集A的变量名,对所有数值变量转置。数据集A中还有一变量_NAME_.应用举例 例15.4 ID变量的值为转置后数据集的变量名。SAS系统12007年03月07日星期五下午09时21分17秒Obs_NAME_AliceBarbaraCarolJaneJanetJoyceJudyLouiseMaryAlfred1Age13.013.014.012.015.011.014.012.015.014.02Height56.565.362.859.862.551.364.356.366.569.03Weight84.098.0102.584.5112.550.590.077.0112.0112.5ObsHenryJamesJeffreyJohnPhilipRobertRonaldThomasWilliam114.012.013.012.01612.01511.015.0263.557.362.559.07264.86757.566.53102.583.084.099.5150128.013385.0112.0 例15.5BY组内最后一个ID值的观测被转置。proctransposedata=ResDat.classout=alet;idsex;procprint;run;结果显示:例15.5 BY组内最后一个ID值的观测被转置。proctransposedata=ResDat.classout=alet;idsex;bysex;procprint;run;结果显示:proc transpose data=ResDat.cla例15.8对每个BY组转置。optionsnodatepageno=1linesize=80pagesize=40;proctransposedata=ResDat.fishdataout=fishlength(rename=(col1=Measurement);varlength1-length4;bylocationdate;run;procprintdata=fishlengthnoobs;titleFishLengthDataforEachLocationandDate;run;例15.8 对每个BY组转置。FishLengthDataforEachLocationandDate1LocationDate_NAME_MeasurementColePond02JUN95Length131ColePond02JUN95Length232ColePond02JUN95Length332ColePond02JUN95Length433ColePond03JUL95Length133ColePond03JUL95Length234ColePond03JUL95Length337ColePond03JUL95Length432ColePond04AUG95Length129输出窗口显示 Fish Length Dat例例15.10 对转置后的数据集作统计分析。对转置后的数据集作统计分析。options nodate pageno=1linesize=80 pagesize=40;datasplit;setResDat.weights;arrays7s1-s7;subject+1;doTime=1to7;strength=stime;output;end;drops1-s7;run;procprintdata=split(obs=15)noobs;titleSplitDataSet;title2First15ObservationsOnly;run;/*接左侧*/proctransposedata=splitout=totsplitprefix=Str;byprogramsubject;copytimestrength;varstrength;run;procprintdata=totsplit(obs=15)noobs;titleTotsplitDataSet;title2First15ObservationsOnly;run;例15.10 对转置后的数据集作统计分析。options n改变输出地点改变输出地点 缺省情况下,SAS过程输出到OUTPUT窗口,SAS日志输出到LOG窗口。利用SAS的PRINTTO过程可以设定SAS过程和日志的输出地点。PRINTTO过程有以下功能:n改变过程输出的目的地;n改变SAS日志输出的目的地;n有选择地限制SAS输出;n将输出结果存放在永久文件中;n将输出直接送到打印机上;n将SAS的输出作为输入数据(这时需要一些附加的程序语句)。改变输出地点 缺省情况下,SAS过程输出到OUTPUT窗口,PRINTTO过程句法过程句法 PROC PRINTTO;选项说明注意:一般情况下,PROCPRINTTO后面一定要加RUN语句。若省略RUN语句,则会丢失PRINTTO后面DATA步或PROC步第一行的输出。PRINTTO过程句法 PROC PRINTTO opti应用举例应用举例 例15.11将SAS日志输出到外部永久文件。procprinttolog=d:log.dat;/*直接输出到永久文件中*/filenamef1d:out.txt;procprinttolog=f1;/*输出到文件标记*/例15.12将运行结果输出到外部永久文件。filenamef2d:out.list;procprinttoprint=f2;/*输出到文件标记*/procprinttoprint=d:out.list;/*直接输出到永久文件中*/应用举例 例15.11 将SAS日志输出到外部永久文件。例15.13直接打印输出结果。filenamefprinter;procprinttoprint=f;/*直接打印*/procprinttoprint=print;/*返回到缺省输出地点*/例15.14替换原输出文件。procprinttoprint=d:out.txtlog=d:log.datnew;procprintdata=ResDat.class;run;例15.13 直接打印输出结果。添加观测添加观测 利用SAS的APPEND过程可以将一个SAS数据集的观测添加到另一个SAS数据集的后面。添加观测 利用SAS的APPEND过程可以将一个SAS数据集APPEND过程句法过程句法 PROC APPENDBASE=SAS-data-set;APPEND过程中只需要一个语句。选项说明:BASE=|OUT=规定基本数据集的名子DATA=|NEW=规定要添加在基本数据集后面的数据集名,缺省时使用最近创建的SAS数据集FORCE强迫PROCAPPEND连接两数据集APPEND过程句法 PROC APPEND BAS应用举例应用举例 例15.17有条件添加数据。procappendbase=data1data=data2(where=(X=1);run;procappendbase=adata=ResDat.stk000001(where=(year(date)=1999);run;例中,使用数据集选项WHERE=或WHERE语句来限制DATA=的数据集中只有满足条件的观测被加到BASE=的数据集中。应用举例 例15.17 有条件添加数据。数据库复制数据库复制利用SAS的COPY过程可以复制整个SAS数据库或其中的数据库成员。数据库复制 利用SAS的COPY过程可以复制整个SAS数据COPY过程句法过程句法 PROC COPYOUT=libref-1IN=libref-2MOVE;EXCLUDESAS-file(s);SELECTSAS-file(s)/;子语句说明:Select规定要拷贝数据库IN=中的成员;Exclude规定不拷贝数据库IN=中的成员。COPY过程句法 PROC COPY OUT=lPROC COPY语句选项语句选项 选项说明:PROC COPY语句选项 选项说明:有效的成员类型(MEMTYPE):有效的成员类型(MEMTYPE):应用举例应用举例 例15.18两个SAS逻辑库之间复制数据集和目录册。proccopyin=lib1out=lib2MTYPE=(datacatalog);run;例15.19将逻辑库LIB1的所有SAS文件移动到LIB2中。proccopyin=lib1out=lib2move;run;应用举例 例15.18 两个SAS逻辑库之间复制数据集和目录例15.21选择以DAT开头的所有文件。dataResDat.datResDat.dat1ResDat.dat2ResDat.dat3(alter=zsw);var=move;run;proccopyin=ResDatout=workmove;selectdat:(alter=zsw);run;例15.21 选择以DAT开头的所有文件。第八章 对数极大似然估计 极大似然估计法极大似然估计法(maximum likelihood,ML),是不同,是不同于最小二乘法的另一种参数估计方法,是从极大似然原理于最小二乘法的另一种参数估计方法,是从极大似然原理发展起来的其他估计方法的基础。虽然其应用没有最小二发展起来的其他估计方法的基础。虽然其应用没有最小二乘法普遍,但在计量经济学理论上占据很重要的地位,因乘法普遍,但在计量经济学理论上占据很重要的地位,因为极大似然原理比最小二乘原理更本质地揭示了通过样本为极大似然原理比最小二乘原理更本质地揭示了通过样本估计母体参数的内在机理,计量经济学理论的发展更多的估计母体参数的内在机理,计量经济学理论的发展更多的是以极大似然估计原理为基础的,对于一些特殊的计量经是以极大似然估计原理为基础的,对于一些特殊的计量经济学模型,只有极大似然方法才是很成功的估计方法。济学模型,只有极大似然方法才是很成功的估计方法。第八章 对数极大似然估计 极大似然估计法 EViews包含了一些常用方法,如最小二乘法、非线性包含了一些常用方法,如最小二乘法、非线性最小二乘法、加权最小二乘法、最小二乘法、加权最小二乘法、TSLS、GMM、ARIMA、ARCH、GARCH等方法,这些方法可以解决可能遇到的大等方法,这些方法可以解决可能遇到的大多数估计问题。但是,我们在研究中也可能会碰到一些不在多数估计问题。但是,我们在研究中也可能会碰到一些不在上述之列的特殊的模型,这些模型可能是现存方法的一个扩上述之列的特殊的模型,这些模型可能是现存方法的一个扩展,也可能是一类全新的问题。展,也可能是一类全新的问题。为为了了能能解解决决这这些些特特殊殊的的问问题题,EViews提提供供了了对对对对数数数数极极极极大大大大似似似似然然然然估估估估计计计计对对对对象象象象这这一一工工具具来来估估计计各各种种不不同同类类型型的的模模型型。对对数数极极大大似似然然估估计计对对象象提提供供了了一一个个一一般般的的,开开放放的的工工具具,可可以以通通过过这个工具极大化相关参数的似然函数对一大类模型进行估计。这个工具极大化相关参数的似然函数对一大类模型进行估计。EViews包含了一些常用方法,如最小二乘法使使用用对对数数极极大大似似然然估估计计对对象象估估计计时时,我我们们用用EViews的的序序列列生生成成器器,将将样样本本中中各各个个观观测测值值的的对对数数似似然然贡贡献献描描述述为为一一个个未未知知参参数数的的函函数数。可可以以给给出出似似然然函函数数中中一一个个或或多多个个参参数数的的解解析析微微分分,也也可可以以让让EViews自自动动计计算算数数值值微微分分。EViews将将寻寻找找使使得得指指定定的的似似然然函函数数最最大大化化的的参参数数值值,并并给出这些参数估计的估计标准差。给出这些参数估计的估计标准差。在在本本章章,我我们们将将详详细细论论述述对对数数极极大大似似然然估估计计对对象象,说说明明其其一一般般特特征征。并并给给出出了了一一些些可可以以使使用用该该方方法法的的具具体体的的例子。例子。使用对数极大似然估计对象估计时,我们用E8.1 8.1 对数极大似然估计的基本原理对数极大似然估计的基本原理对数极大似然估计的基本原理对数极大似然估计的基本原理 8.1.1 8.1.1 极大似然估计的基本原理极大似然估计的基本原理极大似然估计的基本原理极大似然估计的基本原理 设设总总体体的的概概率率密密度度函函数数为为P,其其类类型型是是已已知知的的,但但含含有有未未知知参参数数(向向量量)。我我们们的的目目的的就就是是依依据据从从该该总总体体抽抽得得的的随随机机样本样本 y1,y2,yT,寻求对,寻求对 的估计。的估计。观测值观测值 y1,y2,yT 的联合密度函数被给定为的联合密度函数被给定为 (8.1.1)其其中中:y=(y1,y2,yT)。将将这这一一联联合合密密度度函函数数视视为为参参数数 的函数,称为样本的似然函数(的函数,称为样本的似然函数(likelihood function)。)。8.1 对数极大似然估计的基本原理 8.1.1 极大 极极大大似似然然原原理理就就是是寻寻求求参参数数的的估估计计值值 ,使使得得所所给给样样本本值值的的概概率率密密度度(即即似似然然函函数数)的的值值在在这这个个参参数数值值之之下下,达达到到最最大大。在在当当前前的的情情形形下下,就就是是寻寻求求 的的估估计计值值,使使得得似似然然函函数数 L(y;)相相对对于于给给定定的的观观测测值值 y1,y2,yT 而而言言达达到到最最大大值值,就就被被称称为为极极大大似似然然估估计计量。量。极大似然原理就是寻求参数的估计值 ,使 在在 L(y;)关关于于 i(i=1,2,n,n是是未未知知参参数数的的个个数数)的偏导数存在时,要使的偏导数存在时,要使 L(y;)取最大值取最大值,必须满足必须满足,i=1,2,n (8.1.2)由上式可解得由上式可解得 n 1向量向量 的极大似然估计值的极大似然估计值 ,而式,而式(8.1.2)也被称为似然函数。也被称为似然函数。在 L(y;)关于i(i=1,因因为为 L(y;)与与 lnL(y;)在在同同一一点点处处取取极极值值,所所以也可以由以也可以由,i=1,2,n(8.1.3)求得,因为对数可将乘积变成求和,所以,式求得,因为对数可将乘积变成求和,所以,式(8.1.3)往往往往比直接使用式比直接使用式(8.1.2)来得方便。式来得方便。式(8.1.3)也被称为对数似也被称为对数似然函数。然函数。因为 L(y;)与 lnL(y;考虑多元线性回归模型的一般形式考虑多元线性回归模型的一般形式 ,t=1,2,T(8.1.4)其中其中 k 是解释变量个数,是解释变量个数,T 是观测值个数,随机扰动项是观测值个数,随机扰动项 ,那么那么 yt 服从如下的正态分布:服从如下的正态分布:其中其中(8.1.5)考虑多元线性回归模型的一般形式 y 的随机抽取的的随机抽取的 T 个样本观测值的联合概率函数为个样本观测值的联合概率函数为 (8.1.6)这就是变量这就是变量y的似然函数,未知参数向量的似然函数,未知参数向量=1,2,k,2。对似然函数求极大值和对数似然函数求极大值是等价对似然函数求极大值和对数似然函数求极大值是等价的,式的,式(8.1.6)的的对数似然函数形式对数似然函数形式对数似然函数形式对数似然函数形式为:为:(8.1.7)y 的随机抽取的 T 个样本观测值的联合概 注注意意,可可以以将将对对数数似似然然函函数数写写成成 t 时时刻刻所所有有观观测测值值的的对数似然贡献和的形式,对数似然贡献和的形式,(8.1.8)这这里里对对数数似似然然的的单单个个贡贡献献(用用小小写写字字母母表表示示)由由下下面面的式子给出:的式子给出:(8.1.9)注意,可以将对数似然函数写成 t 时刻所有观 式(式(8.1.7)也可用标准正态分布的密度函数)也可用标准正态分布的密度函数 表示表示 (8.1.10)式中式中标准正态分布的对数似然函数标准正态分布的对数似然函数标准正态分布的对数似然函数标准正态分布的对数似然函数 为为 (8.1.11)这这里里对对数数似似然然函函数数每每个个观观测测值值的的贡贡献献式式(8.1.9)又又可可以以由由下下面面的的式子给出:式子给出:(8.1.12)式(8.1.7)也可用标准正态分布的密度函 8.1.2 8.1.2 EViewsEViews极大似然对象概述极大似然对象概述极大似然对象概述极大似然对象概述 用对数极大似然估计来估计一个模型,主要的工作是用对数极大似然估计来估计一个模型,主要的工作是建立用来求解似然函数的说明文本。用建立用来求解似然函数的说明文本。用EViews指定对数指定对数极大似然函数的说明是很容易的,因为似然函数的说明只极大似然函数的说明是很容易的,因为似然函数的说明只是一系列对序列的赋值语句,这些赋值语句在极大化的过是一系列对序列的赋值语句,这些赋值语句在极大化的过程中被反复的计算。我们所要做的只是写下一组语句,在程中被反复的计算。我们所要做的只是写下一组语句,在计算时,这些语句将描述一个包含每个观测值对似然函数计算时,这些语句将描述一个包含每个观测值对似然函数贡献的序列。贡献的序列。8.1.2 EViews极大似然对象概述 注注意意到到,我我们们能能将将对对数数似似然然函函数数写写成成所所有有观观测测值值 t 的的对数似然贡献和对数似然贡献和对数似然贡献和对数似然贡献和的形式,的形式,这里这里单个贡献单个贡献单个贡献单个贡献由下面的式子给出:由下面的式子给出:注意到,我们能将对数似然函数写成所有观测值 以只含一个解释变量的一元线性回归方程为例以只含一个解释变量的一元线性回归方程为例 ,t=1,2,T 假定知道模型参数的真实值,并且想用假定知道模型参数的真实值,并且想用EViews产生产生一个包含每个观测值的贡献的序列。一个包含每个观测值的贡献的序列。以只含一个解释变量的一元线性回归方程为例 未未知知参参数数向向量量 =0,1,2,可可以以将将参参数数初初值值赋赋给给系系数数向向量量的的c(1)到到c(3)元元素素,然然后后把把下下面面的的赋赋值值语语句句作作为为EViews的的命令或程序来执行。命令或程序来执行。Series res=y-c(1)-c(2)*x Series var=c(3)Series logL1=-log(2*3.14159*var)/2-(res2/var)/2 前前面面两两行行语语句句描描述述了了用用来来存存储储计计算算时时的的中中间间结结果果的的序序列列。第第一一个个语语句句创创建建了了残残残残差差差差序序序序列列列列:resres,而而第第二二个个语语句句创创建建了了方方方方差差差差序序序序列列列列:varvar。而而序序列列logL1logL1包包含含了了每每每每个个个个观观观观测测测测值值值值的的的的对对对对数数数数似似似似然然然然贡贡贡贡献献献献的集合。的集合。未知参数向量=0,1,2,下面考虑下面考虑2个变量的例子:个变量的例子:这这里里,y,x,w 是是观观测测序序列列,而而 =1,2,3,2是是模模型型的的参参数数。有有T个观测值的样本的对数似然函数可以写成:个观测值的样本的对数似然函数可以写成:这里,这里,是标准正态分布的密度函数。是标准正态分布的密度函数。下面考虑2个变量的例子:将这一例子的对数极大似然函数过程写成下面的赋值语将这一例子的对数极大似然函数过程写成下面的赋值语句:句:Series res=y-c(1)-c(2)*x-c(3)*w Series var=c(4)Series logL1=log(dnorm(res/sqrt(var)-log(var)/2 前前面面两两行行语语句句创创建建了了残残差差序序列列res和和方方差差序序列列var,参参数数c(1),c(2),c(3)代代表表了了回回归归系系数数 1,2,3,c(4)代代表表了了 2,序序列列logL1包含了每个观测值的对数似然贡献的集合。包含了每个观测值的对数似然贡献的集合。将这一例子的对数极大似然函数过程写成下面的赋值语句下下面面考考虑虑稍稍复复杂杂的的例例子子,假假设设数数据据是是由由条条件件异异方方差差回回归归模模型型生成的:生成的:这这里里,x,y,w 是是观观测测序序列列,而而=1,2,3,2,是是模模型型的的参参数。有数。有T个观测值的样本的对数似然函数可以写成:个观测值的样本的对数似然函数可以写成:这里,这里,是标准正态分布的密度函数。是标准正态分布的密度函数。下面考虑稍复杂的例子,假设数据是由条件异方 将这一例子的对数极大似然函数过程写成下面的赋值语句:将这一例子的对数极大似然函数过程写成下面的赋值语句:Series res=y-c(1)-c(2)*x-c(3)*w Series var=c(4)*wc(5)Series logL1=log(dnorm(res/sqrt(var)-log(var)/2 前前面面两两行行语语句句创创建建了了残残差差序序列列res和和方方差差序序列列var,参参数数c(1),c(2),c(3)代代表表回回归归系系数数 1,2,3,c(4)代代表表 2,c(5)代代表表 ,序列,序列logL1包含了每个观测值的对数似然贡献的集合。包含了每个观测值的对数似然贡献的集合。将这一例子的对数极大似然函数过程写成下面的赋值语句:现现在在假假定定不不知知道道模模型型参参数数的的真真实实值值,而而想想使使用用数数据据来来估估计计它它。参参数数的的极极大大似似然然估估计计被被定定义义为为:使使得得样样本本中中所所有有随随机机抽抽取取的的一一组组观观测测值值的的联联合合概概率率密密度度,即即似似然然函函数数取最大值的那组参数值。取最大值的那组参数值。而对数极大似然方法使得寻找这些极大似然估计变而对数极大似然方法使得寻找这些极大似然估计变得容易了。只需创建一个对数似然对象,把上面的赋值得容易了。只需创建一个对数似然对象,把上面的赋值语句输入到语句输入到logL的说明窗口,然后让的说明窗口,然后让EViews来估计这个来估计这个模型。模型。现在假定不知道模型参数的真实值,而想使用数在在输输入入赋赋值值语语句句时时,只只需需对对上上面面的的文文本本做做两两处处微微小小的的改改动动就就可可以以了了。首首先先,把把把把每每每每行行行行开开开开头头头头的的的的关关关关键键键键字字字字seriesseries删删删删掉掉掉掉(因因为为似似然然说说明明暗暗含含了了假假定定序序列列是是当当前前的的)。第第二二,必必必必须须须须在在在在说说说说明明明明中中中中加加加加入入入入额额额额外外外外的的的的一一一一行行行行(关关键键字字logLlogL为为包包含含似似似似然然然然贡贡贡贡献献献献的的的的序序序序列命名列命名列命名列命名)。)。这样,要在这样,要在logL说明窗口输入下面的内容:说明窗口输入下面的内容:logL logl res=y-c(1)-c(2)*x-c(3)*w var=c(4)*wc(5)logl=log(dnorm(res/sqrt(var)-log(var)/2 对数似然函数的第一行,对数似然函数的第一行,logL logl,告诉,告诉EViews用用logl序列来存储似然贡献。余下的行定义了中间结果的计算序列来存储似然贡献。余下的行定义了中间结果的计算和实际的似然贡献的计算。和实际的似然贡献的计算。在输入赋值语句时,只需对上面的文本做两处 当当用用EViews估估计计模模型型参参数数时时,它它将将对对不不同同参参数数值值重重复复执执行行说说明明中中的的赋赋值值语语句句,使使用用迭迭代代法法来来求求使使得得对对数数似似然然贡贡献献最最大大的的一一组组参参数数值值。当当EViews再再不不能能提提高高全全部部似似然然贡贡献献时时,它它将将停停止止迭迭代代并并在在估估计计输输出出中中报报告告最终参数值和估计标准差。最终参数值和估计标准差。本章下面的部分将更详细地讨论使用似然方法说本章下面的部分将更详细地讨论使用似然方法说明,估计和检验时要遵循的规则。明,估计和检验时要遵循的规则。当用EViews估计模型参数时,它将对不同参要要创创建建一一个个似似然然对对象象,选选择择Objects/New Object./LogL或或者者在在命命令令窗窗口口输输入入“logL”。似似然然窗窗口口将将打打开开一一个个空空白白说说明明视视图图。说说明明视视图图是是一一个个文文本本窗窗口口,在在这这个个窗窗口口里里可可以以输输入入描描述述统统计计模模型型的的说说明明语语句句,还还可可以以设设置置控控制制估估计计程程序序各个方面的选项。各个方面的选项。8.1.3 8.1.3 似然似然似然似然说明说明说明说明 要创建一个似然对象,选择Objects/1 1似然的定义似然的定义似然的定义似然的定义 正正如如上上节节中中所所描描述述的的那那样样,似似然然说说明明的的主主线线是是一一系系列列赋赋值值语语句句,在在计计算算时时,这这些些赋赋值值语语句句将将产产生生一一个个包包含含样样本本中中每每个个观观测测值值的的对对数数似似然然贡贡献献的的序序列列。赋赋值值语语句句的的多少可以自己决定。多少可以自己决定。1似然的定义每每个个似似然然说说明明都都必必须须包包含含一一个个控控制制语语句句,该该语语句句命命名名了了保存似然贡献的序列。语句的格式为:保存似然贡献的序列。语句的格式为:logL series_namelogL series_name这这里里logL是是关关键键字字,series_name是是保保存存似似然然贡贡献献的的序序列列的的名字,可以写在似然说明的任何位置。名字,可以写在似然说明的任何位置。例例如如,对对于于一一元元线线性性回回归归方方程程的的似似然然说说明明来来说说,第第一一行行:logL logl是是似似然然贡贡献献的的序序列列的的说说明明。当当对对模模型型进进行行计计算算时时,EViews将将在在现现有有参参数数值值下下执执行行每每个个赋赋值值语语句句,并并将将结结果果保保存存到到指指定定名名称称的的序序列列里里。如如果果序序列列不不存存在在,系系统统将将自自动动创创建建,如如果果已已经经存存在在,系系统统将将使使用用现现有有的的序序列列,并并覆覆盖盖序序列列原原来来的的内容。内容。每个似然说明都必须包含一个控制语句,该语 如如果果想想在在估估计计完完成成后后删删除除说说明明中中的的一一个个或或多多个个序序列列,可可以使用以使用temp语句:语句:temp series_name1 sereis_name2.temp series_name1 sereis_name2.这这个个语语句句告告诉诉EViews在在对对说说明明的的计计算算完完成成后后,删删除除列列表表中中的的序序列列。如如果果在在logL中中创创建建了了许许多多中中间间结结果果,又又不不愿愿意意工工作作文文件件因因包包含含这这些些结结果果的的序序列列而而弄弄得得混混乱乱的的话话,删删除除这这些些序序列列将将是是很很有有用用的的。例例如如,图图8.2中中的的最最后后一一行行语语句句就就是是命命令令EViews在在估估计计结结束束后后,删删除除估估计计产产生生的的中中间间序序列列res、var和和logl。这这里里需需要要强强调调一一点点,在在似似然然说说明明的的文文本本中中可可以以加加入入说说明明语语句句,说说明明语语句句的的前前面面加加上上撇撇号号“”,则则这这个个语语句句将将不不被被执行。执行。如果想在估计完成后删除说明中的一个或多个序列 2 2参数名参数名参数名参数名在在上上面面的的例例子子中中,我我们们使使用用了了系系数数c(1)到到c(5)作作为为未未知知参参数数的的名名称称。更更一一般般的的,出出现现在在说说明明中中一一个个已已命命名名的的系系数数向向量量中中的的每每一一个个元元素素都都将将被被视视为为待待估估参参数数。例例如如创创建建2个个命命名名的系数向量:的系数向量:beta(2)sigma(1)于是可以写出下面的似然说明:于是可以写出下面的似然说明:logL logL1 res=cs-beta(1)-beta(2)*inc var=sigma(1)logl1=log(dnorm(res/sqrt(var)-log(var)/2 2参数名 由由于于说说明明中中的的已已命命名名的的系系数数向向量量的的所所有有元元素素都都将将被被视视为为待待估估参参数数,必必必必须须须须确确确确定定定定所所所所有有有有的的的的系系系系数数数数确确确确实实实实影影影影响响响响了了了了一一一一个个个个或或或或多多多多个个个个似似似似然然然然贡贡贡贡献献献献的的的的值值值值。如如果果一一个个参参数数对对似似然然没没有有影影响响,那那么么在在试试图进行参数估计时,将遇到一个奇异错误。图进行参数估计时,将遇到一个奇异错误。应应该该注注意意到到除除了了系系数数元元素素外外所所有有的的对对象象在在估估计计过过程程中中都都将将被被视视为为固固定定的的,不不可可改改变变的的。例例如如,假假定定omega是是工工作作文文件件中中一一个个已已命命名名的的标标量量(scalar omega),如如果果将将子子表表达式达式var定义如下定义如下:var=omega EViews将将不不会会估估计计omega。omega的的值值将将被被固固定定在在估估计计的开始的开始值上值上。由于说明中的已命名的系数向量的所有元素都将 3 3估计的顺序估计的顺序估计的顺序估计的顺序 logL说说明明包包含含了了一一个个或或多多个个能能够够产产生生包包含含似似然然贡贡献献的的序序列列的的赋赋值值语语句句。在在执执行行这这些些赋赋值值语语句句的的时时候候,EViews总总是是从从顶顶部部到到底底部部执执行行,所所以以后后面面计计算算要要用用到到的表达式应放在前面。的表达式应放在前面。EViews对对整整个个样样本本重重复复地地计计算算每每个个表表达达式式。EViews对对模模型型进进行行重重复复计计算算时时采采用用方方方方程程程程顺顺顺顺序序序序和和样样样样本本本本观观观观测测测测值值值值顺顺顺顺序序序序两两种种不不同同方方式式,这这样样就就必必须须指指定定采采用用那那种种方方式,即观测值和方程的执行顺序。式,即观测值和方程的执行顺序。3估计的顺序 (1 1)观测值顺序()观测值顺序()观测值顺序()观测值顺序(byobsbyobs )默默认认情情形形下下,EViews用用观观测测值值顺顺序序来来计计算算模模型型,此此种种方方式式是是先先用用第第一一个个观观测测值值来来计计算算所所有有的的赋赋值值语语句句,接接下下来来是是用用第第二二个个观观测测值值来来计计算算所所有有的的赋赋值值语语句句,如如此此往往复复,直直到到估估计计样样本本中中所所有有观观测测值值都都使使用用过过。这这是是用用观观测测值值顺顺序序来来计计算算递递归归模模型型的的正正确确顺顺序序,递递归归模模型型中中每每一一个个观观测测值值的的似似然然贡贡献献依依赖赖于于前前面面的的观观测测值值,例例如如AR模模型型或或ARCH模型。模型。(1)观测值顺序(byobs)(2 2)方程顺序()方程顺序()方程顺序()方程顺序(byeqnbyeqn )可可以以改改变变计计算算的的顺顺序序,这这样样EViews就就可可以以用用方方程程顺顺序序来来计计算算模模型型,先先用用所所有有的的观观测测值值来来计计算算第第一一个个赋赋值值语语句句,然然后后用用所所有有的的观观测测值值计计算算第第二二个个赋赋值值语语句句,如如此此往往复复,对对说说明明中中每每一一个个赋赋值值语语句句都都用用同同样样方方式式进进行行计计算算。这这是是用用中中间间序序列列的的总量统计作为后面计算的输入的模型的正确顺序。总量统计作为后面计算的输入的模型的正确顺序。可以通过在说明中加入一条语句来声明所选择的计算方可以通过在说明中加入一条语句来声明所选择的计算方法。要用方程顺序来计算,仅加一行关键字法。要用方程顺序来计算,仅加一行关键字“byeqnbyeqn”。要。要用样本顺序来计算,可以用关键字用样本顺序来计算,可以用关键字“byobs”。如果没有给。如果没有给出关键字,那么出关键字,那么系统默认为系统默认为系统默认为系统默认为“byobs”byobs”。(2)方程顺序(byeqn)例例例例8.1 8.1 一元线性回归方程的极大似然估计一元线性回归方程的极大似然估计一元线性回归方程的极大似然估计一元线性回归方程的极大似然估计 以以例例3.1的的消消费费函函数数作作为为例例子子,分分析析普普通通回回归归方方程程的的极极大大似似然然估估计计方方法法。消消费费函函数数的的被被解解释释变变量量cs为为实实际际居居民民消消费费,解解释释变变量量为为实实际际可可支支配配收收入入inc,变变量量均均为为剔剔除除了了价价格格因因素素的的实实际际年年度度数数据据,样样本本区区间间为为19782006年年。那那么么凯凯恩恩斯斯消消费费函函数的方程形式就可以写成:数的方程形式就可以写成:(8.2.5)其中:其中:ut服从标准正态分布,服从标准正态分布,cs=CS/CPI,inc=YD/CPI,CPI 代表代表1978年为年为1的居民消费价格指数,的居民消费价格指数,代表自发消费,代表自发消费,代表边际消费倾向,则参数向量为代表边际消费倾向,则参数向量为=(,u2),观测值个,观测值个数数T=29。例8.1 一元线性回归方程的极大似然估计 利用前面的式利用前面的式(8.2.2),我们可以写出这个方程的对数极大,我们可以写出这个方程的对数极大似然函数似然函数 (8.2.6)(8.2.6)式中式中zt=(cst-inct)/u。利用前面的式(8.2.2),我们可以写出这个 利用极大似然方法求解,作为利用极大似然方法求解,作为byobs语句的一个例子,语句的一个例子,考虑下面的说明:考虑下面的说明:EViews用观测值顺序来计算模型,此种方式是先用第一用观测值顺序来计算模型,此种方式是先用第一个观测值来计算所有的赋值语句,接下来是用第二个观测值个观测值来计算所有的赋值语句,接下来是用第二个观测值来计算所有的赋值语句,如此往复,直到估计样本中所有观来计算所有的赋值语句,如此往复,直到估计样本中所有观测值都使用过。本例将方差作为未知参数测值都使用过。本例将方差作为未知参数c(3),一起求解。,一起求解。利用极大似然方法求解,作为byobs语句的 进行极大似然求解之后,得到进行极大似然求解之后,得到 和和 的估计值的估计值:c(3)是方差的估计结果。这个结果与最小二乘法得到的结是方差的估计结果。这个结果与最小二乘法得到的结果完全相同。果完全相同。进行极大似然求解之后,得到 和 的估计值 作为作为byeqn语句的一个例子,考虑下面的说明:语句的一个例子,考虑下面的说明:进行极大似然求解之后,得到进行极大似然求解之后,得到 和和 的估计值的估计值:作为byeqn语句的一个例子,考虑下面例例例例8.4 8.4 具有异方差的一元线性回归模型的极大似然估计具有异方差的一元线性回归模型的极大似然估计具有异方差的一元线性回归模型的极大似然估计具有异方差的一元线性回归模型的极大似然估计 根根据据第第4章章例例4.1,各各省省人人均均家家庭庭交交通通及及通通讯讯支支出出(cum)和和可可支支配配收收入入(in)的的关关系系,样样本本个个数数为为30,考考虑虑如如下下具具有有异异方方差差性性的方程:的方程:(8.2.40)为消除方程中的异方差,利用加权最小二乘法求解,设为消除方程中的异方差,利用加权最小二乘法求解,设t=cumt 0 1 int,w=1/|,可可以以写写出出式式(8.2.40)的的对对数数极极大大似然函数似然函数 (8.2.41)它的未知参数向量为它的未知参数向量为 =(0,1)。例8.4 具有异方差的一元线性回归模型的极大似然估计 也也可可用用同同样样的的处处理理方方法法利利用用极极大大似似然然方方法法求求解解,作作为为byeqn语句的一个例子,考虑下面的说明:语句的一个例子,考虑下面的说明:这个说明通过利用残差这个说明通过利用残差res建立加权向量建立加权向量w=1/abs(res)来完成来完成一个加权最小二乘回归。一个加权最小二乘回归。res的赋值语句计算了在每次计算时的的赋值语句计算了在每次计算时的残差,而这被用做构造权重序列。残差,而这被用做构造权重序列。byeqn语句指示语句指示EViews在一在一个给定的迭代过程中,必须先算出所有的残差个给定的迭代过程中,必须先算出所有的残差res,然后再计算,然后再计算残差的加权向量残差的加权向量w。本例方差用样本方差替代,也可将方差作为。本例方差用样本方差替代,也可将方差作为未知参数未知参数c(3),一起求解。,一起求解。也可用同样的处理方法利用极大似然方法求解,作
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!