资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Example 4.5,背景介绍,以,We4,P132 Example 4.5 hprice2.dta,为例;,研究问题:住房价格和空气污染的关系;,(,简化:,median housing price ,研究对象:波士顿地区,506,个社区;,变量定义:,nox:,空气中氮氧化物的浓度;,dist:,社区距离,5,个就业中心的距离;,第1页/共15页,Example 4.5,背景介绍,变量定义:,rooms:,社区中住房的平均房间数目;,stratio:,社区中中学的平均学生和老师比例;,回归模型:,log(price)=,0,+ ,1,log(nox),+ ,2,log(dist),+ + ,3,rooms,+ ,4,stratio+u,第2页/共15页,1,、数据的统计性质,导入数据:,方法一:,cd,F:,研究生,研一下,双学位中计,2,课件,statafiles,;,(设定当前工作区),use hprice2,clear,(调用数据),方法,二:,use F:,研究生,研一下,双学位中计,2,课件,statafileshprice2.dta, clear,第3页/共15页,Data,price,nox,rooms,dist,stratio,1,24000,5.38,6.57,4.09,15.3,2,21599,4.69,6.42,4.97,17.8,3,34700,4.69,7.18,4.97,17.8,4,33400,4.58,7,6.06,18.7,5,36199,4.58,7.15,6.06,18.7,6,28701,4.58,6.43,6.06,18.7,7,22900,5.24,6.01,5.56,15.2,8,27100,5.24,6.17,5.95,15.2,9,16500,5.24,5.63,6.08,15.2,10,18900,5.24,6,6.59,15.2,第4页/共15页,Contains data from hprice2.dta,obs: 506,vars: 13 31 Oct 1996 16:37,size: 24,794,-,storage display value,variable name type format label variable label,-,price float %9.0g median housing price, $,nox float %9.0g nit ox concen; parts per 100m,rooms float %9.0g avg number of rooms,dist float %9.0g wght dist to 5 employ centers,stratio float %9.0g average student-teacher ratio,lprice float %9.0g log(price),lnox float %9.0g log(nox),-,Sorted by:,Describe & list,第5页/共15页,Summarize & Sum &Sort,gen ldist=log(dist),sum lprice lnox ldist rooms stratio,第6页/共15页,散点矩阵图,Graph matrix price nox dist rooms strtio,Graph matrix lprice lnox ldist rooms strtio,Comparison and Model selection,第7页/共15页,第8页/共15页,第9页/共15页,2,、,do file & log file,参见代码,第10页/共15页,独立、均值独立、不相关,第11页/共15页,独立,随机事件独立的定义,:,事件,A,、,B,相互独立,P(AB)=P(A)*P(B) P(A,lB)=P(A),;,多维随机变量间的独立性:设,n,维随机变,(X,1,X,2,X,n,),的联合分布函数为,F(x,1,x,2,x,n,),F,i,(x,i,),为,X,i,的边际分布函数。如果对任意,n,个实数,x,1,x,2,x,n,有,则称,X,1,X,2,X,n,相互独立。,第12页/共15页,均值独立,E(u,lx)=0,独立 均值独立,Proof,:,第13页/共15页,反例:,第14页/共15页,感谢您的观赏!,第15页/共15页,
展开阅读全文