资源描述
,*,单击此处编辑母版标题样式,*,单击此处编辑母版标题样式,*,单击此处编辑母版标题样式,*,*,单击此处编辑母版标题样式,*,应用回归分析,应用回归分析,统计软件,SPSS 17.0,最新版本,Statistical Package for the Social Science,统计软件SPSS 17.0 最新版本,章 节 目 录,第,1,章 回归分析概述,第,2,章 一元线性回归,第,3,章 多元线性回归,第,4,章 违背差不多假定的情况,第,5,章 自变量选择与逐步回归,第,6,章 多重共线性的情形及其处理,第,7,章 岭回归,第,8,章 非线性回归,第,9,章 含定性变量的回归模型,章 节 目 录第1章 回归分析概述,第,1,章 回归分析概述,1.1,变量间的统计关系,1.2,回归方程与回归名称的由来,1.3,回归分析的要紧内容及其一般模型,1.4,建立实际问题回归模型的过程,1.5,回归分析应用与发展述评,思考与练习,第1章 回归分析概述1.1 变量间的统计关系,1.1,变量间的统计关系,函数关系,商品的销售额与销售量之间的关系,y,=,px,圆的面积与半径之间的关系,S,=,R,2,原材料消耗额与产量,(,x,1,),、单位产量消耗,(,x,2,),、原材料价格,(,x,3,),之间的关系,y,=,x,1,x,2,x,3,1.1 变量间的统计关系函数关系,1.1,变量间的统计关系,1.1 变量间的统计关系,1.1,变量间的统计关系,相关关系的例子,子女身高,(,y,),与父亲身高,(,x,),之间的关系,收入水平,(,y,),与受教育程度,(,x,),之间的关系,粮食亩产量,(,y,),与施肥量,(,x,1,),、降雨量,(,x,2,),、温度,(,x,3,),之间的关系,商品的消费量,(,y,),与居民收入,(,x,),之间的关系,商品销售额,(,y,),与广告费支出,(,x,),之间的关系,1.1 变量间的统计关系相关关系的例子,1.1,变量间的统计关系,1.1 变量间的统计关系,对变量间统计依赖关系的考察要紧是通过相关分析,(correlation analysis),或回归分析,(regression analysis),来完成的,1.1,变量间的统计关系,对变量间统计依赖关系的考察要紧是通过相关分析(correla,注意,(,1,),不线性相关并不意味着不相关。,(,2,),有相关关系并不意味着一定有因果关系。,(,3,)相关分析,对称地对待任何(两个)变量,两个变量都被看作是随机变量。,(,4,)回归分析,对变量的处理方法存在不对称性,即区分因变量(被解释变量)和自变量(解释变量):前者是随机变量,后者不是。,1.1,变量间的统计关系,注意1.1 变量间的统计关系,回归分析构成计量经济学的方法论基础,其要紧内容包括:,(,1,)依照样本观察值对经济计量模型的参数进行可能,求得回归方程;,(,2,)对回归方程、参数估计值进行显著性检验;,(,3,)利用回归方程进行分析、评价及预测。,1.1,变量间的统计关系,回归分析构成计量经济学的方法论基础,其要紧内容包括:1.1,1.2,回归方程与回归名称的由来,英国著名统计学家,F.Galton(1822-1911,年,),和他的学生、现代统计学的奠基者之一,K.Pearson(18561936,年,),在研究父母身高与其子女身高的遗传问题时,观察了,1 078,对夫妇,他们以成年儿子身高作为纵坐标,夫妇平均身高为横坐标做散点图,结果发现两者的关系近似于一条直线,经计算得到如下方程:,1.,回归方程,2.,回归方程的由来,1.2 回归方程与回归名称的由来 英国著名统,1.3,回归分析的要紧内容及其一般模型,回归分析的要紧内容,1.3 回归分析的要紧内容及其一般模型回归分析的要紧内容,回归分析的一般形式,随机误差项要紧包括以下因素:,(,1,)在解释变量中被忽略的因素的影,(,2,)变量观测值的观测误差的影响;,(,3,)理论模型设定误差的影响;,(,3,)其他随机因素的影响。,1.3,回归分析的要紧内容及其一般模型,回归分析的一般形式 随机误差项要紧包括以下因素:1.3,1.4,建立实际问题回归模型的过程,设置指标变量,收集整理数据,构造理论模型,估计模型参数,修改,N,模型运用,Y,经济因素分析,经济变量控制,经济决策预测,实 际 问 题,模型,检验,1.4 建立实际问题回归模型的过程设置指标变量收集整理数,1.4,建立实际问题回归模型的过程,【,一,】,设置指标变量,依照研究目的,利用经济学理论,从定性角度来确定经济问题中各因素之间的因果关系。,指标变量不容易确定:,1.,认识的局限性;,2.,为了模型参数可能的有效性,设置的解释变量应该是不相关的,可是在经济问题中很难找到,.,3.,从经济学角度考虑应该引进特别重要的经济变量,然而在实际中没有如此的数据,或数据很难拿到,能够考虑用相近的变量代替,或由其他几个指标符合成一个新的指标,.,4.,并不是模型中所涉及的解释变量越多越好,(1),可能会引进与问题无关的变量,;,(2),容易产生共线性,信息重叠,(3),计算量大,误差累计大,估计模型参数精度不高,.,1.4 建立实际问题回归模型的过程【一】设置指标变量,1.4,建立实际问题回归模型的过程,二,.,收集整理统计数据,1.,数据类型,时间序列,按时间顺序排列的数据,横截面数据,同一时间截面上的统计数据,.,面板数据,是截面数据与时间序列数据综合起来的一种数据类型。例如,2000,、,2001,、,2002,、,2003,、,2004,各年中国所有直辖市的,GDP,分别为(单位亿元),:,北京市,8,、,9,、,10,、,11,、,12,;,上海市,9,、,10,、,11,、,12,、,13,;,天津市,5,、,6,、,7,、,8,、,9,;,重庆市,7,、,8,、,9,、,10,、,11,2.,注意的问题,(1),数据的可比性,:,按可比价格计算,扣除价格变动因素,确切反映实物量的变化,.,当年价格,(,报告期实际价格,),用价格指数换算成可比价格,.,(2),统一计算口径,.,如,GDP(,按国土原那么计算,)GNP(,按国民原那么计算,).,两者包含内,容一致,然而计算口径不同,.,(3),样本容量,:,(4),统计数据整理,:,折算,差分,对数化,标准化,剔除异常值,插值法补齐缺失数据等,.,1.4 建立实际问题回归模型的过程 二.收集整理统计数,1.4,建立实际问题回归模型的过程,三,.,理论模型的数学形式,1.,绘制散点图,(SPSS,S-PLUS),2.,依据,:,经济理论和一些数理经济学结果,(,计量经济学,数量经济学,),如,C-D,生产函数,(,柯布道格拉斯生产函数,),数据对数化等,.,四,.,模型参数可能,1.,最小二乘法,极大似然可能,2.,岭回归 主成分回归 偏最小二乘回归,3.,软件,:spss sas s-plus eviews,1.4 建立实际问题回归模型的过程三.理论模型的数学形式,1.4,建立实际问题回归模型的过程,五,.,模型的检验与修改,检验,:1.,回归方程,2.,回归系数,3.,拟合优度,4.,随机误差项序列的相关性 异方差,修改,:,从设置变量是否合理开始,是否遗漏变量,变量间的依赖性是否强,样本容量是否少,理论模型是否合适等等,.,六,.,回归模型的应用,1.,经济变量的因素分析,(1),由回归系数能够发现经济变量的结构关系,;,(2),用解释变量控制被解释变量,.,2.,经济预测,:,定性分析与定量分析的有机结合,.,1.4 建立实际问题回归模型的过程五.模型的检验与修改,
展开阅读全文