关于多元线性回归的毕业论文

上传人:无*** 文档编号:104563463 上传时间:2022-06-10 格式:DOC 页数:22 大小:1.01MB
返回 下载 相关 举报
关于多元线性回归的毕业论文_第1页
第1页 / 共22页
关于多元线性回归的毕业论文_第2页
第2页 / 共22页
关于多元线性回归的毕业论文_第3页
第3页 / 共22页
点击查看更多>>
资源描述
摘 要许多现象往往不是简单的与某一因素有关而是要受多个因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归.当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归.本文的研究主要从四个部分来进行.第一章从基础内容和研究对象着手,对主要研究内容进行了简单的阐述.第二章对多元线性回归的基础进行了详细分析.第三章介绍了中国经济的现状.最后通过多元线性回归模型对我国工业生产总值进行了分析.总的来说,本文在2007年全国各省市主要工业产品的产量与工业总产值的具体数据下,选用塑料、水泥、钢筋、平板玻璃、粗钢、盘条以与原煤等工业产品的产量作为研究对象,建立多元线性回归模型,并对模型做出参数估计.在此基础上对模型做出一定的解释,对于预测工业总产值具有一定的理论指导和现实意义.关键词:多元线性回归模型工业生产总值 假设检验 预测22 / 22Abstract Many phenomena are often not simply associated with a number of factors but with varieties. At this point we need to use two or more factors as independent variables to explain changes in the dependent variable. This is also known as multiple regression. When more than one independent variable and the dependent variable are linear relationship, the regression analysis is carried out by diversity regression.The main research work of this thesis is divided into four parts. In the first chapter, the thesis proceed from the basic content and object of study and elaborate main content simply. In the second chapter, multiple linear regression model is analyzed detail. In the third chapter, the thesis introduces status quo of china. And at last, gross industrial production is analyzed by multiple linear regression model in this article.Over all, this article use the specific data of the output of major industrial products and industrial output in nationwide provinces in 2007, and select the output of plastics, cement, steel, plate glass, crude steel, wire rod and raw coal as study object to establish multiple linear regression model, and then make the model parameter estimation. Based on this,we make some explanations to the model. All of these are of momentous current significance and far-reaching historical significance to the forecast of industrial production.Key Words:Multiple linear regression modelGross industrial production Hypothetical test Prediction目 录摘要.1Abstract.21 绪论42 多元线性回归分析基础52.1 多元线性回归定义52.2多元线性回归模型.62.2.1模型的建立与矩阵表示.62.2.2模型的假设72.3多元线性回归参数估计72.3.1 最小二乘估计和正规方程组72.3.2 最小二乘估计的矩阵形式82.4 回归拟合度评价和决定系数92.4.1 离差分解和决定系数92.4.2 决定系数的性质与修正可决系数102.5统计检验112.5.1回归参数的显著性检验检验112.5.2回归方程的显著性检验F检验122.5.3 多重共线性检验122.5.4 异方差检验.133中国经济现状153.1中国经济现状153.2 工业生产总值的概述154工业生产总值的多因素模型分析164.1建立多因素分析模型164.2数据收集164.3统计检验194.4计量经济学检验与模型修正204.4.1 异方差检验214.4.2 自相关检验215 结论.26致谢.27参考文献281绪 论在各个方面,变量之间的关系一般来说可分为确定性的与非确定性的两种.确定性关系是指变量之间的关系可以用函数关系来表达的.另一种非确定性的即所谓的相关关系.例如人的身高与体重之间存在着关系,一般来说,人高一些,体重也要重一些,但同样高度的人,体重往往不相同.人的血压与年龄之间也存在着关系,但同年龄的人的血压往往不相同.气象中的温度与湿度之间的关系也是这样的.这是因为我们涉与的变量如体重、血压、适度是随机变量,上面所说的变量关系是非确定性的.此时 ,便可以用到回归分析.回归分析能帮助我们从一个变量取得的值去估计另一个变量所取的值.工业生产总值从数值上反应一个地区的工业生产规模,是衡量一个地区的经济繁荣程度的重要指标.研究研究工业总产值与格工业产出指标之间的关系具有非常重要的现实意义,对于做好一个地区的的工业产值预测以与制定国民经济发展规划都有的非常重要的作用.工业总产值 是指以货币表现的工业企业在一定时期内生产的已出售或可供出售的工业的产品的总量.它是反映一定时间内工业生产总规模和,总水平的重要指标,是计算工业生产发展速度和主要比例关系,计算工业产品销售率和其他经济指标的重要依据.工业总产值包括成品价值、工业性作业价值和自制半成品、在产品期末期初差额价值.工业,总产值采用工厂法计算,即以工业企业作为一个整体,按企业工业生产活动的最终成果来计算.但各企业之间、行业之间、地区之间存在着重复计算.其计算公式为:报告期工业总产值=报告期全部产品的成品价值+报告期工业性作业价值+报告期自制半成品和在产品期末余额- 报告期自制半成品和在产品期初余额 计算工业总产值采用的价格有不变价格和现行价格.即,工业生产总值收多个因素影响,此时便需要多个影响因素来分析工业生产总值的变化.而这些变量之间的关系是线性的,这样在分析工业生产总值是用到的回归分析方法便是多元线性回归.2 多元线性回归分析基础2.1多元线性回归定义在客观世界中普遍存在着变量之间的关系.变量之间的关系一般来说可分为确定性的与非确定性的两种.确定性关系是指变量之间的关系可以用函数关系来表达的.另一种非确定性的即所谓的相关关系.例如人的身高与体重之间存在着关系,一般来说,人高一些,体重也要重一些,但同样高度的人,体重往往不相同.人的血压与年龄之间也存在着关系,但同年龄的人的血压往往不相同.气象中的温度与湿度之间的关系也是这样的.这是因为我们涉与的变量如体重、血压、适度是随机变量,上面所说的变量关系是非确定性的.此时 ,便可以用到回归分析.回归分析能帮助我们从一个变量取得的值去估计另一个变量所取的值.在回归分析中,如果有两个或两个以上的自变量,就称为多元回归.事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际.因此多元线性回归比一元线性回归的实用意义更大.在研究问题是,我们考虑一个变量受其他变量的影响时,把这变量称为因变量,记为,其他变量称为自变量,记为,这时相关系数可记作其中为当时,因变量的均值,即.称为对的回归函数,为与的偏差,它是随机变量,并假定.回归函数可以是一元函数,也可以是多元函数,即其中 为元回归函数,统称为多元回归函数.2.2多元线性回归模型2.2.1 模型的建立与矩阵表示多元线性回归模型的一般形式是:其中是回归系数,Y是被解释变量,是k个对Y有显著影响的解释变量k2,是 反映各种误差扰动综合影响的随机项,下标i表示第i期观察值,.假设多元样本回归函数为:回归残差为:.由于有n期的观察值,这一模型实际上包含个方程写成矩阵形式:其中2.2.2 模型的假设因为多元线性模型的建立或选择过程包含相当的主观性,所依据的理论和经验也可能不正确,因此并不能保证模型符合变量的实际关系.而如果模型本身有问题,那么分析的有效性和价值就很难有保证,为了保证所分析的变量关系符合多元线性回归分析的基本规定性,明确分析对象,保证回归分析的有效性和性质,也为了检验判断的依据,需要对多元线性回归模型作一些架设,共包括下列六条:变量和,之间,存在线性随机函数关系,其中是随机误差项.对应每组观测数据的误差项,都为零均值的随机变量,即的数学期望E=0对=1,2.n都成立.误差项的方差为常数,即 对=1,2.n 都成立假设2成立为前提.4对应不同观测数据的误差项不相关,即对任意的都成立假设1成立为前提.5解释变量是确定性变量而非随机变量.当存在多个解释变量r1时假设不同解释变量之间不存在线性关系,包括严格的线性关系和强的近似线性关系.6误差项服从正态分布7.2.3 多元线性回归参数估计2.3.1 最小二乘估计和正规方程组这里直接根据回归残差平方和最小的准则,推导多元线性回归模型参数的最小二乘估计量.对于多元线性回归模型,如果用,分别表示模型参数,的估计,那么样本回归方程就是回归残差平方和为:当V对,的一阶偏导数都等于0,即下列方程组:,同时成立时,有最小值.对这个方程组整理,可得到如下的正规方程组:其中,上述正规方程组有K+1个方程,未知数也是K+1个.只要系数矩阵非奇异即满足解释变量矩阵列满秩:.此时,有,可逆.可以解出,的唯一的一组解,就是,的最小二乘估计8. 2.3.2 最小二乘估计的矩阵形式 引进参数估计量,解释变量回归值和回归残差的下列向量表示:, ,把样本数据分别带入样本回归方程,得到回归方程组为:, 写成等价的向量方程,则为:这样回归残差向量为:在利用向量,矩阵的运算法则,可以得到残差平方和为=求对,的偏导数,等价于对向量求梯度,因此最小二乘估计的正规方程组为:整理得到矩阵形式:当可逆,也就是是满秩矩阵,在上述向量方程两端左乘的逆矩阵,得到:这就是多元线性回归模型最小二乘估计的矩阵一般形式.2.3.3 最小二乘估计量的性质线性性:多元线性回归模型参数的最小二乘估计向量为:,各个参数的最小二乘估计向量为,其中的是矩阵的+1行元素构成的行向量,上式对=1,K都成立,正是被解释变量观测值的线性组合,也就是多元线性回归参数的最小二乘估计是线性估计.无偏性:多元线性回归的最小二乘估计也是无偏估计,即参数最小二乘估计量的数学期望都等于相应参数的真实值,最小二乘估计向量的数学期望等于参数真实值的向量,参数真实值是参数估计量的概率分布中心.最小方差性:根据最小二乘估计公式和模型假设,可以直接导出包含各个参数估计量方差和不同参数估计量协方差的,参数估计向量的协方差矩阵为:2.4 回归拟合度评价和决定系数2.4.1 离差分解和决定系数判断回归结果好坏基本标准,是回归直线对样本数据的逆合程度,称为拟合度.回归直线的逆合度一方面取决于回归直线的选择,这就是由参数估计方法决定的,另一方面则取决于样本数据的分布.当参数估计方法固定时,主要取决于样本数据的分布.样本数据的分布在本质上是由变量关系决定的.因此回归拟合度也是检验模型变量关系真实性,判断模型假设是否成立的重要方法.拟合度较好是对模型的支持,否则,可能意味着必须对模型进行修改.首先需要从Y的离差中分离出由解释变量决定的部分,因变量的实际观测值与其样本均值的离差即总离差可以分解为两部分:一部分是因变量的理论回归值与其样本均值的离差, 它可以看成是能够由回归直线解释的部分,称为可解释离差;另一部分是实际观测值与理论回归值的离差,它是不能由回归直线加以解释的残差. 对任一实际观测值Y总有:对公式2.8两边平方并求和并计算,可得到:根据最小二乘估计和回归残差的相关公式,所有的离差的平方和记为=称为总离差平方和,而记为称为残差平方和,记为称为回归平方和.式2.9两边同除以,得:显而易见,各个样本观测点与样本回归直线靠的越近,在中所占的比重就越大.2.10式中的正是反映解释变量或回归直线对被解释变量决定程度的指标,我们称它为决定系数determined coefficient,通常用表示.计算公式为:2.4.2 决定系数的性质与修正可决系数决定系数是对回归模型拟合程度的综合度量,决定系数越大,模型拟合程度越高.决定系数越小,则模型对样本的拟合程度越差.决定系数具有如下性质: 决定系数具有非负性.由决定系数的定义式可知,的分子分母均是不可能为负值的平方和,因此其比值必大于零. 判定系数的取值范围为01.由的计算公式可以看出:当所有的观测值都位于回归直线上时,=0,这时=1,说明总离差可以完全由所估计的样本回归直线来解释;当观测值并不是全部位于回归直线上时,0,则0,这时1;当回归直线没有解释任何离差,即模型中解释变量与因变量完全无关时,的总离差全部归于残差平方和,即,这时0. 判定系数是样本观测值的函数,它也是一个统计量.判定系数的大小受到自变量的个数k的影响.可以证明,增加自变量的个数,回归平方和增大,从而使得增大.由于增加自变量个数引起的增大与拟合好坏无关,在含自变量个数k 不同的模型之间比较拟合程度时,就不是一个合适的指标,必须加以调整.调整方法为:把残差平方和与总离差平方和之比的分子分母分别除以各自的自由度,变成均方差之比,以剔除自变量个数对拟合优度的影响.调整的判定系数为: 用这个调整的决定系数作为评价多元线性回归拟合度的评价标准,可以基本消除由于解释变量数目的差异所造成的影响,更加合理和具有可比性.2.5 统计检验2.5.1回归参数的显著性检验检验先要找出回归系数的分布,由上述知识得知:其中为的第j行j列的元素.将标准化.一般有未知,用代替,得统计量,以下可用统计量来进行回归系数的假设检验.同一元线性回归一样,要检验解释变量对因变量的线性作用是否显著,要使用检验.步骤如下: 提出假设., 在成立条件下,根据样本计算 给定显著性水平,查表得临界值 判断若,就拒绝,对有显著线性作用;若,就接受,对线性作用不显著.2.5.2回归方程的显著性检验检验多元线性回归模型还可以进行模型总体显著性检验,也就是全体解释变量总体对被解释变量是否存在明显影响的检验,回归显著性检验的基本方法,是检验模型常数项以外所有参数同时为0的假设,使用检验.步骤如下: 提出假设.不全为0 选择、根据样本计算统计量 给定显著性水平,查表,得 判断若,就拒绝,回归方程显著成立,所有自变量对Y 的影响是显著的;若,就接受,回归方程不显著,所有自变量对Y 的线性作用不显著.2.5.3 多重共线性检验在多元线性回归模型中,对的基本假定是:矩阵的各列向量之间是线性无关的,即有:如果这一假定不满足,则称模型存在多重共线性.多重共线性表现为两种情况: 完全多重共线性:,也就是,不存在. 不完全多重共线性:实际中多为此情况,对角线元素较大.而一般产生多重共线性的背景为:1时间序列数据中经济变量在时间上常有共同的变动趋势;2经济变量之间本身具有内在联系常在截面数据中出现;3由于某种决定性因素的影响可能使各个变量向着同方向变化;4滞后变量引入模型,同一变量的逐次值一般都存在相互关系;多重共线性的检验方法有:1简单相关系数矩阵法辅助手段此法简单易行;但要注意两变量的简单相关系数包含了其他变量的影响,并非它们真实的线性相关程度的反映;一般在0.8以上可初步判定它俩之间有线性相关.2变量显著性与方程显著性综合判断;修正可决系数大,值显著大于临界值,而值不显著;那么可认为存在多重共线性.3辅助回归:将每个解释变量对其余变量回归,若某个回归方程显著成立,则该解释变量和其余变量有多重共线性.多重共线性的克服和处理方法有:截面数据和时序数据结合,有时在时间序列数据中多重共线性严重的变量,在截面数据中不一定有严重的共线性.在假定截面数据估计出的参数在时间序列数据中变化不大的前提下,可先用截面数据估计出一些变量的参数,再代入原模型估计另一些变量的参数. 变换模型形式差分法:假设和存在高度线性相关.设原模型为:将其滞后一期:将上述两式相减,得:则上述差分式子变成:差分后,和的共线性将明显减弱.2.5.4 异方差检验在回归模型的假设得到满足之后,用最小二乘法估计的模型参数具有无偏和方差在线性无偏估计方法中最小的有效性,在这些假设中,其中有一条是误差项的方差不变.如果误差项的方差随观测次数的改变而改变,或随解释变量增减而变化,则称回归模型中存在异方差.异方差可以表示为或其中异方差的的发现和检验方法有戈德菲尔德-夸特检验:构造统计量: .如果,误差项存在明显的递增异方差性;如果,误差项没有明显的异方差性.异方差的克服和处理:如线性回归模型为,经检验,误差项有如下异方差性,可以用除模型各项,得到:,新模型的误差项方差为:.3 中国经济现状3.1 中国经济现状改革开放30年来,中国经济持续高速增长,相当程度上是依赖于中小企业的崛起.快速、健康和持续发展的中小企业,对经济增长的贡献有目共睹:在繁荣经济、促进增长、国际贸易、扩大就业、推动创新、提高消费能力等方面发挥着重要的作用,已成为推动我国经济社会发展的重要力量,是大企业发展的依托,是活跃市场的基本主体,也是经济活力的具体体现1.回顾2008年中国:我们经历了年初的雪灾、5月的地震灾害、8月承办奥运、中国股市连连下挫,上证指数从2007年的最高点6124点一路下滑至2008年8月份的最低点2284点、半年光景约有6.7万家中小企业倒闭、国际油价的居高不下,煤、电、油、运全面紧张.针对新局势、新变化,我国政府把防过热、防通胀的经济政策迅速调整为保发展、控通胀.确保发展和控制物价是对立的统一,既有矛盾,也可以相互促进,关键在于我们采取什么样的政策,拉动GDP的三大要素是投资、消费和进出口,根据相关研究今年经济增长如果不超过9.4%,通货膨胀率控制在5%左右,就是一个很好的平衡点,能为明年打下一个好的基础2. 中国经济正处在低谷的边缘.因为我国经济面临内忧外患,内忧是通货膨胀,外患是全球经济放缓,这些都对我国经济有很大影响,我们正在经历着动荡的考验:美元走低、人民币升值、外需放缓,这对于对外依存度超过60%的中国经济,是一次巨大的挑战3.对于中小企业而言在投资和出口问题上主要依赖于国家的宏观调控,就困境中的中小企业本身来说基本上是无能为力的,然而可以团结起来、集合资源,向管理要效益,向降低成本要效益,从扩大内需中要效益,那么就要进一步激励民众扩大内需、大力推动消费、刺激消费,寻找一种能够产生新的消费热情的方法上下功夫,在实现消费增值的基础上取得企业效益,从而保持企业持续健康的发展.3.2工业生产总值的概述工业总产值是指以货币表现的工业企业在报告期内生产的工业产品总量.工业总产值按工厂法计算,即以工业企业作为一个整体,按企业工业生产活动的最终成果计算5.企业内部不允许重复计算,不能把企业内部各个车间生产的成果相加.工业总产值包括成品价值、对外加工费收入和自制半成品、在产品期末期初差额价值8.4 工业生产总值的多因素模型分析4.1建立多因素分析模型设其中:为工业总产值按当年价格,单位:亿元为塑料制品产量单位:万吨为水泥产量单位:万吨为平板玻璃产量单位:万重量箱为生铁产量单位:万吨为粗钢产量单位:万吨为钢筋产量单位:万吨为盘条产量单位:万吨为随机误差项.4.2数据收集研究工业生产总值与经济发展之间的关系严格来说可以对每个地区进行研究,但是具体到各个地区,根据各个地区的条件情形不同,所以对研究得出的数据也会有很大的差异,所以此次就对同一地区的工业生产总值与经济发展之间的关系作为研究,就对一个地区的数据进行收集,然后得出结论,这个结论可以反映出这个地区的工业生产值与经济发展的关系,为促进经济发展,针对某一地区的经济发展,我们可以对它进行几十年的数据收集,得出这个地区的经济发展情况.下面我们以中国2007年各省市的主要工业产品产量统计量为研究对象,通过对这些数据和工业总产值的数据建立的线性关系来预测工业总产值. 工业总产值来自中国2007年按地区分组的专用设备制造业工业企业主要经济指标统计; 原煤来自中国2007年按地区分组的主要工业产品产量统计; 由于#自治区一行中缺省数据太多,故删除了#一栏; 中国2007年按地区分组的主要工业产品产量统计具体数据见下表4.1:表4.1 原始数据地区工业总产值塑料制品 水泥平板玻璃生铁万吨粗 钢万吨钢筋万吨盘条全国10591.983305.23136117.2553918.0747651.6348928.810275.487919.02331.9232.661168.6235.22780.51810.76296.34416.3#204.8240.9614.79186.061435.41602.13185.1964.14#376.27137.379758.2810031.7610523.0110569.291335.431171.84#258.4913.442780.91971.913727.642506.36372.93465.82#124.346.052871.171395.721260.091040.36100.9676.63#680.18159.33893.21941.214057.594140.27246.94453.91#94.5721.971903.81850.76545.66599.6730.5969.16#175.4114.061645.06490.21374.11436.05184.533.3#600.5772.46959.44744.531790.362081.5823.2178.48#1425.76327.3711849.786856.113802.154721.471577.49949.47#875.07768.8810548.512917.53238.08577.23131.63183.74#173.27111.175402.23472.561517.71663.61501.04257.69#253.94106.664500.11867.12477.88588.82289.47222.27#56.0912.955008.54686.641047.361306.81496.39332.42#1736.69315.4715023.895175.614906.674406.911090.68638.12河南797.9121.699471.363619.931974.952275.39556.84660.1湖北126.5853.715638.852178.341679.791778.17226.99178.93湖南425.5623.255683.281518.121247.761331.79337.18224.3广东923.24754.459799.576123.03755.251154.03444.76284.86#175.5321.714350.48530.34639.3765.67288.06207.22海南2.032.25633.327.6818.844.546.540.67重庆84.8522.683000.05254.18328.38358.3649.76102.41四川364.483.516375.62495.791470.731415.34492.78195.91贵州28.317.962059.062.5363.19349.36176.45118.83云南37.2416.113568.53329.81202.78883.85228.43183.61陕西181.625.143175.491175.08365.55396.27318.9453.67甘肃52.4110.321540.21591.89592.78602.898.84140.53青海1.220.27436.8592.9590.09114.711.317.54宁夏16.232.02817.3661.8246.250.3637.775.08#7.4639.471479.28113.66391.82446.85148.06142.08注1:数据来自中国2007年统计年鉴8w.4.3 统计检验由SPSS计算结果表4.2 Variables Entered/RemovedModelVariables EnteredVariables RemovedMethod1盘条x7, 塑料制品x1, 生铁x4, 平板玻璃x3, 水泥x2, 钢筋x6, 粗钢x50.976Entera All requested variables entered.b Dependent Variable: 工业总产值y表4.3Model SummaryModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson10.9930.9870.983245.843471.739a Predictors: ,盘条x7, 塑料制品x1, 生铁x4, 平板玻璃x3, 水泥x2, 钢筋x6, 粗 钢x5 b Dependent Variable:工业总产值y表4.4 ANOVAModelSum of SquaresdfMean SquareFSig.1Regression105370311.469715052901.638249.0590.000Residual1390097.2462360439.011Total106760408.71430 a Predictors: ,盘条x7, 塑料制品x1, 生铁x4, 平板玻璃x3, 水泥x2, 钢筋x6, 粗钢x5b Dependent Variable: 工业总产值y表4.5CoefficientsModelUnstandardized CoefficientsStandardized CoefficientstSig.Collinearity StatisticsBStd. ErrorBetaToleranceVIF1-2.21147.145-0.0470.963塑料制品x10.9890.4520.3172.1870.0390.02737.156水泥x20.0360.0240.4601.5350.1380.006158.745平板玻璃x3-0.0550.056-0.281-0.9780.3380.007145.392生铁x40.0130.1540.0580.0830.9340.001858.829粗钢x50.0040.1760.0200.0040.9810.0011170.904钢筋x60.4560.3620.4411.2600.2200.005216.237盘条x7-0.0160.499-0.012-.0320.9750.004242.790a Dependent Variable: 工业总产值y即有:=0.987 ,=0.983,=249.059方程的决定系数较高,=0.987,修正可决系数=0.983,又回归模型拟合程度与决定系数有关,决定系数越大,模型拟合程度越高,可见本模型拟合程度较好,又F=249.05910, 模型总体显著性检验得知模型总体显著,也就是全体解释变量总体对被解释变量存在明显影响.对t检验由上述分析结果知,除粗钢和原煤外其余预测变量都是显著的.故我们对上述模型进行计量经济学的检验,并进行修正,看是否能使模型方程得到改进.其中我们看到平板玻璃和盘条产量的系数是负值,一般来说,平板玻璃和盘条产量等经济发展量应该与工业总产值成正比关系,但由于在研究具体某个地区的经济发展关系时,由于政策领导或其它的因为地区的特殊性的原因,造成了平板玻璃和盘条产量的系数是可能成为负值的.比如工业总产值在下降,但是因为政策或其它原因平板玻璃和盘条产量却在上升,或工业总产值在上升,但是平板玻璃和盘条产量却在下降.4.4 计量经济学检验与模型修正4.4.1 异方差检验计算残差绝对值与个自变量的斯皮尔曼相关系数,结果如下表:Correlations塑料制品x1水泥x2平板玻璃x3生铁x4粗钢x5钢筋x6盘条x7abs_1Spearmans rho塑料制品x1Correlation Coefficient10.7350.7380.6150.6850.5920.7110.590Sig. 1-tailed00000000N3131313131313131水泥x2Correlation Coefficient0.73510.8550.5470.6040.7820.7600.470Sig. 1-tailed00.00200.0010000.004N3131313131313131平板玻璃x3Correlation Coefficient0.7380.85510.6650.7170.6650.6900.287Sig. 1-tailed00000000.059N3131313131313131生铁x4Correlation Coefficient0.6150.5470.66510.9860.7000.7540.489Sig. 1-tailed00.0010.0000.003N3131313131313131粗钢x5Correlation Coefficient0.6850.6040.7170.98610.7200.7880.513Sig. 1-tailed0000.000.002N3131313131313131钢筋x6Correlation Coefficient0.5920.7820.6650.700.72010.8580.416Sig. 1-tailed00000000.01N3131313131313131盘条x7Correlation Coefficient0.7110.7600.6900.7540.7880.85810.547Sig. 1-tailed00000000.001N3131313131313131abs_1Correlation Coefficient0.5900.4700.2870.4890.5130.4160.5471Sig. 1-tailed00.0040.0590.0030.0020.010.0010.001N3131313131313131Correlation is significant at the 0.01 level 1-tailed.表4.6Correlations残差绝对值与各自变量的相关系数分别为0.59,0.47,0.287,0.489,0.513,0.416,0.547说明存在异方差,需采用加权最小二乘估计;加权估计,得到最优权重为3.000,对其进行加权分析.表4.7Variables Entered/RemovedModelVariables EnteredVariables RemovedMethod1盘条x7, 塑料制品x1, 钢筋x6, 生铁x4, 平板玻璃x3, 粗钢x5, 水泥x20.536Entera All requested variables entered.b Dependent Variable: 工业总产值yc Weighted Least Squares Regression - Weighted by Weight for 工业总产值y from WLS, MOD_4 abs_1* -3.000表4.8Model SummaryModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson11.0001.0001.0000.085921.581a Predictors: , 盘条x7, 塑料制品x1, 钢筋x6, 生铁x4, 平板玻璃x3, 粗钢x5, 水泥x2b Dependent Variable: 工业总产值yc Weighted Least Squares Regression - Weighted by Weight for 工业总产值y from WLS, MOD_4 abs_1* -3.000表4.9ANOVAModelSum of SquaresdfMean SquareFSig.1Regression2587.0987369.58550065.4390.000Residual0.170230.007Total2587.26830a Predictors: , 盘条x7, 塑料制品x1, 钢筋x6, 生铁x4, 平板玻璃x3, 粗钢x5, 水泥x2b Dependent Variable: 工业总产值yc Weighted Least Squares Regression - Weighted by Weight for 工业总产值y from WLS, MOD_4 abs_1* -3.000表4.10CoefficientsModelUnstandardized CoefficientsStandardized CoefficientstSig.Collinearity StatisticsBStd. ErrorBetaToleranceVIF1-13.0133.486-3.7330.001塑料制品x10.8410.0950.2648.8230.0000.003314.686水泥x20.0200.0100.2602.1030.0470.0005366.476平板玻璃x3-0.0170.019-0.084-0.8660.3950.0003333.757生铁x4-0.0080.019-0.038-0.4400.6640.0002602.303粗钢x50.0800.0210.3703.8360.0010.0003255.656钢筋x60.4050.0550.3937.4080.0000.001984.360盘条x7-0.2170.104-0.163-2.0900.0480.0002131.465由上表所知,方程的决定系数较高,=1.000,修正可决系数=1.000,又回归模型拟合程度与决定系数有关,决定系数越大,模型拟合程度越高,可见本模型拟合程度较好,又=50065.43910, 模型总体显著性检验得知模型总体显著,也就是全体解释变量总体对被解释变量存在明显影响.但是值为1.581,要比原来多元线性回归的值要小,自相关性比较严重,需要进一步讨论4.4.2 自相关检验自相关是对随机扰动项之间相互独立假定的违背,指扰动项序列相邻期之间不是随机独立而是存在相关关系,又称为序列相关.自相关主要表现在时间序列中.因此对于线性回归模型:自相关可表示为:用于检验扰动项是否存在自相关的方法主要有:D-W 检验Durbin-Watson 杜宾-瓦特森检验,D-W 检验是Durbin 和Watson 于1951 年提出的一种自相关检验方法.它只适用于扰动项的形式为:为自相关系数的一阶自相关问题.这种方法是最常用的一阶自相关检验方法.其检验步骤如下:1提出假设.:,即扰动项不存在一阶自相关;:,即扰动项存在一阶自相关.2构造统计量.定义DW 统计量为,对于大样本可以把统计量写为,其中为自相关系数的估计.因为|1,所以检验统计的值域为0DW4.3判断.根据样本容量n 和解释变量的数目p 查分布表,得下临界值和上临界值,并依下列准则判断扰动项的自相关情形.如果0,则拒绝零假设,扰动项存在一阶正自相关.越接近于0,正自相关性越强.如果,则无法判断是否有自相关.如果4-,则接受零假设,扰动项不存在一阶正自相关.越接近2,判断无自相关性把握越大.如果4-4-,则无法判断是否有自相关.如果4-4,则拒绝零假设,扰动项存在一阶负自相关.越接近于4,负自相关性越强.由上图4.3得知Durbin-Watson Statistics=1.955873,查表得在显著水平=0.05下,查表 n=30,k=3时,=1.21,=1.55,由于=1.21DW=1.9558734-=2.45,则接受零假设,扰动项不存在一阶正自相关.DW 越接近2,判断无自相关性把握越大.由表可知,值为1.739,可以看出存在正自相关性,通过迭代,来改善自相关性.进行迭代计算,得表4.11 Variables Entered/RemovedModelVariables EnteredVariables RemovedMethod1x71, x11, x41, x31, x21, x61, x51.Entera All requested variables entered.b Dependent Variable: y11表4.12Model SummaryModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson10.9940.9880.984243.306321.867a Predictors: , x71, x11, x41, x31, x21, x61, x51b Dependent Variable: y11表4.13ANOVAModelSum of SquaresdfMean SquareFSig.1Regression108742477.288715534639.613262.418.000Residual1361553.1872359197.965Total110104030.47630a Predictors: , x71, x11, x41, x31, x21, x61, x51b Dependent Variable: y11表4.14CoefficientsModel Unstandardized CoefficientsStandardized Coefficients
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 基础医学


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!