第七章-多重共线性及其处理(共7页)

上传人:n85ho7****4h85bh 文档编号:47895193 上传时间:2021-12-25 格式:DOC 页数:7 大小:192.50KB
返回 下载 相关 举报
第七章-多重共线性及其处理(共7页)_第1页
第1页 / 共7页
第七章-多重共线性及其处理(共7页)_第2页
第2页 / 共7页
第七章-多重共线性及其处理(共7页)_第3页
第3页 / 共7页
点击查看更多>>
资源描述
精选优质文档-倾情为你奉上第七章 多重共线性及其处理一、简答题1什么是变量之间的多重共线性?2什么是完全多重共线性?什么是不完全多重共线性?3多重共线性在多元线性回归模型中普遍存在的主要原因有哪些? 4多重共线性可能造成哪些不利后果?5多重共线性的检验有哪些适当的方法?6多重共线性的修正方法有哪些? 二、计算题分析题1某地区供水部门利用最近20年的用水年度数据得出如下估计模型:(-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8)F=38.9式中,用水总量(百万立方米),住户总数(千户),总人口(千人),人均收入(元),价格(元/100立方米),降雨量(毫米)。(1)根据经济理论和直觉,请计回归系数的符号是什么(不包括常量),为什么?观察符号与你的直觉相符吗?(2)在10%的显著性水平下,请进行变量的t检验与方程的F-检验。T检验与F检验结果有相矛盾的现象吗?(3)你认为估计值是(1)有偏的;(2)无效的;(3)不一致的吗?详细阐述理由。2下表是某地区1995年2004年食品需求量、可支配收入、食品类价格指数、物价总指数和流动资产拥有量的数据资料。食品需求函数有关统计资料年份食品需求量(亿元)可支配收入(亿元)食品类价格指数(1995年=100)物价总指数(1995年=100)流动资产拥有量(亿元)199584829 9294171 199696880 9396213 1997104999 9697251 19981141053 9497290 19991221177 100100340 20001421310 101101400 20011581482 105104440 20021791618 112109490 20031931742 112111510 20042081847 112111530 问题:(1)检验变量间的多重共线性。(2)利用法,建立适当的回归方程。 第四部分 习题答案一、简答题1多重共线性指两个或多个解释变量之间不再彼此独立,而是出现了相关性。2完全多重共线性指:在有多个解释变量模型中,其中一个变量可以表示为其他多个变量的完全线性函数,即,其中至少有一个,与等式右边线性组合的相关系数为1,则这种情况被称为完全多重共线性。在此情况下,不能估计解释变量各自对被解释变量的影响。 不完全多重共线性指:在实际经济活动中,多个解释变量之间存在多重共线性问题,但与等式右边线性组合的相关系数不为1。3多重共线性产生的原因多元线性回归模型产生多重共线性的原因很多,主要有:(1)经济变量的内在联系。这是产生多重共线性的根本原因;(2)解释变量中含有滞后变量;(3)经济变量变化趋势的“共向性”。4多重共线性会产生以下问题:(1)增大了OLS估计量的方差;(2)难以区分每个解释变量的单独影响;(3)回归模型缺乏稳定性;(4)检验的可靠性降低。5在应用多元回归模型中,人们总结了许多检验多重共线性的方法。(1)系数判定法(2)用解释变量之间所构成的回归方程的决定系数进行判别(3)逐步回归判别法以为被解释变量逐个引入解释变量,构成回归模型,进行参数估计,根据决定系数的变化决定新引入的变量是否能够加入模型之中。首先将对所有的解释变量分别作回归,得到所有的模型,取决定系数最大的模型中的解释变量加入模型,作为第一个引入模型的变量;其次,将再对剩余的解释变量分别加入模型,进行二元回归,再次,取决定系数最大的解释变量加入模型;依次做下去,直到模型的决定系数不再改善为止。(4)方差膨胀因子VIF判别法 对于多元线性回归模型,的方差可以表示成 一般当VIF10时(此时0.9),认为模型存在较严重的多重共线性。(5)修正的Frish判别法该方法不仅可以对多重共线性进行判别,同时也是处理多重共线性问题的一种有效方法。其步骤为:第一,用被解释变量分别对每个解释变量进行线性回归,根据经济理论和统计检验从中选择一个最合适的回归模型作为基本回归模型,通常选取决定系数最大的回归模型。第二,在基本回归模型中逐个增加其他解释变量,重新进行线性回归,如果新增加的这个解释变量提高了回归模型的决定系数,并且回归模型中的其他参数统计上仍然显著,就在模型中保留该解释变量;如果新增加的解释变量没有显著提高回归模型的拟合优度,则不在模型中保留该解释变量;如果新增加的解释变量提高了回归模型的决定系数,并且回归模型中某些参数的数值或符号等受到显著的影响,说明模型中存在多重共线性,对该解释变量同与之相关的其他解释变量进行比较,在模型中保留对被解释变量影响较大的,剔除影响较小的。6多重共线性的解决方法有:(1)剔除引起共线性的变量;在估计模型之前,找出引起多重共线性的变量,将它剔除出去,是最有效的克服多重共线性问题的方法。(2)变换模型的形式对原模型进行适当的变换,也可以消除或削弱原模型中解释变量之间的相关关系。具体有三种变换方式:一是变换模型的函数形式;二是变换模型的变量形式;三是改变变量的统计指标。(3)综合使用时序数据与横截面数据如果能同时获得变量的时序数据和横截面数据,则先利用某类数据估计出模型中的部分参数,再利用另一类数据估计模型的其余参数。(4)逐步回归分析法逐步回归选取变量时,是一个“由少到多”的过程,即从所有解释变量中间先选择影响最为显著的变量建立模型,然后再将模型之外的变量逐个引入模型;每引入一个变量,就对模型中的所有变量进行一次显著性检验,并从中剔除不显著的变量;逐步引入剔除引入,直到模型之外所有变量均不显著时为止。 (5)增加样本容量由于多重共线性是一个样本特性,如果理论上解释变量之间不存在多重共线性,则可以通过收集更多的观测值增加样本容量,来避免或减弱多重共线性。二、计算题分析题1(1)在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越高。所以可期望house和pop的符号为正;收入较高的个人可能用水较多,因此pcy的预期符号为正,但它可能是不显著的。如果水价上涨,则用户会节约用水,所以可预期price的系数为负。显然如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可以期望rain的系数符号为负。从估计的模型看,除了pcy之外,所有符号都与预期相符。(2)t-统计量检验单个变量的显著性,F-统计值检验变量是否是联合显著的。这里t-检验的自由度为15-5-1=9,在10%的显著性水平下的临界值为1.833。可见,所有参数估计值的t值的绝对值都小于该值,所以即使在10%的水平下这些变量也不是显著的。这里,F-统计值的分子自由度为5,分母自由度为9。10%显著性水平下F分布的临界值为2.61。可见计算的F值大于该临界值,表明回归系数是联合显著的。T检验与F检验结果的矛盾可能是由于多重共线性造成的。house、pop、pcy都是高度相关的,这将使它们的t-值降低且表现为不显著。price和rain不显著另有原因。根据经验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能够很好地被度量。可以预期水价与年降雨量在各年中一般没有太大的变化,所以它们的影响很难度量。(3)多重共线性往往表现的是解释变量间的样本观察现象,在不存在完全共线性的情况下,近似共线并不意味着基本假定的任何改变,所以OLS估计量的无偏性、一致性和有效性仍然成立,即仍是BLUE估计量。但共线性往往导致参数估计值的方差大于不存在多重共线性的情况。2根据理论分析,食品需求量受四个因素的影响,建立回归方程:利用表7.5中数据,采用最小二乘法,得:给定显著水平,查分布表,得临界值为,故,回归方程线性关系显著。现用软件分别计算两两变量之间的相关系数,得表:需求量、收入、类指数、物价总指数和资产的相关系数矩阵YY 1. 0. 0. 0. 0. 0. 1. 0. 0. 0. 0. 0. 1. 0. 0. 0. 0. 0. 1. 0. 0. 0. 0. 0. 1.可见解释变量之间是高度相关的。为了检查和处理多重共线性,采用修正法。根据理论分析,可支配收入应该是食品需求最主要的影响因素,相关系数检验也表明,收入与食品需求的相关性最强。所以,首先建立以收入为解释变量的一元回归模型。 食品需求量与可支配收入的线性回归结果Dependent Variable: YMethod: Least SquaresSample: 1995 2004Included observations: 10VariableCoefficientStd. Errort-StatisticProb. C-12.455543.-3.0.01070.0.41.937010.0000R-squared0. Mean dependent var140.0000Adjusted R-squared0. S.D. dependent var43.01163S.E. of regression3. Akaike info criterion5.Sum squared resid75.39426 Schwarz criterion5.Log likelihood-24.29012 F-statistic1758.713Durbin-Watson stat2. Prob(F-statistic)0.依次将其余变量逐个引入模型,估计结果分别如表所示。食品需求量与可支配收入及食品类价格指数的线性回归结果VariableCoefficientStd. Errort-StatisticProb. C14.0470849.255430.0.78380.0.8.0.0001-0.0.-0.0.1061R-squared0. Mean dependent var140.0000Durbin-Watson stat2. Prob(F-statistic)0.食品需求量与收入、类价格指数及物价总指数的线性回归结果VariableCoefficientStd. Errort-StatisticProb. C-127.592665.15987-1.0.09790.0.7.0.0003-1.0.-2.0.04853.1.2.0.0396R-squared0. Mean dependent var140.0000Durbin-Watson stat3. Prob(F-statistic)0.需求量、收入、类指数、物价总指数和资产的线性回归结果VariableCoefficientStd. Errort-StatisticProb. C-135.335275.13155-1.0.13150.0.3.0.0146-1.0.-2.0.07823.1.2.0.07230.0.0.0.7724R-squared0. Mean dependent var140.0000Durbin-Watson stat3. Prob(F-statistic)0.可以看出,在依次加入变量后,拟合优度均有所增加,各系数符号正确,但加入流动资产拥有量后,拟合优度虽然有所提高,但是系数却不显著,说明存在严重的多重共线性,所以在模型中应剔除。从而得到最终回归模型为:专心-专注-专业
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!