资源描述
我国城镇居民消费水平影响因素分析摘要随着经济水平的不断发展,人们的消费水平也在不断提高,从社会生产的角度看,消费是其最终环节,消费能否顺利实现是决定企业能否顺利完成生产的重要原因,也是决定经济增长的主要因素,因此消费对于经济增长有着重要的作用。研究影响消费的因素对于我国的经济发展有很重要的经济意义。本文运用SPSS 软件分析方法对影响全国城镇居民家庭人均消费支出的因素进行分析研究,首先分析了食品消费支出,衣着消费支出,居住消费支出,家庭设备及用品消费支出,医疗保健消费支出,交通和通信消费支出等的线性相关性,建立回归模型,再利用逐步回归的方法进行回归分析,最终得到了能反映财政收入与各因素之间关系的“最优”回归方程。最后我们用2006年的数据进行了验证,得出的结果在误差范围内,表明这个模型可以正确反映影响财政收入的各因素的情况。关键词:城镇居民,消费水平,逐步回归分析,城镇居民家庭人均消费,SPSS1. 引言改革开放以来,我国一直以较高的经济增长速度快速发展。但居民消费对经济增长的贡献比重与发达国家差距明显。消费、投资和储蓄并称为现代经济发展的“三驾马车”,而根据各国的国民收入统计显示,其中消费占总需求的60%左右。因此,消费的决定及其变动对宏观经济的影响很大。消费是人类生产的目的,而生产是社会的核心活动,在社会在生产中,生产必须围绕消费需求来进行,消费需求同时对生产有重要的导向作用。生产的消费是相辅相成的,生产者生产的产品的规模,质量,档次直接决定了消费的规模,质量和档次,消费能否顺利实现,决定了生产能否顺利完成。消费行为是指消费者受需求动机的影响而做出购买决定、修改购买方案、完成购买过程的行为。消费者行为过程既是消费者的思维、心理过程,也是不断采取行动、产生方案、解决问题的过程。影响消费者行为的因素是多方面的,由社会的、历史的、经济的等多方面极其复杂的因素。从扩大需求的角度来看,消费是刺激经济增长的主要方式。所以研究消费的影响因素对经济增长有重要的经济意义。我国城镇居民收入高,消费量大,商品化程度高,其消费对农村居民有一定的示范作用,在消费结构的研究中占有重要的地位,因而研究分析城镇居民消费结构及特征,对拓宽消费品市场渠道,确定经济发展战略,适时调整和正确引导居民消费方向,促进经济增长具有重大意义。消费市场的疲软制约了我国经济持续、快速、健康发展。要刺激消费、扩大内需,必须找出影响消费的关键因素,才能对症下药。扩大城镇居民的消费成为推动我国经济增长的一项重要手段。本文从国家统计信息网(http:/data.stats.gov.cn)上选取了1992-2011年这20年间的全国城镇居民家庭人均消费及其主要影响因素的数据,包括了食品消费支出,衣着消费支出,居住消费支出,家庭设备及用品消费支出,医疗保健消费支出,交通和通信消费支出等,运用逐步回归的统计方法,对数据进行分析处理,最终得出了反映各个因素对全国城镇居民家庭人均消费水平的影响的最“优”模型。2. 解决问题的方法和计算结果2.1 样本数据的选取与整理本文在进行统计时,查阅了http:/data.stats.gov.cn中收录的1992年至2011年连续20年的城镇居民消费水平为因变量,考虑一些与全国城镇居民消费水平关系密切并且直观上有线性关系的因素,初步选取这20年间的食品消费支出,衣着消费支出,居住消费支出,家庭设备及用品消费支出,医疗保健消费支出,交通和通信消费支出等因素为自变量,分析它们之间的联系。根据选择的指标,查选数据,整理如表2-1所示。表2-1 1992-2011年全国城镇居民消费水平及其影响因素统计表时间城镇居民消费水平(元)城镇居民家庭人均衣着消费支出(元)城镇居民家庭人均居住消费支出(元)城镇居民家庭人均家庭设备及用品消费支(元)城镇居民家庭人均医疗保健消费支出(元)城镇居民家庭人均交通和通信消费支出(元)城镇居民家庭人均文教娱乐服务消费支出(元)城镇居民家庭人均其他消费支出(元)2012年218611823.41484.31116.11063.72455.52033.5657.12011年199121674.714051023.29692149.71851.7581.32010年171041444.31332.1908871.81983.71627.6499.22009年151271284.21228.9786.9856.41682.61472.8474.22008年140611165.91145.4691.8786.21417.11358.3418.32007年124801042982.3601.8699.11357.41329.2357.72006年10739901.8904.2498.5620.51147.11203309.52005年9832800.5808.7446.5600.9996.71097.5277.82004年8880686.8733.5407.4528.2843.61032.8240.22003年8104637.7699.4410.3476721.1934.4215.12002年7745590.9624.4388.7430.1626902.3195.82001年7324533.7548438.9343.3457690284.12000年6999500.5565.3374.5318.1427669.6171.81999年6351482.4454395.5245.6310.6567.1228.81998年5909480.9408.4356.8205.2257.2499.41971997年5645520.9358.6316.9179.7232.9448.4185.71996年5382528300.9298.2143.3199.1375170.51995年4769479.2283.8263.4110.1183.2331114.92.2 线性回归模型的建立与分析为了研究全国城镇居民消费水平与各种影响因素的关系,必须要建立他们之间的数学模型。数学模型可以有多种形式,比如线性模型,二次模型,指数模型,对数模型等等。而实际生活中,影响城镇居民消费水平的因素很多,并且这些因素的影响不能简单的用某一种模型来描述,所以要建立数学模型往往是很难的。为了便于研究,我们先假定一些前提条件,然后在这些条件下得到简化后的近似模型。我们假定的前提条件是:城镇居民家庭人均食品消费支出,衣着消费支出,居住消费支出,家庭设备及用品消费支出,医疗保健消费支出,交通和通信消费支出等因素对全国城镇居民消费水平的影响显著,并且成正的线性关系。由此假设,我们可以建立全国城镇居民消费水平与各种影响因素的线性回归模型,模型如下: (2-1)其中,是因变量, 是自变量,是各个自变量的系数。各变量符号的定义见表2-2。表2-2 线性回归模型中各变量的含义全国城镇居民消费水平城镇居民家庭人均食品消费支出城镇居民家庭人均衣着消费支出城镇居民家庭人均居住消费支出城镇居民家庭人均家庭设备及用品消费支出城镇居民家庭人均医疗保健消费支出城镇居民家庭人均交通和通信消费支出城镇居民家庭人均文教娱乐服务消费支出城镇居民家庭人均其他消费支出将数据录入统计软件EXCEL,建立统计数据库,首先建立全国城镇居民消费水平与各影响因素的散点图,如图2-1至图2-8所示。图2-1 城镇居民消费水平与城镇居民人均食品消费支出的散点图图2-2 城镇居民消费水平与城镇居民人均衣着消费支出的散点图图2-3 城镇居民消费水平与城镇居民人均居住消费支出的散点图图2-4 城镇居民消费水平与城镇居民人均家庭设备及用品消费支出的散点图图2-5 城镇居民消费水平与城镇居民人均医保消费支出的散点图图2-6 城镇居民消费水平与城镇居民人均交通与通信消费支出的散点图图2-7 城镇居民消费水平与城镇居民人均文娱消费支出的散点图图2-8 城镇居民消费水平与城镇居民人均其他消费支出的散点图从以上的图中不难发现,城镇居民消费水平与城镇居民人均食品消费支出,人均居住消费支出,人均医疗保健消费支出,以及人均交通和通信消费支出等基本具有线性关系。而城镇居民消费水平与人均衣着消费支出,人均家庭设备及用品消费支出,人均家庭其他消费支出的关系出现了波动,而且从图中也可以看出,这三者对城镇居民消费水平的贡献比较小,它们的变化不足以引起城镇居民消费水平的变化。除了EXCEL自带的插入图表的功能,同样也可以使用SPSS软件制作散点图,其操作步骤是:(1) 选择菜单 GRAPHS/ SCATTER/DOT。图2-9 SPSS绘制散点图步骤一(2) 选择SIMPLE SCATTER, 单击DEFINE 。图2-10 SPSS绘制散点图步骤二(3) Y轴为因变量,选择“城镇居民消费水平”,X轴为自变量,依次选择为“城镇居民家庭人均食品消费支出”,“衣着消费支出”,“居住消费支出”,“家庭设备及用品消费支出”,“医疗保健消费支出”,“交通和通信消费支出”等。每选择一次点击一次OK,SPSS自动绘制相应的散点图。图2-11 SPSS绘制散点图步骤三(4) SPSS 绘制的散点图仅做一例,如下图所示,相比于EXCEL自带的图表功能,SPSS的图表功能更加简单快捷。图2-12 SPSS绘制散点图步骤四经过对所有散点图的分析,我们发现人均衣着消费支出,人均家庭设备及用品消费支出,人均家庭其他消费支出与城镇居民消费水平的线性关系不显著,其原因主要有:衣服和家庭设备用品都属于耐用品,居民购买的频率不大;而且它们的价格范围很大,对城镇居民消费水平的反映缺乏真实性。其他消费支出都在千元以下,对城镇居民消费水平的影响不显著。综上,人均衣着消费支出,人均家庭设备及用品消费支出和人均家庭其他消费支出这三者都与我们之前的显著性假设相悖,为使得到的模型有显著的线性关系,我们首先从回归模型中排除了这三者。然后我们用逐步回归的方法对剩下的五个因素进行筛选:将城镇居民人均食品消费支出,人均居住消费支出,人均医疗保健消费支出,人均交通和通信消费支出,以及人均文教娱乐服务消费支出纳入自变量,使用逐步回归法,选择的判据是变量进入回归方程的F的概率不大于0.05,剔除的判据是变量进入回归方程的F的概率不小于0.10。输出结果如表2-3和表2-4所示:表2-3 引入或剔除的变量ModelVariables EnteredVariables RemovedMethod1城镇居民人均食品消费支出.Stepwise (Criteria: Probability-of-F-to-enter = .100).2城镇居民人均文娱消费支出.Stepwise (Criteria: Probability-of-F-to-enter = .100).a Dependent Variable: 城镇居民消费水平表2-4 拟合过程小结ModelRR SquareAdjusted R SquareStd. Error of the Estimate1.996(a).992.992409.574392.998(b).995.995322.54440a Predictors: (Constant), 城镇居民人均食品消费支出b Predictors: (Constant), 城镇居民人均食品消费支出, 城镇居民人均文娱消费支出由上面的两个表可以看出:.选择的过程是,最先引入了变量,建立了模型1;接着引入变量,没有变量被剔除,建立了模型2(含有、);最终的模型中含有变量、。.各模型的拟合情况,模型1的复相关系数R=0.996,可决系数=0.992,调整可决系数为0.992;模型2的复相关系数R=0.998,可决系数=0.995,调整可决系数为0.995。可见模型2的拟合度较高,变量、的作用显著。表2-5 方差分析Model Sum of SquaresdfMean SquareFSig.1Regression353904221.1371353904221.1372109.697 .000(a)Residual2851770.02117167751.178 Total356755991.15818 2Regression355091432.9172177545716.4591706.598 .000(b)Residual1664558.24116104034.890 Total356755991.15818 a Predictors: (Constant), 城镇居民人均食品消费支出b Predictors: (Constant), 城镇居民人均食品消费支出, 城镇居民人均文娱消费支出c Dependent Variable: 城镇居民消费水平表2-5 的方差分析结果表明,当回归方程为模型1、2时,其显著性概率值P(Sig)均小于0.001,即拒绝总体回归系数均为0的原假设。因此,最终的回归方程应当包含城镇居民人均食品消费支出, 城镇居民人均文娱消费支出这2个自变量,且方程拟和效果很好。表2-6 逐步回归过程中排除出模型的变量 Model Beta In t Sig. Partial Correlation Collinearity Statistics Tolerance 1城镇居民人均居住消费支出 .271(a) 3.318 .004 .638 .044 城镇居民人均医保消费支出 .166(a) 2.285 .036 .496 .072 城镇居民人均交通消费支出 .274(a) 2.421 .028 .518 .029城镇居民人均文娱消费支出 .217(a) 3.378 .004 .645 .071 2城镇居民人均居住消费支出 .131(b) .715 .486 .181 .009城镇居民人均医保消费支出 -.323(b) -1.838 .086 -.429 .008 城镇居民人均交通消费支出 .051(b) .333 .744 .086 .013a Predictors in the Model: (Constant), 城镇居民人均食品消费支出b Predictors in the Model: (Constant), 城镇居民人均食品消费支出, 城镇居民人均文娱消费支出c Dependent Variable: 城镇居民消费水平表2-6 显示了方程外各模型变量的有关统计量,即标准化偏回归系数Beta、回归系数显著性检验的t值、P(Sig)值、偏相关系数Partial Correlation、共线性统计的容差Collinearity statistic Tolerance。可见,模型2以外的各变量偏回归系数经检验,P值均较大,考虑到简化方程的需要,排除了这些变量。表2-7 回归计算过程中的方程系数表 Coefficients(a) Model Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta 1 (Constant) -795.539 232.624 -3.420 .003 城镇居民人均食品消费支出 3.568 .078 .996 45.931 .000 2 (Constant) -474.725 206.347 -2.301 .035 城镇居民人均食品消费支出 2.819 .230 .787 12.243 .000 城镇居民人均文娱消费支出 1.956 .579 .217 3.378 .004a Dependent Variable: 消费水平表2-7显示各模型的偏回归系数B、标准差Std. Error、常数Constant、标准化偏回归系数Beta、回归系数显著性检验的t值和P(Sig)值。按照模型2建立的多元线性回归方程为:Y=-474.725+2.819X1 +1.956X7 (2-2)方程中的常数项,偏回归系数、,经t检验,1 ,7的P值分别为0.035、0.000、0.004,按=0.10水平,均有显著性意义。3. 讨论3.1 离群点的筛选计算残差统计量如下表所示:表3-1 残差统计量 MinimumMaximumMeanStd. DeviationNPredicted Value2887.230018666.20908978.78954441.5427319Std. Predicted Value-1.3712.181.0001.00019Standard Error of Predicted Value89.132192.773126.05723.78919Adjusted Predicted Value2880.142618420.70318976.60094414.8866119Residual-534.99329609.81207.00000304.0977819Std. Residual-1.6591.891.000.94319Stud. Residual-1.8261.985.0021.03319Deleted Residual-648.66656687.296262.18857367.2931919Stud. Deleted Residual-1.9882.214.0201.08719Mahal. Distance.4275.4821.8951.13019Cooks Distance.001.541.073.12719Centered Leverage Value.024.305.105.06319a Dependent Variable: 城镇居民消费水平表3-1 显示残差统计的结果,标准化残差的绝对值最大为1.891,小于设定值3。如超过3,则显示具体观察单位Case number 的标准化残差,以帮助发现离群点。使用SPSS绘制出城镇居民人均消费水平的预测值与其标准化残差的散点图如下所示:图3-1 城镇居民人均消费水平的预测值与其标准化残差的散点图从图3-1的城镇居民人均消费水平的预测值与其标准化残差的散点图中,可以看出所有观测量随机地落在垂直围绕2的范围内,预测值与标准化残差值之间没有明显的关系。所以回归方程满足了线性与方差齐性的假设,且拟和效果较好。3.2 对回归模型的检验由上面的计算,得到的最优的多元线性回归模型为:Y=-474.725+2.819X1 +1.956X7 (3-1)对2006年的全国城镇居民消费水平做预测,置信度取为95%。2006年的X1城镇居民人均食品消费支出为3111.90(元),X7城镇居民人均文娱消费支出为1203.00(元),Y全国城镇居民消费水平为10618.00(元),将自变量带入回归方程:Y=-474.725+2.8193111.90 +1.9561203.00=10650.789(元) (3-2)预测区间为,其中(x0)=t0.975(19-2-1)=t0.975(16)104034.890=2.120=683.8 (3-3)代入数值,得到置信度为95%的预测区间为(9966.989,11334.589)。查得2006年全国城镇居民消费水平为10618元,包括在最优模型预测的区间中,可见回归模型的预测还是比较准确的。4总结本文查阅了中国统计年鉴,从中搜集了与全国城镇居民消费水平关系密切并且直观上有线性关系的因素,包括了食品消费支出,衣着消费支出,居住消费支出,家庭设备及用品消费支出,医疗保健消费支出,交通和通信消费支出等,分析它们与全国城镇居民消费水平之间的联系。首先分析了建立了全国城镇居民消费水平与各因素的线性回归模型,再利用逐步回归法进行回归分析,经综合比较,选取了拟合性最好的最“优”回归模型。以SPSS 13.0为分析工具,给出了实验结果,并使用2006年的全国城镇居民消费水平验证了结论的正确性。从最终的线性回归模型中我们可以看到,全国城镇居民消费水平可以用城镇居民人均食品消费支出, 城镇居民人均文娱消费支出很好地解释。其原因主要有两个方面:首先,城镇居民人均食品消费支出属于居民每日必须的支出,消费量很大,对符合了前文的显著性假设;然后,随着城镇居民生活水平的提高,居民的人均文娱消费支出上升范围较大,很大程度上影响了城镇居民的消费水平。由于调研时间有限,该回归模型必然存在很多的不足:拟合曲线和实际值还是有一定的偏差;自变量个数也不够多;一些其他的能显著影响全国城镇居民消费水平的因素没有考虑到,还需要不断查阅资料加以改进。该模型在一定程度上体现了与选取的各个因素之间的线性关系,并能对因变量做出近似的预测。综合来看,数据模型基本达到了预期的目的。参考文献1 孙海燕, 周梦, 李卫国, 冯伟, 应用数理统计, 北京航空航天大学, 2013.92 国家统计信息网,2012 国家统计年鉴2 SPSS 13.0 软件帮助手册
展开阅读全文