统计与R软件论文

上传人:软*** 文档编号:172650049 上传时间:2022-12-05 格式:DOCX 页数:18 大小:114.33KB
返回 下载 相关 举报
统计与R软件论文_第1页
第1页 / 共18页
统计与R软件论文_第2页
第2页 / 共18页
统计与R软件论文_第3页
第3页 / 共18页
点击查看更多>>
资源描述
JISHOU UNIVERSITY1994-2013 年本科生课程论文影响我国税收收入的因素分析题 目:课程名称:所属学院:专业年级:学生姓名:完成时间:统计建模与R软件数学与统计学院2013级金融工程杨迪狄学号:2016年3月5日影响我国税收收入的因素分析1994-2013 年摘要:税收是国家取得财政收入的一种重要工具 ,也是影响我国经济发展的一个 很重要的因素。通过对影响税收增长的主要因素进行分析,解释这些因素和税收 收入之间存在的关系以及其对税收收入的影响程度的大小,并在此基础上,提出 相应的发展对策,以促进我国税收收入的增长以及我国经济的全面发展。关键词:税收收入;影响因素;R软件;数学模型几 一、前言研究数据发现,我国的税收收入从 1994年的 5126.88 亿元至今保持着逐年 增长的趋势,2013 年已经达到 110530.70 亿元,在不到三十年的时间里发生了 巨大的变化。查阅相关资料可知,税收收入主要受经济因素的影响,经济是税收 的基础,只有经济增长了,税收收入才可能增长。因此,本文的主要目的就是找 出影响我国税收的相关因素。税收收入分析与预测一直是税务部门的一项重要工作,它决定着税收计划的 制定,而税收计划的制定是经济活动的一项重要内容。针对目前税收计划的制定 仍以基数加预计增长率这一方式进行的现状,要求尽快建立起一套以税收收入为 为基础的科学预测体系,从而掌握组织收入的主动性。因此,利用统计学知识及 R 软件科学正确的进行税收分析与预测工作对于税务部门具有非常重要的意义。通过对大量历史数据的记录和与之相关的各种数据的分析,在R软件中使用 回归方法建立模型,再对税收收入情况进行了预测,实现了对 19942013 年年 度税收收入的预测,并对预测结果与实际情况作对比分析。查阅相关资料,可知影响我国税收收入主要因素为经济因素,其中有国内生 产总值、财政支出、商品进口额、商品出口额等等。通过建立回归方程,对方程 进行多重共线性、异方差和自相关的检验与消除确定最后模型,再进行预测,对 比分析其结果。二 模型与求解1收集数据表 一 1994-2013年我国税收收入数据年份税收收入Y(亿元)国内生产总值X2 (亿元)财政支出X3(亿元)商品进口额X4 (亿元)商品出口额X5(亿元)19945126.8848197.95792.629960.110421.819956038.0460793.76823.7211048.112451.819966909.8271176.67937.5511557.412576.419978234.04789739233.5611806.515160.719989262.884402.310798.1811626.115223.6199910682.5889677.113187.6713736.416159.8200012581.5199214.615886.518638.820634.4200115301.38109655.218902.5820159.222024.4200217636.45120332.722053.1524430.326947.9200320017.31135822.824649.9534195.636287.9200424165.68159878.328486.8946435.849103.3200528778.54184937.433930.2854273.762648.1200634804.35216314.440422.7363376.977597.2200745621.97265810.349781.3573300.193563.6200854223.79314045.462592.6679526.5100394.9200959521.59340902.876299.9368618.482029.7201073210.79401512.889874.1694699.3107022.8201189738.39473104109247.8113161.4123240.62012100614.3519470.1125953114801129359.32013110530.7568845.2140212.1121037.5137131.4表一数据来自中国统计年鉴 2014。2 绘制散点图运行程序 1,导入数据;运行程序 2,可得散点图:1e+05 4e+0520000 8000040+e8 40+e250+e4 50+e1X22e+048e+0420000 80000 1400000000400008X4图一 X2、X3、X4、X5和Y的散点图由图一可以看出,税收收入Y与国内生产总值X2、财政支出X3、商品进口额X4和商品出口额X5基本呈线性关系,所以可以初步建立回归方程。3线性回归运行程序3,可得结果:Call:lm(formula = Y X2 + X3 + X4 + X5)Residuals:Min 1Q Median 3Q Max-1793.3 -361.2 126.0 374.8 1352.3Coefficients:Estimate Std. Error t value Pr(|t|)(Intercept) -1.829e+03 1.398e+03 -1.308 0.210595X24.486e-024.078e-021.1000.288625X35.450e-011.273e-014.2810.000657 *X42.079e-027.639e-020.2720.789221X55.896e-027.468e-020.7900.442117Signif.codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1Residual standard error: 844.4 on 15 degrees of freedomMultiple R-squared: 0.9995, Adjusted R-squared: 0.9994F-statistic: 7556 on 4 and 15 DF, p-value: 2.2e-16 由以上结果可以看出,错误!未找到引用源。=0.9995,错误!未找到引用源。=0.9994可决系数很高,说明模型对样本的拟合很好,F= 7556检验值很大,说 明回归方程显著,即各自变量联合起来确实对因变量有显著影响;给定显著性水 平错误!未找到引用源=0.05,X2,X4,X5相应的P值分别为0.288625、0.789221、 0.442117,说明X2、X4、X5对因变量影响不显著。综上分析,该模型可能存在 严重的多重共线性。计算结果通过回归系数检验和回归方程检验,由此得到税收收入与国内生产 总值、财政支出、商品进口额和商品出口额之间的关系为Y = -1829 + 0.04486错误!未找到引用源。 + 0.545错误!未找到引用源。 + 0.02079错误!未找到引用源。 + 0.05896错误!未找到引用源。4 多重共线性的检验运行程序4,可得系数相关矩阵:表二 变量系数相关矩阵ObsYX2X3X4X5Obs1.0000.9260.9370.9170.9590.959Y0.9261.0000.9990.9990.9760.965X20.9370.9991.0000.9970.9810.972X30.9170.9990.9971.0000.9660.953X40.9590.9760.9810.9661.0000.996X50.9590.9650.9720.9530.9961.000由表二可以看出,X2、X3、X4、X5之间的相关系数非常高,说明确实存在 严重的多重共线性。如果选择全部变量作回归方程,效果不好,因为回归方程中 X2、X4、X5的t检验都不通过。所以,接下来需要做多重共线性的消除。5 多重共线性的消除运行程序5,逐步回归可得结果:Start: AIC=273.79Y X2 + X3 + X4 + X5DfSum of SqRSSAIC- X415280210746948271.89- X5144439511138540272.60- X2186283811556983273.3410694146273.79- X311306339323757538287.75Step:AIC=271.89Y X2 + X3 + X5DfSum of SqRSSAIC- X2181110111558049271.3410746948271.89- X51296959913716547274.77- X311589945326646401288.05Step: AIC=271.34Y X3 + X5DfSum of SqRSSAIC11558049271.34- X514539227456950324301.24- X31 14571027261468660775366.24Call:lm(formula = Y X3 + X5)Residuals:Min 1Q Median 3Q Max-1560.9 -473.8 206.6 405.3 1475.0Coefficients:Pr(|t|)Estimate Std. Error t value(Intercept) -340.34340 321.97995 -1.057 0.305X30.682950.0147546.294 2e-16 *X50.113540.013908.1712.73e-07 *Signif.codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1Residual standard error: 824.6 on 17 degrees of freedomMultiple R-squared: 0.9995, Adjusted R-squared: 0.9994F-statistic: 1.585e+04 on 2 and 17 DF, p-value: |t|)(Intercept)-2.588e+03 1.003e+03-2.5800.0201 *X26.704e-022.921e-022.2950.0356 *X34.718e-018.621e-025.4735.11e-05 *X47.295e-023.791e-021.9240.0723 .Signif.codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1Residual standard error: 834.4 on 16 degrees of freedom Multiple R-squared: 0.9995, Adjusted R-squared: 0.9994 F-statistic: 1.032e+04 on 3 and 16 DF, p-value: 2.2e-16 以上结果看出,X4的t检验不通过,继续做逐步回归。 Start: AIC=272.6Y X2 + X3 + X4DfSum of SqRSSAIC11138540272.60- X41257800613716547274.77- X21366824114806781276.30- X312085377331992313291.70由以上运算结果可以看出,如果删去变量 X4,AIC 的值会从 272.60 增加到274.77,是增加的最少的,根据 AIC 准则,应该再去掉变量 X4。Call: lm(formula = Y X2 + X3, data = y)Residuals:Min1Q Median3QMax-2464.0-295.6 -119.9 236.51544.1Coefficients:EstimateStd. Errort valuePr(|t|)(Intercept)-3.976e+037.499e+02-5.3025.85e-05 *X21.156e-011.580e-027.3201.20e-06 *X33.478e-016.166e-025.6412.93e-05 *Signif.codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1Residual standard error: 898.3 on 17 degrees of freedomMultiple R-squared: 0.9994,Adjusted R-squared: 0.9993F-statistic: 1.335e+04 on 2 and 17 DF, p-value: 0.05,说明模型不存在异方差。7 自相关的检验运行程序8,可得结果:Durbin-Watson testdata: lm.optDW = 1.5001, p-value = 0.04839alternative hypothesis: true autocorrelation is greater than 0由以上结果可知,DW=1.5001,查表可得,错误!未找到引用源。=1.100,错 误!未找到引用源。=1.537,可知错误!未找到引用源。DW错误!未找到引用源。,所以不能判定该模型有 无自相关。因此,还需进一步检验模型是否存在自相关。运行程序9,可得结果:reusch-Godfrey test for serial correlation of order up to 1data: lm.optLM test = 0.57164, df = 1, p-value = 0.4496由以上结果可以看出,P=0.44960.05,说明模型不存在自相关。三 对模型进行检验1 残差图与回归散点图运行程序 10,画出残差图和回归散点图,并将四幅画在一张图上Residuals vs FittedNormal Q-QqhbuoishOQm o OQUZ_160e+004e+048e+04Fitted valuesTheoretical Quantiles0EauolseRae7nuraanaBScale-LocationCooks distance-QHaua.seLue7nurana5.10.15.0 0.5 10 15 206.0 4.0 2.0 0. ecnatsidskooC0e+004e+048e+04Fitted valuesObs. number图三 税收收入数据的残差图和回归图由图三可以看出,第 01、14、16 号样本点明显远离其他的样本点,为异常点但是,这三个点是否有问题,还需进一步研究。2 正态性检验与异常点去除运行程序 11,得残差的正态性检验:Shapiro-Wilk normality testdata: y.residW = 0.85511, p-value = 0.0065由以上结果可以看出,P=0.00650.05,说明模型残差去除异常点之后变为正态性,故残差符合了线性回归模型的假设。模型预测1 参数的预测区间EstimateLeftRight(Intercept)-3925.2339066-4.830339e+03-3020.1291636X20.10951879.024904e-020.1287884X30.37561203.009987e-010.4502254由以上结果可以看出,参数估计在预测区间内,参数估计合理。2 模型预测经运行有关程序,可得预测结果和预测区间fitlwrupr25295.8844355.9756235.79436851.3745928.8407773.90848192.0237273.3049110.74159374.3238456.75910291.886610849.5339928.49711770.568712907.78111986.80113828.760815184.09714261.91916106.276917536.87516611.73618462.0151020208.72019299.04021118.4011124284.44823372.81425196.0821229073.49128151.34929995.6331334948.50233995.71335901.2901553979.16652924.42855033.9041773805.74272856.64674754.8371888923.28987957.63289888.94619100275.91899264.649101287.18720111039.304109969.343112109.266由以上结果与实际结果作对比分析,发现实际结果落在预测区间内,因此, 说明该模型符合要求。五 结论和政策建议1 结论从最后得出的模型 Y = -3976 + 0.1156错误!未找到引用源。 + 0.3478 错误!未找到引用源。可以看出,在假定其他变量不变的情况下,如果国内生 产总值每增加1亿元,则税收收入平均增加0.1156亿元;如果财政支出每增加 1亿元,则税收收入平均增加0.3478亿元。2 政策建议从宏观经济看,经济整体增长是税收增长的基本源泉,我们应加快经济增 长方式的改革,促进国内的消费需求;由于我国的税制结构以流转税,以现 行价格计算的GDP等指标,经营者的收入水平都与物价水平关系密切,为了实 现人民生活水平与国家整体的健康发展,合理的进行物价调控是有必要的。六 参考文献1 薛毅陈立萍统计建模与R软件清华大学出版社.2007.2 李子奈.潘文卿计量经济学.高等教育出版社.第三版.3 中国统计年鉴2014.中国统计出版社七 附录:程序:1 y=read.table(clipboard,header=T)#录入数据 attach(y)2 pairs(y)#画出 y,x2,x3,x4,x5 的散点图3 y.lm=lm(YX2+X3+X4+X5)#多元线性回归 summary(y.lm)#输出回归结果4 library(car)round(cor(y),3)#变量相关系数5 y.step=step( y.lm ,direction=backward)#逐步回归 summary(y.step)6 lm.step=lm(YX2+X3+X4)# 多元线性回归 summary(lm.step)#输出回归结果 lm.step1=step(lm.step)#逐 步回归 lm.opt=lm(YX2+X3,data=y);summary(lm.opt)7 library(lmtest)bptest(lm.opt)#white 检验异方差8 dwtest(lm.opt)#DW 检验自相关9 bgtest(lm.opt)#BG 检验自相关10 par(mfrow=c(2,2)plot(lm.opt,which=1:4)11 y.resid=residuals(lm.opt)#残差 shapiro.test(y.resid)#残差的 DW12 plot(y.resid)#画出残差图 text(1,y.resid1,labels=1,adj=1.2) text(14,y.resid14,labels=14,adj=1.2)#标记异常点 text(16,y.resid16,labels=16,adj=1.2)y.lm4=lm(YX2+X3,data=y,subset=a-c(1,14,16)#去除异常点
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸设计 > 毕设全套


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!