资源描述
_2014高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了全国大学生数学建模竞赛章程和全国大学生数学建模竞赛参赛规则(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的报名参赛队号为(8位数字组成的编号): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期: 年 月 日赛区评阅编号(由赛区组委会评阅前进行编号):2014高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):-可编辑修改-题目摘要针对(写清楚什么问题),通过(方式怎么分析),考虑到(约束/限制条件),运用(方法),解决(问题) (300-500左右)逐个问题来表述问题一:问题二:问题三:问题四:问题五:问题六:【关键词】:3-5个1.问题的重述股票交易数据的分析1.1问题的背景新中国股份公司的出现和股票市场的形成出现于20世纪八十、九十年代,特别,上海证券交易所、深圳证券交易所的成立标志着我国证券市场开始发展。1990年12月19日,上海证券交易所开业;1991年7月3日,深圳证券交易所正式开业。中国证券市场作为一个新兴的高速成长的证券市场,在短短十几年的时间里取得了举世瞩目的成就。证券市场在促进国有企业改革、推动我国经济结构调整和技术进步方面发挥了突出的作用,目前我国股票总市值已经超过日本,位于世界第二。1.2问题所给信息及数据股票市场的发育程度与活跃状态,通常与一个国家或国际社会的经济发展状态关联,同时也受风险投资者(机构、散户)对企(行)业成长环境的评估与发展前景的预判等多方面因素的影响,特别,不同投资者基于市场投机的利益博弈,有时成为证券交易市场风云起伏的重要主导因素。通常用“牛市-熊市-牛市-熊市-.”这样的交替转化来描述股票市场的景气度周期性质。所谓“牛市”,也称多头市场,指多数上市公司的股票的行情(交易价格)普遍看涨,延续时间较长的大升市。而“熊市”则正好相反,也称空头市场,指行情普遍看淡,延续时间相对较长的大跌市。图B1:上证指数历史数据图(19901219-20150717,共6013个交易日数据),不难发现其交易记录上的几个阶段性高点,分别以HP1、HP2、HP3、HP4标示,特别HP3对应发生在2007年10月16日的高点6124.04, 而HP4对应发生在2015年06月12日5178.19。1.3所要解决的问题通过一些主要门户网站或股票交易的专业网站,可以获取非常丰富的上市公司股票交易历史数据。通过对这些数据的有效建模分析,我们希望在如下方面得到有价值的结论:1)近25年的股票交易历史,有何典型的周期性结论?2)可以获取国际上其它一些重要经济体的证券交易指数历史数据,分析其变动有无共同的特点;3)请结合我国的一些主要经济发展数据指标,给出上证指数目前的合理估值;4)HP3与HP4在适宜的时间跨度下,显示出极强的相似性,升也匆匆,落也汹汹。一方面,从大众对风险投资概念与心理意识,两次过山车行情的心理把握与介入节奏有非常大的不同;另一方面,股市行情与外围经济发展的支撑数据关联也有很大差异。百尺巨浪,成于万里浩淼碧波,我们通常认为,系统的大范围坍塌必然可以从一些局部环节的表现上发现线索。因此,我们希望能从一些个别上市公司的交易数据的奇异变化,来做出市场风险积累与释放前兆的预警方法。比方给出类似一轮行情延续的时限(显然能做到最切近的提示是最有价值的)和冲高的幅值等的预判;5)一些观点认为,近期股市交易的大幅起落,只是宏观慢牛当中的一次短暂性修复,请通过严肃的建模分析,给出相应的分析结论;6)结合你的工作,请给出你对目前中国股市发展的政策建议,篇幅限制在1000字以内。2.问题的分析市场上,股票价格起伏无常,投资者往往面临着市场价格风险。对于多种股票的价格变化,投资者要逐一了解,既不容易,也不胜其烦。题目中提供了1990-2015年上证指数的6000多个交易日数据,作为股票市场价格变动的指标,供我们参考。我们通过找出影响股票价格指数的各种因素,并根据这些因素,结合相关数据的建模分析,借以预测股市未来走势。同时,搜集了我国的一些主要经济发展数据指标,并选取有代表性的股票的成交数据,为当前的上证指数合理估值。2.1问题(1)的分析观察近25年来的股票交易历史数据,有波峰,有波谷,震荡起伏,体现出一定的周期性。所以我们采用周期性函数拟合的方法,假设拟合函数傅里叶级数展开到5阶。股票的历史数据系列,可以看做是一系列不同振幅与相位的正弦函数迭代所构成,?在计算机上我们给定了置信度P与检验的最大最小周期,使之自动进行时间序列的周期性检验,找出最显著的周期进行拟合,一直到再也找不出显著周期为止。?2.2问题(2)的分析本题选取的数据是道琼斯指数1896-2012年的完整收盘价数据,进行相关性分析。具体操作是采用?散点图?的方法,显著性水平为0.05,同时通过计算相关系数R?进行深入的定量考察。2.3问题(3)的分析此问我们结合了国内生产总值GDP、城乡居民储蓄、居民消费指数CPI、M1供给量、M2供给量及其各自的同比增长率,共计5组10个主要的经济发展数据指标,运用多元回归的方法,在matlab软件上求出各组数据的权重系数?,确定至少3个关键的影响因素,进而给出上证指数目前的合理估值。2.4问题(4)的分析本题建立了系统模型以方便求解,在股票市场这个现实的系统中,以?为输入,以?为输出,利用?方程,约束条件有?,系统的目标在于通过一些个别上市公司的交易数据的奇异变化,做出市场风险积累与释放前兆的预警方法。2.5问题(5)的分析每日股票交易的数据.可以看作是随着时间的推移而形成的一个随机时间序列,通过对该时间序列上股票指数的随机性、平稳性以及周期性等因素的分析,将这些单日股指数之间所具有的相关性或依存关系用数学模型描述出来,从而达到利用过去及现在的股票指数信息来预测未来股票价格情况的目的。对此我们运用了自回归积分滑动平均模型(ARIMA模型),以时间序列的自相关分析为基础,而且对序列?“取对数和作差分”等平稳化处理,既考虑了股票指数在时间序列上的依存性,又考虑了随机波动的干扰性。除此之外,结合了?参数估计,通过了假设检验,诊断了残差序列,对于股票交易短期趋势的预测很有依据性。3.模型的假设3.1基本假设3.1.1模型一1)2)3.1.2模型二1)2)3)3.1.3模型三1)假设股票交易市场是一个线性时不变系统2)假设当任意两支大盘股相关度足够高(大于?)时,可以以其中一支为基础数据,近似预测另一支3)3.1.4模型四1)2)3)4.变量假设4.1变量的符号说明符号表示的内容5.模型的建立与求解5.1问题(1)的模型建立与求解5.1.1图像解释近25年来的股票历史交易数据如图?,随着时间的推移 震荡上扬,连续3次包络线,指数递增,迅速又衰减, 对应时间点,详细函数变化要说清楚5.1.2构造函数拟合5.1.3发现周期性结论5.2问题(2)的模型建立与求解5.2.1其他重要经济体的证券历史交易数据表格 1道琼斯股票指数历史收盘数据5.2.2相关性分析5.2.3模型求解沿用问题(1)的模型,解题说明如下:5.2.4结论5.2.4.1道琼斯历史股指数变化趋势分析5.2.4.2与上证的共同点挖掘5.3问题(3)的模型建立与求解5.3.1参考数据指标本题所参考的主要经济发展指标包括“国内生产总值GDP、城乡居民储蓄、居民消费指数CPI、M1供给量、M2供给量及其各自的同比增长率”,共计5组10个,同时提供有有上证指数的相关信息。而每一类数据的时间跨度均在1990-2013年。表格 2 我国主要的经济发展指标5.3.2相关矩阵计算各个经济发展指标用分别用列向量组?表示,而24年来的上证指数以向量组?表示,依次将每一个经济发展指标与对应时期的上证指数做相关性分析,相关系数?,通过协方差计算,协方差矩阵如下:结果得出?(列向量组)相当于?(向量组)的系数矩阵,建立公式?5.3.3偏最小二乘法分析偏最小二乘回归多元线性回归分析典型相关分析主成分分析方法体现:设有q个因变量和p个自变量。为了研究因变量与自变量的统计关系,观测了n个样本点,由此构成了自变量与因变量的数据表X和Y。偏最小二乘回归分别在X与Y中提取出t和u,要求:(1)t和u应尽可能大地携带它们各自数据表中的变异信息;(2)t和u的相关程度能够达到最大。在第一个成分被提取后,偏最小二乘回归分别实施X对t的回归以及Y对t的回归。如果回归方程已经达到满意的精度,则算法终止;否则,将利用X被t解释后的残余信息以及Y被t解释后的残余信息进行第二轮的成分提取。如此往复,直到能达到一个较满意的精度为止。若最终对X共提取了多个成分,偏最小二乘回归将通过施行yk对X的这些成分的回归,然后再表达成yk关于原自变量的回归方程。为自变量、因变量赋值!展示最终表达式!5.3.4求解5.3.5上证目前的合理估值5.4问题(4)的模型建立与求解5.4.1数据的分析比较首先,根据所提供的B题参考数据-601318文档中平安证券自20070301-20150717的历史交易数据,以交易日t为横轴,以每日交易的最高价X(t)为纵轴,作出平安证券8年来股票交易历史数据的曲线图。?图+上证在一张图上我们发现,该曲线的数据震荡变化态势大体类似于题目中“图B1:上证指数历史数据图(19901219-20150717,共6013个交易日数据)”的变化走势。通过其相关矩阵的推导求解,得知两组大盘数据的相关度在95%以上。据此,我们大胆猜想,上证的大盘指数可以由平安提供的大盘历史数据经一定的拉伸变换和时延操作近似得来。5.4.2模型的建立这里要给出一个系统框图!本题建立一系统模型H,把整个股票交易市场看作是一个系统,令Y(t)=X(t)*h(t),其中X(t)代表平安证券的每日交易指数,作为系统激励信号;Y(t)代表上证的大盘指数,作为系统响应信号;而h(t)则表示系统所发挥的作用。研究清楚h(t)的数学表达式,将对于股票市场风险的预估及未来股指的预判有重要意义。5.4.3模型求解在这样一个系统模型中,实际上输入X(t)与输出Y(t)已经能够从附件所给出的“平安历史交易数据”和“上证历史交易指数”中有所窥见,通过已有的数据,我们可以采用逆卷积的方法去求解系统h(t)。可以假设h(t)=A*(t)+B*(t-t0),t0作为时延。以下是详细求解过程:配部分程序语言和求解用图!5.4.4风险预测和行情预判可能的风险对策建议预测图!5.5问题(5)的模型建立与求解5.5.1应用ARIMA模型建模的步骤Step1L: 求出该观察值序列的样本自相关系数(ACF)和样本偏自相关系数(PACF)的值。Step2: 根据样本自相关系数和偏自相关系数的性质,选择阶数适当的ARMA(p,q)模型进行拟合。Step3: 估计模型中未知参数的值。Step4: 检验模型的有效性。如果拟合模型通不过检验;转向步骤(2),重新选择模型再拟合。Step5: 模型优化。如果拟合模型通过检验,仍然转向步骤(2),充分考虑各种可能,建立多个拟合模型,从所有通过检验的拟合模型中选择最优模型。Step6: 利用拟合模型,预测序列的将来走势。5.5.2随机序列的确定5.5.2.1数据的来源基本数据选取的是B题目提供的19901219-20150717,共6013个交易日的上证历史指数,拟对2015年7月以后约百日内的上证综合指数进行预测和实证分析。我们把这部分随机数据用时间序列 yt 来表示。图 1 上证指数历史数据图(19901219-20150717,共6013个交易日数据)5.5.2.2原随机序列的平稳性检验1)平稳性的时序图检验观察时间序列 yt 图谱是否围绕着一个常数附近作随机波动,波动幅度范围是否基本一致、有界。由图 1断定,上证指数的时序图尚不够稳定。 2)平稳性的自相关图检验以下作出自相关图: 一个坐标轴表示延迟时期数k,另一个坐标轴表示自相关系数ACF,通常以悬垂线表示自相关系数的大小。给出自相关图?观察?自相关系数ACF随延迟期数k的增加并没有快速衰减到零,在k=3以后仍旧大于2倍标准差。初步判断,已知的时间序列 yt 尚不够稳定。5.5.2.3平稳化处理对时间序列 yt 进行若干次差分,可使序列平稳化。将一阶差分的序列记为Y,进行ADF检验,从图?可看出,差分后的序列为平稳时间序列ADF检验的一些设定形式或公式?配一阶差分的ADF检验图!有差分序列的自相关和偏自相关函数图也要?序列蕴含着显著的线性趋势,1阶差分就可以实现趋势平稳?序列蕴含着曲线趋势,通常低阶(2阶或3阶)差分就可以消除曲线趋势的影响5.5.3模型定阶与识别自回归模型AR(p)(AR:Auto-regressive)移动平均模型MA(q)(MA:Moving-Average)混合模型ARMA(p,q)(ARMA:Auto-regressive Moving-Average)模型ARMA(p,q)的一般表达式为:et是白噪声,并且对于所有的t,满足: E(et|yt-1,yt-2,)=0引进延时算子B:yt-1=Byt 则有:其中:5.5.3.1p,q参数的处理令求和自回归移动平均模型ARIMA(p,d,q)配参数求解结果?或者必要的说明5.5.3.2白噪声检验对ARMA(p,d,q)的残差序列进行Q检验,具体结果如下配白噪声检验相关图!由图?可知该残差序列为白噪声过程。因此确定用模型ARMA(p,d,q)来拟合时间序列 yt 是合适的。5.5.4模型的求解及结果输出我们可以得到yt+l的预测值yt(l):预测的置信区间对于ARMA(p,q)模型,我们可以得到yt+l预测的95%的置信区间:yt(l)1.96*se(l), 式中se(l)是误差标准差 .模型拟合的相关估计结果图表?模型ARMA(p,d,q)在matlab中的输出结果图示!5.5.5大盘预测效果结论+预测结果?Matlab中预测的数据变动趋势?均值?误差率?等等 需要图!6.模型的评价及推广6.1优点模型1,问题(1)和(2)都采用,模型2,模型3,模型4,6.2缺点模型1,问题(1)和(2)都采用,模型2,模型3,模型4,6.3推广7.对中国股市发展的政策建议1)对1990-2015年以来已有的股市大盘综合指数变动趋势的分析、总结2)根据上文4个模型的研究,对今后一段时间(约100天内)股指数大体走势的预测3)结合股市走势的预测为政府及相关部门提出经济发展方面的建议-可编辑修改-参考文献12345Zhu:l 参考文献按正文中的引用次序列出,其中书籍的表述方式为:编号 作者,书名,出版地:出版社,出版年。参考文献中期刊杂志论文的表述方式为:编号 作者,论文名,杂志名,卷期号:起止页码,出版年。参考文献中网上资源的表述方式为:编号 作者,资源标题,网址,访问时间(年月日)。附录:附录一附录二附录三附录四在论文纸质版附录中,应提供参赛者实际使用的软件名称、命令和编写的全部计算机源程序(若有的话)。同时,所有源程序文件必须放入论文电子版中备查。论文及源程序电子版压缩在一个文件中,一般不要超过20MB,且应与纸质版同时提交。(如果发现程序不能运行,或者运行结果与论文中报告的不一致,该论文可能会被认定为弄虚作假而被取消评奖资格。)THANKS !致力为企业和个人提供合同协议,策划案计划书,学习课件等等打造全网一站式需求欢迎您的下载,资料仅供参考
展开阅读全文