统计回归模型总结

上传人:z**** 文档编号:113800950 上传时间:2022-06-27 格式:DOC 页数:6 大小:232KB
返回 下载 相关 举报
统计回归模型总结_第1页
第1页 / 共6页
统计回归模型总结_第2页
第2页 / 共6页
统计回归模型总结_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
统计回归模型:1、适用的范围:无法分析实际对象的因果关系,建立合乎确定的机理的数 学模型,只可能根据数据去建立模型,再根据数据去检验模型。2、具体的适用对象:在数学建模中必须用到的统计回归模型的知识3、解决步骤:根据已知数据,从常识和经验来判断和分析,辅以作图,决 定取那几个回归变量,以及他们的形式。形式主要有:下面几种4、再通过软件求解后作统计分析, R2,F,p 对模型的整体进行评价,每个回 归系数置信区间是否包含零点,可以用来检验对应的回归变量对因变量的影响是 否显著。5、结果不满意,进行改进。方法有:添加二次项,添加交互项, 一、一元线性回归模型。A、一元线性回归模型的形式:JY = a + bx + ; N (0, G 2)1、估计参数a, b, o 2;2、检验模型正确与否;(即b-0)3、预测或控制;B、软件的实现:使用命令regress实现一元线性回归模型的计算b = regress (Y, X) 或 b, bint, r, rint, stats = regress(Y, X, alpha) 残差及其置信区间可以 用 rcoplotrint)画图例如:为了研究钢材消费量与国民收入之间的关系,在统计年鉴上查得一组 历史数据。年份196419651966197819791980消费(吨)698872988144627362825收入(亿)109712841502294831553372试分析预测若1981年到1985年我国国民收入以4.5%的速度递增,钢材消费量将达到什么样的水平? 【具体对应关系详见软件中】;软件的编程过程:x=1097 1284 1502 1394 13031555 1917 2051 2111 2286 231120032435 262529483155 3372;y=69887298880773810251316153915611765176219601902 20132446 27362825;plot(x,y,*)300025002000150010001000 1500 2000 2500 3000 3500x=1097 1284 1502 1394 1303 1555 1917 2051 21112286 2311 2003 2435 2625 2948 3155 3372;y=698 872 988 807 738 1025 1316 1539 15611765 1762 1960 1902 2013 2446 2736 2825;X=ones(size(x),x,pause c,cint,r,rint,stats=regress(y,X,0.05),pausec =-460.5282 (参数 a)0.9840 (参数 b)cint = -691.8478-229.2085 (a 的置信区间)0.87791.0900 ( b 的置信区间 )r = 79.124869.1244 -29.3788 -104.1112 -83.5709 -44.5286-109.7219 -18.5724 -55.6100 -23.8029 -51.4019 449.6576 -33.4128 -109.36515.816092.1364 -32.3827残(差向量 )rint=(略)(参见残差分析图)stats = 0.9631 391.27130.0000结果是:rcoplot(r,rint)-200-3002 4 6 8 10 12 14 16Case Number000000654000321slaudiseR-400预测:xl(l)=3372;for i=1:5xl(i+l)=l.045*xl(i); y1(i+1)=-460.5282+0.9840*x1(i+1);endx1 = 3372.03523.73682.33848.0 4021.24202.1y1 = 3006.83162.93325.93496.33674.4二、一元非线性(略):1、化曲线回归为一元线性模型(p304) Y2、化曲线回归为一元多重线性回归。(p310) Y其中多项式的回归值得关注。 一元多项式回归在matlab软件中用命令polyfit实现x1=17:2:29;x=x1,x1;y=20.48 25.13 26.15 30.0 26.1 20.3 19.35.24.35 28.11 26.3 31.4 26.92 25.7 21.3;p,S=polyfit(x,y,2);pY,delta=polyconf(p,x,S);Y,pause,x1=17:0.5:29;Y1=polyconf(p,x1,S);plot(x,y,r+,x1,Y1),pause,polytool(x,y,2)三、多元回归模型:A、多元线性回归模型一般形式为:Y = b + b X + b X + + b X + u0 1 1 2 2 k kB、多元线性回归模型的假设: 解释变量 Xi 是确定性变量,不是随机变量;解释变量之间互不相关,即 无多重共线性。 随机误差项具有0均值和同方差 随机误差项不存在序列相关关系 随机误差项与解释变量之间不相关 随机误差项服从0均值、同方差的正态分布C解析形式Y = b + b X + b X + + b X + u0 1 k k 1n个样本观测值(Y , X , X,,X ) i = 1,2,ni1i2 iki得:Y = b + b X + b X + + b X + ui01 1i22 ik kii(Y、(1XXXb、b0 b12r u)Y11X 11X 21 .Xk 11u2-1222:k2+2YJ n丿1X1nX2nXknbJ k丿uJn丿n上述模型中参考(资料)E、软件的实现:,Y = XB + UY =b+bX+bX+ + bX+u10111221kk11Y=b+bX+bX+ + bX+u20112222kk2Y=b+bX+bX+ + bX+un011n22nk kn2阵矩利用: b = regress (Y, X) 或 b, bint, r, rint, stats = regress(Y, X, alpha)例如:某建材公司对某年20个地区的建材销售量Y(千方)、推销开支、实际帐目数、同类商品竞争数和地区销售潜力分别进行了统计。试分析推销开支、实 际帐目数、同类商品竞争数和地区销售潜力对建材销售量的影响作用。试建立回 归模型,且分析哪些是主要的影响因素。设:推销开支一x 1实际帐目数一2同类商品竞争数一x3地区销售潜x1x2x3x4y15.53110879.322.55586200.138.067129163.243.050716200.153.038815146.062.9711217177.778.03012830.989.056510291.994.04284160.0106.573516339.4115.560117159.6125.044121286.3136.05066237.5145.039104107.2153.555104155.0168.070614201.4176.040116100.2184.050118135.8197.562913223.3207.059911195.0软件编程的实现: x1=5.5 2.5 8 3 3 2.9 8 9 4 6.5 5.5 5 6 5 3.5 8 6 4 7.5 7; x2=31 55 67 50 38 71 30 56 42 73 60 44 50 39 55 70 40 50 62 59;x3=10 8 12 7 8 12 12 5 8 5 11 12 6 10 10 6 11 11 9 9;x4=8 6 9 16 15 17 8 10 4 16 7 12 6 4 4 14 6 8 13 11;y=79.3 200.1 163.1 200.1 146.0 177.7 30.9 291.9 160 339.4 159.6 86.3 237.5 107.2 155 201.4 100.2 135.8 223.3 195;X=ones(size(x1),x1,x2,x3,x4; b,bint,r,rint,stats=regress(y,X)Q=r*r sigma=Q/18输出结果是:b = 191.9158-0.77193.1725 -19.6811-0.4501B 0B1B 2B 3B 4bint = 103.1071280.7245(系数的置信区间)r = -6.3045-4.22158442223.46253.3938rint=(略)stats =0.9034(R2)35.0509(F)0.0000(p)Q = r*rb 2= Q/(n-2) = 537.2092 (近似)002 slaudiseR2 4 6 8 10 12 14 16 18 20Case Number逐步回归的方法:stepwise(X, y, inmodel,alfha)分析几个变量对Y的影响。很重要 的内容,这个方法可以选择那些影响显著的变量入围。当然在做逐步回归时也可 以引入高次项,交互项。具体(p325)X=x1,x2,x3,x4;stepwise(X,y,1,2,3)四、多元非线性回归模型: 由于线性中常常出现拟合欠佳的形式,因此直接考虑非线性模型。非线性模 型中注意混合模型的应用。我们可以先做线性回归,再把参数估计值作为非线性 参数估计的迭代初值。而且仅有一些统计检验量有用了!如:在各因素与指标(因变量)之间的信息“一无所知啲情况下,假设模型Y = f (x1,x2x3)+ &中的函数f是多项式形式,即y = b0+ b1 x1 + b 2x2+ b3 x3 + (linear terms)b 12 x 1x 2+ b 13x 1 x 3 + b 23 x 2 x 3 +(interaction terms)b 11 x 1 2 + b 22 x 2 2 + b 33 x 3 2 + 8 (quadratic terms)8 N(0, g2)1、在MATLAB软件下,实现二次多项式回归分析的命令:rstool(X, y,model, alpha) (它将产生一个交互式的界面)linear:(缺省)y = B 0+0 lx 1+.+0 mxmpurequadratic: y = 0 0+0 lx 1+.+0 mxm +Ej=1 to m0 j*xj2 interaction:y = 0 0+0 lx 1+.+0 mxm +工 1WjHkW m0 jkxjxkquadratic(完全二次,以上模型之和)2、非线性用下列语句 nlintool(X,y, model, beta)注意:统计回归模型中要注意诊断自相关性。利用DW检验。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 活动策划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!