数据拟合与回归分析

上传人:桂梅 文档编号:170920137 上传时间:2022-11-23 格式:DOCX 页数:8 大小:128.15KB
返回 下载 相关 举报
数据拟合与回归分析_第1页
第1页 / 共8页
数据拟合与回归分析_第2页
第2页 / 共8页
数据拟合与回归分析_第3页
第3页 / 共8页
点击查看更多>>
资源描述
6.3 数据拟合与回归分析在对工程实践和科学实验的数据处理中,人们除了使用插值的方法来揭示数据间的 关系以外,使用数据拟合以及回归也能很好的描述数据之间的对应关系。数据插值是在纯粹的自变量与因变量之间的数量关系上作分析;数据拟合则考虑如 何选择函数整体逼近所给的数据点列;数据的回归分析则考虑随机误差对原始数据的影 响,探讨如何选用函数即能反映数据之间的关系,又能使整体的误差最小。对于点对(x,y ),j=l,2,3,k,根据其特征用某种形式的函数iiy = f (x, a , a ,a )1 2 n来作为未知函数的近似表达式,其中a , a a为待定常数。求函数f的问题即为数据1 2 n拟合。在实际中常用到最小二乘拟合方法,其数学问题表述如下:min 丈(f (x , a , a a ) - y )2。i 1 2 n ii 二 1般多项式拟合公式:y = a xn-1 + a xn-2 + a x + a。nn-121回归分析与拟合有着紧密的联系,针对回归函数的性质分为线性回归与非线性回归。 在实际应用中,为使预测值( 1 )一元线性回归模型设有数据点对(X ,y ),j=l,2,3,k,存在关系iiy =B +B x + , i = 1,2,ki01i其中0 o, 0 J称为回归系数, i是随机误差,它们相互独立,且服从正态N(0,b 2)分布。对0 ,0 |通常用最小二乘估计求得。(2)多元线性回归模型设随机变量y的取值依赖于x ,x ,,x (其中每个x均为列向量),且有关系1 2 p ify = B + P x + P x + + P x + J i01 i12 i 2p ip N(0,b 2), i = 1,2,. ,n,i其中卩,P,P,为回归系数,为随机误差。01pi(3)多项式回归模型在一元回归中,点对(x,y ),j=l,2,3,k,是n-1次多项式的关系y = a xn-1 + a xn -2 + a x + a + nn -1218是随机误差,且服从正态N (0,b 2)分布。6.3.1 Matlab 中数据拟合与回归方法在 Matlab 中常用 的拟合 与回归 的函数主 要有: polyfit, polyval, polyconf, polytool, regress 等。其使用格式分别如下所述。POLYFIT 多项式拟合POLYFIT(X,Y,N)P,S = POLYFIT(X,Y,N)P,S,MU = POLYFIT(X,Y,N)参数N整数,拟合多项式的次数,P拟合多项式系数,S结构数组,包含Vandermonde矩阵(R)的Cholesky因子,自由度(df),残差范数(normr),MU 以 XHAT = (X-MU(1)/MU(2)此处 MU(1) = mean(X),MU(2) = std(X)的方 式求拟合多项式系数。POLYVAL 多项式求值Y = POLYVAL(P,X)Y = POLYVAL(P,X,MU)Y,DELTA = POLYVAL(P,X,S)Y,DELTA = POLYVAL(P,X,S,MU)参数P 是一个长度为N+l的向量,其元素是关于X的多项式的系数,其多项式为Y = P(1)*XN + P(2)*X(N-1) + . + P(N)*X + P(N+1),X,Y多项式在自变量X上的值为Y,S 由polyfit所得,包含Cholesky因子,自由度,残差范数,MU 由polyfit所得,按XHAT = (X-MU(1)/MU方式求多项式在X的值,DELTA 按 S 中残差范数求 Y +/- delta. ,如输入数据的误差是独立且有常数方差的 正态分布,Y +/- delta至少包含50%的预测值;若MU是用户自行设置的, 则Y +/- delta.包含100 (1-MU) %的预测值,缺省值取MU=0.05。POLYTOOL数据点对(x,y)的多项式拟合及交互图形窗口POLYTOOL(X,Y,N,ALPHA)给出用N阶多项式拟合(X,Y)数据,并用两条红线界定出100 (1-alpha) %置信区 间。N的缺省值为1,alpha的缺省值为0.05。REGRESS 多元线性回归(最小二乘意义)b = REGRESS(y,X)B,BINT,R,RINT,STATS = REGRESS(y,X,alpha)参数b,B返回线性模型y = Xb的系数b,其中X是n*p矩阵,y是n*xl向量ALPHA置信水平默认为 0.5R残差向量BINT回归系数的 100(1-ALPHA)RINT残差向量的 100(1-ALPHA)STATS 复相关系数R2,F统计量的值,相应于F值的概率p。6.3.2 Matlab 的拟合与回归应用实例 设有某地银行两年的月度数据(矩阵形式),其每一列分别表示的数据为:银行存款余额,居民储蓄余额,银行贷款余额,工业贷款,农业贷款,商业贷款。a= 20.04425.080132.686211.51211.018617.831419.86625.209530.455110.82670.950916.349820.63445.348330.092810.55950.938917.178720.45135.466231.386710.70641.001017.397021.30145.576431.199910.81070.975316.923221.72555.735132.398411.14690.999817.605321.77795.934232.786111.37641.062817.637321.96236.090032.702111.60701.062817.192722.30386.144533.266411.74471.149517.493422.64676.264233.375311.90201.203717.342823.26546.342334.397212.27191.251317.871324.19166.110036.280013.27441.316218.341823.67086.813035.896411.29281.324518.215423.53776.825035.012311.12051.342518.156422.92436.948134.125610.85151.385117.659823.53687.235134.012510.56091.475217.122923.71647.523933.895911.92991.522917.594624.09027.808635.259312.29561.540917.946725.30898.082936.335712.86161.805118.081925.37488.312736.035612.68131.672617.821825.63018.435537.544113.05381.718119.127826.28088.581438.262713.15851.788020.560726.67668.680838.605613.03151.690820.233828.41007.660041.395914.76661.570220.7094 。例 1 拟合居民储蓄余额,作线性,二次,三次多项式拟合。 作一次拟合x=(1:24);p=polyfit(x,a(:,2),1); y=polyval(p,x); res=a(:,2)-y;plot(x,a(:,2),-o,x,y,+-); figure;plot(x,res,+-);采用一次多项式拟合的曲线及误差曲线图作二次拟合 x=(1:24); p=polyfit(x,a(:,2),2); y=polyval(p,x); res=a(:,2)-y;plot(x,a(:,2),-o,x,y,+-); figure;采用二次多项式拟合的曲线及误差曲线图 作三次拟合 x=(1:24);p=polyfit(x,a(:,2),3); y=polyval(p,x); res=a(:,2)-y;plot(x,a(:,2),-o,x,y,+-); figure;plot(x,res,+-);置信区间(红色曲线)的情况,调整的degree(拟合多项式的次数)的值,则在图形窗口 立即给出新的拟合曲线及置信区间。p=polytool(x,a(:,2),6);例 3 建立银行存款余额与居民储蓄余额的线性回归方程。这是一元线性回归问题 ,其解 决的方式有两种:其一是应用多项式拟合函数;其二是用解线性方程组。方式1.设银行存款余额为y=a(:,l),居民储蓄余额为x=a(:,2)p=polyfit(x,y,1);即最好的拟合直线为 y = 1.7175x+ 11.6976.用 y1=polyval(p,x) 求 得 回 归 值 , 可 作 图 观 察 其 回 归 直 线 与 原 数 据 点 的 情 况 plot(x,y,.,-+r)。 plot(x,y1,-o,x,y,-o)方式 2.y=a(:,1);x=a(:,2) ones(size(y);p=xy;y1=x*p.例 4. 建立银行存款余额与居民储蓄余额、银行贷款余额、工业贷款、农业贷款、商业贷 款之间的线性回归方程。方式 1. 解线性方程组。y=a(:,1);x=a(:,2:6),ones(size(y);p=cy;得到线性回归方程 y=1.0552*x1+0.5751*x2+0.2754*x3-1.9128*x4-0.2415*x5-0.0449 y1=x*p;plot(y,.); hold on; plot(y1,r+-)29 I28 -27 -26 -25 -24 -23 -22 -21 -20 -19方式 2 使用多元线性回归函数 y=a(:,1);x=a(:,2:6),ones(size(y);b,bint,r,rint,stats=regress(y,x);回归系数估计值:b =1.0552, 0.5751, 0.2754, -1.9128, -0.2415, -0.0449 。 其回归方程为:y=1.0552*x1+0.5751*x2+0.2754*x3-1.9128*x4-0.2415*x5-0.0449 回归系数置信区间: bint0.2981 1.81230.3081 0.8421-0.1005 0.6514-5.1680 1.3425-0.6721 0.1891-3.64593.5562 。残差向量:r = -0.9852,-0.3152 ,0.7657,-0.1549,0.4941,0.1805,-0.1352 ,-0.2378,-0.0778, 0.1002,0.1656,0.2158,-0.2951,0.1352,-0.0625,0.4349,0.2049,-0.4870,0.2053 -0.0653,-0.5073,0.0271,-0.1091,0.5031。残差向量置信区间: rint-1.5527 -0.4177-1.14210.08850.51171.4430-0.99480.6851-0.32851.3167-0.67061.0315-1.0051-1.03700.73470.5614-0.96030.8048-0.77450.9749-0.71251.0437-0.4909-1.02590.92240.4357-0.68030.9507-0.88780.7628-0.26371.1335-0.6222-1.29821.03200.3241-0.47640.8870-0.83380.7032-1.31750.3029-0.6008-0.84360.65510.6254-0.0372 检验统计量:1.0434 。复相关系数R2, F统计量的值,相应于F统计量值的概率p。stats = 0.9708 119.4822 0.0000
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸设计 > 毕设全套


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!