matlab数据拟合回归分析课件

上传人:20****08 文档编号:242024213 上传时间:2024-08-10 格式:PPT 页数:46 大小:1.20MB
返回 下载 相关 举报
matlab数据拟合回归分析课件_第1页
第1页 / 共46页
matlab数据拟合回归分析课件_第2页
第2页 / 共46页
matlab数据拟合回归分析课件_第3页
第3页 / 共46页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,内容,回归分析,线性:,b,bint,r,rint,stats=regress(Y,X,alpha,),多元二项式回归,:,rstool(x,y,model,alpha),逐步回归:,stepwise(x,y,inmodel,penter,premove),常用函数拟合,1、,多项式拟合:P=polyfit(x,y,n),2、,函数线性组合的曲线拟合方法,3、,最小二乘曲线拟合,:,X=,lsqcurvefit,(FUN,X0,XDATA,YDATA,LB,UB,OPTIONS),内容回归分析X=lsqcurvefit(FUN,X0,XD,1,直线拟合:,a=polyfit(x,y,1),b=polyfit(x,z,1),同一条直线,y=0.33x+0.96(z=0.33x+0.96),从拟合到回归,x=0 1 2 3 4,y=1.0 1.3 1.5 2.0 2.3 (+号),x=0 1 2 3 4,z=0.6 1.95 0.9 2.85 1.8(*号),问题:你相信哪个拟合结果?怎样给以定量评价,?,得到,a=0.33 0.96,b=0.33 0.96,直线拟合:同一条直线 y=0.33x+0.96(z=0.33,2,一、数学模型,例1,测16名成年女子的身高与腿长所得数据如下:,以身高x为横坐标,以腿长y为纵坐标将这些数据点(x,I,,y,i,)在平面直角坐标系上标出.,散点图,解答,一、数学模型例1 测16名成年女子的身高与腿长所得数据如下:,3,一元线性回归分析的,主要任务,是:,返回,一元线性回归分析的主要任务是:返回,4,二、模型参数估计,1、回归系数的最小二乘估计,二、模型参数估计1、回归系数的最小二乘估计,5,其中,=,=,=,=,n,i,i,n,i,i,y,n,y,x,n,x,1,1,1,1,,,=,=,=,=,n,i,i,i,n,i,i,y,x,n,xy,x,n,x,1,1,2,2,1,1,.,其中=niiniiynyxnx111,1,=,6,返回,返回,7,三、检验、预测与控制,1、回归方程的显著性检验,三、检验、预测与控制1、回归方程的显著性检验,8,()F检验法,()t检验法,()F检验法()t检验法,9,()r检验法,()r检验法,10,2、回归系数的置信区间,2、回归系数的置信区间,11,3、预测与控制,(1)预测,3、预测与控制(1)预测,12,(2)控制,返回,(2)控制返回,13,收集一组包含因变量和自变量的数据;,选定因变量与自变量之间的模型,利用数据按照最小二乘准则计算模型中的系数;,利用统计分析方法对不同的模型进行比较,找出与数据拟合得最好的模型;,判断得到的模型是否适合于这组数据,诊断有无不适合回归模型的异常数据;,利用模型对因变量作出预测或解释。,回归分析的主要步骤,收集一组包含因变量和自变量的数据;回归分析的主要步骤,14,例1:血压与年龄、体重指数、吸烟习惯,序,号,血,压,年,龄,体重,指数,吸烟,习惯,序,号,血,压,年,龄,体重,指数,吸烟,习惯,1,144,39,24.2,0,21,136,36,25.0,0,2,215,47,31.1,1,22,142,50,26.2,1,3,138,45,22.6,0,23,120,39,23.5,0,10,154,56,19.3,0,30,175,69,27.4,1,体重指数=体重(kg)/身高(m)的平方,吸烟习惯:0表示不吸烟,1表示吸烟,建立血压与年龄、体重指数、吸烟习惯之间的,回归模型,例1:血压与年龄、体重指数、吸烟习惯 序 血年体重吸烟,15,模型建立,血压,y,,年龄,x,1,,体重指数,x,2,,吸烟习惯,x,3,y,与,x,1,的散点图,y,与,x,2,的散点图,线性回归模型,回归系数,0,1,2,3,由数据估计,是随机误差,模型建立血压y,年龄x1,体重指数x2,吸烟习惯x3 y与x,16,多元线性回归,b=regress(Y,X),1、,确定回归系数的点估计值:,MATLAB,统计工具箱常用命令(1),多元线性回归1、确定回归系数的点估计值:MATLAB 统计工,17,3、,画出残差及其置信区间:,rcoplot(r,rint),2、,求回归系数的点估计和区间估计、并检验回归模型:,b,bint,r,rint,stats=regress(Y,X,alpha),回归系数的区间估计,残差,用于检验回归模型的统计量,,有三个数值:相关系数r,2,、,F值、与F对应的概率p,置信区间,显著性水平,(缺省时为0.05),2、求回归系数的点估计和区间估计、并检验回归模型:回归系数的,18,rcoplot(r,rint),残差,及其置信区间作图,MATLAB7.0版本 s增加一个统计量:剩余方差s,2,.,使用命令regress实现一元线性回归模型的计算,b=regress(Y,X),或,b,bint,r,rint,stats=regress(Y,X,alpha),回归系数,beta,以及它们的置信区间,残差向量r=Y-Y及它们的置信区间,相关系数R,2,,F-统计量和与,F,(1,n-2),分布大于,F,值的概率,p,,,p,时,回归模型有效.,默认值是,0.05,rcoplot(r,rint)残差及其置信区间作图MATLA,19,回归系数,回归系数,估计值,回归系数,置信区间,0,45.3636,3.5537 87.1736,1,0.3604,-0.0758 0.7965,2,3.0906,1.0530 5.1281,3,11.8246,-0.1482 23.7973,R,2,=,0.6855,F,=,18.8906,p,0.0001,s,2,=169.7917,模型求解,回归系数,回归系数,估计值,回归系数,置信区间,0,58.5101,29.9064 87.1138,1,0.4303,0.1273 0.7332,2,2.3449,0.8509 3.8389,3,10.3065,3.3878 17.2253,R,2,=,0.8462,F,=,44.0087,p,0.0001,s,2,=53.6604,剔除异常点(,第,2,点和第,10,点,)后,回归系数回归系数估计值回归系数置信区间045.36363,20,例2 软件开发人员的薪金,资历,从事专业工作的年数;管理,1,=管理人员,,0,=非管理人员;教育,1,=中学,,2,=大学,,3,=更高程度,建立模型研究薪金与资历、管理责任、教育程度的关系,分析人事策略的合理性,作为新聘用人员薪金的参考,编号,薪金,资历,管理,教育,01,13876,1,1,1,02,11608,1,0,3,03,18701,1,1,3,04,11283,1,0,2,05,11767,1,0,3,编号,薪金,资历,管理,教育,42,27837,16,1,2,43,18838,16,0,2,44,17483,16,0,1,45,19207,17,0,2,46,19346,20,0,1,46,名软件开发人员的档案资料,例2 软件开发人员的薪金资历 从事专业工作的年数;管,21,分析与假设,y,薪金,,x,1,资历(年),x,2,=,1,管理人员,,x,2,=,0,非管理人员,1,=中学,2,=大学,3,=更高,资历每加一年薪金的增长是常数;,管理、教育、资历之间无交互作用,教育,线性回归模型,a,0,a,1,a,4,是待估计的回归系数,,是随机误差,中学:,x,3,=1,x,4,=0,;大学:,x,3,=0,x,4,=1;,更高:,x,3,=0,x,4,=0,分析与假设 y 薪金,x1 资历(年)x2=1 管,22,模型求解,参数,参数估计值,置信区间,a,0,11032,10258 11807,a,1,546,484 608,a,2,6883,6248 7517,a,3,-2994,-3826 -2162,a,4,148,-636 931,R,2,=0.957,F,=226,p,=0.000,R,2,F,p,模型整体上可用,资历增加,1,年薪金增长,546,管理人员薪金多,6883,中学程度薪金比更高的少,2994,大学程度薪金比更高的多,148,a,4,置信区间包含零点,解释不可靠!,中学:,x,3,=1,x,4,=0;,大学:,x,3,=0,x,4,=1;,更高:,x,3,=0,x,4,=0.,x,2,=,1,管理,,x,2,=,0,非管理,x,1,资历(年),xinjindata.m xinjin.m,模型求解参数参数估计值置信区间a011032 10258,23,残差分析方法,结果分析,残差,e,与资历,x,1,的关系,e,与管理教育组合的关系,残差全为正,或全为负,管理教育组合处理不当,残差大概分成,3,个水平,,6,种管理教育组合混在一起,未正确反映,应在模型中增加管理,x,2,与教育,x,3,x,4,的交互项,组合,1,2,3,4,5,6,管理,0,1,0,1,0,1,教育,1,1,2,2,3,3,管理与教育的组合,残差分析方法 结果分析残差e 与资历x1的关系 e与管理教,24,进一步的模型,增加管理,x,2,与教育,x,3,x,4,的交互项,参数,参数估计值,置信区间,a,0,11204,11044 11363,a,1,497,486 508,a,2,7048,6841 7255,a,3,-1727,-1939 -1514,a,4,-348,-545 152,a,5,-3071,-3372-2769,a,6,1836,1571 2101,R,2,=0.999,F,=554,p,=0.000,R,2,F,有改进,所有回归系数置信区间都不含零点,模型完全可用,消除了不正常现象,异常数据(,33,号)应去掉,e x,1,e,组合,进一步的模型增加管理x2与教育x3,x4的交互项参数参数估,25,去掉异常数据后,的结果,参数,参数估计值,置信区间,a,0,11200,11139 11261,a,1,498,494 503,a,2,7041,6962 7120,a,3,-1737,-1818 -1656,a,4,-356,-431 281,a,5,-3056,-3171 2942,a,6,1997,1894 2100,R,2,=0.9998,F,=36701,p,=0.0000,e x,1,e,组合,R,2,:0.957,0.999,0.9998,F,:226,554,36701,置信区间长度更短,残差,图十分正常,最终模型的结果可以应用,xinjindata2.m xinjin1.m,去掉异常数据后的结果参数参数估计值置信区间a0112001,26,模型应用,制订,6,种管理教育组合人员的“基础”薪金(资历为,0,),组合,管理,教育,系数,“基础”薪金,1,0,1,a,0,+,a,3,9463,2,1,1,a,0,+,a,2,+,a,3,+,a,5,13448,3,0,2,a,0,+,a,4,10844,4,1,2,a,0,+,a,2,+,a,4,+,a,6,19882,5,0,3,a,0,11200,6,1,3,a,0,+,a,2,18241,中学:,x,3,=1,x,4,=0,;大学:,x,3,=0,x,4,=1;,更高:,x,3,=0,x,4,=0,x,1,=,0,;,x,2,=,1,管理,,x,2,=,0,非管理,大学程度管理人员比更高程度管理人员的薪金高,大学程度非管理人员比更高程度非管理人员的薪金略低,模型应用 制订6种管理教育组合人员的“基础”薪金(资历为0,27,MATLAB,统计工具箱常用命令(2),rstool(x,y,model,alpha),x,nm,矩阵,n,是数据容量,y,n,维列向量,alpha显著性水平,多元二项式回归,model从以下4个模型中选取:,(设,m,=2,),MATLAB 统计工具箱常用命令(2)rstool(x,y,28,例3,商品销售量与价格,x1=,;x2=,;x=x1 x2;y=,;,rstool(x,y,quadratic,),Export,向工作区传送参数:beta-回归系数,rmse-剩余标准差s,residuals-残差(向量);,例3 商品销售量与价格 x1=;x2=;x,29,变量选择,影响因变量的因素:,自变量,x,1,x,2,x,m,及其简单函数,如,将所有影响显著的因素都纳入回归模型;,最终的模型尽量简单,即包含尽量少的因素。,变量选择的标准,从候选集合S=,x,1,x,k,中选出一子集S,1,(含,p,k,个自变量)与因变量y构造回归模型,其优劣由s,2,度量.,影响显著的自变量进入模型时,,Q,明显下降,,s,减小;,影响很小的自变量进入模型时,,Q,下降不大,,p,的增加 会使,s,变大.,变量选择与逐步回归,变量选择影响因变量的因素:自变量x1,x2,xm及其,30,逐步回归,从候选集合中确定一初始子集;,从子集外(候选集合内)中引入一个对,y,影响显著的;,对集合中的变量进行检验,剔除影响变得不显著的;,迭代式地进行引入和剔除,直到不能进行为止。,选择衡量影响显著程度的统计量,通常用偏,F,统计量;,适当选取引入变量的显著性水平,in,和剔除变量的,out。,引入新的变量后原来模型内影响显著的变量变得不显著,从而被剔除 自变量之间存在较强相关性的结果.,某些自变量之间的相关性很强,回归系数的置信区间较大,多重共线性,矩阵,X,T,X,病态,逐步回归 从候选集合中确定一初始子集;选择衡量影响显著程度,31,MATLAB,统计工具箱常用命令(3),逐步回归,stepwise(x,y,inmodel,penter,premove),x候选变量集合的nk 数据矩阵(n是数据容量,k是变量数目);y因变量数据向量(n维);,Inmodel初始模型中包括的候选变量集合的指标(矩阵x的列序数,缺省时设定为全部候选变量);,penter引入变量的显著性水平(缺省时设定为0.05);premove剔除变量的显著性水平(缺省时设定为0.10)。,输出交互式画面,MATLAB 统计工具箱常用命令(3)逐步回归 stepw,32,例 儿童的体重与身高和年龄,序号,体重(kg),身高(m),年龄,序号,体重(kg),身高(m),年龄,1,27.1,1.34,8,7,30.9,1.39,10,2,30.2,1.49,10,8,27.8,1.21,9,3,24.0,1.14,6,9,29.4,1.26,10,4,33.4,1.57,11,10,24.8,1.06,6,5,24.9,1.19,8,11,36.5,1.64,12,6,24.3,1.17,7,12,29.1,1.44,9,可能存在二次函数关系,体重y,身高x,1,体重y,年龄x,2,例 儿童的体重与身高和年龄序号体重(kg)身高(m)年龄序,33,例 儿童的体重与身高和年龄,ertong.m,初始结果,最终结果,例 儿童的体重与身高和年龄ertong.m初始结果 最终结,34,2004 B题 电力市场的输电阻塞管理,确定各线路上潮流关于各发电机组出力的近似表达式,当前时段各发电机组出力,p,1,(0),p,n,(0),线路潮流,u,j,(0),a,0,答卷中的问题:没有常数项,a,0,;没有统计检验,p,(0),+,+,+,+,+,p,0,u,a,0,=0,2004 B题 电力市场的输电阻塞管理确定各线路上潮流关于各,35,常用函数拟合,1、多项式拟合,常用函数拟合1、多项式拟合,36,【例】,用polytool(x0,y0,3)还可以得到一个交互式画面。,【例】用polytool(x0,y0,3)还可以得到一个交互,37,2、函数线性组合的曲线拟合方法,2、函数线性组合的曲线拟合方法,38,该方程的最小二乘解为:,其中,该方程的最小二乘解为:其中,39,【例】,【例】,40,matlab数据拟合回归分析课件,41,3、最小二乘曲线拟合,3、最小二乘曲线拟合,42,matlab数据拟合回归分析课件,43,【例】,【例】,44,matlab数据拟合回归分析课件,45,谢谢大家!,谢谢大家!,46,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!