《般线性回归分析》PPT课件.ppt

上传人:sh****n 文档编号:3404870 上传时间:2019-12-13 格式:PPT 页数:33 大小:1.09MB
返回 下载 相关 举报
《般线性回归分析》PPT课件.ppt_第1页
第1页 / 共33页
《般线性回归分析》PPT课件.ppt_第2页
第2页 / 共33页
《般线性回归分析》PPT课件.ppt_第3页
第3页 / 共33页
点击查看更多>>
资源描述
六西格玛绿带培训教材一般线性回归分析,11-1,结束对本章节的学习后,学员将可以:解释什么是回归分析进行一般线性回归分析与解释假设测定系数(R2与修正的R2)回归诊断置信区间有影响的观测数据估计标准误,学习目的,定义:回归是确定一个响应变量(或输出)与一个或多个因变量(或输入)之间的统计关系的方法。Y=f(X1,X2,Xn),回归分析,其中:,Y是响应变量,X1到Xn是因变量,11-2,定义:决定两个来自不同变量源的响应(或输出)之间线性关系的方法。也代表两个变量间的线性关联程度。由一个相关系数(R)来衡量两个变量间的联系强度,在这里-1R1。按照惯例,R表示真实的系数,R表示我们的最佳估算。,相关,回归分析回归分析建立关于因变量与响应变量之间关系的估计方程式(公式)。,回归与相关,相关分析量化两个变量之间的线性关系的程度,即等式的适合性如何?,VS,11-3,预测系统模型因子筛选参数估算,回归的应用,一般线性回归(SLR)数学模型其中:,一般线性回归,Y-轴上的截取值,预测(独立)变量,Y,=,a+bX,斜率,是响应(非独立)变量,11-4,最小平方的方法,残差(或误差)由e1=Yi-(a+bXi)表示。(观测值-拟合值)最适合的直线即是残差平方和最小的那条线。,最小平方的方法,11-5,在Minitab中,可通过以下两种方法得到一般线性回归模型(最佳拟合线):,统计回归回归,统计回归拟合线图,例1,某黑带想了解一化学蒸馏过程中氧气的纯度(Y)与冷凝器中的炭氢化合物%之间的关系。数据在文件Oxygenpurity.mtw中。建立Oxygenpurity.mtw对Hydrocarbon%(X)之间的一般线性回归模式。,例1A,Minitab统计回归回归,11-6,例1A:Minitab的对话窗口,回归分析:Oxygenpurity%与Hydrocarbon%回归方程为Oxygenpurity%=74.3+14.9+Hydrocarbon%系数标自变量系数准误TP常量74.2831.59346.620.000Hydrocarbon%14.9471.31711.350.000S=1.08653R-Sq=87.7%R-Sq(调整)=87.1%方差分析来源自由度SSMSFP回归1152.13152.13128.860.000残差误差1821.251.18合计19173.38,与Hydrocar的关系解释了y值87.7%的变异。,F检验显示测定系数87.7%,具备统计显著性。,整体显著性,在Minitab中P数值是对回归等式的整体显著性的测量,P-value回归拟合线图,11-8,例1B:拟合线图,例2:残差分析,从文件Oxygenpurity中,建立Oxygenpurity对Hydrocarbon%(X)之间的一般线性回归模式并进行残差分析,11-9,例2:Minitab的残差图表,例2:Minitab的残差图表,11-10,随机,正态性,正态且均值为0,随机,置信区间,置信区间(CI)对于一个给出的X,Y的平均值的分布区间。该区间在X=X处最窄:X值离X越远其区间宽度越大。预测区间(PI)对于与一个给出的X值相应的个别的Y值的区间。由于其应用个体值,该区间比置信区间宽。,例3,从文件Oxygenpurity.mtw中,测定对已获得的线性回归模型的95%置信区间和预测区间。,11-11,Minitab例3,Minitab统计回归拟合线图,例3:Minitab的CIPI图,11-12,利用回归模型进行预测,我们可以预测两个数:,给出X值,预测y的均值uy,给出X值,预测y数值,我们不可以用此模型预测数据范围以外的uy或y。此模型只是在数据范围内才被验证为有效。,例4:预测,从文件Oxygenpurity.mtw中,给定X的值为1.15,确定uy和y的95%区间。,11-13,例4:预测,Minitab统计回归回归,例4:Minitab输出,新观测值的预测值新观家拟合值测值拟合值标准误95%置信区间95%预测区间91.4730.250(90.947,91.999)(89.130,93.815)新观测值的自变量值新观测值Hydrocarbon%11.15,11-14,具有影响的数据点,具有影响的数据点包括下列现象:1.在正常数据模式以外的数据;2.强烈影响回归结果的数据(也就是显著改变斜率或y轴截取值)这些现象并不一定是坏现象,因此你不一定要删除他们。,不管怎样,并在分析回归结果之前应该识别这些数据点并评估其影响。,具有影响的数据点,具有影响的数据可由于下列原因而被删除:测量误差数据输入误差违反物理定律,包含明显的虚假值的回归方程式会被视为无效!,11-15,具有影响的数据现象:界外点,界外点具有很大残差数值的现象数据。,具有影响的数据现象:杠杆点,杠杆点X方向的高数值数据,它对于平方占有很高的比例。,11-16,具有影响的数据现象,界外点的处理方法,对于如下两种情况,可以取消界外点:对不将其纳入分析中有合理的解释(例如:输入错误)。若纳入这些数据,会令回归分析的合理的解释失效。但是,因原因#2被撤消的点必须和回归分析同时报告,要么作为一次计数要么作为一个称为“虚假”数值的百分比。这些点通常是一个造成问题的根源,因此,一定不可被“隐藏”。,所有分析都应报告上述界外点,11-17,例5,从Oxygenpurity.mtw文件中,测定在数据组内部是否存在具有影响的数据点。,
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!