简述一元线回归

上传人:仙*** 文档编号:33274569 上传时间:2021-10-16 格式:PPT 页数:22 大小:623KB
返回 下载 相关 举报
简述一元线回归_第1页
第1页 / 共22页
简述一元线回归_第2页
第2页 / 共22页
简述一元线回归_第3页
第3页 / 共22页
点击查看更多>>
资源描述
简简 述述 一一 元元 线线 性性 回回 归归黄黄 延延 俊俊0308801903088019一元线性回归分析中的几点疑问o 一元线性回归方程的建立o 一元线性中相关系数R2的求法o 回归方程的精度与置信区间o 利用回归方程进行预报与控制一元线性回归方程的建立(a, b值的求取) 两变量给出后,相关点可以确定在相关图上可是散乱分布的,拟合曲线y=ax+b 未必过每个(xi, yi) 点,但它是最优直线,所谓最优,即全部相关点(x, y)与其对应的直线上的点 应该离差为最小,由变异指标的认识,可用对应点差的平方和来刻画离差绝对量令 当xi给定, yi是确定的,所以要使离差为最小,只是a,b两参量的值是要讨论的,于是可将其看为二元函数求其最小值问题二元函数极值求法 即是关于未知量a,b的二元一次方程组,用加减消元法,易得 由(1)式 代入(2)式 进而求得 总结:算出了a,b,此时y=f(x)的回归方程为 。例例 题题题解:将有关的数据代入公式,计算建立的标准曲线为例题:用分光光度法测定氨溶液中的铜氨离子,以水参比,在600nm测定铜氨显色溶液的吸光度A,得到结果如下: c/mol/L 0.002 0.003 0.005 0.008 0.012 A 0.12 0.14 0.27 0.40 0.52试根据所得到的数据建立吸光度A与铜氨离子浓度c之间的回归方程。111221110.0027541.6670.00006610.29041.6670.0060.040nnniiinniixyxynbxxnaybx 建立的标准曲线为0.04041.667Ac,0.0020.0040.0060.0080.0100.0120.10.20.30.40.50.6Data: Data1_BModel: LineMod Equation: y = a*(x-b) Weighting:yNo weighting Chi2/DoF= 0.00074R2= 0.98102 a41.66667? .34594b-0.00096? .00063 BA铜氨离子浓度c/10-3mol/L线性相关性检验与相关系数 用最小二乘法拟合回归方程与回归线只表明各实验点与所拟合的回归方程和回归线的变差平方和最小,并没有证明所拟合回归方程肯定有意义。至于所拟合方程与回归线是否有意义,尚需进行统计检验。 由于除x之外其它因素和实验误差的影响,回归系数b与常数a的波动,各实验点不一定都落在回归线上。各实验点偏离平均值的程度,可用它们总的偏差平方和Q来表征。21niiQyy(yi-Yi)(Yi-y)Y=b + ax0yx(xi , yi) 即总的偏差平方和Q可分解为Qg和Qe两部分,其中Qe反映了除x对y的线性影响之外其它一切因素与实验误差以及x对y的非线性影响,称之为殘差平方和。Qg表示由于x在x平均值周围变化而引起的y对y平均值的偏差平方和。很显然,当全部实验点落在回归线上,此时Qe=0,Q=Qg;如果y与x不存在线性关系,则Qg=0,Q=Qe。由此可见,Qg直接反映了因变量y与自变量x之间的相关程度。21niiiQeyY21niiQgYy21niiQyyegQQQ并令, 既然Qg直接反映了因变量y与自变量x之间的相关程度,这种相关程度可用一个称之为相关系数的量r来度量。对于变量y与x的一组观测值来说,我们把称为变量y与x之间的样本相关系数样本相关系数(相关系数相关系数) |r|1 我们通常用r2来表示 当r2越接近于1,相关程度越大; 当r2越接近于0,相关程度越小 我们可以通求相关系数的临界值 检验r值是否有意义 如果r ,则说明所建立的回归方程有意义;反之则没有意义。, fr, fr例例 题题例题 为了研究某一地区土壤与农作物中某痕量元素含量之间的相关关系,取土样与生长在该土壤中的作物进行分析,测定该痕量元素的含量(g)如下:试样号 1 2 3 4 5 6 7 8 9 10 x(土样中) 33.5 27.0 36.0 32.0 19.5 11.0 29.0 21.5 23.0 17.0 y(作物中) 0.24 0.15 0.23 0.19 0.16 0.11 0.20 0.16 0.17 0.13试由这些数据确定土壤中与作物中某痕量元素含量之间是否存在相关关系。在本例中,将土壤中某痕量元素含量作为x,作物中某痕量元素含量作为y。将有关的数据带入公式中,求得2.7270.0048568.7250.1740.0048 24.950.054xyxxba0.0540.0048yx回归方程为相关系数为2.7270.920568.7250.01544xyxxyyr 查相关系数临界值表,得0.05,80.05,80.632,这说明所建立的回归方程式有意义的,作物中某痕量元素含量与土壤中该痕量元素含量与土壤中该痕量元素含量之间确实存在相关关系。回归方程的精度与置信区间(简要介绍)回归线的置信区间, fxxsbt真实斜率的置信区间真实截距的置信区间21,niixxxatfn200,1fxxxxabxtn单次测定的置信区间200,11fxxxxabxtpn200,211fxxyysxtbpnb对于y0进行p次重复 测量 相应的置信区间为当x=x0时,y0值精度最好,x离x平均值越远,精度越差同理,对x0进行p次重复测量相应的置信区间为22s22gyyxxQQbsnn对于所涉及的 可通过公式求得利用回归方程进行预报与控制 预报是根据回归方程由自变量x来预估因变量y的取值范围,控制则是希望因变量y值以一定概率落在某一指定区间(y, y)时,自变量x应控制的取值范围。预报与控制对实际工作具有重要意义内建立回归方程的目的之一就是为了进行预报与控制。在前面讨论了回归方程的精度与置信区间,根据回归方程的精度与置信区间就可以进行预报与控制。例例 题题 某工厂生产一种产品,需要对产品的含水率进行控制。已知生产产品原料中的含水率对产品的含水率有重要影响,为了保证产品质量,该厂化验人员对原料与产品的含水率(质量百分)进行了测定,得到了如下一组数据:实验号 1 2 3 4 5 6 7 8 9 10原料含水率x 16.7% 18.2% 18.2% 17.9% 17.4% 16.6% 17.2% 17.7% 15.7% 17.1%产品含水率y 17.1% 18.1% 18.6% 18.5% 18.2% 17.1% 18.0% 18.2% 16.0% 17.5% 若原料的含水量为16.5%,试问加工后产品的含水率预计在什么范围?o先求得线性方程 y=b + axo再求出相关系数R2 , 并判断其是否有意义o然后用以下公式求出产品含水率y的精确度范围,其中x0取16.5%200,11fxxxxabxtpn 如果要将加工后的产品含水率控制在17.0%18.0%之间,试问原料中的含水率应控制在何范围? 谢 谢 观 赏参考文献:参考文献: 邓勃邓勃 清华大学出版社清华大学出版社 厦门大学物理基础实验中心厦门大学物理基础实验中心 基础化学实验编写组基础化学实验编写组 北京大学出版社北京大学出版社
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 成人自考


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!