sy误差理论与数据处理

上传人:t****d 文档编号:242972312 上传时间:2024-09-13 格式:PPT 页数:96 大小:1.28MB
返回 下载 相关 举报
sy误差理论与数据处理_第1页
第1页 / 共96页
sy误差理论与数据处理_第2页
第2页 / 共96页
sy误差理论与数据处理_第3页
第3页 / 共96页
点击查看更多>>
资源描述
*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,误差理论与数据处理,第一章 绪论,第二章 误差的基本性质与处理,第三章 误差的合成与分配,第四章 测量不确定度,第五章 线性参数的最小二乘法,第六章 回归分析,1,课程目的,正确认识误差的性质,分析误差产生的原因,减小或抑制误差,正确处理实验数据,合理计算所得结果,给出科学可信的实验结果,正确组织实验过程,合理设计、选用仪器或测量方法,根据目标确定最佳方案,2,先修课程:,线性代数、概率论和数理统计、电路理论、电子电工实验等,.,课程目标:,对误差理论体系有一个全面的把握;掌握误差的概念、性质及分类方法;通过对固定量测量数据的处理学习误差处理的基本方法;能利用最小二乘法进行参数估计。掌握线性回归方法处理测量数据;能将以上理论运用于具体测量实践。,教材,误差理论与数据处理,(第,6,版) 费业泰等,机械工业出版社,3,门捷列夫 (1834-1907),科学始于测量,没有测量,便没有精密的科学,。,门捷列夫,研究误差的意义,4,钱学森,信息技术包括测量技术、计算机技术和通信技术,测量技术是信息技术的关键和基础。,钱学森(1911- ),研究误差的意义,5,第一章 绪论,1,、研究误差的意义,2,、误差的基本概念,3,、误差与精度,4,、有效数字与数据运算,6,第一章 绪论,第一节 研究误差的意义,第二节误差的基本概念,误差的定义,误差的分类,误差的来源,7,误差,绝对,误差,相对,误差,粗大,误差,系统,误差,随机,误差,表示形式,性质特点,误差,测得值,真值,一、误差的定义及表示法,8,引用误差,(,Fiducial Error of a Measuring Instrument,),定义,该标称范围(或量程)上限,最大引用误差,仪器某标称刻度值处的绝对误差,引用误差是一种相对误差,而且该相对误差是引用了特定值,又称为引用相对误差。,最大引用误差:引用标称范围上限(或量程)得到的,故该误差又满度误差。,最大引用误差:被用来确定仪表的,等级精度,仪器标称范围(或量程)内的最大绝对误差,9,主要来源,测量方法误差,测量装置误差,测量环境误差,测量人员误差,二、误差的来源,误差的起因,:,测量过程中,由于实验方法和实验设备的不完善,周围环境的影响,人们认识能力所限,实验所得数据和被测量的真值之间存在差异。,10,三、误差分类,系统误差,(,Systematic Error,),在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值与被测量的真值之差。,定义,特征,在相同条件下,多次测量同一量值时,该误差的绝对值和符号保持不变,,或者在条件改变时,按某一确定规律变化的误差。,11,按对误差掌握程度,系统误差可分为,误差绝对值和符号已经,明确,的系统误差。,已定系统误差:,例:,直尺的刻度值误差,误差绝对值和符号未能确定的系统误差,但通常估计出误差范围。,未定系统误差:,按误差出现规律,系统误差可分为,误差绝对值和符号,固定不变,的系统误差。,不变系统误差:,误差绝对值和符号,变化,的系统误差。,按其变化规律,可分为线性系统误差、周期性系统误差和复杂规律系统误差。,变化系统误差:,12,随机误差(,Random Error,),测得值,与在重复性条件下对同一被测量进行无限多次测量结果的,平均值之差,。又称为偶然误差。,定义,特征,在相同测量条件下,多次测量同一量值时,绝对值和符号以不可预定方式变化的误差。,产生原因,实验条件的偶然性微小变化,如温度波动、噪声干扰、电磁场微变、电源电压的随机起伏、地面振动等。,随机误差的大小、方向均随机不定,不可预见,不可修正。,大量的重复测量可以发现,它是遵循,某种统计规律,的。因此,可以用概率统计的方法处理含有随机误差的数据,对随机误差的总体大小及分布做出估计,并采取适当措施减小随机误差对测量结果的影响。,随机误差的性质,13,粗大误差(,Gross Error,),指明显超出统计规律预期值的误差。又称为疏忽误差、过失误差或简称粗差。,定义,产生原因,某些偶尔突发性的异常因素或疏忽所致。,测量方法不当或错误,测量操作疏忽和失误(如未按规程操作、读错读数或单位、记录或计算错误等),测量条件的突然变化(如电源电压突然增高或降低、雷电干扰、机械冲击和振动等)。,由于该误差很大,明显歪曲了测量结果。故应按照一定的准则进行判别,将含有粗大误差的测量数据(称为坏值或异常值)予以剔除。,14,三类误差的关系及其对测得值的影响,标准差,期望值,均值,某次测得值,奇异值,系统误差和随机误差的定义是科学严谨,不能混淆的。但在测量实践中,由于误差划分的人为性和条件性,使得他们并不是一成不变的,在一定条件下可以相互转化。也就是说一个具体误差究竟属于哪一类,应根据所考察的实际问题和具体条件,经分析和实验后确定。,15,第三节误差与精度,测量结果中,系统误差,的影响程度,准确度,(,Correctness,),测量结果中,随机误差,的影响程度,精密度,(,Precision,),精确度,(,Accuracy,),表示测量结果与被测量真值之间的一致程度。就误差分析而言,精确度是测量结果中,系统误差和随机误差,的综合,误差大,则精确度低,误差小,则精确度高。,精确度(精度)在数值上一般多用相对误差来表示,但不用百分数。如某一测量结果的相对误差为,0.001%,,则其精度为,10,-5,。,16,准确度、精密度和精确度三者之间的关系,弹着点全部在靶上,但分散。相当于系统误差小而随机误差大,即精密度低,准确度高。,弹着点集中,但偏向一方,命中率不高。相当于系统误差大而随机误差小,即精密度高,准确度低。,弹着点集中靶心。相当于系统误差与随机误差均小,即精密度、准确度都高,从而精确度高。,17,第四节有效数字与数据运算,一、有效数字,测量精度有限, 最末一位有效数字应与测量精度同一量级,可靠数字,+,一位存疑数字,=,有效数字,有效位数是该数中有效数字的个数。指从该数左方第一个非零数字算起到最末一个数字(包括零)的个数,它不取决于小数点的位置 。,例如:,3.14,(,3,位),0.0032,(,2,位),0.00320,(,3,位),3.14,3.2,10,-3,3.20,10,-3,正确表示:,(,20.53, 0.01,),mm,(,20.534 0.042,),mm,18,二、数字舍入规则,计算和测量过程中,对很多位的近似数进行取舍时,应按照下述原则进行凑整:,若舍去部分的数值,大于保留部分末位的半个单位,则末位数加,1,。,若舍去部分的数值,小于保留部分末位的半个单位,则末位数减,1,。,若舍去部分的数值,等于保留部分末位的半个单位,,则末位凑成偶数,,即当末位为偶数时则末位不变,当末位是奇数时则末位加,1,。,19,三、数字运算规则,在近似数运算时,为了保证最后结果有尽可能高的精度,所有残余运算的数字,在有效数字后可多保留一维数字作为参考数字(或称为安全数字)。,在近似数做加减运算时,各运算数据以小数位数最少的数据位数为准,其余各数据可多取一位小数,但最后结果应与小数位数最少的数据小数位相同。,在近似数乘除运算时,各运算数据以有效位数最少的数据位数为准,其余各数据可多取一位有效数,但最后结果应与有效位数最少的数据位数相同。,在近似数平方或开方运算时,近似数的选取与乘除运算相同。,在对数运算时,,n,位有效数字的数据应该用,n,位对数表,或用(,n+1,)位对数表,以免损失精度。,三角函数运算时,所取函数值的位数应随角度误差的减小而增多,20,第二章 误差的基本性质与处理,第一节 随机误差,第二节 系统误差,第三节 粗大误差,第四节 测量结果的数据处理实例,21,第一节 随机误差,一,、随机误差产生的原因,二、随机误差的分布及其特性,三、算术平均值,四、测量的标准差,五、测量的极限误差,六、不等精度测量,七、随机误差的其他分布,22,一,.,随机误差的产生原因,误差的出现没有确定的规律 统计规律,二,.,正态分布,23,三,.,算术平均值,设 为,n,次测量所得的值,则算术平均值 为:,式中:,第 个测得值, ,1,,,2,,,,,n;,的,残余误差,(简称残差)。,随机误差:,24,正态分布的随机误差分布密度,1.,单次测量的标准差,四,.,测量的标准差,(,Bessel,公式),2.,测量列,算术平均值的标准差,25,五,.,测量的极限误差,1.,单次测量的极限误差,t,:置信系数;,P,:,置信概率或置信水平,2.,算术平均值的极限误差,26,1.,权的概念,各个测量结果的可靠程度,六,.,不等精度测量,2.,权的确定方法,最简单确定权的方法:按测量的次数确定权。,前提:测量条件和测量水平皆相同。,结论:每组测量结果的权与其相应的标准差平方成反比。,27,3.,加权算术平均值,加权算术平均值,4.,单位权概念,若将不等精度测量的各组测量结果 皆乘以自身权数的平方根,,此时得到的新值 的权数就为,1,。,28,用 代替 代入等精度测量的公式得:,加权算术平均值的标准差:,等精度测量列的残余误差,等精度测量列的测量结果,已知各组测量结果的残余误差为: ,,将各组 单位权化得:,加权单次测量的标准差:,5.,加权算术平均值的标准差,29,七,.,随机误差的其他分布,正态分布是随机误差最普遍的一种分布规律,但不是唯一的分布规律。,几种常见的非正态分布:,1.,均匀分布,2.,反正弦分布,3.,三角形分布,4.,分布,5.,分布,6.,分布,30,第二节 系统误差,随机误差处理方法的前提:测量数据中不含有系统误差,实际情况:系统误差与随机误差同时存在,研究系统误差的特征与规律性,找出产生系统误差的原因,,提出减加或消除系统误差的方法 给出科学结论,一 系统误差产生的原因,二 系统误差的特征,三 系统误差的发现,四 系统误差的减小和消除,31,系统误差是有固定不变的或按确定规律变化的因素造成,这些因素是可以掌握的。, 测量装置方面的因素, 环境方面的因素,测量方法的因素,测量人员的因素,计量校准后发现的偏差、仪器设计原理缺陷、仪器制造和安装的不正确等。,测量时的实际温度对标准温度的偏差、测量过程中的温度、湿度按一定规律变化的误差等。,采用近似的测量方法或计算公式引起的误差等。,测量人员固有的测量习性引起的误差等。,一 系统误差产生的原因,32,二 系统误差的特征,在同一条件下,多次测量同一量值时,误差的绝对值和符号保持不变,或者在条件改变时,误差按一定规律变化。,1,不变的系统误差,2,线性变化的系统误差,3,周期性变化的系统误差,4,复杂规律变化的系统误差,33,三 系统误差的发现,34,四 系统误差的减小和消除,(一)消误差源法 (二)加修正值法 (三)改进测量方法,(一)消误差源法:, 所用基准件、标准件是否准确可靠;, 所用量具仪器是否处于正常工作状态,是否经过检定;, 仪器的调整、测件的安装定位和支承装卡是否正确合理,;, 所采用的测量方法和计算方法是否正确,有无理论误差;, 测量的环境条件是否符合规定要求,如温度、振动、尘污、气流等;, 注意避免测量人员带入主观误差如视差、视力疲劳、注意力不集中等。,(二)加修正值法,35,(三)改进测量方法,1,、消除恒定系统误差的方法, 抵消或反向补偿法,丝杠与螺母间的配合间隙等因素引起的定回误差,往往采用往返两个方向的两次读数取均值作为测量结果, 代替法:代替法的实质是在测量装置上对被测量测量后不改变测量条件,立即用一个标准量代替被测量,测量差值 被测量标准差差值, 交换法:这种方法是根据误差产生原因,将某些条件交换,以消除系统误差。,36,2、消除线性系统误差的方法对称法,例如测定量块平面平行性时(见图,2-20,),先以标准量块,A,的中心,0,点对零,然后按图中所示被检量块,B,上的顺序逐点检定,再按相反顺序进行检定,取正反两次读数的平均值作为各点的测得值,就可消除因温度变化而产生的线性系统误差。,37,3、消除周期性系统误差的方法半周期法,38,第三节 粗大误差,粗大误差的数值比较大,它会对测量结果产生明显的歪曲,一旦发现含有粗大误差的测量值,应将其从测量结果中剔除,一 粗大误差的产生原因,1,测量人员的主观原因,2,客观外界条件的原因,二 防止与消除粗大误差的方法,1,避免人为因素的影响,反复多次检查,2,尽量采用自动化数采系统,3,加强本底环境监测,39,三 判别粗大误差的准则,1,准则 测量次数充分大,若 则可以认为它含有粗大误差,2 t,检验准则(罗曼诺夫斯基准则),当测量次数较少时,按,t,分布的实验误差分布范围来判别粗大误差较为合理,.,特点:首先剔除一个可疑的测量值,然后按,t,分布检验被剔除的测量值是否含有粗大误差,.,40,第三章 误差的合成与分配,第一节 函数误差,第二节 随机误差的合成,第三节 系统误差的合成,第四节 系统误差与随机误差的合成,第五节 误差分配,第六节 微小误差取舍准则,第七节 最佳测量方案的确定,41,任何测量结果都包含有一定的测量误差,这是测量过程中各环节一系列误差因素共同作用的结果。,正确分析与综合这些误差因素,并正确地表述这些误差的综合影响。,第一节 函数误差,间接测量,:通过直接测量与被测的量之间有一定函数关系的其,他量,按照已知的函数关系式计算出被测量。,间接测量误差,是各直接测量值误差的函数,即函数误差。,研究函数误差的实质就是研究误差的,传递性,的问题。,对于这种有确定关系的误差的计算称为,误差合成,。,42,(函数系统误差公式),一,.,函数系统误差的计算,第一节 函数误差,二,.,函数随机误差计算,可得:,该式即为,函数随机误差公式,,其中 为第 个测量值和第 个,测量值之间的,误差相关系数,为各测量值的误差传递系数,。,43,若各测量值的随机误差是相互独立的,且当,N,适当大时,有:,则误差公式变为:,令,(较常使用),44,三,.,误差间的相关关系和相关系数,1.,误差间的线性相关关系,即线性依赖关系,有强弱之分。,2.,相关系数,由相关系数定义知:,式中:,误差间的协方差;,两误差的标准差。,45,第二节 随机误差的合成,一,.,标准差的合成,二,.,极限误差的合成,(较常使用),46,一,.,已定系统误差的合成,当 时,有:,二,.,未定系统误差,当各单项未定系统误差均服从正态分布,,且 时,,极限误差,标准差,第三节 系统误差的合成,47,第四节 系统误差与随机误差的合成,一、按极限误差合成,设有,r,个单项已定系统误差,s,个单项未定系统误差,q,个单项随机误差,假设误差传递系数 均为,1,,则总极限误差为:,各个误差间协方差之和,48,按标准差合成,s,个未定系统误差标准差,q,个单项随机误差标准差,误差传递系数均为,1,,且各个误差间协方差之和,R,为,0,对于多次重复测量:,只考虑未定系统误差与随机误差合成问题,49,第五节 误差分配,单项误差 总误差,总误差的允差 各个单项误差,综合,如: 弓高弦长法测大直径,D,给定直径测量允许极限误差 ,求弓高,h,和弦长,s,的测量极限误差,已定系统误差通过修正方法消除,则只考虑未定系统误差和随机误差,且这两种误差分配时可同等看待,分配方法完全相同。,50,第六节 微小误差取舍准则,微小误差,:测量过程包含多种误差,有的误差对测量结果总误差影响较小,小到一定程度,计算测量结果总误差可不予考虑。,取出部分误差,若 , 则 称为微小误差,可从总误差中舍去,已知测量结果的标准差为:,51,第七节 最佳测量方案的确定,测量结果与多个测量因素有关,采用什么方法确定各个因素,使得测量结果的误差为最小,确定最佳测量方案。,函数的标准差为,使标准差为最小,确定最佳测量方案,从以下二方面考虑:,一 选择最佳函数误差公式,二 使误差传递系数等于零或为最小,52,第四章:测量不确定度,第四章 测量不确定度,第一节 测量不确定度的基本概念,第二节 标准不确定度的评定,第三节 测量不确定度的合成,第四节 测量不确定度应用实例,53,第四章:测量不确定度,测量不确定度(,uncertainty of measurement,)是测量结果,带有的一个参数,用于表征被测量值的分散性。,一个完整的测量结果,被测量的最佳估计值,分散性参数,第一节 测量不确定度的基本概念,以分布区间的半宽表示,因此它表示一个区间,,强调一个范围,。,A,类评定方法是采用,统计分析的方法评定标准不确定度,。,一、,A,类评定方法,第二节:标准不确定度的评定,二、,B,类评定方法,在很多情况下,我们不能用统计方法来评定,标准不确定度,,,利用其他,假设,经验或资料,(,本次测量以外的其他信息,),进行统计分析的,B,类评定方法 。,54,第三节:测量不确定度的合成,一、合成标准不确定度(,combined standard uncertainty,),当测量结果受多种因素影响形成了若干个,不确定度分量,时,测量结果的标准不确定度就用这些分量合成后的合成标准不确定度 表示。,一般用下式表示:,一般用下式表示:,其中,,第,i,个标准不确定度的分量,第,i,个和第,j,个标准不确定度分量之间的相关系数,不确定度分量的个数,55,二、展伸不确定度(,expanded uncertainty,),也称为扩展不确定度或范围不确定度。用符号 或 表示。,展伸不确定度由,合成标准不确定度,乘以,包含因子,得到,即,用展伸不确定度作为测量不确定度,则测量结果表示为 :,三、不确定度的报告,56,第四章:测量不确定度,第五章 线性参数的最小二乘法,第一节 最小二乘法的原理,第二节 正规方程,第三节 精度估计,第四节 组合测量的最小二乘法处理,57,第一节最小二乘法原理,最小二乘法的产生是为了解决从一组测量值中寻找最可信赖值的问题。,对某量进行测量,得到一组数据 ,不存在系统误差和粗大误差,相互独立,且服从正态分布,其标准差为,测得值落入 的概率,58,测得值 同时出现的概率为,最可信赖值满足,权因子,最小二乘法原理,虽然是在正态分布下导出最小二乘法,实际上,按误差或残差平方和为最小进行统计推断已形成一种准则。,59,第二节、正规方程组,60,线性测量方程组,线性测量方程组的一般形式为,测量残差方程组,含有随机误差,矩阵形式,61,最小二乘法原理式,求导,正规方程组,正规方程组解,不等权,正规方程组,62,三、标准差的估计,1、直接测量结果的标准差估计,(加权),未知量个数,方程个数,残差,2、待求量的标准差估计,直接测量量的标准差,对角元素,误差传播系数,3、待求量与的相关系数,元素,63,【例,5-,】,为精密测定1号、2号和3号电容器的电容量,进行了等权、独立、无系统误差的测量。测得1号电容值,2号电容值,1号和3号并联电容值,2号和3号并联电容值。试用最小二乘法求及其标准偏差。,【解】,列出测量残差方程组,矩阵形式,64,正规方程组,65,正规方程组解,即,66,标准差的计算,代入残差方程组,计算,67,第三节非线性参数的最小二乘法,测量残差方程组,非线性函数,取的初始似值,泰勒展开,按线性参数最小二乘法解得,迭代直至满足精度为止,68,第四节组合测量问题应用举例,69,【例,5-3】,要求检定丝纹尺0,1,2,3刻线间的距离。已知用组合测量法测得图所示刻线间隙的各种组合量。试用最小二乘法求及其标准偏差。,70,计算步骤,【解】,列出测量残差方程组,71,解出,即,计算结果,72,代入残差方程组可得,估计的标准差,估计的标准差,73,第四章:测量不确定度,第六章,回 归 分 析,第一节,回归分析的基本概念,第二节,一元,线,性,回,归,第三节,两个变量都具有误差映射时线性回归方程的确定,第四节,一元非线性回归,第五节,多,元,线,性,回,归,74,第一节,回归分析的基本概念,1.1,函数关系与相关关系,(,1,)函数关系:能用数学表达式明确变量之间的内在联系和规律的相互关系,即函数关系。,(,2,)相关关系:在实际问题中,影响变量之间的因素实际上是千差万别的,不能简单地决定只由一个或几个影响因数所产生,只能预测估计变量之间的关系,并存在于某一范围之内,这样的变量关系称为相关关系,有时称为“黑箱问题”。如:测量结果的估计值与误差。,应该指出,变量之间的函数关系和相关关系并没有严格的界限。实际上由于误差的存在,确定性的关系往往通过相关关系表现出来,并存在一定的不确定变量因素(如:误差),它通常要用实验方法才能确定。,75,1.2,回归分析的主要内容,回归分析:是处理变量之间相关关系的一种数理统计方法,是将相关变量之间由生产实践和科学实验得到的变量数据,应用数学方法对大量的实验和观察数据进行处理,从而得到比较符合事物内部变量之间的内部规律的数学表达式的方法,。,它所涉及到的主要内容如下:,(,1,)从一组数据出发,确定变量之间的数学表达式,回归方程或经验公式。,(,2,)对回归方程的可信度进行统计检验。,(,3,)进行因素分析,找出变量之间相互联系或关联的重要因素和次要因素。,76,第二节一元 线 性 回 归,一元回归方法:,是通过实验,分析所得到的实验数据,找出两个变量之间的内在相关关系,经验公式。,一元线性回归方法:,是找到两个变量之间,满足线性规律,的一元回归方法。,6.2.1,一元线性回归方程,(,1,)回归方程的求法(,假设,x,无测量误差,误差全在,y,方向存在,),假设两变量之间一组测量数据,y,、,x,满足如下,线性形式,或,线性数学模型,:,y,t,=,0,+,x,t,+,t,(t=1, 2, , N),式中:,0,,,为常数或线性系数。,t,分别表示其他随机因素影响,的总和,是一组相互独立,并满足,正态分布,N,(,0,)的随机变量。,x,t,是一组可以精确测量或严格,控制的变量。可是随机变量,也可,是一般变量。,77,(,2,)回归方程显著性检验,F,检验法,检测,x,与,y,的线性关系是否密切,它取决与回归平方和,U,、残余误差平方和,Q,的大小,,U,越大,Q,越小,则,x,与,y,的线性关系是越密切。通常用,F,检验法进行计量。,计算结果,F,越大,,x,与,y,的线性关系是越密切,回归方程显著性越大,。,一元回归的,F,检验法结果:,(,3,)残余方差与残余标准差,残余方差,:参与平方和,Q,除以它的自由度,v,Q,所得的商,2,,是衡量回归方程,y,随机波动量的估计值。,(一元回归方程: ),78,2.3,重复试验情况,用残余误差平方和检验回归方程所做出的“回归方程显著性判断”,只表明相对于其他因素而言,因素,x,的一次项对,y,的影响是主要的,而未告诉是否存在一个或多个其他因素对一次项对,y,的影响程度,从而,无法肯定的表明,y,和,x,之间确实为线性关系,。,为了检验一个回归方程是否拟合正确并满足线性条件,可做一些重复性试验,获得误差平方和,Q,E,和失拟平方和,Q,L,,同样采用,F,检验法来检验,y,和,x,之间确实为线性关系,。,重复试验的,F,检验法,的具体计算方法和过程,再此不作详细的讲解(略)。,2.4,回归直线的简便求法,回归分析是以最小二乘法原理为基础,具有所建立的回归直线误差的平方和最小,但是计算相对比较复杂和烦琐。有时在精度要求不高或试验所得的数据线性性较好,这时为了简化计算,可采用下述的简便方法计算回归直线。,79,(,1,)分组法(平均值法),将所测量到的自变量数据(,x,,,y,)分成相等或相近的两组数据(,x,i,,,y,i,)和(,x,j,,,y,j,),分别求出两组数据的算术平均值,( ),、( ),带入回归线性直线方程,=,b,0,+,bx,得以,b,0,、,b,为未知量的方程组:,解这方程组,得到,b,0,、,b,并带回回归线性直线方程,=,b,0,+,bx,t,,便得到该测量结果的线性直线回归方程。,(,2,)图表法,把测量组的,N,对观察数据在坐标纸上绘出离散点图,在点群之间绘一条直线,使点群的绝大多数点在直线上或接近此直线并均匀分布在直线的两边,便近似地得到测量组的回归直线的简便方法。,80,第三节 两个变量都具有误差映射时线性回归方程的确定,6.3.1,问题的提出与求解思维方法,(,1,)问题的提出,前面应用最小二乘法原理求得的线性回归方程,是在假设,x,方向没有误差或存在误差可以忽略不计的条件下,所有误差都归结在,y,方向而得到的。然而,x,的测量值存在误差、,y,的测量值也存在误差,哪如何才能获得,x,、,y,之间的线性回归方程呢?,(,2,)求解思维方法:, 一组测量数据,x,、,y,,假设,x,方向没有误差或存在误差可以忽略不计的条件下,所有误差都归结在,y,方向,按最小二乘法原理,使,的平方和最小,求得特定参数,b,0,、,b,,得到线性回归方程。,=,b,0,+,bx,81,用同一组测量数据,x,、,y,,又假设,y,方向没有误差或存在误差可以忽略不计的条件下,所有误差都归结在,x,方向,按最小二乘法原理,使 的平方和最小,求得特定参数,a,0,、,a,,得到,线性回归方程,并转换成 形式的回归直线方程。, 求解两直线方程 、 锐角的某一直线方程,即为测量数据,x,、,y,两个方向均存在测量误差的线性直线回归方程,并存在下面四种形式:,x,方向没有误差或存在误差可以忽略不计的条件下,所有误差都归结在,y,方向,测量数据的线性直线回归方程为 。,y,方向没有误差或存在误差可以忽略不计的条件下,所有误差都归结在,x,方向,测量数据的线性直线回归方程为 。,82,x,方向和,y,方向存在的误差大体相当,则可计算两直线方程,、 锐角的角平分线方程 为测量数据的线性直线回归方程,。,如果测量数据,x,、,y,两个变量中,一个变量存在的测量误差比另一个变量存在的测量误差大,则在两直线方程 、 锐角范围内求得的线性直线方程应偏向于误差大的方向,具体偏向多少,应依据测量数据,x,、,y,两个方向的误差分配比例而定。,注意:,随着两个变量线性相关性的加强,相关系数越接近于,1,,两条直线 、 越接近;当相关系数为,1,时,两条直线重合,。,83,6.3.2,回归方程的求法,两个变量都存在误差时,比较精确的计算回归方程式回归系数的方法通常采用戴明解法(,Deming,)。,若测量数据组,x,t,,,y,t,分别存在误差,t,N,(0,x,),,,t,N,(0,y,),,,t,= 1,2,3,,假设,x,,,y,之间存在线性关系,并具有下面的数学模型:,y,t,=,0,+,(,x,t,t,),+,t,所求的回归方程为:,其中,的 、 、,b,0,、,b,分别为,x,、,y,、,0,、,的估计值,为使,x,、,y,的 误差在求回归方程式具有等价性,令 , ,,可写成:,其中,: 、 。,依据戴明(,Deming,)推广的最小二乘法原理,点(,x,t,,,y,t,)到回归直线 的距离,d,t,的平方和 为最小条件计算回归系数,b,0,、,b,的最佳估计值。,84,由点(,x,t,,,y,t,)到回归直线的距离公式,经整理得距离,d,t,为:,d,t,=,y,t,b,o,bx,t,依据最小二乘法原理,为使 最小,求解:,;,计算得到:,从而可得到,x,方向和,y,方向均存在误差的线性回归方程:,由此可得到,x,、,y,的方差估计值:,85,第四节,一元非线性回归,在实际测量问题中,两个变量之间的关系并不是都满足线性关系,可能是某种曲线关系,即:一元非线性关系。要获得这种非线性关系,通常按下面的步骤进行。, 确定函数类型。, 求解该相关函数中的未知参数。通常直接应用最小二乘法原理求出非线性回归方程中的未知参数是非常困难的,一般情况下可采用如下两种方法进行。,通过变量替换将非线性函数转换成线性函数,用线性回归方程的求解方法求出转换后线性函数的回归方程,在通过变量反变换求出非线性函数的回归方程。,将非线性回归曲线方程,应用泰勒级数展开成回归多项式来描述两个变量之间的关系,把求解曲线回归问题转化成求解多项式回归问题。,86,6.4.1,回归曲线函数类型的选取和检验,(,1,)直接判断方法,根据检测对象的特点和相关专业知识,从理论上推导并结合以前处理相近问题的成功经验,确定两个变量之间的函数类型。如化学反映,。,(,2,)观察方法,将测量观察得到的数据作图,并与典型曲线(书上图,6-6,)进行比较,确定属于哪一类函数曲线,再将所选定的函数曲线类型用下述方法进行检验。,(,3,)直线检验方法,当待检验的函数类型中,所含参数不多时,应用此方法检验效果较好。其步骤如下:, 将预选的回归曲线方程,f,(,x,y,a,b,)= 0,写成:,Z,1,=,A,+,BZ,2,式中:,Z,1,和,Z,2,是只含一个变量(,x,或,y,)的函数,,A,和,B,是,a,和,b,的函数。, 求出几对与,x,、,y,相对应的,Z,1,和,Z,2,值,这几对值与选择,x,、,y,值相距较远为好。, 以,Z,1,和,Z,2,为变量画图,如果所得图形为直线,则证明原先所选定的回归曲线类型是适合的。,87,(,4,)表差方法,如果一组试验数据可用,1,多项式表示,式中含有常数的项多于两个时,可以用表差方法决定回归曲线方程的次数或检验回归方程的次数较为合理。,步骤如下:, 用试验数据绘图。, 观察试验数据,初步确定试验数据可选函数类型方程,(,见表,6-10),。, 自图上根据定差,x,,列出,x,i,,,y,i,各对应值。, 根据,x,y,的读出值,计算差值:,为第一阶差;,为第二阶差;,为第三阶差;, 当方程式的标差(书上表,6-10,)为常数时,便可决定所选函数类型方程。,88,6.4.2,化曲线回归问题为直线回归问题,前面所讲到的可用直线检验法或一阶表差法检验的曲线回归方程,都可以通过变量代换转化为直线回归方程,并利用直线回归方程式的确定方法确定研究对象测量数据的回归方程。,具体方法:结合例题,6-9,和作业加以消化。,6.4.3,回归曲线方程的效果与精度,求解回归方程的目的在于使所配的曲线与观察数据拟合得更好。,因此,在计算回归曲线的剩余平方和,Q,时,不能用和以及,(,Q,= =,S,U=l,yy,b l,xy,)来计算,只能按定义用,y,t,/,和 、定义公式,Q,=,计算。,(,1,)回归曲线方程的效果。一般用相关指数,R,2,(,R,也称相关系数)作为衡量配后曲线的好坏:,89,第五节,多 元 线 性 回 归,在实际工程和科学实验的许多问题中,多变量之间的试验结果、数学分析与表示问题,可归结为多元回归问题。,6.5.1,多元线性回归方程,一个因变量,y,与,M,个自变量(,x,1,x,2,x,M,)之间存在内在的线性关系,通过试验得到,N,组观察数据:(,x,t1,x,t2,x,tM,)。,其中:,t,= 1,2,N,。,由,N,组观察数据确定的线性方程组的,结构形式,或,数学模型,为,:,式中:,1,2,3, ,M,是,M+1,个待估计参数,; (,x,1,x,2, ,x,M,),是,M,个可以精确测量或控制的一般变量;(,1,2, ,M,)是,N,个相互独立并服从正态分布的随机变量。,90,用矩阵表示,令:,Y =,;,X =,;, =,;, =,;,则有多元回归的矩阵表达形式:,Y = X+,仍用最小二乘法的估计参数,b,0, b,1, , b,M,作为参数,1,2,3, ,M,的估计值,则有回归方程为:,依据最小二乘法的原理,全部观察值,y,t,与回归值,t,的残余误差平方和最小。,有:,Q,= = =,最小,对于给定的,N,组观察数据,,Q,是,b,0,、,b,1,,,,,b,M,的非负,二次式,最小值一定存在,,b,0,、,b,1,,,,,b,M,应为下列方程组的解:,91,经整理,并写成矩阵形式:,(X,T,X)b = X,T,Y,或,Ab = X,T,Y,式中:,A=X,T,X,(,6-43,),解(,6-43,)式,得回归方程的估计回归系数,b,:,b = A,-1,(X,T,Y ) = (X,T,X),-1,X,T,Y,(,6-44,),令:,C = A,-1,= (X,T,X),-1,有:,b = CX,T,Y,(,6-45,),对于处理多元线性回归问题,与处理一元回归问题相似,这里不进行过多的讨论,。,92,6.5.2,多元线性回归方程的显著性和精度,一个多元线性回归方程是否更真实反映因变量与自变量之间的客观规律,效果如何,主要靠实践检验。从数学的角度出发,与一元线性回归相似,也可用相应的数理统计的方法进行检验。主要依据是,y,的总离差平方和,S,,回归平方和,U,和残余误差平方和,Q,的计算结果、以及相应的自由度,M,,所具有的,F,检验法计算结果来判定多元线性回归方程的显著特性。计算与,F,检验法判定如书上表,6-18,。,F,检验法的数学统计量计算:,同理,多元线性回归方程的预报精度由残余标准差来估计。,93,6.5.3,每个自变量在多元线性回归中所起的作用,在多元回归方程中,并不是所有的自变量对因变量的影响都是显著的或重要的。在研究实际问题时,我们期望观察和认识到哪些对因变量影响起主要作用的因素,尽可能的去除哪些起次要作用或可有可无的因素,从而进一步简化线性回归方程,利于我们对检测结果的预报和控制。,如何观察和认识某一特定自变量因素在总回归方程中起的作用呢?我们可以利用减少或去掉某一自变量因素或某一部分自变量因素,观察回归平方和,U,的减少量多少,即取消一个自变量后,回归平方和的减少的数值称为,y,对这个自变量,x,i,的偏回归平方和,P,i,(,P,i,=,U,-,U,),,P,i,可用来评价该自变量因素或该部分自变量因素对因变量的影响程度或重要程度。,在通常情况下,要直接按定义式(,P,i,=,U,-,U,)来计算偏回归平方和,P,i,是困难的,可以证明,P,i,可按下式计算:,P,i,= b,i,2,/C,ii,C,i,取消自变量前原回归方程系数矩阵,A,或,L,的逆矩阵,C,或,L,-1,中的相应元素。,b,i,现回归方程的回归系数。,94,但是由于回归方程中各自变量之间可能有着密切关系,即使,P,i,较小,也不能直接判定自变量对因变量的作用较小,还得用下面的,F,检验法作进一步的检验,具体方法如下:, 凡是偏回归平方和,P,i,大的自变量,x,i,,一定对因变量的影响起重要作用显著;对于偏回归平方和,P,i,大到什么程度,才影响显著,可对残余平方和,Q,进行,F,检验法检验:,当,F,i,F,a,时,则认为自变量,x,i,对因变量,y,的影响在,a,水平上显著,即,回归系数检验,方法。, 对于偏回归平方和,P,i,小的自变量,x,i,,并不意味着对因变量,y,的影响就不显著,但可以肯定所有偏回归平方和,P,i,最小的自变量,x,i,,对因变量,y,的影响最小,假如用,F,检验法检验对该自变量检验结果表明又不显著,则就可以将该自变量剔除,得到新的,M-1,元回归方程。, 在新的,M-1,元回归方程基础上,又重新进行上述步,看是否存在对因变量,y,的影响最小的自变量,x,i,,若存在则将其剔除;若不存在则所得到的,M-n,元回归方程为简化后的线性回归方程。,95,但是,上述的简化过程在建立新的回归方程中,存在大量的重复计算。因此,若能找到新老回归系数之间的关系,将大大简化计算。可以证明,在剔除某一自变量,xi,前后,,M-1,个自变量的新回归系数与,M,个自变量的原回归系数之间存在如下关系:,式中:,cii,,,cij ,为原,M,元回归方程相关矩阵中的元素。,例题,6-14,:,。,96,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!