误差理论与数据处理培训课程课件

资源描述

22 七月 2024误差理论与数据处理培误差理论与数据处理培训课程训课程课程目的正确认识误差的性质，分析误差产生的原因减小或抑制误差正确处理实验数据，合理计算所得结果给出科学可信的实验结果正确组织实验过程，合理设计、选用仪器或测量方法根据目标确定最佳方案先修课程：先修课程：线性代数、概率论和数理统计、电路线性代数、概率论和数理统计、电路线性代数、概率论和数理统计、电路线性代数、概率论和数理统计、电路理论、电子电工实验等理论、电子电工实验等理论、电子电工实验等理论、电子电工实验等.课程目标：课程目标：对误差理论体系有一个全面的把握；掌握误对误差理论体系有一个全面的把握；掌握误对误差理论体系有一个全面的把握；掌握误对误差理论体系有一个全面的把握；掌握误差的概念、性质及分类方法；通过对固定量测量数差的概念、性质及分类方法；通过对固定量测量数差的概念、性质及分类方法；通过对固定量测量数差的概念、性质及分类方法；通过对固定量测量数据的处理学习误差处理的基本方法；能利用最小二据的处理学习误差处理的基本方法；能利用最小二据的处理学习误差处理的基本方法；能利用最小二据的处理学习误差处理的基本方法；能利用最小二乘法进行参数估计。掌握线性回归方法处理测量数乘法进行参数估计。掌握线性回归方法处理测量数乘法进行参数估计。掌握线性回归方法处理测量数乘法进行参数估计。掌握线性回归方法处理测量数据；能将以上理论运用于具体测量实践。据；能将以上理论运用于具体测量实践。据；能将以上理论运用于具体测量实践。据；能将以上理论运用于具体测量实践。教材教材误差理论与数据处理（第误差理论与数据处理（第误差理论与数据处理（第误差理论与数据处理（第6 6 6 6版）版）版）版）费业泰等费业泰等费业泰等费业泰等机械工业出版机械工业出版机械工业出版机械工业出版社社社社门捷列夫门捷列夫(1834-1907)(1834-1907)科学始于测量,没有测量，便没有精密的科学。门捷列夫门捷列夫研究误差的意义研究误差的意义钱学森钱学森信息技术包括测量信息技术包括测量技术、计算机技术技术、计算机技术和通信技术，测量和通信技术，测量技术是信息技术的技术是信息技术的关键和基础。关键和基础。钱学森钱学森(1911-)(1911-)研究误差的意义研究误差的意义第一章绪论1、研究误差的意义2、误差的基本概念3、误差与精度4、有效数字与数据运算第一章绪论第一节研究误差的意义第二节误差的基本概念误差的定义误差的分类误差的来源误差误差绝对绝对误差误差相对相对误差误差粗大粗大误差误差系统系统误差误差随机随机误差误差表示形式性质特点误差误差测得值测得值真值真值一、误差的定义及表示法引用误差引用误差（Fiducial Error of a Measuring Instrument）定义定义该标称范围（或量程）上限该标称范围（或量程）上限最大引用误差最大引用误差仪器某标称刻度值处的仪器某标称刻度值处的绝对误差绝对误差引用误差是一种相对误差，而且该相对误差是引用了特定值，又称为引用相对误差。最大引用误差：引用标称范围上限（或量程）得到的，故该误差又满度误差。最大引用误差：被用来确定仪表的等级精度仪器标称范围（或量程）仪器标称范围（或量程）内的最大绝对误差内的最大绝对误差主要来源测量方法测量方法误差误差测量装置测量装置误差误差测量环境测量环境误差误差测量人员测量人员误差误差二、误差的来源二、误差的来源误差的起因:测量过程中，由于实验方法和实验设备的不完善，周围环境的影响，人们认识能力所限，实验所得数据和被测量的真值之间存在差异。三、误差分类系统误差系统误差（Systematic ErrorSystematic Error）在重复性条件下，对同一被测量进行无限多次测量所得结果的平均值与被测量的真值之差。定义定义特征特征在相同条件下，多次测量同一量值时，该误差的绝对值和符号保持不变，或者在条件改变时，按某一确定规律变化的误差。按对误差掌握程度，系统误差可分为按对误差掌握程度，系统误差可分为误差绝对值和符号已经误差绝对值和符号已经明确明确的系统误差。的系统误差。已定系统误差：已定系统误差：例：例：直尺的刻度值误差误差绝对值和符号未能确定的系统误差，误差绝对值和符号未能确定的系统误差，但通常估计出误差范围。但通常估计出误差范围。未定系统误差：未定系统误差：按误差出现规律，系统误差可分为按误差出现规律，系统误差可分为误差绝对值和符号固定不变固定不变的系统误差。不变系统误差：不变系统误差：误差绝对值和符号变化的系统误差。按其变化规律，可分为线性系统误差、周期性系统误差和复杂规律系统误差。变化系统误差：变化系统误差：随机误差（随机误差（Random Error）测得值测得值与在重复性条件下对同一被测量进行无限与在重复性条件下对同一被测量进行无限多次测量结果的多次测量结果的平均值之差平均值之差。又称为偶然误差。又称为偶然误差。定义定义特征特征在相同测量条件下，多次测量同一量值时，在相同测量条件下，多次测量同一量值时，绝对值和符号以不可预定方式变化的误差。绝对值和符号以不可预定方式变化的误差。产生原因产生原因实验条件的偶然性微小变化，如温度波动、噪实验条件的偶然性微小变化，如温度波动、噪声干扰、电磁场微变、电源电压的随机起伏、声干扰、电磁场微变、电源电压的随机起伏、地面振动等。地面振动等。随机误差的大小、方向均随机不定，不可预见，不可修正。大量的重复测量可以发现，它是遵循某种统计规律的。因此，可以用概率统计的方法处理含有随机误差的数据，对随机误差的总体大小及分布做出估计，并采取适当措施减小随机误差对测量结果的影响。随机误差的性质随机误差的性质粗大误差（粗大误差（Gross ErrorGross Error）指明显超出统计规律预期值的误差。又称为疏忽误差、过失误差或简称粗差。定义定义产生原因产生原因某些偶尔突发性的异常因素或疏忽所致。测量方法不当或错误，测量操作疏忽和失误（如未按规程操作、读错读数或单位、记录或计算错误等）测量条件的突然变化（如电源电压突然增高或降低、雷电干扰、机械冲击和振动等）。由于该误差很大，明显歪曲了测量结果。故应按照一定的准则进行判别，将含有粗大误差的测量数据（称为坏值或异常值）予以剔除。三类误差的关系及其对测得值的影响三类误差的关系及其对测得值的影响标准差标准差期望值期望值均值均值某次测得值某次测得值奇异值奇异值系统误差和随机误差的定义是科学严谨，不能混淆的。但在测量实践中，由于误差划分的人为性和条件性，使得他们并不是一成不变的，在一定条件下可以相互转化。也就是说一个具体误差究竟属于哪一类，应根据所考察的实际问题和具体条件，经分析和实验后确定。第三节误差与精度第三节误差与精度测量结果中系统误差的影响程度准确度准确度（Correctness）测量结果中随机误差的影响程度精密度精密度（Precision）精确度精确度（Accuracy）表示测量结果与被测量真值之间的一致程度。就误差分析而言，精确度是测量结果中系统误差和随机误差的综合，误差大，则精确度低，误差小，则精确度高。精确度（精度）在数值上一般多用相对误差来表示，但不用百分数。如某一测量结果的相对误差为0.001%，则其精度为10-5。准确度、精密度和精确度三者之间的关系准确度、精密度和精确度三者之间的关系弹着点全部在靶上，但分散。相当于系统误差小而随机误差大，即精密度低，准确度高。弹着点集中，但偏向一方，命中率不高。相当于系统误差大而随机误差小，即精密度高，准确度低。弹着点集中靶心。相当于系统误差与随机误差均小，即精密度、准确度都高，从而精确度高。第四节有效数字与数据运算一、有效数字一、有效数字测量精度有限测量精度有限最末一位有效数字应与测量精度同一量级最末一位有效数字应与测量精度同一量级可靠数字可靠数字+一位存疑数字一位存疑数字=有效数字有效数字有效位数是该数中有效数字的个数。指从该数左方第一个有效位数是该数中有效数字的个数。指从该数左方第一个非零数字算起到最末一个数字（包括零）的个数，它不取非零数字算起到最末一个数字（包括零）的个数，它不取决于小数点的位置决于小数点的位置。例如：例如：3.14（3位）位）0.0032（2位）位）0.00320（3位）位）3.143.2 10-33.20 10-3正确表示：正确表示：（20.53 0.01）mm（20.534 0.042）mm二、数字舍入规则二、数字舍入规则计算和测量过程中，对很多位的近似数进行取舍时，应按照下述原则进行凑整：1.若舍去部分的数值，大于保留部分末位的半个单位，则末位数加1。2.若舍去部分的数值，小于保留部分末位的半个单位，则末位数减1。3.若舍去部分的数值，等于保留部分末位的半个单位，则末位凑成偶数，即当末位为偶数时则末位不变，当末位是奇数时则末位加1。三、数字运算规则三、数字运算规则 1.在近似数运算时，为了保证最后结果有尽可能高的精度，所有残余运算的数字，在有效数字后可多保留一维数字作为参考数字（或称为安全数字）。2.在近似数做加减运算时，各运算数据以小数位数最少的数据位数为准，其余各数据可多取一位小数，但最后结果应与小数位数最少的数据小数位相同。3.在近似数乘除运算时，各运算数据以有效位数最少的数据位数为准，其余各数据可多取一位有效数，但最后结果应与有效位数最少的数据位数相同。4.在近似数平方或开方运算时，近似数的选取与乘除运算相同。5.在对数运算时，n位有效数字的数据应该用n位对数表，或用（n+1）位对数表，以免损失精度。6.三角函数运算时，所取函数值的位数应随角度误差的减小而增多第二章误差的基本性质与处理第一节随机误差第二节系统误差第三节粗大误差第四节测量结果的数据处理实例21第一节随机误差一、随机误差产生的原因二、随机误差的分布及其特性三、算术平均值四、测量的标准差五、测量的极限误差六、不等精度测量七、随机误差的其他分布 22一.随机误差的产生原因误差的出现没有确定的规律统计规律二.正态分布23三.算术平均值设为n次测量所得的值，则算术平均值为：式中：第个测得值，1，2，n;的残余误差（简称残差）。随机误差：24正态分布的随机误差分布密度1.单次测量的标准差四.测量的标准差（Bessel公式）2.测量列算术平均值的标准差25五.测量的极限误差1.单次测量的极限误差t：置信系数；P:置信概率或置信水平2.算术平均值的极限误差261.权的概念各个测量结果的可靠程度六.不等精度测量2.权的确定方法最简单确定权的方法：按测量的次数确定权。前提：测量条件和测量水平皆相同。结论：每组测量结果的权与其相应的标准差平方成反比。27 3.加权算术平均值加权算术平均值4.单位权概念若将不等精度测量的各组测量结果皆乘以自身权数的平方根，此时得到的新值的权数就为1。28用代替代入等精度测量的公式得：加权算术平均值的标准差：等精度测量列的残余误差等精度测量列的测量结果已知各组测量结果的残余误差为：，将各组单位权化得：加权单次测量的标准差：5.加权算术平均值的标准差29七.随机误差的其他分布正态分布是随机误差最普遍的一种分布规律，但不是唯一的分布规律。几种常见的非正态分布：1.均匀分布2.反正弦分布3.三角形分布4.分布5.分布 6.分布30第二节系统误差随机误差处理方法的前提：测量数据中不含有系统误差实际情况：系统误差与随机误差同时存在研究系统误差的特征与规律性，找出产生系统误差的原因，提出减加或消除系统误差的方法给出科学结论一系统误差产生的原因二系统误差的特征三系统误差的发现四系统误差的减小和消除31 系统误差是有固定不变的或按确定规律变化的因素造成，这些因素是可以掌握的。测量装置方面的因素环境方面的因素测量方法的因素测量人员的因素计量校准后发现的偏差、仪器设计原理缺陷、仪器制造和安装的不正确等。测量时的实际温度对标准温度的偏差、测量过程中的温度、湿度按一定规律变化的误差等。采用近似的测量方法或计算公式引起的误差等。测量人员固有的测量习性引起的误差等。一系统误差产生的原因32二系统误差的特征在同一条件下，多次测量同一量值时，误差的绝对值和符号保持不变，或者在条件改变时，误差按一定规律变化。1 不变的系统误差2 线性变化的系统误差3 周期性变化的系统误差4 复杂规律变化的系统误差33三系统误差的发现34四系统误差的减小和消除（一）消误差源法（一）消误差源法（二）加修正值法（二）加修正值法（三）改进测量方法（三）改进测量方法（一）消误差源法：（一）消误差源法：所用基准件、标准件是否准确可靠；所用量具仪器是否处于正常工作状态，是否经过检定；仪器的调整、测件的安装定位和支承装卡是否正确合理；所采用的测量方法和计算方法是否正确，有无理论误差；测量的环境条件是否符合规定要求，如温度、振动、尘污、气流等；注意避免测量人员带入主观误差如视差、视力疲劳、注意力不集中等。（二）加修正值法（二）加修正值法35（三）改进测量方法（三）改进测量方法 1、消除恒定系统误差的方法抵消或反向补偿法丝杠与螺母间的配合间隙等因素引起的定回误差，往往采用往返两个方向的两次读数取均值作为测量结果代替法：代替法的实质是在测量装置上对被测量测量后不改变测量条件，立即用一个标准量代替被测量，测量差值被测量标准差差值交换法：这种方法是根据误差产生原因，将某些条件交换，以消除系统误差。362、消除线性系统误差的方法对称法例如测定量块平面平行性时（见例如测定量块平面平行性时（见图图2-20）,先以标准量块先以标准量块A的中心的中心0点对零，然后按图中所示被检点对零，然后按图中所示被检量块量块B上的顺序逐点检定，再按上的顺序逐点检定，再按相反顺序进行检定，取正反两次相反顺序进行检定，取正反两次读数的平均值作为各点的测得值，读数的平均值作为各点的测得值，就可消除因温度变化而产生的线就可消除因温度变化而产生的线性系统误差。性系统误差。373、消除周期性系统误差的方法半周期法38第三节粗大误差粗大误差的数值比较大，它会对测量结果产生明显的歪曲，一旦发现含有粗大误差的测量值，应将其从测量结果中剔除一粗大误差的产生原因1测量人员的主观原因2客观外界条件的原因二防止与消除粗大误差的方法1避免人为因素的影响，反复多次检查2尽量采用自动化数采系统3加强本底环境监测39三判别粗大误差的准则1 准则测量次数充分大若则可以认为它含有粗大误差2 t检验准则（罗曼诺夫斯基准则）当测量次数较少时，按 t 分布的实验误差分布范围来判别粗大误差较为合理.特点：首先剔除一个可疑的测量值，然后按t分布检验被剔除的测量值是否含有粗大误差.40第三章误差的合成与分配第一节函数误差第二节随机误差的合成第三节系统误差的合成第四节系统误差与随机误差的合成第五节误差分配第六节微小误差取舍准则第七节最佳测量方案的确定41 任何测量结果都包含有一定的测量误差，这是测量过程中各环节一系列误差因素共同作用的结果。正确分析与综合这些误差因素，并正确地表述这些误差的综合影响。第一节函数误差间接测量：通过直接测量与被测的量之间有一定函数关系的其他量，按照已知的函数关系式计算出被测量。间接测量误差是各直接测量值误差的函数，即函数误差。研究函数误差的实质就是研究误差的传递性的问题。对于这种有确定关系的误差的计算称为误差合成。42（函数系统误差公式）一.函数系统误差的计算第一节函数误差二.函数随机误差计算可得：该式即为函数随机误差公式，其中为第个测量值和第个测量值之间的误差相关系数,为各测量值的误差传递系数。43若各测量值的随机误差是相互独立的，且当N适当大时，有：则误差公式变为：令（较常使用）44三.误差间的相关关系和相关系数1.误差间的线性相关关系即线性依赖关系，有强弱之分。2.相关系数由相关系数定义知：式中：误差间的协方差；两误差的标准差。45第二节随机误差的合成一.标准差的合成二.极限误差的合成（较常使用）46一.已定系统误差的合成当时，有：二.未定系统误差当各单项未定系统误差均服从正态分布，且时，极限误差极限误差标准差标准差第三节系统误差的合成47第四节系统误差与随机误差的合成一、按极限误差合成设有r个单项已定系统误差 s个单项未定系统误差 q个单项随机误差假设误差传递系数均为1，则总极限误差为：各个误差间协方差之和48二按标准差合成s个未定系统误差标准差q个单项随机误差标准差误差传递系数均为1，且各个误差间协方差之和R为0对于多次重复测量：只考虑未定系统误差与随机误差合成问题49第五节误差分配单项误差总误差总误差的允差各个单项误差综合如：弓高弦长法测大直径D给定直径测量允许极限误差，求弓高h和弦长s的测量极限误差已定系统误差通过修正方法消除，则只考虑未定系统误差和随机误差，且这两种误差分配时可同等看待，分配方法完全相同。50第六节微小误差取舍准则微小误差：测量过程包含多种误差，有的误差对测量结果总误差影响较小，小到一定程度，计算测量结果总误差可不予考虑。取出部分误差若，则称为微小误差，可从总误差中舍去已知测量结果的标准差为：51第七节最佳测量方案的确定测量结果与多个测量因素有关，采用什么方法确定各个因素，使得测量结果的误差为最小，确定最佳测量方案。函数的标准差为使标准差为最小，确定最佳测量方案，从以下二方面考虑：一选择最佳函数误差公式二使误差传递系数等于零或为最小52第四章：测量不确定度第四章测量不确定度第一节测量不确定度的基本概念第二节标准不确定度的评定第三节测量不确定度的合成第四节测量不确定度应用实例53第四章：测量不确定度测量不确定度（uncertainty of measurement）是测量结果带有的一个参数，用于表征被测量值的分散性。一个完整的测量结果被测量的最佳估计值分散性参数第一节测量不确定度的基本概念以分布区间的半宽表示，因此它表示一个区间，强调一个范围。A类评定方法是采用统计分析的方法评定标准不确定度。一、A类评定方法第二节：标准不确定度的评定二、B类评定方法在很多情况下，我们不能用统计方法来评定标准不确定度，利用其他假设,经验或资料(本次测量以外的其他信息)进行统计分析的B类评定方法。54第三节：测量不确定度的合成一、合成标准不确定度（combined standard uncertainty）当测量结果受多种因素影响形成了若干个不确定度分量时，测量结果的标准不确定度就用这些分量合成后的合成标准不确定度表示。一般用下式表示：一般用下式表示：其中，第i个标准不确定度的分量第i个和第j个标准不确定度分量之间的相关系数不确定度分量的个数55二、展伸不确定度（expanded uncertainty）也称为扩展不确定度或范围不确定度。用符号或表示。展伸不确定度由合成标准不确定度乘以包含因子得到，即用展伸不确定度作为测量不确定度，则测量结果表示为：三、不确定度的报告56第四章：测量不确定度第五章线性参数的最小二乘法第一节最小二乘法的原理第二节正规方程第三节精度估计第四节组合测量的最小二乘法处理57第一节最小二乘法原理最小二乘法的产生是为了解决从一组测量值中寻找最可最小二乘法的产生是为了解决从一组测量值中寻找最可信赖值的问题。信赖值的问题。对某量进行测量，得到一组数据对某量进行测量，得到一组数据 ,不存在系统误不存在系统误差和粗大误差，相互独立，且服从正态分布差和粗大误差，相互独立，且服从正态分布,其标准差为其标准差为测得值落入测得值落入的概率的概率 58测得值测得值同时出现的概率为同时出现的概率为最可信赖值满足最可信赖值满足权因子权因子最小二乘法原理最小二乘法原理虽然是在正态分布下导出最小二乘法，实际上，按误差虽然是在正态分布下导出最小二乘法，实际上，按误差或残差平方和为最小进行统计推断已形成一种准则。或残差平方和为最小进行统计推断已形成一种准则。59第二节、正规方程组60线性测量方程组线性测量方程组线性测量方程组的一般形式为线性测量方程组的一般形式为测量残差方程组测量残差方程组含有随机误差含有随机误差矩阵形式矩阵形式61最小二乘法原理式最小二乘法原理式求导求导正规方程组正规方程组正规方程组解正规方程组解不等权不等权正规方程组正规方程组 62三、标准差的估计三、标准差的估计 1 1、直接测量结果的标准差估计、直接测量结果的标准差估计（加权）（加权）未知量个数未知量个数方程个数方程个数残差残差2 2、待求量的标准差估计、待求量的标准差估计直接测量量的标准差直接测量量的标准差对角元素对角元素误差传播系数误差传播系数 3 3、待求量与的相关系数、待求量与的相关系数元素元素63【例【例5-5-】为精密测定为精密测定1 1号、号、2 2号和号和3 3号电容器的电容量，进行号电容器的电容量，进行了等权、独立、无系统误差的测量。测得了等权、独立、无系统误差的测量。测得1 1号电容值，号电容值，2 2号电容值，号电容值，1 1号和号和3 3号并联电容值，号并联电容值，2 2号和号和3 3号号并联电容值。试用最小二乘法求及其标准并联电容值。试用最小二乘法求及其标准偏差。偏差。【解】【解】列出测量残差方程组列出测量残差方程组矩阵形式矩阵形式64正规方程组正规方程组 65正规方程组解正规方程组解即即66标准差的计算代入残差方程组，计算代入残差方程组，计算 67第三节非线性参数的最小二乘法测量残差方程组测量残差方程组非线性函数非线性函数取的初始似值取的初始似值泰勒展开泰勒展开按线性参数最小按线性参数最小二乘法解得二乘法解得迭代直迭代直至满至满足精度足精度为止为止68第四节组合测量问题应用举例69【例【例5-35-3】要求检定丝纹尺要求检定丝纹尺0 0，1 1，2 2，3 3刻线间的距离。已知刻线间的距离。已知用组合测量法测得图所示刻线间隙的各种组合量。试用最小用组合测量法测得图所示刻线间隙的各种组合量。试用最小二乘法求及其标准偏差。二乘法求及其标准偏差。70计算步骤【解】【解】列出测量残差方程组列出测量残差方程组 71解出解出即即计算结果计算结果72代入残差方程组可得代入残差方程组可得估计的标准差估计的标准差估计的标准差估计的标准差 73第四章：测量不确定度第六章回回归归分分析析第一节回归分析的基本概念回归分析的基本概念第二节一元一元线线性性回回归归第三节两个变量都具有误差映射时两个变量都具有误差映射时线性回归方程的确定线性回归方程的确定第四节一元非线性回归一元非线性回归第五节多多元元线线性性回回归归 74 第一节回归分析的基本概念1.1 函数关系与相关关系（1）函数关系：能用数学表达式明确变量之间的内在联系和规律的相互关系，即函数关系。（2）相关关系：在实际问题中，影响变量之间的因素实际上是千差万别的，不能简单地决定只由一个或几个影响因数所产生，只能预测估计变量之间的关系，并存在于某一范围之内，这样的变量关系称为相关关系，有时称为“黑箱问题”。如：测量结果的估计值与误差。应该指出，变量之间的函数关系和相关关系并没有严格的界限。实际上由于误差的存在，确定性的关系往往通过相关关系表现出来，并存在一定的不确定变量因素（如：误差），它通常要用实验方法才能确定。1.2 回归分析的主要内容回归分析：是处理变量之间相关关系的一种数理统计方法，是将相关变量之间由生产实践和科学实验得到的变量数据，应用数学方法对大量的实验和观察数据进行处理，从而得到比较符合事物内部变量之间的内部规律的数学表达式的方法。它所涉及到的主要内容如下：（1）从一组数据出发，确定变量之间的数学表达式回归方程或经验公式。（2）对回归方程的可信度进行统计检验。（3）进行因素分析，找出变量之间相互联系或关联的重要因素和次要因素。第二节一元线性回归一一元元回回归归方方法法：是是通通过过实实验验，分分析析所所得得到到的的实实验验数数据据，找找出出两两个个变变量量之之间间的的内内在在相相关关关关系系经经验验公公式式。一一元元线线性性回回归归方方法法：是是找找到两个变量之间到两个变量之间满足线性规律满足线性规律的一元回归方法。的一元回归方法。6.2.1 6.2.1 一元线性回归方程一元线性回归方程（1 1）回归方程的求法（）回归方程的求法（假设假设x x无测量误差，误差全在无测量误差，误差全在y y方向存在方向存在）假设两变量之间一组测量数据假设两变量之间一组测量数据 y y、x x 满足如下满足如下线性形式线性形式或或线性数线性数学模型学模型：y yt t=0 0+xxt t+t t (t=1,2,N)(t=1,2,N)式中：式中：0 0，为常数或线性系数。为常数或线性系数。t t 分别表示其他随机因素影响分别表示其他随机因素影响的总和，是一组相互独立，并满足的总和，是一组相互独立，并满足正态分布正态分布N N（0,0,）的随机变量。）的随机变量。x xt t 是一组可以精确测量或严格是一组可以精确测量或严格控制的变量。可是随机变量，也可控制的变量。可是随机变量，也可是一般变量。是一般变量。（2）回归方程显著性检验）回归方程显著性检验 F 检验法检验法检测检测 x 与与 y 的线性关系是否密切，它取决与回归平方和的线性关系是否密切，它取决与回归平方和U、残余误、残余误差平方和差平方和Q的大小，的大小，U越大越大Q越小，则越小，则 x 与与 y 的线性关系是越密切。的线性关系是越密切。通常用通常用 F 检验法进行计量。检验法进行计量。计算结果计算结果 F 越大，越大，x 与与 y 的线性关系是越密切，回归方程显著性越大的线性关系是越密切，回归方程显著性越大。一元回归的一元回归的 F 检验法结果：检验法结果：（3）残余方差与残余标准差）残余方差与残余标准差残余方差残余方差：参与平方和：参与平方和Q除以它的自由度除以它的自由度vQ所得的商所得的商2，是衡量，是衡量回归方程回归方程 y 随机波动量的估计值。随机波动量的估计值。（一元回归方程：（一元回归方程：）2.3 重复试验情况重复试验情况用用残残余余误误差差平平方方和和检检验验回回归归方方程程所所做做出出的的“回回归归方方程程显显著著性性判判断断”，只只表表明明相相对对于于其其他他因因素素而而言言，因因素素 x 的的一一次次项项对对 y 的的影影响响是是主主要要的的，而而未未告告诉诉是是否否存存在在一一个个或或多多个个其其他他因因素素对对一一次次项项对对 y 的的影影响响程程度，从而度，从而无法肯定的表明无法肯定的表明 y 和和 x 之间确实为线性关系之间确实为线性关系。为了检验一个回归方程是否拟合正确并满足线性条件，可做一些为了检验一个回归方程是否拟合正确并满足线性条件，可做一些重复性试验，获得误差平方和重复性试验，获得误差平方和QE和失拟平方和和失拟平方和QL，同样采用，同样采用F 检验检验法来检验法来检验y 和和 x 之间确实为线性关系之间确实为线性关系。重复试验的重复试验的F 检验法检验法的具体计算方法和过程，再此不作详细的讲的具体计算方法和过程，再此不作详细的讲解（略）。解（略）。2.4 回归直线的简便求法回归直线的简便求法回回归归分分析析是是以以最最小小二二乘乘法法原原理理为为基基础础，具具有有所所建建立立的的回回归归直直线线误误差差的的平平方方和和最最小小，但但是是计计算算相相对对比比较较复复杂杂和和烦烦琐琐。有有时时在在精精度度要要求求不不高高或或试试验验所所得得的的数数据据线线性性性性较较好好，这这时时为为了了简简化化计计算算，可可采采用用下下述的简便方法计算回归直线。述的简便方法计算回归直线。（1）分组法（平均值法）分组法（平均值法）将将所所测测量量到到的的自自变变量量数数据据（x，y）分分成成相相等等或或相相近近的的两两组组数数据据（xi，yi）和和（xj，yj），分分别别求求出出两两组组数数据据的的算算术术平平均均值值()、（），带带入入回回归归线线性性直直线线方方程程 =b0+bx 得得以以b0、b为为未未知知量量的的方方程程组：组：解解这这方方程程组组，得得到到b0、b并并带带回回回回归归线线性性直直线线方方程程 =b0+bxt，便便得到该测量结果的线性直线回归方程。得到该测量结果的线性直线回归方程。（2）图表法）图表法把测量组的把测量组的 N 对观察数据在坐标纸上绘出离散点图，在点群之对观察数据在坐标纸上绘出离散点图，在点群之间绘一条直线，使点群的绝大多数点在直线上或接近此直线并均匀间绘一条直线，使点群的绝大多数点在直线上或接近此直线并均匀分布在直线的两边，便近似地得到测量组的回归直线的简便方法。分布在直线的两边，便近似地得到测量组的回归直线的简便方法。第三节两个变量都具有误差映射时线性回归方程的确定 6.3.1 问题的提出与求解思维方法问题的提出与求解思维方法（1）问题的提出）问题的提出前前面面应应用用最最小小二二乘乘法法原原理理求求得得的的线线性性回回归归方方程程，是是在在假假设设x方方向向没没有有误误差差或或存存在在误误差差可可以以忽忽略略不不计计的的条条件件下下，所所有有误误差差都都归归结结在在y方方向向而而得得到到的的。然然而而x的的测测量量值值存存在在误误差差、y的的测测量量值值也也存存在在误误差差，哪如何才能获得哪如何才能获得x、y之间的线性回归方程呢？之间的线性回归方程呢？（2）求解思维方法：）求解思维方法：一组测量数据一组测量数据x、y，假设，假设x方向没有误差或存在误差可以忽略方向没有误差或存在误差可以忽略不计的条件下，所有误差都归结在不计的条件下，所有误差都归结在y方向，按最小二乘法原理，使方向，按最小二乘法原理，使的平方和最小，求得特定参数的平方和最小，求得特定参数b0、b，得到线性回归方程。，得到线性回归方程。=b0+bx 用用同同一一组组测测量量数数据据x、y，又又假假设设y方方向向没没有有误误差差或或存存在在误误差差可可以以忽忽略略不不计计的的条条件件下下，所所有有误误差差都都归归结结在在x方方向向，按按最最小小二二乘乘法法原原理理，使使的平方和最小，求得特定参数的平方和最小，求得特定参数a0、a，得到，得到线性回归方程，并转换成线性回归方程，并转换成形式的回归直线方程。形式的回归直线方程。求求解解两两直直线线方方程程、锐锐角角的的某某一一直直线线方方程程即即为为测测量量数数据据x、y两两个个方方向向均均存存在在测测量量误误差差的的线线性性直直线线回归方程，并存在下面四种形式：回归方程，并存在下面四种形式：x方方向向没没有有误误差差或或存存在在误误差差可可以以忽忽略略不不计计的的条条件件下下，所所有有误误差差都都归归结在结在y方向，测量数据的线性直线回归方程为方向，测量数据的线性直线回归方程为。y方方向向没没有有误误差差或或存存在在误误差差可可以以忽忽略略不不计计的的条条件件下下，所所有有误误差差都都归归结在结在x方向，测量数据的线性直线回归方程为方向，测量数据的线性直线回归方程为。x方向和方向和y方向存在的误差大体相当，则可计算两直线方程方向存在的误差大体相当，则可计算两直线方程、锐角的角平分线方程锐角的角平分线方程为测量数据的线性直线为测量数据的线性直线回归方程回归方程。如果测量数据如果测量数据x、y两个变量中，一个变量存在的测量误差比另一个两个变量中，一个变量存在的测量误差比另一个变量存在的测量误差大，则在两直线方程变量存在的测量误差大，则在两直线方程、锐角锐角范围内求得的线性直线方程应偏向于误差大的方向，具体偏向多少，范围内求得的线性直线方程应偏向于误差大的方向，具体偏向多少，应依据测量数据应依据测量数据x、y两个方向的误差分配比例而定。两个方向的误差分配比例而定。注意：注意：随着两个变量线性相关性的加强，相关系数越接近于随着两个变量线性相关性的加强，相关系数越接近于1 1，两，两条直线条直线、越接近；当相关系数为越接近；当相关系数为1 1时，两条直线重合时，两条直线重合。6.3.2 回归方程的求法回归方程的求法两两个个变变量量都都存存在在误误差差时时，比比较较精精确确的的计计算算回回归归方方程程式式回回归归系系数数的的方法通常采用戴明解法（方法通常采用戴明解法（Deming）。）。若若测测量量数数据据组组xt，yt分分别别存存在在误误差差t N(0,x)，t N(0,y)，t=1,2,3,，假设，假设x，y之间存在线性关系，并具有下面的数学模型：之间存在线性关系，并具有下面的数学模型：yt=0+(xtt)+t 所求的回归方程为：所求的回归方程为：其其中中的的、b0、b 分分别别为为x、y、0、的的估估计计值值，为为使使x、y的的误差在求回归方程式具有等价性，令误差在求回归方程式具有等价性，令，可写成：可写成：其中其中：、。依依据据戴戴明明（Deming）推推广广的的最最小小二二乘乘法法原原理理，点点（xt，yt）到到回回归归直直线线的的距距离离 dt的的平平方方和和为为最最小小条条件件计计算算回回归归系数系数b0、b 的最佳估计值。的最佳估计值。由点（由点（xt，yt）到回归直线的距离公式，经整理得距离）到回归直线的距离公式，经整理得距离dt为：为：dt=yt bo bxt 依据最小二乘法原理，为使依据最小二乘法原理，为使最小，求解：最小，求解：；计算得到：计算得到：从而可得到从而可得到x方向和方向和y方向均存在误差的线性回归方程：方向均存在误差的线性回归方程：由此可得到由此可得到x、y的方差估计值：的方差估计值：,第四节一元非线性回归在在实实际际测测量量问问题题中中，两两个个变变量量之之间间的的关关系系并并不不是是都都满满足足线线性性关关系系，可可能能是是某某种种曲曲线线关关系系，即即：一一元元非非线线性性关关系系。要要获获得得这这种种非非线性关系，通常按下面的步骤进行。线性关系，通常按下面的步骤进行。确定函数类型。确定函数类型。求求解解该该相相关关函函数数中中的的未未知知参参数数。通通常常直直接接应应用用最最小小二二乘乘法法原原理理求求出出非非线线性性回回归归方方程程中中的的未未知知参参数数是是非非常常困困难难的的，一一般般情情况况下下可可采用如下两种方法进行。采用如下两种方法进行。通通过过变变量量替替换换将将非非线线性性函函数数转转换换成成线线性性函函数数，用用线线性性回回归归方方程程的的求求解解方方法法求求出出转转换换后后线线性性函函数数的的回回归归方方程程，在在通通过过变变量量反反变变换换求求出非线性函数的回归方程。出非线性函数的回归方程。将将非非线线性性回回归归曲曲线线方方程程，应应用用泰泰勒勒级级数数展展开开成成回回归归多多项项式式来来描描述述两两个个变变量量之之间间的的关关系系，把把求求解解曲曲线线回回归归问问题题转转化化成成求求解解多多项项式式回归问题。回归问题。6.4.1 回归曲线函数类型的选取和检验回归曲线函数类型的选取和检验（1）直接判断方法）直接判断方法根根据据检检测测对对象象的的特特点点和和相相关关专专业业知知识识，从从理理论论上上推推导导并并结结合合以以前前处处理理相近问题的成功经验，确定两个变量之间的函数类型。如化学反映相近问题的成功经验，确定两个变量之间的函数类型。如化学反映。（2）观察方法）观察方法将将测测量量观观察察得得到到的的数数据据作作图图，并并与与典典型型曲曲线线（书书上上图图6-6）进进行行比比较较，确确定定属属于于哪哪一一类类函函数数曲曲线线，再再将将所所选选定定的的函函数数曲曲线线类类型型用用下下述述方方法法进进行行检检验。验。（3）直线检验方法）直线检验方法当当待待检检验验的的函函数数类类型型中中，所所含含参参数数不不多多时时，应应用用此此方方法法检检验验效效果果较较好好。其步骤如下：其步骤如下：将预选的回归曲线方程将预选的回归曲线方程 f(x,y,a,b)=0 写成：写成：Z1=A+BZ2 式中：式中：Z1和和Z2是只含一个变量（是只含一个变量（x 或或 y）的函数，）的函数，A和和B是是a和和b的函数。的函数。求求出出几几对对与与x、y相相对对应应的的Z1和和Z2值值，这这几几对对值值与与选选择择x、y值值相相距距较较远远为好。为好。以以Z1和和Z2为为变变量量画画图图，如如果果所所得得图图形形为为直直线线，则则证证明明原原先先所所选选定定的的回回归曲线类型是适合的。归曲线类型是适合的。（4）表差方法）表差方法如如果果一一组组试试验验数数据据可可用用1多多项项式式表表示示，式式中中含含有有常常数数的的项项多多于于两两个个时时，可可以以用用表表差差方方法法决决定定回回归归曲曲线线方方程程的的次次数数或或检检验验回回归归方方程程的的次次数数较较为为合理。合理。步骤如下：步骤如下：用试验数据绘图。用试验数据绘图。观察试验数据，初步确定试验数据可选函数类型方程观察试验数据，初步确定试验数据可选函数类型方程(见表见表6-10)。自图上根据定差自图上根据定差x，列出，列出xi，yi各对应值。各对应值。根据根据x,y的读出值，计算差值：的读出值，计算差值：为第一阶差；为第一阶差；为第二阶差；为第二阶差；为第三阶差；为第三阶差；当当方方程程式式的的标标差差（书书上上表表6-10）为为常常数数时时，便便可可决决定定所所选选函函数数类类型型方程。方程。6.4.2 化曲线回归问题为直线回归问题化曲线回归问题为直线回归问题前前面面所所讲讲到到的的可可用用直直线线检检验验法法或或一一阶阶表表差差法法检检验验的的曲曲线线回回归归方方程程，都都可可以以通通过过变变量量代代换换转转化化为为直直线线回回归归方方程程，并并利利用用直直线线回回归归方方程程式式的确定方法确定研究对象测量数据的回归方程。的确定方法确定研究对象测量数据的回归方程。具体方法：结合例题具体方法：结合例题6-9和作业加以消化。和作业加以消化。6.4.3 回归曲线方程的效果与精度回归曲线方程的效果与精度求解回归方程的目的在于使所配的曲线与观察数据拟合得更好。求解回归方程的目的在于使所配的曲线与观察数据拟合得更好。因此，在计算回归曲线的剩余平方和因此，在计算回归曲线的剩余平方和Q时，不能用和以及时，不能用和以及（Q=SU=lyyb lxy）来计算，只能按定义用）来计算，只能按定义用yt/和和、定义公式、定义公式Q=计算。计算。（1）回归曲线方程的效果。一般用相关指数）回归曲线方程的效果。一般用相关指数R2（R也称相关系数）也称相关系数）作为衡量配后曲线的好坏：作为衡量配后曲线的好坏：第五节多元线性回归在实际工程和科学实验的许多问题中，多变量之间的试验结果、在实际工程和科学实验的许多问题中，多变量之间的试验结果、数学分析与表示问题，可归结为多元回归问题。数学分析与表示问题，可归结为多元回归问题。6.5.1 多元线性回归方程多元线性回归方程一一个个因因变变量量 y 与与M个个自自变变量量（x1,x2,xM,）之之间间存存在在内内在在的的线线性性关系，通过试验得到关系，通过试验得到N组观察数据：（组观察数据：（xt1,xt2,xtM,）。）。其中：其中：t=1,2,N。由由N组观察数据确定的线性方程组的组观察数据确定的线性方程组的结构形式结构形式或或数学模型数学模型为为:式中：式中：1,2,3,M 是是M+1个待估计参数个待估计参数;(x1,x2,xM)是是M个可以精确测量或控制的一般变量；（个可以精确测量或控制的一般变量；（1,2,M）是）是N个个相互独立并服从正态分布的随机变量。相互独立并服从正态分布的随机变量。用矩阵表示，令：用矩阵表示，令：Y=；X=；=；=；则有多元回归的矩阵表达形式：则有多元回归的矩阵表达形式：Y=X+仍仍用用最最小小二二乘乘法法的的估估计计参参数数b0,b1,bM作作为为参参数数1,2,3,M的估计值，则有回归方程为：的估计值，则有回归方程为：依依据据最最小小二二乘乘法法的的原原理理，全全部部观观察察值值 yt 与与回回归归值值 t 的的残残余余误误差差平平方和最小。方和最小。有：有：Q=最小最小对对于于给给定定的的N组组观观察察数数据据，Q是是b0、b1，bM的的非非负负二二次次式式，最最小值一定存在，小值一定存在，b0、b1，bM 应为下列方程组的解：应为下列方程组的解：经整理，并写成矩阵形式：经整理，并写成矩阵形式：(XTX)b=XTY 或或 Ab=XTY 式中：式中：A=XTX （6-43）解（解（6-43）式，得回归方程的估计回归系数）式，得回归方程的估计回归系数 b：b=A-1(XTY)=(XTX)-1XTY （6-44）令：令：C=A-1=(XTX)-1 有：有：b=CXTY （6-45）对于处理多元线性回归问题，与处理一元回归问题相似，这里不对于处理多元线性回归问题，与处理一元回归问题相似，这里不进行过多的讨论进行过多的讨论。6.5.2 多元线性回归方程的显著性和精度多元线性回归方程的显著性和精度一一个个多多元元线线性性回回归归方方程程是是否否更更真真实实反反映映因因变变量量与与自自变变量量之之间间的的客客观观规规律律，效效果果如如何何，主主要要靠靠实实践践检检验验。从从数数学学的的角角度度出出发发，与与一一元元线线性性回回归归相相似似，也也可可用用相相应应的的数数理理统统计计的的方方法法进进行行检检验验。主主要要依依据据是是y的的总总离离差差平平方方和和S，回回归归平平方方和和U和和残残余余误误差差平平方方和和Q的的计计算算结结果果、以以及及相相应应的的自自由由度度M，所所具具有有的的F检检验验法法计计算算结结果果来来判判定定多多元元线性回归方程的显著特性。计算与线性回归方程的显著特性。计算与F检验法判定如书上表检验法判定如书上表6-18。F检验法的数学统计量计算：检验法的数学统计量计算：同理，多元线性回归方程的预报精度由残余标准差来估计。同理，多元线性回归方程的预报精度由残余标准差来估计。6.5.3 每个自变量在多元线性回归中所起的作用每个自变量在多元线性回归中所起的作用在在多多元元回回归归方方程程中中，并并不不是是所所有有的的自自变变量量对对因因变变量量的的影影响响都都是是显显著著的的或或重重要要的的。在在研研究究实实际际问问题题时时，我我们们期期望望观观察察和和认认识识到到哪哪些些对对因因变变量量影影响响起起主主要要作作用用的的因因素素，尽尽可可能能的的去去除除哪哪些些起起次次要要作作用用或或可可有有可可无无的的因因素素，从从而而进进一一步步简简化化线线性性回回归归方方程程，利利于于我我们们对对检检测测结结果的预报和控制。果的预报和控制。如如何何观观察察和和认认识识某某一一特特定定自自变变量量因因素素在在总总回回归归方方程程中中起起的的作作用用呢呢？我我们们可可以以利利用用减减少少或或去去掉掉某某一一自自变变量量因因素素或或某某一一部部分分自自变变量量因因素素，观观察察回回归归平平方方和和U的的减减少少量量多多少少，即即取取消消一一个个自自变变量量后后，回回归归平平方方和和的的减减少少的的数数值值称称为为y对对这这个个自自变变量量xi的的偏偏回回归归平平方方和和Pi（Pi=U-U），Pi可可用用来来评评价价该该自自变变量量因因素素或或该该部部分分自自变变量量因因素素对对因因变变量量的的影响程度或重要程度。影响程度或重要程度。在通常情况下，要直接按定义式（在通常情况下，要直接按定义式（Pi=U-U）来计算偏回归平方）来计算偏回归平方和和Pi是困难的，可以证明是困难的，可以证明Pi可按下式计算：可按下式计算：Pi=bi2/Cii Ci 取消自变量前原回归方程系数矩阵取消自变量前原回归方程系数矩阵A或或L的逆矩阵的逆矩阵C或或L-1中的相应元素。中的相应元素。bi 现回归方程的回归系数。现回归方程的回归系数。但但是是由由于于回回归归方方程程中中各各自自变变量量之之间间可可能能有有着着密密切切关关系系，即即使使Pi较较小小，也也不不能能直直接接判判定定自自变变量量对对因因变变量量的的作作用用较较小小，还还得得用用下下面面的的F检检验法作进一步的检验，具体方法如下：验法作进一步的检验，具体方法如下：凡凡是是偏偏回回归归平平方方和和Pi大大的的自自变变量量xi，一一定定对对因因变变量量的的影影响响起起重重要要作作用用显显著著；对对于于偏偏回回归归平平方方和和Pi大大到到什什么么程程度度，才才影影响响显显著著，可可对对残残余平方和余平方和Q进行进行F检验法检验：检验法检验：当当FiFa时时，则则认认为为自自变变量量xi对对因因变变量量y的的影影响响在在a水水平平上上显显著著，即即回归系数检验回归系数检验方法。方法。对对于于偏偏回回归归平平方方和和Pi小小的的自自变变量量xi，并并不不意意味味着着对对因因变变量量y的的影影响响就就不不显显著著，但但可可以以肯肯定定所所有有偏偏回回归归平平方方和和Pi最最小小的的自自变变量量xi，对对因因变变量量y的的影影响响最最小小，假假如如用用F检检验验法法检检验验对对该该自自变变量量检检验验结结果果表表明明又又不显著，则就可以将该自变量剔除，得到新的不显著，则就可以将该自变量剔除，得到新的M-1元回归方程。元回归方程。在新的在新的M-1元回归方程基础上，又重新进行上述元回归方程基础上，又重新进行上述步，看是否步，看是否存在对因变量存在对因变量y的影响最小的自变量的影响最小的自变量xi，若存在则将其剔除；若不存，若存在则将其剔除；若不存在则所得到的在则所得到的M-n元回归方程为简化后的线性回归方程。元回归方程为简化后的线性回归方程。

展开阅读全文

误差理论与数据处理培训课程课件

最新文档