资源描述
1.5试验数据误差的估计与检验,检验: 计算一个值A 由两个值 (1)自由度df (2)给定的显著水平a=0.05 查表: Ba(df) 或者B0.5a(df) 对比A值与B(df)值得出相关的结论,1.5试验数据误差的估计与检验,1.5.1 随机误差的检验,1.5.1.1卡方检验,一组数据随机误差,检验(,-test),1.5.1.2 F检验,两组数据随机误差,检验,1.5试验数据误差的估计与检验,(1)目的:,对试验数据的随机误差或精密度进行检验。,(2)检验步骤:,计算统计量,1.5试验数据误差的估计与检验,查临界值,一般取0.01或0.05,表示有显著差异的概率,双侧(尾)检验(two-sided/tailed test) :,检验,若,则判断两方差无显著差异,否则有显著差异,1.5试验数据误差的估计与检验,1.5.1 随机误差的估计,1、,适用条件:试验数据的总体方差 已知的情况,其中, 为显著水平,检验,卡方检验随机误差,有一组试验数据x1,x2,x3服从正态分布,则统计量,服从自由度为,的,分布,(见附录1),1.5试验数据误差的估计与检验,检验方法,1.双侧检验:若,2.单侧检验:,则该组数据的方差与原总体,方差无显著差异,否则有显著差异,左侧检验:若,则该组数据的方差与原,总体方差无显著减小,否则有显著减小,右侧检验:若,则该组数据的方差与原,总体方差无显著增大,否则有显著增大,1.5试验数据误差的估计与检验,1.5试验数据误差的估计与检验,例题1-5 p10,已知:用某分光光度计测定某样品中三价铁离子的浓度,正常情况下的测定方差为 ,修复后相同样品的测量值为0.142、0.156、0.161、0.145、0.176、0.159、0.165 求:检修后仪器的稳定性是否有了显著变化,解:稳定性即指随机误差的大小,可用 检验。 由已知得:,依题意,,查得,所以,检修后仪器的稳定性有了显著变化。,1.5试验数据误差的估计与检验,例题1-6 p10,已知:某厂进行技术改造,以减少酒精中甲醇的含量的波动性,原酒精中的甲醇含量的方差为 ,改造后25个样品方差 求:技术改革后酒精中甲醇含量的波动性是否更小 解:依题意,要检验改革后酒精中甲醇含量的波动性是否有明显减小,可用 左侧检验,依题意,,查得,可见,技术改造后酒精中的甲醇含量的波动性有显著减少,技改效果明显。,1.5试验数据误差的估计与检验,2. F检验随机误差,适用条件:两组具有正态分布的试验数据之间的精密度的比较,设有两组数据都服从于正态分布,样本方差分别为,则,服从自由度为,及,的F分布,见附录2,1.5试验数据误差的估计与检验,检验方法,1.双侧检验:若,2.单侧检验:,则该组数据的,方差与原总体方差无显著差异,否则有显著差异,左侧检验:若,则方差1比方差2,无显著减小,否则有显著减小,右侧检验:若,则方差1比方差2,无显著增大,否则有显著增大,1.5试验数据误差的估计与检验,例1-7 用新旧两种方法测定废水中三价铁离子的含量,新法:0.163,0.175,0.159、 旧法:0.153,0.181,0.165,0.155、 求:1)两种方法的精密度是否有显著差异 2)新方法是否比旧法的精密度有显著提高 解:1)依题意,精密度指方差的大小,采用F双侧检验,依题意:,查表得,即:两种方法,的精密度无显著差异,是一致的。,1.5试验数据误差的估计与检验,1. t检验法系统误差,正确度,适用条件:数据的算术平均值Xp与给定值U0是否有显著差异。,(1)平均值与给定值的比较计算值t与查表之ta(df),则统计量:,服从自由度,的t分布。,双侧检验:,左侧检验:,右侧检验:,则给定值与平均值无显著差异,否则、,则给定值与平均值无显著减小,否则、,则给定值与平均值无显著增大,否则、,1.5.2 系统误差的检验,1.5试验数据误差的估计与检验,例题1-8 已知:标准样品含水量7.5%,测量结果为7.6,7.8,8.5,8.3,8.7; 求:1.仪器的测量结果是否存在显著的系统误差? 2.仪器的测量结果较标准值是否明显增大?,解:1属于双侧检验,2属于右测检验,由已知:,由,查表得,所以仪器的测量结果存在显著的系统误差,所以仪器的测量结果较标准值明显增大,1.5试验数据误差的估计与检验,(2)两个平均值的比较,适用条件:两组试验数据的平均值的比较,a.两组数据的方差无显著差异时,统计量,其中:,先F检验,再分为两情况:1-无显著差异;2-有显著差异 再进行t检验,查表ta(df),之后对比t 与 ta(df),b.两组数据的方差有显著差异时,统计量,1.5试验数据误差的估计与检验,其中:,-2,查表t0.5a(df),之后对比/t/ 与 t0.5a(df),系统误差是否一致,1.5试验数据误差的估计与检验,例1-9 已知:两种方法测量样品的含水量,测量结果分别为、 求:两种方法之间是否存在系统误差 解:1.判断两组数据的方差是否存在显著差异 2.进行t检验,1.5试验数据误差的估计与检验,(3)成对数据的比较,适用条件:试验数据是成对出现的,除了被比较的因素之外,其他条件是相同的。,采用统计量:,其中,或,1.5试验数据误差的估计与检验,自由度:,检验:对于给定的显著水平,,不存在显著的系统误差,否则存在显著的系统误差。,则,成对数据之间,计算t0.5a(df), 并与 t 对比,1.5.2 系统误差的检验,1.5试验数据误差的估计与检验,2、秩和检验法适用于对试验数据的统计分布不清楚的情况 P222 计算R1,由n1,n2和a,查到T1和T2 ,比较R1与T、1T2的关系,检验方法: 设独立测得两组的数据为:,1)将两组数据混和以后,从1开始,按从小到大的顺序重新排列,2)观察测量次数较少那一组数据的序号,它的测得值在混合后的次序编号(即秩),再将所有测得值的次序相加,得到的序号号即为秩和R1。,3)两组的测量次数 ,可根据测量次数较少的组的次数 n1 和测量次数较多的组的次数 n2 ,由秩和检验表(附录4)查得 T1 和 T2 ,若 则无根据怀疑两组间存在系统误差。,这里总假定,1.5.2 系统误差的检验,2) 当 ,秩和 R1 近似服从正态分布 括号中第一项为数学期望,第二项为标准差,此时 T1 和 T2 可由正态分布算出。,1.5试验数据误差的估计与检验, 例1-11 ,两组数据如下,求有无系统误差,甲:8.6,10.0,9.9,8.8,9.1,9.1 乙:8.7,8.4,9.2,8.9,7.4,8.0,7.3,8.1,6.8,秩 1 2 3 4 5 6 7 8 9 10 11.5 11.5 13 14 15 甲 8.6 8.8 9.1 9.1 9.9 10.0 乙 6.8 7.3 7.4 8.0 8.1 8.4 8.7 8.9 9.2,因为,查秩和临界表,得T1 =33, T2 =63, R1 T2,故乙组有测定误差,1.5.3 过失误差的检验,1.5试验数据误差的估计与检验,在一系列重复测量数据中: 可疑数据:如有个别数据与其它的有明显差异,它很可能含有粗大误差 不恰当剔除含大误差的数据,会造成测量精密度偏高的假象; 混有粗大误差的数据,即异常值,未加剔除,会造成测量精密度偏低 以上两种情况还都严重影响对平均值的估计 因此,对数据中异常值的正确判断与处理,以获得客观的测量结果 一、粗大误差产生的原因 产生粗大误差的原因是多方面的,大致可归纳为: 测量人员的主观原因 客观外界条件的原因,测量者工作责任感不强、工作过于疲劳、缺乏经验操作不当,或在测量时不小心、不耐心、不仔细等,造成错误的读书或记录。,测量条件意外地改变(如机械冲击、外界振动、电磁干扰等)。,1.5.3 过失误差的检验,二、判别粗大误差的准则 在测量过程中,确实是因读错记错数据,仪器的突然故障,或外界条件的突变等异常情况引起的异常值,一经发现,就应在记录中除去,但需注明原因。这种从技术上和物理上找出产生异常值的原因,是发现和剔除粗大误差的首要方法。有时,在测量完成后也不能确知数据中是否含有粗大误差,这时可采用统计的方法进行判别。统计法的基本思想是:给定一个显著性水平,按一定分布确定一个临界值,凡超过这个界限的误差,就认为它不属于偶然误差的范围,而是粗大误差,该数据应予以剔除。 在判别某个测得值是否含有粗大误差时,要特别慎重,应作充分的分析和研究,并根据判别准则予以确定。常用的判别准则有:,1.5.3 过失误差的检验,1.5试验数据误差的估计与检验,(一) 拉依达准则,不查表 该准则是最常用也是最简单的判别粗大误差的准则,它是以测量次数充分大为前提,但通常测量次数比较少,因此该准则只是一个近似的准则。实际测量中,常以贝塞尔公式算得 s ,以 代替真值。对某个可疑数据 ,若其残差满足: (a=0.01)或 2s(a=0.05) 则可认为该数据含有粗大误差,应予以剔除,利用贝塞尔公式容易说明:在n10的情形,用 准则剔除粗误差注定失败。为此,在测量次数较少时,最好不要选用 准则。下表是 准则的“弃真”概率,从表中看出 准则犯“弃真”错误的概率随n的增大而减小,最后稳定于0.3%。,1.5.3 过失误差的检验,1.5试验数据误差的估计与检验,例 12 对某量进行15次等精度测量,测得值如下所列,设这些测得值已消除了系统误差,试判别该测量列中是否含有粗大误差的测得值。,测量数值:20.30,20.39,20.39,20.39,20.40,20.40,20.40,20.41,20.42,20.42,20.42,20.43,20.43,20.43,20.43,1.5试验数据误差的估计与检验,解:由已知得,其中最可疑的数据为20.30,因此有,即它含有粗大误差,故将此测得值剔除。再根据剩下的14个测得值 重新计算,得:,因此20.39不是坏值,不用剔除,剩下的数据没有坏值,只剔除20.30,1.5.3 过失误差的检验,1.5试验数据误差的估计与检验,其中最可疑的数据为20.39,因此有,(二)格拉布斯准则 P223,查表G(a,n) 1950年格拉布斯(Grubbs)根据顺序统计量的某种分布规律提出一种判别粗大误差的准则。1974年我国有人用电子计算机做过统计模拟试验与其它几个准则相比,对样本中仅混入一个异常值的情况,用格拉布斯准则检验的功率最高。,时,即判别该测得值应予剔除。这里 称为格拉布斯检验临界值。 附录5,对某个可疑数据 dp ,当,1.5试验数据误差的估计与检验,1.5试验数据误差的估计与检验,例13 用例12测得值,试判别该测量列中的测得值是否含有粗大误差。 解:由表计算得:,按测得值的大小,顺序排列得,仅有两测得值,可怀疑,但由于,故应先怀疑 是否含有粗大误差,查表,应予剔除,所以,,剩下的14个数据,再重复上述步骤,判别 是否含有粗大误差。,1.5.3 过失误差的检验,1.5试验数据误差的估计与检验,故可判别 不包含粗大误差,且其余测得值也不含粗大误差。,查表,所以,最可疑,(三)狄克松准则 (自己看) 1950年狄克松(Dixon)提出另一种无需估算 和 的方法,它是根据测量数据按大小排列后的顺序差来判别是否存在粗大误差。有人指出,用Dixon准则判断样本数据中混有一个以上异常值的情形效果较好。以下介绍一种狄克松双侧检验准则。 (1)单侧情形 设正态测量总体的一个样本 ,将 按大小顺序排列成顺序统计量 ,即 构造检验高端异常值 和低端异常值 的统计量 D或D ,表1-3若 ,或 则应该剔除 或 。 如附录6所示。,1.5.3 过失误差的检验,1.5试验数据误差的估计与检验,1.5试验数据误差的估计与检验,1.5试验数据误差的估计与检验,(2)双侧情形,根据表1-3,计算D或D 对于给定的显著水平 ,在附录6中查出对应的双侧临界值 当 判断 为异常值 当 判断 为异常值 否则没有异常值 例1-14,说明: 1.可疑数据应逐一检查,不能同时检验多个数据。按数据与平均值的偏差 大小来检验,先检验偏差大的数据 2.剔除一个数后,如果要检验下一个数据,应注意试验数据的总数发生了变化 3.用不同的方法检验同一组数据,结果可能不同,小结: 大样本情况(n50)用3s准则最简单方便,虽然这种判别准则的可靠性不高,但它使用简便,不需要查表,故在要求不高时经常使用; 30n50情形,用格拉布斯准则效果较好;3n30情形,用格拉布斯准则适于剔除一个异常值。 在较为精密的实验场合,可以选用二种准则同时判断,当一致认为某值应剔除或保留时,则可以放心地加以剔除或保留。当二种方法的判断结果有矛盾时,则应慎重考虑,一般以不剔除为妥。因为留下某个怀疑的数据后算出的 s 只是偏大一点,这样较为安全。另外,可以再增添测量次数,以消除或减少它对平均值的影响。,1.5.3 过失误差的检验,1.5试验数据误差的估计与检验,以上讨论了三类测量误差,它们的特点各异,因而处理的方法也有较大差别。现简单归纳如下: 随机误差具有抵偿性,这是它最本质的特性,算术均值和标准差是表示测量结果的两个主要统计量;系统误差则违背抵偿性,因而会影响算术均值,变化的系统误差还影响标准差;粗大误差则存在于个别的可疑数据中,也会影响算术均值和标准差。 随机误差服从统计规律,是无法消除的,但通过适当增加测量次数可提高测量精度;系统误差则是有确定性规律,在掌握这个规律后,可以采取适当的措施消除或减小它;粗大误差既违背统计规律,又违背确定性规律,可用物理或统计的方法判断后剔除。 为处理一组测量数据,往往先找出个别可疑数据,经统计判断确认无粗大误差后,再用适当的方法检验数据中是否含有明显的系统误差,如确认已无系统误差,最后处理随机误差,统计算术平均值、标准差及极限误差,以正确的表达方式给出测量结果。,1.5.3 过失误差的检验,1.5试验数据误差的估计与检验,1.6 有效数字的运算,1.6.1 有效数字(significance figure),能够代表一定物理量的数字 有效数字的位数可反映试验或试验仪表的精度 数据中小数点的位置不影响有效数字的位数 例如:50,0.050m,5.0104m 第一个非0数前的数字都不是有效数字,而第一个非0数后的数字都是有效数字 例如: 29和29.00 第一位数字等于或大于8,则可以多计一位,可以认为四位有效数字例如:9.99,二、数字运算规则,1.6 有效数字的运算,(1)加、减运算: 与其中小数点后位数最少的相同 (2)乘、除运算 以各乘、除数中有效数字位数最少的为准 (3)乘方、开方运算: 与其底数的相同: 例如:2.42=5.8 (4)对数运算: 与其真数的相同 例如ln6.841.92;lg0.000044,三、数字舍入规则,1.6 有效数字的运算,(5)在4个以上数的平均值计算中,平均值的有效数字可增加一位 (6)所有取自手册上的数据,其有效数字位数按实际需要取,但原始数据如有限制,则应服从原始数据。 (7)一些常数的有效数字的位数可以认为是无限制的 例如,圆周率、重力加速度g、1/3等 (8)一般在工程计算中,取23位有效数字,1.6 有效数字的运算,1.6.3 有效数字的修约规则,4:舍去 5,且其后跟有非零数字 ,进1位 例如:3.14159 3.142 5,其右无数字或皆为0时,“尾留双”: 若所保留的末位数字为奇数则进1 若所保留的末位数字为偶数则舍弃 例如:3.1415 3.142双 1.3665 1.366双,1.7 误差的传递不推导,只结果,1.7.1 误差传递基本公式不推导,只结果,设,全微分得:,得,用,代替,或,误差传递公式,直接测量误差,误差传递系数,1.7 误差的传递不推导,只结果,所以,绝对误差为:,相对误差为:,间接测量值或函数为:,或,函数标准误差传递公式为:,1.7 误差的传递不推导,只结果,由于测量次数有限,一般采用:,1.7.2 常用函数的误差传递基本公式,1.7 误差的传递不推导,只结果,1.7.3 误差传递公式的应用,例1-16 一组等精度测量值,,它们的算术平均值为,试推导出 标准误差的表达式。,解:因为,误差传递系数为:,可见,间接测量或函数的误差是各直接测量值的各项分误差之和,而分误差的大小取决于直接测量误差和误差传递系数的乘积。所以可以根据各分误差的大小,来判断间接测量或函数误差的主要来源,为提高试验质量或改变实验方法提供依据。,1.7 误差的传递不推导,只结果,算术平均值的标准误差为:,由于是等精度测量,它们的标准误差相同, 所以算术平均值的标准 误差为:,算术平均值的绝对误差为:,1.7 误差的传递只结果,例1-17 测量静止流体内部某处的静压强,计算公式为:,测量值:,求:p的最大绝对误差、最大相对误差,解:各变量的绝对误差为:,各变量的误差传递系数:,1.7 误差的传递,最大绝对误差为:,又:,真值为:,最大相对误差:,小 结 给出数据,会求算术平均误差和对数平均误差 知道样本标准差的计算 试验数据误差的检验 (1) 随机误差(精度)的检验 一组数据:卡方检验 两组数据:F检验 (2)系统误差检验:t检验 平均值与与给定值 两组数据平均值 两组成对数据 (3)秩和检验法,小 结 异常数据的检验和处理 (1)拉依达准则,不查表 (2)格拉布斯准则 P223,查表G(a,n) 计算误差传递 计算那个压强计算的例题,
展开阅读全文