误差及数理统计基础课件

上传人:仙*** 文档编号:241793873 上传时间:2024-07-24 格式:PPT 页数:49 大小:599KB
返回 下载 相关 举报
误差及数理统计基础课件_第1页
第1页 / 共49页
误差及数理统计基础课件_第2页
第2页 / 共49页
误差及数理统计基础课件_第3页
第3页 / 共49页
点击查看更多>>
资源描述
第一章第一章误差及数理统计基础误差及数理统计基础1.1误差误差1.1.1误差的定义误差的定义测测量量值值x带带有有误误差差E,测测量量值值去去掉掉误误差差就就等等于于真真值值 0,0 xE。所所以以误误差差的的定定义义为为:Ex 0,即即测测量量值值偏偏离离真值的程度,也就是测量值的不确定度真值的程度,也就是测量值的不确定度.1.1.2误差的类型误差的类型1.绝对误差绝对误差测量值大于真值时误差为正数,表示结果偏高;反之,测量值大于真值时误差为正数,表示结果偏高;反之,误差为负数时表示结果偏低误差为负数时表示结果偏低.这里的误差都是绝对误差,这里的误差都是绝对误差,它具有与测量值和真值相对应的量纲它具有与测量值和真值相对应的量纲.2.相对误差相对误差绝绝对对误误差差在在真真值值中中所所占占的的比比率率称称相相对对误误差差,一一般般用用百百分分率率表表示示相对误差()相对误差()当当真真值值为为未未知知时时,可可用用多多次次重重复复测测定定结结果果的的算算术术平平均均值值代代替替。相对误差没有量纲。相对误差没有量纲.3.粗差粗差粗粗差差也也称称过过失失误误差差,是是由由于于非非正正常常实实验验条条件件或或非非正正常常操操作作所所造造成成的的.如如测测量量时时对对错错了了标标志志,误误读读了了数数码码,实实验验仪仪器器未未达达到到预预想想的指标等的指标等.含有粗差的测量值常称为坏值或异常值含有粗差的测量值常称为坏值或异常值,应予以剔除应予以剔除.4.系统误差系统误差由由于于某某种种原原因因所所产产生生,并并遵遵循循一一定定的的规规律律进进行行变变化化.例例如如,随随样品或试剂用量的大小按比例进行变化样品或试剂用量的大小按比例进行变化.系统误差有一定的指向,系统误差有一定的指向,例如称量一种吸湿性物质,其误差总是正值例如称量一种吸湿性物质,其误差总是正值.从系统误差从系统误差的来源看,它属于方法和技术问题,知道了产生的原因,的来源看,它属于方法和技术问题,知道了产生的原因,便可消除或修正,所以此种误差也称可定误差便可消除或修正,所以此种误差也称可定误差.5.随机误差随机误差在在相相同同条条件件下下重重复复多多次次测测定定同同一一物物理理量量时时,误误差差大大小小或或正正负负变变化化纯纯属属偶偶然然而而毫毫无无规规律律,这这种种误误差差称称为为随随机机误误差差,也也叫叫偶偶然然误误差差.单单个个地地看看是是无无规规律律性性的的,但但就就其其总总体体来来说说,由由于于正正负负有有相相消消的的机机会会,随随着着变变量量个个数数的的增增加加,误误差差的的平平均均值值将将趋趋近近于于零零.这这种种低低偿偿正正是是统统计计规规律律的的表表现现,所以随机误差是可以用概率统计来处理的所以随机误差是可以用概率统计来处理的.1.1.3精密度和准确度精密度和准确度误差表示测量的不精密度和不准确度,即不确定度误差表示测量的不精密度和不准确度,即不确定度.精密精密度和准确度是两个不同的概念度和准确度是两个不同的概念.精密度表示一组测定数据相互精密度表示一组测定数据相互接近的程度或分散的程度,它的大小完全决定于偶然误差接近的程度或分散的程度,它的大小完全决定于偶然误差.在在分析化学中,常用重复性(分析化学中,常用重复性(repeatability)和再现性和再现性(reproducibility)reproducibility)来来表示精密度表示精密度.重复性重复性是指在完全相同条件下,即同一操作者、是指在完全相同条件下,即同一操作者、同一仪器、同一仪器、同一实验室,在较短时间内分析同一样品所得结果的精密度;同一实验室,在较短时间内分析同一样品所得结果的精密度;再现性再现性是指在不同的条件下,即不同的操作者、非同一台仪是指在不同的条件下,即不同的操作者、非同一台仪器、不同的实验室、不同的时间,但是用相同的分析方法和器、不同的实验室、不同的时间,但是用相同的分析方法和分析相同样品所得结果的精密度分析相同样品所得结果的精密度.准确度表示测量值与真值的准确度表示测量值与真值的偏离程度,它由系统误差和偶然误差共同决定偏离程度,它由系统误差和偶然误差共同决定.如如由由4个个学学生生用用浓浓度度准准确确为为0.1mol/L的的盐盐酸酸滴滴定定浓浓度度准准确确为为0.1mol/L的的氢氢氧氧化化钠钠,氢氢氧氧化化钠钠的的体体积积准准确确为为10.00ml.每每个个学学生重复测量生重复测量5次次,其结果示于表其结果示于表1.1.学学生生结果结果(ml)注释注释ABCD10.0810.1110.0910.1010.129.8810.1410.029.8010.2110.199.799.6910.059.7810.049.9810.029.9710.04精密但不准精密但不准确确准确但不精准确但不精密密不准确也不不准确也不精密精密准确而且精准确而且精密密由由表表1.1可可见见,学学生生A尽尽管管测测试试结结果果重重复复性性较较好好,即即精精密密,但但是是准准确确性性较较差差(A的的均均值值为为10.10),所所有有结结果果均均偏偏高高.这这是是由由于于系系统统误误差差所所致致.学学生生B的的测测试试落落到到准准确确值值(即即真真值值)的的两两侧侧,其其均均值值为为10.01.此此结结果果较较准准确确,但但精精密密度度较较差差,主主要要受受到到了了偶偶然然误误差差的的影影响响.学学生生C测测量量中中既既有有偶偶然然误误差差的的影影响响,又又有有系系统统误误差差的的影影响响,所所以以既既不不精精密密,也也不不准准确确.只只有有学学生生D测测试试结结果果比比较较精精密密(范范围围为为9.97-10.04ml),又又比比较较准准确确(均均值值为为10.01).表表1.1用盐酸进行氢氧用盐酸进行氢氧化钠的滴定结果化钠的滴定结果1.1.4 1.1.4 偶然误差的传递偶然误差的传递 1.1.线性加和线性加和 如如y y为测定量为测定量a a,b b和和c c等的线性组合:等的线性组合:式式中中K Ka a,K Kb b,和和K Kc c等等为为常常数数,则则加加和和或或差差值值的的标标准准偏偏差差是是各各量方差加和的平方根量方差加和的平方根:如滴定中,移液管的初值和终值分别为:如滴定中,移液管的初值和终值分别为:3.513.51ml ml 和和 15.6715.67ml,ml,其标准偏差均为其标准偏差均为0.020.02ml,ml,则用去滴定液的体积及标准则用去滴定液的体积及标准偏差分别为:偏差分别为:消耗的滴定液体积消耗的滴定液体积=15.67-3.51=12.16(ml)标准偏差标准偏差=(ml)此此例例说说明明,组组合合的的标标准准偏偏差差大大于于单单个个读读数数的的标标准准偏偏差差,但但小小于各量的标准偏差之和于各量的标准偏差之和.2.2.乘除表达式乘除表达式 若计算若计算y的表达式为:的表达式为:y=kab/cd式式中中a,b,c和和d分分别别为为测测定定量量,k为为常常数数,则则相相对对标标准准偏偏差差有有如下关系:如下关系:如荧光的量子产率可用下式计算:如荧光的量子产率可用下式计算:式中各量的相对标准偏差是:式中各量的相对标准偏差是:I0为入射光强度,为入射光强度,0.5%;If 为荧光强度,为荧光强度,2%;E 为摩尔吸收,为摩尔吸收,1%;c为浓度,为浓度,0.2%;的相对标准偏差为:的相对标准偏差为:由此可见,最终结果的相对标准偏差略大于上述分量中具有由此可见,最终结果的相对标准偏差略大于上述分量中具有最大相对标准偏差的那个分量最大相对标准偏差的那个分量(If).).这一结果给我们的启示这一结果给我们的启示是,若拟提高测试的精度,则首先应该设法改善具有最大相是,若拟提高测试的精度,则首先应该设法改善具有最大相对标准偏差的那个分量的测试精度对标准偏差的那个分量的测试精度.另外,对于某一量的乘方,如另外,对于某一量的乘方,如y=bn则则y y的相对标准偏差为的相对标准偏差为因为因为b和和bn不是分别独立的量不是分别独立的量.则则x和和y的标准偏差具有如下关系:的标准偏差具有如下关系:如某溶液的吸收值如某溶液的吸收值A为光透过率的函数:为光透过率的函数:若若T的的测测定定值值为为0.501,标标准准偏偏差差为为0.001,则则A的的值值及及其其dA/dT分别为:分别为:和和由此可得由此可得A的标准偏差为:的标准偏差为:s=|0.001(-0.434/0.501)|=0.000872.3.其他函数其他函数若若y是是x的函数的函数1.1.5 1.1.5 系统误差的传递系统误差的传递 1 1线性组合线性组合 如测试量如测试量a a,b b,c c等中的系统误差分别为等中的系统误差分别为 等,等,则则y中的系统误差中的系统误差为:为:2.乘除表达式乘除表达式如如y=kabc/d则,相对系统误差为:则,相对系统误差为:同样,若同样,若 则则y的相对系统误差为:的相对系统误差为:3.其他函数其他函数 和偶然误差具有相类似的表达式,即和偶然误差具有相类似的表达式,即1.2 1.2 基础统计学概念基础统计学概念1.1.总体、个体和样本总体、个体和样本 所所研研究究对对象象的的全全体体称称为为总总体体,其其中中每每个个单单位位称称为为个个体体。从从总总体体中中随随机机抽抽取取若若干干个个体体的的集集合合称称为为样样本本。样样本本中中所所含含个个体体的的数数目目n n称称为为样样本本容容量量。如如,某某产产品品设设为为总总体体,考考察察某某产产品品中中铅铅的的含含量量,随随机机选选取取该该类类产产品品100100个个,那那么么100100个个产产品品铅铅的的含含量量x x1 1,x x2 2,x x100100就就是是来来自自总总体体的的容容量量为为100100的的样样本本.在在分分析析化化学学中中,样样本本的的英英文文(samplesample)一一词词为为一一分分析析实实物物。而而在在分分析析数数据据处处理理时时(即即在在统统计计学学中中),此此词词指指的的是是一一组组数数据据,即即自自总总体体中中随随机机抽抽取取的的一一组组测测量量值值。为为了避免混淆,在分析化学中的了避免混淆,在分析化学中的“样本样本”可用可用“试样试样”一词。一词。1.均值和标准偏差均值和标准偏差 对某试样作无限次测定,所得数据称为总体的均值对某试样作无限次测定,所得数据称为总体的均值(亦亦称期望值称期望值)常用常用 表示表示.若无系统偏差,若无系统偏差,则为真值。事实上则为真值。事实上不可能作无限次测定不可能作无限次测定.若作若作n次测定,其均值次测定,其均值(即算数平均值即算数平均值)为为 是是 的估计的估计.的表达式为:的表达式为:同同样样,若若总总体体的的标标准准偏偏差差为为,有有限限次次如如n 次次测测定定的的标标准准偏偏差差为为s,则则s为为 的的估估计计.当当n趋趋于于无无穷穷大大时时,s将将趋趋近近于于。s的表达式为:的表达式为:标标准准偏偏差差可可以以表表征征测测定定结结果果对对于于均均值值的的离离散散程程度度,但但却却不不能能指指示示这这些些数数据据的的分分布布情情况况。而而表表征征数数据据的的分分布布情情况况要要用用直直方方图图(或或频频谱谱图图).如如对对某某一一溶溶液液作作50次次测测定定,其其均均值值为为0.50ug/ml.其中,其中,0.46ug/ml出现出现1次,次,0.47ug/ml出现出现3次次,0.48ug/ml出现出现5次,次,0.49ug/ml出现出现10次,等等次,等等.将每将每一测定值出现的频率对测定值作图即为直方图(或频谱一测定值出现的频率对测定值作图即为直方图(或频谱图)。图)。3.平均值的标准偏差平均值的标准偏差 将将一一组组独独立立重重复复测测定定值值进进行行平平均均时时,一一部部分分偶偶然然误误差差相相互互抵抵消消,使使平平均均值值带带有有的的误误差差比比原原测测定定值值要要小小.平平均均值值的的标标准准偏偏差差又又称称“标标准准误误差差”,与与单单次次测测量量值值的的 之之间间的的关关系为系为故标准误差故标准误差 服从服从的正态分布的正态分布.4.正态分布正态分布在在数数学学上上常常用用正正态态分分布布(即即高高斯斯分分布布)来来描描述述某某试试样的总体:样的总体:其其中中,x为为试试样样测测量量值值,p为为测测量量值值的的概概率率密密度度。正正态态分分布布具有如下重要性质(见图具有如下重要性质(见图1.1):):(1)数据关于数据关于 为对称分布;为对称分布;(2)值越大,数据的离散程度越大;值越大,数据的离散程度越大;(1)样样本本值值落落入入任任意意区区间间(a,b)的的概概率率记记作作p(axt(,f),则则放放弃弃假假设设.同同样样,t(,f)由查表得到由查表得到.用冷蒸汽原子吸收法测定某标样中的汞用冷蒸汽原子吸收法测定某标样中的汞已已知知汞汞的的含含量量为为38.9%.其其测测试试值值为为38.9%,37.4%和和37.1%.由由此此可可得得平平均均值值为为37.8%,标标准准偏偏差差为为0.964%.作作假假设设,即即设设定定无无系系统统误误差差,则则利利用用上上述述公公式式可可计计算算t值:值:当当自自由由度度为为2时时,查查t值值分分布布表表可可得得t(,f)=4.3(=0.05).由于由于|t|t临界临界,假设为真,即无明显的系统误差假设为真,即无明显的系统误差.3 3、成对结果的、成对结果的t检验(检验(pairedt-test)两种方法对于两种方法对于4个试样个试样Pb的测定结果的测定结果(ug/L)为:为:试样试样 湿法氧化湿法氧化 直接萃取直接萃取 1 1 71 7176762 2 61 6168683 3 50 5048484 4 60 6057575若沿用上述算法去直接比较两种方法的均值是不适合的,若沿用上述算法去直接比较两种方法的均值是不适合的,因为测试结果的差异有可能由于本试样不同所导致。因为测试结果的差异有可能由于本试样不同所导致。在此种情况下,可以采用同一试样两个测试结果比较的方法在此种情况下,可以采用同一试样两个测试结果比较的方法.如如上上述述数数据据,对对应应试试样样的的差差值值分分别别为为-5,-7,2,3;这这些些差差值值的的均均值值=-1.75;差差值值的的标标准准偏偏差差s=4.99.由由于于差差值值的的期期望望值值=0,所以,所以t的的自自由由度度为为n-1=3,取取=0.05,查查表表得得t值值为为3.18,t的的实实验验值值为为-0.70,|t|=1,即大者为分子,小者为即大者为分子,小者为分母。分母。测定废水中的氧,其结果为:测定废水中的氧,其结果为:均值(均值(mg/L)标准偏差标准偏差(mg/L)mg/L)标准方法:标准方法:723.31新方法:新方法:721.51n1=n2=8试试问问,新新方方法法的的精精密密度度是是否否明明显显高高于于标标准准方方法法?对对于于此问题可以采用单尾此问题可以采用单尾F检验检验.F=3.312/1.512=4.8在在两两种种情情况况下下均均测测定定8次次,所所以以自自由由度度均均为为7.若若=0.05,查查表表(单单尾尾)得得F的的临临界界值值为为3.787.由由于于计计算算值值大大于于该该临临界界值值,故故可可得得新新方方法法比比标标准准法法具具有有更更高高精密度的结论精密度的结论.再如再如1.6.2中硼的测定中硼的测定 两两种种方方法法的的测测定定次次数数均均为为10,即即自自由由度度均均为为9,标标准准偏偏差分别为差分别为0.30和和0.23.若采用若采用F检验:检验:F=0.32/0.232=1.7显显然然,在在此此种种情情况况下下为为双双尾尾检检验验.查查双双尾尾F分分布布表表所所得得临临界界值值为为4.026(=0.05).计计算算值值小小于于临临界界值值,说明两种方法的标准偏差没有显著性差别说明两种方法的标准偏差没有显著性差别.须须指指出出,在在进进行行双双尾尾检检验验时时,若若使使用用的的F分分布布表表为为单单尾尾,则则显显著著性性水水平平 应应为为双双尾尾的的 的的1/2.如如上上例例,应应为为0.025而不是而不是0.05.1.6.4检验检验2 2检验是有关于某事件发生频率的测试检验是有关于某事件发生频率的测试.如如,由由实实验验室室中中4位位工工作作者者打打破破玻玻璃璃器器皿皿的的件件数数,用用2检验他们的可信赖度有否区别检验他们的可信赖度有否区别.打破件数:打破件数:24,17,11,9若若作作假假设设,则则认认为为他他们们间间可可信信赖赖度度无无区区别别.就就是是说说在在同同一一段段时时间间内内,他他们们打打破破玻玻璃璃器器皿皿的的件件数数是是相相同同的的.由由于于打打破破的的总总件件数数为为61,所所以以对对于于每每位位工工作作者者打打破破器器皿皿的的期期望望值值为为61/4=15.25.现现在在我我们们拟拟得得到到的的答答案案是是,观观测测值值与与期期望望值值是否有显著性差别是否有显著性差别.为此,作如下计算:为此,作如下计算:观测频率,观测频率,O期待频率,期待频率,EOE(O-E)2/E2415.258.755.0201715.251.750.2011115.25-4.251.184915.25-6.252.5610.002=8.966其其中中,OE列列的的加加和和恒恒等等于于0,故故可可作作计计算算中中的的校校验验.若若2超超出出一一定定的的临临界界值值则则拒拒绝绝假假设设.在在此此例例中中,自自由由度度为为4-1=3,若若=0.05,则则由由2的的分分布布表表可可知知2的的临临界界值值为为7.81,计计算算值值大于查表值,说明大于查表值,说明4位工作者的可信赖度确有区别位工作者的可信赖度确有区别.作作为为2检检验验的的应应用用,观观测测总总数数要要大大于于或或等等于于50次,而个体重复次数不应低于次,而个体重复次数不应低于5。另另外外,2检检验验可可用用于于检检验验总总体体方方差差是是否否正正常常,但但总总体体方方差差 要要已已知知.运运用用时时首首先先计计算算出出统统计计量:量:然然后后查查分分布布表表,并并将将查查表表值值与与计计算算值值进进行行比比较较,以判断如某批产品正常与否以判断如某批产品正常与否.1.6坏值的剔除坏值的剔除用统计法进行坏值剔除的基本思想是:给定一显著性水平用统计法进行坏值剔除的基本思想是:给定一显著性水平,并确定一门限值,凡超过这个门限的误差就认为它不,并确定一门限值,凡超过这个门限的误差就认为它不属于随机误差的范畴,而是粗差,并予以剔除属于随机误差的范畴,而是粗差,并予以剔除.1.法则法则2.2.设残差为:设残差为:样本的标准偏差为样本的标准偏差为s,若若则认为则认为xi是含有粗差的坏值,应予剔除是含有粗差的坏值,应予剔除.1.2.Chauvenet准则准则2.2.同上,当同上,当 时剔除坏值时剔除坏值.式中可由表式中可由表1.5查出查出.表表1.5Chauvenet系数的数值表系数的数值表 n in in i34567891011121.381.531.651.731.801.861.921.962.002.03131415161718192021222.072.102.132.152.172.202.222.242.262.28232425304050751002005002.302.312.332.392.492.582.712.813.023.203.Grubbs准则准则同上,当同上,当 时则认为时则认为x xi i是含有粗值的坏是含有粗值的坏值,应予剔除值,应予剔除.值列于表值列于表1.6.1.6.表表1.6 1.6 Grubbs Grubbs 数值表数值表 n n n 0.010.050.010.050.010.05345678910111.151.491.751.912.102.222.322.412.481.151.461.671.821.912.032.112.182.241213141516171819202.552.612.662.702.742.782.822.852.882.292.332.372.412.412.472.502.532.562122232425303540502.912.942.952.993.013.103.183.213.342.582.602.622.642.662.742.812.872.964、t 检验准则检验准则同同上上,但但是是在在均均值值计计算算中中不不包包括括怀怀疑疑值值,标标准准偏偏差差s的的计计算算自由度为自由度为n-2.当当 时,剔除坏值时,剔除坏值xi.式中式中其中其中 为为t分布,分布,f=n-2.5、Dixon准则准则 这这一一准准则则是是运运用用极极差差比比的的方方法法。首首先先将将测测试试数数据据依依小小至至大大排排序序,则则可可计计算算f值值,若若f f(,n),则则应应剔剔除除x(1)或或x(n)。f(,n)为查表值(见表为查表值(见表1.7)。)。表表1.7Dixon系数系数f(,n)和和f f计算公式计算公式 nf(,n)f计算公式计算公式=00.01=0.05x1可疑可疑xn可疑可疑345670.9880.8890.7800.6980.6370.9410.7650.6420.5600.50789100.6830.6350.5970.5540.5120.4771112130.6790.6420.6150.5760.5460.5211415161718192021222324250.6410.6160.5950.5770.5610.5470.5350.5240.5140.5050.4970.4890.5460.5250.5070.4900.4750.4620.4500.4400.4300.4210.4130.406练习题练习题1.什么是标准偏差?什么是均值误差?什么是标准偏差?什么是均值误差?2.误差正态分布的特点是什么?误差正态分布的特点是什么?3.熟悉不同误差类型的传递。熟悉不同误差类型的传递。4什么是总体?什么是个体、样本和样本容量?什么是总体?什么是个体、样本和样本容量?5什么是置信区间?什么是置信限?什么是置信区间?什么是置信限?6什么是置信概率?什么是显著水平?什么是置信概率?什么是显著水平?7.从某批产品中随机抽取从某批产品中随机抽取20个试样测定个试样测定Pb的含量的含量,得得=0.11%,标准偏差标准偏差s=0.01%.若以若以95%的把握估准至少的把握估准至少99%,试计算试计算Pb在在该产品中含量的范围该产品中含量的范围.8.缓冲溶液中缓冲溶液中pH的的7次测定值为次测定值为5.12,5.20,5.15,5.17,5.19,5.15,试分别计算置信度为试分别计算置信度为95%和和99%的置信区间的置信区间.9两组测试数据分别为两组测试数据分别为:组组1:777,790,759,790,770,758,764组组2:782,773,778,765,789,797,782试分别计算试分别计算(1)两组数据的均值有无两组数据的均值有无显著性差别显著性差别?(2)两试数据方差有无显著性差别两试数据方差有无显著性差别?10如有数据如有数据:12.12,12.13,12.15,13.14,12.12,试试用不同方法判断第用不同方法判断第4个数据是否异常点个数据是否异常点(坏值坏值)?
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!