分析化学中的数据处理

上传人:y****n 文档编号:245026637 上传时间:2024-10-07 格式:PPT 页数:49 大小:583.50KB
返回 下载 相关 举报
分析化学中的数据处理_第1页
第1页 / 共49页
分析化学中的数据处理_第2页
第2页 / 共49页
分析化学中的数据处理_第3页
第3页 / 共49页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,河北农大化学系,臧晓欢,1,3.3,分析化学中的数据处理,总体 样本 数据,统计方法,样本容量,n,:,样本所含的个体数,.,抽样,观测,一、基本概念,2,平均值,(设样本容量为,n,),总体均值,若没有系统误差,则总体平均值,就是真值,x,T,总体平均偏差,:,在分析化学中,测量值一般较少(例如少于,20,,故涉及到的是测量值较少时的平均偏差;但在用统计学处理数据时,广泛采用标准偏差来衡量数据的分散程度。,3,总体标准偏差:,(测量次数为无限多次时),样本标准偏差:,(测量值不多时),式中(,n-1,)称为自由度,以,f,表示,当测,量次数非常多时,4,偏差和,标准偏差关系,例如:求下列三组数据的,d,和,S,第一组,10.02,,,10.02,,,9.98,9.98,平均值,=10.00,,,=0.02,,,S=0.02,第二组,10.01,10.01,10.02,9.96,平均值,=10.00,=0.02,S=0.027,第三组,10.02,10.02,9.98,9.98,10.02,10.02,9.98,9.98,平均值,=10.00,=0.02,S=0.021,5,3.3.1,随机误差的正态分布,1,频数分布,:,测定某样品,100,次,,因有偶然误差存在,故分析结果有高有低,有两头小、中间大的变化趋势,即在平均值附近的数据出现机会最多,。,相对频数分布直方图分布特点,(,1,)离散特性,(,2,)集中趋势,6,7,测量数据一般符合正态分布规律,即高斯曲线,y,:概率密度;,x,:测量值,:总体平均值,即无限次测定数据的平均值,无系统误差时即为真值;反映测量值分布的集中趋势。,:标准偏差,反映测量值分布的分散程度;,x-,:随机误差,2,正态分布,8,正态分布曲线规律:,*x=,时,,y,值最大,体现了测量值的集中趋势,*,曲线以,x=,这一直线为其对称轴,说明,正误差和负误差出现的概率相等,*,当,x,趋于,或时,曲线以轴为渐近线。,即小误差出现概率大,大误差出现概率小,*,越大,即精密度越差时,测量值的分布就越分散,正态分布曲线也就越平坦。反之,,越小,测量值的分散程度就越小,正态分布曲线也就越尖锐。,反映测量值分布分散程度,9,横坐标改为,u,,纵坐标为概率密度,此时曲线的形状与,大小无关,不同,的曲线合为一条,标准正态分布曲线,标准正态分布曲线,10,随机误差的区间概率,正态分布曲线与横坐标,-,到,+,之间所夹的面积,代表所有数据出现概率的总和,其值应为,1,,即概率,P,为:,11,不同,u,值对应的积分值做成表,表,3.2,正态分布概率积分表,12,随机误差出现的区间 测量值出现的区间,概率,(,以,为单位,),u=1 x=1 68.3%,u=1.96 x=1.96 95.0%,u=2 x=2 95.5%,u=2.58 x=2.58 99.0%,u=3 x=3 99.7%,13,例,1,已知某试样中质量分数的标准值为,1.75%,,,=0.10%,,又已知测量时没有系统误差,求分析结果落在,(1.750.15)%,范围内的概率。,解:,例,2,同上例,求分析结果大于,2.00%,的概率。,解:属于单边检验问题。,阴影部分的概率为,0.4938,。整个正态分布曲线右侧的概率为,1/2,,即为,0.5000,,故阴影部分以外的概率为,0.5000,0.4938=0.62%,,即分析结果大于,2.00%,的概率为,0.62%,。,14,1.,平均值的标准偏差,设有一样品,,m,个分析工作者对其进行分析,每人测,n,次,计算出各自的平均值,这些平均值的分布也是符合正态分布的。,试样总体,样本,1,样本,2,样本,m,3.3.2,总体平均值的估计,平均值的标准偏差 一定比单个样品,n,次测定的,s,要小,15,对有限次测量:,1,、增加测量次数可以提高精密度。,2,、增加(过多)测量次数的代价不一定能从减小误差得到补偿。一般,3,4,次就可以了。,结论:,测量次数,平均值的总体标准偏差:,平均值的标准偏差 单次测定结果的,s,之间的关系,16,2,少量数据的统计处理,1 t,分布曲线,正态分布是无限次测量,数据的分布规律,而对有,限次测量数据则用,t,分布曲,线处理。用,s,代替,,,纵坐,标仍为概率密度,但横坐,标则为统计量,t,。,t,定义为:,17,t,分布曲线下面一定区间内的积分面积,就是该区间内随机误差出现的概率。,t,分布曲线的意义:,18,t,分布曲线与标准正态分布曲线的区别,t,值与,u,值的区别:用有限次测定的,s,代替了总体,。,t,分布曲线随,f,的不同而不同。,t,分布曲线比正态分布曲线更“矮胖”,说明有限次测定值的分布更分散。,t,积分,是先设定,p,,已知,f,,查,t,值,此时,p,对应了正负,t,曲线下的面积;,u,积分,是已知,,,值,求,,再查,p,值。,19,平均值的置信区间,置信度,P,:,在某一,t,值时,测定值落在(,ts),范围内的概率。落在此范围之外的概率为(,1-P),称为显著性水准,。,t,a,,,f,:,t,值与置信度,P,及自由度,f,关系。,例:,t,005,,,10,表示置信度为,95%,,自由度为,10,时的,t,值。,t,001,,,5,表示置信度为,99%,,自由度为,5,时的,t,值。,20,单,次测量结果、,样本平均值来估计总体平均值可能存在的区间:,对于少量测量数据,即,当,n,有限时,,必须根据,t,分布进行统计处理:,它表示在一定置信度下,以,平均值为中心,,,包括,总体平均值的可靠性范围,即平均值的置信区间,。,平均值的置信区间,21,t,(,f,),f,置信度,p,,显著水平,P=0.50,=,0.50,P=0.90,=,0.10,P=0.95,=,0.05,P=0.99,=,0.01,1,1.00,6.31,12.71,63.66,2,0.82,2.92,4.30,9.93,3,0.77,2.35,3.18,5.84,4,0.74,2.13,2.78,4.60,5,0.73,2.02,2.57,4.03,6,0.72,1.94,2.45,3.71,7,0.71,1.90,2.37,3.50,8,0.71,1.86,2.31,3.36,20,0.69,1.73,2.09,2.85,0.67,1.64,1.96,2.58,t,分布值表,22,例 对其未知试样中,Cl,-,的质量分数进行测定,,4,次结果为,47.64%,,,47.69%,,,47.52%,,,47.55%,。计算置信度为,90%,,,95%,和,99%,时,总体平均值,的置信区间。,解:,23,24,3.4,显著性检验,1.,平均值与标准值的比较,-,t,检验法,步骤:,a.,将 ,,和,n,代入,求,t,计,b.,由已知的,f,和,P,值查,t,表,(,表,3-3,61,页),c.,比较,如,t,计,t,表,,说明有显著性差异,存在系统误差。反之则无显著性差异,25,例 采用某种新方法测定基准明矾中铝的质量分数,得到下列,9,个分析结果:,10.74%,,,10.77%,,,10.77%,,,10.77%,,,10.81%,,,10.82%,,,10.73%,,,10.86%,,,10.81%,。已知明矾中铝含量的标准值,(,以理论值代,),为,10.77%,。试问采用该新方法后,是否引起系统误差,(,置信度,95%)?,解,n,=9,f,=9,1=8,查表,P,=0.95,f,=8,时,,t,0.05,,,8,=2.31,。,t F,a,f,存在显著性差异。,P65,,例,12,1.先F检验,两组数据精密度有没有差别,2.再t检验,两组平均值的比较,不同分析人员或是同一分析人员采用不同方法分析同一试样,所得到的平均值,一般是不相等的,若要判断这两组数据之间是否存在系统误差,即两平均值之间是否有显著差异,对于这样的问题,也可以采用,t,检验法。,设两组分析数据为:,S,称为合并标准偏差,总自由度,f=n,1,+n,2,-2,当,tt,表,时,可以认为有显著性差异,,t t,表,无显著差异,30,例 用两种方法测定合金中铝的质量分数,所得结果如下,:,第一法,1.26%1.25%1.22%,第二法,1.35%1.31%1.33%1.33%,试问两种方法之间是否有显著性差异,(,置信度,90%)?,解,n,1,=3,,,x,1,=1.24%,s,1,=0.021%,n,2,=4,,,x,2,=1.33%,s,2,=0.017%,f,大,=2 f,小,=3 F,表,=955,F t,010,,,5,,故两种分析方法之间存在显著性差异,.,统计检验的正确顺序,:,可疑数据取舍,F,检验,t,检验,32,3.5,异常值的取舍,在实验中得到一组数据,个别数据离群较远,这一数据称为异常值、可疑值或极端值。若是过失造成的,则这一数据必须舍去。否则异常值不能随意取舍,特别是当测量数据较少时。,处理方法有,4,法、格鲁布斯,(Grubbs),法和,Q,检验法。,33,(,1,),4,法,步骤:,排序,求出除异常值外的其余数据的平均值和平均偏差,异常值与平均值进行比较,如绝对差值大于,4,,则将可疑值舍去,否则保留。,当,4,法与其他检验法矛盾时,以其他法则为准。,34,例 测定某药物中钴的含量如,(g/g),得结果如下:,1.25,,,1.27,,,1.31,,,1.40,。试问,1.40,这个数据是否应保留,?,解 首先不计异常值,1.40,,求得其余数据的平均值,x,和平均偏差,d,为,异常值与平均值的差的绝对值为,|1.40,一,1.28|=0.12,4 d(0.092),故,1.40,这一数据应舍去。,4d,法例题,35,(,2,),格鲁布斯,(Grubbs),法,有一组数据,从小到大排列为,:,x,1,x,2,x,n-1,x,n,其中,x,1,或,x,n,可能是异常值。用格鲁布斯法判断时,首先计算出该组数据的平均值及标准偏差,再根据统计量,T,进行判断。,若,T,计,T,表,(,表,3-5,,,p67,),则异常值应舍去,否则应保留,36,格鲁布斯,(Grubbs),法例题,例 前一例中的实验数据,用格鲁布斯法判断时,,1.40,这个数据应保留否,(,置信度,95%)?,解 平均值,x=1.31,,,s=0.066,查表,T,005,,,4,=1.46,,,T,Q,表,时,异常值应舍去,否则应予保留。,38,39,3.6,回归分析法,3.6.1,一元线性回归方程,式中,x,,,y,分别为,x,和,y,的平,均值,,a,为直线的截矩,,b,为直线的斜率,它们的,值确定之后,一元线性回,归方程及回归直线就定了,。,40,2,相关系数,-,correlation coefficient,相关系数的物理意义如下:,a.,当所有的认值都在回归线上时,,r=1,。,b.,当,y,与,x,之间完全不存在线性关系时,,r=0,。,c.,当,r,值在,0,至,1,之间时,表示例与,x,之间存在相关关系。,r,值愈接近,1,,线性关系就愈好。,41,例 用吸光光度法测定合金钢中,Mn,的含量,吸光度与,Mn,的含量间有下列关系,:,Mn,的质量,g 0 0.02 0.04 0.06 0.08 0.10 0.12,未知样,吸光度,A,0.032 0.135 0.187 0.268 0.359 0.435 0.511 0.242,试列出标准曲线的回归方程并计算未知试样中,Mn,的含量。,解 此组数据中,组分浓度为零时,吸光度不为零,这可能是在试剂中含有少量,Mn,,或者含有其它在该测量波长下有吸光的物质。,设,Mn,含量值为,x,,吸光度值为,y,,计算回归系数,a,,,b,值。,a=0.038 b=3.95,标准
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!