计算药物分析药学与生物信息学第三章

上传人:cel****303 文档编号:243681588 上传时间:2024-09-28 格式:PPTX 页数:86 大小:1.85MB
返回 下载 相关 举报
计算药物分析药学与生物信息学第三章_第1页
第1页 / 共86页
计算药物分析药学与生物信息学第三章_第2页
第2页 / 共86页
计算药物分析药学与生物信息学第三章_第3页
第3页 / 共86页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第3章 实验数据的统计分析,3.1 统计分析的基本概念,3.2 实验数据的误差及分布,3.3 平均值的统计检验,3.4 方差的统计分析,3. 非参数统计分析,3.1 统计分析的基本概念,3.1.1 数据处理中的基本术语,3.1.2 样本的数字特征,3.1.3 统计分析的一般步骤,(复习),3.1.1 数据分析中的基本术语一、准确度和精密度,1.准确度和精密度分析结果的衡量指标。,( 1) 准确度分析结果与真实值的接近程度,准确度的高低用误差的大小来衡量;,误差一般用绝对误差和相对误差来表示。,(2) 精密度几次平衡测定结果相互接近程度,精密度的高低用偏差来衡量,,偏差是指个别测定值与平均值之间的差值。,(3) 两者的关系,精密度是保证准确度的先决条件;,精密度高不一定准确度高;,两者的差别主要是由于系统误差的存在。,精密度及其计算1、平均偏差,平均偏差又称算术平均偏差,,用来表示一组数据的精密度。,平均偏差:,特点:简单,缺点:大偏差得不到应有反映,2、标准偏差,相对标准偏差 :(变异系数),标准偏差又称均方根偏差,分两种:, 当测定次数趋于无穷大时,标准偏差 :, 为无限多次测定的平均值(总体平均值); 即,当消除系统误差时,即为真值,有限测定次数,标准偏差 :,例题,用标准偏差比用平均偏差更科学更准确.,例: 两组数据, 0.11, -0.73, 0.24, 0.51,-0.14, 0.00, 0.30, -0.21,n=8 d1=0.28 1=0.38, 0.18,0.26,-0.25,-0.37,,d1=d2,12,3、 平均值的标准偏差,m个n次平行测定的平均值:,当n 大于5时, S 变化不大,实际测定5次即可。,由统计学可得:,由S S n 作图:,4、置信度与置信区间,偶然误差的正态分布曲线:,定义,若随机变量,的概率密度为,正态分布(或高斯分布).,记作:,正态分布的概率密度与分布函数, 正态分布的定义,当,时称,服从,标准正态分布,.,记为:,其中,及,都是常数,,,则称随机变量,服从,正态分布,的概率密度,的图形:,分布曲线的特征:,1,.,关于直线,对称;,2,.,在,处达到最大值;,3,.,在,处有拐点;,4,.,时曲线以,轴为渐近线,.,正态分布的概率密度与分布函数, 正态分布的概率密度与分布函数,5,.,固定,改变,则图形沿,轴平移而不改变,其形状.,6,.,固定,改变,则当,很小时,,曲线的形状与一尖塔相似;,当,值增大时,,曲线将趋于平坦.,正态分布的概率密度与分布函数,正态分布,的分布函数为,正态分布的概率密度与分布函数,标准正态分布的概率密度:,标准正态分布的分布函数:,正态分布的概率密度与分布函数,的性质:,设,服从标准正态分布,求,解:,正态分布的概率密度与分布函数,也可用用MATLAB命令normcdf计算,设,服从标准正态分布,求,解:,正态分布的概率密度与分布函数,也可用用MATLAB命令normcdf计算,P=normcdf(2.5)- normcdf(-1.6),定理,证:,则, 一般正态分布的概率计算,正态分布的概率密度与分布函数,设随机变量,服从正态分布,求概率,解:,正态分布的概率密度与分布函数,设随机变量,服从正态分布,在区间,内的概率,,,这里,解:,求,落,正态分布的概率密度与分布函数,查附表2得,说明:,若,则,正态分布的概率密度与分布函数,由此可知,落在,之外的概率小于,,,根据小概率事件的实际不可能性原理,,通常把区间,这一原理叫做,“,三倍标准差原理”,可能的取值,看作是随机变量,的实际,区间.,正态分布的概率密度与分布函数,置信度与置信区间,S有限次测定的标准偏差; n为测定次数,对于有限次测定,平均值与总体平均值关系为:,置信度与置信区间,讨论:,1. 置信度不变时:n 增加, t 变小,置信区间变小;,2. n不变时:置信度增加,t 变大,置信区间变大;,置信度真值在置信区间出现的几率(P);,置信水准 = 1 - P,置信区间以平均值为中心,真值出现的范围;,5、有效数字及运算法则,有效数字,实验过程中常遇到两类数字:,数目:如测定次数;倍数;系数;分数,测量值或计算值。数据的位数与测定准确度有关。,记录的数字不仅表示数量的大小,而且要反映测量的精确程度。,有效数字的定义: 实际上能测量到的数字;,末位数欠准(1),有效数字,实际上能测量到的数字;末位数欠准(1)。,结果 绝对误差 相对误差 有效数字位数,0.51800 0.00001 0.002% 5,0.5180 0.0001 0.02% 4,0.518 0.001 0.2% 3,实验数据的记录,容量器皿;滴定管;移液管;容量瓶;4位有效数字,分析天平(万分之一)取4位有效数字,标准溶液的浓度,用4位有效数字表示: 0.1000 mol/L,pH 4.34,小数点后的数字位数为有效数字位数,对数值,lgX=2.38;lg(2.4102),(2) 有效数字的运算规则,加减运算,结果的位数取决于绝对误差最大的数据的位数,26.71,乘除运算,有效数字的位数取决于相对误差最大的数据的位数。,0.0325 0.0001/0.0325 100%=0.3%,5.103 0.001 /5.103 100%=0.02%,60.0 0.01 /60.0 100%=0.02%,139.8 0.1 /139.8 100% =0.07%,数字修约规则,过去沿用“四舍五入”,见五就进,能引入明显的舍入误差(误差累计),使修约后的数值偏高。,“四舍六入五成双”规则是逢五有舍、有入,使由五的舍、入引起的误差,可以自相抵消,因而更为合理,,因此,国家对数字修约的标准采用此规则。,规则:,四舍六入五成双(或尾留双),例 将下列测量值按数字修约规则,修约为三位数。,4.135修约为4.14;,4.125为4.12;,4.105为4.10(0以偶数计);,4.1251为4.13;4.1250 为4.12(五后非零数的处理),4.1349为4.13, 不允许分次修约,例:4.1349修约为三位数。不能先修约成,4.135,再修约为4.14,只能修约成4.13。,可先多保留一位有效数字,运算后再修约。,5.3527 + 2.3 + 0.055 + 3.35, 对标准偏差的修约,二位: 0.22;, 注意点:, “0”的双重性: 有效数字和定位. 20.30; 0.02030; 2.03010-2,变换单位位数不变: 20.30 mg; 2.030 10 4g, 首位数8: 位数多计一位。 8.6; 99.2%, 对数: 有效数字以尾数为准。 pH=11.02 H+ = 9.6 10-12, 实验记录数据: 只保留一位欠准数字,总体:,研究对象的全体。,样本:,从总体中抽出的一部分样品。,3.1.2 样本的数字特征,统计分析的目的:,样本 总体,均值:,极差:,标准偏差:,3.1.2 样本的数字特征,甲:,乙:,相对标准偏差:,样本均值的标准偏差:,样本的数字特征,变异系数,均值:,极差:,标准偏差:,样本的数字特征,(EXCEL - 工具 - 数据分析 描述统计),3.1.3 统计分析的一般步骤,被检验的假设称为原假设或零假设H0,而把原假设的对立面称为对立假设或备择假设,记为H1 。,为了检验是否正确,是先假设正确,根据分析计算的统计量如果出现不合理的结果,则判断不正确,则拒绝接受。,基于小概率事件原理。对所谓的小概率,习惯上使用一个指标,称为显著性水平(significance level)。基于这种原理的检验称为显著性检验。,几个基本问题,检验假设: 零假设 (H0)和备择假设(H1),检验类型: 单侧、双侧,单尾 、双尾,误差类型: 、,、,检验结果: NS、S,接受、否定H0,否定、接受H1,2. 检验类型:,不同检验类型 H 的格式,H1 12 12 12,否定H0 的区域 1 (左边) 2(两边) 1(右),检验类型 单侧 双侧 单侧,3. 误差类型: (把客观上符合假设H0判为不符合假设H0的错误,即“以真为假”的错误)、(把客观上不符合假设H0而予以接受的错误,即“以真为假”的错误)。图a说明减小, 将增加;图b说明、 都随样本容量增大而减小。,4. 检验结果: NS、S,接受、否定H0 (P0.05),否定、接受H1 (P0.05, NS; P Qx 舍弃该数据, (过失误差造成),若Q G 表,弃去可疑值,反之保留。,由于格鲁布斯(Grubbs)检验法引入了标准偏差,故准确性比Q 检验法高,基本步骤:,(1)排序:,(2)求 和标准偏差S;,(3)计算G值;,3.2.2 分析测试中的误差传递,1、系统误差的传递,若定量分析中各步测量误差是可定的,则系统误差传递的规律可概括为:,和、差的绝对误差等于各测量值绝对误差的和、差;,积、商的相对误差等于各测量值相对误差的和、差。, R = x+y-z R= x+ y-z, R=xy/z R/R= x/x+ y/y-z/z,例: 减重法称量 滴定管读数,2、偶然误差的传递,极值误差法, R = x+y-z R= x+ y+z, R=xy/z R/R= x/x+ y/y+ z/z,标准误差法:,1) 和、差结果的标准偏差的平方等于各测量值的标准偏差的平方和。,2) 积、商结果的相对标准偏差的平方等于各测量值相对标准偏差的平方和。,例: 样品含量计算,3.2.3 误差的正态分布和t分布,偶然误差的分布曲线:,正态()分布 (n 30),t分布 (n 30) x,t分布(有限次数: n =35 ),平均值的精密度和置信区间,平均值的精密度- 标准偏差,某样品测试次数100次,平均含量为215,,试求:,含量测定结果250的概率;,统计意义上含量测定结果在200,250,之间的概率;,占测定次数95%的含量范围。,例题:,误差的正态分布和t分布,因测定次数为100,,可按正态分布进行统计检验。,查附表3-2,,得,解:,因本次统计试验为单侧试验,故含量测定的结果250的概率为0.16。,250,之间的概率为:,测定结果在200,占测定次数95%的含量范围应为:,解:,统计意义上含量测定结果在200,占测定次数95%的含量范围。,250,之间的概率;,查表得,3.3 平均值的统计检验-系统误差的判断,1、u 检验 (n30 或已知符合正态分布),3.3 平均值的统计检验-系统误差的判断,b. 由要求的置信度和测定次数,查表,得: t表,c. 比较,t计t表 ,表示有显著性差异,存在系统误差,被检验方法需要改进。,t计30),2. t 检验 准确度差别检验,样本平均值与标准值()的比较,a. 计算t值,(2)两组数据的平均值比较(同一试样),t 检验法,新方法-经典方法(标准方法),两个分析人员测定的两组数据,两个实验室测定的两组数据,a求合并的标准偏差:,也可由两组数据的平均值计算,查表(自由度f f 1 f 2n1n22),比较:,t计t表 ,表示有显著性差异,计算值:,两个均值比较,例3-8,甲:,乙:,,,问:这两个实验室的测定结果有无显著性差异?,解:,结论:,95%置信水平上二组数据不存在显著性差异,既可认为两个实验室的测定统计意义上不存在显著性差异。,如:,同一批对象实验前后某一指标的变化,每对实验对象分别予以不同处理,检验假设:,统计量:,若,则,否定,成对地进行对比试验,配对实验,两个均值的比较,样本均数和总体均数的比较,配对实验,例题3-9,某化验师应用两种不同的方法测定10个样品,其结果列表如下,问两者有无显著差异?,两个方法所得结果无显著差别,既统计意义上不存在系统误差。,结论:,样品,结果,解:,3.4 方差的统计分析,检验 精密度差别检验,H0: S12 = S22 H1:S12 S22,查表(单侧表),比较,F计F表 S12 S22,计算值:,注意点:, 检验顺序: G F t,双侧检验和单侧检验:表格,临界值: t 0.05,d.f., 1 = t 0.1,d.f.,2,t 0.025,d.f.,1 = t 0.05,d.f.,2, P 或 的选择: 常用 P =0.95 =0.05, 过大,易犯第一类错误(以真为假);, 过小,易犯第二类错误(以假为真).,F检验,统计量:,方法:,求F值,F与,比较,,,若,则,两组数据的精密度无显著性差异,3.4 方差的统计分析,3.4.1 两个方差的比较,两组数据的精密度显著差异检验,方差分析:,对实验数据的方差进行分析.,基本思想:,实验数据的总方差(复差平方和)分解为组间方差和组内方差,用下一检验判断两种不同来源的方差有无显著性差异。,例3-11,实验室 一二三 四五六七,1.64.61.21.566.23.3,2.92.81.92.73.93.83.8,3.532.93.44.35.55.5,1.84.51.125.84.24.9,2.23.12.93.445.34.5,总数12181013242522,均数2.43.622.64.854.4,现要求七个实验室用同一测定方法分析某牛奶样品中的,黄曲霉素,各测定5次,其实验数据如下:,问:七个实验室的分析结果是否不同?,3.4.2 单因素方差分析,解 实验室数据为测定次数相同的单因素多水平试验。首先分解变差平方和和自由度:,本例的35个数据与总均数的 变差平方和为总变差平方和( );7个实验室各自测定值的均数与总均数 变差平方和称为组间变差平方和( );7个实验室各自测定值与该组均数的变差平方和称为组内变差平方和( )。可以证明:,因此方差分析的统计检验为:,H0:,H1:,3.5 非参数统计分析,Excel 电子表格统计功能的使用,1、插入函数,2、数据分析,函数的应用: 插入函数,chitest,chidist,chiinv,3.5.2 中位数及其稳健性,3.5.3 盒图法描述一维数据,根据计算得到的 ,FL,FU,df,即可绘制盒图。以一个长方形的盒子表示FLFU50%实验点,从盒图的两侧各绘制一条水平线,称为盒尾。其长度分别对应于-1.66和18.511,即包括了所以正常值,而逸出值22落在右盒尾线的外侧。,从图中可以直观地获得许多有用的信息:,掌握中位数和四分位数的数值;,从盒长了解50%数据分散的程度;,根据中位数在盒中部偏斜的程度判断数据分布的斜度;,由盒长和尾长的关系判断全部数据分布集中和分散的程度;,剔除逸出值 。,小结,1.,名词解释:,u,检验、,t,检验、中位数、方差分析;,2,试验,boxplot,;,3.,试说明实验数据统计检验的基本方法;,4.,对两组实验数据进行准确度差别检验时应注意什么问题?,5.,单因素和双因素方差分析有何区别?试举例说明其使用方法。,6.,什么是非参数统计分析?和经典的优化方法有何区别?,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 压缩资料 > 基础医学


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!