第二章试验检测数据的分析与处理

上传人:小*** 文档编号:243375581 上传时间:2024-09-22 格式:PPT 页数:50 大小:1.42MB
返回 下载 相关 举报
第二章试验检测数据的分析与处理_第1页
第1页 / 共50页
第二章试验检测数据的分析与处理_第2页
第2页 / 共50页
第二章试验检测数据的分析与处理_第3页
第3页 / 共50页
点击查看更多>>
资源描述
,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第二章 试验检测数据的分析与处理,学习要求:,熟悉数理统计特征值及抽样检验,掌握数据修约法则,熟悉数据的表达方法;会进行一元线性回归分析,能运用相关法则对特异数据的取舍判断。,第一节 数据的统计特征及抽样检验,第二节 数据的处理与表达方法,第一节 数据的统计特征及抽样检验,一、数据的统计特征及表达,1.,总体与样本,总体又称母体,是统计分析中所需要研究对象的全体。而组成总体的每个单元称为个体。从总体中抽取一部分个体就是样本(又称子样)。,例如,从每一桶沥青中抽取两个试样,一批沥青有100桶,抽检了200个试样做试验,则这100桶沥青称为总体,200个试样就是样本。而组成样本的每一个个体,即是样品。例如上述200个试样中的某一个,就是该样本中的一个样品。,第一节 数据的统计特征及抽样检验,一、数据的统计特征及表达,2.,数据的统计特征量,工程质量数据的统计特征量分为两类:,一类是表示统计数据的规律性,主要有算术平均值、中位数、加权平均值等;,另一类是表示统计数据的离散性,即工程质量的波动性,主要有极差、标准偏差、变异系数等。,第一节 数据的统计特征及抽样检验,一、数据的统计特征及表达,2.,数据的统计特征量,(,1,)算术平均值。,算术平均值是表示一组数据集中位置最有用的统计特征量,【例,2-1,】,某路段沥青混凝土面层抗滑性能检测,摩擦系数的检测使用摆式仪法,测得的摩擦摆值,FB,(,BPN,)(共,10,个测点)分别为:,58,、,56,、,60,、,53,、,48,、,54,、,50,、,61,、,57,、,55,。求摩擦系数的算术平均值。,解:摩擦系数的算术平均值:,(,BPN,),(,2,)中位数。,在一组数据,x,1,、,x,2,、,、,x,n,中,按其大小次序排序,以排在正中间的一个数表示总体的平均水平,称之为中位数,或称中值,用表示。,【例,2-2,】检测值同例,2-1,,求中位数。,解:检测值按大小次序排列为:,61,、,60,、,58,、,57,、,56,、,55,、,54,、,53,、,50,、,48,(,BPN,),,n,=10,,则中位数为:,(,BPN,),(,3,)极差。,在一组数据中最大值与最小值之差,称为极差,记作:,【例,2-3,】例,2-1,中的检测数据的极差为,(,BPN,),(,4,)标准偏差。,也称标准离差、标准差或称均方差,它是衡量样本数据波动性(离散程度)的指标。,(,5,)变异系数。,变异系数是反映样本数据的相对波动状况。,【例,2-5,】,若甲路段沥青混凝土面层的摩擦系数测得摆值的算术平均值为,55.2,,标准偏差为,4.13,;乙路段的摩擦系数测得摆值的算术平均值为,60.8,,标准偏差为,4.27,。则两路段的变异系数为:,甲路段:,乙路段:,从标准偏差看, 。但从变异系数分析,,说明甲路段的摩擦系数相对波动比乙路段的大,面层抗滑稳定性较差。,二、抽样检验基础,检验是指通过测量、试验等质量检测方法,,,将工程产品与其质量要求相比较并作出质量评判的过程。工程质量检验是工程质量控制的一个重要环节,,,是保证工程质量的必要手段。,检验可分为全数检验和抽样检验两大类。全数检验是对一批产品中的每一个产品进行检验,,,从而判断该批产品质量状况,;,抽样检验是从一批产品中抽出少量的单个产品进行检验,,,从而推断该批产品质量情况。全数检验较抽样检验可靠性好,,,但检验工作量非常大,,,往往难以实现,;,抽样检验方法以数理统计学为理论依据,,,具有很强的科学性和经济性,,,在许多情况下,,,只能采用抽样检验方法。,二、抽样检验基础,公路工程不同于一般产品,,,它是一个连续的整体,,,且采用的质量检测手段又多属于破坏性的。所以,,,就公路工程质量检验而言,,,不可能采用全数检验,,,而只能采用抽样检验。即从待检工程中抽取样本,,,根据样本的质量检查结果,,,推断整个待检工程的质量状况,。,二、抽样检验基础,质量检验的目的在于准确判断工程质量状况,以促进工程质量的提高。其有效性取决于检验的可靠性,而,检验的可靠性,与以下因素相关:,(,1,)质量检验手段的可靠性。,(,2,)抽样检验方法的科学性。,(,3,)抽样检验方案的科学性。,在质量检验过程中,必须全面考虑上述3个因素,以提高质量检验的可靠性。,二、抽样检验基础,1,抽样检验的类型,总的来说,抽样检验可分为,非随机抽样和随机抽样,两大类。,(1)非随机抽样。,进行人为的有意识的挑选取样即为非随机抽样。非随机抽样中,人的主观因素占主导作用,由此所得到的质量数据,往往会对总体做出错误的判断。因此,采用非随机抽样方法所得的检验结论,其可信度较低。,二、抽样检验基础,1,抽样检验的类型,(2)随机抽样。,随机抽样排除了人的主观因素,使待检总体中每一个产品具有同等被抽取到的机会。只有随机抽取的样本才能客观地反映总体的质量。这类方法所得到的数据代表性强,质量检验的可靠性得到了基本保证。因此,随机抽样是以数理统计的原理,根据样本取得的质量数据来推测、判断总体的一种科学抽样检验方法,因而被广泛使用。,二、抽样检验基础,2,随机抽样的方法,先举一个例子来说明随机抽样的方法。假如有一批产品,共100箱,每箱20件,从中选择200个样品。一般有以下几种抽样方法,(1)从整批中,任意抽取200件。,(2)从整批中,现分成10组,每组为10箱,然后分别从各组中任意抽取20件。,(3)从整批中,分别从每箱中任意抽取2件。,(4)从整批中,任意抽取10箱,对这10箱进行全数检验。,上述四种方法,分别称为单纯随机抽样、系统抽样、分层抽样、密集群抽样。,二、抽样检验基础,2,随机抽样的方法,随机抽样的方法有多种,适合于公路工程质量检验的随机抽样方法一般有以下4种:,(1)单纯随机抽样。这是一种完全随机化的抽样方法,适用于对总体缺乏基本了解的场合。,(2)分层抽样。一项工程或工序往往是由若干不同的班组施工的。如:同一个班组施工的工程或工序作为一层,若某项工程或工序是由3个不同的班组施工的,则可分为3层,然后按一定比例确定每层应抽取样品数,对每层则按单纯随机抽样法抽取样品。分层时,应尽量使层内均匀,而层间不均匀。分层抽样法便于了解每层的质量状况,分析每层产生质量问题的原因。,二、抽样检验基础,2,随机抽样的方法,(3)两级取样。当物品堆积较多,数量较大时,可先从堆中挑选进行一级取样,再从取出的样品中进行二次随机取样。,(4)系统抽样。对总体实行单纯随机抽样有困难时,如连续作业时抽样、产品为连续体时抽样(如测定路表面的弯沉值)等,可采用一定时间间隔或距离进行抽取的方法,称为系统取样或等距离取样。,二、抽样检验基础,3,抽样检验的评定方法,抽样检验的目的,就是根据样本取得的质量数据来推测样本所属的一批产品或工序的质量状况,并判断该批产品或该工序是否合格。,假如d为抽出样本中不合品数;c为抽样中允许不合格品数(或称合格判定数)。若dc,则认为该批产品合格,可以接受;若dc,则说明该批产品不合格,应拒绝接受。,二、抽样检验基础,3,抽样检验的评定方法,根据公路工程质量检验评定标准,公路工程质量评定采用合格率与评分的方法,也就是根据检测值是否符合质量标准进行评定,按合格率计分。对于路基路面压实度、弯沉值,路面结构层厚度,半刚性基层材料强度,水泥混凝土抗折强度等检验项目,应采用数理统计的方法进行评定计分。,二、抽样检验基础,4.抽样检验的意义,在产品检验中,,,全数检验的应用场合很少,,,大多数情况下是采取抽样检验。这是因为,:,(1)由于无破损检验依据机械的种类很少,,,性能难以稳定,,,在无法采用无破损性检验时,,,就得采用破坏性检验,,,而破坏性检验是不可能对全部产品都做检验的。,(2)当检验对象为连续性物体或粉块混合物时(如油、沥青、水泥等),,,在一般情况下可能对全体物品质量特性进行检测试验,二、抽样检验基础,4.抽样检验的意义,(3)由于产品每批的质量往往有波动,,,尤其是在产品量大、金额高、检验项目多的场合,,,采用全数检验是不可能的,,,用无损试验也有可能导致由于产品不良品率高而带来重大的经济损失。此时,,,抽样检验则十分必要。,(4)抽样检验由于检验的样本较小,,,因而可以收集质量信息,,,提高检验的全面程度和促进质量的改善。,三、数据的修约法则,1,检测数据的来源,检测数据就其本身的特性来说,可以分为计量值数据和计数值数据。,(,1,)计量值。,计量值数据是可以连续取值的数据,如长度、厚度、直径、强度等质量特征。可以表示大小和单位,一般都带有小数。,(,2,)计数值。,计数值数据的特点是不连续,如不合格品数、缺陷的点数等,它们一般没有单位,只有大小且只能用整数或百分数表示。,2,数值修约进舍规则,四舍六入五考虑,五后非零则进一,五后为零视奇偶,奇升偶舍要注意,修约一次要到位。,三、数据的修约法则,2,数值修约进舍规则,(1)拟舍弃数字的最左一位数字小于5时,,,则舍去,,,留下的数字不变。例如,,,将13.2476 约到一位小数时,最左面的第一位数字是4,,,则应舍去,,,结果为13.2。,(2)拟舍弃数字中,,,其最左面的第一位数字大于5时,,,则进1,,,所留下的末位数字加1,。,如将26.567修约到一位小数时,,,其拟舍去的数字中最左面的第一位数字是6,,,则进1,,,结,果为26.6,。,三、数据的修约法则,2,数值修约进舍规则,(,3,),拟舍去的数字中最左面的第一位数字是5,时,而后面的数字并非全是,0,时,则进,1,,即所留下的末位数字加,1,。如,13.0521,修约到一位小数时,其拟舍去的数字中最左面的第一位数字是,5,,,5,后面的数字还有21,所以要进1,,,结果为13.1,。,三、数据的修约法则,2,数值修约进舍规则,(4)拟舍弃数字的最左一位数字为5,,,而后面无数字或全部为0时,,,所保留的数字末为奇数(1,3,5,7,9)则进1,,,为偶数(2,4,6,8,0)则舍去。如将15.05、15.15、 5.25、15,.,45几个数字只保留一位小数,,,则可分别修约为15.0、15.2、15.2、15,.,4。通常所说的奇进偶不进。,三、数据的修约法则,2,数值修约进舍规则,(5)拟舍去的数字并非单独的一个数字时,,,不得对该数值连续进行修约,,,应按拟舍去的数字中最左面的第一位数字的大小,,,按上述各条一次修约完成。例如将15,.,4546修约成整数时,,,不应按15,.,4546-15,.,455-15,.,4615.516进行,,,而应按15,.,4546-15进行修约。,三、数据的修约法则,2,数值修约进舍规则,上述数值修约规则(有时称之为“奇升偶舍法”)与常用的“四舍五入”的方法区别在,,,用“四舍五入”法对数值进行修约,,,从很多修约后的数值中得到的均值偏大。而用上述修约规则,,,进舍的状况具有平衡性,,,进舍误差也具有平衡性,,,若干数值经过这种修约后,,,约值之和变大的可能性与变小的可能性是一样的。,三、数据的修约法则,2,数值修约进舍规则,四舍六入五考虑,五后非零则进一,五后为零视奇偶,奇升偶舍要注意,修约一次要到位。,第二节 数据的处理与表达方法,一、数据的表达方法和数据分析,1,数据的表达方法:,表格法、图示法和经验公式法等。,(,1,)表格法。,当无须获得自变量的函数关系或为了便于计算,可将数据列成表格。,表格法简单方便,应用广泛,但有下列缺点:,表格法不能清晰的反映出数据之间的关系;,表格法不易看出变量之间的变化规律;,表格法对试验数据不能进行数学解析。,当自变量的函数关系无须获得,或为了便于计算,才将数据列成表格,若想得出未测定的某个值时,可用内插法估计。,(,2,)图形法。,从图形上易看出函数的变化规律,但对图形解析困难,从图形上得到某点函数值时,误差会很大。,图示法的基本要点为:,坐标纸的大小与分度的选择应与测量数据的精度相适应。,坐标轴应注明分度值的有效数字和名称、单位,必要时还要标明试验条件,坐标的文字书写方向应与该坐标轴平行,在同一图上表示不同数据时应该用不同的符号加以区别。,测量数据往往是分散的,如果用短线连接各点得到的就不是光滑的曲线,而是折线,需要对曲线进行平滑处理。,(,3,)经验公式法。,测量数据不仅可用图形表示出函数之间的关系,而且可用与图形对应的一个公式来表示所有的测量数据,当然这个公式不可能完全准确地表达全部数据。因此,常把与曲线对应的公式称为经验公式,在回归分析中则称之为回归方程,根据一系列测量数据,建立函数关系式的基本步骤可以归纳如下:,描绘曲线。,以自变量为横坐标,因变量为纵坐标,将测量数据点绘在坐标纸上,并把数据点描绘成测量曲线。,(,3,)经验公式法。,对描绘的曲线进行分析,确定函数关系式的基本形式。,a.如果数据点描绘的基本上是直线,则可用一元线性回归方法确定直线方程。,b.如果数据点描绘的是曲线,则要根据曲线的特点判断曲线属于何种类型。判断时可参现成的数学曲线形状加以选择,对过择的曲线则按一元非线性回归方法处理。,c,.,如果测量曲线很难判断属何种类型,则可按多项式回归处理。,(,3,)经验公式法。,曲线直化。,如果测量数据描绘的曲线被确定为某种类型的曲线,则可先将该曲线方程变换为直线方程,然后按一元线性回归方法处理。例如:双曲线 ,坐标变换时令 , ,即取 一为纵坐标, 一为横坐标,双曲线就变成直线了,所得线性方程为,,其他形式的曲线也可按类似的方法化为直线。,(,3,)经验公式法。,确定回归方程中的常量。,代表测量数据的直线方程或经曲线化直后的直线方程表达式为y=a+bx,可根据一系列测量数据确定方程中的常量a和b,其方法一般有图解法、端值法、平均法和最小二乘法等。,检验所确定公式的准确性。,即用测量数据中自变量值代入公式计算出函数值,看它与实际测量值是否一致,如果差别很大,说明所确定的公式基本形式可能有错误,则应建立另外形式的公式。,2,相关图及回归分析,(,1,)相关图。,相关图又称散布图或散点图,它是将有对应关系的两种数据点在一张坐标图上所得。,在原因分析中,常常会遇到一些变量共处于一个统一体中,它们相互联系,又相互制约,在一定条件下可相互转化。这些相互关联的变量可分为两种类型:第一类是两种以上变量之间存在着确定的关系。如面积与半径的关系S=,R,2,。,2,相关图及回归分析,第二类是变量之间有关系,但又不能由一个交量精确地求出另一变量的值。如路基土的回弹模量E,0,与土的含水量,w,有关,对于同一种土,,w,增大时,E,0,变小,但是不能用精确公式准确表示出它们的关系,对于第二类变量,如果将两种有关的数据列出,并用点描绘在坐标纸上,观察两种变量之间的相互趋势,这种图就是相关图。,2,相关图及回归分析,相关图的种类。,相关图的类型很多,一般可归纳为以下几种形式 :,a.,强正相关。,b.,弱正相关。,c.,强负相关。,d.,弱负相关。,e.,不相关。,f.,非线性相关。,2,相关图及回归分析,相关图的作图方法。,(,1,)数据收集分组:将两组特性数据集中,对应分组(一般应在,30,组以上),填入表中。,(,2,)定坐标。以要因作为,x,轴,结果(特征)作为,y,轴。,(,3,)数据打点入座。对应描出纵横坐标交点。,(,4,)说明。在图中适当的位置标明数据的个数、采集时间、工程部位、制图人和制图日期。,(,2,)回归分析。,若两个变量,x,和,y,之间存在一定的关系,并通过试验获得,x,和,y,的一系列数据,用数学处理的方法得出这两个变量之间的关系式,这就是回归分析 。,如果两变量,x,和,y,之间的关系是线性关系,就称为一元线性回归。如果两变量之间的关系是非线性关系,则称为一元非线性回归或称曲线拟合。,线性回归分析的表达式为:,y=a,十,bx,式中:,a,称为常数项,,b,称为回归系数。,相关系数,-,线性关系的显著检验,回归直线方程求得后,还须解决一个问题:,x,与,y,是否有线性关系?或者说,x,与,y,的线性相关程度如何?为了回答这个问题,需要建立一个检验法,即相关系数检验法。统称计量,r,为样本相关系数,用下式表示:,检验结论的判定:,r,=1,为完全线性相关;,r,=0,时,完全线性无关;当,0,r, r,0,,则说明线性相关关系显著;若,r,r,0,,则线性相关关系不显著。,二、检测数据的误差分析,1,误差的产生与种类,误差,=,测定值,-,真值,真值可表达为理论真值、约定真值、相对真值、近似真值。,(1)理论真值。如理论公式、设计值、图样尺寸值等。,(2)约定真值。实际测量中以在没有系统误差的情况下,足够多次的测量值之平均值作为约定真值。,(,3)相对真值。用高一级仪器检定低一级仪器,当高一级仪器与低一级仪器的误差比为(1/31/20)时,则可认为前者是后者的相对真值。,(4)近似真值。当测量重复无限次时,其结果的平均值可以认为是近似真值。,二、检测数据的误差分析,2,误差的来源,1,)实验装置误差。,2,)环境误差。,3,)人员误差。,4,)方法误差。,3,、误差的分类:,1,)系统误差:可以采取适当的措施消除或校正。,2,)随机误差:无法消除其影响。,3,)过失误差:认真操作,可以避免。,4,测定值的精密度、准确度和精确度,(,1,)精密度:表示测量结果中,随机误差,大小的程度。,(,2,)准确度:表示测量结果中,系统误差,大小的程度。,(,3,)精确度:是测量结果中,随机误差与系统误差的总和,结果。,(a),精密度,(b),准确度,(c),精确度,三、特异数据的取舍原则和方法,在进行数据分析之前,一般应对数据判断和处理:,(,1,)首先检查是否有过失误差存在。,(,2,)如果有条件,可在误差较大处增加测定次数,以发现原因。,(,3,)对于不能确定哪一测值是坏值的情况下,可在数理统计的基础上进行判断予以剔除。,几种主要的判断方法,1,、拉依达准则(,3,或,3s,准则)(适用于,n50,的情况),设:,x,1,、,x,2,x,k,x,n,是从总体中抽取的样本,其中,x,k,为过大或过小值。,(,1,)计算数据的平均值和标准差,如果总体标准差未知是,可求出样本标准偏差,s,;,(,2,)计算,x,k,-,, 如果:,x,k,-,3,则将,x,k,剔除,否则保留。,该方法的优点是计算方便、迅速,不用查表,但是判断过于粗糙,只适用于样本容量,n50,的情况。,2,、肖维纳特准则,设:,x,1,、,x,2,x,k,x,n,是从总体中抽取的样本,其中,x,k,为过大或过小值。判断方法如下:,(1),计算数据的平均值和标准偏差,,如总体标准偏差,未知时,可求出样本标准偏差,s,;,(2),计算,x,k,-,,如果,x,k,-,k,x,(,未知时以,s,代替,) 则可将,X,k,剔除,否则保留。,上式中,k,x,是与样本容量,n,有关的系数,,可查表,。,3,、格拉布斯准则,设:,x,1,、,x,2,x,k,x,n,是从总体中抽取的样本,其中,x,k,为过大或过小值。判断方法如下:,(1),计算数据的平均值,如总体标准偏差,未知时,可求出样本标准偏差,s,;,(2),计算,x,k,-,,如果,x,k,-,g,0,(,,,n,),(,未知时以,s,代替,),则可将,X,k,剔除,否则保留。,应用判断准则时应注意以下几点:,(1),剔除可疑数据时,首先应对样本观测值中的最小值和最大值进行判断,因为这两个值极有可能是可疑数据。,(2),可疑数据每次只能剔除一个,然后按剩下的样本观测值,重新计算平均值和标准偏差,,再做第二次判断,如此逐个地剔除,直到所有剩下的值不再是可疑数据为止。不允许一次同时剔除多个样本观测值。,(3),采用不同准则对可疑数据判断时,可能会出现不同的结论,此时要对所选用准则的适用范围、给定的检验水平的合理性,以及产生可疑数据的原因等作进一步的分析。,【例2-8】对一盘混凝土取14个试件进行抗压强度试验,测试结果如下(单位:MPa):31.2、33.1、30.5、31.0、32.3、31.2、29.4、24.0、30.4、33.0、322、31.0、28.6、30.3。试用三种不同准则进行判断,,,这些数据中是否混有可疑数据。,解:(1)3S准则。n=14,,,x,m,ax,=33,.,1,,,x,m,i,n,=24,.,0,首先,,,怀疑最小值24.0,,,对数据进行统计计算,,,得,,,S=2.28,,,3S=6.84。,|24,.,0-30.59|=6.596.84=3S说明此值在3S内,,,不应剔除,。,其次,,,怀疑最大值33.1,,,同上计十算,,,得|33.1-30.59|=2.51K,x,S=4.79,,,故认为可疑数据24.0应剔除。对剩下的13个样本观测值重新计算的,,,S=1.32,,,由n=13,,,在表2-2中查出K,x,=2.07并计算K,x,S=2.071.32=2.73。,再对其中的最大值33.1和最小值28.6怀疑。因|33.1-31.09|=20,.,1K,x,S=2.73以及|28.6-31.09|=2.49K,x,S=2.73,,,所以认为33.1和28.6均应保留。至此,,,全部数据中已不含有可疑数据。,(3)格拉布斯准则。用格拉布斯准则同样也可得出剔除可疑数据24.0,,,而保留其他数据的结论。此例计算结果表明,,,3S准则相对于其他准则在可疑数据取舍方面偏于保守。,复习思考题,2-1何谓总体、个体和样本?,2-2什么叫抽样检验?随机抽样方法有哪几种?,2,-,3误差按其性质可分为哪几类?各有什么特征?,2-4数据修约规则和特异数据取舍的方法有几种?,2-5修约以下数据,:,15,.,3528(保留两位小数),;,125.555(保留整数),;,15,.,98,5,(保留,两位小数);,16.6875(,保留三位小数,),2-6某路段路基施工质量检查中,用标准轴载测得10点的弯沉值(单位:0.01mm)分别为100、101、102、110、95、98、93、96、103、104,试计算该路段路基弯沉值的算术平均值、中位数、极差、标准差和变异系数。,2-7某路段二灰碎石基层无侧限抗压强度试验结果(单位:MPa)为:0.792、0.306、0.968、0.804、0.447、0.702、0.424、0.498、1.075、0.815,请分别用拉依达法、肖维纳特法和格拉布斯法对上述数据进行取舍判别。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 小学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!