资源描述
工程中的不确定性统计与概率,了解统计与概率的基本知识数据表达方法离散和连续分布正态分布及查表单独事件和多重事件的概率从散乱数据中获得其变化规律。统计与概率在统计过程控制以及公差上的应用。,学习目标:,概述,不确定性是人类生产生活中的重要组成部分。在工程设计中,如果能够对不确定性进行量化分析并能预测不确定性的水平,将对设计和制造产生重大影响。,工程设计中的不确定性可以分成两种:概率问题:当一个系统模型的参数是已知的,我们可以根据这些参数来推导出系统的行为。统计问题:当一个系统模型的参数是未知的,需要通过对获取的数据进行分析来获得这些参数。,假设某公司年产1000台发动机,其中5台为次品。次品可以通过100%的检测程序得到消除。如果更换一台发动机需要$10,000,而检测一台需要$100,相应的费用为:检测:1000*$100=$100,000更换:5*$10,000=$50,000显然,更换的费用低。如果次品数超过10,检测将会更经济。因此,公司必须对加工工程有一个很好的统计数据,以便获得发生次品概率的大小,从而决定采用哪种方案(检测或更换)更加经济。在工程设计的整个过程中,都将应用统计与概率。,例,统计,统计数据表示最简单的统计数据可以从一个量的重复测量得到,如:人的身高、体重、气温等。这样的统计数据通常是一列数字,而这样的一列数字一般是很抽象的,需要通过可视化的方法加以形象表达。,常用的可视化表达方法:直方图直方图是用来表达数据最简单的方法。直方图将数据按区间组合,并以图形形式显示出来。累积分布以图形形式显示小于指定值的数据数量。,统计数据表达方法,一个班28个学生的成绩数据如下:70,73,74,76,76,76,76,77,77,77,78,78,79,79,83,83,84,85,86,87,89,89,90,90,92,92,93,97成绩数据已经按大小顺序排列。将它们分成6个区间,有:区间学生数累积数70-74:3375-79:111480-84:31785-89:52290-94:52795-99:128,例,Distribution,图形化的表示使得我们对数据有更深入的理解。为了能够更简单地对数据进行比较分析,必须采用一些更加实用的参数。下面将定义一些常用的统计术语,1、均值:,3、方差:标准偏差数的平方,4、标准偏差:,对离散分布:,2、众数:一组中出现最频繁的数,5、极差:xi中最大值与最小值之间的差,分母上的N-1往往会带来混淆。原因:当用有限采样来评估大的群体时,采用N-1能得到更好评估效果。,方差,对于前面的例子:70,73,74,76,76,76,76,77,77,77,78,78,79,79,83,83,84,85,86,87,89,89,90,90,92,92,93,97N=28均值为82.35方差为51.20标准偏差为7.15极差为:97-70=27,课堂练习(5分钟),课堂练习1,给出如下数据:51,53,54,56,56,56,56,57,57,57,58,59,63,63,64,65,66,67,69,69,70,72,72,72,73,76(a)用六个区间绘制直方图.(b)绘制累积分布图.,课堂练习1,给出如下数据:51,53,54,56,56,56,56,57,57,57,58,59,63,63,64,65,66,67,69,69,70,72,72,72,73,76(a)用六个区间绘制直方图.(b)绘制累积分布图.,525762677277,121086420,51-553356-6091261-6541666-7052171-7542576-80126,区间NCN,课堂练习1,在一个数据分布中,数据xi出现的频数为fi,有:,均值:,方差:,离散分布:,注意一个给定分布的均值与方差以及用有限采样评估该分布所得到的均值与方差之间的差别。,均值:,方差:,整体,有限采样,增加测量数据和区间数量。绘制频数图。,f=测量数据的频数,f,f,连续分布,连续分布:,假设分布中的数据量足够大,我们可以将区间划分得任意小。在极限状态下,我们可以说概率密度函数是一个连续函数。这样处理能极大地方便计算。有时,即使数据量有限,我们也会采用连续分布来处理。,当区间数量趋于无穷大时,将有限求和换成求积分,则可得到连续分布的均值和方差。首先,我们标准化这个分布,使得概率密度函数满足:,x1和x2之间的测量数据所占的比例分数,连续分布:,均值:,方差:,连续分布:,则有:,几种常见的分布,均匀分布正态分布,定义:均匀分布是指在分布中任何一个数据出现的概率是相同的。如图在区间上的均匀分布的概率密度函数为:,均值,方差,变量代换,均匀分布:,正态分布,正态分布是应用最广泛的一种分布,很多现象都可以用正态分布来描述,如:工艺误差、测量误差、材料特性、应力分布、学生成绩等都可以认为服从正态分布。,正态分布:,正态分布记为:N(,2)。通常正态分布是对称的。,不断增大,正态分布的概率密度函数可以用下式表示:,正态分布也称高斯分布,正态分布密度函数,正态分布N(,2),称为位置参数,称为形状参数;当固定,改变的大小时,正态分布的密度曲线形状不变,只是沿着X轴作平移变化;当固定,改变的大小时,正态分布的密度曲线的对称轴不变,而形状在改变。越小,图形越高越瘦;越大,图形越矮越胖。,f(x),累积分布为:,给出了位于x左面的面积分数,为值小于(等于)x的概率。累积分布是均值和标准偏差的函数。,正态分布:,累积分布函数变成:,当=0,=1时,称为标准正态分布,记为N(0,1)。正态分布通过变量变换,可以转化成标准正态分布:,其中:均值为0标准偏差为1,正态分布:,分布函数,累积分布函数,标准正态分布:,正态分布的累积分布函数可以通过下面的变换从标准正态分布中得到:,标准正态分布:,通过查表,可以获得累积正态分布的值,x.xx,x.xx,标准正态分布:,通常,F(z)表中的z0.对于z0,由于正态分布的对称性,有F(-z)=1-F(z).,标准正态分布:,例-I,例-I,某值落在在均值的一个标准偏差范围内的概率是多少?,查表可得,F(1)=0.8413.,F(1)-F(-1)=0.8413-0.1587=0.6826,约30%左右的值落在一个标准偏差范围之外。,F(-1)=1-F(1)=1-0.8413=0.1587,F(-1),1-F(1),Example-I,例-II,例-II,某值落在在均值的两个标准偏差范围内的概率是多少?,查表可得,F(2)=0.9772.,约5%左右的值落在两个标准偏差范围之外。,F(2)-F(-2)=F(2)-(1-F(2)=2*F(2)-1=2*0.9772-1=0.9544,F(-2),1-F(2),例-II,例-III,例-III,例-III,某公司入库250个连杆,抗张强度均值为45ksi(kilopoundsquareinch,千磅/平方英寸),标准偏差为5kpsi.假设抗张强度服从正态分布。(a)有多少连杆的抗张强度将低于39.5kpsi.,例-III,由于z0,我们用公式:F(-1.10)=1-F(1.10)=1-0.8643=0.1357,(查表).于是,250*0.1357=3434个连杆的抗张强度将低于39.5kpsi,先进行标准化变换:,例-III,某公司入库250个连杆,抗张强度均值为45ksi(kilopoundsquareinch,千磅/平方英寸),标准偏差为5kpsi.假设抗张强度服从正态分布。(b)有多少连杆的抗张强度位于39.5kpsi和59.5kpsi之间?,例-III,由表,F(2.9)=0.9981,所以抗张强度大于的概率为1-0.9981=0.0019.抗张强度位于39.5kpsi和59.5kpsi之间的概率为:1-0.1357-0.0019=0.8624.于是有250*0.8624=216个连杆的抗张强度位于39.5kpsi和59.5kpsi之间。,先进行标准化变换:,课堂练习(5分钟),课堂练习2,500根钢棒的长度服从正态分布。其均值为11cm,标准偏差为1cm。试估计长度大于10cm的钢棒的数量.,课堂练习2,500根钢棒的长度为正态分布。其均值为11cm,标准偏差为1cm。试估计长度小于10cm的钢棒的数量.,由于z0,用以下公式F(-1)=1-F(1)=1-0.8413=0.1587,(查表)于是,有500*0.1587=79根钢棒的长度小于10cm,课堂练习2,先进行标准化变换:,本讲结束谢谢!,
展开阅读全文