建筑数学-概率3-统计数据及数字特征

上传人:lisu****2020 文档编号:245342269 上传时间:2024-10-08 格式:PPT 页数:48 大小:10.17MB
返回 下载 相关 举报
建筑数学-概率3-统计数据及数字特征_第1页
第1页 / 共48页
建筑数学-概率3-统计数据及数字特征_第2页
第2页 / 共48页
建筑数学-概率3-统计数据及数字特征_第3页
第3页 / 共48页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,LOGO,单击此处编辑母版文本样式,第二级,第三级,第四级,Page,*,单击此处编辑母版标题样式,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击以编辑母版标题样式,单击以编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,秦佑国 燕翔,清华大学建筑学院,统计数据及其数字特征,一次,中日两国建筑学的学生一起到中国的一个乡村做民居调查。中国的学生写的调查报告有大量的图片:民居建筑的写生画,拍的照片,画的测绘图,还有建筑形式和空间描述,文字很有诗意,“皓首老者和黄发小儿,斜阳下”云云;而日本学生的报告也有一些照片,但有大量的社会学调查的数据:家庭人口及其组成,经济收入和来源,土地与房屋,村庄的基础设施,行政和宗族体系等等。,社会调查和分析、建筑策划、建筑设计、城市规划等,都需要了解经济、社会、人口、土地、资源、气候、地理等各个方面的大量的统计数据。这些数据有的是需要亲自去调查的,有的是收集相关资料得到的。问题是如何对收集来的数据进行分析处理,应用到自己的工作和研究中去。,我在1994年受西安机场委托,做机场扩建规划和可行性研究,需要预测今后10年(19952005年)西,安机场年旅客吞吐量,并以此为依据规划设计第二航站楼。,首先要了解之前各年(,1995年以前,)西安机场的年旅客吞吐量。,已知过去,15年的数据,如何预测未来10年?,一种方法是把过去的数据“回归”成一个方程(一条曲线),“拟合”过去的数据,并根据其趋势,加以外推(“趋势外推”),“预测”未来。,民航部门常用的是波布加门公式:,根据已有数据,(,扣除了1989和1990年的特殊情况),的拟合回归得到计算公式:,计算和预测值见右表和图,一个城市的航空客运量通常和它的经济状况,有关,通过与,国民生产总值,GNP的,相关分析,可以预测在未来经济发展中航空客运量的增长。但西安又,是一个旅游城市,国际旅客数量居全国第二位(,1993,年),国际旅客绝大都,数是乘飞机的。于是采用了,航空客运量与国民生产的总值和,旅游游客量二元,相关的方法,进行拟合回归。调查了1980-1994年西安的GNP和旅游游客量的数,据,并了解了西安市人大制定的十年经济发展计划和旅游事业规划。,上,述二元相关分析的航空客运量的,实际值与计算值和,预测值如下表所列:,得到二元的回归方程,其中X1是GNP指数,X2是旅客量指数。复相关系数 r=0.981,1994年做10年预测,用,四种方法预测后取整:,2005年西安机场旅客年吞吐量预测值是800万。,现在2005年已经过去,西安机场2005年实际的旅客年吞吐量是:794万。,总体与样本,根据工作和研究的目的和对象,把在同一性质基础上结合起来的许多个别事物的整体称为统计“,总体,”。,总体由许多“个体”组成,可以是可列举的离散的个体,数量有界,也可数量极大,看作无界,如世界人口;可以是连续变化的事物,如气温、水深,也可看着数量无界。(大量性),个体的某种属性可以量化而成“指标”,如人的身高,人的年龄。个体结合成总体,是各个个体相同性质指标的结合。(同质性),各个个体的指标值是不相同的,存在差异。(差异性),对于个体数量巨大的总体和连续变化的事物,不能逐个一一调查、测量,只能进行“,抽样,”调查和检测,抽取限的离散的“,样本,”。,统计学研究如何获取样本,如何从样本分析了解总体的特征。,数学期望与方差,正态分布随机变量的,数学期望是,,方差是,2,。,随机试验的,平均值,方差,2,是:,N=98的一次二项分布试验,平均值:61.38,标准差:12.86,=,累积概率,概率为,P,(,X,),的随机变量,X,,,在,取值范围(a,b)(ab),内,X,取值小于等于,X,k,的概率之和:F(x)=,P,(x X,k,),称为累积概率。,对于离散随机变量:,对于连续随机变量,概率密度函数为,f,(x),累积概率是:,显然,累积分布概率F(x)在 x 取区间(a,b)的最大值 b 时,为 1:,F(x=b)=1,对于正态分布,取值区间是(,+),正态分布随机变量(如图),累积,分布概,(x),就是,图中阴影部分的面积。,样本统计量的数字特征,通过调查获取了大量的样本,如何从样本中分析得到统计对象的特性,需要计算样本统计量的,数字特征,。,实,际上,,2960,名个体,都有各自的身高,但数据太多、太细,简化为,分组表达,。,列表法,图示法,设对一个调查对象采集的样本数为,n,,,各个样本的数值是 X,i,(,i=1,、,2,、,3,、,、,n,),。,平均值是各个样本值相加再除以样本数。它是最常用的统计量:平均年龄、平均身高、平均气温、平均分数等等。,方差是对每个样本值与平均值的差(相对于平均值的偏离)的平方(把正负偏差都统一成正数)求平均。,标准差是方差的开方,。,上一届同学在建筑数学课堂上,每人当场测量自己心律的统计(次/分钟),,共192人,。,平均数,标准差,2个班各30个学生,考试成绩如下表所列,分数,95,92,90,88,85,80,78,75,70,65,60,50,甲班,1,3,2,5,6,5,2,1,2,2,1,乙班,2,3,5,7,3,2,3,3,2,甲班平均成绩 =81.4 标准差,=,10.3,乙班平均成绩 =81.7,标准差,=,7.8,两班,平均,成绩,相差无几,但,标准差,甲班比乙班大,表示甲班同学之间分数差距较大,而乙班同学之间差距较小,比较均匀。这从列表中也可以看出。,把每个人的成绩从,大到小排列,,,第,15个人(人数的,一半,,,n/2,)的成绩称为,中位数,,从上表中可以看出,甲班和乙班的中位数都是85分。,获取了n个样本,把各个样本值从大到小排列,第,n/2,个样本值称为,中位数,。,中位数,一个幽默的故事:亿万富翁比尔盖茨和 2 个“穷光蛋”在一个房间里,把 3 个人的财富进行平均,求出,平均数,,然后宣布:这个房间里的人,,平均财富,上亿美元,。但如果用,中位数,表述,即从富到穷排队,中间的那个人的财富,3个人中的第2个人,是一个“穷光蛋”,全部家当是1万美元,得到,中位数,只是1万美元,。,所以,在一个贫富差别很大的社会里,算人均量不能完全反映问题,还要用中位数。,当一个对象内部差异很大时,用平均数不如用中位数更能反映事物的特征。,众数,样本中中出现次数最多的样本值,用以描述集中趋势。,由,表列数据可以看出,最多数的瓦工,每日砌砖量是0.95m,3,。145个人中有80个人,所以,众数,是0.95m,3,。,偏斜度的度量,当两个分布的平均数、中位数和众数的频率(不是数值)都相同时,其分布形态也可能不一样,两者的比较要用到,偏斜度,。,M,0,是众数,众数在频率分布的峰值处,中位数是样本数的一半处。,加权平均值,当样本各组数量不等时,引入“权重”系数,即:各组数量占总次数的比重。计算公式:,已知三个企业的工人数及月平均工资,计算这些企业共同的月平均工资:,加权的概念还可以用于各样本的重要性、代表性不同(有点类似代表会议的代表,不同地方的代表其所代表的人口数不同)。,几何平均值,主要适用于比率、指数均值的计算,得出平均发展速度。,GDP年增长率5年分别是10%,12%,9%,8%,10%,这5年GDP平均年增长率就是,几何平均,:,为方便计算,两边取对数,再反解对数得真值。,累积分布数(值),对于有差异变化的对象,例如交通噪声,只用平均值(能量平均Leq)和中位数还不能反映。例如夜间,一整夜(9小时)很安静,Leq和中位数的分贝数都不高,但有摩托车飙车,急驶而过,就把人吵醒。交通噪声分析和评价,就有“累积分布噪声级”L,N,(dB):L,1,,L,10,,L,50,,L,90,。L,1,就是在观察时间内(如夜间9小时),有1%的时间,噪声级(dB数)高过这个值,是突发噪声;L,50,是中位数,一半(50%)的时间噪声级高于它,一半(50%)的时间低于它;L,10,是噪声“峰值”,L,90,就是“背景噪声级”。,清华大学西北小区,24小时环境噪声测量,对于交通噪声评价美国采用L,10,,中国采用Leq,日本采用L,50,。,Leq dB,工龄,0,5,年,15,年,20,年,25,年,30,年,35,年,40,年,80,0,0,0,0,0,0,0,0,85,0,1,5,6,7,8,9,10,90,0,4,14,16,16,18,20,21,95,0,7,24,28,29,31,32,29,100,0,12,37,42,45,44,44,41,105,0,18,53,58,60,62,61,54,110,0,26,47,78,78,77,72,62,噪声劳动保护标准限值,长期在强噪声环境下工作,会损害工人的听力。各国都制定了噪声暴露的劳动保护标准,规定每天8小时工作连续暴露的等效连续噪声级Leq dB(A)的限值。依据是对强噪声暴露下的不同工龄的工人(美国曾对纺织女工)的听力进行调查,国际标准化组织ISO根据各国的调查数据于,1971,年曾公布不同,工龄(年)噪声暴露下,Leq dB(A)与噪声性耳聋发病率的关系(,%,),。,我国在上世纪70年代末80年代初,为制定中国的噪声劳动保护标准,曾经对不同行业的一万多个作业场所的噪声状况进行了调查。但在确定限值时发生了争议,国际上北欧、苏联、东欧的限值是85 dB,美国、英国、日本的限值是90dB。中国的现状条件比美、日差,有人提出中国定在,90 dB,较为确当;但另一种意见说,美、日是资本主义国家,中国是社会主义国家,应该关心工人,限值应定在,85dB,。当时纺织工业部和机械工业部的代表反对,即使定90 dB实际也难以执行。最后没有形成“国家标准GB”,只是由劳动部和卫生部发了一个“通知”,对于新建和扩建工厂要求85 dB,现有工厂可以是90dB。10年以后,制定国家标准,限值是,90 dB,。保护,85%,左右的工人。,反映贫富差异的“,基尼系数,”,实质上就是财富按人口的,累积分布,:把人口按财富从低到高累积,同时计算财富的累积。如果,人口累积和财富累积“同步”,人口累积到10%,财富也累积到10%,人口累积到50%,财富也累积到50%,人口累积到100%,财富也累积到100%,这就是基尼系数为0,财富分配绝对平等。如果人口累积到90%,财富累积才到15%,也就是,剩下的10%的人口占有社会85%的财富,贫富差距太大,社会财富分配不公。,图中绿线代表绝对平均状态,人口累积与财富累积同步;蓝线代表绝对不平均(即所有财富被一个人占有);红线代表某种实际情况。绿红两线之间的面积与绿蓝两线之间的面积之比就是“基尼系数”,G,。图中绿线和红线之间的面积越小,财富分配越平等。绿线代表,G=0,蓝线代表G=1。一般发达国家的基尼系数在,0.24,到,0.36,之间,美国偏高,为,0.4,。我国基尼系数已从改革开放初的,0.28,上升到,2007,年的,0.48,,近两年还不断上升,实际已超过了,0.5,,这是十分严重的信号。,建筑设计中的人体尺寸,建筑的使用者是人,人体各部在各种活动形态的尺寸与建筑设计密切相关。人的身高是最基本、最重要的人体尺寸。但个人的身高各不相同,需要了解一个国家、一个地区众
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!