资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,系统聚类分析法在大气污染中的应用,System clustering analysis in application of atmospheric pollution,实际问题的提出,聚类要素的数据处理,样品间距离计算,最短距离法,绘制出聚类谱系图,类的定义,结论,系统聚类分析法在大气污染中的应用 Syste,1,设在某城市的环保检测站于2009年在全市均匀地布置了14个监测点,每天三次定时抽取大气样品,测量大气中二氧化硫、氮氧化物、飘尘的含量。前后5天,每个取样点(监测点)每种污染元素实测15次,取15次实测值的平均作为该取样点大气污染元素的含量(见表1),(1)试用系统聚类分析法对这现象进行研究,并绘制谱系图来进行分类。,(2)根据(1)中的分类结果,谈谈你自己的建议?,一、实际问题的提出,一、实际问题的提出,2,污染元素,样品号,二氧化硫(),氮氧化物(),飘尘(),1,0.045,0.043,0.265,2,0.066,0.039,0.265,3,0.094,0.061,0.194,4,0.003,0.003,0.102,5,0.048,0.015,0.106,6,0.210,0.066,0.263,7,0.086,0.072,0.274,8,0.196,0.072,0.211,9,0.187,0.082,0.301,10,0.053,0.060,0.209,11,0.020,0.008,0.112,12,0.035,0.015,0.170,13,0.205,0.068,0.284,14,0.088,0.058,0.215,表1 2009年某城市记录的14个监测点的大气污染数据,3,二、聚类要素的数据处理,在聚类分析中,聚类要素的选择是十分重要的,它直接影响分类结果的准确性和可靠性。,在地理分类和分区研究中,被聚类的对象常常是多个要素构成的。不同要素的数据往往具有不同的单位和量纲,其数值的变异可能是很大的,这就会对分类结果产生影响。因此当分类要素的对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。,二、聚类要素的数据处理 在聚类分析中,聚类要素的,4,假设,有,m,个聚类的对象,每一个聚类对象都有,n,个要素构成。它们所对应的要素数据可用表2给出。,表2 聚类对象与要素数据,假设有m 个聚类的对象,每一个聚类对象都有n个要,5,在本论文中,用到的聚类要素的数据处理(转换)方法有如下:,极差的标准化,,即,经过这种标准化所得的新数据,各要素的极大值为,1,,极小值为,0,,其余的数值均在,0,与,1,之间。,(公式1),在本论文中,用到的聚类要素的数据处理(转换)方法有如,6,表3 极差标准化处理后的数据,X,1,X,2,X,3,G,1,0.203,0.506,0.819,G,2,0.304,0.454,0.814,G,3,0.440,0.734,0.462,G,4,0.000,0.000,0.000,G,5,0.217,0.152,0.020,G,6,1.000,0.797,0.809,G,7,0.401,0.873,0.864,G,8,0.932,0.873,0.548,0.889,1.000,1.000,0.242,0.722,0.538,0.082,0.063,0.050,0.155,0.152,0.342,0.976,0.823,0.915,0.411,0.696,0.568,表3 极差标准化处理后的数据X1X2X3G1 0,7,三、样品间距离的计算,绝对值距离计算,三、样品间距离的计算 绝对值距离计算,8,四、最短距离法,原理,最短距离法,是在原来的,14,14,距离矩阵的非对角元素中找出 ,把分类对象和 归并为一新类 ,然后按计算公式,计算原来各类与新类之间的距离,这样就得到一个新的13阶的距离矩阵;再从新的距离矩阵中选出最小者,,把,和,归并成新类;再计算各类与新类的距离,这样一直下去,直至各分类对象被归为一类为止。,四、最短距离法 原理,9,由于 的距离是最小的,故而合并 和 ,同时划去第13行和第13列,于是我们得到,由于 的距离是最小的,故而合并 和 ,同时划去第1,10,如此重复下去,直到合并为一类为止,我们得到,如此重复下去,直到合并为一类为止,我们得到,11,五、类的定义,设阈值T的正数,若集合中任意两个元素的距离都满足:,则称G对于阈值组成一个类。,五、类的定义 设阈值T的正数,若集合中任意两个元素的距,12,0.500,0.622,六、绘制出聚类谱系图,0.5000.622六、绘制出聚类谱系图,13,七、结论,(1)由最长距离法计算的结果与最短距离法比较后,发现运用最短距离的谱系图并且当阈值 =0.500时分类是比较好的,所以再根据类的定义,把这些监测点分为六大类分别是6,8,13、1,2、4,5,11,12,9,10、3、7,14。,七、结论 (1)由最长距离法计算的结果与最短距离法比较,14,(2)由此,我们用互不相关的前5个主要成分来代替原来的18个指标变量损失的信息不大,所以结论分析(建议)如下:,1,2这三个观测点,污染极轻,应加以保持。,4,5,11,12,9,10这五个观测点,污染较轻,应注意减少污染物的排放。,6,8,13这三个观测点,大气污染较严重,应加强城市绿化工作,建立城市立体绿化体系。,7观测点污染较重,应该进行整治。,14观测点污染很重应该按照环保工作总体方案进行大气环境污染综合整治工作部署,以大气污染企业污染治理和全面达标为重点。,3观测点,污染极重应大力的、系统的整治。,(2)由此,我们用互不相关的前5个主要成分来代替原来的18个,15,
展开阅读全文