资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,1,2.2,模式相似性测度,用于描述各模式之间特征的相似程度,距 离 测 度,相 似 测 度,匹 配 测 度,第二章 聚类分析,12.2 模式相似性测度,2,2.2,模式相似性测度,一、距离测度,(,差值测度,),测度基础:,两个矢量矢端的距离,测度数值:,两矢量各相应分量之差的函数,。,时,等号成立;,,当且仅当,第二章 聚类分析,22.2 模式相似性测度一、距离测度(差值测度)时,等号成立,3,2.2,模式相似性测度,常用的距离测度有:,1.,欧氏,(Euclidean),距离,第二章 聚类分析,32.2 模式相似性测度常用的距离测度有:第二章 聚类分析,4,2.2,模式相似性测度,4.,明氏,(Minkowski),距离,(2-2-4),2.,绝对值距离,(,街坊距离或,Manhattan,距离,)(2-2-2),3.,切氏,(Chebyshev),距离,(2-2-3),第二章 聚类分析,42.2 模式相似性测度4.明氏(Minkowski)距离2,5,2.2,模式相似性测度,第二章 聚类分析,52.2 模式相似性测度第二章 聚类分析,6,2.2,模式相似性测度,5.,马氏,(Mahalanobis),距离,注意!,马氏距离对一切非奇异线性变换都是不变的,这说明它不受特征量纲选择的影响,并且是平移不变的。,上面的,V,的含义是这个矢量集的协方差阵的统计量,故马氏距离加入了对特征的相关性的考虑。,第二章 聚类分析,62.2 模式相似性测度5.马氏(Mahalanobis)距,7,2.2,模式相似性测度,第二章 聚类分析,72.2 模式相似性测度第二章 聚类分析,8,8,9,现金识别例子,(,欧氏平均距离,),数据样本介绍:,10,个文本文件,文件名:,rmb00.txt,rmb09.txt,每个文件有,4,个币种的数据,分别是:,100,圆、,50,圆、,20,圆、,10,圆,每个币种有新旧两种版本,,4,个方向,故有,8,个数据块:,如,100,圆的,8,个数据块:,data100a,data100b,data100c,data100d,老版,data100e,data100f,data100g,data100h,新版,每个数据块有,8,个传感器数据:,传感器,1,,传感器,2,,,,传感器,8,每个传感器有,60,个采样数据:,数据,1,,数据,2,,,,数据,60,9现金识别例子(欧氏平均距离)数据样本介绍:10个文本文件,10,现金识别例子,Eucliden=15.000000,Manhattan=33.000000,Chebyshev=11.000000,Minkowski=11.039449m=8,100,元,A,面第,1,个样本第,10,点和,20,点的距离,X:,(75,76,101,83,102,96,91,82),Y:,(70,74,90,76,99,96,90,86),X-Y:,5,2,11,7,3,0,1,-4,距离测度,rmbdis,10现金识别例子Eucliden=15.000000100元,11,现金识别例子,马式平均距离,a:39.73 101.41 162.90 256.38,b:91.89 230.25 288.69 659.47,c:103.76 135.94 257.57 724.96,d:78.58 171.10 330.97 675.90,e:247.42 443.46 333.93 218.71,f:108.10 328.11 305.19 607.51,g:265.16 956.58 818.83 348.42,h:107.56 339.64 387.10 628.88,100,圆,50,圆,20,圆,10,圆,其中马式矩阵为,100,圆,A,面的,上面是各面到,100,圆,A,面的均值点的平均马式距离。,11现金识别例子马式平均距离a:39.73 101.,12,2.2,模式相似性测度,二、相似测度,测度基础:,以两矢量的方向是否相近作为考虑的基础,矢量长度并不不重要。设,1.,角度相似系数,(,夹角余弦,),(2-2-11),注意:坐标系的旋转和尺度的缩放是不变的,但对一般的线形变换和坐标系的平移不具有不变性。,122.2 模式相似性测度二、相似测度1.角度相似系数(夹角,13,现金识别例子,100,圆,A,面传感器,1,与其它各面的相似系数,13现金识别例子100圆A面传感器1与其它各面的相似系,14,2.2,模式相似性测度,二、相似测度,2.,相关系数,它实际上是数据中心化后的矢量夹角余弦。,(2-2-12),142.2 模式相似性测度二、相似测度,15,15,16,现金识别例子,100,圆,A,面传感器,1,与其它各面的相关系数,16现金识别例子100圆A面传感器1与其它各面的相关系,17,2.2,模式相似性测度,二、相似测度,3.,指数相似系数,(2-2-13),式中 为相应分量的协方差,为矢量维数。它不受量纲变化的影响。,172.2 模式相似性测度二、相似测度式中 为相应分量的,18,现金识别例子,100,圆,A,面传感器,1,与其它各面的相关系数,18现金识别例子100圆A面传感器1与其它各面的相关系,19,2.2,模式相似性测度,当特征只有两个状态(,0,,,1,)时,常用匹配测度。,0,表示无此特征,1,表示有此特征。故称之为,二值特征,。,对于给定的,x,和,y,中的某两个相应分量,x,i,与,y,j,若,x,i,=1,y,j,=1,,则称,x,i,与,y,j,是,(1-1),匹配,;,若,x,i,=1,y,j,=0,,则称,x,i,与,y,j,是,(1-0),匹配;若,x,i,=0,y,j,=1,,则称,x,i,与,y,j,是,(0-1),匹配;若,x,i,=0,y,j,=0,,则称,x,i,与,y,j,是,(0-0),匹配。,二、匹配测度,192.2 模式相似性测度当特征只有两个状态(0,1)时,常,20,2.2,模式相似性测度,202.2 模式相似性测度,21,2.2,模式相似性测度,三、匹配测度,(1)Tanimoto,测度,212.2 模式相似性测度 三、匹配测度(1)Tanim,22,例,2.2.2,可以看出,它等于,共同具有的特征数目,与分别具有的特征种类总数之比。这里只考虑,(1-1),匹配而不考虑,(0-0),匹配。,设,则,2.2,模式相似性测度,22例2.2.2 可以看出,它等于共同具有的特征数,23,现金识别例子,100,圆,A,面与其它各面的匹配系数,Tanimoto,23现金识别例子100圆A面与其它各面的匹配系数Tan,24,2.2,模式相似性测度,三、匹配测度,(2),Rao,测度,注:,(1-1),匹配特征数目和所选用的特征数目之比。,242.2 模式相似性测度 三、匹配测度(2)Rao测,25,现金识别例子,100,圆,A,面与其它各面的匹配系数,Rao,25现金识别例子100圆A面与其它各面的匹配系数Rao,26,2.2,模式相似性测度,三、匹配测度,(3),简单匹配系数,注:上式分子为,(1-1),匹配特征数目与,(0-0),匹配特征数目之和,分母为所考虑的特征数目。,262.2 模式相似性测度 三、匹配测度(3)简单匹配,27,现金识别例子,100,圆,A,面与其它各面的匹配系数,Simple,27现金识别例子100圆A面与其它各面的匹配系数Sim,28,2.2,模式相似性测度,三、匹配测度,(4)Dice,系数,(5)Kulzinsky,系数,282.2 模式相似性测度 三、匹配测度(4)Dice,29,现金识别例子,100,圆,A,面与其它各面的匹配系数,dice,29现金识别例子100圆A面与其它各面的匹配系数dic,30,现金识别例子,100,圆,A,面与其它各面的匹配系数,Kulzinsky,30现金识别例子100圆A面与其它各面的匹配系数Kul,31,作业,P44:2.1,2.3,31作业P44:2.1,2.3,
展开阅读全文