聚类分析及其应用实例ppt课件

上传人:文**** 文档编号:168600313 上传时间:2022-11-11 格式:PPT 页数:25 大小:335KB
返回 下载 相关 举报
聚类分析及其应用实例ppt课件_第1页
第1页 / 共25页
聚类分析及其应用实例ppt课件_第2页
第2页 / 共25页
聚类分析及其应用实例ppt课件_第3页
第3页 / 共25页
点击查看更多>>
资源描述
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确聚类分析及其应用实例聚类分析及其应用实例在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确Outlinesn聚类的思想聚类的思想n常用的聚类方法常用的聚类方法n实例分析:层次聚类实例分析:层次聚类在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确1.聚类的思想聚类的思想Oh?在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确1.聚类的思想聚类的思想Oh!在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确1.聚类的思想聚类的思想n聚类(聚类(clusteringclustering)是对物理的或抽象的对象集合分组的过程)是对物理的或抽象的对象集合分组的过程即把即把“性质相似性质相似”或或“相互关系密切相互关系密切”的样品或指标聚在一起。的样品或指标聚在一起。同一个类内样本之间彼此相似,不同类间的样本足够不相似。同一个类内样本之间彼此相似,不同类间的样本足够不相似。寻找数据中寻找数据中潜在的自然分组结构潜在的自然分组结构或或感兴趣的关系感兴趣的关系。same color!在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确基本原理:将随机现象归类的统计学方法;基本原理:将随机现象归类的统计学方法;分类分类R型聚类:指标聚类,目的是指标降维从而选型聚类:指标聚类,目的是指标降维从而选择有代表性的指标;择有代表性的指标;nPearson、Spearman系数系数Q型聚类:样本聚类,目的是找出样品间的共型聚类:样本聚类,目的是找出样品间的共性;性;n欧氏距离、绝对距离、马氏距离及明氏距离等。欧氏距离、绝对距离、马氏距离及明氏距离等。在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确逐步聚类法逐步聚类法-用于对大样本的样品间聚类用于对大样本的样品间聚类 K-K-均值聚类方法均值聚类方法 系统聚类法系统聚类法-用于对小样本的样品间聚类及对指标聚类用于对小样本的样品间聚类及对指标聚类 。层次聚类层次聚类模糊聚类法模糊聚类法-建立在模糊数学基础上,适用于小样本建立在模糊数学基础上,适用于小样本分割聚类法分割聚类法-适用于对指标聚类适用于对指标聚类 2 常用的聚类分析方法常用的聚类分析方法在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确3.实例分析:层次聚类算法实例分析:层次聚类算法凝聚的方法(自底向上)凝聚的方法(自底向上)常用常用思想思想:一开始将每个对象作为单独的:一开始将每个对象作为单独的一组,然后根据一组,然后根据同类相近,异类相异同类相近,异类相异的原则,合并对象,直到所有的组合的原则,合并对象,直到所有的组合并成一个,或达到一个终止条件。并成一个,或达到一个终止条件。分裂的方法(自顶向下)分裂的方法(自顶向下)思想思想:一开始将所有的对象置于一类,:一开始将所有的对象置于一类,在迭代的每一步中,一个类不断地分在迭代的每一步中,一个类不断地分为更小的类,直到每个对象在单独的为更小的类,直到每个对象在单独的一个类中,或达到一个终止条件一个类中,或达到一个终止条件a,b,c,d,e c,d,e d,e a,b e d c b a 第第4步步 第第3步步 第第2步步 第第1步步 第第0步步 凝聚的(AGENS)第第0步步 第第1步步 第第2步步 第第3步步 第第4步步 分裂的(DIANA)定义:对给定的数据进行层次的分解定义:对给定的数据进行层次的分解在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确X1:Gibbon(长臂猿)(长臂猿)X2:Symphalangus(合趾猿)(合趾猿)X3:Human(人)(人)X4:Gorilla(大猩猩)(大猩猩)X5:Chimpanzee(黑猩猩)(黑猩猩)凝聚的层次聚类示意图凝聚的层次聚类示意图 Oh?在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确常用的聚类统计量常用的聚类统计量距离函数距离函数-用于对样品的聚类用于对样品的聚类欧式距离:两点之间的直线距离欧式距离:两点之间的直线距离 马氏距离:数据的协方差距离马氏距离:数据的协方差距离 切比雪夫距离:两个向量之间的最大距离切比雪夫距离:两个向量之间的最大距离曼哈顿距离曼哈顿距离 :运动物体走过的实际距离:运动物体走过的实际距离。相似系数相似系数-常用于对变量的聚类常用于对变量的聚类PearsonPearson相关系数:两个连续变量间呈线性相关相关系数:两个连续变量间呈线性相关SpearmanSpearman相关系数:利用两变量的秩次大小作线性相关分析相关系数:利用两变量的秩次大小作线性相关分析 KendallKendall等级相关系数,。等级相关系数,。在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确X1:Gibbon(长臂猿)(长臂猿)X2:Symphalangus(合趾猿)(合趾猿)X3:Human(人)(人)X4:Gorilla(大猩猩)(大猩猩)X5:Chimpanzee(黑猩猩)(黑猩猩)凝聚的层次聚类示意图凝聚的层次聚类示意图 最短距离最短距离最长距离最长距离类平均距离类平均距离几何平均距离几何平均距离离差平方和法离差平方和法在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确Gp和和Gq中最邻近的两个样本的距离为这两个类之间的距离。中最邻近的两个样本的距离为这两个类之间的距离。,|minqpijpqGjGidD在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确G Gp pG Gq q Gp和和Gq中相距最远的两个样本的距离为这两个类之间的距离。中相距最远的两个样本的距离为这两个类之间的距离。,|maxqpijpqGjGidD在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确G Gp pG Gq q Gp和和Gq中每两两样本间距离的平均值作为两个类之间的距离。中每两两样本间距离的平均值作为两个类之间的距离。qptitjijqppqGjGidttDpq,111在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确G Gp pG Gq q用用Gp和和Gq两类几何中心的距离为两个类之间的距离。两类几何中心的距离为两个类之间的距离。qptiqiqqtipippqppqXtXXtXXXdD1)()(1)()()()(11,用用Gp和和Gq表示两个类,它们所包含的样本数目分别为表示两个类,它们所包含的样本数目分别为tp和和tq,类,类Gp和和Gq之间之间的距离用的距离用Dpq表示。表示。在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确Cluster PCluster QCluster MG Gp pG Gq q 各元素到类中心的欧式距离之和。各元素到类中心的欧式距离之和。qpMWWWD2在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确根据根据5种灵长类动物朊粒蛋白的氨基酸序列比较,得到它们之种灵长类动物朊粒蛋白的氨基酸序列比较,得到它们之间的距离矩阵(经过数据变换处理)。间的距离矩阵(经过数据变换处理)。X(1):Gibbon(长臂猿);(长臂猿);X(2):Symphalangus(合趾猿);(合趾猿);X(3):Human(人);(人);X(4):Gorilla(大猩猩);(大猩猩);X(5):Chimpanzee(黑猩猩)(黑猩猩)样本间距离样本间距离欧氏距离;欧氏距离;类间距离类间距离最短距离;最短距离;在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确5个物种各自构成个物种各自构成1类,得到类,得到5类,有:类,有:初始分类初始分类G(1)=X(i)(i=1,2,3,4,5)初始类别数目初始类别数目m=5初始类间距离矩阵初始类间距离矩阵D(1)D(1)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确由由D(1)知,合并知,合并X(1)和和X(2)为新类为新类C(4)=X(1),X(2),有:,有:新的新的G(2)=X(3),X(4),X(5),C(4)新的类别数目新的类别数目m=4新的类间距离矩阵新的类间距离矩阵D(2)D(2)D(1)C(4)2.546在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确由由D(2)知,合并知,合并X(3)和和X(4)为一新类为一新类C(3)=X(3),X(4),有:,有:新的新的G(3)=X(5),C(4),C(3)新的类别数目新的类别数目m=3新的类间距离矩阵新的类间距离矩阵D(3)D(3)2.52在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确由由D(3)知,合并知,合并X(5)和和C(3)为一新类为一新类C(2)=X(5),C(3),有:,有:新的新的G(4)=C(4),C(2)新的类别数目新的类别数目m=2新的类间距离矩阵新的类间距离矩阵D(4)D(4)D(3)2.5在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确由由D(4)知,最后合并知,最后合并C(4)和和C(2)为一新类为一新类C(1)=C(4),C(2),有:,有:新的新的G(5)=C(4),C(2)新的类别数目新的类别数目m=1新的类间距离矩阵新的类间距离矩阵D(5)D(5)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确X1:Gibbon(长臂猿)(长臂猿)X2:Symphalangus(合趾猿)(合趾猿)X3:Human(人)(人)X4:Gorilla(大猩猩)(大猩猩)X5:Chimpanzee(黑猩猩)(黑猩猩)Human(人)(人)Gorilla(大猩猩)(大猩猩)Chimpanzee(黑猩猩)(黑猩猩)Symphalangus(合趾猿)(合趾猿)Gibbon(长臂猿)(长臂猿)画谱系聚类图画谱系聚类图在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 算法性能:算法性能:(1)简单,但遇到合并点选择困难的情况简单,但遇到合并点选择困难的情况(2)一旦一组对象被合并,就不能撤销一旦一组对象被合并,就不能撤销(3)算法复杂度大,不适合大数据集的计算算法复杂度大,不适合大数据集的计算聚类结果评价:聚类结果评价:(1)较高的类内相似度较高的类内相似度(2)较高的类间相异度较高的类间相异度在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!