K 均值聚类法

上传人:s****a 文档编号:119689168 上传时间:2022-07-15 格式:DOCX 页数:3 大小:11.36KB
返回 下载 相关 举报
K 均值聚类法_第1页
第1页 / 共3页
K 均值聚类法_第2页
第2页 / 共3页
K 均值聚类法_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述
K-均值聚类法0聚类是对数据空间中数据对象进行分类,位于同一类中的数据 对象之间的相似度较大,而位于不同类之间的数据对象差异度较 大。聚类是一种无监督学习,能自动对数据集进行划分。常见的聚 类算法:k-means, DBSCAN, CURE等算法。简单地讲,聚类的结果就是得到数据集中数据对象的类别信 息。例如,将以下几种物品玫瑰、红枫、松树、老虎、大象、绵羊 等进行聚类,就应该得到玫瑰、红枫、松树属于同一类,老虎、大 象、绵羊属于一类,可以对这自己对这两类赋予标记,如“植物”、 “动物”这两个标记分别代表聚类空间中的两个类。算法:第一步:选K个初始聚类中心,z1(1), z2(1),,zK(1),其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定,例如可选开始的K个模式样本的向量值作为初始聚 类中心。第二步:逐个将需分类的模式样本x按最小距离准则分配给K个聚 类中心中的某一个zj(1)。假设i=j时,则,其中k为迭代运算的次序号,第一次迭代k=1,Sj表示第j个聚类,其聚类中心为zj。第三步:计算各个聚类中心的新的向量值,zj(k+1),j=1,2,K求各聚类域中所包含样本的均值向量:其中Nj为第j个聚类域Sj中所包含的样本个数。以均值向量作为新的聚类中心,可使如下聚类准则函数最小:在这一步中要分别计算K个聚类中的样本均值向量,所以称之为K- 均值算法。第四步:若,j=1,2K,则返回第二步,将模式样本逐个重新分 类,重复迭代运算;若,j=1,2K,则算法收敛,计算结束聚类的用途是很广泛的。在商业上,聚类可以帮助市场分析人 员从消费者数据库中区分出不同的消费群体来,并且概括出每一类 消费者的消费模式或者说习惯。它作为数据挖掘中的一个模块,可 以作为一个单独的工具以发现数据库中分布的一些深层的信息,并 且概括出每一类的特点,或者把注意力放在某一个特定的类上以作 进一步的分析;并且,聚类分析也可以作为数据挖掘算法中其他分 析算法的一个预处理步骤。聚类分析的算法可以分为划分法(Partitioning Methods)、层次法(Hierarchical Methods)、基 于密度的方法(density-based methods)、基于网格的方法(grid-based methods)、基于模型的方法(Model-Based Methods)。聚类是数据挖掘的重要分支之一,引入模糊理论的模糊聚类分 析为现实数据提供了模糊处理能力,在许多领域被广泛应用。在本 文中,总结了模糊聚类的原则和通用的方法,讨论了常用的模糊聚 类算法,讨论了这些算法的优缺点、存在的问题以及前景展望。 模 糊C-均值聚类算法是目前广泛使用的模糊聚类算法。但它也存在一些缺点,例如模糊C-均值(FCM)聚类算法受初始化影响较大,在迭代时容易陷入局部极小。本文从引入隶属度函数、引入消息熵和类中心的约束出发,研究了模糊C-均值的改进方法。在此基础上,提出了一种改进的模糊C-均值聚类算法。其基本思想是:通过对数im据对象的模糊隶属度增加一个加权值,以及在算法中引入模糊聚类 有效性函数对聚类数目c进行优选。为了证明改进FCM算法的实用 性,我们将该算法应用于两个领域:网络入侵检测和Web日志挖掘。入侵检测是网络安全的第二道防线。在本文中,分析了入侵检测技 术的要点,提出了一种基于改进FCM算法的网络入侵检测方法。该方法的优点是不需要标示或训练数据集。文中使用KDD99数据 集作为实验数据,实验结果显示该方法检测未知入侵检测是有效 的,而且它提高了入侵检测系统的检测率和误警率。 最后,我们 使用改进的模糊聚类算法来分析Web日志数据,以实现Web用户聚 类,即根据用户的浏览行为,发现相似的用户组;以及Web页面聚 类,即根据Web页面被用户访问的情况,发现相关页面组。实验证 明,采用该改进的模糊聚类算法对Web日志挖掘效果良好。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!