SPSS软件聚类分析过程的图文解释及结果的全面分析

上传人:cunz****g666 文档编号:59542253 上传时间:2022-03-03 格式:DOC 页数:3 大小:38KB
返回 下载 相关 举报
SPSS软件聚类分析过程的图文解释及结果的全面分析_第1页
第1页 / 共3页
SPSS软件聚类分析过程的图文解释及结果的全面分析_第2页
第2页 / 共3页
SPSS软件聚类分析过程的图文解释及结果的全面分析_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述
SPSS 聚类分析过程聚类的主要过程一般可分为如下四个步骤:1.数据预处理(标准化)2.构造关系矩阵(亲疏关系的描述)3. 聚类(根据不同方法进行分类)4. 确定最佳分类(类别数)SPSS 软件聚类步骤1. 数据预处理(标准化)TAnalyze 宀 Classify宀 Hierachical Cluster Analysis然后从对话框中进行如下选择从 Transform Values 框中点击向下箭头,此为标准化方法,将出现如下可选项,从中选一即可:标准化方法解释:None:不进行标准化,这是系统默认值;Z Scores:标准化变换;Range - 1 to 1 极差标准化变换(作用:变换后的数据均值为 0,极差为 1,且|Xij*|1,消去了量纲的影响;在以后的分析计算中可以减少误 差的产生。);Range 0 to 1(极差正规化变换 / 规格化变换);2. 构造关系矩阵在 SPSS 中如何选择测度(相似性统计量):TAnalyzeTClassifyTHierachical Cluster Analysis然后从对 e 话框中进行如下选择常用测度(选项说明):Euclidean distanee:欧氏距离(二阶 Minkowski 距离),用途:聚类分析中用得最广泛的距离;Squared Eucidean distanee :平方欧氏距离; Cosine:夹角余弦(相似性测度;Pearson correlation :皮尔逊相关系数;3. 选择聚类方法SPS 冲如何选择系统聚类法 常用系统聚类方法a)Between-groups linkage 组间平均距离连接法方法简述:合并两类的结果使所有的两两项对之间的平均距离最小。(项对的两成员分属不同类)特点:非最大距离,也非最小距离b)Within-groups linkage 组内平均连接法方法简述:两类合并为一类后,合并后的类中所有项之间的平均距离最小C) Nearest neighbor 最近邻法(最短距离法)方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法d)Furthest neighbor 最远邻法(最长距离法)方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法e)Centroid clustering 重心聚类法 方法简述:两类间的距离定义为两类重心之间的距离,对样品分类而言,每一类中心就是属于该类样品 的均值 特点:该距离随聚类地进行不断缩小。该法的谱系树状图很难跟踪,且符号改变频繁,计算较烦。f)Median clustering 中位数法 方法简述:两类间的距离既不采用两类间的最近距离,也不采用最远距离,而采用介于两者间的距离 特点:图形将出现递转,谱系树状图很难跟踪,因而这个方法几乎不被人们采用。g) Ward s method差平方和法 方法简述:基于方差分析思想,如果分类合理,则同类样品间离差平方和应当较小,类与类间离差平方 和应当较大特点:实际应用中分类效果较好,应用较广;要求样品间的距离必须是欧氏距离。 谱系分类的确定经过系统聚类法处理后,得到聚类树状谱系图,Demirmen(1972) 提出了应根据研究的目的来确定适当的分类方法,并提出了一些根据谱系图来分类的准则:A. 任何类都必须在临近各类中是突出的,即各类重心间距离必须极大B. 确定的类中,各类所包含的元素都不要过分地多C. 分类的数目必须符合实用目的D. 若采用几种不同的聚类方法处理,则在各自的聚类图中应发现相同的类实例分析分析软件聚类分析聚类分析 系统聚类法在数据编辑窗口的主菜单中选择 分析(A) 分类(F)J系统聚类(H) ”(如图-4 所示),弹出“系统聚类分析 ”对话框,将 “地区”变量选入 “标注个案 (C) ”中,将其他变量选入 “变量框”中,如图 -5所示。在 分群”单选框中选中 个案”,表示进行的是 Q 型聚类。在 输出”复选框中选中 统计量”和 图”,表 示要输出的结果包含以上两项。单击 统计量 (S) ”按钮,在 系统聚类分析:统计量 ”对话框中选择 合并进程表 ”、 相似性矩阵 ”,如图 -6 所 示,表示输出结果将包括这两项内容。单击 绘制(T) ”按钮,在 系统聚类分析:图”对话框中选择 树状图”、冰柱”,如图-7 所示,表示输出的结 果将包括谱系聚类图(树状)以及冰柱图(垂直) 。单击 方法(M)”按钮,弹出 系统聚类分析:方法”对话框,如下图-8 所示。聚类方法 (M) ”选项条中可选项包括如图 -9 所示的几种方法,本例中选择 组间联接 ”:度量标准-区间(N)选项条中可选项包括如图-10 所示的几种度量方法,本例中选择 平方 Euclidean 距 离”:转换值 -标准化 (S) 选”项条中可选项包括如图 -11 所示的几种将原始数据标准化的方法,本例中选择 全局 从 0 到1 ”:冰柱图解释聚类分析冰柱图形状类似于屋檐上垂下的冰柱,因此而得名。横轴:案例(Case)表示被聚类的对象或变量;纵轴:群集数(Number of clusters )表示被聚成几类;观察冰柱图应从最后一行开始。举例如下:当聚成 6 类时 X4 和 X8 和 X6 聚成一类,其他个案自成一类,用白板将6 类一下挡上可以看出如图;当聚成 5 类时 X4 和 X8 和 X6 和 X2 聚成一类,其他个案自成一类。冰柱图的优点是不仅可以显示出不同类数时个案所属的分类结果,还能表现出聚类的过程步骤,生动形 象;缺点是不能表现出聚类过程中距离的大小。若生成的树状图如下,看不清楚。可点击右键导出文件,生成word 文件,然后可以看出聚类过程。导出的 word 文档中聚类过程如下:可看出聚类过程为如下表所示:分类过程统计表连结顺序连结元素1BC2ABC3EF4EFABC5DABCEF
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 商业计划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!