聚类分析的SPSS实现

上传人:lis****210 文档编号:158600879 上传时间:2022-10-05 格式:DOCX 页数:13 大小:263.09KB
返回 下载 相关 举报
聚类分析的SPSS实现_第1页
第1页 / 共13页
聚类分析的SPSS实现_第2页
第2页 / 共13页
聚类分析的SPSS实现_第3页
第3页 / 共13页
点击查看更多>>
资源描述
7.5聚类分析的SPSS实现一、系统聚类法的SPSS实现例7.5.1利用全国30个省市自治区经济发展基本情况的八项指标数 据(见数据集wyzb6_5.),用系统聚类法对这30个省市自治区作一初 步的分类,并说明各类地区经济发展的特点。操作分析(Analyze)n 分类(Classify)n 系统聚类(Hierarchical Cluster) 打开系统聚类分析(Hierarchical Cluster Analysis)对话框1. 变量(Variable(s)列表框设置分析变量。2. 标志个案(Label Cases by) 框 设置分析对象的标志变量。3. 分群(Cluster)单选择框设置聚类分析的类型。4. 输出(Display )复选择框 设置聚类分析的输出结果,统计量和 图都是默认选项。5.统计量(Statistics)按钮 设置输出的统计量。合并进程表(Agglomeration schedule)默认选项,输出聚类分析的 凝聚状态表;相似性矩阵(Proximitymatrix)为复选项,输出各样品的距离矩阵。聚类成员(Cluster Menbership )选择框:无(None)选项:不显示类的样品构成;单一方案(Single solution)选项:选择此项,并输入一个确 定的分类数n,并输出聚成n个类时各个类的样品构成 情况。方案范围(Range of solutions):选择此项,并输入两个数n1, n2,将显示指定聚成n1类到n2类时各个类的样品构成 情况。6. Plots按钮设置输出图形:树状图冰状图念系统聚美分析:叵捌状图所有聚类(&)聚类的擀定全g 开始聚类:岸止聚类(E):麻序杭准旦):|i |Q|w-方向垂业)7.Method按钮设置聚类分析的具体方法。_. i 帮助组间连接:类间平均法 组内连接:类内平均法 最近临元素:最短距离法最远临元素:最长距离法质心聚类法:重心法中位数聚类法:中位数法Ward法:离差平方和法度量方法选择框:选择计算样品距离的方法转换值选择框:选择原始数据标准化的方法Z得分,最常用的方法8. Save按钮设置需要保存的分析结果。输出结果的统计分析凝聚状态表聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集21414.33800522026.702008328291.0860014427301.5420085452.1481020617182.7990012723243.5180017820274.3802417910155.3220022103166.278001811787.35400131217228.94660231371210.5441102014252812.33603241522114.261002116111316.234001917202318.3778724183621.701100231911125.08801621204730.31951325211238.32919152622101946.58890272331755.69018122524202564.922171428253478.747232028261999.2842102727110130.81426222928320166.8612524292913232.00027280第1歹U:步骤号,一共进行了 29聚类第2和3歹U:表示某步聚类时的哪两个样品或类进行了合并,合并后的类号为第2列的样品或类号第4列:聚类时的两个样品或类间的距离第5和6列:表示某步聚类时是样品还是类参与合并第7列:表示本步所聚成的类,再下面的第几步聚类时用到。成员表群集成员案例8群集7群集6群集5群集4群集1:北京111112:天津111113:河北222224:山西333225:内蒙333226:辽宁222227:吉林333228:黑龙江333229:上海4443110:江苏5554311:浙江1111112:安徽3332213:福建1111114:江西3332215:山东5554316:河南2222217:湖北6222218:湖南6222219:广东5554320:广西7665421:海南1111122:四川6222223:贵州7665424:云南7665425:西藏8765426:陕西7665427:甘肃7665428:青海8765429:宁夏8765430:新疆76654水平冰柱图IIIIII510202530紊走柜牝虹B*3备一隹柜叱芸 江湖湖四山珏内古此主广耽廿新世云西由宁 6:7:B2:4:4-5:7-2-0.l3-7.Q:3:4:5:官9: 112 1 k1222J22222树状图Dendrogram using Ward MethodRescaled Distance Cluster Combine20251510C A S E 0 Label Num +山西4-+江西14-+-+内蒙5-+ +吉林7-+ |I黑龙江8-+-+I安徽12-+湖北17-+II湖南18-+II四川22-+-+I河北3-+-+ I+河南16-+ +-+II辽宁 6 +II青海28-+II宁夏29-+II西藏 25-+I贵州23-+II云南24-+I广西20-+I陕西26-+I甘肃27-+I新疆30-+I江苏10-+I山东15-+I广东19+II天津 2-+-+海南21-+I浙江11-+-+III福建13-+ +-+北京1-+I上海 9+结果分析:123456784类北京河北江苏广西天津山西山东贵州上海内蒙广东云南浙江辽宁西藏福建吉林陕西海南黑龙江甘肃安徽青海江西宁夏河南新疆湖北湖南四川5类北京河北上海江苏广西天津山西山东贵州浙江内蒙广东云南福建辽宁西藏海南吉林陕西黑龙江甘肃安徽青海江西宁夏河南新疆湖北湖南四川6类北京辽宁江西上海江苏广西天津河南吉林山东贵州浙江湖北黑龙江广东云南福建湖南安徽西藏海南四川山西陕西内蒙甘肃青海宁夏新疆7类北京辽宁江西上海江苏广西西藏天津河南吉林山东贵州青海浙江湖北黑龙江广东云南宁夏福建湖南安徽陕西海南四川山西甘肃内蒙新疆8类北京辽宁江西上海江苏湖北广西西藏天津 浙江 福建海南河南吉林 黑龙江 安徽 山西内蒙山东广东湖南四川贵州 云南 陕西 甘肃 新疆青海宁夏二、动态聚类法的SPSS实现在SPSS中,凝聚点的指定不是必须的,系统会自动根据分类数目, 结合样品情况来选取凝聚点。形成初始分类的方法通常有两种,一是直接将每个样品按与其距离最 近的凝聚点并类,二是先让每个凝聚点自成一类,将样品依此并入与 其距离最近的凝聚点的一类,并计算该类的重心,以这个重心代替原 来的凝聚点,再考虑下一个样品的并类,直至所有样品都归类为止。操作:分析(Analyze)n 分类(Classify)nk-均值聚类(K-Means Cluster) 打开k-均值聚类分析(K-Means Cluster Analysis)对话框变量列表框:聚类数(Number of Clusters)输入框输入指定的聚类数目。1.迭代(Iterate)按钮设置快速聚类的迭代终止条件。2.保存(Save)按钮 设置需要保存的分析结果。3.选项(Options)按钮 选择快速聚类的输出结果,并指定对缺失 数据的处理方法。输出结果的统计分析凝聚点表InitialClusterCentersCluster123456GDP5381.7255.982849.525002.34630.072462.57居民消费水平26991110125815279425343固定资产投资1639.8317.87704.871229.55150.84996.48职工平均工资825073824839514544759279货物周转量656.504.202033.301196.60301.10207.40居民消费价格指数114.00117.30115.20117.60121.40118.70商品零售价指数111.60114.90115.80114.20117.20113.00工业总产值1396.355.571234.852207.69324.721642.95最后类中心表Final Cluster CentersCluster123456GDP5381.72790.332647.025078.80829.982462.57居民消费水平269921121704172713475343固定资产投资1639.83294.11605.011332.25239.38996.48职工平均工资825073424945554448959279货物周转量656.50240.301083.871111.05410.62207.40居民消费价格指数114.00116.60116.80116.70118.05118.70商品零售价指数工业总产值111.601396.35112.70477.17114.871135.45114.252117.17115.95448.49113.001642.95类间距离表Distances between Final Cluster CentersCluster12345615007.8734551.0633029.9786060.0334153.00425007.8733256.0185128.2392570.9014340.74234551.0633256.0182786.7742119.1685765.11843029.9785128.2392786.7744804.9445918.45856060.0332570.9012119.1684804.9446316.47164153.0044340.7425765.1185918.4586316.471分类表Cluster MembershipCaseNumber省份ClusterDistance1北京21168.5252天津21057.8283河北31082.8824山西5516.8015内蒙5848.1236辽宁31062.6997吉林5833.3158黑龙江31242.4309上海6.00010江苏4480.52911浙江32046.16412安徽3935.18113福建31472.33314江西5807.88515山东4480.52916河南31111.73817湖北3477.43218湖南3660.95719广东1.00020广西21海南22四川23贵州24云南25西藏26陕西27甘肃28青海29宁夏30新疆5837.0305902.60331114.1595644.3435552.00421377.9115576.3415758.14451209.8475834.4835494.696每类中包含的样品数Number of Cases in each ClusterCluster11.00023.000310.00042.000513.00061.000Valid30.000Missing.000123456广东北京辽宁河北江苏广西新疆上海天津河南湖北山东江西吉林西藏湖南四川山西内蒙安徽浙江海南贵州福建黑龙江云南陕西甘肃青海宁夏习题1 土壤样品聚类.sav记录了 20个土壤样品的有关指标的数据,5项 指标分别是:含沙量X1,淤泥含量X2,粘土含量X3,有机物X4, PH值X5。利用系统聚类法完成样品分类,选取合适的分类数目,并 通过分析各类中所含样品各指标值的统计性质,说明各类土壤的特点。2森林及草资源.sav记录了世界18个国家的森林及草原资源的分布 情况。共有4项指标,分别是:森林面积X1,森林覆盖率X2,林木 蓄积量X3,草原面积X4。利用快速聚类法完成样品分类,选取合适 的分类数目,并通过分析各类中所含样品各指标值的统计性质,说明 各类国家的森林及草原资源的分布的情况。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸设计 > 毕设全套


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!