多元统计-主成分分析案例

上传人:hjk****65 文档编号:245332970 上传时间:2024-10-08 格式:PPT 页数:23 大小:677.50KB
返回 下载 相关 举报
多元统计-主成分分析案例_第1页
第1页 / 共23页
多元统计-主成分分析案例_第2页
第2页 / 共23页
多元统计-主成分分析案例_第3页
第3页 / 共23页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,主成分分析,法通过研究指标体系的,内在结构关系,,从而将,多个指标,转化为,少数几个,相互独立且包含原来指标大部分信息(,80%,或,85%,以上)的综合指标。其优点在于它确定的,权数,是基于数据分析而得出的指标之间的内在结构关系,不受主观因素的影响,有较好的,客观性,,而且得出的综合指标(主成分)之间相互独立,减少信息的交叉,这对分析评价极为有利。,例,1,、,主成分分析用于综合评价,反映地区社会经济发展的指标体系,X,1,:国内生产总值(,GDP,),X,2,:人均,GDP,X,3,:第三产业产值占,GDP,比重,X,4,:人均出口额,X,5,:工业企业劳动生产率,X,6,:人均社会消费品零售额,X,7,:每万人拥有卫生技术人员数,X,8,:每万人高等学校在校生数,X,9,:教育经费投入占,GDP,比重,X,10,:人均货运总量,X,11,:人均邮电业务总量,X,12,:每万人电话机装机数,X,13,:人均固定资产投资,X,14,:人均实际利用外资,X,15,:地方财政收入占,GDP,比重,X,16,:每万人科研机构数,X,17,:科研经费占,GDP,比重,对全国,31,个地区上述,17,项指标的数据进行主成分分析,应用,SAS,软件进行处理。,数据见,CD.PCRex01,1,、,求相关系数矩阵,R,2,、,计算,R,的特征值,主成分,Y,1,Y,2,Y,3,Y,4,特征根,贡献率(,%,),累计贡献率,11.1134,65.37,65.37,2.6656,15.68,81.05,0.9126,5.37,86.42,0.7052,4.15,90.57,3,、,求特征根所对应的单位特征向量,0.513225,0.203116,-0.182858,0.193618,0.217290,0.113642,-0.164527,-0.114637,-0.509240,-0.025832,0.083471,0.132592,0.105402,0.199407,-0.181330,-0.261367,-0.295756,0.038466,0.276020,0.243654,0.263487,0.180546,0.290834,0.259842,0.280523,0.094233,0.215946,0.292016,0.288268,0.282016,0.259006,0.216793,0.259962,0.212293,X,1,X,2,X,3,X,4,X,5,X,6,X,7,X,8,X,9,X,10,X,11,X,12,X,13,X,14,X,15,X,16,X,17,Y,2,Y,1,特征向量,第一主成分名次,地区,Y,1,得分,Y,2,得分,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,北京,上海,天津,广东,辽宁,福建,浙江,江苏,海南,新疆,吉林,黑龙江,山西,宁夏,云南,11.7257,10.1776,5.1235,2.7422,1.1325,0.5586,0.2718,0.1817,0.0795,-0.3075,-0.4873,-0.6307,-0.7467,-0.7791,-0.8203,-3.94396,2.43505,0.12551,3.34907,0.61942,1.90248,2.31576,2.53147,-0.79528,-1.07448,-1.09413,0.61915,-1.13709,-1.92281,-0.48313,4,、主成分的表达式及其含义解释,5,、计算主成分得分,第一主成分名次,地区,Y,1,得分,Y,2,得分,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,陕西,山东,青海,湖北,内蒙古,河北,甘肃,重庆,湖南,西藏,广西,四川,江西,河南,安徽,贵州,-0.9116,-1.0207,-1.1131,-1.1943,-1.2295,-1.4456,-1.8358,-1.8603,-1.8806,-1.9085,-1.9098,-2.1979,-2.3049,-2.3383,-2.4358,-2.6347,-2.06481,2.32993,-1.47145,0.66326,-0.87181,1.25757,-1.40987,-0.36439,0.04577,-2.04139,-0.42078,0.33126,0.07660,0.86909,0.45974,-0.83575,主成分分析在市场研究中的应用,为了对常用的,100,种食品的生产进行经营决策,需要就消费者对食品的嗜好程度进行调查。对,785,名消费者进行调查,要求每个消费者对,100,种食品进行评价,按对食品的,喜好程度,评分,最受欢迎的给予最高分,9,分,最不受欢迎的给予最低分,1,分。,食品生产预测(日本户田),将被调查者按,性别,与,年龄,分成,10,组,假若你是该食品加工业决策部门的高级顾问,为了对食品生产作出合理决策,请你对调查资料进行分析,为决策者提供建议。,以组为单位,在每组中每个成员都对,100,种食品给予评分,然后计算,每组成员对每种食品评分的,平均值,。,食品,组号,123456789,10,1,2,3,.,.,100,7.8 5.4 3.9 3.5 3.0 8.1 6.0 5.4 3.8,1.6 2.8 4.4 4.0 3.5 6.2 7.2 7.5 7.0,.,.,.,3.1 2.8 3.3 3.0 2.5 3.9 3.5 3.0 2.8,2.5,9.0,3.0,15,组表示男性,,610,组表示女性,15,,,610,年龄从小到大排序,特征向量,y,1,y,2,y,3,X,1,X,2,X,3,X,4,X,5,X,6,X,7,X,8,X,9,X,10,0.286,0.331,0.323,0.299,0.261,0.309,0.344,0.348,0.346,0.303,0.443,0.235,-0.172,-0.364,-0.509,0.409,0.256,0.036,-0.164,-0.267,0.194,0.336,0.442,0.375,0.123,-0.034,-0.171,-0.290,-0.322,-0.522,特征根,方差贡献率,累计方差,贡献率,6.826,68.26%,68.26%,1.769,17.69%,85.95%,0.75,7.5%,93.45%,y,1,反映了公共,平均嗜好,程度,,y,1,得分越大,表示大众越喜欢吃此食品。,y,2,反映了,年龄,的作用。,y,2,得分为正时,表示孩子喜欢吃,;y,2,得分为负时,表示孩子不喜欢吃。,y,3,反映,性别,的作用。,y,3,得分为正时,表示男性喜欢吃,;y,3,得分为负时,表示女性喜欢吃。,主成分的含义,用 得分来表示食品嗜好程度可有七成把握。,在充分注意到人们普遍的嗜好程度基础上,进一步考虑到青少年和老年人的嗜好程度,对食品业的开发方针作出决策时,将有,85%,的把握。,特别喜欢吃的,醋拌生鱼片、冰激棱,一般喜欢,男性喜欢,女性喜欢,孩子,成人,咖喱饭,鸡蛋烩饭、炸猪排,炸肉饼、火腿面包,酸汤、大头鱼,一般不喜欢,孩子,成人,干咖喱、浓汤,煮牛肉、生蛋,饼干、带馅面包,酱面条、烧鱼,特别不喜欢,菜粥、清汤,为了较好地满足市场的需要,服装生产厂要了解所生产的一种服装究竟设计,几种型号,合适?这些型号的服装应按,怎样的比例,分配生产计划才能达到较好的经济效益?,服装的定型分类问题,X1,:身长,X2,:坐高,X3,:胸围,X4,:头高,X5,:裤长,X6,:下裆,X7,:手长,X8,:领围,X9,:前胸,X10,:后背,X11,:肩厚,X12,:肩宽,X13,:袖长,X14,:肋围,X15,:腰围,X16,:腿肚,对,128,名成年男子按,16,项指标进行测量。,特征值,贡献率,累计贡献率,7.03,2.61,1.63,0.84,0.77,0.64,0.58,0.46,0.36,0.31,0.24,0.22,0.17,0.14,0.07,0.04,44%,16%,10%,6%,5%,4%,3%,3%,2%,2%,2%,1%,1%1%,0,0,44%,60%,70%,76%,81%,85%,88%,91%,93%,95%,97%,98%,99%,100%,特征向量,y,1,y,2,y,3,X,1,身长,X,2,坐高,X,3,胸围,X,4,头高,X,5,裤长,X,6,下裆,X,7,手长,X,8,领围,X,9,前胸,X,10,后背,X,11,肩厚,X,12,肩宽,X,13,袖长,X,14,肋围,X,15,腰围,X,16,腿肚,0.34,0.27,0.23,0.34,0.33,0.29,0.29,0.19,0.09,0.15,0.10,0.24,0.32,0.18,0.27,0.16,0.20,0.14,-0.33,0.18,0.20,0.27,0.19,-0.37,0.07,-0.17,-0.35,-0.02,0.11,-0.37,-0.27,-0.36,0.01,-0.06,0.14,0.03,0.03,-0.03,0.02,-0.15,0.63,-0.53,-0.20,-0.31,-0.02,0.25,0.14,0.24,y,1,是刻画尺寸,大小,的因子。,y,2,反映人的胖瘦情况,是一个,体形,因子。反映“长”的尺寸前面的系数为正,;,反映“围”的尺寸前的系数为负。,y,3,系数多数取值很小,接近于,0,。只有三个系数绝对值较大。,y,3,是反映,特殊体形,的因子,区分有无畸形。,区分有几种型号 (分类),各种型号的生产量(比例),要解决的问题:,样品的分类,(图解样品),1,、计算,y,1,、,y,2,的得分。,2,、以,y,1,为横坐标、,y,2,为纵坐标,描点。,3,、把样品按在图上的集中情况分成若干组(,g,组)。,4,、取每一组的中心,(,k=1,,,2,,,g),作为该组的代表点。,相应原,16,个指标的尺寸:,5,、各种型号的,比例,按,该组样品数,/128,确定。,Practice makes perfect,Wish you success,!,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业管理 > 营销创新


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!