2.7主成分分析法与层次分析法

上传人:t****d 文档编号:243014588 上传时间:2024-09-13 格式:PPT 页数:12 大小:160KB
返回 下载 相关 举报
2.7主成分分析法与层次分析法_第1页
第1页 / 共12页
2.7主成分分析法与层次分析法_第2页
第2页 / 共12页
2.7主成分分析法与层次分析法_第3页
第3页 / 共12页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2.7 主成分分析法与层次分析法,主成分概念首先是由Karl Parson在1901年引进的,不过当时只对非随机变量来讨论的.1933年Hotelling将这个概念推广到随机向量.,在实际问题中,经常会遇到研究多指标(变量)问题,然而在多数情况下,不同指标之间是有一定相关性.由于指标较多再加上指标之间有一定的相关性,势必增加了分析问题的复杂性.主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标,同时根据实际需要从中选取几个较少的综合指标尽可能多地反映原来指标的信息.,1,这种将多个指标化为少数互相无关的综合指标的统计方法就叫主成分分析或称为主分量分析.也是数学上处理降维的一种方法.,例1,生产服装有很多指标,比如袖长、肩宽、身高等十几个指标,服装厂生产时,不可能按照这么多指标来做,怎么办?一般情况,生产者考虑几个综合的指标,象标准体形、特形等。,例2,企业经济效益的评价,它涉及到很多指标。如百元固定资产原值实现产值、百元固定资产原值实现利税,百元资金实现利税,百元工业总产值实现利税,百元销售收入实现利税,每吨标准煤实现工业产值,每千瓦时电力实现工业产值,全员劳动生产率,百元流动资金实现产值等,我们要找出综合指标,来评价企业的效益。,2,基本思想:,主成分分析就是设法将原来众多具有一定相关性的指标(比如p个指标),重新组合成一组相互无关的综合指标来代替原来指标。通常数学上的处理就是将原来p个指标作线性组合,作为新的综合指标。,但是这种线性组合,如果不加限制,则可以有很多,我们应该如何去选取呢?如果将选取的第一个线性组合即第一个综合指标记为F,1,,自然希望F,1,尽可能多的反映原来指标的信息,这里的“信息”用什么来表达?最经典的方法就是用F,1,的方差来表达,即var(F,1,)越大,表示F,1,包含的信息越多。因此在所有的线性组合中所选取的F,1,应该是方差最大的,故称F,1,为第一主成分。,3,如果第一主成分不足以代表原来p个指标的信息,再考虑选取F,2,即选第二个线性组合。为了有效地反映原来信息,F,1,已有的信息就不需要再出现在F,2,中,用数学语言表达就是要求Cov(F,1,F,2,)=0,称F,2,为第二主成分,依此类推,可以制造出第三、四第p个主成分。不难想像这些主成分之间不仅不相关,而且它们的方差依次递减。因此,在实际工作中,就挑选前几个最大的主成分(一般取信息量包含85%以上的前几个指标),虽然这样做会损失一部分信息,但是由于它使我们抓住了主要矛盾,并从原始数据中进一步提取了某些新的信息,因而在某些实际问题的研究中得益比损失大,这种既减少了变量的数目又抓住了主要矛盾的做法有利于问题的分析和处理。,4,主成分分析的数学模型,5,此时所选取的综合指标,相当于在原指标的基础上,进行了坐标旋转,使得第一个指标的方差最大(含有最多的信息)。若只选取前几个综合指标,则意味着降维。,6,主成分分析的具体推导,7,若m个主成分的累计贡献率超过85%,那我们认为前m个主成分基本包含了原来指标信息。,8,例:各地区居民消费情况主成分分析 (2001年全国各地区消费情况指数),地区,食品,X1,衣着,X2,家庭设备用品及服务,X3,医疗保健和个人用品,X4,交通和通信,X5,娱乐教育文化,X6,居住,X7,北 京,101.5,100.4,97.0,98.7,100.8,114.2,104.2,天 津,100.8,93.5,95.9,100.7,106.7,104.3,106.4,河 北,100.8,97.4,98.2,98.2,99.5,103.6,102.4,山 西,99.4,96.0,98.2,97.8,99.1,98.3,104.3,内蒙古,101.8,97.7,99.0,98.1,98.4,102.0,103.7,辽 宁,101.8,96.8,96.4,92.7,99.6,101.3,103.4,吉 林,101.3,98.2,99.4,103.7,98.7,101.4,105.3,9,黑龙江,101.9,100.0,98.4,96.9,102.7,100.3,102.3,上 海,100.3,98.9,97.2,97.4,98.1,102.1,102.3,江 苏,99.3,97.7,97.6,101.1,96.8,110.1,100.4,浙 江,98.7,98.4,97.0,99.6,95.6,107.2,99.8,安 徽,99.7,97.7,98.0,99.3,97.3,104.1,102.7,福 建,97.6,96.5,97.6,102.5,97.2,100.6,99.9,江 西,98.0,98.4,97.1,100.5,101.4,103.0,99.9,山 东,101.1,98.6,98.7,102.4,96.9,108.2,101.7,河 南,100.4,98.6,98.0,100.7,99.4,102.4,103.3,湖 北,99.3,96.9,94.0,98.1,99.7,109.7,99.2,湖 南,98.6,97.4,96.4,99.8,97.4,102.1,100.0,广 东,98.2,98.2,99.4,99.3,99.7,101.5,99.9,10,2001年全国各地区消费情况指数,广 西,98.5,96.3,97.0,97.7,98.7,112.6,100.4,海 南,98.4,99.2,98.1,100.2,98.0,98.2,97.8,重 庆,99.2,97.4,95.7,98.9,102.4,114.8,102.6,四 川,101.3,97.9,99.2,98.8,105.4,111.9,99.9,贵 州,98.5,97.8,94.6,102.4,107.0,115.0,99.5,云 南,98.3,96.3,98.5,106.2,92.5,98.6,101.6,西 藏,99.3,101.1,99.4,100.1,103.6,98.7,101.3,陕 西,99.2,97.3,96.2,99.7,98.2,112.6,100.5,甘 肃,100.0,99.9,98.2,98.3,103.6,123.2,102.8,青 海,102.2,99.4,96.2,98.6,102.4,115.3,101.2,宁 夏,100.1,98.7,97.4,99.8,100.6,112.4,102.5,新 疆,104.3,98.7,100.2,116.1,105.2,101.6,102.6,11,前三个主成分为:,第一主成分:F1=0.3758X1+0.3682X2+0.3666X3+0.3764X4+0.3762X5+0.3991 X6+0.3824 X7,第二主成分:F2=-0.1352X1-0.0898X2-0.2381X3-0.3488 X4+0.0387 X5+0.8762 X6-0.1617 X7,第三主成分:F3=-0.2001X1-0.1447X2-0.0954X3+0.8332X4-0.2777 X5+0.2098X6-0.3384X7,前三个特征值累计贡献率已达99.987%,说明前三个主成分基本包含了全部指标具有的信息。,在第一主成分的表达式中,每项指标的系数都差不多大,我们可以把第一主成分看成是七个指标共同刻画的反映消费结构的综合指标。,在第二主成分的表达式中,第六项指标的影响特别大,远远超过其他指标的影响,我们可以单独看成是娱乐教育文化的影响。,在第三主成分的表达式中,第四项影响特别大,其次是第三、五项指标的影响,可将它看成是反映医疗保健和个人用品、家庭设备用品及服务和交通通讯的综合指标。,12,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!