第5章 主成分分析

上传人:jkl****17 文档编号:172553746 上传时间:2022-12-05 格式:DOC 页数:4 大小:126KB
返回 下载 相关 举报
第5章 主成分分析_第1页
第1页 / 共4页
第5章 主成分分析_第2页
第2页 / 共4页
第5章 主成分分析_第3页
第3页 / 共4页
点击查看更多>>
资源描述
第五章 主成分分析一、填空题1主成分分析就是设法将原来众多 的指标,重新组合成一组新的 的综合指标来代替原来指标。2主成分分析的数学模型可简写为 ,该模型的系数要求 。3主成分分析中,利用 的大小来寻找主成分。4第k个主成分的贡献率为 ,前k个主成分的累积贡献率为 。5确定主成分个数时,累积贡献率一般应达到 ,在spss中,系统默认为 。6主成分的协方差矩阵为_矩阵。7原始变量协方差矩阵的特征根的统计含义是_。8原始数据经过标准化处理,转化为均值为_ _,方差为_ _的标准值,且其_矩阵与相关系数矩阵相等。9在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为_。10SPSS中主成分分析采用_命令过程。二、判断题1主成分分析就是设法将原来众多具有一定相关性的指标,重新组合成一组新的相互无关的综合指标来代替原来指标。 ( )2主成分y的协差阵为对角矩阵。 ( )3.的主成分就是以的特征向量为系数的一个组合,它们互不相关,其方差为的特征根。 ( )4原始变量的信息提取率表示这m个主成分所能够解释第i个原始变量变动的程度。 ( )5在spss中,可以直接进行主成分分析。 ( )6主成分分析可用于筛选回归变量。 ( )7SPSS中选取主成分的方法有两个:一种是根据特征根1来选取; 另一种是按照累积贡献率85%来选取。 ( )8主成分方差的大小说明了该综合指标反映p个原始观测变量综合变动程度的能力的大小。 ( )9主成分表达式的系数向量是协方差矩阵的特征向量。 ( ) 10主成分与原始变量的相关系数反映了第k个公共因子对第i个原始变量的解释程度。 ( )三、简答题1简述主成分的概念及几何意义。2主成分分析的基本思想是什么?3.简述主成分分析的计算步骤。4主成分有哪些性质?5主成分主要应用在哪些方面?四、计算题1假设3个变量 、和的协方差矩阵为:要求用此协差阵和相应的相关阵对这3个变量进行主成分分析,根据计算结果说明应选取多少个主成分以代表原来的3个变量,并说明理由。2在一项研究中,测量了376只鸡的骨骼,并利用相关系数矩阵进行主成分分析,见下表:Y1Y2Y3Y4Y5Y6头长x1头宽x2肱骨x3尺骨x4股骨x5胫骨x60.350.330.440.440.430.440.530.700.190.250.280.220.76-0.64-0.05-0.02-0.06-0.05-0.050.000.530.480.510.48-0.040.000.190.150.670.700.000.040.590.630.480.15特征值4.570.710.410.170.080.06(1)解释6个主成分的实际意义。(2)计算前三个主成分各自的贡献率和累积贡献率。(3)对于y4,y5,y6的方差很小这一点,你怎样对实际情况作出推断。3假设某商场棉鞋 、凉鞋、布鞋三种商品销售量的协方差矩阵如下:试求各主成分,并对各主成分的贡献率和各个原始观测变量的信息提取率进行讨论。4对某市15个大中型工业企业进行经济效益分析,经研究确定,从有关经济效益指标中选取7个指标作分析,即固定资产产值率(X1),固定资产利税率(X2),资金利润率(X3),资金利税率(X4),流动资金周转天数(X5),销售收入利税率(X6)和全员劳动生产率(X7)。数据资料如下:企业及编号固定资产产值率X1固定资产利税率(X2)资金利润率(X3)资金利税率(X4)流动资金周转天数(X5)销售收入利税率(X6)全员劳动生产率(X7)康佳电子1茂名石化2华空空调3三星集团4数源科技5中华电子6南方制药7中国长城8白云制药9五羊自行10广发卷烟11岭南通信12华南冰箱13潮州二轻14稀土高科1553. 2559.8246.7834.3975.3266.4668.1856.1359.2552.4755.7661.1950.4167.9551.0716.6819.7015.207.2929.4532.9325.3915.0519.8221.1316.7515.8316.5322.2412.9218.419.216.244.7643.6833.8727.5614.2120.1726.5219.2317.4320.6337.0012.5426.7527.5623.408.9756.4942.7837.8519.4928.7835.2028.7228.0329.7354.5920.8255556562695063767162586169636631.8432.9432.9821.3040.7447.9833.7627.2133.4139.4129.6226.4032.4931.0525.121.752.871.531.632.142.602.431.751.831.731.521.601.311.571.83根据下面SPSS软件的输出信息,回答:(1)这个数据的7个变量可以用几个综合变量(主成分)来表示?(2)这几个综合变量(主成分)包含有多少原来的信息?(3)写出这几个综合变量(主成分)的模型。Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %14.63566.21966.2194.63566.21966.21921.28518.35884.5771.28518.35884.5773.5878.38992.966 4.3905.57698.542 5.0871.24399.785 6.013.18299.967 7.002.033100.000 Extraction Method: Principal Component Analysis.Component Matrix(a) Component12固定资产率.888.213固定资产利税率.984-.028资金利润率.943.272资金利税率.909.315流动资金周转天数-.284.833销售收入利税率.860-.139全员劳动生产率.585-.594Extraction Method: Principal Component Analysis.a 2 components extracted.五、证明题主成分有三个重要性质:的协差阵为对角阵;试分别加以证明。六、SPSS操作题1.下面是8个学生两门课程的成绩表:12345678英语x1数学x2100659085707070908585554555554565(1)求出两个特征根及其对应的单位特征向量;(2)求出主成分,并写出表达式;(3)求出主成分的贡献率,并解释主成分的实际意义;(4)求出两个主成分的样本协方差矩阵;(5)第1个样本主成分与第2个变量样本之间的相关系数为多少(6)求出8个学生第一主成分得分并进行排序2.某中学十二名女生的身高x1,体重x2的数据如下:123456789101112身高体重155481534615748154451584915246160481564515851157471594816150(1)两个变量的协方差矩阵与相关系数阵;(2)两个特征根及其对应的单位特征向量;(3)主成分的表达式并解释各贡献率的大小意义和主成分的实际意义;(4)如果舍弃主成分y2,则哪一个原变量的信息损失量最大;(5)画出全部样本的主成分散点图。3根据下列某地区11年数据X1(总产值)X2(存储量)X3(总消费)y(进口额)1234567891011149.3161.2171.5175.5180.8190.7202.1212.4226.1231.9239.04.24.13.13.11.12.22.15.65.05.10.7108.1114.8123.2126.9132.1137.7146.0154.1162.3164.3167.615.916.419.019.118.820.422.726.528.127.626.3(1)计算地区总产值、存储量和总消费的相关系数矩阵。(2)求特征根及其对应的特征向量。(3)求出主成分及每个主成分的方差贡献率;(4)利用主成分方法建立y与x1,x2,x3的回归方程(取两个主成分)。4
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 商业管理 > 营销创新


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!