主成分分析和因子分析

上传人:tian****1990 文档编号:246700920 上传时间:2024-10-15 格式:PPT 页数:17 大小:240.99KB
返回 下载 相关 举报
主成分分析和因子分析_第1页
第1页 / 共17页
主成分分析和因子分析_第2页
第2页 / 共17页
主成分分析和因子分析_第3页
第3页 / 共17页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第八讲主成分分析和因子分析,一、概述,意义和作用:,解决变量间多重共线性。在社会经济研究工作中经常会遇到多指标的问题,这些指标间往往存在一定的相关,直接纳入分析不仅复杂,变量间难以取舍,而且由于分析前提不满足,得出错误结论。,变量压缩。主成分分析通过线性变换,在尽可能,保留原始变量的信息,的基础,,降低维度,,将原来的多个变量组合成相互,独立,的少数的、新的综合变量。,变量解释。利用新变量进一步探讨变量内在联系和结构,利于简化和解释问题。,因子分析和主成分分析方法,往往是更复杂的统计分析方法的基础。,Factor1.sav,、,Factor2.sav,二、主成分分析,1、基本原理,统计信息实际上是指数据变异信息,右图中,在椭圆的长轴方向数据变异明显大于短轴方向,F1,F2,F1与F2不相关,沿长、短轴方向设定新坐标系,长轴变量承载大部分变异信息,短轴变量承载少量变异信息,一个长轴新变量F,就可以代表原来两个变量的主要信息,从而起到降维作用,在主成分分析中,提取出的每个新变量(主成分)都是原来多个变量的线性组合,如由两个原始变量,X,1,和,X,2,,,可提取两个主成分,:,F,1,=a,11,X,1,+a,21,X,2,F,2,=a,12,X,1,+a,22,X,2,依次类推:由,N,个原始变量可提取,N,个主成分,但如果将它们全部提取出来就失去了该方法简化数据的实际意义,一般情况下按贡献率由大到小,取累计贡献率达到,85,的前,2,3,个主成分,其他的忽略不计。,在进行主成分回归时,提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。,利用主成分进行综合评价:当进行多指标的综合评价时,应用主成分方法将多指标中的信息集中为若干个主成分,然后加权求和,得到综合评价指数。,利用主成分进行回归分析:通过对存在共线性的自变量进行主成分分析,从而在提取多数信息的同时解决共线性问题。,2、应用,与主成分分析相同,也是一种多变量化简、降维技术。,在主成分分析时,要求提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。但在因子分析中,目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,每一类变量代表了一个“共同因子”,即一种内在结构。因子分析就是要寻找该结构。,在实际应用中,有时两者不加区分,三、因子分析,1、概述,为了找出变量间内在结构,要求因子分析满足以下条件:,样本量,样本量与变量数的比例应在,5:1,以上,总样本量最好大于,100,,而且原则上越大越好,各变量间必须有相关性,KMO,统计量,:,在(,0,,,1,)之间,大于,0.9,最佳,,尚可,,很差,,0.5,以下放弃,Bartletts,球形检验:对变量间的独立性进行检验,若变量间相互独立(,Sig.,大于,0.05),,因子分析无效,2、适用条件,判断数据是否符合要求,是否有必要进行主成分,/,因子分析,对原有变量标准化,以消除计量单位和数据基数的影响,(SPSS,会自动对原始变量标准化),根据标准化数据计算相关矩阵或协方差矩阵,及其特征根和特征向量,进行分析,按一定标准确定提取的主成分,/,因子数,3、步骤,如果进行的是主成分分析,步骤到此结束,如果进行的是因子分析,则考察因子的可解释性,并在必要时进行因子旋转,使因子载荷向,0,、,1,分化,以寻求最佳解释,如有必要,计算因子得分等中间指标供进一步分析使用,特征根,(,Eigenvalue,):,是因子影响力度的指标,其数值代表因子相当于原始变量平均解释力的多少。特征根大于,1,,表示引入的因子解释力度大于一个原始变量平均解释力度。因此往往将特征根大于作为抽取因子的标准。,方差贡献率:数值越大,表明该因子对原来变量信息的综合能力越强。,累计贡献率,4、输出统计量,变量,X,i,的变量共同度:也称公因子方差比,是提取公因子后,各变量中信息被提取出的比例,或者说原变量的信息量,(,方差,),由公因子决定的比例,旋转前,/,后因子载荷,:反映因子和各个变量间的密切程度的指标,实质是两者间的相关系数,因子得分函数系数,公因子数量的确定,主成分的累积贡献率:,85%,以上,特征根:大于,1,综合判断。因子分析时更重要的是因子的可解释性,必要时保留特征根小于,1,的因子,利用碎石图帮助确定因子数量,5、公因子数的确定,例:在Factor2.sav中,有重庆市40个区县的GDP、工业总产值等九个指标数据,试根据这些指标对各区县经济发展状况进行综合评价。,在,SPSS,中的实现:,分析,(Analyze)-,数据降维,(Data Reduction)-,因子分析,(Factor Analyze),在因子分析对话框中,将原变量选入“变量”列表框中,在“描述”按钮对话框,在“相关矩阵”部分选择“系数”和“,KMO,和,Bartlett,球形度检验”,6、在SPSS中的实现,在“抽取”按钮对话框,“方法”设定为“主成分”,在“旋转”按钮对话框,“方法”设定为“最大方差法”,在“得分”按钮对话框,选择“保存为变量”、“方法”设定为“回归”,选择“显示因子得分系数矩阵”,说明的总方差表:包括特征根,旋转前,/,后的方差贡献率、累计贡献率,变量共同度,旋转前,/,后因子载荷矩阵,因子得分模型系数:求出公因子后,可以用回归估计方法求出因子得分数学模型(在因子分析中,不能直接由载荷矩阵按列得到因子的表达式),7、输出结果阅读,某市15个大中型企业经济效益数据见“某市工业企业效益指标.sav”,利用因子分析方法对企业经济效益进行综合评价及分析。,上机习题,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!