第八讲SPSS主成分分析和因子分析课件

资源描述

,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第八讲主成分分析和因子分析,一、概述,意义和作用：,解决变量间多重共线性。在社会经济研究工作中经常会遇到多指标的问题，这些指标间往往存在一定的相关，直接纳入分析不仅复杂，变量间难以取舍，而且由于分析前提不满足，得出错误结论。,第八讲主成分分析和因子分析一、概述意义和作用：,1,变量压缩。主成分分析通过线性变换，在尽可能,保留原始变量的信息,的基础，,降低维度,，将原来的多个变量组合成相互,独立,的少数的、新的综合变量。,变量解释。利用新变量进一步探讨变量内在联系和结构，利于简化和解释问题。,因子分析和主成分分析方法，往往是更复杂的统计分析方法的基础。,Factor1.sav 、 Factor2.sav,变量压缩。主成分分析通过线性变换，在尽可能保留原始变量的信息,2,二、主成分分析,1、基本原理,统计信息实际上是指数据变异信息,右图中，在椭圆的长轴方向数据变异明显大于短轴方向,二、主成分分析1、基本原理,3,F1,F2,F1与F2不相关,沿长、短轴方向设定新坐标系，长轴变量承载大部分变异信息，短轴变量承载少量变异信息,一个长轴新变量F,就可以代表原来两个变量的主要信息，从而起到降维作用,在主成分分析中，提取出的每个新变量(主成分)都是原来多个变量的线性组合,F1F2F1与F2不相关沿长、短轴方向设定新坐标系，长轴变量,4,如由两个原始变量X,1,和X,2,，可提取两个主成分:,F,1,=a,11,X,1,+a,21,X,2,F,2,=a,12,X,1,+a,22,X,2,依次类推：由N个原始变量可提取N个主成分，但如果将它们全部提取出来就失去了该方法简化数据的实际意义,一般情况下按贡献率由大到小，取累计贡献率达到85的前23个主成分，其他的忽略不计。,在进行主成分回归时，提取出的主成分能包含主要信息即可，不一定要有准确的实际含义。,如由两个原始变量X1和X2，可提取两个主成分:,5,利用主成分进行综合评价：当进行多指标的综合评价时，应用主成分方法将多指标中的信息集中为若干个主成分，然后加权求和，得到综合评价指数。,利用主成分进行回归分析：通过对存在共线性的自变量进行主成分分析，从而在提取多数信息的同时解决共线性问题。,2、应用,利用主成分进行综合评价：当进行多指标的综合评价时，应用主成分,6,与主成分分析相同，也是一种多变量化简、降维技术。,在主成分分析时，要求提取出的主成分能包含主要信息即可，不一定要有准确的实际含义。但在因子分析中，目的是分解原始变量，从中归纳出潜在的“类别”，相关性较强的指标归为一类，每一类变量代表了一个“共同因子”，即一种内在结构。因子分析就是要寻找该结构。,在实际应用中，有时两者不加区分,三、因子分析,1、概述,与主成分分析相同，也是一种多变量化简、降维技术。三、因子分析,7,为了找出变量间内在结构，要求因子分析满足以下条件：,样本量,样本量与变量数的比例应在5: 1以上,总样本量最好大于100，而且原则上越大越好,各变量间必须有相关性,KMO统计量:在（0，1）之间，大于0.9最佳， 0.9-0.7尚可， 0.7-0.6很差，0.5以下放弃,Bartletts球形检验：对变量间的独立性进行检验，若变量间相互独立（Sig.大于0.05)，因子分析无效,2、适用条件,为了找出变量间内在结构，要求因子分析满足以下条件：2、适,8,判断数据是否符合要求，是否有必要进行主成分/因子分析,对原有变量标准化，以消除计量单位和数据基数的影响(SPSS会自动对原始变量标准化）,根据标准化数据计算相关矩阵或协方差矩阵，及其特征根和特征向量,进行分析，按一定标准确定提取的主成分/因子数,3、步骤,判断数据是否符合要求，是否有必要进行主成分/因子分析3、步骤,9,如果进行的是主成分分析，步骤到此结束,如果进行的是因子分析，则考察因子的可解释性，并在必要时进行因子旋转，使因子载荷向0、1分化，以寻求最佳解释,如有必要，计算因子得分等中间指标供进一步分析使用,如果进行的是主成分分析，步骤到此结束,10,特征根(Eigenvalue ）：是因子影响力度的指标，其数值代表因子相当于原始变量平均解释力的多少。特征根大于1，表示引入的因子解释力度大于一个原始变量平均解释力度。因此往往将特征根大于作为抽取因子的标准。,方差贡献率：数值越大，表明该因子对原来变量信息的综合能力越强。,累计贡献率,4、输出统计量,特征根(Eigenvalue ）：是因子影响力度的指标，其数,11,变量X,i,的变量共同度：也称公因子方差比，是提取公因子后，各变量中信息被提取出的比例，或者说原变量的信息量(方差)由公因子决定的比例,旋转前/后因子载荷,：反映因子和各个变量间的密切程度的指标，实质是两者间的相关系数,因子得分函数系数,变量Xi的变量共同度：也称公因子方差比，是提取公因子后，各变,12,公因子数量的确定,主成分的累积贡献率：85%以上,特征根：大于1,综合判断。因子分析时更重要的是因子的可解释性，必要时保留特征根小于1的因子,利用碎石图帮助确定因子数量,5、公因子数的确定,公因子数量的确定5、公因子数的确定,13,例：在Factor2.sav中，有重庆市40个区县的GDP、工业总产值等九个指标数据，试根据这些指标对各区县经济发展状况进行综合评价。,在SPSS中的实现：,分析(Analyze)-数据降维(Data Reduction)-因子分析(Factor Analyze),在因子分析对话框中，将原变量选入“变量”列表框中,在“描述”按钮对话框，在“相关矩阵”部分选择“系数”和“KMO和Bartlett球形度检验”,6、在SPSS中的实现,例：在Factor2.sav中，有重庆市40个区县的GDP、,14,在“抽取”按钮对话框，“方法”设定为“主成分”,在“旋转”按钮对话框，“方法”设定为“最大方差法”,在“得分”按钮对话框，选择“保存为变量”、“方法”设定为“回归”，选择“显示因子得分系数矩阵”,在“抽取”按钮对话框，“方法”设定为“主成分”,15,说明的总方差表：包括特征根，旋转前/后的方差贡献率、累计贡献率,变量共同度,旋转前/后因子载荷矩阵,因子得分模型系数：求出公因子后，可以用回归估计方法求出因子得分数学模型（在因子分析中，不能直接由载荷矩阵按列得到因子的表达式）,7、输出结果阅读,说明的总方差表：包括特征根，旋转前/后的方差贡献率、累计贡献,16,某市15个大中型企业经济效益数据见“某市工业企业效益指标.sav”，利用因子分析方法对企业经济效益进行综合评价及分析。,上机习题,某市15个大中型企业经济效益数据见“某市工业企业效益指,17,

展开阅读全文

第八讲SPSS主成分分析和因子分析课件

最新文档