第八讲SPSS主成分分析和因子分析课件

上传人:风*** 文档编号:242624433 上传时间:2024-08-29 格式:PPT 页数:17 大小:101.94KB
返回 下载 相关 举报
第八讲SPSS主成分分析和因子分析课件_第1页
第1页 / 共17页
第八讲SPSS主成分分析和因子分析课件_第2页
第2页 / 共17页
第八讲SPSS主成分分析和因子分析课件_第3页
第3页 / 共17页
点击查看更多>>
资源描述
,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第八讲主成分分析和因子分析,一、概述,意义和作用:,解决变量间多重共线性。在社会经济研究工作中经常会遇到多指标的问题,这些指标间往往存在一定的相关,直接纳入分析不仅复杂,变量间难以取舍,而且由于分析前提不满足,得出错误结论。,第八讲主成分分析和因子分析一、概述意义和作用:,1,变量压缩。主成分分析通过线性变换,在尽可能,保留原始变量的信息,的基础,,降低维度,,将原来的多个变量组合成相互,独立,的少数的、新的综合变量。,变量解释。利用新变量进一步探讨变量内在联系和结构,利于简化和解释问题。,因子分析和主成分分析方法,往往是更复杂的统计分析方法的基础。,Factor1.sav 、 Factor2.sav,变量压缩。主成分分析通过线性变换,在尽可能保留原始变量的信息,2,二、主成分分析,1、基本原理,统计信息实际上是指数据变异信息,右图中,在椭圆的长轴方向数据变异明显大于短轴方向,二、主成分分析1、基本原理,3,F1,F2,F1与F2不相关,沿长、短轴方向设定新坐标系,长轴变量承载大部分变异信息,短轴变量承载少量变异信息,一个长轴新变量F,就可以代表原来两个变量的主要信息,从而起到降维作用,在主成分分析中,提取出的每个新变量(主成分)都是原来多个变量的线性组合,F1F2F1与F2不相关沿长、短轴方向设定新坐标系,长轴变量,4,如由两个原始变量X,1,和X,2,,可提取两个主成分:,F,1,=a,11,X,1,+a,21,X,2,F,2,=a,12,X,1,+a,22,X,2,依次类推:由N个原始变量可提取N个主成分,但如果将它们全部提取出来就失去了该方法简化数据的实际意义,一般情况下按贡献率由大到小,取累计贡献率达到85的前23个主成分,其他的忽略不计。,在进行主成分回归时,提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。,如由两个原始变量X1和X2,可提取两个主成分:,5,利用主成分进行综合评价:当进行多指标的综合评价时,应用主成分方法将多指标中的信息集中为若干个主成分,然后加权求和,得到综合评价指数。,利用主成分进行回归分析:通过对存在共线性的自变量进行主成分分析,从而在提取多数信息的同时解决共线性问题。,2、应用,利用主成分进行综合评价:当进行多指标的综合评价时,应用主成分,6,与主成分分析相同,也是一种多变量化简、降维技术。,在主成分分析时,要求提取出的主成分能包含主要信息即可,不一定要有准确的实际含义。但在因子分析中,目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,每一类变量代表了一个“共同因子”,即一种内在结构。因子分析就是要寻找该结构。,在实际应用中,有时两者不加区分,三、因子分析,1、概述,与主成分分析相同,也是一种多变量化简、降维技术。三、因子分析,7,为了找出变量间内在结构,要求因子分析满足以下条件:,样本量,样本量与变量数的比例应在5: 1以上,总样本量最好大于100,而且原则上越大越好,各变量间必须有相关性,KMO统计量:在(0,1)之间,大于0.9最佳, 0.9-0.7尚可, 0.7-0.6很差,0.5以下放弃,Bartletts球形检验:对变量间的独立性进行检验,若变量间相互独立(Sig.大于0.05),因子分析无效,2、适用条件,为了找出变量间内在结构,要求因子分析满足以下条件:2、适,8,判断数据是否符合要求,是否有必要进行主成分/因子分析,对原有变量标准化,以消除计量单位和数据基数的影响(SPSS会自动对原始变量标准化),根据标准化数据计算相关矩阵或协方差矩阵,及其特征根和特征向量,进行分析,按一定标准确定提取的主成分/因子数,3、步骤,判断数据是否符合要求,是否有必要进行主成分/因子分析3、步骤,9,如果进行的是主成分分析,步骤到此结束,如果进行的是因子分析,则考察因子的可解释性,并在必要时进行因子旋转,使因子载荷向0、1分化,以寻求最佳解释,如有必要,计算因子得分等中间指标供进一步分析使用,如果进行的是主成分分析,步骤到此结束,10,特征根(Eigenvalue ):是因子影响力度的指标,其数值代表因子相当于原始变量平均解释力的多少。特征根大于1,表示引入的因子解释力度大于一个原始变量平均解释力度。因此往往将特征根大于作为抽取因子的标准。,方差贡献率:数值越大,表明该因子对原来变量信息的综合能力越强。,累计贡献率,4、输出统计量,特征根(Eigenvalue ):是因子影响力度的指标,其数,11,变量X,i,的变量共同度:也称公因子方差比,是提取公因子后,各变量中信息被提取出的比例,或者说原变量的信息量(方差)由公因子决定的比例,旋转前/后因子载荷,:反映因子和各个变量间的密切程度的指标,实质是两者间的相关系数,因子得分函数系数,变量Xi的变量共同度:也称公因子方差比,是提取公因子后,各变,12,公因子数量的确定,主成分的累积贡献率:85%以上,特征根:大于1,综合判断。 因子分析时更重要的是因子的可解释性,必要时保留特征根小于1的因子,利用碎石图帮助确定因子数量,5、公因子数的确定,公因子数量的确定5、公因子数的确定,13,例:在Factor2.sav中,有重庆市40个区县的GDP、工业总产值等九个指标数据,试根据这些指标对各区县经济发展状况进行综合评价。,在SPSS中的实现:,分析(Analyze)-数据降维(Data Reduction)-因子分析(Factor Analyze),在因子分析对话框中,将原变量选入“变量”列表框中,在“描述”按钮对话框,在“相关矩阵”部分选择“系数”和“KMO和Bartlett球形度检验”,6、在SPSS中的实现,例:在Factor2.sav中,有重庆市40个区县的GDP、,14,在“抽取”按钮对话框,“方法”设定为“主成分”,在“旋转”按钮对话框,“方法”设定为“最大方差法”,在“得分”按钮对话框,选择“保存为变量”、“方法”设定为“回归”,选择“显示因子得分系数矩阵”,在“抽取”按钮对话框,“方法”设定为“主成分”,15,说明的总方差表:包括特征根,旋转前/后的方差贡献率、累计贡献率,变量共同度,旋转前/后因子载荷矩阵,因子得分模型系数:求出公因子后,可以用回归估计方法求出因子得分数学模型(在因子分析中,不能直接由载荷矩阵按列得到因子的表达式),7、输出结果阅读,说明的总方差表:包括特征根,旋转前/后的方差贡献率、累计贡献,16,某市15个大中型企业经济效益数据见“某市工业企业效益指标.sav”,利用因子分析方法对企业经济效益进行综合评价及分析。,上机习题,某市15个大中型企业经济效益数据见“某市工业企业效益指,17,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!