资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,SPSS 19(,中文版,),统计分析实用教程,电子工业出版社,*,第十章,主成分分析和因子分析,主要内容,10.1,主成分分析和因子分析简介,10.2,主成分分析,10.3,因子分析,10.1,主成分分析和因子分析简介,10.1.1,基本概念和主要用途,(,1,)基本概念,主成分分析,就是考虑各指标之间的相互关系,利用降维的方法将多个指标转换为少数几个互不相关的指标,从而使进一步研究变得简单的一种统计方法。主成分分析是由,Hotelling,于,1933,年首先提出的,是利用“降维”的思想,在损失很少信息的前提下把多个指标转化为几个综合指标,称为主成分。每个主成分均是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能。,因子分析,是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的分析方法,最早是由心理学家,Chales Spearman,在,1904,年提出的,它的基本思想是将实测的多个指标,用少数几个潜在指标(因子)的线性组合表示。,10.1,主成分分析和因子分析简介,(,2,)主要用途,解决共线性问题;,评估问卷的结构效度;,寻找变量之间的潜在结构;,内在结构证实。,(,3,)常用术语,因子载荷,变量共同度,公共因子的方差贡献,10.1,主成分分析和因子分析简介,3,常用术语,(,1,),因子载荷,(,2,)变量共同度,(,3,)公共因子的方差贡献,10.1,主成分分析和因子分析简介,10.1.2,主成分和公因子数量的确定,(,1,)确定时遵循几个原则,主成分的累积贡献率:,一般来说,提取主成分的累积贡献率达到,80%,85%,以上就比较满意了,可以由此确定需要提取多少个主成分。,特征值:,特征值在某种程度上可以看成表示主成分影响力度大小的指标,如果特征值小于,1,,说明该主成分的解释力度还不如直接引入原变量的平均解释力度大。因此一般可以用特征值大于,1,作为纳入标准。,综合判断:,大量的实际情况表明,如果根据累积贡献率来确定主成分数往往较多,而用特征值来确定又往往较少,很多时候应当将两者结合起来,以综合确定合适的数量。,10.1,主成分分析和因子分析简介,10.1.3,两者,的区别与联系,(,1,)两者都是在多个原始变量中通过它们之间的内部相关性来获得新的变量(主成分变量或因子变量),达到既能减少分析指标个数,又能概括原始指标主要信息的目的。,(,2,)提取公因子主要有主成分分析法和公因子法,若采用主成分法,则主成分分析和因子分析基本等价。,(,3,)因子分析提取的公因子比主成分分析提取的主成分更具有解释性。,(,4,)两者分析的实质和重点不同。,(,5,)两者的,SPSS,操作都是通过,“,分析降维因子分析,”,过程实现的,主成分分析不需要因子旋转,而因子分析需要经过旋转。,主要内容,10.1,主成分分析和因子分析简介,10.2,主成分分析,10.3,因子分析,10.2,主成分分析,10.2.1,统计原理与分析步骤,(1),统计原理,10.2,主成分分析,(1),统计原理,10.2,主成分分析,10.2.1,统计原理与分析步骤,(,2,)分析步骤,第,1,步 原始数据的标准化处理。,第,2,步 计算相关系数矩阵。,第,3,步 计算特征值及单位特征向量。,第,4,步 计算主成分的方差贡献率和累积方差贡献率。,第,5,步 计算主成分。,10.2,主成分分析,10.2.2 SPSS,实例分析,【,例,10-1】,为了从总体上反映世界经济全球化的状况,现选择了具有代表性的,16,个国家的数据,这些国家参与经济全球化的程度指标值如下表所示。试分析一个国家参与经济全球化的程度主要受哪些因素的影响。,编号,国家,x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,x13,x14,x15,1,中国,3.205,54.5,28.53,0.878,1.409,0.894,11.6,2.305,0.547,2.932,4.818,9.003,2.7,3.914,1.472,2,印度,1.449,31.1,0.279,0.339,0.272,0.1,2.7,0.128,0.193,0.825,2.318,5.127,0.6,4,0.218,3,日本,14.079,52.3,0.653,10.254,11.769,1.097,0,1.967,1.3,6.178,14.746,27.297,30.9,57.734,15.125,4,韩国,1.318,136.3,1.011,1.6,0.42,1.838,1.3,0.77,0.78,2.267,23.32,42.875,9.1,12.129,0.452,5,新加坡,0.275,739.5,3.572,27.841,0.884,13.314,28.6,0.622,0.143,1.885,169.772,319.907,54.2,917.328,0.718,6,美国,29.641,46.1,3.682,6.429,20.563,4.808,5.4,24.253,29.941,15.638,10.784,24.555,13.6,24.495,21.274,7,加拿大,2.056,101.5,0.898,8.276,2.313,5.369,10.5,2.444,5.145,3.854,34.691,67.047,15.1,21.83,1.362,8,巴西,2.434,27.1,1.584,2.327,0.962,2.905,6.8,1.953,2.3,0.857,4.716,10.101,6.7,5.498,1.104,9,墨西哥,1.567,151.4,1.657,2.837,0.797,1.471,10.9,0.67,0.212,2.186,18.485,37.986,4.5,4.887,0.468,10,英国,4.67,118.4,0.497,26.151,12.456,22.137,11.2,16.552,19.642,5.542,28.434,58.7,66.1,278.968,11.289,11,法国,4.639,120.6,1.84,9.242,4.492,10.848,8.5,8.282,5.841,5.21,28.46,54.052,29.2,56.453,8.889,12,德国,6.84,132.9,2.252,9.558,6.646,7.747,2.2,8.589,8.971,8.843,32.121,63.174,36,51.514,12.18,13,意大利,3.792,104.5,0.321,8.153,3.724,1.059,2.5,0.77,1.913,4.032,22.869,43.924,27,17.776,5.678,14,俄罗斯,1.3,58.6,1.533,1.499,0.552,0.499,2.5,0.31,0.298,0.987,7.77,12.581,1.1,2.001,0.469,15,澳大利亚,1.309,94.5,0.502,5.773,0.941,1.987,18.9,0.527,1.371,1.131,15.745,33.795,13.2,24.117,0.797,16,新西兰,0.177,110.5,0.218,7.374,0.179,3.04,31.5,0.126,0.338,0.248,23.221,47.387,19.8,41.274,0.215,10.2,主成分分析,第,1,步 分析:,从数据来看,一共有,15,个因素,但有些因素是存在相关性的,同时各因素对全球化影响的程度也是不一样的,故可采用主成分分析。,第,2,步 数据组织:,按如教材所示的“指标”一列定义变量,输入数据并保存。,第,3,步 主成分分析的设置:,按“分析降维因子分析”顺序打开“因子分析”对话框,将,x1,x15,这,15,个变量移入“变量”对话框中,并按如下所示的图形进行设置。,10.2,主成分分析,10.2,主成分分析,说明:,由于在,SPSS,中并没有完整的主成分分析过程,其主成分分析过程是集成在,“,因子分析,”,过程中的,但并不完善。由于主成分的得分需要对因子得分情况进行进一步计算,故不需设置,“,得分,”,子对话框,即不需保存因子得分情况,即使保存了,因子得分也不是各主成分得分的结果。,对于提取因子的个数问题,一般遵循两个标准,其一是累计方差贡献率在,80%,以上,其二是其特征值大于,1,。本例之所以设置为,3,,是因为通过预先分析,发现前,3,个主成分可以解释总体信息的,86.7%,。,10.2,主成分分析,第四步 因子分析的结果:,特征值和方差贡献表,成分,初始特征值,提取平方和载入,合计,方差的,%,累积,%,合计,方差的,%,累积,%,1,6.049,40.325,40.325,6.049,40.325,40.325,2,5.813,38.755,79.080,5.813,38.755,79.080,3,1.142,7.616,86.696,1.142,7.616,86.696,4,.876,5.842,92.538,5,.599,3.996,96.534,6,.326,2.174,98.709,7,.119,.796,99.505,8,.041,.272,99.776,9,.018,.121,99.897,10,.010,.063,99.961,11,.004,.027,99.988,12,.001,.009,99.997,13,.000,.002,99.999,14,.000,.001,100.000,15,4.080E-7,2.720E-6,100.000,提取方法:主成分分析。,从表中可以看出前,3,个主成分已经解释了总方差的近,86.7%,,故可以选择前,3,个主成分进行分析。,10.2,主成分分析,第四步 因子分析的结果:,主成分的碎石图,该图从另一个侧面说明了取前三个主成分为宜。,10.2,主成分分析,第四步 因子分析的结果:,旋转前的因子载荷矩阵,成分,1,2,3,x1,.407,.805,.268,x2,.596,-,.727,.209,x3,-,.147,.016,.821,x4,.895,-,.333,-,.181,x5,.614,.763,.028,x6,.826,-,.124,-,.281,x7,.273,-,.627,.184,x8,.636,.703,.041,x9,.619,.703,.008,x10,.552,.766,.196,x11,.654,-,.691,.172,x12,.666,-,.685,.166,x13,.863,-,.191,-,.297,x14,.728,-,.632,.144,x15,.579,.760,.005,提取方法,:,主成分。,a.,已提取了,3,个成分。,说明:,教材中公式,10.7,中的 是标准化正交向量,并不是,SPSS,输出“因子载荷矩阵”中的系数。而“因子载荷矩阵”中各分量的系数为单位特征向量乘以相应的特征值的平方根的结果,其公式为 。故需进一步利用因子分析的结果进行主成分分析。,10.2,主成分分析,第五步 利用因子分析的结果进行主成分分析。,10.2,主成分分析,第六步 主要结果:,编号,国家,y,1,y,2,y,3,1,中国,-,2.19,0.07,3.01,-,0.63,2,印度,-,2.56,-,0.11,-,0.46,-,1.11,3,日本,0.45,1.85,-,0.27,0.88,4,韩国,-,1.69,-,0.46,-,0.27,-,0.88,5,新加坡,5.28,-,6.26,1.19,-,0.20,6,美国,3.30,6.07,1.46,3.80,7,加拿大,-,0.43,-,0.47,-,0.31,-,0.38,8,巴西,-,1.91,-,0.06,-,0.43,-,0.83,9,
展开阅读全文