SPSS主成分分析与因子分析(精品)

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,第八章主成分分析与因子分析,Principle Component Analysis,&,Factor Analysis,8-1,概述,在许多研究中,为了全面系统地分析问题,都尽可能完整地搜集信息,对每个观测对象往往需测量很多指标,(,变量,),人们自然希望用较少的新变量代替原来较多的旧变量,而这些新变量应尽可能地反映旧变量的信息,.,主成分分析与因子分析正是满足这一要求的处理多变量问题的方法,.,由于它们能浓缩信息,使指标降维,简化指标的结构,使分析问题简单、直观、有效,故被广泛应用于医学、心理学、经济学等领域,.,参考文献,1,、综合评价中如何运用主成分分析。,作者：朱峰,统计教育,2005,年第,10,期,P4547,2,、对因子分析方法及其过程中几个问题的探讨。,作者：马晓君,统计教育,2005,年第,8,期,P6164,3,、基于,SPSS,的主成分分析与因子分析的辨析。,作者：唐功爽,统计教育,2007,年第,2,期,P1214,4,、主成分分析法在证券市场个股评析中的应用,作者：江东明,数理统计与管理,2001,年第,2,期,P2831,5,、因子分析法在企业综合经济效益评价中的应用,作者：王增民,数理统计与管理, 2002,年第,1,期,P1013,参考文献,6,、甘肃省区域综合经济实力变动分析,作者：魏奋子,开发研究,2003,年第,3,期,P4345,7,、江苏省区域经济实力的综合评价与实证分析,作者：门可佩,江苏统计,2001,年第,12,期,P1517,8,、数理统计方法在河南经济发展水平和分区研究中的应用,作者：刘钦普,数理统计与管理, 2002,年第,3,期,P1015,8,、科技实力国际比较的因子分析,作者：徐小阳,统计与决策,2003,年第,1,期,P1517,8.1.1,主成分分析的几何意义,1.1,在,P,维总体中抽取了,N,个样品,可以得到在,P,维空间中的,N,个点,来研究这,N,个点之间的关系,.,首先以简单的低维空间说明,.,以二维空间,即平面的二个变量,P=2,为例,:,1 2 3 4 5 6,X1,1 2 3 4 5 6,X2,2 4 6 8 10 12,样品,指标,直线方程,X2=2X1,X1,X2,1 2 3 4 5 6,Y1,样品,变量,Y1,将,X1,和,X2,轴同时逆时针旋转,X1,X2,Y1,Y2,.,.,.,.,.,.,.,.,.,.,.,.,.,.,.,.,.,.,.,.,.,.,.,8.1.2,主成分分析的基本概念,主成分分析,(Principle Component Analysis),也称主分量分析,是一种将多个指标化为少数几个综合指标的统计分析方法。,基本思想,:,描述经济现象需要用很多指标,(,也称变量,),来刻划,但是指标之间往往有一定的相关性,因而所得的统计数据在一定程度上反映的信息有重叠。主成分分析可将相关的指标化成一些不相关的指标,避免了信息重叠带来的虚假性,而且这些主成分可以尽可能地反映原来变量的绝大部分信息。,2.,主成分分析的一般数学模型,并且满足：,其中,e,i j,由下列原则决定：,1.,任一两个主成分之间都不相关：,i,与,Y,j,(i,j,；,i,，,j=1,2,p),2.Y,1,是,X,1,、,X,2,、,、,X p,的一切线性组合中方差最大的；,Y,2,是与,Y,1,不相关的,X,1,、,X,2,、,、,X p,的一切线性组合中方差最大的；（,Y,2,的方差小于,Y,1,的方差）；,Y p,是与,Y,1,、,Y,2,、,、,Y,p-1,都不相关的,X,1,、,X,2,、,、,X p,的一切线性组合中方差最大的（,Y,p,的方差小于,Y,1,、,Y,2,、,、,Y,p-1,的方差,),。,这样确定的综合指标就称为原变量的第一主成分,第二主成分,第,p,主成分。,3.,主成分的求解,关键是求系数，而其正是观测变量相关矩阵的单位特征向量,.,因此通过求解观测变量相关矩阵的特征方程，得到,P,个特征根和,P,个单位特征向量，把,P,个特征根按从大到小的顺序排列，记作,它们分别代表,P,个主成分所解释的观测变量的方差,.,相应的,P,个单位特征向量就是主成分的系数,主成分模型中的各统计量的意义,(1),主成分,Y,i,的方差贡献率,主成分分析是把,P,个原始变量,X,1,、,X,2,、,、,X p,总方差分解成,P,个不相关变量,Y,1,、,Y,2,、,Y p,的方差,之和，而,因此描述了第,i,个主成分反映的信息占,总信息的份额，我们称它为第,i,主成分,Y,i,的方差贡献率。,第一主成分的方差贡献率最大，表明,Y,1,综合原始变量,X,1,、,X,2,、,、,X p,所含信息的能力最强，而,Y,2,、,Y p,的综合能力依次减弱。,主成分模型中的各统计量的意义,(2),前,k,个主成分,Y,k,( i=1,，,2,，,，,k),的对原变量的贡献率,称为,Y,1,、,Y,2,、,、,Y,k,的累计方差贡献率。,它表明前,K,个主成分,Y,1,、,Y,2,、,、,Y k,综合提供,X,1,、,X,2,、,、,X p,中信息的能力。实际应用中，通常选取,KP,使前,K,个主成分的方差贡献率达到较高的比例,(85%,以上,).,这样用前,K,个主成分,Y,1,、,Y,2,、,、,Y,k,，代替原始变量,X,1,、,X,2,、,、,X p,，不仅减少了变量的个数，便于对实际问题的研究，而且对于原始变量中的信息损失减少。,（,3,）因子载荷量,前,K,个主成分,Yk,与原变量,Xi,的相关系数,3.,主成分分析的步骤,（）对原个变量的数据标准化,（）求观测变量的相关矩阵,（）求相关矩阵的特征根和单位特征向量,（）确定主成分，结合专业知识给各主成分所蕴藏的信息给予恰当的解释，并利用它们来判断样品的特性,5.,主成分个数的确定,主成分分析的目的是为了减少变量的个数，以便对实际问题的研究，而且对于原始变量中的信息损失很少，故一般不用,p,个主成分，而用,Kp,个主成分。,K,的选取要看前,K,个主成分累计方差贡献率达到,85%,以上。,7.1.2,因子分析,(,Factor Analysis),因子分析,(Factor Analysis),是主成分分析的推广，它也是一种把多个相关变量（指标）化为少数几个不相关变量,因子的统计分析方法。在许多实际问题中，我们经常,用多个指标（变量）来描述某一现象,，由于这些指标之间往往具有一定的,相关性,，即很多指标反映的,信息有重叠,，并且指标太多给分析问题带来了不方便，这时我们总希望能用少数几个不相关指标（变量）来代替原来的指标。与主成分分析方法一样，因子分析也给我们提供了解决这个问题的另一种方法。,例如，某市场调查公司为了帮助快餐店了解其市场竞争能力进行消费者调查，通过定性研究设计了,30,项有关快餐店及其产品和服务的调查项目。这,30,个指标对于我们评价快餐店市场竟争能力很不方便。事实上这,30,个指标可能反映了快餐的质量、价格、就餐环境和服务四个基本方面，通过因子分析我们能找出反映数据本质特征的这四个因子，并分析原来,30,个指标和这四个因子之间的关系，通过这四个因子能较方便地评价快餐店的市场竞争能力。,一、因子分析模型,设,p,个可观测变量,X,1,、,X,2,、,、,X,P,可表示为：,称上式为因子分析模型。其中,F,1,、,F,2,、,、,Fm,称为公因子，称为特殊因子，他们都是不可观测的随机变量。,正交因子模型满足的四个假定条件,:,解释因子分析模型,公因子,F,1,、,F,2,、,、,F,m,出现在每一个原始变量,X,i,(i=1,，,2,，,，,p),的表达式中，可理解为原始变量共同具有的公共因素；每个公因子,F,j,(j=1,，,2,，,，,m),至少对两个原始变量有作用，否则它将归入特殊因子。每个特殊因子仅仅出现在与之相应的第,i,个原始变量,X,i,的表达式中，它只对这个原始变量有作用。,因子分析模型假设,p,个特殊因子之间是彼此独立的，特殊因子和公因子之间也是彼此独立的,。,在因子分析模型中，每一个观测变量由,m,个公因子和一个特殊因子的线性组合来表示，我们感兴趣的只是这些能够代表较多信息的公因子。,公因子的个数最多可以等于观测变量数。因为在求因子解时，总是使第一个公因子代表了所有变量中最多的信息，随后的公因子代表性逐步减少，因此通常忽略掉最后几个公因子。所以，在因子分析模型中，公因子的个数，往往远远小于观测变量的个数。,为什么公因子的个数远远小于变量个数？,二、几个重要的概念,1,因子载荷,在因子分析模型中，,a,i j,称为因子载荷，它反应了第,i,个原始变量,X,i,在第,j,个公因子,F,j,上的相对重要性。可以证明原始变量,X,i,与公因子,F,j,之间的相关系数等于,a,i,j,，即,a,i,j,的绝对值越大，表示原始变量,X,i,与公因子,F,j,之间关系越密切。,因子载荷矩阵,由所有因子载荷构成的矩阵称为因子载荷矩阵，,记作,A,。,2,变量共同度,变量共同度也称公因子方差。,原始变量,X,i,的方差由两部分组成，,h,i,2,+ =1,第一部分由公因子决定的方差即公因子方差,h,i,2,公因子方差记作,h,i,2,用公式表示为：,h,i,2,=a,i1,2,+a,i2,2,+a,im,2,（,i=1,，,2,，,，,p,）,第二部分由特殊因子决定的方差即特殊因子方差,公因子方差表示了原始变量方差中能被公因子所解释的部分，公因子方差越大，变量能被公因子说明的程度越高。若公因子方差接近于,1,，这说明该变量的几乎全部原始信息都被所选取的公因子说明了。,进一步解释,每个元素表明每个变量对公因子的依赖程度,解释公因子要根据每个公因子系数大小情况,变量共同度,:,载荷矩阵行元素的平方和,.,表示的是所有公因子对,Xi,的方差贡献,特殊因子方差解释不足部分,(3),载荷矩阵列元素的平方和,:,表示某一公因子对所有变量的方差贡献,.,3,公因子,F,j,的方差贡献（列）,公因子,F,j,的方差贡献记作,g,j,2,，,用公式表示为：,g,j,2,= a,1j,2,+a,2j,2,+a,pj,2,（,j=1,，,2,，,，,p,）,公因子,F,j,的方差贡献,g,j,2,，是公因子,F,j,对诸原始变量所提供方差贡献的总和。它是衡量公因子相对重要性的指标，它等于公因子,F,j,所对应的特征值，即,所有公因子的方差总贡献,在实际问题中常用下列相对指标：,每个公因子,F j,的方差贡献率,为：,前,k,个公因子的累积方差贡献率,为：,根据前,k,个公因子的累积方差贡献率,的大小达到一定的比例时，来决定,选取多少个公因子。,第二节求因子模型及因子得分,一、求解初始因子,要求因子模型，关键是求出因子载荷矩阵,A,。,对,A,的估计方法有很多，如,主成分法（,Principal Components,）,主轴因子法（,Principal axis factoring,）,最大似然法,(Maximum likelihood),因子提取法,(Alpha factoring),映像分析法,(Image analysis),最小二乘法,(Least squares),应用较为普遍的是主成分法。,主成分法,就是按主成分分析求出相关矩阵的特征根,j,和单位特征向量（,e,1j,，,e,2j,，,，,e,p j,）,(j=1,，,2,，,，,p),，,则,:,载荷矩阵,A,的估计就是原变量协方差矩阵的特征值的平方根与特征向量的乘积,.,二、因子旋转,因子分析的目的不仅是找出公因子，更重要的是知道每个公因子的意义。但是用上述方法所求出的公因子解，各因子的典型代表变量不很突出，因而容易使因子的意义含糊不清，不便于对因子进行解释。为此必须对因子载荷矩阵进行旋转，,使得因子载荷的平方按列,向,0,和,1,两级转化,，达到其结构简化的目的。,所谓结构简化,就是使每个变量仅在一个公因子上有较大的载荷，而在其余公因子上的载荷比较小。这种变换因子载荷矩阵的方法称为因子旋转。,为什么要进行旋转？,如果初始因子在原变量上的载荷值都相差不大，就不便于解释各因子的意义,因子旋转的方法有很多种：,最大方差旋转（,Varimax,）,斜交旋转（,Promax,）,四次方最大正交旋转（,Quartimax,）,平均正交旋转（,Equamax,）,直接斜交旋转（,Direct,Oblimin,rotation,）,三、公因子得分,因子模型使将,原变量表示为公因子的线性组合,。,由于公因子能反映原变量的相关关系，用公因子代表原变量时，有时更有利于描述研究对象的特征。因此，常常反过来将公因子表示为原变量的线性组合，即,F,j,=b,j1,X,1,+b,j2,X,2,+b,j p,X,p,（,j=1,2,m,）,称上式为因子得分函数。用它来计算每个样品的公因子值，称为公因子得分。,对于用主成分法求得的公因子解，可以直接得到因子得分函数，对于用其它方法得到的公因子解，只能得到因子得分函数系数的估计值，通常用回归法进行估计。,四,.,因子分析的步骤,1,将原始数据标准化。,2,计算变量的相关矩阵。根据计算的相关矩阵还应进一步判断应用因子分析方法是否合适,.(,后面具体说明,),3,计算相关矩阵的特征根和单位特征向量。,4.,提取因子,.,确定描述数据所需要的因子个数和求因子解的方程,.,5,进行因子旋转，集中于变换因子使因子解的实际意义更好解释,.,6,计算每一个样品,Case,的因子得分，然后将它们用于各种进一步的分析中。,*,适合作因子分析的四个检验,(,包括三个统计量,) (,),A.,相关矩阵检验,:,使用因子分析的前提条件是观测变量之间应该有较强的相关关系，相关程度很小，不可能享有公共因子。,相关矩阵中的大部分,r0.3,，则不适合做因子分析,.,B.,反映象相关矩阵,(Anti-image correlation matrix ),检验,:,其元素等于负的偏相关系数,-,偏相关是控制其他变量不变，一个自变量对因变量的独特解释作用，如果数据中确实存在公因子，变量间的偏相关系数应该很小，因为它与其他变量重叠的解释影响被消除掉了,.,故矩阵中诸元素的值比较大，应考虑观测数据可能不适合做因子分析。,适合作因子分析的四个检验,(,包括三个统计量,) (,),C.,巴特利特球体检验,(Bartlett test of,sphericity,),检验,:,该统计量从检验整个相关矩阵出发，其零假设为相关矩阵是单位阵，如果不能拒绝该假设的话，应该重新考虑因子分析的使用。,适合作因子分析的四个检验,(,包括三个统计量,) (,),D. KMO(K-image correlation matrix ),测度,:,该测试比较观测量之间简单相关系数和偏相关系数的相对大小出发，其值的变化范围从,01,。当所有变量之间的偏相关系数的平方和，远远小于简单相关系数的平方和时，,KMO,的值接近于,1,，,KMO,值较小时，表明观测变量不适合做因子分析,.,通常按以下指标解释该指标值的大小：,0.9,以上,非常好,;,0.8,以上,好,;,0.7,一般,0.6,差,0.5,很差,0.5,以下不能接受,源自,:Joseph F.Hair,JR.etc.(1995)Multivarite Data Analysis with Readings,4th Edition. Prentice-Hall International,Inc.:374,因子个数的确定,1.,特征值准则,:,特征值大于等于,1,的主成分作为初始因子，放弃特征值小于,1,的主成分,.,因为每个变量的方差为,1,，该准则认为每个保留下来的因子应该能解释一个变量的方差，否则达不到精减的目的。,2.,碎石检验准则：按照因子被提取的顺序,画出因子的特征值随因子个数变化的散点图，根据图形来判断因子的个数,.,3.,因子累积解释方差的比例,:,达到,85%,以上。实际中结合几个准则进行判断。,7.1.3,主成分分析与因子分析的区别,主成分是原观测变量的线性组合,每个主成分相应的系数是唯一确定的特征向量,因子分析模型是原观测变量表现为各新因子的线性组合,每个因子相应系数不唯一,.,即因子载荷矩阵不唯一,.,主成分个数,m=P,因子个数,mP,(,为经济起见,总是越小越好,),当时,m=P,就不能考虑特殊因子,.,主成分分析是因子分析的一个特例,7.1.3,主成分分析与因子分析的区别,区别,:,主成分分析是一种变量的变换不能作为一个模型一表述，因子分析需要构造因子模型，且其中的因子满足特定的条件，当这些条件不满足时因子分析就可能是虚假的,.,7.1.3,主成分分析与因子分析的区别,区别,:,两种方法的侧重点有所不同：主成分分析重点在于从观测变量到主成分的变换上，而因子分析重点在公共因子和特殊因子到观测量的变换上。,两者的实际应用范围有所不同：主成分分析主要应用在综合评价和指标筛选上，因子分析除这两个作用外，还可对,样本或变量,的分类。,7.1.3,主成分分析与因子分析的联系,联系,:,因子分析数学模型的特殊因子的影响微不足道可以忽略时，数学模型就变成：,X=AF,。,如果,F,中的各分量均为正交，就形成特殊形式的因子分析，即主成分分析，它的数学系模型为,Y=UX,，这两个数学系模型的含义是不同的，但从因子分析求解主因子过程可以看到，当特殊因子变差贡献为零时，主因子分析和主成分分析完全是等价的。,7.2,因子分析过程,在,SPSS13.0,中进行主成分分析与因子分析的统计分析过程由主菜单的,Analyze,下拉菜单中的,Data Reduction,功能中的,Factor,过程实现。,Factor Analysis :,因子分析的主对话框,变量栏,选择变量值范围,选择项按钮,因子得分按钮,旋转方法选择按钮,因子提取按钮,选择描述统计量按钮,Descriptives,描述统计对话框,初始因子分析结果,相关矩阵,KMO,和球形,Bartlett,检验因子模型是否适合,反映象,再生,相关系数矩阵的逆矩阵,行列式,Extraction,提取因子对话框,控制提取进程和提取结果的选择项,因子分析收敛的最大迭代次数,提取因子的方法,Rotation,因子旋转对话框,:,方差最大,斜交旋转,0-1,之间,四次方最大正交旋转,平方正交,在正交最大方差旋转的基础上进行斜交旋转,因子载荷散点图,旋转收敛的最大迭代次数,Factor Scores,因子得分对话框,:,因子得分作为新变量保存在数据文件中,因子得分作为新变量保存在数据文件中,均值为,0,方差为估与实间多元相关的平方,均值为,0,均值为,0,方差为,1,原始变量得分后的标准化系数矩阵,Options,选择项子对话框,变量中有缺失值的观测量一律删除,成对剔除带有缺失值的观测量,相关系数的显示格式,系数按其数值大小排列,不显示那些绝对值小于指定值的相关系数,案例分析,1(,主成分分析,),某市,15,个大中型工业企业的经济效益分析，从有关经济效益指标中选取,7,个指标作分析：即固定资产产值率、固定资产利税率、资金利润率、资金利税率、流动资金周转天数、销售收入利税率和全员劳动生产率，对这,15,个大中型工业企业的经济效益的状况及差异进行分析。,分析表,1,相关矩阵表。各变量间存在着较强的相关关系，因此有必要进行主成分分析。,表,2,变量共同度：,变量的共同度对所有变量都是，表明模型解释了每一个变量的全部方差，而不需要特殊因子，即特殊因子的方差为。,表,3,解释总方差：变量相关阵有两个最大特征根，即,4.660,和,1.316,一起解释总方差的,85.372%,说明前两个主成分提供了原始数据足够的信息。,碎石图：由图可以看出第一主成分与第二主成分的特征根大于,1,，而其它主成分的特征值小于,1,，可以认为前二个主成分能概括绝大部分信息。,因子载荷矩阵,分析与小结,第一主成分是由，确定的，因为它们在式中系数远远大于其他变量的系数，故标志着是这个指标的综合反映，说明企业经济效益盈利方面有能力；而且这个指标的系数相当，进而说明这项指标用于考核评价企业经济效益都是必不可少的,第二主成分是依赖于、变量，这标志着是反映企业资金和人力的利用水平这两个主成分从影响经济效益的二个主要方面刻划分析企业经济效益，用它们考核企业经济效益具有的可靠性。,综合评价：,从以上的输出信息与分析结果未能看出个企业的综合经济效益的好坏，及企业在经营过程中的优势与不足，故要计算各企业在第一、二个主成分及综合经济效益方面的得分，以此作为评价的依据。,操作步骤：,1.,原始变量标准化,2.,选择,Transform Compute,求,Z,1,、,Z,2,和,=0.66568Z,1,+0.18803Z,2,值,3.,分别按,Z,1,、,Z,2,和排序,主成分得分值及排序表,盈利能力方面,资金和人力方面,综合经济效益评价,Z1,名次,z2,名次,Z,名次,康佳电子,1,茂名石化,2,华空空调,3,三星集团,4,数源科技,5,中华电子,6,南方制药,7,中国长城,8,白云制药,9,五羊自行,10,广发烟卷,11,岭南通信,12,华南冰箱,13,潮州二轻,15,稀土高科,16,-0.57,0.73,-1.45,-4.06,3.76,3.96,1.75,-1.70,-0.17,0.6,-0.72,-0.88,-1.05,1.78,-1.99,8,5,12,15,2,1,4,13,7,6,9,10,11,3,14,0.98,2.16,-0.13,0.93,-1.64,2.11,0.11,-0.91,-0.75,-0.12,0.17,-0.18,-0.19,-1.59,0.05,3,1,9,4,15,2,6,12,11,8,5,10,13,14,7,-0.20,0.89,-0.98,-2.53,2.20,3.01,1.19,-1.30,-0.25,-0.37,-0.45,-0.62,-0.90,0.88,-1.31,7,4,12,15,2,1,3,13,8,6,9,10,11,5,14,案例分析,2,：,对全国,30,个省、市自治区经济发展基本情况的八项指标作主成分分析。,考核的指标有：,GDP,、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。数据,P150,分析,:,在第一主成分的表达式中第一、三、八项指标的系数较大，这三个指标起主要作用，我们可以把第一主成分看成是由国内生产总值、固定资产投资工业总产值所刻划的反映经济发展情况的综合指标；,在第二主成分中，第二、第四、第五、第七项指标的影响大，且第四、第五项尤其大，可将之看成是反映物价指数、职工工资和货物周转量的综合指标；,在第三主成分中，第六项指数影响最大，远远超过其他指标的影响可单独看成是居民价格指数的影响。,案例分析,3(,因子分析）：,某公司欲招聘一批新员工，为了了解他（她）和知识水平、交际能力，自信心及应变能力等，为此人事部制定了个方面考核指标，即：,：申请书形式,：外貌,X3,：,专业能力,X4,：讨人喜欢能力,X5,：自信程度,X6,：洞察力,X7,：诚实,X8,：推销能力,X9,：经验,X10,：驾驶汽车本领,X11,：志向,X12,：理解能力,X13,：潜在能力,X14,：对工作要求强烈程度,X15,：适应性,对,48,名应聘者进行面试，并对每一方面考核指标按十分制打分，最好表现给予最高分，普普通通给予中间分数，不好表现给予低分。面试结果见数据，请综合评价,48,名应聘者的素质，从而找出最优挑选方案。,因子得分及排序表,综合素质方面,外在表现方面,经验方面,专业能力方面,综合,F1,名次,F2,名次,F3,名次,F4,名次,F,名次,1,2,3,4,5,6,.,.,.,.,.,48,综合评价,（,1,）,a1,、,a2,、,a3,、,a4,分别为旋转之后的方差贡献,F=(a1*FAC1-1+a2*FAC2-1+a3*FAC3-1+a4*FAC4-1)/a1+a2+a3+a4,(38.176*FAC1-1+18.20*FAC2-1+15.99*FAC3-1+8.975*FAC4-1)/81.35,（,2,）分别对四个因子和,F,进行排序整理得下表：,从因子得分表可以看出,48,名应聘者在综合素质方面、外露能力、经验及专业能力等方面的得分。作为公司主管可根据本公司及各部门的需要，并结合应聘者综合素质及特长，选择所需要的人员。,案例,4,：,对全国,30,个省、市自治区经济发展基本情况的八项指标作因子分析。,考核的指标有：,GDP,、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。数据,P150,第一个因子在,X1,、,X3,、,X8,有较大的载荷，这些是从,GDP,、固定资产投资、工业总产值三个方面反映经济发展善的，因此命名为总量因子。,第二个因子在,X2,、,X4,、,X5,有较大的载荷，这些是从居民消费水平，职工平均工资、货物周转量这三方面反映经济发展状况的，因此，命名为消费因子。,第三个因子在,X6,、,X7,有较大的载荷，因此命名为价格因子。,案例分析,5:,抽取深圳、上海八家上市公司,2001,年中九天收盘价格资料,进行投资组合时,常常希望在相关性较大的一类股票中只选择一只或少数几只投资,试用因子分析法,确定投资方式,.,8,种股票收盘价资料,公司,日期,洞庭水殖,X1,南方汇通,X2,上海邮通,X3,广东明珠,X3,禾嘉股份,X5,离合器,X6,长征电器,X7,浙江东日,X8,4.26,5.21,5.28,6.6,6.13,6.20,6.26,7.17,7.20,24.10,26.10,26.09,26.75,27.00,27.40,28.69,25.80,26.61,18.73,18.83,18.46,19.20,19.00,18.85,21.10,19.20,19.95,20.58,21.99,20.80,22.68,22.22,20.55,20.82,18.49,19.00,15.26,16.18,15.40,16.19,17.11,16.44,17.01,15.44,15.94,14.40,15.81,16.66,17.43,17.7816.50,16.80,16.25,17.05,13.58,14.60,14.51,15.52,16.04,15.25,15.98,14.96,15.31,15.00,16.35,16.21,16.93,16.88,15.31,16.27,15.14,15.62,16.04,17.20,17.25,18.36,18.28,16.97,17.62,16.70,17.25,小结,主成分分析与因子分析两者都是将多个指标转化为少数几个变量指标的一种实用多元统计分析方法，其用意在于重新组织数据，使变量的维数降低，而有关信息损失尽可能减少，以便在低维空间顺利地研究有关问题两种方法通过因子分析过程,actor,实现但在运用,actor,过程实现两种分析时，应注意以下几个问题：,指标同趋势化即为了评价分析方便，需将逆指标转化为正指标,小结,利用,Factor,过程实现主成分分析时，在确定公因子个数，要选择与原变量数目一样的公因子个数，即指定的数目,Number of Factors,与原变量数目相等因为此时因子模型中特殊因子方差为，形成特殊形式的因子分析，即主成分分析,3.,利用,Factor,过程实现主成分分析时，产生的因子负荷矩阵表，不能直接依据表的数据，写出各主成分与原变量的线性组合需对各主成分上的载荷值分别除以相应主成分的特征值的平方根,作业,:,以国家统计局网站上,2007,年任何一种类型企业的经济效益数据作主成分分析和因子分析,并提交实验报告。,

展开阅读全文

SPSS主成分分析与因子分析(精品)

最新文档