资源描述
,#,单击此处编辑母版标题样式,会计学,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,会计学,1,主成分分析,主成分分析,每个人都会遇到有,很多变量,的数据。,这些数据的共同特点是变量很多,在如此多的变量之中,有很多是相关的。人们希望能够找出它们的,少数,“,代表,”,来对它们进行描述。,本章就介绍两种把变量维数降低以便于描述、理解和分析的方法:,主成分分析,(,principal component analysis,)和,因子分析,(,factor analysis,)。实际上,主成分分析可以说是因子分析的一个特例,。,第1页/共32页,主成分分析(,Principal Components Analysis,,,PCA),也称为主分量分析,是一种通过降维来简化数据结构的方法,即如何把多个变量(变量)转化为少数几个综合变量(综合变量),而这几个综合变量可以反映原来多个变量的大部分信息。,什么是主成分分析,主成分分析,第2页/共32页,主成分分析就是设法将原来众多具有一定相关性的变量,(,如,p,个变量,),,重新组合成一组新的相互无关的综合变量来代替原来变量。,怎么处理?,通常数学上的处理就是将原来,p,个变量作线性组合作为新的综合变量。,如何选择?,如果将选取的第一个线性组合即第一个综合变量记为,F1,,自然希望,F1,尽可能多的反映原来变量的信息。,怎样反映,?,基本思想,第3页/共32页,最经典的方法就是用方差来表达,即,var(F1),越大,表示,F1,包含的信息越多。因此在所有的线性组合中所选取的,F1,应该是方差最大的,故称之为第一主成分(,principal component I,)。,如果第一主成分不足以代表原来,p,个变量的信息,再考虑选取,F2,即第二个线性组合。,F2,称为第二主成分(,principal component II,)。,F1,和,F2,的关系?,基本思想,第4页/共32页,为了有效地反映原来信息,,F1,已有的信息就不再出现在,F2,中,即,cov,(,F1,F2),0,。依此类推,可以获得,p,个主成分。因此,这些主成分之间是互不相关的,而且方差依次递减。在实际中,挑选前几个最大主成分来表征。,标准?,各主成分的累积方差贡献率,80%,或,85%(,根据实验结果和要求可以自己调整,),或特征根,1,。,基本思想,第5页/共32页,第6页/共32页,第7页/共32页,第8页/共32页,第9页/共32页,第10页/共32页,上 机 操 作 流 程,第11页/共32页,第12页/共32页,第13页/共32页,第14页/共32页,第15页/共32页,主成分分析的前提条件:,原始变量之间有一定的相关性,检验方法,(,1,),Kaiser-Meyer-Olkin,(,KMO),检验:抽样充足量的测度,检验变量之间的偏相关系数是否过小。,(,2,),Bartlett,s,检验:该检验的原假设是相关矩阵为单位阵(不相关),如果不能拒绝原假设,则不适合进行主成分分析。,综合变量(主成分)之间互不相关,第16页/共32页,第17页/共32页,第18页/共32页,计算主成分特征根及贡献率和累积贡献率,如果想选取,累积贡献率,95%,,,则需要重,新选择因子数,第19页/共32页,第20页/共32页,确定主成分,本操作是选择以特征根大于,1,为标准提取主成分,提取了,2,个主成分。按照累积方差的观点,应该提取,80%,或,85%,的值,本例题提取,2,个主成分,其累积方差贡献率为,94.99,,应该提取,2,个应该提取前两个主成分。,第21页/共32页,写出主成分模型,第22页/共32页,前面的表给出的因子载荷矩阵,主成分系数应该为特征向量,其换算方法为:用主成分载荷矩阵中的数据除以主成分相对应的特征值开平方根便得到两个主成分中每个指标所对应的系数。,第23页/共32页,第24页/共32页,第25页/共32页,第26页/共32页,第一主成分的特征值,第27页/共32页,第28页/共32页,第二主成分的特征值,第29页/共32页,第30页/共32页,主成分模型为:,F1,主要表示,X4,、,X5,、,X6,、,X7,的信息(夏半年的信息),F1=,0.337,X1+,0.34,X2+,0.347,X3+0.22X4+0.102X5+0.084X6+0.156X7+,0.322,X8+,0.344,X9+,0.34,X10+,0.328,X11+,0.33,7X12,F1,主要表示,X1,、,X2,、,X3,、,X8,、,X9,、,X10,、,X11,、,X12,的信息(冬半年的信息),F2=-0.134X1-0.114X2+0.016X3+,0.384,X4+,0.507,X5+,0.519,X6+,0.457,X7+0.034X8-0.064X9-0.136X10-0.195X11-0.157X12,第31页/共32页,
展开阅读全文