第六讲 因子分析

上传人:ta****u 文档编号:210890355 上传时间:2023-05-18 格式:DOCX 页数:13 大小:45KB
返回 下载 相关 举报
第六讲 因子分析_第1页
第1页 / 共13页
第六讲 因子分析_第2页
第2页 / 共13页
第六讲 因子分析_第3页
第3页 / 共13页
点击查看更多>>
资源描述
第五讲 因子分析在许多实际问题中,涉及的变量众多,各变量间还存在错 综复杂的相关关系,这时最好能从中提取 少数综合变量 ,这些 综合变量 彼此不相关 ,而且 包含原变量提供的大部分信息 。因 子分析就是为解决这一问题提供的统计分析方法。以后,如无特别说明,都假定总体是一个 p 维变量:元=(X , X ,,X )1 2 p它的均值向量E(x),协方差矩阵V=(6)都存在。1J p X p第一节 正交因子模型11 公共因子与特殊因子从总体中提取的综合变量:F F2,,F (mp)称为(总体1 2 m的)公共因子 。一般来说,公共因子不可能包含总体的所有信 息,每个变量 Xi 除了可以由公共因子解释的那部分外,总还有i一些公共因子解释不了的部分,称这部分为变量Xi 的特殊因i子,记为:&。i于是,我们有:变量X.的信息=公共因子可以表达部分i+公共因子不可表达部分 这就是所谓因子模型。目前,公共因子可以表达的部分由公共 因子的线性组合表示。 即上面的因子模型可以写成以下的形式:X P a F + a F + + a F + , i 1,2,.,pi ii1 1i2 2im m i12 正交因子模型设总体元(XXX ),均值向量E(x)=亍,协方差12p矩阵Va/(X)二V 。因子模型有形式:pxpXp=aF+aF+ +aF+ s111111221m m1Xp=aF+aF+ +aF+ sV222112222m m2Xp=aF+aF+ +aF+ sppp11p22pm mp其中m5p ;即使这样,样本容量也不能太少,一般应在 100 以上。以上要求在实际问题中往往都达不到。这时可以 适当放 宽 要求,结合检验来判断结果的可靠性。52 因子分析可行性与效果检验1 Bartlett 球形检验 检验各变量是否独立,通过相关阵是 否单位阵来判断。只有在原假设: 各变量相互独立 被拒绝, 因子分析才能进行。2KMO 检验 检查各变量间的偏相关性,用来判断因子分析效果:0 W KMO W 1。通常使用的标准是:当KMO 0.7,因子分析效果较好,越大越好;当 KMO0.5 ,此时不适合用因子分析法。53 关于因子的解释 因子分析得到的公共因子应该可以解释,即有实际意义。 否则,就应该重新设计原始变量集合。第六节 因子分析应用举例例 数据data09,此文件收录了 15个企业的7个主要经济指标。 试对这 7 个指标提取 2 个公共因子,作因子分析。选择命令菜单: Data Reduction Factor ,在 Factor Analysis 对 话框中,将变量 固定资产率 、固定资产利率 、资金利率 、资金 利税率 、 流动资金周转天数 、 销售收入利税率 和 全员劳动生产 率输入 Variables,打开 Extraction,在 Number of factors 中键 入 2(因子个数)( Eigenvaluesover 1特征值大于 1 ,screet plot碎石图。返回,打开Rotation (因子分析 旋转),选择Varimax 最大方差法,Rotated loading plot。返回,打开 Scores,选择Save as variables 中 的 Regression 和 Display factor score coefficient matrix。“Factor Analysis: Descriptives”对话框Factor Analysis: Options对话框 exclude cases listwise返回,OK。输出解读:Total Variance ExplainedInitial EigenvaluesExtraction Sums of SquaredLoadotation Sums ofSquared LoaComponjntTotal% of VariaiCemulativej %Total% of VarianCemulativej %Total% of VariaCemulativej %14.638; 66.26;266.26;24.63866.26:266.26;?4.21460.19Jj60.19!21.28118.29!584.5571.28118.29!584.5571.705i24.36:?84.5573.5818.296i92.85:J4.3935.610|98.46:J5.0921.309|99.7726.014.19499.96(、7.002.034100.000Extraction Method: Principal Component Analysis.这是一张方差解释表, Initial Eigenvalues 一栏中的 Total 便是每 个公共因子的 方差贡献值 ,系统计算出全部 7个因子的方差贡献 值,并按降序排列。 % of Variance 系每个因子的方差贡献占总 方差的比率,即 方差贡献率 。其后的 Extraction Sums of Squared Loadings 意译为“被提取的载荷平方和”它表示在 未经旋转 时, 被提取的 2个公共因子(表中为第一、第二因子) 各自方差贡献 值以及方差贡献率 。从中可以看到,在未经旋转时,提取的第 一公共因子的方差值为 4.638 ,方差贡献率 66.262% ;第二公共 因子的方差值为 1.281 ,方差贡献率 18.295% 。同时,告诉读者: 两个公共因子可以解释总方差的84.557% ( 66.262+18.295 即:累计方差贡献率 ),也就是说:总体近 85 的信息可以由这两 个公共因子来解释。打一个比喻,这就相当于选出两个代表, 他们可以代表选民近 85 的要求。最后一栏 Rotation Sums of Loadings 意译为“ 旋转的载荷平方和 ”,它表示经过 Varimax 旋 转后,得到的 新公共因子 的方差贡献值、方差贡献率和累计方 差贡献率。可以看到,和未经旋转相比,每个因子的方差贡献 值有变化,但 累计方差贡献率 不变。Component MatrixComponent12固定资产率(%) 固定资产利率(%) 资金利率(%) 资金利税率(%) 流动资金周转天数 销售收入利税率(%) 全员劳动生产率(万 元/人年).888.984.942.908 -.288.862.585.203-.026.276.318.829-.135-.596Extraction Method: Principal Component Analysis. a. 2 components extracted.Rotated Component MatrixComponent12固定资产率(%) 固定资产利率(%) 资金利率(%) 资金利税率(%) 流动资金周转天数 销售收入利税率(%) 全员劳动生产率(万 元/人年).903 .911.979.962.026.758.335.126.374.077.025 -.877.433.766Extraction Method: Principal Component Analysis.Rotation Method: Varimax with Kaiser Normalization.a. Rotation converged in 3 iterations.这是两张因子载荷矩阵表,第一张是未经旋转的,第二张是旋 转后的。明显可以看到, 旋转后的载荷矩阵比未旋转时更容易 解释因子意义 。现以旋转后的载荷矩阵为例说明。由于因子载 荷是变量与公共因子的相关系数,因此对一个变量来说,载荷 绝对值较大的因子与它关系更密切,也更能代表这个变量。按 照这一观点,第一因子更能代表固定资产率、固定资产利率、 资金利率、资金利税率和销售收入利税率,而第二因子则更适 合代表流动资金周转天数和全员劳动生产率。从而可见, 第一 因子主要代表企业的固定实力(固定资产与资金),第二因子 主要代表企业的管理水平。Communalities固定资产率()1.000.831固定资产利率(%)1.000.969资金利率(%)1.000.964资金利税率(%)1.000.926流动资金周转天数1.000.770销售收入利税率(%)1.000.761全员劳动生产率(万 元/人年)1.000.698Extraction Method: Principal Component Analysis.这张表是变量的 共同度, 其中的 Extraction 一栏表示 共同度的 值。因为共同度取值区间为 0, 1 ,所以不妨认为共同度的值是 一个比率,例如:固定资产率的共同度为 0.831 ,可以看作 两个 公共因子能够解释固定资产率方差的 83.1% 。Component Score Coefficient MatrixComponent12固定资产率(%) 固定资产利率(%) 资金利率(%) 资金利税率(%) 流动资金周转天数 销售收入利税率(%) 全员劳动生产率(万 元/人年).235 .191.266.271.172.136-.048-.080.094-.129-.163-.627.165.480Extraction Method: Principal Component Analysis.Rotation Method: Varimax with Kaiser Normalization.Component Scores.这张表是 因子得分系数矩阵 ,它给出因子得分公式:F 二 0.235gdzcl + 0.191 gdzcll + 0.266zjll + 0.271 zjlsl + 0.172lzzzts + 0.136xslsl 一 0.048qyldscl读者自己写出第二因子F2 的得分公式。回到数据文件,看到文件中增加了两列:FAC1(第一因子得分)和FAC2(第二因子得分)。数源科技以2.13081的 得分名列第一因子得分榜首,而中华电子则以 2.20625 分居第 二因子得分首位。说明这两个企业前者实力雄厚,后者管理强 劲。如果要看综合实力,则可对两个因子得分加权求和,权数取方差值或方差百分比。本题旋转后第一因子方差值为 4.214 方差百分比为 60.195% ,(倒数第二栏 )第二因子方差值为 1.705 ,方差百分比为 24.362 。可以用以下两个公式之一求 综合 得分:zF 二 4.214F + 1.705F12zF = 60.195F + 24.362F12 上述综合得分用 Transform Compute 计算,结果自动生成在数 据文件中。用第一个公式计算结果:中华电子 8.36 分居榜首, 数源科技 7.87 分紧随其后。这个问题的样本容量显然偏小,因此必须做检验验证因子分析是否有效。点击Descriptives 选择 KMO and Barlett testof sphericity。这样,在因子分析时就会输出:KMO and Bart le tt s TestKaiser-Meyer-Olkin Measure of Sampli ng Adequacy.646Bartletts Test ofApprox. Chi-Square134.579Sphericitydf21Sig.000KMO值为0.646,小于0.7,但大于0.5。效果差一些,但可供参考。而 Bartlett 检验值 Sig.=0.000 ,变量间的相关性不显著,故 可以做因子分析。最后,提出一个问题由读者自己完成:如果本题要求所提 取的公共因子能够解释变量总方差不低于90,至少应提取几个公共因子,试作因子分析。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸设计 > 毕设全套


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!