实例说明利用Excel进行主成分分析分解 (2)

上传人:hh****6 文档编号:201579945 上传时间:2023-04-20 格式:DOCX 页数:13 大小:491.03KB
返回 下载 相关 举报
实例说明利用Excel进行主成分分析分解 (2)_第1页
第1页 / 共13页
实例说明利用Excel进行主成分分析分解 (2)_第2页
第2页 / 共13页
实例说明利用Excel进行主成分分析分解 (2)_第3页
第3页 / 共13页
点击查看更多>>
资源描述
细心整理方法:1 利用Excel2000进展主成分分析第一步,录入数据,并对进展标准化。【例】一组古生物腕足动物贝壳标本的两个变量:长度和宽度。图1 原始数据和标准化数据及其均值、方差取自张超、杨秉庚计量地理学根底计算的详细过程如下: 将原始数据绘成散点图图2。主持分分析原那么上要求数据具有线性相关趋势假如数据之间不相关即正交,那么没有必要进展主成分分析,因为主成分分析的目的就是用正交的变量代替原来非正交的变量;假如原始数据之间为非线性关系,那么有必要对数据进展线性转换,否那么效果不佳。从图2 可见,原始数据具有线性相关趋势,且测定系数R2=0.4979,相应地,相关系数R=0.7056。 对数据进展标准化。标准化的数学公式为这里假定按列标准化,式中,分别为第j列数据的均值和标准差,为第i行即第i个样本、第j列即第j个变量的数据,为相应于的标准化数据,为样本数目。图2 原始数据的散点图图3 标准化数据的散点图 对数据标准化的详细步骤如下: 求出各列数据的均值,叮嘱为average,语法为:average(起始单元格:终止单元格)。如图1所示,在单元格B27中输入“=AVERAGE(B1:B26)”,确定或回车,即得第一列数据的均值;然后抓住单元格B27的右下角光标的十字变细右拖至C27,便可自动生成其次列数据的均值。求各列数据的方差。叮嘱为varp,语法同均值。如图1所示,在单元格B28中输入“=VARP(B2:B26)”,确定或回车,可得第一列数据的方差,右拖至C28生成其次列数据的方差。 求各列数据的标准差。将方差开便利得标准差。也可利用叮嘱stdevp干脆生成标准差,语法和操作方法同均值、方差,不赘述。 标准化计算。如图1所示,在单元格D2中输入“=(B2-$B$27)/$B$29”,回车可得第一列第一个数据“3”的标准化数值-1.786045,然后按住单元格D2的右下角下拖至D26,便会生成第一列数据的全部标准化数值;遵照单元格D2的右下角右拖至E2,就能生成其次列第一个数据“2”的标准化数据-1.806077,抓住单元格E2的右下角下拖至E26便会生成其次列数据的全部标准化数值。 作标准化数据的散点图图3。可以看出,点列的总体趋势没有变换,两种数据的相关系数与标准化以前完全一样。但回来模型的截距近似为0,即有,斜率等于相关系数,即有。 求标准化数据的相关系数矩阵或协方差矩阵。求相关系数矩阵的方法是:沿着“工具T”“数据分析D”的路径翻开“分析工具A”选项框图4,确定,弹出“相关系数”对话框图5,在“输入区域”的空白栏中输入标准化数据范围,并以单元格G1为输出区域,详细操作方法类似于回来分析。确定,即会在输出区域给出相关图4 分析工具选项框图5 相关系数对话框系数矩阵的下三角即对角线局部,由于系对称矩阵,上三角的数值与下三角相等,故未给出图6,可以通过“拷贝转置粘帖”的方式补充空白局部。图6 标准化数据的相关系数和协方差 求协方差的方法是在“分析工具”选项框中选择“协方差”图7,弹出“协方差” 选项框图8,详细设置与“相关系数”类似,不赘述。结果见图6,可以看出,对于标准化数据而言,协方差矩阵与相关系数矩阵完全一样。因此,二者任取其一即可。图7 在分析工具选项框中选择“协方差”图8 协方差选项框 计算特征根。我们已经得到相关系数矩阵为,而二阶单位矩阵为,于是依据公式,我们有遵照行列式化为代数式的规那么可得依据一元二次方程的求根公式,当时,我们有据此解得,对于本例,明显,。这便是相关系数矩阵的两个特征根。 求标准正交向量。将代入矩阵方程,得到在系数矩阵中,用第一行加其次行,化为由此得,令,那么有,于是得根底解系,单位化为单位化的公式为。 完全类似,将代入矩阵方程,得到用系数矩阵的其次行减去第一行,化为于是得到,取,那么有,因此得根底解系为,单位化为这里、便是标准正交向量。 求对角阵。首先建立标准正交矩阵P,即有该矩阵的一个特殊性质便是,即矩阵的转置等于矩阵的逆。依据,可知下面说明一下利用Excel进展矩阵乘法运算的方法。矩阵乘法的叮嘱为mmult,语法是mmult (矩阵1的单元格范围,矩阵2的单元格范围)。例如,用矩阵 与矩阵C相乘,首先选择一个输出区域如G1:H2,然后输入“=mmult(A1:B2,C1:D2)”,然后按下“Ctrl+Shift+Enter”键图9,即可给出1.2060441.2060440.20817-0.20817再用乘得的结果与P阵相乘,便得对角矩阵1.705603000.294397假如盼望一步到位也不难,选定输出区域如C3:D4,然后输入“=mmult(mmult(A1:B2,C1:D2),E1:F2)” 图10,同时按下“Ctrl+Shift+Enter”键,立刻得到结果图11。明显,对角矩阵对角线的数值恰是相关系数矩阵的特征值。图9 矩阵乘法例如图10 矩阵连乘的叮嘱与语法 至此,标准化的原始变量x与主成分之间z之间可以表作明显与之间正交。图11 乘法结果:对角矩阵 依据特征根计算累计方差奉献率。现已求得第一特征根为,其次特征根为,二者之和刚好就是矩阵的维数,即有,这里m=2为变量数目留意前面的n=25为样本数目。比拟图6或图10中给出的相关系数矩阵C与图11中给出的对角矩阵D可以看出,Tr.(C)=1+1=2,Tr.(D)=1.7056+0.2944=2,即有Tr.(C)= Tr.(D),可见将相关系数亦即协方差矩阵转换为对角矩阵以后,矩阵的迹trace,即对角线元素之和没有变更,这意味着将原始变量化为主成分以后,系统的信息量没有削减。此时此刻问题是,假如我们只取一个主成分代表原来的两个变量,能反映原始变量的多少信息?这个问题可以借助相关系数矩阵的特征根来判定。利用Excel简洁算出,第一特征根占特征根总和即矩阵维数的85.28%见下表,即有特征根累计值百分比累计百分比1.7056031.70560385.28%85.28%0.294397214.72%100.00%也就是说:1.7056, :0.2944, :2,这说明,假如仅取第一个主成分,可以反映原来数据85.28%的信息换言之,舍弃其次个主成分,原来数据的信息仅仅损失14.72%,但分析变量的自由度却削减一个,整个分析将会显得更加简明。 计算主成分载荷。依据公式,简洁算出 计算公因子方差和方差奉献。依据上述计算结果可以比拟公因子方差和方差奉献。再考虑全部的两个主成分的时候,对应于和的公因子方差分别为 对应于第一主成分z1和其次主成分z2的方差奉献分别为 可以看出图12: 第一,方差奉献等于对应主成分的特征根,即有其次,公因子方差相等或彼此接近,即有第一,公因子方差之和等于方差奉献之和,即有第一个规律是我们确定提取主成分数目的判据与之一,其次个规律是我们判定提取主成分数目是否相宜的判据之一,第三个规律是我们判定提取主成分后是否损失信息的判据之一。去掉次要的主成分以后,上述规律理当照旧满足。这时假如其次个规律不满足,就意味着主成分的提取是不相宜的。此外,上述规律也是我们检验计算结果是否正确的判据之一。图12 公因子方差、方差奉献的计算结果及其与特征根的奉献 计算主成分得分。依据主成分与原始变量的关系,应有或者对于本例而言,式中,这里,为前面计算的标准化特征向量。于是有化为代数形式便是式中的x均为标准化数据。对进展转置,可得图13 计算特征向量的公式及语法图14 计算主成分得分依据这个式子,利用Excel计算主成分得分的步骤如下: 将特征向量复制到标准化数据的旁边; 选中一个与标准化数据占据范围一样大小的数值区域如G2:H26; 输入如下计算公式“=mmult(标准化数据的范围,特征向量的范围)”,在本例中就是“=MMULT(B2:C26,E2:F3)”图13; 同时按下“Ctrl+Shift+Enter”键。 计算主成分得分的均值和方差,可以发觉,均值为0由于误差之故,约等于0,方差等于特征根。 最终,可以对主成分得分进展标准化。确定主成分得分的均值为0,我们不按总体方差进展标准化,而按样本方差进展标准化。图15 主成分得分的标准化结果 样本方差的计算公式为相应地,标准差为标准化公式同前面给出的一样。结果见表15。留意,这里之所以按样本方差进展标准化,主要目的是为了与SPSS的计算结果进展比拟。 分别以z1、z2为坐标轴,将主成分得分包括标准化的得分点列标绘于坐标图中,可以发觉,点列分布没有任何趋势:回来结果说明,回来系数和相关系数均为零,即有,图16,图17。这从几何图形上显示:主成分之间是正交的,即有试将图16、图17与图2、图3比照。图16 主成分得分的相关系数为零图17 主成分得分的相关系数为零标准化最终可以验证因子载荷即为标准化原始数据与主成分得分之间的相关系数,简洁算出,图18 与的关系及其回来方程图19 与的关系及其回来方程图20 与的关系及其回来方程图21 与的关系及其回来方程回来方程为 方程的系数恰是以下矩阵的元素
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!