现代统计分析方法与应用课件 第十五章 典型相关分析

上传人:1666****666 文档编号:52229094 上传时间:2022-02-07 格式:PPT 页数:52 大小:765KB
返回 下载 相关 举报
现代统计分析方法与应用课件 第十五章 典型相关分析_第1页
第1页 / 共52页
现代统计分析方法与应用课件 第十五章 典型相关分析_第2页
第2页 / 共52页
现代统计分析方法与应用课件 第十五章 典型相关分析_第3页
第3页 / 共52页
点击查看更多>>
资源描述
2022-1-20中国人民大学六西格玛质量管理研究中心1第第十五十五章章 典型相关分析典型相关分析 目录 上页 下页 返回 结束 15.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 15.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 15.3 15.3 典型相关分析的上机实现典型相关分析的上机实现 2022-1-20中国人民大学六西格玛质量管理研究中心2第第十五十五章章 典型相关分析典型相关分析 目录 上页 下页 返回 结束 典型相关分析(典型相关分析(canonical correlation analysis)是研究两组变量之间相关关系的多元分析方法。它借用是研究两组变量之间相关关系的多元分析方法。它借用主成分析降维的思想,分别对两组变量提取主成分,且主成分析降维的思想,分别对两组变量提取主成分,且使从两组变量提取的主成分之间的相关程度达到最大,使从两组变量提取的主成分之间的相关程度达到最大,而从同一组内部提取的各主成分之间互不相关,用从两而从同一组内部提取的各主成分之间互不相关,用从两组之间分别提取的主成分的相关性来描述两组变量整体组之间分别提取的主成分的相关性来描述两组变量整体的线性相关关系。典型相关分析的思想首先由的线性相关关系。典型相关分析的思想首先由Hotelling于于1936年提出,计算机的发展解决了典型相关分析在应年提出,计算机的发展解决了典型相关分析在应用中计算方面的困难,目前成为普遍应用的进行两组变用中计算方面的困难,目前成为普遍应用的进行两组变量之间相关性分析的技术。本章主要介绍典型相关分析量之间相关性分析的技术。本章主要介绍典型相关分析的思想,基本理论及分析方法,并介绍利用的思想,基本理论及分析方法,并介绍利用SPSS软件软件进行典型相关分析的方法。进行典型相关分析的方法。2022-1-20中国人民大学六西格玛质量管理研究中心315.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 一、典型相关分析的统计思想一、典型相关分析的统计思想 典型相关分析研究两组变量之间整体的线性相关关系,它是将每一典型相关分析研究两组变量之间整体的线性相关关系,它是将每一组变量作为一个整体来进行研究而不是分析每一组变量内部的各个变量。组变量作为一个整体来进行研究而不是分析每一组变量内部的各个变量。所研究的两组变量可以是一组变量是自变量,而另一组变量是因变量的所研究的两组变量可以是一组变量是自变量,而另一组变量是因变量的情况,两组变量也可以处于同等的地位,但典型相关分析要求两组变量情况,两组变量也可以处于同等的地位,但典型相关分析要求两组变量都至少是间隔尺度的。都至少是间隔尺度的。 典型相关分析是借助于主成分分析的思想,对每一组变量分别寻找典型相关分析是借助于主成分分析的思想,对每一组变量分别寻找线性组合,使生成的新的综合变量能代表原始变量大部分的信息,同时,线性组合,使生成的新的综合变量能代表原始变量大部分的信息,同时,与由另一组变量生成的新的综合变量的相关程度最大,这样一组新的综与由另一组变量生成的新的综合变量的相关程度最大,这样一组新的综合变量称为第一对典型相关变量,同样的方法可以找到第二对,第三合变量称为第一对典型相关变量,同样的方法可以找到第二对,第三对,对,使得各对典型相关变量之间互不相关,典型相关变量之间的简,使得各对典型相关变量之间互不相关,典型相关变量之间的简单相关系数称为典型相关系数,典型相关分析就是用典型相关系数衡量单相关系数称为典型相关系数,典型相关分析就是用典型相关系数衡量两组变量之间的相关性。两组变量之间的相关性。2022-1-20中国人民大学六西格玛质量管理研究中心415.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心515.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心615.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 二、典型相关分析的基本理论及方法二、典型相关分析的基本理论及方法2022-1-20中国人民大学六西格玛质量管理研究中心715.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心815.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心915.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心1015.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心1115.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心1215.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心1315.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心1415.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心1515.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心1615.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心1715.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心1815.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心1915.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心2015.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心2115.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心2215.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心2315.1 15.1 典型相关分析的基本理论典型相关分析的基本理论 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心2415.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 典型相关分析的步骤有以下典型相关分析的步骤有以下6步:(步:(1)确定)确定典型相关分析的目标;(典型相关分析的目标;(2)设计典型相关分析;)设计典型相关分析;(3)检验典型相关分析的基本假设;()检验典型相关分析的基本假设;(4)估计)估计典型模型,评价模型拟合情况;(典型模型,评价模型拟合情况;(5)解释典型变)解释典型变量;(量;(6)验证模型。见参考文献)验证模型。见参考文献5。它实现的。它实现的逻辑框图如下:逻辑框图如下:2022-1-20中国人民大学六西格玛质量管理研究中心2515.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 图15.1 典型相关分析的逻辑框图2022-1-20中国人民大学六西格玛质量管理研究中心2615.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 图15.1 典型相关分析的逻辑框图 (续)(续) 2022-1-20中国人民大学六西格玛质量管理研究中心2715.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 第第1步:确定典型相关分析的目标步:确定典型相关分析的目标 典型相关分析所适用的数据是两组变量。我们假定每组典型相关分析所适用的数据是两组变量。我们假定每组变量都能赋予一定的理论意义,通常一组可以定义为自变量都能赋予一定的理论意义,通常一组可以定义为自变量,另一组可以定义为因变量。典型相关分析可以达变量,另一组可以定义为因变量。典型相关分析可以达到以下目标:到以下目标: 1.确定两组变量是相互独立,或者相反,确定两组变量确定两组变量是相互独立,或者相反,确定两组变量间存在关系的大小。间存在关系的大小。 2.为每组变量推导出一组权重,使得每组变量的线性组为每组变量推导出一组权重,使得每组变量的线性组合达到最大程度相关。最大化余下的相关关系的其他的合达到最大程度相关。最大化余下的相关关系的其他的线性函数是与前面的线性函数独立的。线性函数是与前面的线性函数独立的。 3.解释自变量与因变量组中存在的相关关系,通常是通解释自变量与因变量组中存在的相关关系,通常是通过测量每个变量对典型函数的相对贡献来衡量。过测量每个变量对典型函数的相对贡献来衡量。2022-1-20中国人民大学六西格玛质量管理研究中心2815.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 第第2步:设计典型相关分析步:设计典型相关分析 典型相关分析作为一种多元分析方法,与其他的多元分典型相关分析作为一种多元分析方法,与其他的多元分析技术有共同的基本的要求。其它方法(尤其是多元回归、析技术有共同的基本的要求。其它方法(尤其是多元回归、判别分析和方差分析)所讨论的测量误差的影响、变量类型判别分析和方差分析)所讨论的测量误差的影响、变量类型及变换也与典型相关分析有很大关系。及变换也与典型相关分析有很大关系。 样本大小的影响和每个变量需要足够的观测都是典型相样本大小的影响和每个变量需要足够的观测都是典型相关分析经常遇到的。研究者容易使自变量组和因变量组包含关分析经常遇到的。研究者容易使自变量组和因变量组包含很多的变量,而没有认识到样本量的含义。小的样本不能很很多的变量,而没有认识到样本量的含义。小的样本不能很好的代表相关关系,这样掩盖了有意义的相关关系。建议研好的代表相关关系,这样掩盖了有意义的相关关系。建议研究者至少保持每个变量究者至少保持每个变量10个观测,以避免数据的个观测,以避免数据的“过度拟过度拟合合”。2022-1-20中国人民大学六西格玛质量管理研究中心2915.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 第第3步:典型相关分析的基本假定步:典型相关分析的基本假定 线性假定影响典型相关分析的两个方面。首先,任意两个变量间线性假定影响典型相关分析的两个方面。首先,任意两个变量间的相关系数是基于线性关系的。如果这个关系不是线性的,一个或者的相关系数是基于线性关系的。如果这个关系不是线性的,一个或者两个变量需要变换。其次,典型相关是变量间的相关。如果关系不是两个变量需要变换。其次,典型相关是变量间的相关。如果关系不是线性的,典型相关分析将不能测量到这种关系。线性的,典型相关分析将不能测量到这种关系。 典型相关分析能够包容任何没有严格正态性假定的度量变量。正典型相关分析能够包容任何没有严格正态性假定的度量变量。正态性是有意义的,因为它标准化了分布,允许变量间的更高程度的相态性是有意义的,因为它标准化了分布,允许变量间的更高程度的相关。但在严格意义上,如果变量的分布形式(比如高度偏态)不会降关。但在严格意义上,如果变量的分布形式(比如高度偏态)不会降低与其他变量的相关关系,典型相关分析是可以包含这种非正态变量低与其他变量的相关关系,典型相关分析是可以包含这种非正态变量的。这就允许使用非度量变量。然而,对于每个典型函数的多元正态的。这就允许使用非度量变量。然而,对于每个典型函数的多元正态性的统计检验是必要的。由于多元正态性检验不一定可行,流行的准性的统计检验是必要的。由于多元正态性检验不一定可行,流行的准则是保证每个单变量的正态性。这样,尽管不严格要求正态性,建议则是保证每个单变量的正态性。这样,尽管不严格要求正态性,建议所有变量都检验正态性,如有必要,对变量进行变换。所有变量都检验正态性,如有必要,对变量进行变换。2022-1-20中国人民大学六西格玛质量管理研究中心3015.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 第第4步:推导典型函数、评价整体拟合情况步:推导典型函数、评价整体拟合情况 每个典型函数都包括一对变量,通常一个代表自变量,每个典型函数都包括一对变量,通常一个代表自变量,另一个代表因变量。可从变量组中提取的典型变量(函数)另一个代表因变量。可从变量组中提取的典型变量(函数)的最大数目等于最小数据组中的变量数目。比如,一个研究的最大数目等于最小数据组中的变量数目。比如,一个研究问题包含问题包含5个自变量和个自变量和3个因变量,可提取的典型函数的最大个因变量,可提取的典型函数的最大数目是数目是3。2022-1-20中国人民大学六西格玛质量管理研究中心3115.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 (一)推导典型函数(一)推导典型函数 典型函数的推导类似于没有旋转的因子分析的过程典型函数的推导类似于没有旋转的因子分析的过程参见参见前面推导前面推导。典型相关分析集中于说明两组变量间的最。典型相关分析集中于说明两组变量间的最大相关关系,而不是一组变量。结果是第一对典型变量大相关关系,而不是一组变量。结果是第一对典型变量在两组变量中有最大的相关关系。第二对典型变量得到在两组变量中有最大的相关关系。第二对典型变量得到第一对典型变量没有解释的两组变量间的最大相关关系。第一对典型变量没有解释的两组变量间的最大相关关系。简言之,随着典型变量的提取,接下来的典型变量是基简言之,随着典型变量的提取,接下来的典型变量是基于剩余残差,并且典型相关系数会越来越小。每对典型于剩余残差,并且典型相关系数会越来越小。每对典型变量是正交的,并且与其他的典型变量是独立的。变量是正交的,并且与其他的典型变量是独立的。 典型相关程度是通过相关系数的大小来衡量的。典型相典型相关程度是通过相关系数的大小来衡量的。典型相关系数的平方表示一个典型变量通过另外一个典型变量关系数的平方表示一个典型变量通过另外一个典型变量所解释的方差比例,也可称作两个典型变量间共同方差所解释的方差比例,也可称作两个典型变量间共同方差的比例。典型相关系数的平方称作典型根或者特征值。的比例。典型相关系数的平方称作典型根或者特征值。2022-1-20中国人民大学六西格玛质量管理研究中心3215.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 (二)典型函数的解释(二)典型函数的解释 一般来讲,实际提取的典型函数都是典型相关系数在某一般来讲,实际提取的典型函数都是典型相关系数在某个水平(比如个水平(比如0.05)上显著的函数。对显著的典型变量)上显著的函数。对显著的典型变量的解释是基于这样的假设,即认为相关的函数中,每组的解释是基于这样的假设,即认为相关的函数中,每组中的变量都对共同方差有较大贡献。中的变量都对共同方差有较大贡献。 Hair(1984)等人推荐三个准则结合使用来解释典型函数。等人推荐三个准则结合使用来解释典型函数。这三个准则是(这三个准则是(1)函数的统计显著性水平,()函数的统计显著性水平,(2)典型)典型相关的大小,(相关的大小,(3)两个数据集中方差解释的冗余测量。)两个数据集中方差解释的冗余测量。 通常认为一个有统计显著性的相关系数可接受显著性水通常认为一个有统计显著性的相关系数可接受显著性水平是平是0.05(也有(也有0.01的水平)。统计软件所提供的最常的水平)。统计软件所提供的最常见的检验是基于见的检验是基于Rao近似的统计量。除了对每个典型函近似的统计量。除了对每个典型函数分别的检验以外,全部典型根的多元检验也可以用来数分别的检验以外,全部典型根的多元检验也可以用来评价典型根的显著性。许多评价判别函数显著性的测量,评价典型根的显著性。许多评价判别函数显著性的测量,包括包括WilksLamada、Hotelling迹、迹、Pillai迹和迹和Roys gcr,这里也可以给出。这里也可以给出。2022-1-20中国人民大学六西格玛质量管理研究中心3315.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 典型函数的实际重要性是由典型相关系数的大小代表的。典型函数的实际重要性是由典型相关系数的大小代表的。当决定解释哪些函数时,应当考虑典型函数。当决定解释哪些函数时,应当考虑典型函数。 前面讲到典型相关系数的平方可以提供典型变量间共同前面讲到典型相关系数的平方可以提供典型变量间共同方差的一个估计。尽管这是对共同方差的一个简单明了的估计,方差的一个估计。尽管这是对共同方差的一个简单明了的估计,它可能引起一些误解,因为典型相关系数的平方表示由因变量它可能引起一些误解,因为典型相关系数的平方表示由因变量组和自变量组的线性组合所共享的方差,而不是来自两组变量组和自变量组的线性组合所共享的方差,而不是来自两组变量的方差。这样,即使两个典型变量可能并没有从它们各自的变的方差。这样,即使两个典型变量可能并没有从它们各自的变量组中提取显著方差,但这两个典型变量(线性组合)间仍可量组中提取显著方差,但这两个典型变量(线性组合)间仍可能得到一个相对较强的典型相关系数。为了克服在使用典型根能得到一个相对较强的典型相关系数。为了克服在使用典型根(典型相关系数平方)作为共同方差的测量中可能出现的有偏(典型相关系数平方)作为共同方差的测量中可能出现的有偏性和不稳定性,提出了冗余指数。它等价于在整个自变量组与性和不稳定性,提出了冗余指数。它等价于在整个自变量组与因变量组的每一个因变量之间计算多元相关系数的平方,然后因变量组的每一个因变量之间计算多元相关系数的平方,然后将这些平方系数平均得到一个平均的将这些平方系数平均得到一个平均的 。2R2022-1-20中国人民大学六西格玛质量管理研究中心3415.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心3515.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 (2)解释的方差比例。第二步是要计算通过自变量典型变量)解释的方差比例。第二步是要计算通过自变量典型变量能够解释的因变量典型变量的方差比例。这也就是自变量典型能够解释的因变量典型变量的方差比例。这也就是自变量典型变量与因变量典型变量间相关系数的平方,也就是典型相关系变量与因变量典型变量间相关系数的平方,也就是典型相关系数的平方。(数的平方。(3)冗余指数。一个典型变量的冗余指数就是这)冗余指数。一个典型变量的冗余指数就是这个变量的共同方差比例乘以平方典型相关系数,可以得到每个个变量的共同方差比例乘以平方典型相关系数,可以得到每个典型函数可以解释的共同方差部分。要得到较高的冗余指数,典型函数可以解释的共同方差部分。要得到较高的冗余指数,必须有较高的典型相关系数和由因变量典型变量解释的较高的必须有较高的典型相关系数和由因变量典型变量解释的较高的共同方差比例。研究者应注意虽然在典型函数中两个典型变量共同方差比例。研究者应注意虽然在典型函数中两个典型变量的典型相关系数是相同的,但是两个典型变量的冗余指数却有的典型相关系数是相同的,但是两个典型变量的冗余指数却有可能差异很大,因为每个都有不同的共同方差比例。已有人提可能差异很大,因为每个都有不同的共同方差比例。已有人提出关于冗余指数的检验,但还没有得到广泛应用。出关于冗余指数的检验,但还没有得到广泛应用。 2022-1-20中国人民大学六西格玛质量管理研究中心3615.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 第第5步:解释典型变量步:解释典型变量 即使典型相关系数在统计上是显著的,典型根和冗余系即使典型相关系数在统计上是显著的,典型根和冗余系数大小也是可接受的,研究者仍需对结果作大量的解释。这些数大小也是可接受的,研究者仍需对结果作大量的解释。这些解释包括研究典型函数中原始变量的相对重要性。主要使用以解释包括研究典型函数中原始变量的相对重要性。主要使用以下三种方法:(下三种方法:(1)典型权重(标准化系数),()典型权重(标准化系数),(2)典型载荷)典型载荷(结构系数),(结构系数),(3)典型交叉载荷。)典型交叉载荷。 (1)典型权重。传统的解释典型函数的方法包括观察每)典型权重。传统的解释典型函数的方法包括观察每个原始变量在它的典型变量中的典型权重的符号和大小。有较个原始变量在它的典型变量中的典型权重的符号和大小。有较大的典型权重,则说明原始变量对它的典型变量贡献较大,反大的典型权重,则说明原始变量对它的典型变量贡献较大,反之则相反。原始变量的典型权重有相反的符号说明变量之间存之则相反。原始变量的典型权重有相反的符号说明变量之间存在一种反面关系,反之则有正面关系。但是这种解释遭到了很在一种反面关系,反之则有正面关系。但是这种解释遭到了很多批评。这些问题说明在解释典型相关的时候慎用典型权重。多批评。这些问题说明在解释典型相关的时候慎用典型权重。2022-1-20中国人民大学六西格玛质量管理研究中心3715.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 (2)典型载荷。由于典型权重的缺陷,典型载荷逐步)典型载荷。由于典型权重的缺陷,典型载荷逐步成为解释典型相关分析结果的基础。典型载荷,也称典型成为解释典型相关分析结果的基础。典型载荷,也称典型结构相关系数,是原始变量(自变量或者因变量)与它的结构相关系数,是原始变量(自变量或者因变量)与它的典型变量间的简单线性相关系数。典型载荷反映原始变量典型变量间的简单线性相关系数。典型载荷反映原始变量与典型变量的共同方差,它的解释类似于因子载荷,就是与典型变量的共同方差,它的解释类似于因子载荷,就是每个原始变量对典型函数的相对贡献。每个原始变量对典型函数的相对贡献。 (3)典型交叉载荷。它的提出是作为典型载荷的替代。)典型交叉载荷。它的提出是作为典型载荷的替代。计算典型交叉载荷包括使得每个原始因变量与自变量典型计算典型交叉载荷包括使得每个原始因变量与自变量典型变量直接相关,反之亦然。交叉载荷提供了一个更直接的变量直接相关,反之亦然。交叉载荷提供了一个更直接的测量因变量组与自变量组关系的指标。测量因变量组与自变量组关系的指标。2022-1-20中国人民大学六西格玛质量管理研究中心3815.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 第第6步:验证与诊断步:验证与诊断 与其他的多元分析方法一样,典型相关分析的结果应与其他的多元分析方法一样,典型相关分析的结果应该验证,以保证结果不是只适合于样本,而是适合于总体。该验证,以保证结果不是只适合于样本,而是适合于总体。最直接的方法是构造两个子样本(如果样本量允许),在最直接的方法是构造两个子样本(如果样本量允许),在每个子样本上分别做分析。这样结果可以比较典型函数的每个子样本上分别做分析。这样结果可以比较典型函数的相似性、典型载荷等。如果存在显著差别,研究者应深入相似性、典型载荷等。如果存在显著差别,研究者应深入分析,保证最后结果是总体的代表而不只是单个样本的反分析,保证最后结果是总体的代表而不只是单个样本的反映。映。 另一种方法是测量结果对于剔除一个因变量或自变量另一种方法是测量结果对于剔除一个因变量或自变量的灵敏度,保证典型权重和典型载荷的稳定性。的灵敏度,保证典型权重和典型载荷的稳定性。2022-1-20中国人民大学六西格玛质量管理研究中心3915.2 15.2 典型相关分析的步骤及逻辑框图典型相关分析的步骤及逻辑框图 目录 上页 下页 返回 结束 另外还必须看到典型相关分析的局限性。这些局限中对另外还必须看到典型相关分析的局限性。这些局限中对结论和解释影响最大的是:结论和解释影响最大的是: 1.典型相关反映变量组的线性组合所共享的方差,而不是典型相关反映变量组的线性组合所共享的方差,而不是从变量提取的方差。从变量提取的方差。 2.计算典型函数推导的典型权重有较大的不稳定性。计算典型函数推导的典型权重有较大的不稳定性。 3.推导的典型权重是最大化线性组合间的相关关系,而不推导的典型权重是最大化线性组合间的相关关系,而不是提取的方差。是提取的方差。 4.典型变量的解释可能会比较困难,因为它们是用来最大典型变量的解释可能会比较困难,因为它们是用来最大化线性关系的,没有类似于方差分析中变量旋转的有助化线性关系的,没有类似于方差分析中变量旋转的有助于解释的工具。于解释的工具。 5.难以识别自变量和因变量的子集间有意义的关系,只能难以识别自变量和因变量的子集间有意义的关系,只能通过一些不充分的测量,比如载荷和交叉载荷。通过一些不充分的测量,比如载荷和交叉载荷。2022-1-20中国人民大学六西格玛质量管理研究中心4015.3 15.3 典型相关分析的上机实现典型相关分析的上机实现 目录 上页 下页 返回 结束 典型相关分析可以通过典型相关分析可以通过SPSS和和SAS实现。实现。在在SPSS中使用宏命令语句可以执行典型相关分中使用宏命令语句可以执行典型相关分析,但由宏命令得到的结果往往不能满足全部析,但由宏命令得到的结果往往不能满足全部的分析需要,还需要调用其他的命令。这里我的分析需要,还需要调用其他的命令。这里我们使用功能强大的们使用功能强大的SAS软件来实现典型相关分软件来实现典型相关分析。析。2022-1-20中国人民大学六西格玛质量管理研究中心4115.3 15.3 典型相关分析的上机实现典型相关分析的上机实现 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心4215.3 15.3 典型相关分析的上机实现典型相关分析的上机实现 目录 上页 下页 返回 结束 在此我们通过软件在此我们通过软件SAS来完成数据分析。操作步骤如下:来完成数据分析。操作步骤如下: 1.首先,将数据输入到文本文档中,命名为首先,将数据输入到文本文档中,命名为“pig.txt”,保存于保存于D盘盘 2.打开打开SAS软件,输入以下程序软件,输入以下程序 使用使用SAS软件操作步骤,软件操作步骤,SAS软件的输入程序为:软件的输入程序为:data pig; infile “D:/shouzhi.txt”; input x1-x4 y1-y8; run;proc cancorr data=pig ncan=2; var x1-x4; with y1-y8; run;我们可以得到以下结果:我们可以得到以下结果: 2022-1-20中国人民大学六西格玛质量管理研究中心4315.3 15.3 典型相关分析的上机实现典型相关分析的上机实现 目录 上页 下页 返回 结束 结果一是判断两组变量相关性的各种检验,如果无结果一是判断两组变量相关性的各种检验,如果无法拒绝它们不相关的零假设,就不必做进一步的典型相关法拒绝它们不相关的零假设,就不必做进一步的典型相关分析了。从输出结果来看,我们有理由拒绝零假设,即认分析了。从输出结果来看,我们有理由拒绝零假设,即认为这两组变量之间有一定的相关性。为这两组变量之间有一定的相关性。2022-1-20中国人民大学六西格玛质量管理研究中心4415.3 15.3 典型相关分析的上机实现典型相关分析的上机实现 目录 上页 下页 返回 结束 结果二主要反映典型变量之间的相关系数,第一对典结果二主要反映典型变量之间的相关系数,第一对典型变量(型变量(V、W)的典型相关系数)的典型相关系数0.990688,第二对典型,第二对典型变量的典型相关系数为变量的典型相关系数为0.813766。2022-1-20中国人民大学六西格玛质量管理研究中心4515.3 15.3 典型相关分析的上机实现典型相关分析的上机实现 目录 上页 下页 返回 结束 结果三给出了特征根(结果三给出了特征根(Eigenvalue)、特征根所占的)、特征根所占的百分比(百分比(Proportion)、累计百分比()、累计百分比(Cumulative)等信)等信息。可以看出第一对典型变量(息。可以看出第一对典型变量(V、W)的特征根占了总量)的特征根占了总量的的93.01% 。注意,特征根的大小反映了对(。注意,特征根的大小反映了对(V、W)的相)的相关的不同重要程度。关的不同重要程度。2022-1-20中国人民大学六西格玛质量管理研究中心4615.3 15.3 典型相关分析的上机实现典型相关分析的上机实现 目录 上页 下页 返回 结束 结果四反映了第一组变量的前两个典型变量结果四反映了第一组变量的前两个典型变量V1、V2的表示式(标准化后数据),从中不难看出第一个典型变的表示式(标准化后数据),从中不难看出第一个典型变量主要代表工资性收入和转移性收入,第二个典型变量主量主要代表工资性收入和转移性收入,第二个典型变量主要代表工资性收入和财产收入,但是工资性收入起负面作要代表工资性收入和财产收入,但是工资性收入起负面作用。用。 432114111. 00767. 01142. 05659. 0 xxxxV432128815. 04284. 07276. 02056. 1xxxxV2022-1-20中国人民大学六西格玛质量管理研究中心4715.3 15.3 典型相关分析的上机实现典型相关分析的上机实现 目录 上页 下页 返回 结束 类似的还可以得到第二组变量的前两个典型变量类似的还可以得到第二组变量的前两个典型变量W1、W2的表示式(标准化后数据),可以看出第一个典型变量主的表示式(标准化后数据),可以看出第一个典型变量主要代表家庭设备及服务和衣着,第二个典型变量主要代表家要代表家庭设备及服务和衣着,第二个典型变量主要代表家庭设备及服务、交通和通讯、文教娱乐用品及服务、医疗保庭设备及服务、交通和通讯、文教娱乐用品及服务、医疗保健、其他商品及服务,不过交通和通讯、文教娱乐用品及服健、其他商品及服务,不过交通和通讯、文教娱乐用品及服务在这里起负面作用。务在这里起负面作用。 5432111265. 04832. 00862. 02066. 00252. 0yyyyyW8761958. 01075. 00852. 0yyy5432129772. 18191. 19091. 01716. 08120. 0yyyyyW8763223. 17860. 10594. 1yyy2022-1-20中国人民大学六西格玛质量管理研究中心4815.3 15.3 典型相关分析的上机实现典型相关分析的上机实现 目录 上页 下页 返回 结束 2022-1-20中国人民大学六西格玛质量管理研究中心4915.3 15.3 典型相关分析的上机实现典型相关分析的上机实现 目录 上页 下页 返回 结束 结果四(续)结果四(续)2022-1-20中国人民大学六西格玛质量管理研究中心5015.3 15.3 典型相关分析的上机实现典型相关分析的上机实现 目录 上页 下页 返回 结束 结果五可以看出结果五可以看出 主要和变量主要和变量 相关,相关, 和和反映消费支出的反映消费支出的8各变量相关性都很强。各变量相关性都很强。1V321,XXX1W2022-1-20中国人民大学六西格玛质量管理研究中心5115.3 15.3 典型相关分析的上机实现典型相关分析的上机实现 目录 上页 下页 返回 结束 结果五(续)结果五(续) 由此,综合以上结果分析,我们不难得出由此,综合以上结果分析,我们不难得出V1所代表的工资性所代表的工资性收入和转移性收入和收入和转移性收入和W1所代表的各种家庭生活消费支出相关。所代表的各种家庭生活消费支出相关。 2022-1-20中国人民大学六西格玛质量管理研究中心52
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!