spss相关分析分析ppt课件

上传人:txadgkn****dgknqu... 文档编号:174336685 上传时间:2022-12-14 格式:PPT 页数:61 大小:2.07MB
返回 下载 相关 举报
spss相关分析分析ppt课件_第1页
第1页 / 共61页
spss相关分析分析ppt课件_第2页
第2页 / 共61页
spss相关分析分析ppt课件_第3页
第3页 / 共61页
点击查看更多>>
资源描述
运筹学与数据分析实践数据分析部分数据分析部分相关分析的基本概念相关分析的基本概念1 二元相关分析二元相关分析2偏相关分析偏相关分析3距离相关分析距离相关分析4 任何事物的变化都与其他事物是相互联系任何事物的变化都与其他事物是相互联系和相互影响的,用于描述事物数量特征的变量和相互影响的,用于描述事物数量特征的变量之间自然也存在一定的关系。变量之间的关系之间自然也存在一定的关系。变量之间的关系归纳起来可以分为两种类型,即函数关系和统归纳起来可以分为两种类型,即函数关系和统计关系。计关系。当一个变量当一个变量x x取一定值时,另一变量取一定值时,另一变量y y可可以按照确定的函数公式取一个确定的值,记为以按照确定的函数公式取一个确定的值,记为y y=f(xf(x),则称,则称y y是是x x的函数,也就时说的函数,也就时说y y与与x x两变量之间存在函数关系。又如,某种商品在两变量之间存在函数关系。又如,某种商品在其价格不变的情况下,销售额和销售量之间的其价格不变的情况下,销售额和销售量之间的关系就是一种函数关系:销售额关系就是一种函数关系:销售额=价格价格销售销售量。量。函数关系是一一对应的确定性关系,比较函数关系是一一对应的确定性关系,比较容易分析和测度,可是在现实中,变量之间的容易分析和测度,可是在现实中,变量之间的关系往往并不那么简单。关系往往并不那么简单。为了判断为了判断r r对对的代表性大小,需要对相的代表性大小,需要对相关系数进行假设检验。关系数进行假设检验。(1 1)首先假设总体相关性为零,即)首先假设总体相关性为零,即H H0 0为为两总体无显著的线性相关关系。两总体无显著的线性相关关系。(2 2)其次,计算相应的统计量,并得到)其次,计算相应的统计量,并得到对应的相伴概率值。如果相伴概率值小于或等对应的相伴概率值。如果相伴概率值小于或等于指定的显著性水平,则拒绝于指定的显著性水平,则拒绝H H0 0,认为两总体,认为两总体存在显著的线性相关关系;如果相伴概率值大存在显著的线性相关关系;如果相伴概率值大于指定的显著性水平,则不能拒绝于指定的显著性水平,则不能拒绝H H0 0,认为两,认为两总体不存在显著的线性相关关系。总体不存在显著的线性相关关系。相关系数的取值范围在相关系数的取值范围在1 1和和+1+1之间,即之间,即1r+11r+1。其中:。其中:若若0 0r1r1,表明变量之间存在正相关,表明变量之间存在正相关关系,即两个变量的相随变动方向相同;关系,即两个变量的相随变动方向相同;若若1r1r0 0,表明变量之间存在负相,表明变量之间存在负相关关系,即两个变量的相随变动方向相反;关关系,即两个变量的相随变动方向相反;在实际中,因为研究目的不同,变量的类在实际中,因为研究目的不同,变量的类型不同,采用的相关分析方法也不同。比较常型不同,采用的相关分析方法也不同。比较常用的相关分析是二元相关分析、偏相关分析和用的相关分析是二元相关分析、偏相关分析和距离分析。距离分析。在二元变量的相关分析过程中比较常用的在二元变量的相关分析过程中比较常用的几个相关系数是几个相关系数是PearsonPearson简单相关系数、简单相关系数、SpearmanSpearman和和Kendalls tau-bKendalls tau-b等级相关系数。等级相关系数。Pearson Pearson简单相关系数用来衡量定距变量简单相关系数用来衡量定距变量间的线性关系。间的线性关系。2.1 Pearson相关系数相关系数定距变量,它的取值之间可以比较大小,可以用加减法计算出差异的大小。例如,“年龄”变量、“收入”变量、“成绩”变量等都是典型的定距变量。几种典型的几种典型的Pearson相关系数及其散点图相关系数及其散点图2.2 SPSS中实现过程中实现过程 研究问题研究问题 某班级学生数学和化学的期末考试成绩如某班级学生数学和化学的期末考试成绩如表表2-12-1所示,现要研究该班学生的数学和化学所示,现要研究该班学生的数学和化学成绩之间是否具有相关性。成绩之间是否具有相关性。人人 名名数数 学学化化 学学hxh99.0090.00yaju88.0099.00yu65.0070.00shizg89.0078.00hah94.0088.00smith90.0088.00watet79.0075.00jess95.0098.00wish95.0098.00laly80.0099.00john70.0089.00chen89.0098.00david85.0088.00caber50.0060.00marry87.0087.00joke87.0087.00jake86.0088.00herry76.0079.00 实现步骤实现步骤Step01:实现步骤实现步骤Step02:选择检验变量在【Bivariate Correlations(双变量相关)】对话框左侧的候选变量列表框中选择两个个或两个以上变量将其添加至【Variables(变量)】列表框中,表示需要进行简单相关分析的变量。实现步骤实现步骤Step04:假设检验类型选择在图中的【Test of Significance(显著性检验)】选项组中可以选择输出的假设检验类型,对应有两个单选项。Two tailed:系统默认项。双尾检验,当事先不知道相关方向(正 相关还是负相关)时选择此项。One tailed:单尾检验,如果事先知道相关方向可以选择此项。同时,可以勾选【Flag significant Correlations(标记显著性相关)】复选框。它表示选择此项后,输出结果中对在显著性水平0.05下显著 相关的相关系数用一个星号“*”加以标记;对在显著性水平0.01下 显著相关的相关系数用两个星号“*”标记。从上述的Pearson相关系数表。可以看到,两个成绩的Pearson相关系数值为0.742;同时相伴概率P值明显小于显著性水平0.01,这说明 两者中度正线性相关。结果和讨论结果和讨论2.3 绘制相关散点图绘制相关散点图 如果对变量之间的相关程度不需要掌握得如果对变量之间的相关程度不需要掌握得那么精确,可以通过绘制变量的相关散点图来那么精确,可以通过绘制变量的相关散点图来直接判断。仍以上例来说明。直接判断。仍以上例来说明。实现步骤实现步骤Step01:Step02:结果和讨论结果和讨论Step03:选择X轴和Y轴的对应变量2.4 Spearman相关系数相关系数 Pearson 线性相关系数必须假设数据是成对地从正态分布中取得的,并且数据至少在逻辑范畴内必须是等间距的数据。如果这两条件不符合,可采用Spearman 秩相关系数来代替Pearson 线性相关系数。Spearman秩相关系数用来度量顺序水准变量间的线性相关关系。它是利用两变量的秩次大小作线性相关分析,适用条件为:两个变量的变量值是以等级次序表示的数据;一个变量的变量值是等级数据,另一个变量的变量值是等距或比率数据,且其两总体不要求是正态分布,样本容量n不一定大于30。Spearman 秩相关系数经常被称为非参数相关系数,这具有两层含义:第一,只要在X 和Y 具有单调的函数关系的关系,那么X 和Y 就是完全Spearman 相关的,这与Pearson 相关性不同,后者只有在变量之间具有线性关系时才是完全相关的。两外一个关于Spearman 秩相关系数的非参数性的理解就是样本之间精确的分布可以在不知道X 和Y 的联合概率密度函数时获得。2.5 SPSS中实现过程中实现过程 研究问题研究问题 某语文老师先后两次对其班级学生同一篇某语文老师先后两次对其班级学生同一篇作文加以评分,两次成绩分别记为变量作文加以评分,两次成绩分别记为变量“作文作文1 1”和和“作文作文2 2”,数据如表,数据如表2-22-2所示。问两次评所示。问两次评分的等级相关有多大,是否达到显著水平?分的等级相关有多大,是否达到显著水平?人人 名名作作 文文 1作作 文文 2hxh86.0083.00yaju78.0082.00yu62.0070.00shizg75.0073.00hah89.0092.00smith67.0065.00watet96.0093.00jess80.0085.00wish77.0075.00laly59.0065.00john79.0075.00chen68.0070.00david85.0080.00caber87.0075.00marry75.0080.00joke73.0078.00jake95.0090.00herry88.0090.00 实现步骤实现步骤只需在相关系数中选择Spearman即可,其他与Pearson相关分析相似,结果和讨论结果和讨论从上述的Spearman相关系数可以看到,这位老师两次的评分的正相关性较显著,说明这位老师两次批改结果还是较一致的 二元变量的相关分析在一些情况下无法较二元变量的相关分析在一些情况下无法较为真实准确地反映事物之间的相关关系。例如,为真实准确地反映事物之间的相关关系。例如,在研究某农场春季早稻产量与平均降雨量、平在研究某农场春季早稻产量与平均降雨量、平均温度之间的关系时,产量和平均降雨量之间均温度之间的关系时,产量和平均降雨量之间的关系中实际还包含了平均温度对产量的影响。的关系中实际还包含了平均温度对产量的影响。同时平均降雨量对平均温度也会产生影响。在同时平均降雨量对平均温度也会产生影响。在这种情况下,单纯计算简单相关系数,显然不这种情况下,单纯计算简单相关系数,显然不能准确地反映事物之间地相关关系,而需要在能准确地反映事物之间地相关关系,而需要在剔除其他相关因素影响的条件下计算相关系数。剔除其他相关因素影响的条件下计算相关系数。偏相关分析正是用来解决这个问题的。偏相关分析正是用来解决这个问题的。定义:偏相关分析是指当两个变量同时与定义:偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程。只分析另外两个变量之间相关程度的过程。偏相关分析的工具是计算偏相关系数偏相关分析的工具是计算偏相关系数r r1212,3 3。3.1 统计学上的定义和计算公式统计学上的定义和计算公式3.2 SPSS中实现过程中实现过程 研究问题研究问题 某农场通过试验取得某农作物产量与春季某农场通过试验取得某农作物产量与春季降雨量和平均温度的数据,如表降雨量和平均温度的数据,如表3-33-3所示。现所示。现求降雨量对产量的偏相关。求降雨量对产量的偏相关。产产 量量降降 雨雨 量量温温 度度150.0025.006.00230.0033.008.00300.0045.0010.00450.00105.0013.00480.00111.0014.00500.00115.0016.00550.00120.0017.00580.00120.0018.00600.00125.0018.00600.00130.0020.00 实现步骤实现步骤Step01:打开主菜单选择菜单栏中的【Analyze(分析)】【Correlate(相关)】【Partial(偏相关)】命令,弹出【Partial Correlations(偏相关)】对话框,如下图所示,这是偏相关分析的主操作窗口。实现步骤实现步骤Step02:选择检验变量在【Bivariate Correlations(偏相关)】对话框左侧的候选变量列表框中选择两个或两个以上变量,将其添加至【Variables(变量)】列表框中,表示需要进行偏相关分析的变量。Step03:选择控制变量在【Bivariate Correlations(偏相关)】对话框左侧的候选变量列表框中 至少选择一个变量,将其添加至【Controlling for(控制)】列表框中,表示在进行偏相关分析时需要控制的变量。注意如果不选入控制变量,则进行的是简单相关分析。Step04:假设检验类型选择在【Test of Significance(显著性检验)】选项组中可以选择输出的假设检验类型,对应有以下两个选项。Two tailed:系统默认项。双尾检验,当事先不知道相关方向(正相关还是负相关)时选择此项。One tailed:单尾检验,如果事先知道相关方向可以选择此项。同时,可以勾选【Flag significant Correlations】复选框。它表示选择此项后,输出结果中对在显著性水平0.05下显著相关的相关系数用一个星号“*”加以标记;对在显著性水平0.01下显著相关的相关系数用两个星号“*”标记。实现步骤实现步骤Step05:其他选项选择单击【选项】按钮,弹出的对话框用于指定输出内容和关于缺失值的处理方法,主要包括以下选项。统计量:选择输出统计量。均值和标准差:将输出选中的各变量的观测值数 目、均值和标准差。零阶相关系数:显示零阶相关矩阵,即Pearson 相关矩 阵。缺失值:用于设置缺失值的处理方式。它有两种处理方式:按对排除个案:系统默认项。剔除当前分析的两个变量值中缺失的个案。按列表排除个案:表示剔除所有含缺失值的个案后再进行分 析。Step06:相关统计量的Bootstrap估计单击【Bootstrap】按钮,在弹出的对话框中可以进行如下统计量的Bootstrap估计。描述统计表支持均值和标准差的Bootstrap 估计。相关性表支持相关性的Bootstrap 估计。Step07:单击【OK】按钮,结束操作,SPSS软件自动输出结果。3.3 结果和讨论结果和讨论从以上结果可以看出,在控制了温度变量后,产量和降雨量之间还是有正相关关系,但不如之前的显著了。4.1 统计学上的定义和计算公式统计学上的定义和计算公式 简单相关分析和偏相关分析有一个共同点,那就是对所简单相关分析和偏相关分析有一个共同点,那就是对所分析的数据背景应当有一定程度的了解。但在实际中有时会分析的数据背景应当有一定程度的了解。但在实际中有时会遇到一种情况,在分析前对数据所代表的专业背景知识尚不遇到一种情况,在分析前对数据所代表的专业背景知识尚不充分,本身就属于探索性的研究。这时就需要先对各个指标充分,本身就属于探索性的研究。这时就需要先对各个指标或者案例的差异性、相似程度进行考察,以先对数据有一个或者案例的差异性、相似程度进行考察,以先对数据有一个初步了解,然后再根据结果考虑如何进行深入分析。初步了解,然后再根据结果考虑如何进行深入分析。距离相关分析是对观测量之间或变量之间相似或不相似距离相关分析是对观测量之间或变量之间相似或不相似的程度的一种测量。距离相关分析可用于同一变量内部各个的程度的一种测量。距离相关分析可用于同一变量内部各个取值间,以考察其相互接近程度;也可用于变量间,以考察取值间,以考察其相互接近程度;也可用于变量间,以考察预测值对实际值的拟合优度。预测值对实际值的拟合优度。距离相关分析根据统计量不同,分为以下距离相关分析根据统计量不同,分为以下两种。两种。不相似性测量:通过计算样本之间或不相似性测量:通过计算样本之间或变量之间的距离来表示。变量之间的距离来表示。相似性测量:通过计算相似性测量:通过计算PearsonPearson相关系相关系数或数或CosineCosine相关来表示。相关来表示。距离相关分析根据分析对象不同,分为以距离相关分析根据分析对象不同,分为以下两种。下两种。样本间分析:样本和样本之间的距离样本间分析:样本和样本之间的距离相关分析。相关分析。变量间分析:变量和变量之间的距离变量间分析:变量和变量之间的距离相关分析。相关分析。在不相似性测量的距离分析中,根据不同在不相似性测量的距离分析中,根据不同类型的变量,采用不同的统计量进行计算。类型的变量,采用不同的统计量进行计算。(1 1)对连续变量的样本)对连续变量的样本 (x,yx,y)进行距进行距离相关分析时,常用的统计量有以下几种。离相关分析时,常用的统计量有以下几种。4.2 SPSS中实现过程中实现过程 距离相关分析分为相似性测量和不相似性距离相关分析分为相似性测量和不相似性测量,也可分为样本间分析和变量间分析。下测量,也可分为样本间分析和变量间分析。下面分别对这面分别对这4 4种情况进行讲解。种情况进行讲解。研究问题研究问题1 1变量和个案之间的不相似性变量和个案之间的不相似性测量分析测量分析 对对6 6个标准电子元件的电阻(欧姆)进行个标准电子元件的电阻(欧姆)进行3 3次平行测试,测得结果如表次平行测试,测得结果如表4-44-4所示。问测试所示。问测试结果是否一致,结果是否一致,6 6个电子元件之间测试结果有个电子元件之间测试结果有无差异。无差异。123456第一次第一次0.1400.1380.1430.1410.1440.137第二次第二次0.1350.1400.1420.1360.1380.140第三次第三次0.1410.1420.1370.1400.1420.143 实现步骤实现步骤Step01:打开对话框选择菜单栏中的【Analyze(分析)】【Correlate(相关)】【Distanc es(距离)】命令,弹出【Distances(距离)】对话框,这是距离分析 的主操作窗口。实现步骤实现步骤Step02:选择检验变量在【Distances(距离)】对话框左侧的候选变量列表框中选择两个或两个以上变量,将其添加至【Variables(变量)】列表框中,表 示需要进行距离分析的变量。同时可以选择一个字符型标示变量移入【Label Cases(标注个案)】列表框中,在输出中将用这个标示变量 值对各个观测量加以标记。缺省时,输出中用观测量的序号来标记。Step03:选择分析类型在【Compute Distances(计算距离)】选项组中可以选择计算何种类型的距离。Between cases:系统默认项。表示作变量内部观察值之间的距离 相关分析。Between variables:表示作变量之间的距离相关分析。实现步骤实现步骤Step04:测度类型选择在【Measure(度量标准)】选项组中可以选择分析时采用的距离类型。Dissimilarities:系统默认项。不相似性测距,系统默认采用欧式 距离测度观测值或变量之间的不相似性。Similarities:相似性测距。系统默认使用Pearson相关系数测度 观测值或变量之间的相似性。Step05:完成操作单击【OK】按钮,结束操作,SPSS软件自动输出结果。结果和讨论结果和讨论以上是三次测试的不相似距离分析结果,从以上结果可以看出,三次测试的一致性较好,数据之间的距离较小结果和讨论结果和讨论以上是6个电子元件的不相似距离分析结果,从以上结果可以看出,6个电子元件的测试结果非常一致,可认为6个电子元件测试结果无差别
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!