心理与教育统计学第5章-相关关系课件

上传人:文**** 文档编号:241418692 上传时间:2024-06-24 格式:PPT 页数:43 大小:321.67KB
返回 下载 相关 举报
心理与教育统计学第5章-相关关系课件_第1页
第1页 / 共43页
心理与教育统计学第5章-相关关系课件_第2页
第2页 / 共43页
心理与教育统计学第5章-相关关系课件_第3页
第3页 / 共43页
点击查看更多>>
资源描述
第五章第五章 相关关系相关关系第五章相关关系第五章第五章 章节内容章节内容一、相关、相关关系与散点图一、相关、相关关系与散点图二、积差相关二、积差相关三、等级相关三、等级相关四、质与量相关四、质与量相关五、品质相关五、品质相关六、相关系数的选用与解释六、相关系数的选用与解释第五章章节内容一、相关、相关关系与散点图一、一、相关、相关关系与散点图相关、相关关系与散点图1 1、相关的意义、相关的意义事物之间的相互关系事物之间的相互关系 因果关系(两种事物)因果关系(两种事物)共变关系(三种事物)共变关系(三种事物)相关关系(两种事物)相关关系(两种事物)相关的含义相关的含义事物之间存在关系,但又不能直接做因果关系解释时,事物之间存在关系,但又不能直接做因果关系解释时,称事物间的联系为相关。称事物间的联系为相关。判断两个因素或变量之间是否有关系,定量地研究这判断两个因素或变量之间是否有关系,定量地研究这些关系,称为相关分析。些关系,称为相关分析。一、相关、相关关系与散点图1、相关的意义事物之间的相互关系相相关的类别相关的类别正相关正相关:两个变量向相同的方向变化两个变量向相同的方向变化,即一个变即一个变量增加量增加,另一个变量也增加另一个变量也增加。负相关负相关:两个变量向相反的方向变化,即一个变两个变量向相反的方向变化,即一个变量增加量增加,另一个变量反而减少。另一个变量反而减少。零相关零相关:两列变量之间没有关系,即:两列变量之间没有关系,即6一列变量变一列变量变动时,另一列变量作无规律变动。动时,另一列变量作无规律变动。相关的类别两列变量间相关程度的数字表现形式,即用来表示相关两列变量间相关程度的数字表现形式,即用来表示相关系数强度的指标。系数强度的指标。P P(总体)总体)r r(样本)样本)不相关,相互独立不相关,相互独立正相关正相关负相关负相关完全正相关完全正相关完全负相关完全负相关越接近越接近1,表示两个变量的相关程度越密切,称高相关。,表示两个变量的相关程度越密切,称高相关。越接近越接近0,表示两个变量的相关程度越疏松,称低相关。,表示两个变量的相关程度越疏松,称低相关。相关系数相关系数两列变量间相关程度的数字表现形式,即用来表示相关系数强度的相关散点图相关散点图直观地显示了两个事物的成对观测值之间是直观地显示了两个事物的成对观测值之间是否存在相关,存在什么样的相关以及相关程否存在相关,存在什么样的相关以及相关程度。度。相关散点图直观地显示了两个事物的成对观测值之间是否存在相关,几种相关散点图几种相关散点图线性线性 (如身高和体重)(如身高和体重)非线性非线性(如年龄和身高如年龄和身高)曲线相关曲线相关 线性正相关线性正相关R=-1R=1线性负相关线性负相关 零相关零相关几种相关散点图线性(如身高和体重)非线性(如年龄和身高)二、积差相关二、积差相关英国英国 Pearson 1、定义公式若记 则二、积差相关英国Pearson1、定义积差相关适用条件积差相关适用条件要求成对数据两列变量各自总体的分布都是正态两个相关的变量是连续变量,也即两列数据都是测量数据两列变量之间的关系是直线性的,如果是非直线性的双列变量,不能计算线性相关。判断两列变量之间的相关是否为直线式,可作相关散点图进行初步分析,也可查阅已有研究结果论证。积差相关适用条件要求成对数据3、计算公式3、计算公式4、标准分数的计算公式4、标准分数的计算公式实例:书P116(例5-1)实例:书P116(例5-1)相关系数的合并相关系数的合并意义:来自同一总体的多个样本的相关系数的合成。意义:来自同一总体的多个样本的相关系数的合成。步骤:步骤:(1 1)将各样本的)将各样本的r r 转换成费舍转换成费舍Z Z分数,见附表分数,见附表8 8。(2 2)求每一样本的)求每一样本的Z Z分数之和分数之和(3 3)求平均)求平均Z Z分数分数例子:例子:P123 (例例5-2)相关系数的合并意义:来自同一总体的多个样本的相关系数的合成。三、等级相关三、等级相关(一(一)斯皮尔曼等级相关斯皮尔曼等级相关 斯皮尔曼等级相关是等级相关的一种,适用于只有两列变量,而且是属于等级变量性质具有线性关系的资料 其中:N 成对数 D=Rx-Ry 对偶等级之差请注意:尽可能不出现相同等级,即不能并列排名,否则误差大1、定义公式:、定义公式:三、等级相关(一)斯皮尔曼等级相关请注意:1、定义公式:2 2、相同等级计算方法、相同等级计算方法(1)将连续变量转化为等级变量求相关两个变量排序的方式要一致遇到相同等级时,要求他们的等级平均值例:例:X 100 98 97 97 93 93 93 90X 100 98 97 97 93 93 93 90 等级等级 1 2 3.5 3.5 6 6 6 8 1 2 3.5 3.5 6 6 6 8 2、相同等级计算方法(2 2)校正公式)校正公式其中:其中:其中:其中:D D:对偶等对偶等级差级差n:n:各变量各变量相同等级数相同等级数(2)校正公式其中:其中:例子:P128(例5-5)3、计算条件(1 1)必须成对数据)必须成对数据(2 2)必须都是等级变量)必须都是等级变量(3 3)正态条件不明或非正态时,转为等级求)正态条件不明或非正态时,转为等级求r r例子:P128(例5-5)(二)肯德尔等级相关(二)肯德尔等级相关 1 1、肯德尔、肯德尔W W系数系数 (1 1)适用资料)适用资料 肯肯德德尔尔W W系系数数又又称称为为肯肯德德尔尔和和谐谐系系数数是是表表示示多多列列等等级级变变量量相相关关程程度度的的一一种种方方法法。这这种种资资料料的的获获得得一一般般采采用用等等级级评评定定的的方方法法,即即让让K K个个被被试试(或或称称评评价价者者)对对N N件件事事物物或或作作品品进进行行等等级级评评定定,这这样样便便可可得得到到K K列列从从1 1到到N N的的等等级级变变量量资资料料;另另一一种种情情况况是是一一个个评评价价者者先先后后K K次次评评价价N N件件事事物物或或作作品品,采采用用等等级级评评定定的的方方法法,这这样样,同同样样得得到到K K列列从从1 1到到N N的的等等级级变变量量资资料料。对对这这样样的的K K列列等等级级变变量量资资料料求求相相关关,用用肯肯德德尔尔W W系数。系数。*用于三个或三个以上变量等级的相关系数,即求几个变用于三个或三个以上变量等级的相关系数,即求几个变量的一致性或和谐性量的一致性或和谐性(二)肯德尔等级相关1、肯德尔W系数*用于三(2 2)肯德尔)肯德尔W W系数计算公式系数计算公式基本公式:基本公式:其中:其中:R Ri i:每一件被评价事每一件被评价事物的物的K K个等级之和个等级之和N N:被评价事物的件被评价事物的件数即等级数数即等级数K K:评价者的数目或评价者的数目或等级变量的列数等级变量的列数 R R:评价等级和的平评价等级和的平均数均数(2)肯德尔W系数计算公式其中:Ri:每一件被评价事物的K个校正公式(出现相同等级的计算)例子:例子:P132(例例5-7)校正公式(出现相同等级的计算)例子:P132(例5-7)2、肯德尔肯德尔U U系数系数(1 1)适用资料)适用资料评价者采用对偶比较的方法,将评价者采用对偶比较的方法,将N N件事物两两配对,件事物两两配对,然后对每一对中两事物进行比较,择优选择,优者然后对每一对中两事物进行比较,择优选择,优者记记1 1,非优者记,非优者记0 0,最后整理成相对应的评价结果。,最后整理成相对应的评价结果。(2 2)计算公式:)计算公式:其中:N N:被评事物的数目,即被评事物的数目,即等级数等级数K K:评价者的数目评价者的数目r rijij:对偶比较记录表格中对偶比较记录表格中的择优分数的择优分数例子:书例子:书P133(5-8)2、肯德尔U系数其中:例子:书P133(5-8)定义:需要计算相关的两更变量一列为等比或等距的测量数据,另一列是按性质划分的类别,欲求这样两列变量的直线相关,称之为质量相关,包括点二列相关、二列(双列)相关及多系列相关。*质量相关是研究连续变量与二分变量的相关关系。质量相关是研究连续变量与二分变量的相关关系。有一种变量,只有两个取值,称为二分变量二分变量(1、0)人为划分为两个取值,称人为二分变量人为二分变量(及格、不及格)若有等级之分,称二分等级变量二分等级变量若无等级之分,称二分称名变量二分称名变量(男、女)四、四、质与量相关质与量相关 定义:需要计算相关的两更变量一列为等比或等距的测量数据,另一1 1、点二列相关、点二列相关 (1)适用资料两列变量,一列为来自正态分布的等距或等比测量数据的连续变量,另一列变量是二分称名变量或整体不服从正态的二分等级变量(2)公式及计算(P136)*该相关系数的正负号无意义,只根据绝对值的大小该相关系数的正负号无意义,只根据绝对值的大小加以解释。加以解释。1、点二列相关(1)适用资料2 2、二列相关、二列相关 (1)适用资料两列变量,都为连续变量均属于正态分布,一列变量等距或等比,另一列为人为的二分变量。(2)公式及计算:是非选择题用点二列,主观题评分用二列。q2、二列相关(1)适用资料q例例下表为10名考生一次测验的卷面总分和一道问答题的得分,试求该问答题的区分度(该问答题满分为10分,因此得6分和6分以上则认为该题通过)考生考生 A B C D E F G H I J卷面总分卷面总分75 57 73 65 67 56 63 61 65 67问答题得分问答题得分 7 6 7 4 7 4 4 4 7 6 例下表为10名考生一次测验的卷面总分和一道问答题的得分,试求解:问答题得分被人为划为通过、不通过两类,本题应解:问答题得分被人为划为通过、不通过两类,本题应求双列相关。求双列相关。根据题意可得:根据题意可得:解:问答题得分被人为划为通过、不通过两类,本题应求双列相关。3 3、多列相关、多列相关(1)适用资料:适合处理两列正态变量资料,其中一列为等距或等比变量的测量数据,另一列被人为分为多种类别,称为名义变量。分为三类就叫作三列相关,四类就叫做四类相关。(2)公式及计算见(P140)3、多列相关(1)适用资料:适合处理两列正态变量资料,其中一五、品质相关五、品质相关 1、品质相关用于表示RC(行列)表的两个变量之间的关联程度。可用于心理测验的编制,进行项目分析2、这种相关因两个变量(因素)只划分为不同的品质类别,故而得名。一般对计数数据,而非测量数据,即使是测量数据,也人为地分为几个类别。3、主要有四分(格)相关、相关、列联表相关等。五、品质相关1、品质相关用于表示RC(行列)表的两个变1 1、四分相关、四分相关(1)适用资料四分相关适用于计算两个变量都是连续且每个变量都被人为分为两种类型这样的测量数据之间的相关。计算四分相关首先要将资料整理成四格表。四格表是二个因素(变量),每个变量各有两项分类。四格表的二因素都是连续的正态变量,只是人为将其按一定标准划分为两个不同的类别(2)计算公式:P1431、四分相关(1)适用资料2 2、系数系数 (1)适用资料 两个相互关联的变量分布都是真正的二分变量,其系数用符号表示。求取系数可以运用列联表来计算,因此系数又叫列联系数。适用资料是除四分相关之外的四格表(计数)资料,是表示两因素两项分类资料相关程度最常用的一种相关系数。2、系数(1)适用资料(2)计算公式:完全正相关全体个案落在四格表中的a、d中;完全负相关全体个案落在四格表中的b、c中;零相关表示均匀分配。当值小于0.3时,表示相关较弱,当值大于0.6时,表示相关较强。除常用系数,也用Q系数或归结系数。(2)计算公式:3 3、列联表相关、列联表相关 (1)列联相关又称均方相依系数、接触系数等,一般用C表示。(2)它是二因素的RC列联表资料求得,故称为列联相关。当数据属于RC表的计数资料,欲分析所研究的二因素之间的相关程度,就要应用列联相关3、列联表相关(1)列联相关又称均方相依系数、接触系数等,(3)公式:(4)另外当双变量的测量数据整理成次数分布表后,也可用列联相关系数表示两变量的相关程度。此时,当分组数目R5,C5,而且样本N又较大,计算的列联相关系数C与积差相关系数r很接近。(3)公式:六、相关系数的选用与解释六、相关系数的选用与解释如何选择合适的相关系数如何选择合适的相关系数1、选择计算相关系数的方法主要取决于要处理的数据的性质以及某一相关系数需要满足的假设条件2、总的来说,为了选择一个合适的相关系数进行相关分析,要分下面几个步骤考虑:考虑每种测量所产生的数据类型要对第一种测量数据和第二种测量数据的类型依次做出判断确定采用哪一种相关系数。至于两个测量数据哪个为第一,哪个标为第二,没有差别六、相关系数的选用与解释如何选择合适的相关系数1、相关系数是一个指标值,它表示两个变量之间的相关程度2、相关系数不是等距的测量值,因此在比较相关程度时,不能用倍数关系说明,只能说绝对值大者比绝对值小者相关更密切一些。3、相关系数值的大小表明了两列测量数据相互间的相关程度,并可以预测。4、当两个变量之间的关系受到其他变量的影响时,两者之间的高强度相关很可能是一种假象:虚假相关或伪相关相关系数值的解释相关系数值的解释1、相关系数是一个指标值,它表示两个变量之间的相关程度相关系5、偏相关与半偏相关6、在纯理论研究中,即使是很小的相关,如果在统计上有显著性,也能够说明心理规律,但这并不表明有显著性就就有高相关7、特别注意:证实两个变量之间存在相关关系,并不一定说明一个变量的变化会引起另外一个变量发生变化,即“相关关系不是因果关系”。相关值较大的两类事物之间,不一定存在因果关系相关系数值的解释相关系数值的解释5、偏相关与半偏相关相关系数值的解释 相关意义的理解相关意义的理解1.相关的意义要看确定系数R22.相关系数0.3以下,为低相关,有理论意义而无实际意义3.相关系数0.4-0.6,为中等相关,既有有理论意义,也有实际意义4.相关系数0.7以上,为高相关,理论意义与实际意义都很大相关意义的理解1.相关的意义要看确定系数R2相关分析的发展相关分析的发展聚类分析聚类分析多组相关指标的简缩聚类分析(cluster analysis)又称分类分析、群聚分析、集群分析,是将所观测的事物,或观测事物的指标进行分类的一种统计分析方法。样品聚类-Q型聚类:根据样品(事物或被试)之间的“距离”。指标聚类-R型聚类:用指标之间的相关系数,如果被施测的团体一定,可对测试指标进行聚类,从众多指标中找出一些有代表性的指标。这样可以减少指标,优化指标。相关分析的发展聚类分析多组相关指标的简缩相关分析的发展相关分析的发展因素分析因素分析多组相关背后因素的探索它是从众多可观测“变量”根据其相关情况,概括和推论出少数不可观测的“潜变量”(又称因素),目的在于用最少的因素去概括和解释大量的观测事实,并建立起最简洁的,基本的概念系统,以揭示事物之间的本质联系的一种统计分析方法。相关分析的发展因素分析多组相关背后因素的探索探索性因素分析主要是从一组杂乱无章的数据对其又缺乏理论认识找出共同属性,以建立新的理论假设或发展新的理论构架;验证性因素分析的目的则在于验证已有的理论构架对其已有理论上的认识。探索性因素分析主要是从一组杂乱无章的数据对其又缺乏理论认识1 1、下下表表是是平平时时两两次次考考试试的的成成绩绩分分数数,假假设设其其分分布布为为正正态态,分分别别用用积积差差相相关关与与等等级级相相关关方方法法计计算算相相关关系系数数,并并回回答答,就就这这份份资资料料用用哪哪种种相相关关法更恰当?法更恰当?1、下表是平时两次考试的成绩分数,假设其分布为正态,分别用积2 2、假假设设两两变变量量为为线线性性关关系系,对对下下列列各各种种情情况况各各应应使使用何种方法计算相关系数?用何种方法计算相关系数?(1 1)两列变量是等距或等比变量,且均为正态分布。)两列变量是等距或等比变量,且均为正态分布。(2 2)两列变量是等距或等比变量,但不为正态分布。)两列变量是等距或等比变量,但不为正态分布。(3 3)一一列列变变量量为为正正态态连连续续变变量量,另另一一列列变变量量为为正正态态连续变量但被人为分为两类。连续变量但被人为分为两类。(4 4)一一列列为为正正态态连连续续变变量量,另另一一列列变变量量为为二二分分称称名名变量。变量。心理与教育统计学第5章-相关关系课件 谢谢大家!谢谢大家!谢谢大家!
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!