统计中的相关分析

上传人:wuli****0220 文档编号:248082863 上传时间:2024-10-22 格式:PPT 页数:41 大小:291.50KB
返回 下载 相关 举报
统计中的相关分析_第1页
第1页 / 共41页
统计中的相关分析_第2页
第2页 / 共41页
统计中的相关分析_第3页
第3页 / 共41页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Psychology,Statistics,应用心理学专业必修课 心理统计学 淮北煤师院教育学院 李怀龙,Email:,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第三章 相关分析,理解相关是描述两个变量之间关系的量数;,掌握相关的种类;,掌握各种相关系数的计算、适用条件;,掌握相关在教学实践中的运用;,掌握对相关系数的解释。,3.1,什么是相关,?,1,、什么是相关?,事物间的关系有三种:,(,1,),因果关系,:一种现象是另一种现象的因,而另一种现象则是果。,(,2,),共变关系,:两事物本身之间没有直接的关系,但它们都受第三种现象的影响而发生变化。,(,3,),相关关系,:两类现象在发展变化的方向与大小方面存在一定关系,但不能确定两者中哪个是因,哪个是果。,3.1,什么是相关,相关(统计学意义):,指具有相关关系的不同现象之间的关系程度。,相关分分类,按性质:,(,1,),正相关,:,两列变量变动方向相同。同时增大,同时减少。如身高与体重的关系。,(,2,),负相关,:两列变量变动方向相反。一个增大,另一个却减少;反之亦然。如年龄越大,走路速度越慢。,(,3,),零相关,:两列变量之间无关系。如学习成绩与身高的关系。,3.1,什么是相关,相关的分类,相关分类,按程度:,强相关,若相关,完全相关,相关分分类,按趋势:,线性相关,曲线相关,2,、相关系数,相关系数是两列变量相关程度的数字表现形式。样本相关系数用,r,表示;总体相关系数用,表示。,,r-1.00,,,1.00,(,1,),完全相关:,-1.00,或,1.00,,说明两个变量之间为确定关系;,(,2,),不完全相关,:,|,,,r|=30,为宜。,(,2,),相关系数不能直接进行四则运算。,(,3,)存在相关关系,不一定存在因果,关系。,(,4,)计算相关系数要求,成对数据,。若干个个体中每个个体要有两种不同的观测值。如每个学生的智力分数和学习成绩。任意两个个体之间的观测值不能求相关。,(,5,),没有线性相关,不一定没有关系,可能是非线性的。,3.2,积差相关,相关系数的合并,相关系数的合并意义:来自同一总体的多个样本的相关系数的合成。,步骤:,P138,,例,3.2,(1)将各样本的,r,转换成费舍,Z,分数,见附表8。,(2)求每一样本的,Z,分数之和,(3)求平均,Z,分数,2,、计算积差相关系数的公式,:,3.2,积差相关,3.2,积差相关,积差相关,,也称积矩相关、皮尔逊相关(,Pearson,英国统计学家),是求,直线相关,的基本方法。,积差相关适用条件:,(,1,)两列数据都是测量的数据(,数值型变量,),即要求是,连续变量,;,(,2,)成对数据,且,n,30,。,(,3,),双,变量,正态,(可对较大样本分别做正态性检验)。要求总体为正态,但对样本不要求一定为,正态,。,(,4,)两列变量之间的关系应是,线性,的,如果是非线性的,则不能计算线性相关。,3.2,积差相关,例,3.1,计算身高与体重的相关系数。,3.2,积差相关,3.2,积差相关,3.3,等级相关,顺序量表的数据或等距、等比数据而总体非正态,不能计算积差相关的条件下,可以计算等级相关。,优点:对,总体没有特别要求,是非参数的相关方法,适用面广。,缺点:与积差相关相比,精度稍差。,3.3.,等级相关,等级相关,请注意:,尽可能不出现相同等级,即不能并列排名,否则误差大,1、定义公式:,(一,),斯皮尔曼等级相关,斯皮尔曼等级相关是等级相关的一种,适用于只有,两列变量,而且是属于,等级变量性质,具有,线性关系,的资料。,其中:,N,成对数,;D=R,x,-,R,y,对偶等级之差,一家广告代理商想了解一家公司产品质量等级是否与其商场份额等级有关。小规模的实验研究,获得该行业,12,家公司的质量等级。,例,3.3.,等级相关,公司的质量形象与其市场份额等级成,正相关,。,3.3.,等级相关,有相同等级的等级相关系数,3.3.,等级相关,(,1,),是计算,多个等级变量,相关程度的一种相关量,既可是,k,个评分者评,(N),个对象,也可以是同一个人先后,k,次评,N,个对象。,(,2,)公式:,R,i,为每一被评事物,k,个等级之和,,n,为被评价事物的数目,即等级数,,k,为评价者的数目或等级变量的列数。,肯德尔,(Kendall),和谐系数(,W,),3.3.,等级相关,有,10,人对七件广告作品进行等级评价,结果如下表,问这,10,人的评价是否具有一致性?,所以,,10,人对,7,个作品的评价具有较高的一致性。排名为(从小到大):,4,、,6,、,1,、,5,、,3,、,7,、,2,。,例,3.3,3.3.,等级相关,肯德尔,W,系数的性质,若,k,个评价者的评价完全一致,,W=1,;,若完全没有相关,,W=0;,若,k,个评价者的评价完全相反,,W=-1,;,若,k,个评价者的评价存在一定关系,但又不完全一致,则,0,W,1,一般来说,,W,0,,,1,,没有负值。,原理:,和谐系数,W,=最大可能的方差/实际等级和方差。,肯德尔,(Kendall)U,系数,肯德尔,U,系数又称一致性系数。,处理的数据同肯德尔,W,系数,但数据获得的方法不同。,1,、适用的资料:,由,K,个评价者采用,对偶比较方法,对其优劣、大小、高低等单一维度的属性进行评价得到的数据。,具体方法为:将,N,件事物两两配对比较,优者为,1,,非优为,0,,难以判定为,0.5,。,3.3.,等级相关,10,个评价者对,7,种颜色对偶评价,其中一个评价者的评价为:,例如:,红,橙,黄,绿,青,蓝,紫,红,1,1,0,0,0,1,橙,0,0,0,0,0,1,黄,0,1,0,1,0,1,绿,1,1,1,1,1,1,青,1,1,0,0,0,1,蓝,1,1,1,0,1,1,紫,0,0,0,0,0,0,3.3.,等级相关,整理得到,10,个评价者对,7,种颜色对偶评价的结果为:,红,橙,黄,绿,青,蓝,紫,红,10,9,0,6,2,10,橙,0,2,0,0,0,5,黄,1,8,0,3,0,8,绿,10,10,10,10,5,10,青,4,10,7,0,0,9,蓝,8,10,10,5,10,10,紫,0,5,2,0,1,0,3.3.,等级相关,肯德尔,U,系数的计算公式,N,被评价事物的数目,即等级数,K,评价者数目,r,ij,对偶比较记录中,ij(ij),格子中择优分数,3.3.,等级相关,质与量相关,质与量相关,指一列变量为数值型数据,另一列变量为类别变量,求两列变量的直线相关,称为质与量相关。,包括:,点二列相关,二列相关,多系列相关。,1,、点二列相关,(,1,)适用资料,两列变量中,一列为等距或等比的测量数据,而且总体分布为正态,,另一列变量为类别(名义)变量,,分为两类。,点二列相关多用于编制,是非,测验题评价测验内部一致性等问题。每个题目(二分名义变量)与总分(数值)变量的相关,称为每个题目的区分度。,(,2,)计算公式,3.4,质与量相关,例,:,有一,是非,选择测验,共有,50,题,每题选对得,2,分,满分为,100,分。现有,20,人的总成绩及对第,5,题的选答情况,问第,5,题与总分的相关程度如何?,1,、点二列相关,3.4,质与量相关,例,3.4,3.4,质与量相关,n=20,,,X,t,=81.6,St=8.66,答对人数,10,答错人数,10,p=,答对学生的比率,=10/20=0.5,q=1-p=0.5,X,p,=88.4,X,q,=74.8,第5题与总分相关较高,相关系数为0.785,即第5题的答对答错与总分有一致性。也可以说该题的区分度较高。,3.4,质与量相关,(,1,)适用资料,适用于两列变量都为,正态等距,变量,但其中一列变量被,人为地划分成两类,。,二列相关与点二列相关的主要区别在于,二分变量是否正态,。,(,2,)计算公式,2,、二列相关,3.4,质与量相关,(,3,)下表为,10,名考生一次测验的卷面总分和一道回答题的得分,试求该问答题的区分度(该回答题满分为,10,分,因此得,6,分以上则认为该题通过)。,例,3.5,3.4,质与量相关,解:回答题得分被认为划分为通过和不通过两类,应求二列相关。查正态分布表:当,p=0.60,时,y=0.3866,,,3.4,质与量相关,偏相关(,Partial Correlation,),多要素系统中,一个要素的变化要影响到其它要素的变化,因此它们之间存在着不同的相关关系。,消除其它要素影响后两个要素之间的相关,称为,偏相关,。,偏相关系数是度量偏相关程度和方向的指标,它可以通过相关系数法来计算。,设有三个要素或变量,x,1,,,x,2,,,x,3,,其简单相关系数矩阵如图。,3.6,偏相关(,Partial Correlation,),三个变量间的偏相关系数有三个,即,r,123,,,r,132,,,r,231,下标圆点后面的数字,代表保持不变的变量,如,r,123,表示,X,3,保持不变,称为一级偏相关系数。,若有四个要素或变量相关,则有六个偏相关系数,即,r,1234,,,r,1324,,,r,1423,,,r,2314,,,r,2413,,,r,3412,,称为二级偏相关系数。,要素或变量多于四个时,可以类推。,偏相关的计算公式,r,ij,有是变量,x,i,,,x,j,,的简单相关系数,例如:假定测量了某个班级学生的三个变量数学成绩,x,1,、外语成绩,x,2,和语文成绩,x,3,。计算这三个测量值之间线性相关系分别为:,r,12,=0.58,,,r,13,=0.70,,,r,23,=0.80,。,3.6,偏相关,3.7 多重相关,表示一个变量与一组变量的“综合”效应之间的相关,一般以为高中平时成绩和高考成绩可以对大学一年级学业成绩有预测作用。,如何考虑大学一年级学业成绩与高中平时成绩和高考成绩“总和”的相关?,六、相关系数的选用与解释,如何选择合适的相关系数,1,、选择计算相关系数的方法主要取决于要处理的数据的性质以及某一相关系数需要满足的假设条件,2、总的来说,为了选择一个合适的相关系数进行相关分析,要分下面几个步骤考虑,考虑每种测量所产生的数据类型。,要对第一种测量数据和第二种测量数据的类型依次做出判断,确定采用哪一种相关系数。至于两个测量数据哪个为第一哪个标为第二,没有差别。,1、相关系数是一个指标值,它表示两个变量之间的相关程度。,2、相关系数不是等距的测量值,因此在比较相关程度时,不能用倍数关系说明,只能说绝对值大者比绝对值小者相关更密切一些。,3、相关系数值的大小表明了两列测量数据相互间的相关程度,并可以预测。,4、当两个变量之间的关系受到其他变量的影响时,两者之间的高强度相关很可能是一种假象:虚假相关或伪相关。,5,、在纯理论研究中,即使是很小的相关,如果在统计上有显著性,也能够说明心理规律,但这并不表明有显著性就有高相关。,6、,特别注意:证实两个变量之间存在相关关系,并不一定说明一个变量的变化会引起另外一个变量发生变化,即“相关关系不是因果关系”,相关系数的解释,小结,相关的含义,积差相关的计算公式和条件,等级相关,斯皮尔曼等级相关,肯德尔和谐系数,肯德尔,U,系数,质与量的相关,点二列相关,二列相关,作业,1、下表是平时两次考试的成绩分数,假设其分布为正态,分别用积差相关与等级相关方法计算相关系数,并回答,就这份资料用哪种相关法更恰当?,4、,假设两变量为线性关系,对下列各种情况各应使用何种方法计算相关系数?,(1)两列变量是等距或等比变量,且均为正态分布。,(2)两列变量是等距或等比变量,但不为正态分布。,(3)一列变量为正态连续变量,另一列变量为正态连续变量但被人为分为两类。,(4)一列为正态连续变量,另一列变量为二分称名变量。,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!