《相关测量法》PPT课件

上传人:wuli****0220 文档编号:244766934 上传时间:2024-10-06 格式:PPT 页数:35 大小:200KB
返回 下载 相关 举报
《相关测量法》PPT课件_第1页
第1页 / 共35页
《相关测量法》PPT课件_第2页
第2页 / 共35页
《相关测量法》PPT课件_第3页
第3页 / 共35页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三讲 统计相关测量法,一、选择相关测量法需要注意三个问题,第一、变量的测量层次:定类、定序和定距。属于不同测量层次的变量,就要用不同的相关测量法。,第二、变量之间关系是对称还是不对称的。有些相关测量法是假定变量与变量之间具有对称关系,有些则假定是不具有对称关系。,第三、注意统计值的意义。一般选择具有消减误差比例意义的测量法,即PRE测量法。,根据变量层次,有六种相关测量情况:,两个定类变量,两个定序变量,两个定距变量,一个定类变量和一个定距变量,一个定类变量和一个定序变量,一个定序变量和一个定距变量,二、两个变量的相关测量法,两个变量的测量等级,相关系数,是否描述对称关系,取值范围,有无减少误差意义,SPSS上有无该系数,定类与定类,Lambda,对称,0,1,有,有,Lambday,不对称,0,1,有,无,Tauy,不对称,0,1,有,有,定序与定序,Gamma,对称,-1,1,有,有,dy,不对称,-1,1,有,有,Taua,不对称,-1,1,无,有,Taub,对称,-1,1,无,有,Tauc,对称,-1,1,无,无,rho,对称,-1,1,有,有,定距与定距,回归系数,非对称,正负无穷大,有,有,积矩相关系数,对称,-1,1,有,有,定类与定距,Eta,非对称,0,1,有,有,定类与定序,Lambda,Tauy,对称,不对称,0,1,0,1,有,有,有,无,定序与定距,Eta,非对称,0,1,有,有,三、两个定类变量的统计相关,1、,Lambda相关测量法,Lambda相关测量法的基本逻辑是用一个定类变量来解释或预测另一个定类变量时,以众数作为解释或预测的标准,可以减除多少预测误差。,Lambda相关测量法有两种形式。一种是对称形式,即两个变量间的关系是对称的,不分自变量或因变量。另一种是不对称形式,即要求一个是自变量(X),另一个是因变量(Y)。,(对称形式),(非对称形式),其中:My是Y变量的众数次数。,Mx是X变量的众数次数。,mx是Y变量的每个值(类别)之下X变量的众值次数。,my是X变量的每个值(类别)之下X变量的众值次数。,n,是全部样本数目。,表,1 100,名青年的人生志愿与性别的关系,性别X,总数,男,女,快乐家庭,10,30,40,理想工作,40,10,50,增广见闻,10,0,10,总数,60,40,100,资料表明性别与志愿是非对称关系,性别为自变量,志愿为因变量,二者都是定类变量,故要应用,Lambda,系数来计算相关情况。,根据的系数公式和表1的次数资料,可知M=50,,m,=40+30=70,n=100,该统计量表明,以X解释或预测Y,可以消减40%的误差。,2、,tauY相关测量法,测量方法,tauY系数是属于不对称相关测量法,要求两个定类变量中有一个是自变量(X),另一个是因变量(Y)。系数值在0与1之间,具有消减误差比例的意义。该方法与Lamabda不同在于计算系数时,包括所有的边缘次数和条件次数。,其中:E1为不知道X而预测Y时的全部误差,E2为知道X预测Y时的误差。,n,为全部个案数目,,f,为某条件次数,,Fy,为,Y,变量的某个边缘次数,,Fx,为,X,变量的某个边缘次数。,根据表,1,的研究资料。全部样本数目(,n,)是,100,。性别是自变量(,X,),边缘次数(,Fx,)分别是,60,和,40,;志愿是因变量(,Y,),边缘次数(,Fy,)分别是,40,、,50,和,10,。表内有六个条件次数,每者都代表同属于某项,Y,值与某项,X,值的样本数目(,f,)。,这个数值不但能表示性别与志愿的相关程度,而且可以解释为以性别来预测或估计志愿,能够消减22.4%的误差。,由于tau-y测量法是考虑全部次数,故其敏感度高于Lambda测量法。,tauy=(58-45)/58=22.4%,四、两个定序变量的统计相关,计算一个定序变量与另一个定序变量的相关系数,可用Gamma系数,dy 系数,肯得尔的tau系数以及斯皮尔曼的rho系数。,1、计算中所用的基本概念(同序对、异序对、同分对),同序对,。如果某对样本在两个变量上的相对等级是相同的,则称为同序对(sameordered pair)。,异序对,。如果某对样本在两个变量上的相对等级是不相同的,则称为异序对(different-ordered pair)。,同分对,。如果两个样本在某变量上可能是同分(tie),即不能分高低,则称为同分对。,学生,成绩等级,数学,英文,A,4,2,B,3,3,C,2,1,D,1,4,四名学生的成绩等级,A与C是同序对,因为A的数学成绩等级低于C,其英文成绩也低于C同理,B与C也是同序对至于A与B则是异序对,因为A的数学成绩等级低于B,但其英文成绩高于B同理,A与D,B与D,和C与D皆是异序对综合起来,同序对有个,异序对有个,s=2,Nd=4,2、Gamma相关测量法,计算公式:,Gamma系数不考虑同分对数。公式中的分母,表示在预测或解释任何一个个案的相对等级时可能的最大误差。公式中的分子,表示以一对个案在一个变量上的相对等级来预测其在另一变量上的相对等级所能减少的误差。Gamma属于对称相关测量法。,3,、d相关测量法,计算公式:,其中Ns是同序对数,Nd是异序对数,T是只在因变量Y上同分的对数。d相关测量法属于非对称相关测量法。,G=(Ns-Nd)/(Ns+Nd),D=(Ns-Nd)/(Ns-Nd+Ty),工厂,工人积极性与产量,积极性等级,产量等级,A,5,5,B,3,3,C,4,1,D,1.5,3,E,1.5,3,4、肯德尔的tau系数,肯德尔的,tau,系数可分三种形式,分别称为,tau-a,,,tau-b,,,tau-c,,都是适用于分析对称的关系。其基本逻辑是计算同序对数与异序对数之差在全部可能对数中所占的比例,如何选用这三种系数呢?,1、,如果在两个变量上都没有同分对,则使用,tau-a,,该系数值是由,-1,+1,。,2、,如果有同分对,且在交叉分组表行数与列数相同(即,r=c,)的情况下,可用,tau-b,,其系数值是由,-1,+1,。,3、tau-c,则不考虑是否有同分对,也不考虑行数与列数是否相等,其系数值在,-1,+1,之间。,Tau-c,系数适合于社会科学研究,因为社会科学研究在问卷的设计时,不一定各个问题的选项都相同,在做交叉分析时,表的大小无一定规则,同时表中常有很多同分对。,其中,Ns是同序对,Nd是异序对,n是全部个案数目,m是交互分类表的行数(r)与列数(c)中的较小者。,5、斯皮尔曼rho系数,斯皮尔曼rho系数也称等级相关系数,其特点是在计算每个个案在两个变量上的等级时,不仅要区别二者的高低差异,而且还要计算二者差异的确切数值。,该方法的特点是:1、是对称相关测量法,其统计值在-1+1之间;2、该值具有消减误差比例的意义。,十个乡的经济水平与卫生水平,乡名,经济,卫生,D,D平方,A,1,1,0,0,B,2,3,-1,1,C,3,4,-1,1,D,4,5,-1,1,E,5,8,-3,9,F,6,6.5,-0.5,0.25,G,7,9.5,-2.5,6.25,H,8.5,6.5,2,4,I,8.5,9.5,-1,1,J,10,2,8,64,五、两个定距变量的相关,如果所研究的变量都属于定距测量层次,可以用简单线性回归分析法测算以自变量的数值预测或估计因变量的数值,也可以用积距相关系数来测量两个变量的相关程度。,1、简单线性回归分析,简单线性回归分析就是根据一个直线方程式,以一个自变量(X)的数值来预测一个因变量(Y)的数值。这个方程式表示为:Y1=a+bX,由于实际值是Y,则预测误差便是:e=Y-Y1。将全部样本个案的各个e相加起来就是误差总数,但这样做的结果会引起正负值相抵消的问题。为了克服“正负抵消”问题,我们将e的平方值相加起来,再使之最小,这就是所谓的“最小二乘法准则”。,通过求极值得到b解:,r=,2、积距相关测量法,尽管通过b值的作用,使我们能够以X的变化来预测Y的变化。但由于b值没有上限,难以判断变量之间的相关强弱。因此需要应用皮尔逊(pearson)的积距相关系数(r),公式如下:,r系数与b系数的区别,是r系数假定X与Y的关系是对称的,而且r的统计值是由-1至+1,同时r的平方值具有消减误差的意义。这个r值,称为决定系数。,六、定类与定距、定类与定序、定序与定距 变量的相关,1、定类与定距相关比率测量法(Eta),相关比率是测量一个定类变量与一个定距变量相关关系的方法。其中定类变量为自变量(X),定距变量为因变量(Y)。相关比率就是根据自变量的每一个值来预测或估计因变量的均值。Eta系数值是由0到1,其平方值具有消减误差比例的意义。,2、定类与定序Lambda,tauy系数,3、定序与定距相关比率,语,文,水,平,职业种类,干部,工人,农民,78,52,83,82,59,75,91,73,82,90,61,78,85,80,80,81,51,83,64,54,样本数,7,8,5,均值,84.29,61.75,79.60,标准差,4.40,9.64,2.87,例:语文水平与职业的关系,上表是研究,20,名学生的家庭职业背景,(,分为干部,工人和农民三类对其语文能力,(,由,0,至,100,分,),的影响,.,家庭职业背景是自变量,属于定类测量层次,.,而语文水平是因变量,属于定距测量层次,故可用,Eta,统计量,.,六、偏相关系数,1、概念,在多元回归分析中,其他变量被固定后,给定的任意两个变量之间的相关系数,叫偏相关系数。,在因果分析中,控制第三类变量以后,两个变量的相关系数也称偏相关系数。,2、计算公式,偏相关系数属于对称相关测量法的一种,它要求变量间是直线关系,且所有变量都必须是定距变量。,假定我们所研究的两个变量,X,与,Y,,如果控制一个变量,W,,则偏相关系数的计算公式如下,:,公式1左边的符号表示在控制,W,变量以后,,X,与,Y,的净相关(下标中的小点表示控制),而公式1右边的各个,r,就是两个变量之间的积矩相关。分子中的第一项表示,X,与,Y,的相关程度,第二项分别表示,X,、,Y,与控制变量之间的相关关系。公式2、3表示同时控制两个或两个以上的第三变量,X与Y的净相关。如此类推,可以同时控制更多的第三类变量。公式1也称为一阶相关,公式2称为二阶相关,等等。,例题4:利用偏相关系数分析27个村工业化程度与人均耕地面积和距离城市远近的关系。,27个村的工业化程度、耕地人口比例和距城远近,村,工业人口(%),每人耕地(亩),离城距离,1,17.5,0.75,2.5,2,9.1,1.24,2.7,3,8.9,1.25,4.9,4,7.8,1.15,4.0,5,7.8,1.05,0.7,6,7.8,0.69,2.8,7,7.4,1.21,3.4,8,7.1,1.02,4.3,9,6.5,1.15,1.8,10,6.2,1.03,1.0,11,5.8,1.54,10.8,12,4.9,1.02,1.5,13,4.6,1.48,7.3,14,4.3,1.24,6.3,15,3.9,1.32,7.8,16,3.9,1.36,13.2,17,3.8,1.37,4.5,18,3.1,1.30,7.2,19,2.8,0.99,4.0,20,2.7,1.21,3.4,21,2.3,1.07,4.3,22,2.3,1.22,7.2,23,2.2,1.34,7.2,24,1.8,1.45,6.0,25,1.0,1.56,5.7,26,0.8,1.39,10.4,27,0.5,1.44,7.2,从理论上讲,村的工业化程度与耕地面积有较强的负相关性。如果村中人均耕地面积多,就没有迫切的需要和剩余的人力来发展工业,相反,如果地少人多,就具有发展工业的迫切性与可能性。二者的相关关系为-0.64,能够验证理论。,如果考虑到村子距城镇距离远近这个因素,上述关
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!