常用统计参数课件

上传人:无*** 文档编号:241298064 上传时间:2024-06-16 格式:PPT 页数:134 大小:635.50KB
返回 下载 相关 举报
常用统计参数课件_第1页
第1页 / 共134页
常用统计参数课件_第2页
第2页 / 共134页
常用统计参数课件_第3页
第3页 / 共134页
点击查看更多>>
资源描述
第二章:常用第二章:常用统计参数参数主主讲:任杰:任杰1a统计量量n统计量量:反映一反映一组数据(数据(样本本)统计特特征的数字。征的数字。n参数参数:反映反映总体体的的统计特征的数字叫参特征的数字叫参数。数。n统计量和参数的量和参数的统计意意义是相同的,是相同的,计算原理和方法算原理和方法也是相同的,只是在指代也是相同的,只是在指代不同不同对象象时叫法不同,表示方法不同。叫法不同,表示方法不同。2024/6/162a2024/6/163a一、集中量数一、集中量数n集中量集中量:即表即表现一一组数据的集中数据的集中趋势或或集中程度,代表一集中程度,代表一组数据的数据的中心位置中心位置的的统计量。量。2024/6/164a集中量集中量算算术平平均均数数加加权平均数平均数中中数数众众数数几几何何平平均均数数2024/6/165a(一)算(一)算术平均数平均数1、算、算术平均数平均数:一般一般简称称为平均数或均数平均数或均数(Mean),一),一组数据的数据的总和除以数据的和除以数据的总个数所得的商就是算个数所得的商就是算术平均数。平均数。n学算学算术平均数常用代表平均数常用代表变量的字母上加量的字母上加一一“”来表示,如来表示,如2024/6/166a2、算、算术平均数的平均数的计算算假假设一一变量量X共有共有n个个观测值,则变量量X的的平均数平均数为:2024/6/167a3、算、算术平均数的性平均数的性质n在一在一组数据中每个数据中每个观测值与平均数之差与平均数之差(离均差)的(离均差)的总和等于和等于0。n在一在一组数据中,每一个数据中,每一个观测值都加上一都加上一个常数个常数C C,则所得平均数所得平均数为原来的平均原来的平均数加上常数数加上常数C C。n在一在一组数据中,每一个数据中,每一个观测值都乘以一都乘以一个常数个常数C C,则所得平均数所得平均数为原来的平均原来的平均数乘以常数数乘以常数C C。2024/6/168a证明明2024/6/169a4、次数分布表算次数分布表算术平均数的平均数的计算算2024/6/1610a5、算、算术平均数的意平均数的意义与与优点点n算算术平平均均数数是是应用用最最普普遍遍的的一一种种集集中中量量数,是数,是“真真值”的的渐近、最佳估近、最佳估计值。n反反应灵灵敏敏。观测数数据据中中任任何何一一个个数数值的的变化都能通化都能通过算算术平均数反平均数反应出来。出来。n确确定定严密密。只只要要是是同同一一组数数据据,计算算出出来来的的算算术平平均均数数不不受受计算算者者、时间、地地点等因素的影响。点等因素的影响。2024/6/1611a2024/6/16第二章:常用统计参数125、算、算术平均数的意平均数的意义与与优点点n简明明易易解解。原原理理简单易易懂懂,计算算简便便易易行。行。n符合代数方法符合代数方法进一步演算一步演算。n较少少受受抽抽样变动的的影影响响。从从同同一一个个总体体中中随随机机抽抽取取的的容容量量相相同同的的样本本,所所计算算出出的的算算术平平均均数数与与其其他他集集中中量量指指标相相比比,抽抽样误差差较小。小。12a6、算、算术平均数平均数应用的局限用的局限n易受易受极端数据极端数据的影响。的影响。n若若有有模模糊糊不不清清的的数数据据,则无无法法计算算平平均均数。数。n凡凡不不同同质的的数数据据不不能能计算算平平均均数数。(同同质数数据据是是指指用用同同一一个个观测手手段段,采采用用相相同同的的观测标准准,能能反反映映某某一一问题的的同同一一方面特方面特质的数据。)的数据。)2024/6/1613a(二)中数(二)中数1、中中数数,又又叫叫中中位位数数,符符号号为Md或或Mdn(Median),指指的的是是位位于于一一组数数据据中中较大大一一半半与与较小小一一半半中中间位位置置的的那那个数。个数。n中中数数可可能能是是观测数数据据中中的的某某一一个个,也也可可能根本不是原有的数。能根本不是原有的数。2024/6/1614a2、未分、未分组数据中数的数据中数的计算算A、将数据依将数据依值的大小排序的大小排序B B、如如果果位位于于数数据据序序列列中中间的的几几个个数数不不重重复复,按以下方法,按以下方法计算算中数中数:1 1)当当数数据据的的个个数数为奇奇数数时,取取位位于于中中间的的那个数即第(那个数即第(N+1)/2个数个数为中数;中数;2 2)当当数数据据的的个个数数为偶偶数数时,取取第第N/2个个和和第第N/2+1个数个数的平均数的平均数为中数。中数。2024/6/1615aC C、如果位于数据序列中、如果位于数据序列中间的是几个的是几个重复数据重复数据,则按以下方法按以下方法计算中数:算中数:1 1)把重复数据)把重复数据视作某一区作某一区间上的几个上的几个连续的数;的数;2 2)根据)根据B B步步骤的的计算方法,中数落在哪一个数上,算方法,中数落在哪一个数上,则该数的中点就是此一列数据的中数;数的中点就是此一列数据的中数;3 3)如果中数落在两个重复数据之)如果中数落在两个重复数据之间,则前一个前一个重复数据的精确上限或后一个数据的精确下重复数据的精确上限或后一个数据的精确下限即限即为要求的中数。要求的中数。2024/6/1616an2、4、5、7、8、9、9、11、13n2、4、5、5、7、8、9、9、11、13n2、4、5、5、8、9、9、9、11、1212、13n2、4、5、5、8、9、9、9、11、1212、13、172024/6/1617a3 3、次数分布表中数的次数分布表中数的计算算A、求求N/2,找找出出N/2即即中中数数所所在在的的分分组区区间;B、求求N/2所所在在区区间以以下下各各区区间的的次次数数和和(即即中中数数所所在在组区区间下下限限以以下下的的累累加加次次数),数),记作作Fb b;C、计算算N/2FbFb的的值;D D、求位于、求位于N/2N/2点的点的值2024/6/1618a2024/6/1619a其中:其中:nL Lmdmd为N/2N/2所在区所在区间的精确下限的精确下限ni i为组距距nf fmd md 为中数所在区中数所在区间的次数的次数 2024/6/1620a组别组中中值(Xc)次数次数(f)相相对次数次数上限以下累上限以下累积百分数百分数42.5-4510.0333.347.5-5030.10013.352.5-5530.10023.357.5-6030.10033.362.5-6540.13346.667.5-7040.13359.972.5-7580.26786.677.5-8030.10096.682.5-8510.034100.0总和和()N=301.0002024/6/1621a4、中数的意、中数的意义与与应用用n优点点:计算算简单,容易理解。,容易理解。n不不足足:反反应不不够灵灵敏敏;受受抽抽样的的影影响响较大大,不不稳定定;也也不不能能作作进一一步步的的代代数数运运算。算。2024/6/1622a4、中数意、中数意义与与应用用n应用用:中中数数一一般般不不经常常使使用用,但但在在下下列列情情况况下,中数可以下,中数可以较好地反映数据的集中好地反映数据的集中趋势:A A当一当一组观测结果中出果中出现两极端数据两极端数据时;B B当当次次数数分分布布的的两两端端数数据据或或个个别数数据据不不清清楚楚时,只只能取中数作能取中数作为集中集中趋势的代表的代表值;C C当当需需要要快快速速估估计一一组数数据据的的代代表表值时,也也常常用用中中数。数。2024/6/1623a(三)众数(三)众数1、众众数数:又又叫叫范范数数,密密集集数数,通通常常数数等等,常常用用符符号号Mo o表表示示,是是指指一一组数数据据中中出出现次数最多的那个数(次数最多的那个数(Modeode)。)。2024/6/1624a2、众数的、众数的计算算n求众数最求众数最简单的方法是通的方法是通过直接直接观察找察找出出粗略众数粗略众数。n也可以用公式求出理也可以用公式求出理论众数,众数,皮皮尔逊经验法法是常用的是常用的计算正算正态分布数据理分布数据理论众众数的方法,其公式数的方法,其公式为:Mo=3Md-2M2024/6/1625a3、众数的、众数的应用用众数的众数的缺点缺点同中数一同中数一样,其,其应用也因此受用也因此受到限制,通常是在无法到限制,通常是在无法计算平均数的情算平均数的情况下,用以了解一况下,用以了解一组数据的集中情况,数据的集中情况,如存在极端数据、有模糊数据、有不同如存在极端数据、有模糊数据、有不同质数据等。数据等。2024/6/1626a(四)加(四)加权平均数平均数1、加加权平平均均数数是是用用来来表表示示不不同同比比重重数数据据、或或平均数平均数的平均数,用的平均数,用 或或Mw表示。表示。n当当数数据据的的比比重重不不同同时,如如果果直直接接用用算算术平平均均数数来来表表示示该组数数据据的的集集中中趋势,就就不不够科科学学和和准准确确,这时就就要要用用权数数(weightweight),即即该数数据据在在整整个个数数据据总体体中的相中的相对重要性来重要性来计算平均数。算平均数。2024/6/1627a2、加、加权平均数的平均数的计算算2024/6/1628a3、加、加权平均数的平均数的应用用大学大学课程成程成绩的的计算算大学生大学生综合合测评成成绩的的计算算不同分不同分实验(调查)结果的会合果的会合等等等等2024/6/1629a(五)几何平均数(五)几何平均数1 1、几几何何平平均均数数(geometric geometric meanmean):又又叫叫对数平均数数平均数,符号,符号记作作MgMg或或 。2024/6/1630a2 2、几何平均数的、几何平均数的应用条件用条件n一一组实验数数据据中中有有少少数数数数据据偏偏大大或或者者偏偏小,数据的分布呈小,数据的分布呈偏偏态时;n心心理理物物理理学学实验中中,用用等等距距和和等等比比量量表表测量所量所获得的数据;得的数据;n一一组数数据据彼彼此此间差差异异较大大,几几乎乎是是按按一一定定的的比比例例关关系系变化化时,如如教教育育研研究究中中教教育育经费的增加、学校每年的招生人数等。的增加、学校每年的招生人数等。2024/6/1631a3、几何平均数的、几何平均数的计算算2024/6/1632an上式中,上式中,n代表数据的个数;代表数据的个数;n几何平均数有两种情况:一种是几何平均数有两种情况:一种是实验直直接接观测值的平均数的平均数(如心理物理(如心理物理实验中中所所获得的数据,此得的数据,此时用公式用公式A,A,P36P36);一种是指数据的平均一种是指数据的平均变化率化率(如人口的(如人口的增增长率、学率、学习能力的能力的进步率等,此步率等,此时用用公式公式B B)。2024/6/1633a练习一研究一研究阅读能力随能力随阅读遍数遍数变化的化的实验结果如下:果如下:第一遍,理解成分第一遍,理解成分为40%第二遍,理解成分第二遍,理解成分为52%第三遍,理解成分第三遍,理解成分为65%第四遍,理解成分第四遍,理解成分为75%第五遍,理解成分第五遍,理解成分为86%第六遍,理解成分第六遍,理解成分为97%求求阅读能力随能力随阅读遍数的遍数的平均增加比率平均增加比率。2024/6/1634a二、二、离散量离散量n离散量离散量:反映一反映一组数据数据离散离散趋势或离散或离散程度程度的的统计量,用来表示一量,用来表示一组数据的分数据的分散情况。散情况。n次数分布的两个基本特征次数分布的两个基本特征:中心位置中心位置与与离散性离散性2024/6/1635a图例2024/6/1636a离散量离散量方方差差与与标准准差差标准分数准分数全全距距平平均均差差差差异异系系数数离散量的种离散量的种类n相相对差差异量异量n绝对差异量差异量2024/6/1637a(一)全距(一)全距n全距全距:即一:即一组数据中最大数据中最大值与最小与最小值的的差。常用大写字母差。常用大写字母R表示。表示。(Range=Max-Min)n用全距表示一用全距表示一组数据的离散程度是非常数据的离散程度是非常粗略粗略和和不准确不准确的。的。2024/6/1638a(二)平均差(二)平均差n平均差平均差:每一个:每一个观测值与平均数的距离与平均数的距离的和的平均。用的和的平均。用AD(average deviation)表示。)表示。2024/6/1639a平均差的平均差的应用用n平平均均差差是是用用来来表表示示一一组数数据据离离散散程程度度的的较好的好的差异量数,差异量数,反反应灵敏,确定灵敏,确定严密密。n缺缺点点是是在在计算算时要要取取绝对值,不不利利于于代代数数方方法法的的运运算算;也也不不利利于于进一一步步的的统计分析。分析。2024/6/1640a(三)方差与(三)方差与标准差准差1、基本定、基本定义n方方差差(Variance):也也叫叫变异异数数、均均方方,是是每每个个观测值与与该组数数据据的的平平均均数数之之差差平平方方后后和的均和的均值,即,即离均差平方和的平均数离均差平方和的平均数。n样本本方方差差和和总体体方方差差的的计算算方方法法和和含含义是是一一致致的的,但但符符号号不不同同,前前者者用用S2表表示示,后后者者用用2表示。表示。n标准差(准差(Standard deviation):即:即方差的平方差的平方根方根,样本方差常用符号本方差常用符号S或或SD表示,表示,总体体方差方差则用用表示。表示。2024/6/1641a2、方差与、方差与标准差的准差的计算公式算公式2024/6/1642a练习试推推导用原始数据用原始数据计算方差和算方差和标准差的公准差的公式。式。2024/6/1643a计算并思考算并思考计算算下下列列四四组数数据据的的平平均均数数,并并找找出出每每组数数据据的最大的最大值和最小和最小值:A7、7、8、8、8、9、9B4、5、7、8、9、11、12C1、4、7、8、9、12、15D 1、8、8、8、8、8、15n思考:思考:这四四组数据有什么不同?数据有什么不同?n仅仅用用平平均均数数能能不不能能反反映映这组数数据据的的所所有有特特性?性?为什么?什么?2024/6/1644a3、标准差的性准差的性质n一一组数据的每一个数据的每一个观测值都加上一个常都加上一个常数数C,其,其标准差不准差不变。n一一组数据的每一个数据的每一个观测值都乘以一个常都乘以一个常数数C,其,其标准差准差为原原标准差乘以准差乘以常数常数C。2024/6/1645a证明并思考明并思考n试证明上述明上述标准差的性准差的性质并思考在每种并思考在每种情况下数据情况下数据分布形分布形态的的变化化。2024/6/1646a4、方差与、方差与标准差的意准差的意义n方方差差与与标准准差差是是表表示示一一组数数据据离离散散程程度度的的最好指最好指标,具有以下,具有以下优点:点:n反反应灵灵敏敏,每每个个数数据据取取值的的变化化,方方差差与与标准差都会随之准差都会随之变化;化;n有一定的有一定的计算公式算公式严密确定密确定;n容易容易计算并适合代数运算算并适合代数运算;2024/6/1647a4、方差与、方差与标准差的意准差的意义n受抽受抽样变动的影响小的影响小;n具有可加性具有可加性,因此可以分解并确定出属于,因此可以分解并确定出属于不同来源的不同来源的变异性异性,并可,并可进一步一步说明每种明每种变异异对总结果的影响,是以后果的影响,是以后统计推推论部部分常用的分常用的统计特征数。特征数。2024/6/1648a(四)(四)标准分数及其准分数及其应用用1、标准分数(准分数(Standard Score):又称又称基基分数分数或或Z分数分数,是以,是以标准差准差为单位位表示表示一个分数在一个分数在团体中所体中所处位置的位置的相相对位置位置量数量数。2024/6/1649a2、标准分数的准分数的计算算n其中:其中:Xi代表原始分数代表原始分数n 为一一组数据的平均数数据的平均数nS为标准差。准差。2024/6/1650a例子例子n计算算B B组各数据的各数据的Z Z分数及其和分数及其和2024/6/1651a3、Z分数的性分数的性质n在在一一组数数据据中中,所所有有由由原原分分数数转换得得出出的的Z分分数数之之和和为0,其其Z分分数数的的平平均均数数也也为0。n一一组数据中各数据中各Z分数的分数的标准差准差为1。2024/6/1652a4、Z分数的分数的应用用nZ分分数数可可用用于于比比较一一组数数据据中中的的观测值在在该组数数据据中中的的相相对位位置置,并并可可根根据据Z分分数数的的大大小小判判断断该数数据据距距离离中中心心位位置置的的远近。近。2024/6/1653a4、Z分数的分数的应用用nZ分分数数可可用用于于比比较性性质不不同同的的观测值在在各自数据分布中各自数据分布中相相对位置的高低位置的高低。例例子子:我我市市3 3岁幼幼儿儿的的平平均均身身高高为9090公公分分,标准准差差为2020公公分分;平平均均体体重重为1010公公斤斤,标准准差差为5 5公公斤斤。现有有一一3 3岁幼幼童童身身高高100100公公分分,体体重重1515公公斤。斤。问该儿童是身高偏高?儿童是身高偏高?还是体重更偏重?是体重更偏重?2024/6/1654a4、Z分数的分数的应用用n当已知同一当已知同一样本或本或对象象各不同各不同质的的观测值的次数分布的次数分布为正正态时,可用,可用Z分数求分数求不同的不同的观测值的的总和或平均和或平均值。例子:甲、乙、丙三生的某四例子:甲、乙、丙三生的某四门功功课的成的成绩如如下表,下表,试问三生的三生的总体学体学习成成绩孰孰优孰劣?孰劣?2024/6/1655a课程程A课程程B课程程C课程程D甲甲81807278乙乙94649091丙丙72606774全班平全班平均成均成绩72.969.46772.6标准差准差12.713.21411.42024/6/1656a4、Z分数的分数的应用用nZ分数可用来表示分数可用来表示标准准测验的分数。的分数。经过标准准化化的的心心理理与与教教育育测验,如如果果其其常常模模分分数数分分布布接接近近正正态分分布布,常常常常转换成成正正态标准准分分数数,能能更更清清楚楚地地表表明明某某一一分分数在相数在相应团体中的位置体中的位置。2024/6/1657a其其转换公式公式为:Z=aZ+b其中:其中:Z为正正态标准分数准分数 a、b为常常数数,通通常常为该测验总的的标准准差差和和总平均数平均数,有有时也用也用经验分数。分数。X为原分数原分数 为某某团体(或年体(或年龄组)的平均分数的平均分数 S S为该团体或年体或年龄组的的标准差准差2024/6/1658a一些一些测验的常模的常模Z分数分数 0,12T分数分数 50,102GRE,SAT500,1002WechlerIQ100,152SbIQ100,1622024/6/1659a练习并并证明明n例一:某校大二学生分属三个学院,全部参例一:某校大二学生分属三个学院,全部参加了某次英加了某次英语四四级考考试,其成,其成绩见下表,下表,试计算算该校大二学生校大二学生CET-4平均成平均成绩和和总的的标准差。并找出准差。并找出计算算总标准差的通用公式。准差的通用公式。学院学院A学院学院B学院学院C平均数平均数747065标准差准差251030人数人数100120802024/6/1660a方差的可加性方差的可加性证明明2024/6/1661a方差的可加性方差的可加性证明明n在上式中,在上式中,总的方差(的方差(变异)被分成两异)被分成两部分,前一部分可看作是部分,前一部分可看作是组内方差或内方差或由由组内原因引起的内原因引起的变异异(如被(如被试内的差异)内的差异);后一部分可看作是;后一部分可看作是组间的方差或由的方差或由不不同的同的组引起的引起的变异异(如(如实验中不同的中不同的变量)量)。2024/6/1662a方差的可加性方差的可加性证明明n因因此此,标准准差差是是反反映映一一组数数据据离离散散程程度度的的高高效效差差异异量量。对于于两两组同同质的的数数据据来来说,要要比比较它它们之之间的的离离散散程程度度,就就要要用用标准准差差的的大大小小来来衡衡量量,标准准差差大大,说明明该组数数据据较分分散散,标准准差差小小,说明明该组数据数据较集中。集中。2024/6/1663a例例二二:试分分析析例例一一中中三三个个学学院院CET-4成成绩分布的分散程度。分布的分散程度。例例三三:已已知知某某小小学学一一年年级学学生生的的平平均均体体重重为25公公斤斤,体体重重的的标准准差差为3.7公公斤斤,平平均均身身高高为110厘厘米米,身身高高标准准差差为6.2厘厘米米,问身身高高与与体体重重的的离离散散程程度度哪哪一一个个大?大?2024/6/1664an利用利用标准差准差进行比行比较是有是有严格条件的:格条件的:即即进行比行比较的数据的数据组是是对同一特同一特质用用同同一种一种测量工具量工具进行行测量而量而获得的,并且得的,并且样本的本的总体之体之间差异不大差异不大,即,即样本平均本平均数差异不大。数差异不大。n这是一个是一个绝对差异量。差异量。2024/6/1665a(五)差异系数(五)差异系数n这样,如如果果两两个个样本本水水平平相相差差较大大,就就要借助要借助相相对差异量差异量来来进行比行比较。n最常用的相最常用的相对差异量就是差异量就是差异系数差异系数。1 1、差差异异系系数数:又又叫叫变异异系系数数、相相对标准准差差等等,通通常常用用符符号号CV表表示示。其其计算算公公式如下:式如下:2024/6/1666a2、差异系数的、差异系数的应用条件用条件n同同一一团体体不不同同特特质观测值离离散散程程度度的的比比较;n进行行的的是是同同一一种种观测,但但水水平平相相差差较大大的的各各种种团体体,进行行观测值离离散散程程度度的的比比较;n此此外外,适适用用于于用用差差异异系系数数进行行比比较的的测量量值最最好好是是比比率率变量量,如如重重量量、长度度、时间和和编制得好的制得好的测验量表。量表。2024/6/1667a例例四四:今今有有一一画画线实验,标准准线分分别为5厘厘米米及及10厘厘米米,实验结果果5厘厘米米组的的误差差平平均均数数为1.3厘厘米米,标准准差差为0.7厘厘米米;10厘厘米米组的的误差差平平均均数数为4.3厘厘米米,标准准差差为1.2厘厘米米。请问,如如何何比比较其其离离散程度的大小?散程度的大小?2024/6/1668a3、差异系数的缺点、差异系数的缺点n差差异异系系数数的的缺缺点点主主要要在在于于它它只只能能用用于于一一般般的的相相对差差异异量量的的描描述述上上,至至今今尚尚无无有有效效的的假假设检验方方法法,因因此此对差差异异系系数数不不能能进行行统计推推论。2024/6/1669a三、地位量数三、地位量数n表示一个原始分数在其所表示一个原始分数在其所处分布中地位分布中地位的量数,叫地位量数。的量数,叫地位量数。n种种类:n百分位分数百分位分数n百分等百分等级分数分数n标准分数准分数nT分数分数n2024/6/1670a(一)百分位分数(一)百分位分数n把一个次数分布排序之后,分把一个次数分布排序之后,分为100个个单位,位,则某个特定百分点某个特定百分点对应的原始分的原始分数即数即为百分位分数百分位分数,它表明在次数分布,它表明在次数分布中有中有该特定百分数的数据低于特定百分数的数据低于该分数。分数。n通常用通常用P加下加下标m(代表某个特定百分(代表某个特定百分点)表示。点)表示。n如:如:P75=78代表有代表有75%的数据小于的数据小于78。2024/6/1671a(一)百分位分数(一)百分位分数n计算公式算公式2024/6/1672a(一)百分位分数(一)百分位分数2024/6/1673a(一)百分位分数(一)百分位分数n例:例:n在上表中在上表中,假假设老老师要要对全班的前全班的前15%的学生的学生进行行奖励励,请问至少要多少分才至少要多少分才能能获得得奖励励.2024/6/1674a(一)百分位分数(一)百分位分数n一些常用的百分位数一些常用的百分位数nQ1=即第即第25%点点对应的原始分数,是第的原始分数,是第一个四分位数一个四分位数nQ2,第二个四分位数,第二个四分位数nQ3,第三个四分位数,第三个四分位数nQ3-Q1=QD,叫,叫四分位距四分位距,是比全距更,是比全距更好的离散量指好的离散量指标。2024/6/1675a(二)百分等(二)百分等级分数分数n某个已知原始分数在其所某个已知原始分数在其所处分布中的相分布中的相对位置叫位置叫百分等百分等级分数分数。n通常用通常用PR表示。表示。2024/6/1676a(二)百分等(二)百分等级分数分数n计算公式算公式2024/6/1677a(二)百分等(二)百分等级分数分数n例:例:n在上表中在上表中,假假设某位学生考了某位学生考了76分,分,请问全班有多少人排在他的前面?全班有多少人排在他的前面?2024/6/1678a百分位分数与百分等百分位分数与百分等级分数分数n二者都是用来表示个体在二者都是用来表示个体在团体中的相体中的相对地位;地位;n计算算过程相反,一个是由百分数程相反,一个是由百分数计算原算原始分数,另一个是由原始分数始分数,另一个是由原始分数计算百分算百分数。数。2024/6/1679a次数分布的分布形次数分布的分布形态n正正态分布与偏分布与偏态分布分布n正正态分布分布(normal distribution):以平均数):以平均数为中心位置的中心位置的对称分布。称分布。n偏偏态分布(分布(skewed distribution):非):非对称分布。称分布。n正偏正偏态分布分布(positive skewed):次数分布中低分数):次数分布中低分数偏多,尾部在高分端(右端),也叫右偏分布。偏多,尾部在高分端(右端),也叫右偏分布。n负偏偏态分布分布(negative skewed):次数分布中高分数):次数分布中高分数偏多,尾部在低分端(左端),也叫左偏分布。偏多,尾部在低分端(左端),也叫左偏分布。2024/6/1680a图例2024/6/1681a图例2024/6/1682a次数分布的分布形次数分布的分布形态n不同分布中平均数、中数及众数之不同分布中平均数、中数及众数之间的关系:的关系:分布分布关系关系正正态分布分布M=Md=Mo正偏正偏态分布分布MMd Mo负偏偏态分布分布MMd Mo2024/6/1683a练习2024/6/1684a2024/6/1685a2024/6/1686a2024/6/1687a2024/6/1688a2024/6/1689a2024/6/1690a四、相关分析四、相关分析(一)基本概念(一)基本概念1、相关与相关分析、相关与相关分析v相相关关:即即两两类现象象在在发展展变化化的的方方向向与与大小大小方面存在一定的关系。方面存在一定的关系。v相相关关分分析析:用用一一些些合合理理的的指指标对相相关关事事物物的的观测值进行行统计分分析析,以以判判断断两两事事物相关的程度,称物相关的程度,称为相关分析。相关分析。2024/6/1691a2、相关、因果、共、相关、因果、共变因果关系因果关系:一种:一种现象是另一种象是另一种现象的因,另象的因,另一种一种现象象则是果。是果。共共变关系关系:即表面看起来有:即表面看起来有联系的两种事物系的两种事物都与都与第三种第三种事物有关。也就是事物有关。也就是说这两种事物两种事物之之间的关系并不是一种的关系并不是一种实质性性的关系,而是的关系,而是因因为它它们都与第三者有关,才具有的都与第三者有关,才具有的表面上表面上的关系。的关系。相关关系内也可能包含因果关系或共相关关系内也可能包含因果关系或共变关系,关系,但但仅从相关程度不能作出判断从相关程度不能作出判断。2024/6/1692a3、相关的种、相关的种类v根根据据具具有有相相关关关关系系的的两两个个变量量在在变化化方方向向和大小和大小上的关系,可以把相关分上的关系,可以把相关分为三三类:v负相关相关:v即即两两个个变量量变化化的的方方向向相相反反,也也就就是是说,一一个个变量量变动时,另另一一个个变量量也也发生生变动但但方方向正好与前一向正好与前一变量的方向相反。量的方向相反。2024/6/1693a3、相关的种、相关的种类v正相关正相关:v即即两两个个变量量变化化的的方方向向相相同同,也也就就是是说,一一个个变量量变动时,另另一一个个变量量也也同同时发生生或大或小与前一或大或小与前一变量同方向的量同方向的变动。v零相关零相关:v即即两两列列变量量之之间没没有有关关系系,也也就就是是说两两个个变量量的的变动在在方方向向和和大大小小方方面面没没有有任任何何关关系,二者是系,二者是独立的随机独立的随机变量量。2024/6/1694a4、相关系数、相关系数q相关系数相关系数:用来表示两个具有相关关系:用来表示两个具有相关关系的的变量之量之间相关程度的数相关程度的数值。q通常通常样本的相关系数用本的相关系数用r(relationship)表表示。示。q总体的相关系数用体的相关系数用表示。表示。2024/6/1695a例一例一n现测得十名女模特的身高和体重得十名女模特的身高和体重见下表下表,请问模特的身高和体重之模特的身高和体重之间的相互关系如的相互关系如何何?(身高身高单位位为厘米厘米;体重体重单位位为公斤公斤)2024/6/1696a巴西21岁女模特安娜卡罗琳雷斯顿 2024/6/1697a模特模特12345678910身高身高174 170165172176178168183 170160体重体重40504449656144655244干瘦干瘦型身型身高高183 180177174156165159171 168162体重体重848076724860526864562024/6/1698a5、协方差(方差(Covariance)其中其中n为成成对的的变量数量数2024/6/1699a协方差的含方差的含义通通过两两变量量离离均均差差乘乘积的的大大小小和和取取值的的正正负,能能够反反映映出出此此两两列列变量量的的变动在在方方向向和和大大小小上上的的关关系系,即即能能够反反映映两两变量相互之量相互之间的关系。的关系。思思考考:协方方差差在在表表示示两两变量量相相关关程程度度上上有有什么局限?什么局限?2024/6/16100an在上例中,若把身高的在上例中,若把身高的单位位换算算为米,米,再再计算身高和体重的算身高和体重的协方差,方差,这时的的协方差和上一个方差和上一个协方差有什么不同?方差有什么不同?n造成造成这种差异的原因是什么?种差异的原因是什么?n这说明了什么明了什么问题?2024/6/16101a协方差的缺陷方差的缺陷协方差是有方差是有单位位的。的。两两变量量的的测量量单位位不不同同,协方方差差的的单位位也也是是不不同同的的,而而且且任任何何一一个个变量量的的测量量单位位的的变化化,都都会会引引起起协方方差差的的值的的变化化,因此因此协方差是方差是不不稳定定的。的。思考:如何克服思考:如何克服协方差的方差的这一缺点?一缺点?2024/6/16102a(二)(二)积差相关差相关v英英国国的的统计学学家家皮皮尔逊(Pearson)于于20世世纪初初提提出出了了积差差相相关关概概念念,用用来来计算算线性性关系的两列关系的两列变量的相关程度。量的相关程度。2024/6/16103a1、积差相关系数的差相关系数的计算算2024/6/16104a用原始数据用原始数据计算算2024/6/16105a例二例二:完全正相关与完全完全正相关与完全负相关相关X1516171819Y2223242526Z2625242322P34353436352024/6/16106a2、相关系数的性、相关系数的性质相关系数的取相关系数的取值范范围为-1r1。相关系数取相关系数取值的正的正负号表示相关的方向。号表示相关的方向。取取值大小大小仅表示两表示两变量相关的程度。量相关的程度。相相关关系系数数只只是是一一个个比比率率,没没有有单位位也也不不是是等等距的度量距的度量值,不能,不能进行代数运算。行代数运算。相相关关系系数数只只能能描描述述两两个个变量量之之间的的变化化方方向向同同密密切切程程度度,并并不不能能揭揭示示二二者者之之间的的内内在在本本质联系系。2024/6/16107a3、积差相关的适用范差相关的适用范围v两两变量的数据都量的数据都为等距或等比等距或等比数据;数据;v两两变量量所所代代表表的的总体体的的分分布布形形态都都为正正态分布分布或或接近接近正正态分布;分布;v两两变量之量之间的关系是的关系是直直线性性的;的;v要要排除排除共共变因素的存在;因素的存在;v样本的容量本的容量n30。2024/6/16108a问题与思考与思考v如何判断如何判断总体分布的形体分布的形态?v如何确定两如何确定两变量量为线性关系?性关系?v如何排除共如何排除共变关系的存在?关系的存在?2024/6/16109a相关散点相关散点图的的绘制制v方方法法一一:对于于两两变量量X、Y,以以X为横横坐坐标,Y为纵坐坐标画画一一直直角角坐坐标系系,以以两两变量量的的成成对测量量值(X,Y)在在坐坐标系系内描点,即构成内描点,即构成相关散布相关散布图。v方方法法二二:先先计算算两两变量量X、Y的的每每一一个个测量量值的的Z分分数数,以以Z分分数数为坐坐标,以以成成对的的(ZX,ZY)在在坐坐标系系内内描描点点,即可得到更清楚的相关关系散点即可得到更清楚的相关关系散点图。2024/6/16110a2024/6/16111a例三例三被被试12345678910X(排名)排名)45.59732815.510Y(排排名)名)105861.5371.5492024/6/16112a(三)斯皮(三)斯皮尔曼曼(Spearman)等等级相关相关1、适用条件:、适用条件:只有只有两列等两列等级变量量两两变量是量是线性性关系关系非正非正态分布分布的等距或比率的等距或比率变量量2024/6/16113a2、计算方法算方法2024/6/16114a思考思考n等等级相关和相关和积差相关的关系?差相关的关系?2024/6/16115a3、积差相关与等差相关与等级相关相关v等等级相关是相关是积差相关的差相关的特例特例v二者可以二者可以互相推互相推导v等等级相关引相关引进了了计算算误差,没有差,没有积差相差相关精确,关精确,能能够用用积差相关差相关计算的数据一算的数据一定不能用等定不能用等级相关相关计算。算。2024/6/16116a用等用等级序数求相关序数求相关2024/6/16117a例四例四被被评者者评价者价者12345678910红3523443243橙橙6676757766黄黄5457664454绿1112222112青青4344335635蓝2231111321紫紫77655765772024/6/16118a(四)肯德(四)肯德尔W系数系数又又叫叫肯肯德德尔和和谐系系数数(the Kendall coefficient of concordance),用用rW表表示。示。2024/6/16119a1、适用条件、适用条件两列以上两列以上等等级变量之量之间的相关程度。的相关程度。在心理与教育研究中,肯德在心理与教育研究中,肯德尔和和谐系数系数常用来考察常用来考察评分者的一致性程度分者的一致性程度。评定有两种情况,即不同定有两种情况,即不同评定者定者对同一同一组个体的等个体的等级评定,或者同一定,或者同一评定者定者对同一个体等同一个体等级的几次的几次评定。定。2024/6/16120a2、计算公式算公式 2024/6/16121a2024/6/16122a问题与思考与思考肯德肯德尔和和谐系数的取系数的取值有什么特点?有什么特点?为什么?什么?2024/6/16123a(六)(六)质与量的相关与量的相关定定义:所:所谓质与量的相关与量的相关是指一列是指一列变量量为等比或等距的等比或等距的测量数据量数据,另一列,另一列变量量是是按性按性质划分的划分的类别(即(即名名义变量量),),这两列两列变量的相关即量的相关即质与量的相关。与量的相关。内容:点二列相关;二列相关;多系列内容:点二列相关;二列相关;多系列相关相关2024/6/16124a例五例五n现有有18个五个五岁幼儿投幼儿投掷砂袋砂袋(150克克)的成的成绩见下表下表,问性性别与投与投掷成成绩的相关情况如何的相关情况如何?序号序号123456789成成绩4.03.63.53.24.44.83.85.24.7性性别男男女女女女女女男男男男女女男男男男序号序号101112131415161718成成绩3.44.93.73.34.77.83.12.93.4性性别女女男男女女女女男男男男女女女女女女2024/6/16125a1、点二列相关、点二列相关适用条件:适用条件:属于属于测量数据的量数据的变量其量其总体分布体分布为正正态另一列另一列变量是按事物的量是按事物的性性质划分划分为两两类这类按性按性质划分划分为两两类的的变量叫量叫二分名二分名义变量。量。2024/6/16126a计算公式算公式2024/6/16127a应用用点二列相关常用于点二列相关常用于编制制是非是非题测验时评价价测验的的内部一致性内部一致性问题一一测验中某一中某一项目的目的区分度区分度即被即被试在在该项目上的成目上的成绩与与测验总成成绩之之间的相关的相关在心理与教育研究中点二列相关常用于在心理与教育研究中点二列相关常用于考察考察不同性不同性别的被的被试在某一心理在某一心理现象上象上的相关程度的相关程度(如例五如例五)。2024/6/16128a例六例六n下表下表为10名小学一年名小学一年级学生某一学生某一语言能力言能力测验结果及其期末果及其期末语文考文考试的通的通过情况情况.序号序号12345678910语言言能力能力测验95786984828655749088语文文通通过情况情况过未未过未未过过过过未未过未未过过过2024/6/16129a2、二列相关、二列相关适用条件适用条件两列两列变量都是量都是总体体为正正态分布的分布的连续变量量其中一列其中一列变量被人量被人为地划分地划分为两两类,成,成为二分二分变量量两列两列变量之量之间是是线性关系性关系样本容量本容量N802024/6/16130a计算公式算公式2024/6/16131a应用用二列相关常用于二列相关常用于对非非是非是非测验项目区分目区分度指度指标的确定的确定2024/6/16132a3、多系列相关、多系列相关适用条件适用条件:n两列两列变量都量都为正正态分布的分布的连续变量量n其中一列其中一列变量被人量被人为地分成多种地分成多种类别,即成即成为名名义变量。量。n则该两列两列变量的相关称量的相关称为多系列相关:多系列相关:若分成三若分成三类,就称,就称为三系列相关,其余三系列相关,其余类同。同。2024/6/16133a练习2024/6/16134a
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!