资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第六章教育测验的常模及其建立方法,教育测验常模的意义与类型,百分等级常模及建立方法,标准分数常模及建立方法,标准分数在我国高考中的试点应用,第六章教育测验的常模及其建立方法教育测验常模的意义与类型,测验常模的含义,测验的常模(常模)是指一个有代表性的样组在某种测验上的表现情况,或者说,是一个与被试同类的团体在相同测验上得分的分布状况与结构模式。,对于测验的常模,我们要认识到以下几点:,有代表性的样组(常模团体)是指在建立测验常模过程中实际受测被试样组,他们代表着一个有明确定义的人群。常模资料虽然是有代表性的常模团体在某个测验上的实际表现水平,但它却代表着某个总体的水平分布状况。,测验总是用来测量人的某种身心特性的。由于在实际中很难编制出严格的平行测验,况且许多同类性质的测验在结构上有着明显的差异,因此,测量同一种身心特性的测验可能是多种多样的。,测验常模的含义 测验的常模(常模)是指一个有代表性的样,常模的用途,常模是解释测验分数的参照系,它可以回答以下三个问题:,一个学生的测验成绩与其他学生的测验成绩相比如何?,一个学生在某次测验中的成绩与他(她)在其它测验中的成绩相比如何?,一个学生在一种形式测验的成绩与以前参加其它形式测验的成绩相比如何?,常模的用途 常模是解释测验分数的参照系,它可以回答以下三个,导出分数的概念,导出分数是指以常模团体的原始分数为基础,用统计学方法,导出一种新的具有特定意义的能反映个体发展在其团体中相对位置状况的分数量表或符号系统。,导出分数的概念 导出分数是指以常模团体的原始分数为基,测验常模的类型,(,1,)发展常模,发展常模就是某类个体正常发展过程中各个特定阶段的一般水平。有了它,我们就可以把某个被试的发展程度与该类群体正常发展水平进行比较。发展常模有年级常模和年龄常模之别。,年龄常模:,人的某些能力特性,在某个年龄阶段中可能随着年龄的增长而逐渐地发展提高,也可能在某个特殊年龄段,某种能力特性随着年龄的增加而不断地衰退。如果存在这样一种现象,而且不同的年龄组其能力变化的差异具有统计学上的显著意义,那么,我们就可以为不同的年龄组建立起一个有意义的常模。年龄常模建立的方法有两种:一是取平均值作为指标;二是用一组题目作为指标。,年级常模:,年级常模是指不同年级学生在某种测验上的正常的一般的表现水平。这样可用某年级学生在该测验上的平均分和相应的年级当量之间的对应关系来描述某一测验的年级常模。年级当量通常用两位数表示,第一位为年,第二位为月。,(,2,)组内常模,组内常模是关于一个与被试同类的群体,在某种测验所测特性上的一般表现水平的常模资料,可以反映每一个体在其同类群体中的相对位置。组内常模又有百分等级常模和标准分数常模两种。,测验常模的类型 (1)发展常模,百分等级常模的意义与应用,百分等级是一个地位量数,能够反映某个测验分数在一组数据中的相对地位。它是把学生的原始分数放在该学生所在群体的成绩中进行比较,以确定学生在群体中的相对地位之高低。,百分等级常模是指基于某个常模团体,为某种测验的原始分数与百分等级之间建立起对应关系的组内常模类型。,百分等级常模意义直观、容易理解、便于解释,在能力测验和学业测验中得到广泛的应用、它不仅可用于解释学生在单一能力测验的成绩,以便了解该生的能力发展在其所属团体中的相对位置,而且对于同时施测的若干个不同的测验来讲,利用各自的百分等级常模,可以比较学生在不同科目上的发展状况,克服了原始分数不能直接比较的缺陷。,百分等级常模的意义与应用 百分等级是一个地位量数,能够,百分等级常模建立的方法,百分等级常模建立的基本思想,选取一个有代表性的被试群体(即常模团体),把他们在某个测验上的分布的全距划分为一百个等级,然后建立起测验原始分数与百分等级之间的一一对应关系。这样,每一可能的测验分数都有一个百分等级与其对应。,百分等级常模建立的具体方法,(,1,)基于未归类数据建立百分等级常模方法,把观测数据从小到大依次排列;,按不同数据逐个地统计次数;,从低分开始向高分方向,计算各个得分点数据以下的累积次数(不包括本得分点的次数);,计算各得分点的,“,以下累积相对次数,”,,即比例数;,确定各得分点数据的百分等级,PR,,其计算方法是把各数据的,“,以下累积相对次数,”,乘上,100,即得之;,把上述结果用一张表加以表达,即为测验的百分等级常模表。,(,2,)基于分组归类数据建立百分等级常模的方法,根据测验所欲使用的对象,科学地选择常模团体(有代表性的被试样本);,把测验施测于该常模团体,取得实测数据;,编制实测数据(常模团体实测分数)的次数分布表;,计算测验原分数,X,所对应的百分等级,PR,();,把上述变换结果用一张表或一个图形加以表达,即为测验的百分等级常模。,百分等级常模建立的方法 百分等级常模建立的基本思想,标准分数的基本定义,标准分数是以标准差为单位表示测验成绩与平均分数之间的距离。,其计算公式为:,从上面标准分数,Z,的定义公式可知,标准分数,Z,是一种以平均数为参照,以测验分数的标准差来衡量原分数在其常模团体中地位高低的一种评定方法。,由于标准分数,Z,分值过小,并往往带有小数和负值等缺陷,在许多情形下直接使用不大合乎人们表示分数的习惯,故通常把标准分数,Z,通过线性变换,转到更大的标准分数量表上,其一般转换公式为:,标准分数常模的建立方法,标准分数常模是指以常模团体在某一测验上实测数据为基础,把原始分数转换成基本标准分数,Z,或转换到更大的标准分数,T,量表上,能够揭示每个测验分数在常模团体测验分数中的相对地位的一种组内常模。,建立标准分数常模实际上就是根据常模团体的实测数据,利用公式 和 ,在原始分数序列,X,i,和标准分数之间,Z,i,或标准分数,T,i,之间,建立起对应关系,从而形成某种测验的标准分数常模转换表。,标准分数常模及建立的方法,标准分数的基本定义标准分数常模及建立的方法,标准分数,Z,的性质与特点,(,1,)任何一批原始分数,转化成,Z,分数后,这批,Z,分数的平均值为,0,,标准差为,1,。,Z,大于,0,,表示测验成绩在平均数之上;,Z,小于,0,,表示测验分数在平均数之下;,Z,为,0,,则表示测验成绩与平均数相等。,(,2,)标准分数,Z,量表的单位是相等的,其零点是相对的。因此,不同科目的,Z,分数具有较好的可比性和可加性。,(,3,),Z,分数本身是关于原始分数,X,的一种线性变换,因此,,Z,分数不改变原始分数的分布形态。,(,4,)在一般情况下,标准分数,Z,的取值范围在,-3,到,+3,之间。,Z,分数的意义可以用正态分布曲线下的面积比例(本质上是概率值)做出最好的解释。,标准分数 Z 的性质与特点 (1)任何一批原始分数,转,正态分布下标准分数,Z,和百分等级,PR,之间的关系,标准分数,Z,是与百分等级,PR,相联系的一种相对分数,在正态分布下,其对应的百分等级,PR,与一个以标准分数,Z,为界点的正态曲线左尾部面积比例数相对应。,正态分布下标准分数 Z 和百分等级PR之间的关系 标准分,正态分布下若干种评分体系之间的关系,(,1,)标准九分及其与百分等级和标准分数之间的关系,标准九分是基于百分等级形成的另一较常用的评分量表,该评分量表是,9,点评分形式,取值为,1,至,9,的整数。在正态分布下,标准九分量表与标准分数及百分等级之间的关系如下表所示:,标准九分与其他评分制相互关系,(,2,)其他多点评分量表,除了上述标准九分量表外,还有标准十分、标准十五分和标准二十分量表等,它们在本质上都是基于百分等级的多点(等级)评分量表。,标准九分,Z,分范范围,百分等级范围,标准九分个案百分比(,%,),9,8,7,6,5,4,3,2,1,+1.75,以上,+1.25,+1.75,+0.75,+1.25,+0.25,+0.75,0.25,+0.25,0.75,0.25,1.25,0.75,1.75,1.25,1.75,以下,96,100,89,95,77,88,60,76,41,59,24,40,12,23,5,11,1,4,4,7,12,17,20,17,12,7,4,正态分布下若干种评分体系之间的关系(1)标准九分及其与百分,标准分数的使用是基于常模数据服从正态分布的假设。只有在正态分布之下使用标准分数,才能充分体现标准分数的优越性与内涵(标准分数,Z,与百分等级,PR,之间存在着一定的关系)。,但是,在实际测试过程中,很可能碰到常模团体的测验分数严重偏态,这种情况下若要直接使用上述的标准分数体系来建立常模就不大妥当。而一种可行的办法是先对测验分数分布进行正态化处理,尔后再建立标准分数常模。其主要步骤如下:,根据常模团体的测验分数次数分布表,建立起原始分数,X,i,与百分等级,PR,i,之间的一一对应关系,;,利用正态分布面积表,从已知的每一个百分等级,PR,i,反查其对应的标准分数,Z,i,,,从而间接实现了从,X,i,到,Z,i,之间的变换,;,根据需要选择公式,中的,a,与,b,两个常数,通过公式再次实现,Z,i,到,T,i,之间的线性变换。从而建立正态化标准分数常模。,标准分数使用的条件,标准分数的使用是基于常模数据服从正态分布的假设。只有,假定甲、乙两生高考入学考试成绩如下表所示,试问根据考试成绩应该优先录取哪名考生?,思考题,考试科目,全 体 考 生,原始分数,平均分数(),标准差(,),甲,乙,语 文,政 治,外 语,数 学,理 化,70,65,69,50,75,10,5,8,6,8,85,70,68,53,72,89,62,72,40,87,假定甲、乙两生高考入学考试成绩如下,甲乙两生高考入学考试成绩的原始分数与标准分数,就原始分数而言,应该优先录取乙生(甲生总成绩(,348,)低于乙生总绩(,350,),这一结论是不科学的。因为原始分数单位不同,因此不能比较,也不能合并。但把原始分数转换成标准分数后,单位相同,因此就可以合并成总成绩进行比较。就标准分数而言,应该优先录取甲生(甲生的总成绩(,2.5,)高于乙生的总成绩(,1.505,)。,解,考试科目,全体考生,原始分数,甲 乙,标准分数,甲 乙,语文,政治,外语,数学,理化,70 10,65 5,69 8,50 6,75 8,85 89,70 62,68 72,53 40,72,87,1.5,1.9,1,0.6,0.125,0.375,0.5,1.67,0.375,1.5,348 350,2.5 1.505,甲乙两生高考入学考试成绩的原,建立标准分数制度是高考标准化的重要环节,在高考中引进标准化考试的改革试验始于,1985,年。在改革的第一阶段(,1985,1992,年)主要是引入,“,标准化考试,”,的概念,实现分卷考试,引入计算机、光学符号阅读器等先进技术设备,实现考试手段现代化。从,1993,年起开始进入高考深化改革的第二阶段,分数的解释和使用标准化。,建立标准分数制度是高考标准化的重要环节 在高考中引进标准化,在高考中使用原始分数的局限性,原始分数是未经任何处理或转换的分数,是考生在一份试卷所得的卷分数。,我国高考一直沿用原始分数制度,原始分数从作答率或通过率方面反映考生已取得的成就水平,但存在如下局限性:,原始分数未能反映考试分数相对于团体的位置信息;,不同科目或同一科目不同考试之间分数可比性较差;,各科标准差不一影响对科目权重的设计。,在高考中使用原始分数的局限性 原始分数是未经任何处理或转换,高考标准分数制度的内容,高考标准分数制度是根据教育统计、教育测量、教育评价等科学原理,按照一定规则把原始分数转化为具有相同意义、相同单位和共同参照点并能刻画考试分数在总体中位置的分数制度。,高考标准分数制度由常模量表分数(包括全国常模和省常模)、等值量表分数组成。,常模量表分数反映一次考试考生成绩在考生总体中的位置,分数值与这位置有关。,由于高考是全国统一考试,
展开阅读全文