资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,教学测量与评价,第三组,测验的项目分析,测验的难度,测验的区分度,难度的含义,难度的计算方法,项目难度的讨论,1,2,3,4,难度的等距转换,测验的难度,一、难度的含义,1,、难度指测验项目的难易程度。,2,、一个测验项目,如果大部分被试都能 答对,该项目的难度就小;如果大部分被试都不能答对,则该项目的难度就大。,3,、难度过大或过小的题目,都不能很好地将不同水平的被试区分开来,因此对常模参照测验的价值就不大。,二、难度的计算方法,1,、当项目以,0,、,1,计分时,难度等于通过率(不考虑猜测机率)。,2,、当项目以,1,、,0,计分而人数较多时,难度等于总分上高分组与低分组通过率的平均数,3,、当项目是多重计分时,难度等于平均分与满分之比。,注,:,1,、,P,值的范围在,0-1,之间。,2,、,P,值越大,题目越容易;,P,值 越小,题目越难。,3,、,P,值与我们通常理解的难度意 义正好相反,也有人将它称为容易度,三、项目难度的讨论,仅仅凭借,P,值,还不足以判断是否保留或删除一个项目。,项目难度的适当性标准取决于测验的性质和功能:,对于一般性测验而言,项目难度的一般标准应在,0.3-0.7,之间;,对于成就或学绩测验,则不必过多考虑项目难度。只要是必须掌握的内容,都可以作为考试项目,其难度可以从,0-1,之间变动。平均难度在,0.50,左右。,对于选拔性、竞赛性考试,其项目难度应接近录取率。如果录取率高则难度应该低一些,录取率低则难度应该高一些,四、难度的等距转换,P,值本质上是正确答题的人数百分比,是一种顺序量表。对于一般的难度分析而言,只要计算出,P,值即可。,如果需要对,P,值做进一步的统计分析(如加减运算、求平均数、做显著性检验等),则要将,P,值转化为等距量表性质的标准,Z,分数或,值,使之具有相等的单位。,Z,值,Z,是均值为,0,、标准差为,1,的标准分数。,通过查阅正态分布表,可以从,P,值查到,Z,值。,Z,值越大,题目越难;,Z,值越小,题目越容易。这一点与,P,值的含义相反。,试题,P,值,Z,值,Z,值之差,1,2,3,0.70,0.60,0.50,-0.52,-0.25,0,0.27,0.25,值,值是对,Z,值的线性转化,平均数为,13,,标准差为,4,。,=13+4Z,(,在,1,与,25,之间变动),注意:,值越大,难度越大;,值越小,难度越小。这一点与,P,值的含义相反。,项目难度对测验的影响,1,、项目难度影响测验的编排,一般根据试题的难度,按照由易到难的顺序编排。,2,、项目难度影响测验分数的分布形态,整个测验的难度适当,测验的分数接近正态分布;测验的难度偏大,则大多数被试集中在低分端,,“,正偏态分布,”,;测验过于容易,则大多数被试集中在高分端,,“,负偏态分布,”,。,3,、项目难度影响测验分数的离散程度,题目难度在,0.50,左右时,分数分布的离散程度最大。难度过大或过小,分数分布的离散程度变小。,4,、项目难度影响测验信度,当测验难度的平均值在,0.50,左右时,分数的分布范围最广,以相关系数为基础的信度也变得相对较高。,5,、项目难度影响区分度,1,3,2,4,区分度的含义,项目的区分度,区分度的计算,区分度与难度的关系,区分度的相对性,一、区分度的含义,区分度指测验项目对被试心理品质水平差异的区分能力。,区分度良好的项目,能够将高水平与低水平的被试区分开来。即高水平个体在该项目上得分高,低水平被试在该项目上得分低。,项目分析中,一般采用被试的测验总分作为判断其水平的效标分数,内部效标。也可以采取外部效标。,区分度一般用,D,表示。,D,值在,-1,1,之间变动。,区分度的大小,常常能够决定是否删除或保留一个项目,它可以作为筛选项目的一个主要指标。,二、区分度计算,项目区分度可以有不同的计算方法,我们,要根据测验的目的以及测验分数的特征来选择,合适的方法。,1,、鉴别指数法(适合,0,、,1,计分),一个项目的鉴别指数指总分高分组与低分组在该项目上的通过率之差。,D=P,H,P,L,2,、相关法,鉴别指数只考虑了高分组和低分组的情况,浪费了测验中的许多信息,统计结果的精确度与分析全体被试的数据要差一些。,在大规模或标准化的测验中,大多采用相关法来计算项目区分度。可以有两种计算途径:其一,计算项目得分与测验总分的相关系数;其二,计算项目得分与外部效标的相关系数。对相关系数,进行显著性检验。,三、区分度与难度的关系,项目难度,P,鉴别指数,D,1.00,0.90,0.70,0.60,0.50,0.40,0.30,0.10,0.00,0.00,0.20,0.60,0.80,1.00,0.80,0.60,0.20,0.00,0,0.2,0.4,0.6,0.8,1.0,P,值,D,的最大值,0.2,0.4,0.6,0.8,1.0,当难度为,0.50,时,该项目的潜在鉴别指数,D,最大,而难度分布在两端(,0,或,1,)时,潜在的鉴别指数,D,最小。,常模测验中要求项目难度保持在中等水平,可以最大程度地区分被试的水平差异。,是不是测验中所有项目的难度都要控制在,0.50,左右呢,?,实际编制测验时,最好使项目的难度分布广一些,梯度大一些,容易:中等难度:难,=3,:,5,:,2,,使整个测验的难度呈正态分布,且平均难度保持在,0.50,左右。,四、区分度的相对性,1,、不同计算方法得到的区分度指标不同。,鉴别指数法和相关法求出的区分度含义不同,所得数值也不相同。,2,、样本容量大小影响相关法区分度的大小。,样本容量越小,用相关法计算出来的相关系数越不可靠。样本容量越大,相关系数越可靠。,3,、分组标准影响鉴别指数。,25%,、,27%,、,33%,、,50%,,分组越极端,,D,值越大。,4,、被试团体的性质影响区分度大小。,项目的区分度是针对不同被试而言的。比如同一份测量试卷,让自考学生和全日制心理系大学生做,项目的区分度会有很大不同。,THE END,谢谢!,22,
展开阅读全文