心理测量学教案昉生

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,心理测量学,昉生,1,参考教材与参考书目,心理测量金瑜主编华东师范大学出版社,心理测量学郑日昌、蔡永红、周益群著人民教育出版社,心理教育与测量张厚粲主编浙江教育出版社,现代教育与心理测量学原理漆书青戴海崎丁树良编著江西教育出版社,心理教育测量戴海崎张锋陈雪枫主编暨南大学出版社,学校心理测量学顾海根编著广西教育出版社,心理测验与常用量表陈国鹏主编科学普及出版社,2,第一章心理测验绪论第一节心理测验的历史,一心理测验在我国的发展史,孔子：中人、中人以上和中人以下,孟子：“权，然后知轻重；度，然后知短长。物皆然，心为甚。”,刘劭：人物志对人要观其感变，以审长度。将人分为十二类，如强毅之人、柔顺之人、雄悍之人、惧慎之人、辩博之人、沉静之人等等，,南唐的刘勰：使左手画方，右手画圆，无一俱成。,3,4,5,西汉时代的扬雄，曾以词作为心理鉴定的重要内容。,自从隋炀帝创行开科取仕，将考试作为选拔人才的主要方法，科举制度在我国通行了1300年，经过历代的改进，形式上日臻完善。,清朝末年，心理学由西方传入我国。,1914年有人在广东测验了500名儿童的记忆和比喻理解力。,6,1916年樊炳清首先介绍了“比奈西蒙智力测验”。,1918年俞子夷曾编制“小学生毛笔书法量表”，这是我国最早的标准化教育测验。,1920年，北京高等师范学校和南京高等师范学校建立了我国最早的两所心理学实验室。廖世承和陈鹤琴在南京高师开设测验课，并用心理测验试测投考该校的学生，这便是我国正式开始的科学心理测验。,7,1921年他俩正式出版智力测验法一书，这是我国最早的心理测量专著。,1922年，比奈量表由费培杰译成中文，并在江苏、浙江两省的一些小学生中进行过测试。,1922年美国测验专家麦柯尔博士应中华教育改进社聘请来华讲学，在他的指导下，北京师范大学、北京大学、燕京大学、北京女子高等师范学校、东南大学等校的教授和学生开始编制测验。,1923年，中华教育改进社对全国22个城市和11个乡镇的9.2万名小学生进行了测验，引起教育界的关注。,8,1924年，陆志韦先生发表了订正比奈西蒙智力测验说明书，1936年又与吴天敏再次做了修订。,1931年在艾伟、陆志韦、陈鹤琴、肖孝荣等人的倡议下中国测验学会成立。,1932年测验杂志创刊。到抗日战争前，我国心理学家自编和修订国外心理测验达二十多种、教育测验五十多种。,1978年中国心理学会在保定开会时，组织心理测验座谈会。,9,1979年中国心理学会在天津开会时，医学心理专业委员会成立了心理测验协作组，并推选湖南医学院龚耀先主持修订韦克斯勒成人智力量表。,同年，龚耀先在长沙湖南医学院开办了医疗卫生系统测验学习班。,1980年5月，中国心理学会实验心理学专业委员会在武汉召开克全国心理测验研究协作会议，会上决定由林传鼎、张厚粲主持修订韦克斯勒儿童智力量表，吴天敏主持修订比奈智力量表。,10,1980年初，北京师大心理系首次开设心理测验课。许多单位陆续编制或修订了一些心理测验。,在1984年召开的第五界全国心理学年会上，成立了以北师大心理系张厚粲教授为首的测验工作委员会（后改称测验专业委员会），加强了对测验工作的指导，这标志着我国心理测量已进入了一个新的高速发展时期。,1990年，中国心理学会心理测量专业委员会在无锡召开第一次学术会议。,11,在测量学学科建设方面，出版了大量有关心理与教育测量的著作。,80年代以前,孟承先测量之学理的研究、王叔林心理与教育测验、陈选善教育测验、艾伟小学儿童能力测验、孙正邦心理与教育测验,80年代以后,宋兆鸿等现代教育测量（1986）；郑日昌心理测量（1987）；戴忠恒教育与心理测量（1987）；俞嘉元教育与心理测量（1987）；王汉澜主编教育测量学（1988）；彭凯平心理测验原理与实践（1989）；刑最智、司徒伟成现代教育测量理论（1989）；漆青书、戴海崎项目反应理论及其应用研究（1992）；黄光扬心理测量的理论与应用（1997）等。,12,二科学心理测验的产生与发展,（一）心理测验的产生是社会的需要,（二）心理测验的先驱,、冯特,、高尔顿,、卡特尔,、比奈,13,（三）心理测验的发展,、编制出一批操作测验，既可弥补语言文字量表在理论上的缺陷，又可适用于文盲和有言语障碍的人。,、编制出团体智力测验，扩大了测验的应用范围。,、多重能力倾向测验逐渐受到重视。,14,、桑代克等人，利用心理测验原理，编制了第一批标准化的教育测验，一些专门的测验机构成立。,、心理测验发展的另一领域涉及情感适应、人际关系、动机、兴趣、态度、性格等人格特点的测量。,、60年代后，由于认知心理学的崛起，将实验法与测验法结合，产生了信息加工测验，为了解心理能力提供了一些补充方法，使心理测验出现了新的发展趋势。,15,（四）心理测量的三大来源,中国的科举考试,西方学校的考试制度,心理学对个别差异的研究,16,第二节心理测量的性质,美国心理学家桑代克在1918年曾说：“凡物之存在必有其数量”。,美国测量学家麦柯尔于1922年又提出：“凡有数量的东西都可以测量。”,17,一测量的定义,（一）定义一,测量就是依据一定的法则使用量具对事物的特征进行定量描述的过程。,18,所谓“一定的法则”，是指任何测量都要建立在科学规则和科学原理基础之上，并通过科学的方法和程序完成测量过程。,所谓“事物的特征”是指所要测量的事物的特定属性。,所谓“量具”是指测量中所使用的工具。,所谓“定量描述”，是指任何测量的结果总是对事物特征的量的确定。,19,（）测量的精确度决定于测量对象本身的性质。,确定型，即在一定条件下，事物的量保持恒定不变。,随机型，即事物的量随机改变。,模糊型，即事物的量本身就是模糊不定的，难以获得确定的量。,20,（）测量的精确度决定于测量工具的精密性。,物理测量：即对事物的物理特征的测量。,生理测量：即对机体生理特征的测量。,社会测量：即对社会现象的测量。,心理测量：即对人的心理特征的测量。,21,（二）定义二,美国心理与教育测量学家布朗认为：“测验是测量一个行为样本的系统程序。”,心理测验就是通过观察人的少数有代表性的行为，对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。,22,说明：,（）测验测量的是人的行为，严格地讲，只是测量了做测验的行为，也就是一个人对测验项目所进行的反应。,（）一个测验不可能包括所要测量的行为领域中所有可能的项目，它所包含的只是全部可能项目的一个样本。,（）在编制、施测、评分和解释方面依据一套系统的程序。,23,使用标准化测验应注意以下一些事项：,（）与被试建立融洽的关系，减轻被试者的紧张与焦虑。,（）创造良好的测验环境。测验场所应肃静、宽敞、明亮、通风，不使被试过度疲劳。,（）宣读测验指导语要清晰、缓慢，务使被试者准确理解指导语的含义。,（）严格按测验说明书的程序评分，务使评分客观、准确。,（）被试的测验成绩应适当保密。,24,（三）定义三,史帝芬斯说：“就其广义来讲，测量是按照法则给事物指派数字。”,测量的三个要素：,（）测量的对象事物属性,（）测量的结果数字,（）测量的方法法则,25,（四）定义四,美国心理测量学家阿娜斯塔西认为：“心理测验实质上是对性样本的客观和标准化的测量。”,、行为样本,、标准化,测验的标准化需要具备下列条件：,（）测验内容的标准化,（）施测条件的标准化,（）评分规则的标准化。,（）测验常模的标准化,、难度或应答率,、信度和效度,26,二心理测量的特性,（一）心理测量的间接性,（二）心理测量的相对性,（三）心理测量的客观性,、测验用的项目或作业、施测说明、施测者的言语、态度及施测时的物理环境等，均经过标准化，测验的刺激是客观的。,、评分记分的原则和手续经过了标准化，对反应的量化是客观的。,、分数的转换和解释经过了标准化，对结果的推论是客观的。,（四）心理测量的稳定性,27,三测量的基本要素,（一）测量的参照点,参照点有两种：,绝对参照点，即以绝对的零点作为测量的起点。,相对的参照点，即以人为确定的零点作为测量的起点。,28,（二）测量的单位,理想的测量单位应当具备两个条件：,1、要有确定的意义,即对同一单位，所有的人的理解都是相同的，不允许作出不同的解释。,2、要有相等的价值,即第一单位与第二单位之间的距离等于第二单位与第三单位之间的距离。,29,四测量的量表,（一）命名量表（类别量表）,它只是用数字代表事物或用数字对事物进行分类。,命名量表又可细分为两种形式：一是名称量表，即用数字指代个别事物。二是类别量表，即用数字指代事物的种类。,（二）顺序量表（次序量表、等级量表）,它不仅能够指代事物类别，而且能够表明不同类别的大小、等级或事物具有某种特征的程度。,既没有相等的单位，也没有绝对的零点。,30,（三）等距量表（间距量表）,它不仅能够指代事物的类别、等级，而且具有相等的单位。,没有绝对的零点。,（四）比率量表（等比量表）,除了具有类别、等级、等距的特征外，还具有绝对的零点。,31,量表名称,性质,统计方法,类别测量,只能对事物进行分类，具有区分性,次数，百分比，,2,，列联相关,等级测量,能把事物分等，具有等级或序列性,中位数，百分位数，等级相关，秩次检验,等距测量,能把事物作等距的分等，具有等距性,均数，标准差，积矩相关，T检验，F检验,比率测量,能测量事物差异的比例关系，具有可加性,几何均数，等比量数,32,四种测量在三个维度上的表现,33,第三节心理测验的种类与功能,一心理测验的种类,（一）按测验功能分类,1、能力测验,能力测验可分为实际能力测验与潜在能力测验。,能力测验又可分为普通能力测验和特殊能力测验。,2、成就测验（教育测验）,主要用来测量个人（或团体）经过某种正式教育或训练之后对知识和技能掌握的程度。,成绩测验有两种类型：（1）学科成就测验。（2）综合成就测验。,34,3 、人格测验,主要用于测量性格、气质、兴趣、态度、品德、情绪、动机、信念、价值观等方面的个性心理特征，亦即个性中除能力以外的部分。,35,（二）按测验对象分类,1、个别测验,每次以一位被试为对象，通常是由一位主试与一位被试在面对面的情形下进行。,36,优点：,（1）主试对被试的作题行为有仔细的观察，有机会获得测量分数之外的信息。,（2）主试与被试面对面交流的机会更多，容易与被试建立起融洽的合作关系，易于激发被试的测验动机，有较多的观察与控制机会。,（3）对于一些特殊被试（如幼儿、文盲）只能采用个别测量，以便主试代替被试记录其行为反应。,37,缺点：,（1）费时，难以在短时间收集大量的测量资料。,（2）测验手续比较复杂需经过较高水平训练的人担任主试。,38,、团体测验,指每次测验过程中由一个或几个测验者对数量较多的被测验者(一个群体)同时实施测验。,优点：节省时间，可以在短时间内收集到大量的测量数据。,缺点：由于同一时间内接受测量的被试多，不易有效地控制被试的行为，容易产生测量误差，从而影响测验的信度和效度。,39,（三）按测验内容的形式来分类,、文字（纸笔）测验,这类测验通常为文字项目组成，由文字说明做法和作出回答。,优点：实施起来方便，团体测验多采用此种方式编制。,缺点：容易受被试的文化背景的影响，从而降低测验的效度。,、非文字（操作）测验,这类测验的项目多由实物、图片、模型之类的直观材料制作组成，测验也多以操作方式进行。,优点：此种测验不受或少受文化背景的影响，也适用于测量学前儿童及文盲的心理特征。,缺点：常局限于个别测量，在时间上不经济。,40,（四）按测验功能来分类,、成就测验与预测测验,成就测验的目的是测量个人在某一领域已经达到的实际成就。,预测测验的目的在于测量个人在未来某一方面获得成功的可能性。,、难度测验与速度测验,难度测验的功能在于识别个人能够达到的最高水平。,速度测验的功能在于识别个人做题的最快速度。,41,、描述测验与诊断测验,描述测验的功能在于通过测量来描述某一特定群体在某一心理特质上的一般状况。,描述测验的功能在于通过测量来描述某一特定群体在某一心理特质上的一般状况。,42,（五）按评价所参照的标准来分类,、常模参照测验,是根据被试对量表中所规定的题目答对多少来评分的，被试成绩的优劣，是根据所得分数在常模中所处的地位来确定的，不是以是否达到某个标准来决定。,、目标参照测验,是将被试水平与一绝对标准相比较，以便评价被试有无达到该标准为目的测验，也称标准参照测验。,、潜力参照测验,是将被试水平与自身潜力相比较，以评价被试有无充分发挥自身潜力为目的的测验。,43,（六）按测验要求分类,、最高作为测验,、典型作为测验,（七）按测验应用来分类,、教育测验,、职业测验,、临床测验,44,二心理测验的功能,（一）在教育工作上的应用,、心理测验是教师了解学生的有用手段。,、心理测验也可使教师发现学生的心理问题，以便及时地进行心理辅导或干预。,、心理测验是教育评价的重要工具。,、心理测验是教育研究的重要方法。,45,（二）在临床医学上的应用,、临床工作中借助心理测验对儿童进行心理指导。,、临床工作中对器质性精神病的鉴别，往往借助于一些专门的心理测验。,、在临床科研中，借助于心理测验也可以观察病情程度，比较疗效。,（三）在智能缺陷早期诊断上的应用,46,（四）在人才选拔、工作安置上的应用,、借助心理测验以便预测人们从事各种活动的适宜性，从而提高人才选拔和职业训练的效率。,、借助心理测验，可以做到人与工作的较好匹配，做到人尽其才，从而提高工作效率。,、心理测验在解决实际问题中发挥了较广泛的作用。,47,第四节心理测验的正确使用,一对心理测验的正确态度,（一）两种极端的看法,、认为测验完美无缺。,、认为测验无用且有害。,（二）对心理测验的正确态度,、心理测验是一种有用的研究手段和测量工具。,、测验作为一种研究手段和测量工具尚不完善。,、为更好地发挥测验的效能，必须防止测验的滥编乱用。,48,为防止测验的滥编乱用，要注意以下几个问题：,（）测验的编制和修订必须由有关领域的专家来主持。,（）测验的出版和发行要严加控制。,49,二心理测验使用者的资格,（一）心理测量工作者的知识结构,心理测验工作者可分为两个不同的层次：,（）专业研究工作者，主要从事心理测量学的理论研究工作和各种测验的编制工作。,（）实际应用工作者，主要从事运用心理测量解决各行各业的实际问题的工作。,心理测量工作者应当具备相应的基础知识和专业知识。,、基础知识,（）普通心理学、发展心理学、教育心理学等广泛的心理学基本知识。,（）扎实的心理统计学的基本知识。,、专业知识,50,（二）对心理测验的科学态度,（三）心理测验工作者的道德准则,、测验的保密和控制使用,、测验中个人隐私的保护,测验工作者应当采取适当的保护措施：,（）只有在必要的情况下，测验工作者才能询问个人的隐私，凡是与测验目的无关的方面就不应涉及。,（）对受测者保证为其保密，并在实际上为受测者严守秘密。,（）凡测验中必须涉及的个人隐私应事先征得受测者本人或其他有关人员的同意。,51,三心理测验使用中的注意事项,（一）测验前准备的注意事项,、要选择合适的量表。,、要准备好测验的场所。,、要准备好测验的器材。,、要熟悉测验的方法和步骤。,52,（二）测验过程中的注意事项,、协调好与被试的关系，充分激发被试的测验动机，使其能配合做好测验。,、严格按照规定的步骤和方法进行测试，时限的掌握要准确，指导语要统一，不能对被试有任何的暗示。,、要注意排除各种干扰测验的无关因素。,53,（三）测验后的注意事项,、严格按照测验规定的标准记分。,、测验结果的解释应慎重，注意教育性原则，尽量使测验结果的解释有利于被试发展与身心健康，避免对被试造成不良后果。,、对测验结果要保密，未经被试同意，不能告诉其他人。,54,四测验的使用,在测验时也必须注意以下几个问题。,(1)慎重选择测验量表,(2)与被测验者建立协调关系,(3)控制实施测验的误差,(4)正确解释测验结果,(5)遵守测验的道德,(6)注意测验的保密,55,第二章心理测验的编制与应用第一节心理测验编制的一般程序,一确定测验目的与对象,（一）测量对象,（二）确定并分析测量的目标,（三）测验用途,二拟定编制计划,56,例如：塞斯顿基本心理能力成套测验,美国著名心理学家塞斯顿，采用因素分析方法，对56个分测验之间的交互相关进行因素分析，概括出七种基本心理能力，提出了智力的多因素结构理论，并围绕着这七种基本心理能力，编制了一套由七个分测验组成的“塞斯顿基本心理能力成套测验”。塞斯顿于1941年正式出版了“基本心理能力测验（简称为PMAT），这是当时较为著名的智力测验。,57,这七个测验分别是：,（1）言语理解，即测量阅读时理解文意的能力。,（2）数字计算，即测量运算的速度和准确性。,（3）知觉速度，即测量迅速而正确地观察和辨别事物异同点的能力。,（4）词语流畅，即测量词义联想迅速和正确的能力。,（5）记忆，即测量机械记忆的能力，包括强记单词、数字、字母等方面。,（6）归纳推理，即测量根据已知条件进行推理判断的能力。,（7）空间知觉，即测量运用感官及知觉经验以正确判断空间方向及关系的能力。,58,例如：小学自然常识测验的编题计划,行为目标,教材,内容,获得基本知识,理解基本原理原则,应用原理原则,分析因果关系,综合成系统见解,建立评价标准,合计,生物世界,3,5,6,3,2,1,20,资源利用,2,3,3,1,1,0,10,动力和机械,2,3,4,2,0,1,12,物质、物性与能量,5,6,8,3,2,1,25,气象,2,4,3,2,2,0,13,宇宙,2,5,4,1,0,0,12,地球,2,2,2,1,1,0,8,合计,18,28,30,13,8,3,100,59,三设计测试项目,（一）搜集有关资料,、资料要丰富。,、资料要有普通性。,、资料要有趣味性。,60,（二）选择项目形式,在选择项目形式时，要考虑以下几点：,、测验的目的和材料的性质。,、接受测验的团体的特点。,、各种实际因素。,61,（三）编写和修订项目,编写项目要注意以下几个问题：,、项目的范围要与测验计划相一致。,、项目的数量要比最后所需的数目多一倍或几倍，以备筛选和编制复本。,、测验项目的取样应当对欲测量的心理品质具有代表性。,、项目的难度应有一定的分布范围，必须符合测验目的的需要。,、项目的说明必须清楚。,、编写测验项目的用语要力求精练简短、浅显明了。,62,四项目的试测和分析,（一）试测,预测应注意以下几个问题：,、预测对象应取自将来正式测验准备应用的群体。虽然人数不必太多，但要具有代表性。,、预测的实施过程欲情境应力求与将来正式测试时的情况相近似。,、预测是时限可稍宽一些，最好使每个被试都能将项目做完，以搜集较充分的反应资料，使统计分析的结果更为可靠。,、在预测过程中，应随时记录被试的反应情形。,63,（二）项目分析,质的分析是从内容取样的适当性、题目的思想性以及表达是否清楚等方面加以分析。,量的分析是对预测结果进行统计分析，确定项目的难度、区分度、备选答案的适宜性等。,64,五合成测验,（一）项目的选择,选择测验项目的指标有三：,（）测验的性质，即要选择那些能够测量所要测量的东西的项目。,（）项目的难度。,（）项目的区分度。,65,（二）项目的编排,（）并列直进式。,（）混合螺旋式。,66,（三）编造复本,复本的关键是等值。所谓等值就是要符合下列条件：（1）复本测量的是同一种心理特质；（2）复本测题的内容范围相同，但题目不应有重复；（3）复本测验题型相同，题目的数量相等，并且有大体相同的难度和区分度结构。（4）复本测验的分数分布（平均数和标准差）大致相同。,67,两个等值的测验复本,A本：1、4、5、8、9、12,B本：2、3、6、7、10、11,三个等值的测验复本,A本：1、6、7、12、13、18,B本：2、5、8、11、14、17,C本：3、4、9、10、15、16,68,六测验使用的标准化,（1）确保测验实施过程的规范性与统一性，包括测验指导语、测验时间、测验情境等。,（2）制定客观的评分标准与解释分数的常模。,（3）务必使测验的效度与信度达到一定的要求。,69,（三）分数解释,、常模团体,常模团体是由具有某种共同特征的人所组成的一个群体或是该群体的一个样本。,确定常模群体的注意事项：,（）群体构成的界限必须明确。,（）常模团体必须是所测群体的一个代表性样本。,（）取样的过程必须明确且有详尽的描述。,（）样本大小要适当。,（）常模团体必须是近时的。,（）注意一般常模与特殊常模相结合。,70,、常模,（）年龄常模：这是以不同年级测验平均分数为常模的，它通常用在学科或学力测验中。,（）年龄常模：这是以不同年龄的测验平均分数为常模的，它一般用在智力测验中，有时也用在教育测验中以表示学生的教育年龄。,（）百分等级常模：当常模样本组的测验分数的分布偏离正态分布时，可以百分等级表作为测验的常模表。,（）分数常模：这是以标准差为单位的标准分数转换所得的常模。,71,七搜集信度、效度资料,八编写测验手册,测验手册的内容有：,（1）测验的名称、作者、发行单位。,（2）测验的目的和功用。,（3）测验编制的理论背景和选择题目的依据。,（4）测验的实施方法、时限及注意事项。,（5）测验的标准答案和计分方法。,（6）常模资料。,（7）测验的信度资料和效度资料。,72,良好的测验应符合以下一些要求：,、试题的类型应与测量的目的相适应。,、所拟定试题应具有代表性。,、试题要有适宜的难度和区分度。,、试题的表述要明晰、准确，不会引起被试者对试题的误解。,、测验的结果具有可靠性和有效性。,、测验要易于实施，易于评分，便于统计检验，在人力、物力和时间方面，符合经济性原则。,73,第二节构制心理测验的具体方法及实例,强调实证效度的经验效标法,所谓强调实证效度的经验效标法，是指测验编制者凭借丰富的实践经验来编拟测验题目，并把这些题目分别施测于两个组内同质、组间异质的效标组，依此来筛选题目，构建测验的方法。,1武德沃斯个人资料调查表,2、明尼苏达多相人格调查表,二基于因素分析技术的编制方法,(1)塞斯顿基本心理能力成套测验及其后续研究,(2)卡特尔的十六种人格因素测验,74,三基于某一人格理论或概念系统的构思方法,(1)爱德华个人偏好量表,(2)吉尔福特的创造力测验,四综合法,1、杰克逊人格问卷,2、考夫曼儿童成套评鉴测验,75,第三节标准化测验的应用,一怎样选择适用的标准测验,（一）根据测验的目的选择适宜的测验。,（二）尽量使用曾经多次修订的量表。,（三）尽量选用具有较高学术水平的专家们编制的量表。,（四）尽量选用我国自己编制或修订的量表。,（五）选用具有效度、信度资料，提供常模的量表，评分客观、方面，易于实施的测验。,76,二使用标准化测验的条件和注意事项,（一）使用标准化测验的条件,水平：可使用实施方法较为简便的标准化测验。,水平：可使用性向测验或一般适应测验。,水平：可实施个别测验或投射测验。,77,（二）使用标准化测验的注意事项,、与被试者建立融洽的关系，减轻被试者的紧张与焦虑。,、创造良好的测验环境。,、宣读测验指导语要清晰、缓慢，务使被试者准确理解指导语的含义。,、严格按测验说明书的程序记分，务使评分客观、准确。,、被试者的测验成绩应适当保密。,78,第三章测量误差及其来源,一测量误差的含义,测量误差指的是在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应,理解：,（）测量误差是由那些与测量目的无关的变因所致。,（）测量误差表现为不准确或不一致两种方式。,79,二测量误差的种类,（一）随机误差,是由那些与测量目的无关的、偶然因素引起的、而又不易控制的误差。,（二）系统误差,是那种由测量目的无关的变因引起的一种恒定而有规律的效应。,系统误差只影响测量的准确性，不影响稳定性，而随机误差既影响稳定性又影响准确性。,80,81,三测量误差的来源,（一）测验自身引起的误差,（二）施测过程引起的误差,、测试环境,、测试时间,、主试因素,、意外干扰,、评分记分,82,（三）被试引起的误差,、应试动机,、测验焦虑,、测验经验,、练习效应,、反应倾向,、生理变因,83,第四章信度第一节信度的意义,一信度及其统计学原理,信度指可靠性或可靠的程度。,（一）信度指实测值和真值相差的程度。,实测值是实际测量某种事物时所获得的测定值，也称实得分数或观察分数。,真值是被测量的事物的真实规模的取值，也称真分数。,实得分数和真分数之差称为测量误差或误差分数。可以称为绝对误差。,X=T+E,84,实得分数的相对误差是误差分数（）对于真分数（）所占的百分数。即相对误差E/T100%,可以用最大绝对误差（）对于实得分数（）所占的百分数来作为这个这个实得分数（）的最大相对误差，即最大相对误差E/X100%,信度可定义为真分数方差与实得分数方差的比率。,rxx=ST,2,/SX,2,85,（二）信度指统计量（如样本平均数）与参数（如总体平均数）的接近程度。,（三）信度指一种测验对相同的应试者再次测验时引起同样反应的程度。,86,第二节信度系数的计算,信度指标常用相关系数表示，也称信度系数，表示实得分数的变异数中有多少比例是由真分数的变异决定的，例如信度系数为0.9意指变异的90来自真分数的差异。,一稳定性系数（再测信度）,稳定性系数是用同一量表对相同被试者在不同时间测验两次的实得分数的相关系数。,重测法,测验1,适当时距,测验A2,87,皮尔逊积差相关公式：,88,计算再测信度应满足以下几个假设：,（）所测得的特质必须是稳定的。,（）遗忘与练习的效果相同。,（）两次施测期间被试的学习效果没有差别。,在使用重测法计算稳定性系数时，要注意下列问题：,（）两次测验之间的时间间隔要适当。时间间隔过短易夸大稳定性，时间间隔过长，易降低稳定性。,（）重测法适用于速度测验而不适用于难度测验。,（）应注意提高被试者的积极性。,89,二等值性系数,等值性系数是以两个等值（题型、题数、难度、区分度相等），但具体内容不同的量表，在最短时距内，对相同的应试者先后施测两次测验所获得的两组对应分数的相关系数。,复份法,测验,最短时距,测验,90,计算复本信度的条件：,（）要构造出两份或两份以上真正平行的测验。,（）被试要有条件接受两个测验。,91,使用复份法计算等值性系数要注意下列几点：,（）复份法的关键在于两个量表必须等值。,（）两次测验的时距宜尽可能短促，以避免知识积累、练习效应等因素的影响。,（）由于量表的两个复份再许多方面近似，所以信度系数有稍微偏高的倾向。,（）标准化测验一般均有复份，若没有说明等值信度，或等值性系数较低，则使用复本应持慎重态度。,92,三等值稳定性系数,等值稳定性系数是合估等值性与稳定性而得到的信度系数。,复份法,测验,适当时距,测验,93,四内部一致性系数（同质性信度）,内部一致性系数是用同一测验量表的两个部分得分的相关系数。,、分半法,(1)斯皮尔曼布郎公式校正公式,r,xx,2r,hh,/（1+r,hh,）,r,hh,为两半分数的相关系数，r,xx,为测验在原长度时的信度估计。,94,斯皮尔曼布郎通用校正公式:,r,kk,=Kr,ij,/(1+(K1)r,ij,),K为可能测验长度与原测验长度的比率,r,ij,为原测验信度系数,r,kk,为测验增长成原来的K倍时的信度估计值,缺陷：该公式假设两半测验分数的变异相等，如不等值时可采用下两个公式：,95,(2)弗郎那根（Flanagan）公式:,r,xx,2（1（S,a,2,+S,b,2,)/S,x,2,）,S,a,2,、S,b,2,和分别为两半测验分数的变异数，,S,x,2,为测验总分的变异数。,(3)卢伦（Lulon）公式：,r,xx,1S,d,2,/S,x,2,S,d,2,为两半测验分数之差的变异数，S,x,2,为整个测验分数的变异数。,96,、基于项目协方差的方法,库得尔理查森公式法,（1）20的用法,r,kk,=（K/（K1）(1(p,i,q,i,)/S,x,2,),K为题数,p,i,为通过第i个题目的人数比例,q,i,为未通过第i个题目的人数比,S,x,2,为测验总分的变异数。,注：适用答对一题得一分，答错无分的测验。,97,(2)21 用法,r,kk,=（K/（K1)）(（1Kp,i,q,i,）/S,x,2,),（K S,x,2,X(KX)）/(K1)S,x,2,p,i,为题目的平均通过率,q,i,为1p,i,X为测验总分的平均数,S,x,2,为测验总分的变异数,适用各题难度相近的情况。,当题目难度相差大时，所求信度系数有低估倾向。,98,99,计算内部一致性系数，需注意下列问题：,（1）若用分半法时，以按奇数题和偶数题分为两半为宜。,（2）若速率是测验的重要因素，则不宜用分半法。,（3）如果答案只有正确和错误两种，得分也有两种，可用库得尔理查森公式法计算信度系数；若答案多种多样，得分也多种多样时（如论文式考试），则不能用上列公式计算一致性系数。,100,五论文式测验的信度系数,克龙巴赫系数公式：,（K/（K1）（1S,i,2,/ S,x,2,）,S,i,2,为某项目分数的变异数，其它字母意义同kR20公式，当题目以二分法记分时， S,i,2,piqi，所以KR20公式为系数的特例。,适用多重记分的测验。,上述公式不适用速度测验。,库德理查逊公式和克伦巴赫系数所求得的信度通常比分半信度低。,101,102,六阅卷者评分的信度系数,（一）斯皮尔曼等级相关公式,两个评分者一致性计算：计算每份试卷两个分数的相关系数。,（二）肯德尔和谐系数（W）,W( R,i,2,(R,i,),2,/N)/（K,2,(N,3,-N)/12）,K为评分者人数,N为被评对象数,R,i,是每个对象被评等级。,103,104,假设有三位专家给六篇论文评等级，结果如表所示，试计算此次评分者的评分者信度。,专家,1,2,3,4,5,6,1,2,4,1,5,6,3,2,3,4,1,5,6,2,3,3,5,1,4,6,2,R,i,8,13,3,14,18,7,105,106,七目标参照测验的信度系数,（一）方法一：,举行一次测验，确定一个决断分数，假定测验成绩超过决断分数的学生已具备学习下一阶段教材的条件，那么达到目标的可能性较大。经过下一阶段的学习和训练后，举行第二次测验，若上次测验成绩超过决断分数的应试者在第二次测验中的成绩确已达到所规定的目标，则说明上一次测验的信度高；反之，若上次测验成绩超过决断分数的许多人在第二次测验中成绩低下，并未达到预期目标，则说明上次测验的信度低。,107,（二）方法二：,采用复本法，以等值的两个量表测验相同的应试者，但不计算各应试者两次得分的相关系数，而是根据两次测验都在决断分数（假定这个分数是应试者是否达到目标的临界分）以上和以下的人数的百分比，来判断测验结果的信度。,108,八速度测验的信度系数,重测验法和复本法。,分半法的依据必须是时间而非试题。有两种方法：,（1）把测验时间分为两半,（2）把全部测验时间分为四段,109,各种信度系数相应误差变异的来源,信度系数类型,误差变异来源,再测信度,时间取样,复本信度（连续施测）,内容取样,复本信度（间隔施测）,时间内容取样,分半信度,内容取样,同质信度,内容异质性,评分者信度,评分者间差异,110,第三节提高测验信度的方法,一测验信度以多大为宜,二影响测验信度的因素,（一）系统误差,系统误差不影响信度。,（二）抽样误差,抽样误差是影响信度的一个因素。,（三）随机误差,随机误差是影响信度的最主要的一种误差。,111,三提高测验信度的方法,（一）延长测验的长度,（）新增加测验题与原有的测验题应有相同的统计性质，即应有相同的平均难度和相同的组间相关。,（）加大测验长度应当不影响被试者回答问题的方法。,112,113,题数,与原测验题数之比,信度系数,效度系数,10,1,0.300,0.400,20,2,0.462,0.496,30,3,0.562,0.548,60,6,0.720,0.619,120,12,0.837,0.668,240,24,0.911,0.679,480,48,0.954,0.713,114,（二）测验的难度要适中,难度在0.400.70之间是合适的。,（三）测验的内容应尽量同质,（四）测验的时间要充分,（五）测验的程序应统一,（六）评分要客观,（七）加大应试者之间的差异,115,第五章测验的效度第一节效度的意义,一效度的含义,效度是量表能实际测量出其所要测量的特性或功能的程度。,理解：,（1）测量的效度始终是对一定的测量的目的而言的。,（2）测量的效度也是对测量的结果而言的。,（3）一种测验结果的效度只是高或低的问题。,116,二效度的统计学原理,潜在真分数方差,S,V,2,系统误差方差,S,I,2,真分数的变异数可以分为：与测量目的有关的变异和与测量目的无关的变异。系统误差的变异包含在真分数的变异中。,S,T,2,=S,V,2,+S,I,2,S,X,2,=S,V,2,+S,I,2,+S,E,2,117,可以把效度定义为潜在真分数方差与实得分数方差之比。,效度S,V,2,/S,X,2,r,xy,2,式中：S,V,2,代表有效变异数，S,X,2,代表总变异数，r,xy,2,代表测量的效度系数。,一个测验的效度表明，在一组测验分数中，有多少比例的变异数是由测验所要测量的变因引起的，结果用效度系数表示。,118,三效度与信度的关系,1、效度高的测验，信度也一定高，高信度是高效度的必要条件。,2、信度高的测验，其效度不一定高，高信度并非高效度的充分条件。,119,第二节效度的估计,逻辑效度：效度的高低根据教育学或心理学的原理推论和判断，如内容效度和结构效度；,统计效度：效度的高低可以通过统计计算而用数量指标描述，如目标关联效度。,120,一内容效度,内容效度是指测验目的代表所欲测量的内容和引起预期反应所达到的程度。,比如，教师为了解学生在某一学科知识掌握的情况，要进行一个全面的考试。考试不可能包含所有学科内容。于是，就从学科知识范围可能的题目中取样来编成测验，根据测验分数推论学生学科知识掌握的情况。如果测验题目的取样代表性好，则推论将有效；如果题目取样有偏差，则推论将无效。,121,（一）逻辑分析的方法,专家判断,内容效度比（CVR）,内容效度比低的题目就应该被淘汰.然后计算全部测题的内容效度比的平均数,作为内容效度的指标.,缺点:,1) 没有量化指标;,2) 对内容效度的判断不一致;,3) 教育思想或心理学观点不同,所以对内容范围的理解也不同.,122,（二）测验题目与教材内容比较的方法。,1、克龙巴赫方法,2、在传授某种知识之前先对应试者进行一次测验，这时应试者对测验的内容当然知之甚少；然后正式传授这种知识，一定时间后测验所学内容，比较两次测验结果，也可以看出是否测量了课堂上所教的内容。,123,提高内容效度的方法之一：编制命题的双向细目表,124,二结构效度,结构效度是指测验分数能够说明心理学理论的某种结构或特征的程度，也可以理解为测验实际测量了所欲测量的结构和特性所达到的程度。,1、分析某种结构和特征与测验题目的联系，看这些题目是否能测量该种结构和特征。,2、比较两组被试者进行同一测验的结果,3、把自己所编制的测验的施测结果，与另一性质相同而被公认具有较高结构效度的测验结果比较。,125,4、比较先后两次测验的结果。,5、用因素分析法判断结构效度。,6、用计算聚敛效度与区分效度的方法估计结构效度,聚敛效度就是测量某种心理结构的测验分数，要与测量相同结构的其他测量的分数具有高相关。,区分效度是测量某种心理结构的分数要和测量不同结构的测验分数具有低相关。,126,某一智力理论的四项假设:,1.智力随年龄而增长;,2.智商是稳定的;,3.智力与学业成绩有密切关系;,4.智力受遗传的影响.,127,某注意力的理论,注意有如下特征:,1.稳定性,2.集中性,3.转移性,4.分配,5.范围,128,例如,构想：考试焦虑是当考试结果对个人有重大意义时的一种害怕失败的紧张情绪”。,有一个焦虑测验，考察这测验是否有构想效度。,设计几种试验情境：,129,设计1：,比较不同重要性考试时该测验的分数,按照构想，重要考试时焦虑分数高,平时考试中实施此焦虑测验,重要考试之前施该焦虑测验,比较两次分数，如重要考试前的焦虑分数显著提高，就说明这个测验对测量考试焦虑是有效的。,130,设计2：,举行两场考试，使被试相信一场考试关系重大，一场考试无关要紧。,挑选两组被试，高焦虑组和低焦虑组。,比较考试成绩，出现下述情况，说明测验有构想效度：,焦虑分数高组学生，如在第一场考试中成绩比平时有所下降，在第二场考试中却能正常发挥。,焦虑分数低组学生，无论在哪场考试都发挥正常。,131,设计3：,收集被试在经历一场重大考试时的生理心理参数作为焦虑的指标,将其同焦虑测验分数比较,相关高证明焦虑测验测量了焦虑这个特质。,132,三效标关联效度,效标关联效度是指测量分数与作为效标的另一独立测验结果之间的一致程度。,一个好的效标必须具备以下条件：,（）有效性。（）可靠性。（）可操作性。（）实用性。,被预测的行为是检验测验效度的标准，简称效标。因为效标效度需要实际证据，所以也叫实证效度。,例如：,用大学入学成绩预测大学生的学习成绩,用职业测验预测工作能力,用人格测验预测哪种人容易得精神病等。,133,1、效标,所谓效标就是衡量测验有效性的参照标准，指的是可以直接而且独立测量的我们所感兴趣的行为。常见的效标有：,学业成就：如,在校成绩、学业测验分数、学历等可以作为智力和学习能力测验的效标。,等级评定：如对学习成绩、智力、人格、工作等表现可以通过判断评定一个量数，用来作为各有关测验的效标。,临床诊断：临床观察诊断的结果可以作为智力、人格等测验的效标。,134,2、,效标测量：将观念上的效标用可操作的测量确定下来。,例如：对于大学入学测验来说，我们感兴趣的或要预测的行为是“大学的成功”，即入大学后能否学得好。,“大学的成功”就是观念效标，我们必须要数量化或操作化。,比如大学的成绩常常就用来作为对“大学的成功”的测量，所以，大学成就就是效标测量。,135,效标关联效度分成两种：,（一）同时效度,同时效度是一种测验的结果与另一大约同时获得的测验结果（即效标）之间的一致程度。,136,（二）预测效度,预测效度时指测验结果对未来的行为或测验成绩（效标）能够准确预测的程度。,估计预测效度的主要方法有：,1、用计算积差相关系数的方法估计预测效度，并以积差相关数作为效度系数。,2、利用回归方程估计效标分数及计算其置信区间。,3、用计算点二列相关系数的方法估计预测效度，并以点二列先观系数作为效度系数。,137,1、相关法,1) 积差相关,在两组数据都是连续变量,且两者存在线性关系时使用,公式:,138,139,2) 二列相关,在测验分数和效标这两个变量中一个是连续变量,另一个是二分变量时使用.,公式:,140,例: 智商与学校类型的关系,p 重点中学被试百分比 66/302 = 0.1875,q 普通中学被试百分比 286/302 = 0.8125,重点中学被试智商均数 114,普通中学被试智商均数 96,S,t,总体标准差 14.53,y 常态曲线下，p 所对应的纵轴高度 0.2685,141,3) 多元相关,在测验分数和效标变量中有一个是连续变量,另一个是二分以上的变量时使用.,用Juspen公式,4) 四格相关,在两组变量都是二分变量时使用,用皮尔逊余弦,法.,142,相关法求效度的优缺点,优点：,提供一个统计指标以总结预测源与效标间的关系。,可利用回归方程式来预测每个人的期望效标成绩。,效度系数为大家广泛接受，便于比较研究。,缺点：,假如预测源与效标的关系不是直线的，则必须采用特殊的相关法。,测验结果不能提供有关取舍正确性的指标。,143,2、分组法（区分度）,预测源分数能否区分由效标测量所定义的团体。,检验平均数,测验录取一批工人，工作一段后，根据工作成绩（产品数量、质量）分成称职和不称职两组，然后再检查当初的测验分数，用t检验看两组在测验的平均分数上有无显著的差异，如果有，说明测验有预测作用，否则就没效。,当团体数量大时，很小的一点平均数的差异都会有显著意义，此时测验区分这些团体的实际价值就很小。为了避免上述问题，必须把两组的平均分数、标准差、重叠量以及平均分数的差异在统计学上的显著性一并报告。,144,3、命中率,当测验用来作取舍的根据时，其有效性的指标就是正确决定的比例。,预测源分数确定一个临界分数（分数线），高于分数线者接受，低于分数线拒绝。在效标方面根据情况确定一个标准，高于标准为成功，低于标准为失败。此时可以得到预测命中表。,145,效,标,成,绩,测,验,预,测,146,4、功利率,使用测验所花费的费用与得到的利益的比较，看利弊大小如何，这种效度就是功利率。,U=B(NS)C(NU)S (6.5),U代表功利率,B代表录用一个成功的工人所产生的平均利润,C代表录用一个不合格工作造成的损失,NS和NU分别代表录用的人中成功和不成功人数,S代表整个选人程序的费用,147,四表面效度,表面效度时指从外表直观地看来这个两标可以测量所想测量的特性和功能的程度。,内容效度与表面效度的区别,表面效度是指测验看起来所要测量的东西,是被试或外行看来是有效的测验.,表面效度与内容效度并不总是一致的.,表面效度能间接影响测验的效度,所以测验编制时也要适当关注表面效度.,148,表面效度是由外行对测验作表面上的检查所确定的。内容效度是由够资格的专家详尽地、系统的对测验作评价而建立的。,前者只考虑题目与测量目的之间明显的、直接的关系。后者则同时考虑题目与测量目的和内容总体之间的逻辑的微妙关系。,最高行为测验（如能力测验）要求有较高的表面效度，以使受测验者具有较强的动机，尽最大的努力完成。典型行为测验（如人格测验）却要求较低的表面效度，如果受试者很容易就从题目上看出测题的目的，就可能作出假的反应。,149,第三节提高测验效度的方法,一多种效度系数的要求,二提高效度的方法,（一）控制系统误差,（二）精心编制量表,、测验内容要确实能适应测验目的。,、题目表述必须清楚、简明，所用字、词、句能为学生理解，内容应能引起应试者的兴趣，排列由易到难，但前面的题目不应暗示后面的答案。,、题目难度合适，有足够的区分度。,、试卷印刷清楚，无错误和遗漏，并力求精美。,150,（三）妥善组织测验,（四）扩大样本的容量代表性,（五）合理处理效度与信度的关系,（六）适当增加测验的长度,151,第六章测验的难度与区分度第一节难度及其计算,一难度的意义,(一)难度,P=R/N,（二）难度对测验的影响,1 、测验难度影响测验分数的分布形态,2、测验难度影响测验测验分数的离散程度,3 、测验难度影响测验的鉴别能力,越是接近中等难度的题目越具有区分的作用,也就是越是靠近0.50的题目越好,其区分程度越高.,152,如: 1 99 = 99 2 98 = 196,30 70 = 2100,50 50 = 2500,（三）测验的适宜难度,0.50是测验的适宜难度。,153,测验难度影响测验分数的分布形态,难度大，正偏态,难度低，负偏态,154,二难度的计算,（一）计算难度的基本公式,1、以试题通过率计算难度,（1）二分法记分项目的直接计算法,PR/N100,P代表难度，N代表全体被试人数，R为答对或通过该题的人数。,（2）多项选择项目的校正计算法,CP(KP1)/ (K1),CP是校正后的通过率,P为实得通过率,K为备选答案的数目。,155,比如P为75，5个备选时，CP为69；4个备选时，CP为67；3个备选时， CP为63；2个备选时， CP为54。,2、非二分法计分项目的平均分计算法,PX/X,max,100,X为全体受试者在该题目上的平均分数，X,max,为该题的满分。,156,校正难度的作用,检验实际难度,例: 某题通过率为75%,是一个五选一的题目.,比较两个不同选项数题目的难度,例: 有二道题,一题的难度为0.50,有五个选项,另一题的难度为0.53,有四个选项.,157,（二）用极端分组法计算客观性试题难度,（上下27%）,P=（P,H,+P,L,）/2,PH、PL分别为高分组与低分组的通过率,158,步骤：,A、按测验总分由高到低排序,B、从高分段向下选出全部试卷的27作为高分组,C、从低分段向上选出全部试卷的27作为低分组,D、按照上述公式计算项目难度值,159,例：100人参加某测验，高分组与低分组各取27人，其中第一题高分组20人答对，低分组10人答对。这道题的难

展开阅读全文

心理测量学教案昉生

最新文档