心理测量学(基础知识).ppt

资源描述

1 心理测量学 2 上篇什么是心理测量学心理测量起于行为主义盛行的时代人的心理在相当程度上被看成是与一般动物的心理活动有同样的本质所以是可以操控和测量的但是我们今天看到隐秘深邃有限而又无限社会文化使得人类个体的行为远离动物行为的刻板模式更具有随机性而似乎不可确定还是可以测量的吗是的可以言必由衷行必有因言与行提供了人类心灵评估的标尺基于此心理测量依然成为当代心理学工作者的有效技术了返回首页 3 目录第一节概述第二节心理测验的常模第三节心理测验的信度第四节心理测验的效度第五节心理测验的项目分析第六节心理测验的编制程序第七节心理测验的使用退出 4 第一节心理测量学概述心理测量学是心理学的基本方法学课程之一它主要讨论如何借助于标准化的心理测量工具心理测验对个体的心理特征或心理状态进行评估并将其数量化的过程因此它基本的和重点的内容在于心理测验的编制方法质量评估实际应用和结果解释以及经典测验的介绍和使用 5 一心理测量的涵义要素与量表 1 心理测量及其构成元素事物总在不断地运动变化而其运动变化表现为多种属性在质或量上的改变这些可变的事物的属性叫变量利用一定的规则方法或工具使事物的属性数量化即确定一系列事物的属性值就叫测量其构成元素有事物即事物的属性规则数字规则则是指这一过程具有科学依据确定的程序和量化的标准数字一般具有同一性或区分性等级性或位次性等距性可加性当被测量的变量是反映心理活动的属性或特征时这种测量就叫心理测量如记忆力测量气质类型测量焦虑水平测量等 P348 6 2 心理测量的基本要素测量有两个基本要素参照点和单位其中参照点是测量过程计算量的起点包括绝对和相对参照点绝对参照点就是绝对零点相对参照点则根据情境来人为规定也叫相对零点单位是测量中的等值单元它必须具备两个条件有确定的意义有相同的价值就心理测量来说第一测量中几乎没有绝对零点大多是以相对零点来计算的第二测量中很少有相等单位所以在对测量值进行解释时更多看其相对意义或将测量结果等值转换形成相等单位当然心理测量常以行为测量来完成而行为测量中是可以有绝对零点和相等单位的如学习能力无绝对零点但考试成绩有零分 P349 7 3 测量量表及其种类如将事物某一属性的可能取值全部列出并按其相对位置排列就构成了一个测量标尺这一标尺就叫测量量表 measurescale 按照测量量表是否具有绝对零点相等单位以及测量所得数值的对比关系我们可以将测量量表划分为四种 1 命名量表也叫称名量表 2 顺序量表也叫等级量表 3 等距量表 4 等比量表这里需要注意 1 各种量表值的意义 2 各种量表的量化水平 3 各种量表测量值允许的运算加减乘除 4 心理测量大多是在顺序量表上进行的 P349 8 能够用来完成心理测量的标准化工具或程序叫心理测验也叫心理量表定义心理学家依据一定心理学理论和系统观察取样而精心编制的一系列刺激项目及其标准化形式就叫心理测验心理测量就是心理测验的使用过程它是收集个体对这一系列刺激项目的反应资料进而对其心理特征能力及其他心理结构进行评定的过程所以从某种意义上说心理测量就是从人的众多相关行为中进行取样然后由这一行为样本推断其心理品质或心理状态二心理测验的基本概念 1 什么叫做心理测验 P350 9 为理解心理测验再强调三点第一心理测验所提供的是一系列刺激项目借此收集被试对这些刺激的反应资料所以心理测验实际上是进行行为取样的过程为使收集来的行为资料意义较确定测验项目应具体直接语义单一尽量不使用含糊抽象和有较大不确定性的问题第二测验不需要涉及某类行为的所有方面而要有所选择即要进行行为取样选取那些能有效反映所想要测量的心理特征或倾向第三测验应是标准化的即其编制施用评分和结果解释都必须按照系统程序和科学化的规则来进行 P350 10 心理测验的三要素第一行为样组心理测量是通过个体一组相关的行为测量间接完成的所以其成功与否或准确性高低取决于心理测验中的行为取样的有效性第二标准化心理测量更看重个体间测量结果的比较关系为了使得测量结果具有可比性心理测验必须标准化第三客观性客观性是指测量结果较少受到主观的其他偶然因素影响而获得可靠结果进行良好的行为取样和进行标准化都是为了保证测量结果的客观性 P350 11 心理测验的特点决定了心理测量的性质第一因为心理测验提供的是一个刺激序列使用测验所获得的是人对这一刺激系列的反应资料然后再推断其内在的心理特质所以心理测量具有间接性第二针对测验的刺激项目我们获得的主要是被试对刺激的反应倾向或反应强度不具有绝对零点和绝对意义只具有相对意义所以心理测量具有相对性第三测验中的项目选择施测程序结果的分析与解释均是经过标准化的这决定了心理测量具有相对的可靠性即具有客观性 P351 12 2 心理测验的分类按测验的功能或目标不同智力测验特殊能力测验人格测验按测验材料的性质不同文字测验操作测验按测验材料的严谨程度不同客观测验投射测验按测验的方式不同个别测验团体测验按测验对被试要求的不同最高作为测验典型行为测验按测验的目的不同描述性测验诊断性测验预测性测验 P353 13 三如何看待心理测验第一万能论心理测验测验完美无缺可以解决一切问题第二无用论侵犯隐私违背民主原则种族歧视宿命论等第三心理测验就是智力测验心理测验智力测验智商遗传决定论错误看法 P351 14 正确看法第一心理测验是心理学研究和实际工作中的有效工具可以帮助人们收集有关人的心理特征心理状态的资料获得对人的心理活动规律性的认知和进行科学决策第二心理测验作为研究方法和测量工具尚不完善其使用中会带来系统的和随机的误差所以可信但不能全信可靠但不是绝对可靠的无用论和万能论都是错误的第三心理测验不等于智力测验更不能说成是遗传决定论 P351 15 四心理测验在心理咨询中的应用 1 心理测验与心理咨询的关系心理测验对心理咨询的影响 1 提供关于个体心理特质心理状态心理发展的客观资料为教育心理咨询发展预测咨询职业指导提供依据 2 作为诊断甄别与疗效评估的工具使心理咨询具有更高的操作性针对性和有效性 3 巧妙使用可以作为心理咨询与治疗的手段之一达到意想不到的效果心理咨询对心理测验的影响 1 心理咨询与治疗实践的需要直接刺激和推动了心理测验的发展 2 心理咨询与治疗过程获得的资料丰富和推动了心理学理论和测验技术的完善与发展 P355 16 2 我国心理咨询中运用较多的心理测验 1 智力测验比奈智力测验韦克斯勒智力测验瑞文标准推理测验等测查智力发展水平或进行智障诊断 2 人格测验艾森克人格问卷 EPQ 卡特尔16种人格因素问卷 16PF 明尼苏达多项人格调查表 MMPI 等这些测验可以达到了解诊断和预测的目的 3 心理评定量表精神病评定量表躁狂状态评定量表抑郁量表恐怖量表等这些测验主要用来进行临床诊断和疗效评估 P355 17 五心理测验的发展简史 1 现代心理测验的开始 1 英国的高尔顿 F Galton 受达尔文进化论的影响最早关注个体气质特点与智能差异即个性差异为了研究差异的遗传性设计了差异测量的方法这可被看作是心理测验的开端高尔顿提出相关的概念并由他的学生皮尔逊 K Pearson 发展出积差相关为心理测验奠定了统计学基础使心理测验的信度效度评估和进行因素分析成为可能其实际测量集中在1884后的6年波林在测验领域 19世纪80年代是高尔顿的10年 90年代是卡特尔的10年 20世纪头10年则是比内的10年 P357 18 2 心理测验的概念和标准化思想的提出美国著名心理学家卡特尔 JamesM Cattell 于1890年在心理杂志上发表心理测验与测量首次正式提出心理测验 mentaltest 的概念并强调了心理测验标准化制订常模的重要性 P357 19 3 世界上第一个正式的心理测验 1904年法国公共教育部成立了一个专门研究学习落后儿童教育方法的委员会比奈 A Binet 成为该委员会成员他开始着手制订有效方法来甄别学校中那些学习成绩差者哪些是由于智力落后造成的在西蒙 T Simon 医生协助下比奈于次年发表诊断异常儿童智力的新方法公布一个由30个项目组成的粗略量表这就是第一个正式的智力测验被称为比奈西蒙智力测验比内在1908年发表修订版测验时第一次使用了心理年龄 mentalage 简称MA 的概念 P358 20 比奈智力量表后传到美国经斯坦福大学的推孟 Terman 教授修订于1916年发表了被广泛使用的智力测验即斯坦福比奈智力量表该量表第一次提出了智力商数的概念简称智商 intelligenceratio 简称IQ 比内的主要工作从1898年发表人格心理学中的测量提出许多测验开始直至1911年去世去世当年发表了他的智力测验的第二次修订版 P358 21 2 现代心理测验的发展 1 操作测验的发展比奈西蒙量表以言语测验为主制约了对整体智力的测验和测验向某些人群的推广于是出现操作性测验 2 团体智力测验的发展第一次世界大战之前主要是属于个人测验后因战争需要团体智力测验迅速发展 3 能力倾向测验的发展 20世纪30年代因素分析技术使智力结构理论迅速发展促进了智力测验特别是能力倾向测验的发展 4 人格测验的发展 20世纪40年代由于社会动荡人格障碍成为社会生活中的突出问题这推动了人格理论的繁荣和发展也进而推动了人格测验的发展 P358 22 3 现代心理测验在中国的发展在20世纪二三十年代我国早期心理学家进行了比奈智力量表的引进和修订工作陈鹤琴等著名心理学家进行了大量教育心理的测验和研究工作后因抗战爆发测验工作处于停滞建国后的最初几年心理测验也得到发展但后因学习苏联批判儿童学连带儿童学的研究方法心理测验也受到批判进入20世纪80年代后我国的心理测验得到顺利发展主要进行了智力与人格量表的引进和修订近年主要致力于测验的本土化工作编制适合于我国文化背景的智力测验适应行为量表等 P358 23 1 用心理量表将心理现象数量化的方法是 A 个案法B 会谈法C 观察法D 测量法2 测量的二要素是 A 行为样组B 参照点C 客观性D 标准化E 单位3 测量结果可以进行加减乘除运算的量表是 A 命名量表B 顺序量表C 等距量表D 等比量表4 心理测验的要素是 A 行为样组B 参照点C 客观性D 标准化E 单位5 心理测验或心理测量的性质包括 A 神秘性B 间接性C 准确性D 客观性E 相对性返回目录本节学习检测题 24 6 按测验的功能或目标分类心理测验包括 A 个人测验B 智力测验C 文字测验D 特殊能力测验E 人格测验7 下列有关心理测验性质的描述哪项是正确的 A 心理测验可以直接反映心理品质的量B 心理测验分数是心理品质的相对估计C 心理测验分数是绝对客观的没有主观因素参与D 如果两个人的测验分数相等那么他们的心理品质也完全相同8 根据测验目的可将心理测验划分为预测性诊断性和等形式 A 文字性B 非文字性C 计划性D 描述性9 我国心理门诊运用较多的心理测验主要有 A 智力测验B 管理能力测验C 人格测验D 心理评定量表E 团体智力测验返回目录 25 10 最早关注个别差异测量并提出相关概念的学者是 A 高尔顿B 卡特尔C 比内D 推孟11 最早提出心理测验概念并强调要建立常模的学者是 A 高尔顿B 卡特尔C 比内D 推孟12 完成了第一个正式心理测验编制的学者是 A 高尔顿B 卡特尔C 比内D 推孟13 最早使用智力商数概念的学者是 A 高尔顿B 卡特尔C 比内D 推孟14 在比西测验问世后心理测验的主要发展为 A 操作测验的发展B 团体测验的发展C 能力倾向测验的发展D 人格测验的发展返回目录 26 第二节测验的常模常模就是常定模具是衡量被试分数相对高低的固定对照模板它由原始分与导出分组成实际上就是测验所得原始分与在相应人群中该分排位的等级的对照表导出分也叫常模分是根据常模样本施测的分数计算出来的然后就成为评估被试测验分数的标准或基础导出分是具有参照点和单位的一个意义明显的测验量表是一个排位值当被试参加测验得到了原始分数之后与常模对照即可得到排位分一常模与常模分数 27 二常模团体及其测量分数的转换 1 什么叫做常模团体常模团体是具有某种共同特征的人组成的一个群体或者是该群体的一个代表性样本确定常模团体的方法是先由测验将要施测的对象确定一般总体然后根据常模拟适用的范围确定目标总体再从目标总体中抽取一代表性样本就形成了一个常模团体就一个测验可以根据被试特征的不同选择出多个不同的常模团体制订出多个常模以适用于对不同被试的测量与评估一常模团体 P360 28 2 常模团体的条件适合于选用的常模团体必须符合下列条件 1 所测群体的构成必须是界定明确的 2 常模团体必须是所测群体的代表性样本以保证分数的分布特征与目标总体一致 3 样本大小要适当样本大小的关键是看其是否具有代表性总体小只有几十人则需100 的样本总体大样本也要大一般不少于30或100人全国性常模一般应有2000 3000人为宜 4 具有时空的新近性 P360 29 3 常模团体的取样方法取样就是从目标总体中抽取有代表性的样本其方法包括概率性抽样和非概率性抽样两类具体做法有 1 简单随机抽样 2 系统随机抽样 3 分组抽样 4 分层抽样 5 整群随机抽样 P361 30 4 常模团体的抽样误差略我们期望常模团体能完全代表总体即常模团体测验得分的平均分及其分布状态与所在总体完全重合但实际上很难做到在抽样过程中会产生误差当这种误差一旦出现就会成为一个常模中的系统误差所以有必要对该误差大小进行估计以便能估计出使用这个常模来评定被试成绩时可能产生的误差范围统计学使用标准误来估计抽样误差它与被试异质性成正比与样本容量的平方根成反比即 31 试比较下列两组数据 32 二常模团体分数的转换常模团体的被试均按标准程序参加测验就可以得到每个被试的测验分数将这些分数按大小顺序排列就可以得到一个分数分布表一系列排位等级由此可确定各种等级位数和标准分数百分等级百分点百分位数十分位数四分位数标准分等有了上述排位值或标准分就可以找到某一被试测验分数的相对排位这种排位值就是常模分数 P361 33 返回目录 34 三常模的类型 1 发展常模年龄量表 1 发展顺序量表发展顺序量表就是对正常儿童样本的心理或行为能力的发展顺序进行观测并制订出各种发展水平与年龄的对照表这种对照表就是发展顺序量表它可以提供给人们的是关于各年龄正常儿童所具有的能力或行为方式它是最直观的发展常模最早的范例是葛塞尔发展顺序量表 P363 35 葛塞尔发展程序表葛塞尔发展程序表是按月份显示儿童在运动水平适应性语言社会性四方面大致的发展水平他强调儿童发展的规律性顺序性具体如 4周能控制眼睛运动去追随一个对象 16周能使头保持平衡 28周能用手抓握东西并摆玩它 40周能控制躯干坐立或爬行 52周能控制腿脚运动站立或行走 P363 36 皮亚杰关于儿童发展的研究皮亚杰的研究着重于从婴儿到十多岁儿童认知过程的发展尤其注重某些特殊概念的形成其中最著名的工作就是对守恒概念的研究他发现儿童不同时期出现不同的守恒概念 5岁时出现质量守恒概念 6岁时出现重量守恒概念 7岁时出现容量守恒概念 P363 37 2 智力年龄比奈西蒙智力测验最先使用了智力年龄的概念这个量表实际上是一个智力发展的年龄量表根据儿童所能完成的题目处在哪一年龄就把这一年龄称为他的智力年龄简称智龄 IA 在吴天敏修订的比奈智力量表中每个年龄有六个题目所以每完成一个题目相当于智龄两个月这些题目的难度是呈梯级增加的这样可以根据被试完成的题数确定其智龄 P363 38 3 年级当量年级当量就是年级量表测验结果说明被试的能力或学绩达到了哪一年级的水平年级量表的单位通常为10个月 4 5的年级当量代表的是第4年级中的第5个月水平或说中间水平而不是指4 5年级的平均水平 7 3代表的是7年级中的第3个月水平 P364 39 2 百分位常模百分位常模包括百分等级和百分点四分位数十分位数未分组资料的百分等级百分点也叫百分位数计算 P364 40 3 标准分常模标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表常见的标准分数有 z分数 Z分数 T分数标准九分数离差智商 IQ 等在线性转换中加上一个常数是为消除负数乘上一个常数是为了去掉小数点如将原始分数转换为平均数为50 标准差为10的标准分则叫做T分数 T 50 10z 最早提出者是麦柯尔 P365 41 非线性转换的标准分数了解标准九分是一9级的分数量表它是以5为平均数以2为标准差的一个分数量表标准十分是一10级的分数量表其以5为平均数以1 5为标准差标准二十分是一20级的分数量表其以10为平均数以3为标准差 P365 42 4 智商及其意义 1 比率智商但是用比率智商反映个体的智力发展概念有缺陷首先心理年龄 MentalAge 简称MA 与实足年龄 ChronologicalAge 简称CA 并不同步增长所以比率智商不适合于年龄较大的被试其次不同年龄组儿童的比率智商分布的情况不一样所以相同的比率智商在不同年龄就具有不同意义 P366 43 2 离差智商离差智商是一种以年龄组为样本计算而得标准分数并且转换成平均数为100 标准差为15的标准分数其中 X为一被试的测验分数 M为相应年龄组常模样本测验的平均分 SD为相应年龄组常模样本测验的标准差 P366 44 四常模分数的表示方法 1 转换表法转换表也叫常模表一个转换表显示出一个特定的标准化样组的原始分数与其相应的等值分数百分位标准分数 T分数或者其他任何分数利用转换表可以将被试的测验分数转换为与其对应的导出分数 P368 45 2 剖面图法剖面图是将测验分数的转换关系用图形表示出来从剖面图上可以很直观地看出被试在各个分测验上的表现及其相应的位置 46 47 1 常模团体必须是所测群体的 A 总体B 优秀分子C 随机样本D 代表性样本2 全国性常模一般常模团体应有人为宜 A 30 100B 100 500C 2000 3000D 5000以上3 最早的发展顺序量表是制订的 A 比内B 皮亚杰C 葛塞尔D 科尔伯格4 皮亚杰特别关注一些特殊概念形成的研究如概念的研究 A 数量B 守恒C 顺应D 同化5 百分位常模包括 A 百分等级B 百分点C 四分位数D 十分位数本节学习检测题 48 6 小明语文分数在全班50名同学中排15名则其百分等级为 A 15 B 30 C 71 D 85 7 常见的标准分常模有 A T分数B 百分位数C 离差智商D 标准九分数8 标准T分数的平均数为50 标准差为 A 5B 10C 15D 不确定9 标准九分的平均数和标准差分别为 A 5 1B 6 1C 5 2D 6 210 标准十分的平均数和标准差分别为 A 5 1B 6 1C 5 1 5D 6 1 511 使用最广影响最大的常态化标准分数是 A T分数B 比率智商C Z分数D 离差智商 49 12 16PF的量表分是 A 标准九分B 标准十分C T分数D Z分数13 比率智商是指 A 实足年龄与心理年龄之比B 心理年龄与实足年龄之比C 心理年龄与实足年龄之差D 实足年龄与心理年龄之差14 在斯坦福比内量表的发展中其主要特征是 A 测验成绩用智龄表示B 首次引用智商概念C 用离差智商代替比率智商D 用L型和M型两个等值量表15 下面哪一个是离差智商 A IQ MA CA 100B IQ MA CA 100 C IQ 100 15 X X SDD IQ 50 15 X M SD16 最简单和最基本的常模表示方法是 A 比率智商B 离差智商C 转换表D 剖面图 50 第三节测验的信度分析信度是指同一被试者在不同时间内用同一测验或用另一套相等的测验重复测量所得结果的一致性程度前后测验分数一致性程度高即可信度高反之可信度低一信度的定义 P371 51 信度的本质一般来说使用一个工具对个体进行测量时所得结果由两部分组成 X T E 其中 T是真分数它是稳定的值 E是随机误差它的变化是随机的如重复进行测量随机误差会造成分数起伏变化随机误差小实测分数起伏小信度较高相反随机误差大实测分数起伏大数据不稳定信度较低所以信度受随机误差而不是系统误差影响理论上讲要评估工具的信度就要对一个人反复进行测量看前后结果的稳定性但是这在很多时候是行不通的 52 通常的做法是选取一个被试团体即样本使用一个工具对样本团体中的每一个体进行测量得到一组数据这一组数据的总变异方差Sx2 ST2 SE2 如果测量中没有随机误差则实测数据总方差就等于真分数方差数据完全可信如果随机误差很大真分数方差只占总方差中很小一部分数据几乎全无可信如果随机误差较小真分数占总方差的大部分则信度较高于是信度被定义为一组测量分数中真分数的方差与测验分数的总方差之比该比率也叫信度系数由公式看出随机误差引起的方差越小信度系数越接近于1 53 54 二信度的指标信度的定义是明确的但是在一组测量分数中真分数方差是未知的所以真分数方差与误差方差无法分离信度系数计算仍然是一句空话不过可以设想让一个被试团体接受同一种工具的两次测量因为实测分数由真分数和随机误差组成随机误差较小时实测分数主要由真分数组成而真分数在前后两次测量中是稳定的所以前后两次实测分数一致性就高具有较高的正相关反之就具有低相关甚至负相关所以两次测量结果的相关可以间接反映测量随机误差大小信度系数就是一种相关系数信度系数成为可计算的指标了 1 信度系数与信度指数 P371 55 信度指数等于真分数标准差与实测分数标准差的比值所以信度系数正好等于信度指数的平方信度指数 P371 56 何谓相关呢相关系数的意义是什么 57 2 测量的标准误随机误差的标准差也就是标准误对于一个样本的测量来说分数的标准差一部分是反映个体真值的差异性一部分是反映随机误差的起伏变化性即误差的标准差根据前面的信度公式可以推导出 SE越大 rxx就越小反之 rxx就越大所以标准误也是一种信度指标 P371 58 三信度评估的方法 1 重测信度 test retestreliabllity 又称稳定性系数使用同一测验在其他条件相同的情况下对同一组被试者前后施测两次测验求两次得分间的相关系数一般是2 4周较宜间隔时间最好不超过6个月 P372 59 2 复本信度 alternate formreliability 以两个等值但题目不同的测验复本来测量同一群体然后求得被试者在两个测验上得分的相关系数复本信度反映的是测验在内容上的等值性故又称等值性系数某种意义上它更像效度 P372 60 3 内部一致性信度 1 分半信度 split halfreliability 这个相关系数就代表了两半测验内容取样的一致程度式中为rhh为一半分数的相关系数 rXX为测验在原长度时的信度估计值 P373 61 2 同质性信度 homogeneityreliability 代表测验内部所有题目间的一致性如果各项目测量同一心理特质则项目间得分应有显著的正相关这时内部一致性较高信度较高如果项目间出现低相关或负相关则内部一致性差信度不高当测验包含多个分测验时则应首先计算各分测验的同质性信度再计算全量表的同质性信度对二项记分测验使用库德理查逊公式计算同质信度对于多等级记分的测验计算克伦巴赫系数来估算信度大小对于项目编排时专门进行反向记分处理的项目要在计算同质性信度之前对记分进行反向调整 P373 62 4 评分者信度随机抽取若干份测卷由两位评分者按评分标准分别给分然后根据每份测验卷的两个分数计算相关即得评分者信度一般要求在成对的受过训练的评分者之间评分一致性要达到0 90以上才认为评分是可信的当评分者人数达到三人以上时通过计算肯德尔和谐系数来估价评分者信度 P373 63 四信度与测验分数的解释 1 解释实测得分与真分数的相关信度系数反映了实测分数变化与真分数变化的一致性程度当rxx 1 00时二者完全一致实测数据的变异量方差全部是由于真分数不同引起的当rxx 0 00时则说明实测分数的变异量全部是由随机误差起伏变化引起的实测数据变化没能反映真分数不同的任何信息当rxx 0 90 说明实测数据变化的90 都是由真分数不同引起的实测分数反映了真分数大部分的变化信息具有高的可信度所以信度系数也反映了测量的随机误差比例 P373 64 在根据信度水平决定是否采用某一测验时需要重点考虑测验的目标和功用一般能力测验和成就测验信度应在0 90以上人格态度兴趣价值观等测验信度应在0 80以上另需注意 1 信度系数低于0 70时测验不能用于对人的评价和预测也不能用于作团体间的比较达到0 70以上可用于作团体比较达到0 85以上测验可用于对个人的评价和预测 2 新编测验的信度应高于同类测验或相似测验 2 确定测验的可接受程度 P374 65 3 解释个人分数的意义两个作用其一是估计真实分数的范围其二是了解实得分数再测时可能的变化情形 P374 66 五信度的影响因素信度常用信度系数来表示信度系数就是相关系数相关系数的获得需要一个被试样本或叫样本团体 1 样本团体异质性的影响当样本异质性高时计算的信度系数会较大可能会高估测验的信度反之计算的信度系数较小可能会低估测验信度 2 样本团体平均能力水平的影响样本平均能力水平的高低也会影响分数的分布所以也会影响信度计算一般要求在给出信度系数时也要描述相应的测量样本 1 被试样本特征 P375 67 2 测验的长度测验的长度即测验的项目数会影响测验的信度 1 测验越长测验的测题取样或内容取样越具有代表性 2 测验越长被试的猜测因素对结果的影响就越小但是增加测验长度的效果是遵循报酬递减率原则的这里可以利用斯皮尔曼布朗公式的导出公式了解测验长度与信度系数的关系要使测验的信度从原来的rxx提高到rkk 则测验的长度需要增加到原来的K倍 P376 68 3 测验的难度对于能力与成就测验来说存在难度问题一般来说中等难度的测验计算出来的信度系数较大太难和太容易都会使信度较低对于简答题难度为0 50 求得的信度较高对于选择题因有猜测成分所以难度应适当提高 P376 69 4 时间间隔对于重测信度和不同时测量的复本信度来说存在时间间隔问题时间间隔越短计算得到的信度系数越大时间间隔越长信度系数越低一般是2 4周较宜间隔时间最好不超过6个月 P376 70 1 衡量测量结果一致性程度的指标是 A 区分度B 难度C 信度D 效度2 下列可作为信度指标的是 A 信度系数B 信度指数C 标准差D 标准误3 重测信度反映的是测验在上的稳定性 A 内容B 时间C 空间D 误差4 复本信度反映的是两个测验在上的一致性 A 内容B 时间C 空间D 误差5 重测信度的计算中重测的时距一般最多不要超过 A 2周B 4周C 4月D 6月本节学习检测题 71 6 内部一致性信度主要包括两种 A 分半信度和重测信度B 重测信度和复本信度C 复本信度和同质性信度D 分半信度和同质性信度7 二级评分测验同质信度可用以下方法计算 A 分半信度B 库德理查逊公式法C 系数法D 重测信度法8 计算的分半信度为0 80 那么整个测验的信度大约为 A 0 80B 0 85C 0 89D 0 959 用库德理查逊公式计算信度的方法适用于 A 多等级选择测验B 判断题测验C 多项选择和判断题测验D 简答题10 克伦巴赫系数法适合于测验的信度计算 A 多等级选择测验B 判断题测验C 多项选择题测验D 简答题 72 11 评估评分者之间一致性的信度是 A 复本信度B 肯德尔和谐系数C 同质信度D 分半信度12 一个测验选用哪种方法计算信度主要是看 A 哪种因素导致更大的误差B 哪种因素导致的误差最小C 哪种方法更简单D 对哪种方法更熟练13 要取得较高的同质信度测验内部项目间得分要有 A 较高正相关B 较高负相关C 较低正相关D 较低负相关14 当一个测验的信度系数为0 85时就可以说 A 真分数变异占总变异的85 B 真分数变异占总变异的15 C 随机误差变异占总变异的85 D 随机误差变异占总变异的15 15 一般的能力测验和成就测验的信度系数应达到以上 A 0 70B 0 80C 0 90D 0 95 73 16 影响信度的因素包括 A 样本特征B 测验长度C 测验难度D 时间间隔17 样本团体同质性高则计算的信度系数 A 会低估测验的信度B 会高估测验的信度C 会偏低D 会偏高18 当希望以增加测验长度的方法使其一50题组成的测验的信度系数从0 85提高到0 90 那么测验长度要增加题 A 30B 60C 80D 9019 受时间间隔影响的信度计算是 A 重测信度B 分半信度C 同质信度D 克伦巴赫系数 74 第四节测验的效度一效度的概念 1 什么叫做效度在心理测验中效度是指一个测验所能测量到它想要测量的心理特质或倾向的程度也就是它对测量目标测量的准确性测量分数可分解为真分数和随机误差真分数可以再分解为两部分反映测量目标水平的分数和系统误差即与测量目标有关的部分和与测量目标无关的部分效度是在一组测量分数中与测量目标有关部分的方差S2V与总方差S2X之比 P379 75 2 效度的性质 1 效度具有相对性任何测验都是针对一定目标编制的用于该目标就会有效用于其他目标就可能无效对某一总体有效的测验对于其他总体未必有效某一心理学家认为有效的测验其他心理学家可能认为无效 2 效度具有连续性说明一测验效度也是用相关系数表示有高低之分非有和无之差二是效度是针对测量结果来说的 P379 76 3 效度与信度的关系 1 信度是效度的必要条件但不是充分条件 2 效度总会受到信度的制约它不会超过信度的平方根 P380 77 二效度评估的方法美国心理学会在1974年所发行的教育与心理测量之标准一书中将效度分为三大类内容效度构想效度效标效度 1 内容效度 content relatedvalidity 内容效度是指测验项目在内容上的适合性即是否是所欲测量的行为领域的代表性取样要编制有高内容效度的测验就要对测量的心理特性有明确的定义并划定出相应的行为内容其次测验题目应是所界定的行为内容的代表性取样 P380 78 内容效度的专家评定法专家评定是最常用的内容效度评估方法是请有关专家对测验题目与测量目标的符合性程度作出评判看测验的题目是否代表欲测的内容也可以请专家对测验项目的适合性进行定量评定专家的判断多是依赖于对内容的逻辑分析所以这种评估的效度也叫做逻辑效度 P381 79 关于内容效度要注意的两个问题第二内容效度与表面效度的区分最高作为测验可以有比较高的表面效度典型行为测验则要有比较低的表面效度但两类测验都要有高的内容效度第一测验要有高的内容效度但不一定要有高的同质性 P381 80 2 构想效度 1 什么叫做构想效度构想效度就是一个测验对于某一理论构想或内在心理特质假设的证实程度测量程度所以也叫做构思效度结构效度等建立构想效度的逻辑顺序基于相关专业知识和观测资料提出某一心理特质假设或某一心理结构理论假设然后根据理论或假设所可能对应的行为特点编制测验并进行施测最后对测量结果进行相关或因素分析验证其与理论假设的符合程度 P382 81 2 构想效度的评估方法从测验的组成成分来分析其结构是否与理论构思一致常用因素分析方法来确定测验的结构成分当使用一个新编制的测验对目标群体施测后对测验项目进行因素分析还可以通过计算相容相关和区分相关来间接验证所编测验能够测量的是不是某一种心理特质或理论构想 P382 82 3 效标效度 1 什么叫效标效度效标效度是指使用测验分数预测个体在某种情境下行为表现的准确性被预测的行为同时也就成为检验测验有效性的效标这种效度也叫实证效度根据效标资料与测验分数获得的时间不同效标效度又分为同时效度和预测效度二者差异主要在于测验的目的不同同时效度与用来诊断现状的测验有关后者与预测将来结果的测验有关 P383 83 2 效标效度的评估方法相关法区分法命中率法 P384 84 4 效度系数的计算方法效标效度的计算第一步取得测验分数x和效标分数y 好的效标需要具备下列条件有效的反映测验的目标具有较高的信度稳定可靠可以客观地加以测量可用数据或等级来表示测量的方法要简单省时省力经济可用 85 当测验分数效标资料均为连续数据时使用积差相关当测验分数效标资料均为等级变量时使用等级相关第二步根据两种分数的性质选用适当方法计算相关系数 86 三效度系数的作用预测效标效度系数的实际意义常以决定系数表示即效度的内涵为相关系数的平方它表示测验正确预测或解释的效标方差占总方差的比例如测验的效度是0 80 则测验分数能正确预测效标分数变异量的64 效度系数是根据测验分数和效标分数计算出来的相关系数所以它也反映了二者所具有的共变关系这样就可以建立二者的回归方程式以便由测验分数预测效标分数 P385 87 如果用一被试的测验分数来估计他的效标分数误差会有多大呢这用标准误来估计从公式看效度系数的大小与估计的误差有关如果效度系数rxy 1 00 则估计误差等于0 通过测验分数可准确预测效标分数变化如果rxy 0 00 则以测验分数无法估计效标分数以测验分数预测效标则无异于猜测 P385 88 预测效率指数据预测效标分数的标准误计算公式无关系数K的计算公式 K反映了测验分数与效标分数的无关程度它受效度系数的影响当效度系数等于1时 K 0 测验分数与效标分数有完全的对应关系当效度系数等于0 K 1 测验分数与效标分数100 的无关测验与效标分数完全无关它对效标分数没有任何预测力当效度系数等于0 90时可以计算出K 0 436 即测验分数与效标分数的无关程度是43 6 预测效率指数就是56 4 即使用该测验预测被试的效标分数较之瞎猜可以减少56 4 的误差 P386 89 四效度的影响因素根据前文关于信度和效度概念的分析知道随机误差影响信度进而影响效度系统误差直接影响效度本身所以凡是会产生随机误差和系统误差的因素都会影响测验的效度 P386 90 1 测验编制本身的因素测验取材的代表性长度试题类型难度区分度以及编排方式等都会影响效度为此编制要注意 1 测验材料要有应测内容具有代表性 2 尽量避免误差较大的题型如是非题 3 难度要适中具有较大的区分度 4 测验长度要恰当保证一定的题量 5 测题的排列应先易后难 P386 91 2 测验施测过程中的干扰因素 1 测验实施中主试的影响如是否按标准化来实施测验与效标测量的实施的时间间隔测验环境的布置等 2 测验实施中被试的影响如被试参加测验的动机情绪态度身体状态反应定势等 P386 92 3 所抽取的样本团体的特点 1 样本团体的异质性其他条件相同样本团体同质性越高分数范围越小得到的效度系数就会越低会低估测验效度反之得到的效度系数就越大可能会高估效度比如只使用经选拔后的被试组成样本团体增加了被试同质性测验得到的效度系数会较低 2 干涉因素样本团体的有些变量会影响效度测验比如被试的年龄性别受教育程度智力动机兴趣职业等特征对于同一个测验来说使用的样本团体不同得到的效度系数也会不同 P387 93 4 效标的性质 1 效标与测验分数是否是线性关系 2 效标测验本身的可靠性即信度 P388 94 1 效度是指测验的准确性即 A 真分数方差与总方差之比B 随机误差方差与总方差之比C 与测量目标有关的真实方差与总方差之比D 真分数方差与系统误差方差之比2 反映测验题目是否是所欲测量的行为领域的代表性取样属于 A 内容效度B 构想效度C 效标效度D 表面效度3 使用专家判断法评估的效度也叫 A 效标效度B 表面效度C 逻辑效度D 构想效度4 在下列测验中最需要降低表面效度的测验是 A 智力测验B 气质测验C 性格测验D 学绩测验本节学习检测题 95 5 当效度系数等于1时被试的测验分数 A 可以准确预测其效标分数B 对效标分数没有任何的预测力C 就是效标分数D 与效标分数有最大的正相关6 影响效度的因素包括 A 测验本身B 主试因素C 被试因素D 效标的性质7 用下列样本评估中学生智力测验效度得到较大效度系数的是 A 全省中学生的代表性样本B 全省重点高中学生的代表性样本C 全省青少年的代表性样本D 全省当年高考一本上线代表性样本 96 第五节项目分析一项目的难度 1 难度的定义测验项目的难易程度通常以题目的通过率为指标 2 难度的计算方法 1 二分法计分项目最简单方法就是以被试在该项目上的通过率评估难度当被试人数多时可以高分组和低分组通过率的平均数来评估 P PH PL 2 P389 P R N 100 97 在有多选项的选择题中为了平衡机遇因素的影响可采用吉尔福特的难度校正公式来计算难度 Cp为校正后的通过率 P为实际得到的通过率 K为被选答案数 98 2 非二分计分的项目即以被试在某一项目上得分的平均值除以该题满分再乘以100 P390 99 3 难度水平的确定 1 项目难度的确定难度分析的目的在于筛选项目难度确定取决于测验的目的性质以及项目的形式一般来说 P值越接近于0 50 区别力越高为了使测验具有更大的区别力各题目难度可考虑控制在0 50 0 20 当测验用于选拔时可较多地选择难度接近于录取率的项目当测验用于筛选或诊断出少数被试则难度要比较低即P值要比较大 P390 100 2 测验难度的确定整个测验的难度取决于组成项目的难度如果测验分数接近于常态分布说明整个测验的难度较为恰当如果出现明显的正偏态分布说明难度偏大可增加一些较容易的题目如果出现明显的负偏态说明难度偏小可增加一些难度较大的题目 P390 101 二项目的区分度 1 项目区分度的定义项目区分度也叫鉴别力是指测验项目对被试的心理特性倾向性或发展水平的区分能力项目区分度的取值范围在 1 1之间主要是指项目得分与实际能力水平之间的相关程度相关系数越大区分度越高 P391 102 2 区分度的计算方法 1 鉴别指数通常以测验总分高分组前27 和低分组后27 在一项目上通过率或得分率之差作为该项目的鉴别指数即D PH PL 美国测量专家伊贝尔 L Ebel 提出了一套项目鉴别指数的平均标准 0 40 很好0 30 0 39 良好修改后更佳0 20 0 29 尚可但需修改0 19以下差必须淘汰 P391 103 2 相关法计算区分度最常用的方法是以某一项目分数与效标成绩或测验成绩总分的相关作为该项目区分度的指标相关越高表明项目越具有区分功能 P392 104 3 区分度与难度的关系一般来说中等难度的项目区分度最大但是区分度和难度都是相对的有条件的较难的项目对高水平的被试区分度高较容易的项目对低水平的被试区分度高中等难度的项目对中等水平的被试区分度高测验中项目的难度分布最好也是常态分布的其中很难的和很容易的项目都较少中等难度的项目最多平均难度在0 50左右这样可以提高整个测验的鉴别力 P392 105 下列公式中属于难度计算的是 A R N 100 B P PH PL 2C KP 1 K 1 D D PH PL 能够更好的区分被试之间差异的测验项目的难度一般是 A 0B 0 5C 1D 无所谓3 下列测题区分度D属于很好的是 A 0 6B 0 41C 0 36D 0 284 对于选拔性测验来说测验的难度应该 A 较小B 中等C 较大D 无所谓5 对于诊断性测验来说测验的难度应该 A 较小B 中等C 较大D 无所谓本节学习检测题 106 第六节心理测验编制的程序第一步测验的目标分析简单地说就是要 1 确定测量的对象群即测量总体2 确定测量结果的用途3 确定测量的具体内容 P394 107 1 测量的对象测验编制前要明确测验适应的团体只有对受测者的年龄受教育程度社会经济地位和阅读水平有清楚了解测验编制才能做到有针对性举例来说被试理解题意吗 108 2 测量结果的用途测验目的结果的用途不同测验的选材范围和项目难度都会有所不同 P394 109 3 测量的目标测验目标就是缩编测验欲测量的心理变量或行为倾向为使测验有效需对测量目标进行分析目标分析可分为三种情况 1 工作分析也叫任务分析是针对特定领域或岗位的选拔性或预测性测验所进行的目标分析分两步先确定特定工作或活动取得高绩效所需要的心理特质或行为倾向再建立考察被试绩效的效标 2 给特定概念下定义即分析所要测量心理特质或品质的内涵并在此基础上给出操作性定义便于将抽象的心理特质具体化 3 确定测验具体内容描述性显示测验编制前要确定测验所要显示的内容和技能以便从中进行内容取样常使用双向细目表 P395 110 第二步测题的编写目标分析需要大量调研而测题编写时也需要开展调研以搜集可以写进测验的项目下列资料是获得测验项目的重要参考 1 已有标准测验即从已有测验中选择修订项目为新测验所用 2 理论和专家经验根据理论构念将其具体化为外显行为从而作为测题使用专家经验可直接提供测验题目 3 临床医生和护理人员教师的观察和工作记录这是测验行为取样的主要源泉如MMPI 罗夏墨迹测验学习适应性测验等 1 项目来源 P396 111 2 命题的一般原则 1 内容方面符合测验目的避免贪多而乱出题内容取样要有代表性题目间互相独立且要尽量避免复合性测题 2 文字方面使用准确的当代语言避免生僻字词语句表述要充分简明扼要一句话说明一个概念即语义单一明确清晰尽量不用双重否定 3 理解方面题目应有确切答案除创造力测验和人格测验外不应具有引起争议的可能不要超出受测者的知识水平和理解力 4 社会敏感性方面尽量避免有社会敏感性的问题 P396 112 2 编制要领 1 选择题 2 是非题 3 简答题 4 操作题 P396 113 第三步测验的编排和组织 1 试题形式的选择 1 根据测验的目的和材料性质选择试题形式 2 根据受测者团体的特点选择试题形式 3 根据实际的制约因素选择试题形式如被试者人数时间和经费限制等 P399 114 2 题目审定是测验编制者或有关专家对题目反复审查修订改正意义不明确的词语取消一些重复和不适宜的题目组成预备测验题目审定时需要注意以下问题 1 除必要的调整外审核题目的内容及结构是否与计划一致 2 保留的题目数量应比最后所需题数多出一倍至几倍以备筛选和制作复本使用 3 题目的难度要适当符合测验目的的需要 4 题目的说明必须清楚明白 P400 115 3 测题的编排测验题目选出之后根据测验的目的性质被试的可能心理反应加以合理编排一般应依照以下原则 1 测题宜由易到难排列 2 尽可能将同类型的测题组合在一起 3 注意根据各种类型测题本身的特点排列题目 4 尽量将涉及个人敏感性话题的题目排在后边 P400 116 测题的编排方式 1 并列直进式将整个测验的试题或项目按照性质或测量目标不同单列为几个分测验此为并列而每个分量表中的项目由易到难排列此为直进通常智力测验是采用这种排列方式 2 混合螺旋式将整个测验的试题或项目按难度分层然后在每一个难度层次里将各分测验或分量表的项目交叉混排使测验难度逐渐升进被试能较好维持作答兴趣如比内西蒙智力量表 P401 117 第四步预测项目分析与修改测验基本成型后需要从目标总体中选择一定容量的样本进行预测预测之后要做项目分析以评估测验的质量和为进一步的修改完善提供客观依据 P401 118 1 预测的目的预测的目的在于获取被试对测题的反应资料以便从定性和定量两方面分析测题乃至整个测验的质量比如哪些题目的意义不清容易引起误解是否存在时限长度不合适某些题目容易引起被试反感等意想不到的情况施测过程中是否还存在需要进一步控制的因素等 P401 119 2 预测时应注意的问题 1 预测对象应来自目标总体取样有代表性规模要合适 2 预测的过程和环境应尽量接近将来实际施测的过程和环境 3 预测的时限应放宽尽量让每个被试将题目做完 4 预测过程中随时记录被试反应如被试进度不理解的题 P401 120 3 预测后的项目分析与修改预测后对测题及整个测验进行定性和定量分析定性分析主要是关于题目的适切性思想性表达清晰性和准确性等定量分析主要是对预测资料进行统计分析以评估题目的难度区分度备选答案的合适度等根据分析结果对测验进行修改和完善包括修改增删项目调整测验的编排结构等然后再预测再分析再修改此过程可循环多次以获得满意的测验 P401 121 第五步质量评估及其参数计算测验编好后可在小范围内试用以对其可信度和有效性进行初步鉴定确定其是否可用被认为是可用的测验可以在一个较大的代表性样本中试测并依据测验资料估价测验的信度效度 P402 122 第六步常模制订常模是依据标准化样本测量分数分布模式制订出来的而标准化样本就是来自目标总体的较大的代表性样本将测验在标准化样本中施测然后将所得分数进行统计整理形成一个具有代表性的分数分布即常模常用的心理测验常模包括百分位常模标准分常模发展常模及商数等 P402 123 第七步编写指导手册指导手册的内容包括 1 测验的目标和功用 2 测验的理论背景材料选取的原则方法和统计指标 3 指导语 4 测验的标准答案或计分标准 5 常模资料包括常模表常模适用团体测验分数的换算和解释方法 6 测验的基本特征难度鉴别力信度效度和因素分析等资料 P402 124 1 命题的一般原则涉及以下几个方面 A 内容B 文字C 理解D 社会敏感性2 题目审定时可对初选的题目进行删减一般保留的题目是 A 少于测验所需的题目以便为增加新题目留有余地B 等于测验所需的题目C 多出一倍至几倍以便筛选和编制复本D 尽可能的多以便精选项目3 心理测验常用的测题编排方式有 A 难以交叉式B 并列直进式C 混合螺旋式D 随意混排式本节练习题 125 4 编制测验时进行预测的目的是 A 对测题质量进行定性分析 B 对测题质量进行定量分析 C 测试时

展开阅读全文

心理测量学(基础知识).ppt

最新文档