心理测量学(心理量表的介绍和操作)

资源描述

,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,心理测验和常用量表的操作,顾海根教授主讲,上海师范大学应用心理系主任,第一章绪论,第一节心理测验的发展简史,第二节心理测验的性质与种类,第三节心理测验的用途与使用中的注意事项,第一节,心理测验的发展简史,一、第一个科学心理量表-比纳西蒙智力量表,1.测验编制的历史背景,2.比纳西蒙量表的特点,1)以智力年龄表示智力高低 2)既测量低级的,心理过程，又测量高级的心理过程 3)测量一,般智力,3.比纳一西蒙量表的不足 1)测量高级心理过,程的测题不够多 2)没有统一的测验手续 3)某,些项目排放的位置不对,二、心理测验的发展,1.斯坦福一比纳智力量表推孟(Terman)1916年,智商与智商公式 IQ=(MA/CA)100,2.团体智力测验美国军队甲种和乙种量表,3.韦克斯勒智力量表,学前与学龄初期量表、儿童量表和成人量表,离差智商 IQ=100+15Z,4.人格测验的发展 6.教育测验的发展,三、我国心理测验的发展,(一) 我国古代心理测验思想,(二) 我国近代心理测验的产生与发展,(三) 我国现代心理测验的发展,(一)、我国古代心理测验思想,1.先秦时期的心理测验思想,孔子的差异心理思想,孟子的万物皆可测量的思想,2.科举考试对心理测验的影响,3.古代对心理测验的尝试,杨雄与词汇测验,刘劭与人物志,智力玩具与智力测验,(二)、我国近代心理测验的产生与发展,1.我国最早的心理测验 1914年广东,2.比内-西蒙测验的介绍 1916年樊炳清,3.“小学生毛笔书法量表”的编制 1918年俞子夷,4.测验课程的开设 1919年廖世承陈鹤琴,5.第一本心理测验专著智力测验法1921年廖世承陈鹤琴,6.麦考尔来华讲学 1922年,7.大规模教育调查 1923年,8.第一次修订比内测验 1924年陆志韦,9.中国测验学会成立 1931年,10.测验杂志创刊 1932年,11.第二次修订比内测验 1936年,三、我国现代心理测量发展,1.“禁区”开始被打破 1979年,2.心理测量学习班与心理测验协作组成立,1979年在长沙龚耀先医学卫生系统,1980年在武汉林传鼎张厚粲师范院校,3.大量国外量表被修订,1982年龚耀先修订韦氏成人智力量表,1982年吴天敏第三次修订比内量表,3.大量国外量表被修订,1981年刘绍衣修订“卡特尔16种人格因素测验”,1985年宋维真修订“明尼苏达多相人格调查表” 张厚粲修订“瑞文标准推理测验”,1986年林传鼎、张厚粲修订“韦氏儿童智力量表”龚耀先修订“韦氏幼儿智力量表”,1987年张明园修订“生活事件量表”,1990年吴文源修订“症状自评量表”,1992年戴忠恒修订“一般能力倾向测验”,4.许多自编心理量表完成,洪德厚编制“中国少年非智力个性特征问卷” 1988年,沙毓英、张锋编制“学生性格量表(1118)”,宋维真编制“中国人个性量表”1993年,李伯黍、顾海根编制“青少年道德判断能力测验”1997年,顾海根编制“职业心理综合测验”2002年,第二节心理测验的性质、种类及用途,一、心理测验的种类,1.按测验功能来分：能力测验、学习成就测验、人格测验,2.按每次测验的人数分：个别测验与团体测验,3.按测验材料来分：文字测验与非文字测验,一、心理测验的种类,4.按测验目的来分：,筛选测验、诊断性测验、预测性测验,5.按测验的难度与时限来分：,速度测验、难度测验,6.按测验的要求分：,最高行为测验与典型行为测验,7.按测验性质来分：构造性测验与投射性测验,二、心理测验的用途,1.区分个体差异以便进行更有效的教育,2.心理问题(障碍)的预测和诊断,3.人员的选拔和分配,4.在评价与咨询中使用心理测验,5.在心理学研究中运用心理测验,三、心理测验的性质,1.心理测验的定义,心理测验就是对一个行为样组的客观和标准化的测量。,2.心理测验的三要素,行为样组：测验选择的一组有代表性行为。,标准化：是指测验的编制、实施、记分、解释等程序的一致性。,客观性：指测验不受主观支配，可重复，测验的实施、记分和解释都是客观的。,常模：是指一个测验在标准化样组上的分数分布。,四、实施心理测验时的注意事项,1.测验要保密,2.测验使用者的资格,1).心理学专业本科以上毕业生,2).在心理测量专家的指导下具有两年测验使用经验者,3).经心理测量培训班的专门训练，获得资格认定书,3. 要使用合适的常模,4. 不能一测定终身,5. 综合其它评价结果,6. 对测验结果的解释不要因人而异,第二章智力测验,第一节智力测验概述,第二节个别智力测验,第三节团体智力测验,第四节婴幼儿智力测验,第五节智力等级评定,第一节智力测验概述,一、智力的定义,1.抽象思维说比内推孟,2.适应环境说斯滕桑代克皮亚杰,3.学习能力说柏金汉姆汉蒙,4.综合能力说韦克斯勒史多达,朱智贤张春兴,吴天敏燕国材,二、智力的理论,1.智力结构论斯皮尔曼桑代克瑟斯顿,吉尔福特,2.智力层次论阜南,3.智力形态论卡特尔,4.智力新理论,1)三元智力理论斯腾伯格,2)PASS模型戴斯,3)多元智力论加德纳,3) 多元智力理论,概念：智力是某种文化环境的价值标准之下个体用以解决问题与生产创造所需的能力,七种能力：语言能力数学能力,空间能力音乐能力运动能力,社交能力自知能力,三、智力测验与智商,(一)智力测验,1.智力测验的定义：是一种对智力水平的客观的和标准化的测量。,2.智力测验的种类,个别智力测验与团体智力测验,语言测验与操作测验,文字测验与非文字测验,(二) 智龄与智商,1.智龄的含义：智龄是指某一年龄儿童的平均智力水平。例如智龄6岁就是该儿童的智力水平相当于6岁儿童的平均水平。,2.智商的种类,比率智商：IQ=(MA/CA)*100,离差智商：IQ=100+15Z Z=(X-M)/S,3.智商的稳定性与可变性,第二节个别智力测验,一、第三次修订的中国比纳测验,二、韦克斯勒智力量表,三、麦卡锡幼儿智能测验,四、个别智力测验的优、缺点,一、第三次修订的中国比纳测验,1.测验适用对象：218岁,2.测验项目：51题,3.测验步骤：先确定被试年龄，然后决定起始题，接着按顺序测试，直至连续错5题为止。,4.记分：答对1题记1分。,5.解释：先计算总分，然后查常模表转换成智商。,二、韦克斯勒智力量表,1.韦氏学前与学龄初期智力量表(WPPSI),适合年龄：4岁6岁半,2.韦氏儿童智力量表(WISC),适合年龄：6岁16岁,3.韦氏成人智力量表(WAIS),适合年龄：16岁老年,1.韦氏学前与学龄初期智力量表,1.测验结构,语言测验：1)常识 3)词汇 5)算术 7)类同,9)理解,操作测验：1)动物房 4)图形补缺 6)迷津,8)几何图形 10)扁木图,2.记分与解释先记原始分(10个)，然后根据常模转化为量表分，再根据量表分转化为智商,2. 韦氏儿童智力量表(WISC-R),1.测验结构,语言测验：1)常识 3)类同 5)算术,7)词汇 9)理解,操作测验：2)填图 4)图片排列 6)积木图案,8)图形拼凑 10)译码,2.记分与解释 10个量表分,语言量表分语言智商,操作量表分操作智商,全量表分总智商,3. 韦克斯勒儿童智力量表第三版(WISC-3),1) 报告了新的常模信息 2200名6-16岁儿童。,2) 增加了一个分测验符号搜索,测试加工速度,3) 增加了测题的范围,在算术、排列、迷津3个分测验中增加简单和更难的题目。,4) 测验材料的改进黑白插图改为彩色。,5) 手册提供更多的资料和信息,语言IQ与操作IQ之差,分数的基本比例,对学习困难学生的诊断,4. 韦氏成人智力量表,1.测验结构,语言测验：1)知识 2)领悟 3)算术,4)相似性 5)数字广度 6)词汇,操作测验：7)数字符号 8)填图 9)木块图,10)图片排列 11)图形拼凑,2.记分与解释 11个量表分,语言量表分语言智商,操作量表分操作智商,全量表分总智商,三、麦卡锡幼儿智能测验,1.测验结构：5个分量表 18个项目,言语(V) 知觉-操作(P) 数量(Q),记忆(Mem) 运动(Mot),2.测验记分：计算原始分，加权后合成各分量表的合成原始分。根据常模表转换成各分量表的T分数。V、P、Q 3个分量表构成一般智能，用离差智商表示。,四、个别智力测验的优缺点,1.优点：1)适用对象范围广,2)主试与被试能充分接触，促进被试合作,3)能有效控制测验中的无关因素,2.缺点：1)费时费力,2)对主试要求很高，必须受专业训练,3)有些项目评分较主观,第三节团体智力测验,一、中小学生团体智力筛选测验,1.测验对象：8岁17岁,2.测验内容： 60题分为5类,1)归类求异(21题) 2)类比推理(19题),3)数的运算(10题) 4)逻辑判断(6题),5)数字系列(4题),3.记分与解释：每题1分，总分查常模表转化为智高,二、瑞文推理测验,1.测验对象：5.5岁老年,2.测验版本：标准型(60题) 联合型(72题),高级型(48题),3.测验性质：非文字测验，团体测验,4.测验记分：每题1分,5.测验解释：计算总分，再查常模表转换成离差智商,三、团体儿童智力测验,1.测验对象：9岁18岁,2.测验结构：,语言量表：常识类同算术理解词汇,非语言量表：辨异排列空间译码拼配,3.记分与解释：10个原始分转化为10个量表分，再转分为3个智商,四、团体智力测验的优缺点,1.优点：1) 节省人力物力,2) 对主试要求不高,3) 评分较客观,4) 容易建立常模,2.缺点：1) 不易发现被试的特殊反应,2) 对测验环境控制较差,3) 主试不了解被试对测验要求与题意理解与否,第四节婴幼儿智力测验,一、格塞尔发展量表(GDS),二、丹佛发展筛选测验(DDST),一、格塞尔发展量表(GDS),1. 适用对象：初生3岁,2. 测验内容：63个项目 8张分量表,4周 16周 28周 40周 52周,18个月 24个月 36个月,四大行为领域：,1)运动：坐、走、跑、平衡动作等。,2)适应：手的摆弄、探究、觉醒程度等。,3)语言：面部表情、发音、懂话、说话等。,4)个人社会交往：生活自理、游戏、大小便、与成人交往等。,3. 测验结果：发展商数,二、丹佛发展筛选测验(DDST),1. 适用对象：初生6岁,2. 测验内容：,105个项目，分为四大行为领域：,1)大运动：坐、走、跑、平衡动作等。,2)语言：面部表情、发音、懂话、说话等。,3)精细动作与适应性：手指动作、探究等。,4)个人-社会行为：生活自理、游戏、大小便、与成人交往等。,3. 测验结果审核：正常、可疑、异常和无法测定。,第五节智力的等级评定,一. 智力的分布常态分布,二. 智力的等级,智商等级百分比,130以上极优秀 2.3,120-129 优秀 6.7,110-119 中上 16.1,90-109 中等 50.0,80-89 中下 16.1,70-79低能边缘 6.7,70以下智力缺陷 2.2,三、精神发育迟滞儿童诊断标准,1.现存的总智力功能显著低于平均数(2个标准差),2.表现出适应行为异常(包括独立生活能力和社会适应能力),3.以上状况发生在发育期(0-18岁),第三章创造力测验,一、创造力的概念,创造力是指独创性地解决问题的能力。,1.聚合思维与发散思维,聚合思维：思维方向集中，功能求同，答案唯一。,分散思维：思维方向发散，功能求异，答案多样。,发散思维的特征：流畅性、变通性、独特性,二、南加尼福利亚大学测验,1.对象：初中以上,2.内容：14个项目,词语流畅观念流畅联想流畅表达流畅,非常用途解释比喻效用测验故事命题,推断后果职业象征组成物体描绘简图,火柴拼图装饰设计,3.测验解释:从流畅性、弹性、创新和精细四方面进行解释.,南加利福尼亚大学测验,14个项目的意义,（1) 词语流畅（DSU）：迅速写出包含某个字母的单词。如：“O”load，over，pot,（2）观念流畅性(DMU)：迅速列举属于某一种类事物的名称。如：“能燃烧的液体”汽油、煤油、酒精,（3）联想流畅性（DMR）:列举近义词。如：“艰苦”艰难、困难、困苦,（4）表达流畅性（DMS）：写出每个词都以特定字母开头的四词句。如“K、U、Y、I”Keep up your interist，Kill unless yellow insects，,（5）非常用途(DMC)：列举出一个指定物体的各种可能的非同寻常的用途。如：“报纸”点火、包装箱子时作填充物,（6）解释比喻(DMS)：以几种不同方式完成包括比喻的句子。如：“一个女人的美丽就像秋天，它”，答案可能是“在还没充分欣赏时就消逝了”,（7）效用测验(DMU)：尽可能多地列举每一件东西的用途。如：“罐头盒”作花瓶、切饼。根据回答总数记观念流畅性的分数，根据用途种类的变化记变通性的分数（属于同一范畴的用途只能记一分）。,（8）故事命题(DMU,DMT)：写出一个短故事情节的所有合适的标题。可根据标题总数（思想流畅性）及有创见的标题数目（独创性）进行记分。,（9）推断结果(DMO,DMT)：列举一个假设事件的不同结果。如：“假设人们不需要睡眠会产生什么样的结果？”答案可能是：干更多的活，不再需要闹钟。记分方式同故事命题的记分方式。,（10）职业象征(DMI)：列举一个给定的物体或符号所象征的职业，如“灯泡”，可以是电器工程师、灯泡制造商,（11）组成对象(DFS)：利用一套简单的图案，如圆形、三角形等，画出几个指定的物体，任一图案都可重复或改变大小，但不能增加其他任何图形。,（12）描绘简图(DFU)：要求将一简单图形复杂化，给出尽可能多的可辨认物体的草图。,（13）火柴拼图(DFI)：移动特定数目的火柴，形成特定数目的方形和三角形。,（14）装饰设计(DFI)：以尽可能多的不同设计修饰一般物体的轮廓图。,以上14个测验中，10个需要言语反应，4个使用图形内容，皆考察发散思维，适用于初中水平以上的人，用百分位和标准分数进行分数解释。分半信度为0.600.90。,三、托兰斯创造思维测验,1.适用对象：小学生中学生,2.测验版本：甲种图形创造思维测验,乙种词汇创造思维测验,3.测验内容：,甲种 (1)构建图画(2)完成图形(3)平行线条,乙种 (1)发问 (2)猜测原因(3)猜测结果,(4)产品改良(5)不寻常的用途(6)不寻常问题(7)藉物设想,4.测验记分与解释：从流畅性、变通性和独创性三方面记分和解释。,四、威廉斯创造性倾向量表,1.适用对象：高中生大学生,2.测验结构,(1)冒险性 (2)好奇性 (3)想象力(4)挑战性,3.测验记分与解释,正题：完全符合3分，部分符合2分，完全不合1分。,反题：完合符合1分，部分符合2分，完全不合3分。,根据四项分数和总分按常模解释。,第五章人格测验,第一节人格测验概述,第二节人格自陈量表,第三节人格评定量表,第四节人格投射测验,第一节人格测验概述,一、人格特质理论,二、人格测验分类,三、人格测验编制方法,一、人格特质理论,(一)奥尔波特的特质理论,共同特质,特质首要特质,个别特质,重要特质,次要特质,(二)卡特尔的特质理论,表面特质与根源特质因素分析,(三)艾森克的特质理论,艾森克的特质理论,神经质,内向外向,情绪稳定,二、人格测验的分类,(一)人格问卷测验,1.人格自陈测验(自评测验),2.人格评定测验(他评测验),(二)人格投射测验,(三)人格情境测验,三、人格测验编制方法,(一)根据理论编制测验,莫瑞的15种需要理论与爱德华偏好量表,(二)根据经验编制测验,明尼苏达多相人格调查表(MMPI),(三)根据因素分析结果编制测验,卡特尔16种人格因素测验(16PF),第二节人格自陈量表,一、明尼苏达多相人格调查表(MMPI),1.测验的适用对象：16岁以上有阅读能力者,2.测验的结构：4个效度量表，10个临床量表,3.测验的记分：正题“是”记1分，“否”记0分，反题则相反。原始分经修正后转化为T分。,T=50+10(X-M)/S,4.测验的解释,:(1)T分数解释 (2)剖析图解释,(3)双峰组合解释,二、卡特尔16种人格因素测验,(一)测验的结构：16个人格因素,(二)测验的记分：除B外，按2，1，0分记分，得到16个原始分。,(三)测验的解释：1.标准分解释 14分低分，5、6分中间分，710分为高分。,2.二元因素解释：将标准分代入四个公式，计算结果低于4.5分为前一种类型，高于6.5分为后一种类型，4.56.5分为中间型。,3.应用方面解释：将标准分代入四个公式，计算结果按常模解释。创造力个性因素分数转化为标准分后，按标准有解释。,三、艾森克人格问卷(EPQ),(一)问卷结构：分儿童版与成人版。每一版本四个分量表：P量表精神质 E量表,内外向 N量表神经质 L量表说谎,(二)记分：正题“是”记1分，“否”记0分，反题反之。4个分量表得4个原始分，查表得4个T分。,(三)结果解释：1.T分解释 2.两维组合解释,四、Y-G性格测验,(一)测验的结构: 12种特质，每种特质10道题。,(二)测验的记分：正题“是”记2分，“？”记1分，“否”记0分。反题则反之。计算12种原始分。转化为等级分、百分率。,(三)测验的解释：1.等级分解释 12分为低分，3分为中间分，45分为高分。,2.类型解释：A、B、C、D、E 五种类型,(五) 加卅心理测验(CPI),1.适用对象：16岁以上有阅读能力者,2.测验的结构: 18个量表分为四类。,3.测验的记分：用套板算出18个分量表原始分，然后根据常模转化为T分。,4.测验的解释：,用T分数解释。,5.加卅心理测验的中国修订版,2.加卅心理测验结构,第一类自在性、优越性、自信心以及人际关系适应能力测量,(1)支配性(2)上进心(3)社交性(4)自在性,(5)自尊性(6)幸福感,第二类社会化、成熟程度、责任心及价值观念的测量,(7)责任心(8)社会化(9)自制力,(10)宽容性(11)好印象(12)从众性,第三类获得成就潜能及智能效率的测量,(13)遵从成就(14)独立成立(15)智能效率,第四类智力性与兴趣性态度的测量,(16)心理性 (17)伸缩性 (18)女性化,5. 加卅心理测验的中国修订版,1) 调整后的结构：,第一部分：通俗概念量表(20个),第二部分：结构量表(三个维度),第三部分：特殊目的和研究量表(12个),2)分数解释,(1)T分数解释(20个概念量表),(2)第二、第三部分采用“划界分”判定类型,(六)大学生人格问卷(UPI),1.测验对象：大学生,2.测验结构：1)基本资料 2) 60题，其中5、,20、35、50是测伪题，8、16、25和26是关键题。 3)4个辅助题,3.测验解释：第一类筛选标准：,1)总分25分以上者，2)第25题做肯定选择者，3)辅助题中至少有两题做肯定选择者，4)明确提出咨询要求的且属于心理问题者。,第二类筛选标准： 1)总分在2024分之间,2)8、16、26题中有一题做肯定选择者,3)辅助题中有一题做肯定选择者,(七)心理健康临床症状自评量表(SCL-90),1.测验结构：90题分为10个因子：1)躯体化,2)强迫症状 3)人际关系敏感 4)抑郁 5)焦虑,6)敌对 7)恐怖 8)偏执 9)神经病性 10)其他,2.测验记分：每题5级评分(1-5) 计算： (1)总分,(2)总均分=总分/90,(3)阳性症状均分=(总分-阴性项目数)/阳性项目数,(4)因子分=因子项目总分/因子项目数,3.测验结果解释：根据常模解释。,(八)抑郁自评量表(SDS),1.测验结构：20道题，10题正题，10题反题,2.测验评分：正题评分1,2,3,4。反题4,3,2,1。,计算20题的总分(粗分),3.测验解释：,粗分转化为标准分，标准分超过53分，则被认为有抑郁症状，分数越高，症状越严重,(九)焦虑自评量表(SAS),1.测验结构：,共20题，其中17题为正题，3题为反题,2.测验记分：,正题记分为1,2,3,4。反题记分为4,3,2,1。,计算20题总分，该总分为粗分，可转换为标准分。,3.测验解释：,根据常模解释，标准分超过50分，,则可被判定为有焦虑症状。,五、人格自陈量表的优缺点,(一)优点：1.能揭示被试的真实感受,2.施测方便，易于整理。3.记分客观,4.对主试要求不高。,(二)缺点：,1.被试容易作假，,2.对题目的理解不同会影响到测验结果。,3.测验的稳定性较差。,第三节人格投射测验,一、投射测验的一般原理,人们对日常生活模糊刺激情境的反应是受个人当时的心理状况和他过去掌握的经验以及对将来的行为要求所推动的，当人们面对主题不明确的测验材料时，就会将自己的人格不自觉地表现出来，投射在测验的反应中，通过对被试测验反应的分析，就能得到他的人格资料。,二、投射测验的种类,1.联想法文字联想测验墨迹测验,2.构造法主题统觉测验儿童统觉测验,3.完成法语句完成测验故事完成测验,4.选排法森迪测验图形排列测验,5.表达法画树测验画人测验,三、罗夏墨迹测验,(一) 测验材料：10张墨迹图,(二) 测验的指导语,要给你看的图上印有偶然形成的墨迹图形，请你将看图时所想到的东西，不论是什么都自由地、原封不动地说出来，回答无所谓正确不正确，所以，请你看到什么就说什么。,(三) 测验的记分和解释,1.定位 (1)整体反应(W) (2)局部反屈(D),(3)细微局部反应(d) (4)特殊局部反应(Dd),(5)空白部分反应(S),2.定素 (1)形状 (2)运动 (3)色彩反应,(4) 阴影,3. 内容：动物整体或局部，人的整体或部分，内脏器官，性，建筑，抽象观念，植物,4.独立和从众,四、主题统觉测验,(一)测验内容 20张内容隐晦的黑白图片,(二)测验指导语这是一种想象力测验，请你根据每张图片的内容编一个故事，告诉我图片中的事情是如何发生的？现在正在发生什么？画中的人物在想什么？以后将会发生什么故事愈生动，愈戏剧化愈好。,(三)测验结果的解释,(,1)主角本身 (2)主角动机倾向和情感(3)主角环境力量(4)结果(5)主题,(6)兴趣与情操,儿童统觉测验(CAT),五、其它投射测验,(一)完成句子测验,(二)绘画测验,1.画人测验 2.画树测验,(三)逆境对话测验,(四)团体人格投射测验,六、投射测验的优缺点,(一) 优点 (1)可以对人格作综合、深入的探索 (2)测验隐蔽性好，被试不易作假,(3)不受语言文字限制，适用范围广,(二)缺点 (1)评分不够客观，难以量化,(2) 测验解释较主观 (3)信度、效度难以确定 (4)对主试要求很高 (5)易受施测环境影响,第五章教育测验,第一节成就测验,第二节学习适应性测验,第一节成就测验,一、成就测验的发展,二、成就测验的类型,三、成就测验的应用,四、成就测验的举例,一、成就测验的发展,1.我国古代成就测验的萌芽,隋末开始的科举考试,西周就初步设置学业考试,2.西方成就测验的发展,1864年英国教师费舍(G.Fisher)编制量表集,1897年菜斯 (Rice)编制第一个成就测验：拼字测验，二十世纪初教育测验开始蓬勃发展。,二、成就测验的类型,1. 按测验的编制方法分,教师自编测验与标准化成就测验,2. 按测验的内容分,单科成就测验与综合成就测验,3. 按测验的用途分,诊断性测验与考查性测验,4. 按测验评分的参照系分,目标参照测验与常模参照测验,三、成就测验的应用,1. 诊断学生学习中的问题,2. 为升级与升学提供依据,3. 作为证书考试,4. 作为招聘考试,四、成就测验的举例,1. 斯坦福成就测验,1)适用对象：小学和初中学生,2)测验分为4种量表：,幼级量表：小1小3年级，测查段落大意、拼字、算术推理和四则运算。,初级量表：小3小4年级，测查段落大意、语义、拼字、算术推理和四则运算。,中级量表：小5小6年级，测查段落大意、语义、拼字、算术推理、四则运算、社会常识、科学常识和学习方法。,高级量表：适用初中生，内容与中级量表相同。,2、教育进步序列测验,1）适用对象：小学4年级至大学2年级,2）测验分为4种水平：,第1级水平：适用小4小6年级,第2级水平：适用初中生,第3级水平：适用高中生,第4级水平：适用大学12年级,内容：阅读理解、听觉能力、写作短文、,写作知识、数学、自然科学、社会科学等。,3、学绩水平测验,1）测验适用对象：小学生、初中生、高中生,2）测验分为,、三级。,3,）测验内容,级,包括语文、数学，,、级还包,括理化。,第二节学习适应性测验,一、在校心理适应的诊断,二、学习困难的诊断,一、在校心理适应的诊断,(一)心理适应的概念,指个体在与周围环境相互作用，与周围人们相互交往中，以一定的行为动作积极地反作用于周围环境而获得平衡的心理能力,(二)学生在校心理适应的诊断,1.中学生在校心理适应能力诊断表,2.问题行为早期发现测验(PPCT),1. 中学生在校心理适应能力诊断表,(1)测验内容：20题,(2)测验记分：,“是”记2分，“否”记-2分，“无法肯定”记0分,(3)测验解释：,3540分，适应很好。2934分，适应良好,1728分，适应一般。 616分，适应较差,5分以下，适应很差。,2. 问题行为早期发现测验(PPCT),(1)测验对象：小学四年级高三,(2)测验结构：6个内容量表和1个效度量表,R量表(反抗) O量表(被压迫感) I量表(欲求不满强烈) A量表(有孤独感倾向),S量表(没有学习热情) N量表(缺乏成就欲求),L量表(说谎量表),(3)测验记分：先按三级评分记分，然后求出每一内容量表的原始分，最后转化为C分。0-5分为A等，6-7分为B等，8-10为C等,(4) 测验的解释,A等为无问题，B等稍有问题，C等为有问题。,A.对人关系不适,(R+O)/2 R、O分别用C分代入，分数高说明对人关系不适。,B.情绪不稳定,(I+A)/2 I、A分别用C分代入，分数越高，说明情绪越不稳定。,C.学习适应不良,(S+N)/2 S、N分别用C分代入，分数越高，说明越设有学习热情和缺少成就欲求,(一) 学习困难的分析,1.学习困难的原因,(1)学习的不良态度 (2)不良的性格特点,(3)心智活动存在某些缺点,(4)某些局部缺陷或智力落后,2.学习困难的基本类型,(1)一般性学习落后型、语言差型与数学差型,(2)智力缺陷型与学习失能(LD)型,(二) 学习困难问题的诊断,1.智力缺陷型学习困难的诊断,智力测验如韦氏智力量表测出智商低于70,2.学习失能型学习困难的诊断,(1)面谈,(2)心理教育检查智力测验、心理语言能力测验、知觉发展测验、感觉统合测验,(3)学力测验阅读能力测验、数学能力测验,(4)行为观察学习失能儿童行为测验量表,第三章测验的质量分析,第一节项目难度,第二节项目区分度,第三节测验信度,第四节测验效度,第一节项目难度,一、项目难度的概念,指项目的难易程度。0,1评分公式：,P=R/N P为项目难度，R为答对人数，N为总人数。,多级评分公式：,P=,X,i,/LN,为连加号，Xi表示某一被试在该项目上的得分，L为该项目的满分。,第一节项目难度,二、项目难度的等距量表,(一)P转换成Z分,P0.5查0.5-P，P0.5查P-0.5，Z取负号。,(二)P转换成,分,=13+4Z,三、项目难度受机遇影响的矫正,CP=(KP-1)/(k-1),CP为矫正后的项目难度,K为项目选项数,P为矫正前的项目难度,第二节项目区分度,一、项目区分度的概念,是指项目对被试实际水平的区分度。,二、项目区分度的估计方法,(一)分组求差法,1.按测验总分高低排列试卷,2.确定高分组与低分组,3.分别计算高分组与低分组的项目难度,4.计算区分度：,D=P,H,-P,L,(二) 相关法,1.点二列相关法,R,Pb=(,(M,P,-Mq)Pq/St,R,Pb,为区分度,，,M,P,为做对该项目的被试测验总分的平均分，Mq为做错该项目的被试测验总分的平均分，P为做特该项目的被试人数占总人数的比率，q为(1-p)，St为测验总分的标准差。,2.二列相关r,b,=(M,p,-M,q,)/S,t,*(pq/Y),r,b,为二列相关系数,，,M,p,为答对该项目的人测验总分的平均分，M,q,为答错该项目的人测验总分的平均分，S,t,为测验总分标准差，p为答对该项目的人的人数比率，q为答错该项目的人的人数比率，Y为正态分布下答对该项目人数比率所在位置的曲线高度，即该点纵坐标。,3. 积差相关,R=(,xy/N-M,x,M,y,)/S,x,S,y,R为积差相关系数，,为连加号，x为被试测验总分，y为被试在该项目上的得分，N为被试人数，M,x,为测验总分的平均分,，,M,y,为项目得分平均分， S,x,为测验总分的标准差，S,y,为项目得分的标准差。,4.,相关法,=(bc-ad)/(a+b)(c+d)(a+c)(b+d),A、b、c、d的意义下：,总分,答错答对,合计,及格,a b,a+b,不及格,c d,c+d,合计,a+c b+d,a+b+c+d,三、项目区分度与难度的关系,S=pq,项目难度适中，项目标准差最大，项目区分度可能最高。,项目难度为1或0，项目区分度为0。,项目难度太难或太易，项目区分度都会很低。,第三节项目功能差异,一、项目功能差异的概念,早在60年代，就有项目偏差(item bias)一词，,试图研究文化差异对项目测试结果的影响，这是检查测验公平性的一种方法。后来由于“偏差”一词在统计学、社会学和政治学上有不同的含义，后改为项目功能差异，(differential item functioning,DIF)它是指在控制团体能力差异后，一个项目在不同团体中显示不同的统计特性。,二、估计项目功能差异的方法(OCI),1.M-H法,项目分数,群体 1 0 合计,参照子群体(r) f,1rk,f,0rk,n,rk,不利子群体(f) f,1fk,f,0fk,n,fk,合计 n,1k,n,0k,n,k,MH,=(f,1rk,f,0fk,/n,k,)(f,0rk,f,1fk,/n,k,),2.标准化方法,E,r,(Y|Z)=E,f,(Y|Z),测验项目分数Y对测验分数水平Z的回归,3. Logistic回归模型,令Y为项目分数变量，取值为1或0；,令Z为可观测变量，通常是被试的总分；,令V为被试分类变量，被试被分为不同子群体。,P(Y=1|Z，V)=exp(,0,+,1,Z+,2,V+,3,ZV)/ 1+exp (,0,+,1,Z+,2,V+,3,ZV ),LogP/(1-P)= ,0,+,1,Z+,2,V+,3,ZV,若只有,0,与,1,不为零，则表示无差异，,0,、,1,、和,2,均不为零，则有均匀性差异，若,3,不为零，则有非均匀性差异。,第三节测验信度,一、测验信度的概念,二、测验信度的估计方法,三、影响信度的因素,一、测验信度的概念,(一)什么是信度,信度(reliability)又叫可靠性，是指测验结果的一致性程度。,X=T+E S,x,2,=,S,T,2,+,S,E,2,rxx=S,T,2,/S,X,2,r,xx,为信度,，,S,T,2,为真分数方差，S,E,2,为误差方差。,(二)信度的类型,1.重测信度 2.复本信度 3.同质信度,4.评分者信度,二、测验信度的估计方法,(一)重测信度的估计方法,(二)复本信度的估计方法,(三)同质信度的估计方法,(四)评分者信度的估计方法,(一)重测信度的估计方法,r,x1x2,=(,X,1,X,2,/N-M,1,M,2,)/S,x1,S,x2,R,x1x2,为重测信度系数，,为连加号，X,1,为第一次测验的分数，X,2,为第二次测验分数，N为被试人数，M,1,为第一次测验平均分，M,2,为第二次测验的平均分，S,x1,为第一次测验分数的标准差，S,x2,为第二次测验的标准差。,(三) 同质信度的估计方法,1.分半信度的估计方法,(1)斯皮尔曼布朗公式法,r,hh,=(,X,o,X,e,/N-M,o,M,e,)/S,o,S,e,r=2 r,hh,/(1+ r,hh,),(2)弗拉南根公式 r=21-(S,a,2,+S,b,2,)/S,2,(3)卢龙公式 r=1-S,d,2,/S,2,S,d,为(Xo-Xe)的标准差。,2. 库德-理查逊公式法,r=n/(n-1)(S,2,-,pq)/S,2,n为项目数，S,2,为测验总分方差，p为项目难度，q=1-p.,3.,系数法, = n/(n-1)(S,2,-,S,i,)/S,2,S,i,为第i个项目得分的标准差,(四) 评分者信度的估计方法,W=,R,2,i,-(,R,i,),2,/(1/12)K,2,(N,3,-N),W为肯德尔和谐系数，这里为评分者信度系数，R,i,为第i份试卷评分等级之和，K为评分者人数，N为试卷数。,三、影响信度的因素,(一)分数分布范围与信度,分数分布范围越广，信度越高,(二)测验长度与信度,测验长度越长，信度越高,n=r,nn,(1-r,11,)/r,11,(1-r,nn,),(三)测题难度与信度,难度分数分布信度,大或小小低,适中大高,第四节测验效度,一、测验效度的概念,二、测验效度的类型,三、测验效度的估计方法,四、信度与效度的关系,五、影响放度的因素,一、测验效度的概念,(一)效度的描述定义,效度（Validity)是指测验有效地测量到其所要测量的目标的程度。即测验测量准确与否的指标。,(二)效度的数理定义,Val=S,v,2,/S,2,S,2,=S,v,2,+S,i,2,+S,e,2,Val为效度系数，S,2,v,为有效方差，S,2,为总方差。,二、测验效度的类型,(一)效标效度(实证效度),测验分数与效标之间的一致性程度。,效标即衡量测验测量准不准的标准或尺子。,效标必须具备有效性、可靠性、可操作性和实用性等条件。,(二)内容效度,测验试题取样的适当性和代表性。,(三)构想效度(结构效度),测验结果与理论构想的一致性程度。,三、效度的估计方法,(一)效标效度的估计,1.相关法,(1)积差相关 r= (,X,1,X,2,/N-M,1,M,2,)/S,1,S,2,(2)等级相关 r=1-6,D,2,/n(n,2,-1),2.区分法 t=(M,H,-M,L,)/S,H,2,/n,H,+S,L,2,/n,L,3.命中率法正命中率=工作成功/测验成功,总命中率=命中/(命中+失误),三、效度的估计方法,(二)内容效度的估计方法,由专家通过逻辑分析进行评估判断,(三)构想效度的估计方法,1.测验内的方法因素分析方法,2.测验间的方法相容效度方法，即用一个权威测验与新测验求相关。,3.效标效度的方法,四、效度与信度的关系,(一)信度是效度的必要条件，但不是充分条件。,(二)信度系数的平方根是效度系数的最高限度。即:,R,效,=r,信,五、影响效度的因素,(一)测验本身的因素,1.测验材料 2.测验长度 3.测题难度与区分度 4.测题类型 5.测题排放次序,(二)测验实施过程中的因素,1.指导语 2.测验时限 3.测验环境 4.主试,(三)被试方面的因素,1.兴趣、动机、情绪、态度 2.生理状态：疲劳、饥饿、疾病等。,概化理论(Generalizability Theory),第一节概化理论产生的背景及概念框架,第二节概化理论研究实例,第一节概化理论产生的背景及概念框架,一、产生背景,二、概化理论的主要概念,三、概化理论的误差分析,一、产生背景,(一)概化理论产生的时间与标志,1. 时间: 20世纪60年代后期,2. 标志: Cronbach等人的系列论文与专著,(二)概化理论产生的原因,概化理论是针对经典测量理论的不足提出的,经典测量理论对测测误差只是一个笼统的概念没有区分各种原因造成的误差及其比例。,概化理论是对经典测量理论的拓展，主要对误差进行了分折。,(三)概化理论与经典测量理论的不同,1. CTT的信度是建立在平行测验基础上的而GT则是建立在随机平行测验基础上的。,2. CTT只考虑单一笼统的误差，而GT则将误差依测试条件进行分解,进行方差分析。,3. CTT中使用信度系数, GT中使用G系数。,二、概化理论中的主要概念,(一)测量倾面指影响测量目标的主要因素,1.倾面的水平: 指处于不同条件和状态下的侧面。如测验题型、评分员等作为测量侧面，而不同题型(如记叙文、说明文、论述文)和不同评分者为不同侧面水平。,2.观察全域：指侧面水平的全体。,(二)GT设计,1. 交叉型(crossed) 2.嵌套型(nested),3. 混合型,1.交叉型设计,同一批被试(P)考相同的一批题目(i),被试(P) 1 2 3 .N,试题(i) 1 2 3.M,P*i,2. 嵌套型,不同章节含有不同的试题,试题(i) 1 2h,1,h,1+1,h,2,h,2+1,h,3.,章节(h) 1 2 3,i：h,3.混合型,既有交叉型，又有嵌套型,评分员(r) 1 2 3,被试(p) 1 2 3 4 5 6,作文试题(i) 1 2,i*(p：r),(三) 方差分类,1. 真方差,测量目标效应形成的方差，如学生作文水平的方差。,2.相对误差方差,它是所有含有测量目标的交互效应的方差除以各水平数之后的和。,3.绝对误差方差,除真方差以外所有方差除以各自水平数后的和。,(四) G研究和D研究,1.G研究,(1)确定测量目标及测量侧面,(2)进行初始测验研究设计,(3)收集测验数据,(4)进行方差分量估计(各效应和交互作用的方差),2.D研究,(1)修改设计方案,(2)估计G系数,三、概化理论的研究步骤,(一)确定研究问题,(二)测量设计,(三)被试选取,(四)G研究,(五)D研究,(二) 测量设计,1.测量目标的确定,2.测量侧面和水平的确定,3.设计类型的确定,(五) D研究,1.各侧面随机条件下的D研究,2.固定一个侧面条件下的D研究,项目反应理论,第一节项目反应理论概述,第二节项目反应模型,第三节信息函数,第四节项目反应理论的新进展,第五节项目反应理论的应用,第一节项目反应理论概述,一、项目反应理论产生的原因,二、项目反应理论的基本概念,三、项目反应理论的历史回顾,四、项目反应理论的基本假设,五、项目反应理论的特点,六、项目反应理论的优点,一、项目反应理论产生的原因,经典测量理论的局限性,1.测量结果拓广的有限性,2.测量分数的测验依赖性,3.统计量的样本依赖性,4.信度估计的不精确性,5.能力量表与难度量表的不一致性,二、项目反应理论的基本概念,1. 潜在特质,2.项目特征曲线：以潜在特质为横坐标，以正确反应或肯定反应的概率为纵坐标，以此反应项目基本特征的一条曲线。,3.项目难度、项目区分度和猜测参数,三、项目反应理论的历史回顾,1.项目反应理论的诞生标志,1952年洛德的博士论文关于测验分数的一种理论,2.伯恩鲍姆提出逻辑斯蒂克模型 19571958年,3.拉希模型 1960年,4.洛克等心理测验分数的统计理论1968年,5.塞米吉玛提出多等级评分资抖的等级反应模型,6.魏泰利提出了多成份潜在特质模型 1980年,7.多谁模型的发展 1990年后,四、项目反应理论的基本假设,1.知道-正确假设,2.一维性假设,3.局部独立性假设,4.项目特征曲线形成假设,五、项目反应理论的特点,1.测量指标与被试潜在特质联系在一起,2.以项目特征参数描述项目特征曲线,3.通过项目信息函数来推算测量的信度,4.在项目水平上进行分析,六、项目反应理论的优点,1.对项目参数的估计独立于被试样本团体,2.对被试能力的估计独立于对他们实测的那一组项目,3.可以根据被试的不同能力水平给出不同的估计精度,

展开阅读全文

心理测量学(心理量表的介绍和操作)

最新文档