测量心理学 2011de执着-人生在磨砺中见锋芒(修订版2)

资源描述

测量（选择）测量就是依据一定的法则使用量具对事物的特征进行定量描述的过程一定法则是建立在科学规则和科学原理基础上并通过科学的方法和程序完成测量的过程事物特征是所要测量的事物的特定属性根据性质可根伟确定型随机型模糊型量具是测量的工具定量描述是任何测量的结果总是对事物特征的量的确定区分性序列性等距性可加性测量精度影响因素（选择）测量对象本身性质确定型事物量保持恒定不变随机型事物量随机改变模糊型对象本身不确定测量工具的精密性测量学的目标之一是设法尽可能把误差减少到最低程度而不可能完全消灭误差测量的基本要素（选择）参照点绝对参照点以绝对零点为测量的起点零点的意义为无什么都测不到相对零点只能加减不能乘除单位理想单位具备两个条件要有确定的意义同一单位所有理解相同要有相等的价值测量量表（简答）量表能够使事物的特征数量化的数字的连续体命名量表是最低水平量表只用数字来表示事物或进行分类适用统计方法百分比次数众数卡方命名量表细分为名称量表和类别量表顺序量表次低量表给个体赋值数字代表等级大小程度的顺序没有相等单位没有绝对零点适用统计中位数百分比百分位数等级相关系数肯德尔和谐系数等距量表较高水平量表等距量表的数字具有真正的数量给个体赋值数值间的差反映个体心理在特征上的差异程度没有绝对零点能够进行加减运算适合统计方法平均数标准差积差相关 t检验F检验比率量表最高水平量表个体间数值反映个体心理在特性上的比率有绝对零点适合统计几何平均数变异系数心理测量的定义（配套简述）依据一定的心理学理论使用一定的操作程序给人的行为和心理属性确定出一种数量化的价值心理测量与一般测量的比较（简答）心理测量依据的法则很大程度上只是一种理论通过理论来编制测量工具并完成测量工作不如物理测量准确心理测量对象是人的心理特质和成就特质含义模糊不大容易给予界定其具有内隐性需要通过行为推断心理测量量具由有关专家编制长期形成标准化测验心理测量目标虽然是对人心理特质和教育成就进行定量分析单精度较差编制技术水平并不高编制理论不够先进心理测量的理论基础（简答）1918桑代克凡是客观存在的事物都有其数量 1939年麦柯尔凡是有其数量的事物都可以测量1 人的心理现象和知识水平同其他一切物理现象一样是有差异的包涵质和量两个方面有必要测定差异的数量2 心理特质和知识水平虽不是物理实体不能直接测量但能够通过行为表现 3心理测量的准确性可靠性精确性如同其他一切测量技术一样是相对的测量不准确不等于不能测量心理测验的定义（简答）这个知识点比较重要它可以延伸出样本取样项目分析信度效度等问题的论述题是对行为样本的客观的和标准化的测量行为样本从总体行为中抽取出来能反应个体特定心理特质的一组行为可以依据对这一组行为测量结果推断其心理特质样本需要有较好的代表性样本的代表性制约测量的质量并且要了解全部行为样本的意义心理测量的目标是通过测量来预测被试以后将会出现的行为标准化指测验编制实施计分以及测量分数解释程序的一致性标准化需要具备测验内容标准化所有接受测量的个人实施相同的或等值的测验内容施测条件标准化所有接受测量个人必须在相同施测条件下接受测验情境指导语时限评分规则标准化测验制定评分标准最大化使不同人的评分一致测验常模标准化个体分数需要与他人比较才有意义常模即给解释分数一个可比较参照点难度或应答率难度太低或太高不能有效地将不同水平个体区分应答率需要通过客观统计计算确定信度和效度信度是指一个测验的可靠性即多测用同一测验测量统一团体所得分数的一致性效度是测量有效性一个测验多大程度上能够测量到它所要测量的心理特质分类（简答）按对象属性和特质不同分认知测验包括能力测验智力测验（斯比量表威克斯勒智力量表瑞文推理）成就测验人格测验指测量个人注入兴趣动机等（16PF 艾森克人格问卷罗夏克墨迹主题统觉）按测量方式分个体测验主试在同一时间内只能测量一个被试斯比威克斯勒罗夏克墨迹主题统觉优点主试对被试的观察更细致有机会获得测量分数之外的信息主试和被试的面对面交流更多容易和被试建立融洽合作关系一些特殊被试只能选择个体测验缺点费时间难以在短时间内收集大量测量资料测验手续比较复杂需要经过较高水平训练的人担任主试团体测验同一主试在同一时间内能够测量许多被试瑞文陆军甲乙团体智力优点短时间内可以大量获得信息节省时间在教育选拔团体比较中广泛使用缺点不易有效控制被试的行为容易产生测量误差按照测试内容不同文字测验测验内容通过文字形式表现容易受被试文化影响非文字测验通过图形仪器工具实物模型等形式表现常限于个别测量按测验目的分描述测验诊断测验预示性测验按测验难度和时限分难度测验和速度测验按测验的要求分最高行为测验和典型行为测验按计分方式分客观测验和非客观测验按照测量对象分智力测验测量个人智力水平的高低能力倾向测验测量个人的潜在才能预测个人能力发展倾向分为一般能力倾向测验特殊能力倾向测验成就测验测量个人在接受教育后的学业成就分为学科成就测验某一科目的学习成就综合成就测验在各学科上的综合学业成就人格测验测量个人在兴趣态度动机气质性格等方面的心理特征分为自陈和投射按评价参照标准常模参照测验被试水平与常模比较以评价被试在团体中的相对地位目标参照测验被试水平与一绝对标准相比较以评价被试有无达到该目标潜力参照测验被试水平与自身潜力相比较以评价被试有无充分发挥自己潜力心理测验理论研究功能（选择）理论功能收集研究资料通过测验获得第一手资料作为实证资料做出科学结论建立和检验理论假设根据已有研究进行理论假设再论证实验分组可以和实验结合起来运用于研究工作实用功能选拔人才人员安置心理诊断描述评价心理咨询经典测量理论（论述）测量中能出论述的理论不多经典测量理论模型并且经典测量理论也是这个阶段必须掌握的是多数其他理论的支撑心理特质的含义心理特质是表现一个人身上所特有的相对稳定的行为方式含义特质是一组具有内部相关的行为概括具有一定抽象性（让座友好待人热情助人）特质是一种一般神经心理系统可以综合不同刺激使人对这些刺激做出相同反映（对老弱病残都能让座）特质是一个人身上比较稳定的特点一个人的精神面貌是有多种特质分多个层次有机组合而成心理测量任务就是区别出不同个体在能力个性等特质上的差异特质可以决定一个人对特定刺激的反应倾向可以对人的行为做预期可测性假设凡是事物都是有数量的凡是有数量的都是可以观测的真分数的含义被试某种心理特质的真正水平的那个值称作该特质的真分数把实测的称为观察分数由于误差的存在真分数很难得到只能通过改进工具完善操作使观测分数不断接近真分数X=T+ECTT数学模型的三个假设公理1 若一个人的某种心理特质可以用平行测验反复测量足够多次其观察分数的平均数会接近真分数E(X)=T或E(E)=02 真分数和误差分数之间相关为0 （T,E）=03 各平行测量上的误差分数之间相关为0 （E1,E2）=0 2 3说明E是随机误差不包含系统误差结论在问题范围内某心理特质水平的真分数坚定不会变测量任务就是估计这个真分数的大小观察分数被假定等于真分数与误差之和即观察分数和真分数之间是线性关系测量误差是随机误差并服从均值为0的正态分布一般情况下计算真分数不是通过对一个个体施测多个平行测试而是对多个同质个体进行同一测验的测量当团体人数足够大的时候就会出现各误差相互抵消推导公式P44戴虽然GG的有但是我不想COPY过来大家自己再好好看看自己过一遍手记忆深刻经典测量理论的评价1信度估计精度不高根据真分数理论假设测验原始分数X线性分解为测验真分数T和误差分数E两部分误差分数原始分数真分数相互独立假设本身就不可靠并且定义测验信度不能提高信度估计严格的平行测验很难获得等都导致信度估计不高2误差指标笼统单一不精细导出标准误是所有被试测量误差的标准差相同测验对不同测验的误差是不同的3各种参数的估计对样本的依赖性太大编制高质量测验离不开四度对不同被试的得分影响大并受制与随机抽样的理想状态 4参数指标之间的配套性较差通过现有指标不能找到验证某试题是否恰好匹配其被试的计量方法 PS经典测量理论CTT是我们现阶段所学知识的主要理论支撑原因在于项目分析和概化都不能用手算那么就要清楚它的理论假设为它提供了什么很多理论都只是站在理论假设的基础上提出并进化的那么这些理论假设的正确性就是后人批判的根据也是后面先进学说的弥补不仅仅的经典测量理论其他的理论也都是如此先考虑假设的成立是学习的一个根本测量信度（论述）测量结果的稳定性程度对测量一致性程度的估计也叫测量的可靠性 P46戴定义1 被测团体的真分数的变异数与实得分数的变异数之比公式定义2 被测团体的真分数与实得分数的相关系数的平方公式定义3 信度是一个测验X与它的任意一个平行测验X的相关系数定义12具有理论意义 3具有实际意义原因在于通常我们是为了测查一批人而不是反复测量一个人的（怎么理解？）公式信度的作用信度是测量过程中所存在随机误差大小的反映 P47戴信度可以解释个人测验分数的意义标准误是一次测量中误差大小的客观指标标准误对于同一团体两次施测之差的分布的标准差能否明白其公式的推导过程？一个研友问过我的信度的标准误公式信度可以帮助进行不同测验分数的比较通过采用差异的标准误进行差异显著性检验 S为相同尺度的标准分数的标准差差异显著性检验公式注意信度有多种计算方式只是对测量分数的一致性估计并不指出原因获得较高信度只是测验有效性的必要条件测量结果是以一个点为中心SE倍数为半径上下波动的范围PS 不仅是理论就是公式也是有继承性的如果我们仅仅限于把表象的东西记住那么我觉得拿不了高分多问几个为什么！信度系数的估计（论述）（各种计算方法只适用常模参照测验）学绩0.9 人格0.8 教师自编学绩0.6重测信度是指用一个量表同时对一组被试施测两次所得结果的一致性程度为两次成绩的皮尔逊相关公式重测信度值大说明两次结果比较一致被试的心理特质不易受环境和状态影响时间跨度稳定性好误差来源所测特性本身就不稳定成熟知识的发展并非人人等量增长练习因素和记忆因素及偶发因素使用前提所测量心理特质必须稳定的练习和遗忘的效果基本上相互抵消两次施测间无更多学习几点说明重测信度一般用于反映随机变量因素导致的变化而不是行为的长期变化适用人格测验速度测验复本信度两个平行测验测量同一批被试所得结果的一致性程度其结果等于两次结果皮尔逊积差相关的数如果两次施测是同时称为等值性系数反映了题目所带来的差异如果有时间间距则称为稳定-等值系数是最严格的检验误差来源非平行测验的两个复本间差异被试的情绪波动动机变化测验情景的变化使用前提要构造两份或两份以上真正平行测验被试要有条件接受两个测验分半信度将一个测验分为两半后所有被试在这两半上所得分数的一致性程度制作分半的办法奇偶法随机安置法题目难度分半题目内容分半使用前提在只能施测一次或没有副本的情况下使用如果无法对等分半就不宜使用几点说明有牵连的题目要放在同一半或则会高估信度存在任意题或速度测验不易用半分法如果测验有多个分量表应在分量表内排好顺序在把分量表两半组合起来求相关斯皮尔曼-布朗公式适用两分半测验等价时根据适用条件可以出选择题需注意不等价时用费拉南根或卢龙公式同质性信度也叫内部一致性系数指测验内部所有题目间的一致性信度当具备较高同质性信度说明测验主要测的是某一个心理特质如果不高测验结果是几种心理特质综合反映测量单一特性是同质性高的必要而不充分条件计算同质性信度的四种方法库得-李查逊20适用（0、1）计分测验库得-李查逊21适用所有题目难度接近时卡隆巴赫系数实际上库得-李查逊的20、21是其特例其值为测量信度的下界估计值大信度高小未必低荷伊特用方差分量描述评分者信度多个评分者给同一批人的答卷进行评分的一致性程度当评分者为2时计算为同一被试所有分数的相关系数当大于2时用肯德尔和谐系数当评分者为3-20 被评分者N=3-7 可以查W表 W值高则信度高当N大于7可以计算卡方指公式信度的影响因素（简答）被试方面个体身心健康应试动机注意力耐力求胜心同质性低分数高可能高估信度值主试方面施测者不按照规定施测给被试暗示指导语不当主试的期望和情绪影响评分者的标准施测情境会对测验构成影响光线空间狭窄等测量工具在测验长度上测验越长测验的信度越高在难度上过难或太容易都会降低信度取样不当也会影响信度两次测量间隔时间时间间隔越长信度越低提高信度的方法（简答）1适当增加测验中与原题目具有较好同质性的题目增加测验长度长度要适度2是测验中所有试题的难度接近正态分布并控制在中等水平这样的分的分布更广3努力提高题目区分度4选取恰当被试团体提高测验在各同质性较强的亚团体上的信度注意被试的个人信息5主试严格执行施测规则评分严格按照评分准则施测场地按要求布置减少无关干扰测量效度（论述）指一个测验或量表实际能测出其所要测的心理特质的程度，效度是总变异中由所测量的特性造成的变异所占的百分比注意效度是一个相对概念 1心理测量的效度只有程度上的差别效度相对一定目的而言 2心理测量的特质具有隐蔽性需要通过行为表现推测而不是百分百准确的不能为0 效度是测量的随机误差和系统误差的综合反映只要出现测量误差效度必受影响判断一个测量是否有效要从多方面收集证据测量理论中效度指与测量有关的真实变异与总变异的比公式P60戴效度的估计内容效度测验题目对有关内容或行为取样的适当程度一个测验实际测到的内容与所要测量的内容之间的吻合程度注意条件要有定义完好的内容范围测验题目应是所界定的内容范围的代表性取样主要采用逻辑分析法即专家根据自己的知识经验对量表的有效性做出判断主要步骤确定测验内容的总体范围确定每个题目所测内容比较自己分类和测验编制者的分类编制评定量表从所测验内容所测的技能题目对所定义范围覆盖率各种题目数目和分数的比例以及题目形式的适当性做出评价内容效度主要应用成就测验和某些选拔分类的职业测验不适用能力倾向测验和人格测验主要问题在于缺乏理想的数量指标是它最突出的问题贝隆巴赫指出被试后测成绩显著由于前测成绩说明内容有较高内容效度结构效度适用所要测量的理论结构或特质的程度或者说所测验分数能够说明心理学理论的某种结构或者特质的程度所谓某种结构或特质是心理学理论抽象而假设性概念主要特点结构效度的大小取决于事先假设的心理特质理论具有不同理论构思的测验其结构效度无法进行比较结构效度有时难以获得当实际测量资料无法证实假设理论的时候不一定确定结构效度低可能假设错误结构效度没有单一指标需要由各方面证据累积起来进行评价确定方法步骤提出理论假设并分解成一些细小纲目依据理论构架推演有关测验成绩假设用逻辑和实证检验假设测验内方法主要包括内容效度被试解答测题时的反应过程和测验的同质性测验间方法相容效度法计算新的测验与测量同一特质的已知效度较高的原有测验的相关系数区分效度法如果两个测验测量的是不同特质使用相同方法进行测量他们之间的相关也应该很低因素分析法通过因素分析找出影响测验的共同效度测验分数总变异来自有关因素的比例是其指标考察效标关联效度根据效度把人分为两类考察其得分差异依据测验得分把人分为高分组和低分组考察这两组在所测特质方面是否有差异多种特质-多种矩阵法若用多种极不相同的方法测量同一特质相关很高效标关联效度常用于学业成就等级评定临床诊断专门训练实际工作表现团体能力区分一个测验对处于特定情境中的个体的行为进行估计的有效性又叫实证效度效标被估计的行为是检验测验效度的外在标准简称效标也是独立于测验并可以从实践中直接获得的我们感兴趣的行为根据时间分类可以分为同时效度测验分数和效标资料是同时收集预测效度先获得测验分数隔一段时间再收集效标资料常用效标学业成就临床诊断实际工作表现特殊训练成绩不同团体的总体表现先前有效的测验等级评定测量要求有效性效标测量能真正反映观念效标代表理论上测验有效性的主要方面可靠性效标测验应具有较高的信度客观性效标测量必须能真正反应观念效标避免效标污染评定者知道被试分数而影响对效标的评定实用性优秀的效标测验应该方法简单经济实用效标估计方法相关法计算测验分数与效标测量之间的相关系数区分法根据效标测验的成绩区分被试为两组然后分析这两组被试原来接受测验的分数差异若差异显著说明测验有较高的效标命中率当测验做取舍决策时正命中率和总命中率是较好的效标功利率测验所需费用和得到收益进行比较效度影响因素（简答）测验构成测验中词汇和句型不能过于困难题目表达要清楚测题不能给出额外线索测题编制要合理测验正确答案不能有明显组型测试题目难度适当测题数目适当题目长度增加可以提高信度正相关测验实施过程遵从指导语控制计分差错测验被试被试的动机情绪态度对于团体如果缺乏必要同质性可能导致下降所选效标的性质效标与测验行为的近似型效标本身的可靠性效标行为和测验分数之间是否呈线性关系（皮尔逊相关引起）测量的信度信度不高的测验不可能有高效度提高效度方法（简答）精心编制测验量表避免出现较大系统误差妥善组织测验控制随机误差减少随机误差创设标准应试情境让每个被试发挥正常水平选好正确效标定好恰当效标测量正确使用有关公式信度和效度关系（简答）如果考研以简单提问就需要说明以下红字内容直接制约你的得分这个知识点需要注意要明白并且弄清所有变异来源以及信度效度的定义公式根据S2X= S 2V+ S2I+ S2E S2T= S 2V+ S2I rxx= S 2T/S2X rxy= S 2V/S2X 当随机变异数减小真实分数的变异数增加测验信度就随之提高然后信度提高只给有效变异数增加提供可能是否提高效度需要看系统误差的变异数因此能够提高效度真分数的变异数必须占较大比重信度高是效度高的必要而不充分条件一个测验效度高信度必然高但信度高不一定效度高效度受到信度制约公式PS这个知识点本人真的觉得很重要效度信度讲了那么多实验测量统计都有而且都是重要知识点搞清楚来龙去脉理解生层次内涵心理测量的误差（选择）测量误差在测量过程中由那些目的无关变化因素引起的一种不准确或不一致的测量效应包括测量误差由那些与测量目的无关变因所置测量误差表现不准确或不一致心理测量误差分类随机误差与测量目的无关的偶然因素引起而又不易控制的误差使得多次测量结果不一致系统误差由测量目的无关的变因引起一种恒定而有规律的效应稳定存在于每次测量中（并不一定如此）系统误差只影响测量的准确性随机误差影响稳定性和准确性测量误差的来源（选择）测量工具测量偏差测量工具信度不好效度不好都会影响测量对象造成测量误差的主要原因受测者真正水平是否正常发挥受测者的动机状态和情绪心理生理水平施测过程施测的物理环境主试的某些属性计分环节出现干扰等测量误差估计（简答）假设如果一个人测量无数次则其误差之和为0 平均误差为0误差与真分数之间独立一个团体的平均真分数等于该团体中所有被试实得分数的平均值如果团体足够大则误差会相互抵消对于一个团体实得分数真分数和测量误差之间的关系为心理测验的项目分析（简答）P72戴（如果今年出一道关于项目分析的简答呢？以后大题年年都会有计算吧我想）题目难度测验项目的难易程度题目计算二分计分项目通过率公式高低分组27% 计算公式非二分计分项目公式非二分项目进行难度比较校正排除猜测答案的公式难度水平确定（选择）取决于测验的目的和性质对于选拔性测验应该将难度控制在录取率对于选择题难度大于猜测概率难度的等距变换（简答）这里要知道具体转化过程比如 +1 的难度通过率是多少？仔细看看P75戴由于难度是顺序变量不能说0.6 0.7 0.8之间是同等差异不能指出差异的大小和代数运算所以一般都转换成等距量表样本很大时样本分布近似为正态可以转换成标准分数但是转换后往往会有小数和符号可以采用美国教育测验服务中心的难度指标 =13+4Z Z为P值转换得来的难度指标难度对测验的影响（选择）1项目难度普遍较大的测验分数分布为正偏态小为负偏态能力成就测验控制在0.5 正偏态适合筛选性测验2过难或过易的测验会使分数集中题目的区分度D （简答）是否具有效度的指示器取值在-1到+1区分度指测验项目对被试心理品质水平差异的区分能力或鉴别能力作为评价项目质量筛选项目的主要指标依据区分度计算项目鉴别法高低分27%公式 N小于100可用50% 相关法项目分数与效标或测验总分的相关作为项目区分度的指标相关越高项目区分度越高方差法被试在某一项目上的得分越分散则试题鉴别能力越大区分相对性不同计算方法区分值不同一个测验的每一项目都要采取同一区分度指标样本容量大小影响相关法区分度值的大小一般样本容量越小统计值越不可靠分组标准影响鉴别力指数D 极端组划分不同区分值不同分组标准的同质性程度影响区分度的大小被试团体越同质个体水平越接近区分度越小区分度与难度（简答）当通过率为极端值此时难度为极端值 D=0当通过率不为极端值此时难度不为极端值 D的值会有不同但D受通过率的制约通过率越大 Dmax 越大当P为0.5时Dmax为1最大猜测问题与猜测率（简答）猜测校正公式 P86戴被选答案越少被试得分越高于他们的真实水平则难度的不能良好反映真实难度公式 P86戴优点可避免降低测验的信度校正后的得分可以反映被试真正水平比较公平事前孤立学生答完全部选题但总有人无法答完缺点公式的基本假设不成立只要被试能做完全部试题猜测校正无实质作用会出现负数不采用猜测校正对信度并无重大影响实际缺乏充分的证据和资料PS 由于选项不同可能未校对前 A难度大于B 可校对后 B也有可能大于A 题目的综合分析和筛选（简答）区分度在0.3以上较好难度保持0.50.15的正态分布如果是人格测验态度测验以及心理健康测验不要求难度过高选项异常正确答案无人选题目高分组选择低于低分组错误的选项高分组高于低分组某个题目无人作答题目分析注意点（简答）难度过难的过易的题目需要说明区分度小于0.19的需要说明某题目未做答过多需要说明某题目的错误选项无人作答或作答人数过少需要说明某题目某错误选项高分组和低分组作答人数相同需要说明某题目某错误选项选择人数高于正确选项选择人数需要说明其他内容良好需要正面评价原始分数被试接受测验后根据测验计分标准对照被试的反应所计算出的测验分数成为原始分数导出分数在原始分上按照一定规则经过统计处理后获得的具有一定参考点和单位可以相互比较的分数包括百分数百分等级标准分数 T分数标准九分数导出分数种类见统计资料PS 需要说明看到公式一定要理解公式的意义每个符号符号和符号之间的意义对照例题理解特别抽象除外然后再做题理解了意义其实公式很好背做题很顺手我说过现在的心理学理科很死文科很活分数组合的一般种类了解基本测验项目组成一个分测验或一个测验有几个分测验的得分组成合成分数有几个测验的得分的组合获得合成分数或合成预测分数合成的方法临床诊断-直觉合成具有较高综合性具有灵活针对性容易受主观偏见影响缺乏精确数量分析加权求和合成测验间特质相互代偿有为连续分布并基本同时获得多重回归多重划分常模团体（简答）具有某种共同特质的人所组成的一个群体或是该群体的一个样本成就测验和能力倾向测验常模团体应包括目前与潜在的竞争者广泛能力与性格测验通常包括具有同样年龄或教育水平的人确定常模团体的注意事项（简答）群体构成的界限必须明确必须清楚说明所要测量的群体的性质和特征常模团体必须是所测群体的一个代表性样本如果缺乏代表性则会使常模产生偏差取样过程必须明确且有详尽描述防止测验中产生偏差样本大小要适当根据总体选择团体人数若群体性质单一则样本数不必大测验结果的精确度和样本容量正相关常模团体必须是近时的常模属于历史而人是随实践变化的注意一般常模与特殊常模的结合主要常模参照分数（选择）心理年龄被试在标准化题目中所得原始分与常模年龄比较在青春期后年龄常模不再有意义年龄量表基本假设是所测量的特质随年龄做有系统的改变基本要素一组可区分不同年龄的题目一个常模团体各个年龄具有代表性的样本常模表年级当量被试测验成绩与某一年级学生平均数比较说成相当于某一年级水平单位为10个月缺点教育内容每个年级不同年级当量解释比较困难年级常模经常被误用为标准商数教育商数教育年龄和实际年龄之比教育年龄为儿童取得的平均教育成就通过年级当量间接获得成就商数一个学生的教育年龄比智龄确定智龄和学业成就只有中等相关其次二者测验不可靠呈现常模资料的方法（简答）转化表又称常模表最简单最基本且最常用由原始分数相应导出分数常模团体具体描述组成分为简单转化表和复杂转化表剖析图要求个各分测验所使用的必须是同一个常模团体编制心理测验的基本程序（简答）确定测验目标明确测量对象即明确测量那些团体和个人明确测量目标测量什么心理功能并进一步具体化明确测量用途用途不同编制材料的取材范围和难度也不同制定编题计划全面而具有代表性的测验内容不致使测验偏离应侧范围对各个内容点相对重视程度用途指明编辑那些方面的测验项目即数目计分可按计划中百分比确定每类测验项目分数标准编辑测验项目收集测验资料资料要丰富资料要具有普遍性资料要有趣味性选择项目形式取决于受测者年龄人数测量目的测验项目性质编写测验项目测验项目的取样应当对欲测心理品质具有代表性确保有效性测验项目的取材范围要同编题计划所列项目范围一致测验项目的难度应有一定分布范围编写测验项目的用语力求精简明了初编题目数量大于最终题数便于筛选和编制副本测验项目的说明必须简明预测与项目分析预测获得被试对测验项目作何反应的资料注意预测对象来自正是测验时被备选的群体具有代表性预测的情景力求同正式测验一样测验的时限可以延长便于做完题目施测者应对受测者的反应加以记录对完成数目和题意不清的项目分析对预测结果进行统计分析确定项目难度和区分度合成测验经过预测以后证明有价值的项目排成有组织的测验解决测验项目的选择问题和测验项目的编排问题测验项目选择性质难度区分度测验项目编排并列直进式依此由易到难混合螺旋式根绝难度分为若干不同层次做交叉式派力奥难度渐次上升编制复本增加实际效用一种测验只有要有等值的两份条件各份测验测量相同特质内容形式相同不应重复题目测验数目相同测验标准化见第一页测验内容施测过程评分标准分数解释鉴定测验测验编好必须对信度效度进行鉴定以及测验量表和常模编写测验说明书测验目的作用理论依据测验方法测验的标准答案和评分方法关于测验信度效度资料水明常模表及解释测验分数的解释（简答）解释类型描述个人心理特征状态溯因解释及个人目前预测解释及推测未来评价的解释原则充分了解测验性质和功能对导致测验结果的原因解释应慎重防止片面必须充分估计测验常模和效度的局限性解释分数应参考其他有关资料对测验应以 “一段分数”来解释而不是特定数值如何告知测验分数意义使用当事人理解的语言保证当事人知道这个测验测量目的以常模为参考需要知道比较的常模团体要使当事人知道分数只是估计具有偏差要考虑测验分数给受测者的影响测验结果保密对低分者解释应小心报告测验分数应设法了解当事人的心理感受采取适当措施加以引导PS不要觉得这个不重要在某年某高校真题中就出现过。测验等值（选择）通过考核同一种心理品质的多个测验形式做出测量分数系统的转化进而使不同形式之间的测验可比测验等值分数系统转化与测验原始分数与导出分数转化之间区别目的不同前者为了比较不同测验形式之间实测分数后者是为了把原始分转换到可以比较的相对分数系统中性质不同前者是两个或多个不同测验形式分数系统转化后者是一个测验形式不同分数系统转化测验等值的条件（简答）同质性被等值的不同测验形式必须是同一中心理品质内容范围也一致等信度不同测验等值需要相等信度公平性考生参加被等值的不同测验形式中任一个测试等值后结果一致可递推性很重要。对成型两个待等值的测验形式 XY 无论等值转换从哪出发其对应关系相同样本不变性测验XY的等值关系与其本身有关而与样本无关测验等值结果的表示方法（了解）列表法对应排列成表公式法 y=Ax+B图示法画图。测验等值的计算方法（了解）等百分位等值线性等值公式P143戴PS 能看到上面有些只有题目希望针对上面的知识点大家能看看一定要看看目标参照测验根据某一明确界定的内容范围而缜密编制的测验并被试在所得测验结果也是根据某一明确界定行为标准直接进行解释目标参照测验的项目分析（简答）内容范围的确定内容范围具有边界当其边界得到明确界定的时候我们可以判定什么行为属于这一内容范围每一种内容范围均可分为几类每一类内容及其再次内容范围内相对重要性确定以后内容范围就有了明确的结构特定测验目的的确定常为内容范围的界定提供依据内容效度分析项目分析首先对构成测验的每一个题目是否适合以及有效进行分析通常采用专家评定法根据中数判断质量测验的预测选取一定被试进行预测获取数据对项目难度区分度进行量化分析前测-后测已接受教学组-未接受教学组对照组前两个方法其假定有关教学活动的被试均掌握教学内容未必成立选择一批被试经专家评定一组为未接受一组为接受在进行控制组对照组比较难度分析纯粹的目标参照测验一般注重所测内容范围以及被试所测内容掌握程度如果某项目为不可或缺那么难度被忽视区分度分析难度差值掌握组-未掌握组指数通过预测可得到两组数据掌握者和非掌握者 K=Pa-Pb 得数越接近1区分度越高个人获得指数采取先后测可获得在前测中错误回答某项目而在后测中能正确回答的人数比例接近1为有效相关系数区分度为正负1 当为负数时应当予以修改或剔除为正保留接近1有效PS区分度难度通过率的计算其实很简单但是综合在一起就要会！这种知识点出简单题的概率很大目标参照测验的信度与效度（简答）信度分类一致性信度分数解释对被试分类对被试分类一致性的度量指标似乎成为分类一致性信度考察被试在同一测验的两次施测中或量复本中是否被分为一类运用四格法公式见P162戴优点直观易懂计算简单缺点是复本法和再测法的缺点见前文方差分析方法荷伊特信度从信度定义出发利用方差分析方法找出个体水平真正变异在总变异的水平作为估计值荷伊特信度不随测验分数分界点而变化因而更具有普遍性效度内容效度两个条件测量有明确界定内容范围对测验每一题目的内容效度的分析（内容效度分析法）效标效度在统计指标与常模参照测验不同提出决策效度掌握组及格人数比总人数加为掌握组不及格人数比例测验分数的解释（选择）目标参照测验有明确界定的行为标准即测验分界点其实解释无法逃避的或作为决策的依据专家判定法效标组预测法对照组法临界组法学绩测验的性质（简答）对个体在一个阶段的学习或训练之后知识技能的发展水平的测定属最佳行为测验最佳行为测验施测时要求被试调动所学一切知识、所具备的一切技术能力对所有习题给出最佳答案或最佳操作编写时需要注意测验能够诱发被试发挥出最高水平学绩测验对象认知性心理品质其优劣表现为认知内容的多寡认知能力的高低学绩测验是针对有计划的学习或训练之后的成绩测定而设计的学绩测验的作用（简答）鉴定学生的学业成绩学生评价升学反思教师的教学改进人事管理录用学绩测验的分类（选择）编制方法分教师自编课堂测验和标准化学绩测验测验内容分单科测验多科测验单元测验总测验测验用途分考察性测验诊断性测验标准化学绩测验（配套简答）在心理教育原理下遵循一定程序所编制的各方面质量都达到规定标准的学绩测验斯坦福成就测验（简答）综合性学绩考察测验 1923年团体常模参照测验11个科目内容词汇阅读理解拼字听理解词汇学习技能语言数学概念数学计算数学应用社会科学知识和自然科学知识配套测验斯坦福早期学校成就测验适用幼儿园和一年级学生斯坦福学业技能测验适用8到13岁学生导出分数百分等级标准九分数年级当量量表分数正态曲线当量各分测验信度均在0.8以上教师自编课堂测验特点（选择）测验形式灵活多变测验目的完全一致测验内容与教材内容高度一致测验难度切合学生的实际水平测验编制简单快速能力测验（简答）智力人们在获得知识和运用知识解决实际问题所必须具备的心理条件或特征关于智力智力是学习的能力智力是适应环境的能力智力是抽象思维的能力智力是信息加工的能力比内西蒙量表（选择）1905年世界第一个智力量表处于对诊断异常儿童智力的需要1908年第一个年龄量表增加测验项目到59个测验以年龄分组以智力年龄评估个体智力1911年增加适用范围设置成人题目组斯坦福-比内量表（选择）1916年推孟首次引入比率智商以IQ作为个体智力水平的指标1937年将量表适应性扩大到1.5-18岁 1960年舍弃了比率智商引入离差智商概念平均是100 标差161972年重新修订常模信度大体在0.9以上随机误差引起分数变异不足10效度内容效度斯比量表包含多内容效标关联效度在0.4到0.75中国比内（选择）陆志伟吴天敏 51道题每题代表4个月韦克斯勒量表（选择）W-B1第一个成人智力测验主要测量10到60岁人WAIS-R 每个分测验独立计分在转化为平均数10标准差3的标准分数 6语言量表可得语言分量表 5操作分测验得操作量表分全部相加可得全量表分平均分100标差15信度背书和数字符号是复本信度其他为分半信度效度没有收集。中国修订版 1982 龚耀先语言量表常识理解算术类同背数词汇操作量表数字符号填图积木图案图片排列拼图 WISC 韦氏儿童量表降低了测验难度添加了迷津测验背数迷津为被选测验适用6到16 每四个月为一个年龄组中国修订版1979年林传鼎张厚灿WPPIS 韦氏幼儿量变 1967 使用4到6.5岁有句子复述动物房几何图案为新编团体智力测验（选择）陆军乙使用非文字测验瑞文推理（选择）非文字图形测验瑞文标准推理测验使用5.5岁以上正常智力发展人瑞文彩图推力测验使用幼儿和智力底下成人瑞文高级推力测验理论假设来源于斯皮尔曼智力一般因素理论瑞文将G因素划分为再生性能力推断性能力中国版修订1985年张厚灿认知能力测验（选择）1968-1972 桑代克等分为初级性适用小学低年级图片材料口头指导语包好口头词汇关系改变多重智力和数量文字测验适用小4以上有词汇句子填充词语分类词语类推组成数量测验适用小4以上数的大小比较数列补充和建立关系非文字测验使用小4以上图形分类图形推理和图形综合组成能力倾向测验（选择）目的在于预测未来预测个体在将来的学习或工作中可能达到的成功程度具体能力倾向测验学术能力倾向测验SAT 分辨能力倾向测验DAT 一般能力倾向成套测验GATB特殊能力测验西肖尔音乐才能测验音乐能力测验图梅尔美术判断力测验格雷福斯图案判断测验霍恩没事能力问卷空间关系测验机械理解能力测验创造力测验（选择）吉尔福特发散思维测验主要理论基础是吉尔福特智力结构理论托伦斯创造性思维测验人格测量（选择）通过一定方法对在人的行为中起稳定调节作用的心理特质和行为倾向进行定量分析以便进一步预测个人未来行为人格测验信度效度相对智力测验更低注意人格测量的真实性问题提高真实性插入说谎量表或使用投射测验自陈量表（选择）即自我陈述让被测者个人提供自己人格特征的报告假设受测者了解自己人格特征特点题量较大常采用纸币测验计分简单而客观信度通常采用重测信度和内部一致性信度不低于0.6 效度常采用理论建构效度主要问题在反应定势（社会赞许）反应形式（默认形式或合理化加工）除以下量表自陈量表还有加州心理调查表CPI 儿童14中人格因素问卷明尼苏达多项人格调查表（选择） MMPI 哈撒韦麦里金1966年 566 16个重复项目为测受测者反映的一致性前399分配在13个分量表 10临床 3效度量表中国修订版1980-1989 宋维真临床量表 Hs 疑病 D抑郁 Hy癔病 Pd精神病态 MF性别化 Pa妄想 PT精衰 Sc精神分裂 Ma轻躁狂 Si社会化效度量表 L 说谎量表 F诈病量表 K校正量表分数高表示一种自卫反应 Q疑问量表未答或都选 30分异常卡特尔16种人格因素量表（选择） 16PF 团体测验能在45分钟测量16中主要人格特质初中以上文化程度均可A B两套题目每套187 分配在16个项目每项目13-26题 ABC三个选项投射测验（简答）投射之个人对客体特征的想象式解释个体具有将自己身上发生的心理过程无意识附着于客体身上特点测验材料没有明确的结构和确切意义受测者对测验材料的反应不受限制可根据自己理解做解释决定于受测者人格特征和当时心态测验的目的具有明显的隐蔽性避免伪装和防卫对测验结果的解释重在对受测者的人格特征获得全面整体了解投射测验内容多为无明确意义图片被广泛夸文化使用相对自陈量变计分困难难以对结果进行确定的定量分析理论基础精神分析的无意识观点假定人们对外部事物的解释性反应都是有其心理原因的同时也可以给予说明和预测人们对外部刺激的反映所呈的刺激特征受多方面因素影响正因为个人人格会无意识渗透在对情境解释性反应之中所以通过个体解释内容获得受测者自身人格特质认识信度效度。由于测验自身原因难以获得信度效度指标。分类根据被试反应方式分联想法让被试说出某种刺激所引起的联想罗夏克墨迹测验构造法要被试根据他所看到的图画编造一套含有过去现在将来等发展过程的故事主题统觉测验完成法提供一些不完整句子或故事等材料让被试自己补充句子完成测验选排法要被试根据某一准则选择照片或排列表露法受测者利用某种媒介自由表露自己心理状态房树人测验罗夏克墨迹测验（选择） 1921正是发表。第一个投射测验5张黑白图片 3张彩色 2张除黑白外有明显红色主体统觉测验（选择）莫瑞摩尔根 1935年 TAT原理呈现意义相对模糊的图卡并鼓励他按照卡不假思索编述故事基本假设人们在解释一种模糊情景时总是倾向将这种解释与自己过去的经历和目前的愿望相一致在面对测验卡讲故事受测者利用过去经验并在所编造的故事中表达他们的感情和需要30张黑白图卡和一张空白图卡比罗夏克墨迹的组织和意义要明确30张图卡分为四组按性别年龄适用于各组受测者的图卡均为19张外加一张空白卡心理健康量表（选择）SCL-90 采用五级评分制 0-4 0 代表没有 4代表很重汉米尔顿焦虑量表 1950 用于评定神经症和其他病人焦虑严重程度 5级评定总分29严重 21明显14有焦虑发育量表（选择）格赛尔智能发育量表 1940 适用4周到3岁包括动作能力应物能力语言能力应人能力每次测验60分钟以发育商数DQ=测得的发育成熟年龄/实际年龄*100% 表示 70以下为低常 70-90一般 90-110正常 110-130良好 130-150优秀 150以上超常项目反映理论（简答）属于微观研究也称特质理论或潜在模型意义在于可以指导项目筛选和测验编制假设 1能力单维性假设指组成某个测验的所有项目都是测量同一潜在特制 2局部独立性假设对某个被试而言项目间无相关存在 3项目特征曲线假

展开阅读全文

测量心理学 2011de执着-人生在磨砺中见锋芒(修订版2)

最新文档