测量心理学 2011de执着-人生在磨砺中见锋芒(修订版2)

上传人:ca****in 文档编号:203103728 上传时间:2023-04-24 格式:DOC 页数:16 大小:112KB
返回 下载 相关 举报
测量心理学 2011de执着-人生在磨砺中见锋芒(修订版2)_第1页
第1页 / 共16页
测量心理学 2011de执着-人生在磨砺中见锋芒(修订版2)_第2页
第2页 / 共16页
测量心理学 2011de执着-人生在磨砺中见锋芒(修订版2)_第3页
第3页 / 共16页
点击查看更多>>
资源描述
测量(选择)测量就是依据一定的法则使用量具对事物的特征进行定量描述的过程一定法则 是建立在科学规则和科学原理基础上 并通过科学的方法和程序完成测量的过程事物特征 是所要测量的事物的特定属性 根据性质可根伟 确定型 随机型 模糊型量具 是测量的工具定量描述 是任何测量的结果 总是对事物特征的量的确定 区分性 序列性 等距性 可加性测量精度影响因素(选择)测量对象本身性质 确定型 事物量保持恒定不变 随机型 事物量随机改变 模糊型 对象本身不确定测量工具的精密性 测量学的目标之一是设法尽可能把误差减少到最低程度 而不可能完全消灭误差测量的基本要素(选择)参照点 绝对参照点 以绝对零点为测量的起点 零点的意义为无 什么都测不到 相对零点 只能加减 不能乘除单位 理想单位具备两个条件 要有确定的意义 同一单位所有理解相同 要有相等的价值 测量量表(简答) 量表 能够使事物的特征数量化的数字的连续体命名量表 是最低水平量表 只用数字来表示事物或进行分类 适用统计方法 百分比 次数 众数 卡方 命名量表细分为 名称量表 和类别量表顺序量表 次低量表 给个体赋值 数字代表 等级 大小 程度的顺序 没有相等单位 没有绝对零点 适用统计 中位数 百分比 百分位数 等级相关系数 肯德尔和谐系数等距量表 较高水平量表 等距量表的数字具有真正的数量 给个体赋值 数值间的差反映个体心理在特征上的差异程度 没有绝对零点 能够进行加减运算 适合统计方法 平均数 标准差 积差相关 t检验F检验比率量表 最高水平量表 个体间数值反映个体心理在特性上的比率 有绝对零点 适合统计 几何平均数 变异系数心理测量的定义(配套简述)依据一定的心理学理论 使用一定的操作程序 给人的行为和心理属性确定出一种数量化的价值心理测量与一般测量的比较(简答) 心理测量依据的法则很大程度上只是一种理论 通过理论来编制测量工具并完成测量工作 不如物理测量准确心理测量对象是人的心理特质和成就 特质含义模糊 不大容易给予界定 其具有内隐性 需要通过行为推断心理测量量具由有关专家编制 长期形成 标准化测验 心理测量目标虽然是对人心理特质和教育成就进行定量分析单精度较差 编制技术水平并不高 编制理论不够先进心理测量的理论基础(简答)1918桑代克 凡是客观存在的事物都有其数量 1939年 麦柯尔凡是有其数量的事物都可以测量1 人的心理现象和知识水平同其他一切物理现象一样是有差异的 包涵质和量两个方面 有必要测定差异的数量2 心理特质和知识水平虽不是物理实体 不能直接测量 但能够通过行为表现 3心理测量的准确性 可靠性 精确性 如同其他一切测量技术一样是相对的 测量不准确不等于不能测量心理测验的定义(简答) 这个知识点比较重要 它可以延伸出 样本取样 项目分析 信度效度等问题的论述题 是对行为样本的客观的和标准化的测量行为样本 从总体行为中抽取出来 能反应个体特定心理特质的一组行为 可以依据对这一组行为测量结果推断其心理特质 样本需要有较好的代表性 样本的代表性制约 测量的质量 并且要了解 全部行为样本的意义 心理测量的目标是 通过测量 来预测被试以后将会出现的行为标准化 指测验编制 实施 计分 以及测量分数解释程序的一致性 标准化需要具备 测验内容标准化 所有接受测量的个人实施相同的或等值的测验内容 施测条件标准化 所有接受测量个人必须在相同施测条件下接受测验 情境 指导语 时限评分规则标准化 测验制定评分标准 最大化 使不同人的评分一致测验常模标准化 个体分数需要与他人比较才有意义 常模即给解释分数一个可比较参照点难度或应答率 难度太低或太高 不能有效地将不同水平个体区分 应答率需要通过客观统计计算确定信度和效度 信度是指一个测验的可靠性 即多测用同一测验测量统一团体所得分数的一致性 效度 是测量有效性 一个测验多大程度上能够测量到它所要测量的心理特质分类(简答)按对象属性和特质不同分认知测验 包括能力测验 智力测验(斯比量表 威克斯勒智力量表 瑞文推理) 成就测验人格测验 指测量个人注入兴趣动机等(16PF 艾森克人格问卷 罗夏克墨迹 主题统觉)按测量方式分个体测验 主试在同一时间内只能测量一个被试 斯比 威克斯勒 罗夏克墨迹 主题统觉 优点 主试对被试的观察更细致 有机会获得测量分数之外的信息 主试和被试的面对面交流更多 容易和被试建立融洽合作关系 一些特殊被试只能选择个体测验 缺点 费时间 难以在短时间内收集大量测量资料 测验手续比较复杂 需要经过较高水平训练的人担任主试团体测验 同一主试在同一时间内 能够测量许多被试 瑞文 陆军甲乙团体智力 优点 短时间内可以大量获得信息 节省时间 在教育 选拔 团体比较中广泛使用 缺点 不易有效控制被试的行为 容易产生测量误差 按照测试内容不同文字测验 测验内容通过文字形式表现 容易受被试文化影响非文字测验 通过图形 仪器 工具 实物 模型等形式表现 常限于个别测量按测验目的分 描述测验 诊断测验 预示性测验按测验难度和时限分 难度测验 和速度测验按测验 的要求分 最高行为测验和典型行为测验按计分方式分 客观测验 和非客观测验按照测量对象分 智力测验 测量个人智力水平的高低 能力倾向测验 测量个人的潜在才能预测个人能力发展倾向 分为 一般能力倾向测验 特殊能力倾向测验 成就测验 测量个人在接受教育后的学业成就 分为 学科成就测验 某一科目的学习成就 综合成就测验 在各学科上的综合学业成就 人格测验 测量个人在 兴趣 态度 动机 气质 性格等方面的心理特征 分为自陈 和 投射按评价参照标准 常模参照测验 被试水平与常模比较 以评价被试在团体中的相对 地位 目标参照测验 被试水平与一绝对标准相比较 以评价被试有无达到该目标 潜力参照测验 被试水平与自身潜力相比较 以评价被试有无充分发挥自己潜力心理测验理论研究功能(选择)理论功能 收集研究资料 通过测验获得第一手资料 作为实证资料做出科学结论建立和检验理论假设 根据已有研究 进行理论假设 再论证实验分组 可以和实验结合起来运用于研究工作实用功能 选拔人才 人员安置 心理诊断 描述评价 心理咨询 经典测量理论(论述) 测量中 能出论述的理论不多 经典测量理论模型 并且经典测量理论 也是这个阶段必须掌握的 是多数其他理论的支撑心理特质的含义心理特质是表现一个人身上所特有的相对稳定的行为方式含义 特质是一组具有内部相关的行为概括 具有一定抽象性 (让座 友好待人 热情助人) 特质是一种一般神经心理系统 可以综合不同刺激 使人对这些刺激做出相同反映(对老弱病残都能让座) 特质是一个人身上比较稳定的特点 一个人的精神面貌是有多种特质分多个层次有机组合而成 心理测量任务就是 区别出不同个体在能力 个性等特质上的差异 特质可以决定一个人对特定刺激的反应倾向 可以对人的行为做预期可测性假设 凡是事物都是有数量的 凡是有数量的都是可以观测的真分数的含义 被试某种心理特质的真正水平的那个值称作该特质的真分数 把实测的称为观察分数由于误差的存在 真分数很难得到 只能通过改进工具 完善操作 使观测分数不断接近真分数X=T+ECTT数学模型的三个假设公理1 若一个人的某种心理特质可以用平行测验反复测量足够多次其观察分数的平均数 会接近真分数E(X)=T或E(E)=02 真分数和误差分数之间相关为0 (T,E)=03 各平行测量上的误差分数之间相关为0 (E1,E2)=0 2 3说明E是随机误差不包含系统误差结论在问题范围内 某心理特质水平的真分数坚定不会变 测量任务就是估计这个真分数的大小观察分数被假定等于真分数与误差之和 即观察分数和真分数之间是线性关系测量误差是随机误差 并服从均值为0的正态分布一般情况下计算真分数不是通过对一个个体施测多个平行测试 而是对多个同质个体进行同一测验的测量当团体人数足够大的时候就会出现各误差相互抵消推导公式P44戴 虽然GG的有 但是我不想COPY过来 大家自己再好好看看自己过一遍手记忆深刻经典测量理论的评价1信度估计精度不高 根据真分数理论假设 测验原始分数X线性分解为测验真分数T和误差分数E两部分误差分数 原始分数 真分数相互独立 假设本身就不可靠 并且定义测验信度不能提高信度估计 严格的平行测验很难获得等都导致 信度估计不高2误差指标笼统单一 不精细 导出标准误 是所有被试测量误差的标准差 相同测验对不同测验的误差是不同的3各种参数的估计对样本的依赖性太大 编制高质量测验 离不开四度 对不同被试的得分影响大 并受制与随机抽样的理想状态 4参数指标之间的配套性较差 通过现有指标 不能找到验证某试题是否恰好匹配其被试的计量方法 PS经典测量理论CTT是我们现阶段所学知识的主要理论支撑 原因在于 项目分析 和 概化 都不能用手算 那么就要清楚 它的理论假设为它 提供了什么 很多理论 都只是站在理论假设的基础上提出 并进化的 那么 这些理论假设的正确性 就是后人批判的根据 也是后面 先进学说的弥补 不仅仅的经典测量理论 其他的理论也都是如此 先考虑假设的成立 是学习的一个根本测量信度 (论述)测量结果的稳定性程度 对测量一致性程度的估计 也叫测量的可靠性 P46戴定义1 被测团体的真分数的变异数与实得分数的变异数之比 公式 定义2 被测团体的真分数与实得分数的相关系数的平方 公式定义3 信度是一个测验X与它的任意一个平行测验X的相关系数 定义12具有理论意义 3具有实际意义原因在于 通常我们是为了测查一批人 而不是反复测量一个人的 (怎么理解?)公式信度的作用 信度是测量过程中所存在随机误差大小的反映 P47戴 信度可以解释个人测验分数的意义 标准误是一次测量中误差大小的客观指标 标准误 对于同一团体两次施测之差的分布的标准差 能否明白其公式的推导过程?一个研友问过我的 信度的标准误公式 信度可以帮助进行不同测验分数的比较 通过采用差异的标准误进行差异显著性检验 S为相同尺度的标准分数的标准差 差异显著性检验公式注意 信度有多种计算方式 只是对测量分数的一致性估计并不指出原因 获得较高信度只是测验有效性的必要条件测量结果是以一个点为中心SE倍数为半径上下波动的范围PS 不仅是理论 就是 公式 也是有继承性的 如果我们仅仅限于把表象的东西 记住 那么 我觉得 拿不了高分 多问几个为什么 !信度系数的估计(论述)(各种计算方法只适用常模参照测验)学绩0.9 人格0.8 教师自编学绩0.6重测信度 是指用一个量表同时对一组被试施测两次所得结果的一致性程度 为两次成绩的皮尔逊相关公式 重测信度值大说明两次结果比较一致 被试的心理特质不易受环境和状态影响 时间跨度稳定性好误差来源 所测特性本身就不稳定 成熟知识的发展并非人人等量增长 练习因素 和记忆因素 及偶发因素使用前提 所测量心理特质必须稳定的 练习和遗忘的效果基本上相互抵消 两次施测间无更多学习几点说明 重测信度一般用于反映随机变量因素导致的变化而不是行为的长期变化 适用人格测验 速度测验复本信度 两个平行测验测量同一批被试所得结果的一致性程度 其结果等于两次结果皮尔逊积差相关的数 如果两次施测是同时 称为等值性系数 反映了题目所带来的差异 如果有时间间距则称为稳定-等值系数 是最严格的检验误差来源 非平行测验的两个复本间差异 被试的情绪波动 动机变化 测验情景的变化使用前提 要构造两份或两份以上真正平行测验 被试要有条件接受两个 测验分半信度 将一个测验分为两半后 所有被试在这两半上所得分数的一致性程度制作分半的办法 奇偶法 随机安置法 题目难度分半 题目内容分半使用前提 在只能施测一次或没有副本的情况下使用 如果无法对等分半就不宜使用几点说明 有牵连的题目要放在同一半或则会高估信度 存在任意题或速度测验不易用半分法 如果测验有多个分量表 应在分量表内排好顺序 在把分量表两半组合起来求相关斯皮尔曼-布朗公式 适用两分半测验等价时 根据适用条件 可以出选择题 需注意不等价时用费拉南根 或 卢龙公式同质性信度 也叫内部一致性系数 指测验内部所有题目间的一致性信度 当具备较高同质性信度说明测验主要测的是某一个心理特质 如果不高测验结果是几种心理特质综合反映测量单一特性是同质性高的必要而不充分条件计算同质性信度的四种方法 库得-李查逊20适用 (0、1)计分测验库得-李查逊21适用所有题目难度接近时 卡隆巴赫系数 实际上 库得-李查逊的20、21是其特例 其值为测量信度的下界估计值 大信度高 小未必低荷伊特 用方差分量描述评分者信度 多个评分者给同一批人的答卷进行评分的一致性程度 当评分者为2时计算为 同一被试所有分数的相关系数 当大于2时用肯德尔和谐系数当评分者为3-20 被评分者N=3-7 可以查W表 W值高则信度高 当N大于7可以计算卡方指公式信度的影响因素(简答)被试方面 个体身心健康 应试动机 注意力 耐力 求胜心 同质性低 分数高 可能高估信度值主试方面 施测者不按照规定施测 给被试暗示 指导语不当 主试的期望和情绪影响 评分者的标准施测情境 会对测验构成影响 光线 空间狭窄等测量工具 在测验长度上 测验越长 测验的信度越高 在难度上 过难或太容易都会降低信度 取样不当也会影响信度两次测量间隔时间 时间间隔越长信度越低提高信度的方法(简答)1适当增加测验中与原题目具有较好同质性的题目 增加测验长度 长度要适度2是测验中所有试题的难度接近正态分布 并控制在中等水平 这样的分的分布更广3努力提高题目区分度4选取恰当被试团体 提高测验在各同质性较强的亚团体上的信度 注意被试的个人信息5主试严格执行施测规则 评分严格按照评分准则 施测场地按要求布置 减少无关干扰测量效度(论述)指一个测验或量表实际能测出其所要测的心理特质的程度,效度是总变异中由所测量的特性造成的变异所占的百分比注意 效度是一个相对概念 1心理测量的效度只有程度上的差别效度相对一定目的而言 2心理测量的特质具有隐蔽性需要通过行为表现推测 而不是百分百准确的 不能为0 效度是测量的随机误差和系统误差的综合反映 只要出现测量误差 效度必受影响 判断一个测量是否有效要从多方面收集证据测量理论中 效度指 与测量有关的真实变异与总变异的比 公式P60戴效度的估计内容效度 测验题目对有关内容或行为取样的适当程度 一个测验实际测到的内容与所要测量的内容之间的吻合程度注意条件 要有定义完好的内容范围 测验题目应是所界定的内容范围的代表性取样 主要采用逻辑分析法 即专家根据自己的知识经验对量表的有效性做出判断主要步骤 确定测验内容的总体范围 确定 每个题目所测内容 比较自己分类和测验编制者的分类 编制评定量表 从所测验内容所测的技能 题目对所定义范围覆盖率各种题目数目和分数的比例以及题目形式的适当性做出评价内容效度 主要应用成就测验 和某些选拔 分类的职业测验 不适用 能力倾向测验和人格测验 主要问题在于缺乏理想的数量指标是它最突出的问题 贝隆巴赫指出 被试后测成绩显著由于前测成绩说明 内容有较高内容效度结构效度 适用所要测量的理论结构或特质的程度 或者说所测验分数能够说明心理学理论的某种结构或者特质的程度 所谓某种结构或特质是心理学理论抽象而假设性概念主要特点 结构效度的大小取决于事先假设的心理特质理论 具有不同理论构思的测验其结构效度无法进行比较 结构效度有时难以获得 当实际测量资料无法证实假设理论的时候 不一定确定结构效度低 可能假设错误 结构效度没有单一指标 需要由各方面证据累积起来进行评价确定方法 步骤 提出理论假设 并分解成一些细小纲目 依据理论构架推演有关测验成绩假设 用逻辑和实证 检验假设测验内方法 主要包括内容效度 被试解答测题时的反应过程和测验的同质性测验间方法 相容效度法 计算新的测验与测量同一特质的已知效度较高的原有测验的相关系数 区分效度法 如果两个测验测量的是不同特质 使用相同方法进行测量他们之间的相关也应该很低 因素分析法 通过因素分析找出影响测验的共同效度测验分数总变异来自有关因素的比例是其指标 考察效标关联效度 根据效度把人分为两类 考察其得分差异 依据测验得分把人分为高分组和低分组 考察这两组在所测特质方面是否有差异多种特质-多种矩阵法 若用多种极不相同的方法测量同一特质相关很高效标关联效度 常用于 学业成就 等级评定 临床诊断 专门训练 实际工作表现 团体能力区分一个测验对处于特定情境中的个体的行为进行估计的有效性 又叫实证效度效标 被估计的行为是检验测验效度的外在标准简称效标 也是独立于测验并可以从实践中直接获得的我们感兴趣的行为根据时间分类 可以分为同时效度 测验分数和效标资料是同时收集 预测效度 先获得测验分数 隔一段时间再收集效标资料常用效标 学业成就 临床诊断 实际工作表现 特殊训练成绩 不同团体的总体表现 先前有效的测验 等级评定测量要求 有效性 效标测量能真正反映观念效标 代表理论上测验有效性的主要方面 可靠性 效标测验应具有较高的信度 客观性 效标测量必须能真正反应观念效标 避免效标污染 评定者知道被试分数而影响对效标的评定 实用性 优秀的效标测验应该方法简单经济实用效标估计方法 相关法 计算测验分数与效标测量之间的相关系数 区分法 根据效标测验的成绩区分被试为两组 然后分析这两组被试原来接受测验的分数差异若差异显著说明测验有较高的效标 命中率 当测验做取舍决策时 正命中率和总命中率是较好的效标 功利率 测验所需费用和得到收益进行比较效度影响因素(简答)测验构成 测验中词汇和句型不能过于困难 题目表达要清楚 测题不能给出额外线索 测题编制要合理 测验正确答案不能有明显组型 测试题目难度适当 测题数目适当 题目长度增加可以提高信度 正相关测验实施过程 遵从指导语 控制计分差错测验被试 被试的动机 情绪 态度 对于团体如果缺乏必要同质性 可能导致下降所选效标的性质 效标与测验行为的近似型 效标本身的可靠性 效标行为和测验分数之间是否呈线性关系(皮尔逊相关引起)测量的信度 信度不高的测验 不可能有高效度提高效度方法(简答)精心编制测验量表 避免出现较大系统误差妥善组织测验 控制随机误差 减少随机误差 创设标准应试情境 让每个被试发挥正常水平 选好正确效标 定好恰当效标测量 正确使用有关公式信度和效度关系(简答) 如果考研以简单提问 就需要说明以下红字内容 直接制约你的得分这个知识点需要注意 要明白并且弄清所有变异来源 以及 信度 效度的定义公式根据S2X= S 2V+ S2I+ S2E S2T= S 2V+ S2I rxx= S 2T/S2X rxy= S 2V/S2X 当随机变异数 减小 真实分数的变异数增加 测验信度就随之提高 然后信度提高只给有效变异数增加提供可能 是否提高效度 需要看 系统误差的变异数 因此 能够提高效度 真分数的变异数必须占较大比重信度高是效度高的必要而不充分条件 一个测验效度高信度必然高 但信度高不一定效度高效度受到信度制约公式PS这个知识点本人真的觉得很重要 效度信度讲了那么多 实验测量统计 都有 而且都是重要知识点搞清楚 来龙去脉 理解生层次内涵 心理测量的误差(选择) 测量误差 在测量过程中由那些目的无关变化因素引起的一种不准确或不一致的测量效应包括 测量误差由那些与测量目的无关变因所置 测量误差表现不准确或不一致心理测量误差分类 随机误差 与测量目的无关的 偶然因素引起而又不易控制的误差 使得多次测量结果不一致系统误差 由测量目的无关的变因引起 一种恒定而有规律的效应 稳定存在于每次测量中 (并不一定如此)系统误差只影响测量的准确性 随机误差影响稳定性和准确性测量误差的来源(选择)测量工具 测量偏差 测量工具信度不好 效度不好 都会影响测量对象 造成测量误差的主要原因受测者真正水平是否正常发挥 受测者的动机 状态和情绪 心理生理水平施测过程 施测的物理环境 主试的某些属性 计分环节出现干扰等测量误差估计(简答) 假设如果一个人测量无数次则其误差之和为0 平均误差为0误差与真分数之间独立一个团体的平均真分数 等于该团体中所有被试实得分数的平均值 如果团体足够大则误差会相互抵消对于一个团体 实得分数 真分数 和测量误差之间的关系为 心理测验的项目分析(简答)P72戴(如果今年出一道关于项目分析的简答呢?以后大题年年都会有计算吧我想)题目难度 测验项目的难易程度题目计算 二分计分项目通过率公式 高低分组27% 计算公式 非二分计分项目公式 非二分项目进行难度比较校正排除猜测答案的公式难度水平确定(选择)取决于测验的目的和性质 对于选拔性测验 应该将难度控制在录取率 对于选择题 难度大于猜测概率 难度的等距变换 (简答) 这里要知道 具体转化过程 比如 +1 的难度 通过率是多少? 仔细看看P75戴由于难度是顺序变量 不能说0.6 0.7 0.8之间是同等差异 不能指出差异的大小和代数运算 所以一般都转换成等距量表 样本很大时 样本分布近似为正态 可以转换成标准分数 但是转换后往往会有小数和符号 可以采用美国教育测验服务中心的难度指标 =13+4Z Z为P值转换得来的难度指标难度对测验的影响(选择)1项目难度普遍较大的测验 分数分布为正偏态 小为负偏态 能力成就测验控制在0.5 正偏态适合筛选性测验2过难或过易的测验会使分数集中 题目的区分度D (简答) 是否具有效度的指示器 取值在-1到+1区分度 指测验项目对被试心理品质水平差异的区分能力或鉴别能力 作为评价项目质量 筛选项目的主要指标依据区分度计算 项目鉴别法 高低分27%公式 N小于100可用50% 相关法 项目分数与效标或测验总分的相关作为项目区分度的指标 相关越高项目区分度越高 方差法 被试在某一项目上的得分越分散则试题鉴别能力越大区分相对性 不同计算方法区分值不同 一个测验的每一项目都要采取同一区分度指标 样本容量大小影响相关法区分度值的大小 一般样本容量越小 统计值越不可靠 分组标准影响鉴别力指数D 极端组划分不同 区分值不同 分组标准的同质性程度影响区分度的大小 被试团体越同质 个体水平越接近 区分度越小区分度与难度(简答)当通过率为极端值 此时难度为极端值 D=0当通过率不为极端值 此时难度不为极端值 D的值会有不同 但D受通过率的制约通过率越大 Dmax 越大 当P为0.5时Dmax为1最大猜测问题与猜测率(简答)猜测校正公式 P86戴被选答案越少 被试得分越高于他们的真实水平 则难度的不能良好反映真实难度 公式 P86戴优点 可避免降低测验的信度 校正后的得分可以反映被试真正水平 比较公平 事前孤立学生答完全部选题 但总有人无法答完缺点 公式的基本假设不成立 只要被试能做完全部试题 猜测校正无实质作用 会出现负数 不采用猜测校正对信度并无重大影响 实际缺乏充分的证据和资料PS 由于选项不同 可能未校对前 A难度大于B 可校对后 B也有可能大于A 题目的综合分析和筛选(简答)区分度在0.3以上较好 难度保持0.50.15的正态分布如果是人格测验 态度测验 以及心理健康测验不要求难度过高 选项异常 正确答案无人选 题目高分组选择低于低分组 错误的选项高分组高于低分组 某个题目无人作答题目分析注意点(简答)难度 过难的 过易的 题目需要说明区分度 小于0.19的需要说明 某题目未做答过多 需要说明某题目的错误选项无人作答或作答人数过少 需要说明某题目某错误选项 高分组和低分组作答人数相同需要说明某题目某错误选项选择人数高于正确选项选择人数 需要说明 其他内容良好 需要正面评价原始分数 被试接受测验后 根据测验计分标准 对照被试的反应所计算出的测验分数成为原始分数导出分数 在原始分上 按照一定规则 经过统计处理后获得的 具有一定参考点和单位可以相互比较的分数包括 百分数 百分等级 标准分数 T分数 标准九分数导出分数种类 见统计资料PS 需要说明 看到公式一定要理解公式的意义 每个符号 符号和符号之间的意义 对照例题理解 特别抽象除外 然后再做题 理解了意义 其实公式很好背 做题很顺手 我说过 现在的心理学 理科很死 文科很活分数组合的一般种类 了解基本测验项目组成一个分测验或一个测验 有几个分测验的得分组成合成分数有几个测验的得分的组合 获得合成分数或合成预测分数合成的方法 临床诊断-直觉合成 具有较高综合性具有灵活针对性 容易受主观偏见影响 缺乏精确数量分析加权求和合成 测验间特质相互代偿有为连续分布 并基本同时获得 多重回归 多重划分常模团体(简答)具有某种共同特质的人所组成的一个群体 或是该群体的一个样本 成就测验和能力倾向测验 常模团体应包括目前与潜在的竞争者 广泛能力与性格测验 通常包括具有同样年龄或教育水平的人确定常模团体的注意事项(简答)群体构成的界限必须明确 必须清楚说明所要测量的群体的性质和特征常模团体必须是所测群体的一个代表性样本 如果缺乏代表性则会使常模产生偏差取样过程必须明确且有详尽描述 防止测验中产生偏差样本大小要适当 根据总体选择 团体人数 若群体性质单一 则样本数不必大 测验结果的精确度和样本容量正相关常模团体必须是近时的 常模属于历史 而人是随实践变化的注意一般常模与特殊常模的结合主要常模参照分数(选择)心理年龄 被试在标准化题目中所得原始分与常模年龄比较 在青春期后 年龄常模不再有意义年龄量表基本假设 是 所测量的特质随年龄做有系统的改变基本要素 一组可区分不同年龄的题目 一个常模团体 各个年龄具有代表性的样本 常模表年级当量 被试测验成绩与某一年级学生平均数比较 说成相当于某一年级水平 单位为10个月缺点 教育内容每个年级不同 年级当量解释比较困难 年级常模经常被误用为标准商数教育商数 教育年龄和实际年龄之比 教育年龄为儿童取得的平均教育成就 通过年级当量间接获得成就商数 一个学生的教育年龄比智龄 确定 智龄和学业成就只有中等相关 其次二者测验不可靠呈现常模资料的方法(简答)转化表 又称常模表 最简单最基本且最常用 由原始分数 相应导出分数 常模团体具体描述 组成 分为简单转化表 和复杂转化表剖析图 要求个各分测验所使用的必须是同一个常模团体 编制心理测验的基本程序(简答)确定测验目标明确测量对象 即明确测量那些团体和个人 明确测量目标 测量什么心理功能 并进一步具体化明确测量用途 用途不同编制材料的取材范围和难度也不同制定编题计划全面而具有代表性的测验内容 不致使测验偏离应侧范围对各个内容点相对重视程度用途 指明编辑那些方面的测验项目即数目 计分可按计划中百分比确定每类测验项目分数标准编辑测验项目收集测验资料 资料要丰富 资料要具有普遍性 资料要有趣味性选择项目形式 取决于受测者 年龄 人数 测量目的 测验项目性质 编写测验项目 测验项目的取样应当对欲测心理品质具有代表性 确保有效性 测验项目的取材范围要同编题计划所列项目范围一致 测验项目的难度应有一定分布范围 编写测验项目的用语力求精简明了 初编题目数量大于最终题数 便于筛选和编制副本 测验项目的说明必须简明预测与项目分析预测 获得被试对测验项目作何反应的资料注意 预测对象来自正是测验时被备选的群体 具有代表性 预测的情景力求同正式测验一样 测验的时限可以延长 便于做完题目 施测者应对受测者的反应加以记录 对完成数目 和题意不清的项目分析 对预测结果进行统计分析 确定项目难度和区分度 合成测验 经过预测以后证明有价值的项目排成有组织的测验 解决测验项目的选择问题和测验项目的编排问题测验项目选择 性质 难度 区分度测验项目编排 并列直进式 依此由易到难 混合螺旋式 根绝难度分为若干不同层次 做交叉式派力奥 难度渐次上升编制复本 增加实际效用 一种测验只有要有等值的两份条件 各份测验测量相同特质 内容形式相同 不应重复题目 测验数目相同测验标准化见第一页测验内容 施测过程 评分标准分数解释鉴定测验 测验编好必须对信度效度进行鉴定 以及测验量表和常模编写测验说明书测验目的作用 理论依据 测验方法 测验的标准答案和评分方法 关于测验信度 效度资料水明 常模表及解释测验分数的解释(简答)解释类型 描述个人心理特征状态 溯因解释及个人目前 预测解释及推测未来 评价的解释原则 充分了解测验性质和功能 对导致测验结果的原因解释应慎重 防止片面 必须充分估计测验常模和效度的局限性 解释分数应参考其他有关资料 对测验应以 “一段分数”来解释 而不是 特定数值如何告知测验分数意义 使用当事人理解的语言 保证当事人知道这个测验测量目的 以常模为参考 需要知道比较的常模团体 要使当事人知道分数只是估计 具有偏差 要考虑 测验分数给受测者的影响 测验结果保密 对低分者解释应小心 报告测验分数应设法了解当事人的心理感受 采取适当措施加以引导PS不要觉得这个不重要 在某年某高校真题中就出现过 。测验等值(选择)通过考核同一种心理品质的多个测验形式做出测量分数系统的转化 进而使不同形式之间的测验可比测验等值分数系统转化与测验原始分数与导出分数转化之间区别目的不同 前者 为了比较不同测验形式之间实测分数 后者是为了把原始分转换到可以比较的相对分数系统中性质不同 前者 是两个或多个不同测验形式分数系统转化 后者是一个测验形式不同分数系统转化测验等值的条件(简答)同质性 被等值的不同测验形式必须是同一中心理品质 内容范围也一致等信度 不同测验 等值需要相等信度 公平性 考生参加被等值的不同测验形式中任一个测试 等值后结果一致可递推性 很重要。对成型 两个待等值的测验形式 XY 无论等值转换从哪出发 其对应关系相同样本不变性 测验XY的等值关系 与其本身有关 而与样本无关测验等值结果的表示方法(了解)列表法 对应排列成表公式法 y=Ax+B图示法 画图。测验等值的计算方法(了解)等百分位等值 线性等值 公式P143戴PS 能看到上面有些只有题目 希望针对 上面的知识点 大家能看看 一定要看看 目标参照测验根据某一明确界定的内容范围 而缜密编制的测验 并 被试在所得测验结果 也是根据某一明确界定行为标准直接进行解释目标参照测验的项目分析(简答)内容范围的确定内容范围具有边界当其边界得到明确界定的时候 我们可以判定 什么行为属于这一内容范围每一种内容范围均可分为几类 每一类内容及其再次内容范围内相对重要性确定以后 内容范围就有了明确的结构特定测验目的的确定常为内容范围的界定提供依据内容效度分析项目分析首先对构成测验的每一个题目是否适合以及有效进行分析 通常采用 专家评定法 根据中数判断质量测验的预测选取一定被试进行预测获取 数据 对项目难度 区分度进行量化分析前测-后测 已接受教学组-未接受教学组对照组 前两个方法 其假定有关教学活动的被试均掌握教学内容 未必成立选择一批被试 经专家评定一组为未接受 一组为接受 在进行控制组对照组 比较难度分析纯粹的目标参照测验一般注重 所测内容范围以及被试所测内容掌握程度 如果某项目为不可或缺 那么难度被忽视区分度分析难度差值 掌握组-未掌握组指数 通过预测可得到两组数据 掌握者和非掌握者 K=Pa-Pb 得数越接近1区分度越高个人获得指数 采取先后测 可获得在前测中错误回答某项目而在后测中能正确回答的人数比例 接近1为有效相关系数 区分度为正负1 当为负数时应当予以修改或剔除 为正保留 接近1有效PS区分度 难度 通过率的计算其实很简单但是综合在一起 就要会! 这种知识点出简单题的概率很大目标参照测验的信度与效度(简答)信度 分类一致性信度 分数解释对被试分类 对被试分类一致性的度量指标 似乎成为分类一致性信度 考察被试在同一测验的两次施测中或量复本中是否被分为一类 运用四格法 公式见P162戴优点 直观易懂 计算简单 缺点 是复本法 和再测法的缺点 见前文方差分析方法荷伊特信度从信度定义出发 利用方差分析方法 找出个体水平真正变异在总变异的水平 作为估计值荷伊特信度不随测验分数分界点而变化 因而更具有普遍性效度内容效度 两个条件 测量有明确界定内容范围 对测验每一题目的内容效度的分析(内容效度分析法)效标效度 在统计指标与常模参照测验不同 提出决策效度 掌握组及格人数比总人数加为掌握组不及格人数比例测验分数的解释(选择)目标参照测验 有明确界定的行为标准 即测验分界点 其实解释无法逃避的 或作为决策的依据专家判定法效标组预测法 对照组法 临界组法学绩测验的性质(简答)对个体在一个阶段的学习或训练之后知识技能的发展水平的测定 属最佳行为测验最佳行为测验 施测时要求被试调动所学一切知识、所具备的一切技术能力对所有习题给出最佳答案或最佳操作编写时需要注意测验能够诱发被试发挥出最高水平学绩测验对象 认知性心理品质 其优劣表现为 认知内容的多寡 认知能力的高低 学绩测验 是针对有计划的学习或训练之后的成绩测定而设计的学绩测验的作用(简答)鉴定学生的学业成绩 学生评价 升学 反思 教师的教学改进 人事管理 录用学绩测验的分类(选择)编制方法分 教师自编课堂测验和标准化学绩测验 测验内容分 单科测验 多科测验 单元测验 总测验测验用途分 考察性测验 诊断性测验 标准化学绩测验(配套简答)在心理教育原理下 遵循一定程序所编制的各方面质量都达到规定标准的学绩测验斯坦福成就测验 (简答)综合性学绩考察测验 1923年 团体常模参照测验11个科目内容 词汇 阅读理解 拼字 听理解 词汇学习技能 语言 数学概念 数学计算 数学应用 社会科学知识和自然科学知识 配套测验 斯坦福早期学校成就测验 适用幼儿园和一年级学生 斯坦福学业技能测验 适用8到13岁学生导出分数 百分等级 标准九分数 年级当量 量表分数 正态曲线当量 各分测验信度均在0.8以上教师自编课堂测验特点(选择)测验形式灵活多变 测验目的完全一致测验内容与教材内容高度一致测验难度切合学生的实际水平测验编制简单快速 能力测验(简答)智力人们在获得知识和运用知识解决实际问题所必须具备的心理条件或特征关于智力 智力是学习的能力 智力是适应环境的能力 智力是抽象思维的能力 智力是信息加工的能力 比内西蒙量表(选择)1905年 世界第一个智力量表 处于对诊断异常儿童智力的需要1908年 第一个年龄量表 增加测验项目到59个 测验以年龄分组 以智力年龄评估个体智力1911年 增加适用范围 设置成人题目组斯坦福-比内量表(选择)1916年推孟 首次引入比率智商 以IQ作为个体智力水平的指标1937年 将量表适应性扩大到1.5-18岁 1960年 舍弃了比率智商 引入离差智商概念 平均是100 标差161972年 重新修订常模信度 大体在0.9以上 随机误差引起分数变异不足10效度 内容效度 斯比量表 包含多内容 效标关联效度在0.4到0.75中国比内(选择)陆志伟吴天敏 51道题 每题代表4个月韦克斯勒量表(选择)W-B1第一个成人智力测验 主要测量10到60岁人WAIS-R 每个分测验独立计分 在转化为平均数10标准差3的标准分数 6语言量表 可得语言分量表 5操作分测验 得操作量表分 全部相加可得全量表分 平均分100标差15信度 背书和数字符号 是复本信度 其他为分半信度 效度 没有收集。中国修订版 1982 龚耀先语言量表 常识 理解 算术 类同 背数 词汇操作量表 数字符号 填图 积木图案 图片排列 拼图 WISC 韦氏儿童量表 降低了测验难度 添加了 迷津测验 背数 迷津为被选测验 适用6到16 每四个月为一个年龄组中国修订版1979年 林传鼎 张厚灿WPPIS 韦氏幼儿量变 1967 使用4到6.5岁 有 句子复述 动物房 几何图案 为新编团体智力测验(选择)陆军乙使用非文字测验瑞文推理(选择)非文字图形测验 瑞文标准推理测验 使用5.5岁以上正常智力发展人 瑞文彩图推力测验 使用幼儿和智力底下成人 瑞文高级推力测验 理论假设来源于斯皮尔曼 智力一般因素理论 瑞文将G因素 划分为再生性能力 推断性能力中国版修订1985年 张厚灿认知能力测验(选择)1968-1972 桑代克等分为 初级性 适用小学低年级 图片材料 口头指导语 包好 口头 词汇 关系改变 多重智力和数量 文字测验 适用小4以上 有词汇 句子填充 词语分类 词语类推组成 数量测验 适用小4以上 数的大小比较 数列补充和建立关系 非文字测验 使用小4以上 图形分类 图形推理 和图形综合组成能力倾向测验(选择)目的在于预测未来 预测个体在将来的学习或工作中可能达到的成功程度 具体能力倾向测验 学术能力倾向测验SAT 分辨能力倾向测验DAT 一般能力倾向成套测验GATB特殊能力测验 西肖尔音乐才能测验 音乐能力测验图 梅尔美术判断力测验 格雷福斯图案判断测验 霍恩没事能力问卷 空间关系测验 机械理解能力测验创造力测验(选择)吉尔福特发散思维测验 主要理论基础是吉尔福特智力结构理论托伦斯创造性思维测验人格测量(选择)通过一定方法 对在人的行为中起稳定调节作用的心理特质和行为倾向进行定量分析 以便进一步预测个人未来行为人格测验信度 效度相对智力测验更低 注意人格测量的真实性问题提高真实性 插入说谎量表 或使用投射测验自陈量表(选择)即自我陈述 让被测者个人提供自己人格特征的报告 假设受测者了解自己人格特征特点 题量较大 常采用纸币测验 计分简单而客观信度通常采用重测信度 和内部一致性信度 不低于0.6 效度常采用理论建构效度主要问题在 反应定势 (社会赞许) 反应形式 (默认形式 或合理化加工)除以下量表 自陈量表还有加州心理调查表CPI 儿童14中人格因素问卷明尼苏达多项人格调查表(选择) MMPI 哈撒韦 麦里金1966年 566 16个重复项目为测 受测者反映的一致性 前399分配在13个分量表 10临床 3效度量表中国修订版1980-1989 宋维真临床量表 Hs 疑病 D抑郁 Hy癔病 Pd精神病态 MF性别化 Pa妄想 PT精衰 Sc精神分裂 Ma轻躁狂 Si社会化效度量表 L 说谎量表 F诈病量表 K校正量表 分数高表示一种自卫反应 Q疑问量表 未答或都选 30分异常卡特尔16种人格因素量表(选择) 16PF 团体测验能在45分钟测量16中主要人格特质 初中以上文化程度均可A B两套题目每套187 分配在16个项目 每项目13-26题 ABC三个选项投射测验(简答) 投射 之个人对客体特征的想象式解释 个体具有将自己身上发生的心理过程无意识附着于客体身上特点 测验材料没有明确的结构和确切意义 受测者对测验材料的反应不受限制 可根据自己理解 做解释 决定于受测者人格特征和当时心态 测验的目的具有明显的隐蔽性 避免伪装和防卫 对测验结果的解释重在对受测者的人格特征获得全面整体了解 投射测验内容多为无明确意义图片 被广泛夸文化使用 相对自陈量变 计分困难 难以对结果进行确定的定量分析理论基础 精神分析的无意识观点 假定 人们对外部事物的解释性反应都是有其心理原因的 同时也可以给予说明和预测 人们对外部刺激的反映所呈的刺激特征 受多方面因素影响 正因为个人人格会无意识渗透在对情境解释性反应之中 所以通过个体解释内容获得受测者自身人格特质认识信度效度 。由于测验自身原因 难以获得信度效度指标。分类 根据被试反应方式分联想法 让被试说出某种刺激所引起的联想 罗夏克墨迹测验构造法 要被试根据他所看到的图画 编造一套含有过去 现在 将来等发展过程的故事 主题统觉测验完成法 提供一些不完整句子 或故事等材料 让被试自己补充 句子完成测验选排法 要被试根据某一准则选择照片或排列表露法 受测者利用某种媒介自由表露自己心理状态 房树人测验罗夏克墨迹测验(选择) 1921正是发表 。第一个投射测验5张黑白图片 3张彩色 2张除黑白外有明显红色主体统觉测验(选择) 莫瑞 摩尔根 1935年 TAT原理 呈现意义相对模糊的图卡 并鼓励他按照卡不假思索编述故事基本假设 人们在解释一种模糊情景时 总是倾向 将这种解释与自己过去的经历和目前的愿望相一致 在面对测验卡讲故事 受测者 利用过去经验 并在所编造的故事中表达他们的感情和需要30张黑白图卡 和一张空白图卡 比罗夏克墨迹 的组织和意义要明确30张图卡分为四组 按性别 年龄 适用于各组受测者的图卡均为19张外加一张空白卡心理健康量表(选择)SCL-90 采用五级评分制 0-4 0 代表没有 4代表很重汉米尔顿焦虑量表 1950 用于评定神经症和其他病人焦虑严重程度 5级评定 总分29严重 21明显14有焦虑发育量表(选择)格赛尔智能发育量表 1940 适用4周到3岁 包括 动作能力 应物能力 语言能力 应人能力每次测验60分钟 以发育商数DQ=测得的发育成熟年龄/实际年龄*100% 表示 70以下为低常 70-90一般 90-110正常 110-130良好 130-150优秀 150以上超常项目反映理论(简答)属于微观研究也称特质理论或潜在模型意义 在于可以指导项目筛选和测验编制 假设 1能力单维性假设 指组成某个测验的所有项目都是测量同一潜在特制 2局部独立性假设 对某个被试而言项目间无相关存在 3项目特征曲线假
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 大学资料


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!