测验理论的基本假设培训课件

资源描述

测验测验理理论论的基本假的基本假设设第一节第一节心理特质及其可测性假设心理特质及其可测性假设7/6/20242测验理论的基本假设一、心理特质的含义内涵表现在一个人身上所特有的相对稳定的行为表现在一个人身上所特有的相对稳定的行为方式为人的心理特质（方式为人的心理特质（trait）。）。理解理解特质是一组具有内部相关的行为的概括，具特质是一组具有内部相关的行为的概括，具有一定的抽象性，有一定的抽象性，如善良、聪明如善良、聪明。比较稳定，对不同的刺激做相同的反应；比较稳定，对不同的刺激做相同的反应；7/6/20243测验理论的基本假设特质是一个人身上比较稳定的特点。特质是一个人身上比较稳定的特点。一个人的精神面貌（人格）是由多种特质分一个人的精神面貌（人格）是由多种特质分多个层次有机组合而成的。多个层次有机组合而成的。智力可以分语言智力可以分语言和操作，语言可以分为词汇和文法。和操作，语言可以分为词汇和文法。特质可以决定一个人对特定刺激的反应倾向，特质可以决定一个人对特定刺激的反应倾向，可以对人的行为进行某种预测。可以对人的行为进行某种预测。7/6/20244测验理论的基本假设二、心理特质的可测性心理特质的可测性Thorndike“凡客观存在的事物都有其数量。”McCall“凡有数量的东西都可以测量。7/6/20245测验理论的基本假设第二节第二节测量误差及其来源测量误差及其来源7/6/20246测验理论的基本假设一、测量误差的含义定义定义在测量过程中由那些与测量目的无关的变化在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效因素所产生的一种不准确或不一致的测量效应。应。理解理解测量误差由那些与测量目的无关的变因所致测量误差由那些与测量目的无关的变因所致测量误差表现为不准确或不一致两种方式测量误差表现为不准确或不一致两种方式。7/6/20247测验理论的基本假设二、测量误差的种类系统误差：由与测量目的无关的变因引起的一种恒定而有规律的效应（稳定）；随机误差：由与测量目的无关的、偶然因素引起、而又不易控制的误差（不稳定）。7/6/20248测验理论的基本假设（一）测量工具（测验内部）引起的误（一）测量工具（测验内部）引起的误差差题目取样题目取样(影响最大影响最大)指导语指导语难度难度时限时限测验复本不等值测验复本不等值三、测量误差的来源测量误差的来源7/6/20249测验理论的基本假设（二）由测量对象引起的误差（最复杂二）由测量对象引起的误差（最复杂最难控制的误差）最难控制的误差）测验的经验测验的经验练习因素练习因素应试动机应试动机测验焦虑测验焦虑反应定势反应定势生理因素生理因素7/6/202410测验理论的基本假设（三）由施测过程引起的误差（三）由施测过程引起的误差物理环境物理环境主试者方面主试者方面意外干扰意外干扰评分计分评分计分7/6/202411测验理论的基本假设第三节第三节真分数及其有关的假设真分数及其有关的假设7/6/202412测验理论的基本假设一、真分数的含义真分数（TrueScore）：一个测量工具在没有测量误差时，所得到的纯正值。操作定义：经过无数次测量所得到的平均值。观察分数（ObservedScore）：实测分数7/6/202413测验理论的基本假设实测重量（微克）Xt真正重量（微克）X误差（微克）Xe1219274151102030405021311总数150平均数30方差203.2标准误15030200003.21.8某一物理测量数据某一物理测量数据 (1)实测重量实测重量=真实重量真实重量+误差误差 (2)误差之和为零误差之和为零 (3)实测重量的平均值实测重量的平均值=真实重量的平均值真实重量的平均值7/6/202414测验理论的基本假设二、数学模型及其假设l（一）CTT的数学模型经典测验理论假定，观察分数（记为经典测验理论假定，观察分数（记为X X）与真分）与真分数（数（T T）之间是一种线性关系，并只相差一个随机误）之间是一种线性关系，并只相差一个随机误差（记为差（记为E E）。即即X=T+El（二）（二）3个相关联的假设公理个相关联的假设公理1.1.若一个人的某种心理特质可以用平行的测验反若一个人的某种心理特质可以用平行的测验反复测量足够多次，则其观察分数的平均值会接近于复测量足够多次，则其观察分数的平均值会接近于真分数。真分数。即：即：E E（X X）=T=T或或E E（E E）=0=0 2.2.真分数和误差分数之间的相关为零。真分数和误差分数之间的相关为零。即：即：（T T，E E）=0=07/6/202415测验理论的基本假设SV2SI2SE2SX2ST23.3.各平行测验上的误差分数之间相关为零。各平行测验上的误差分数之间相关为零。即即（E1，E2）=0SX2=ST2+SE2ST2=SV2+SI2SX2=SV2+SI2+SE27/6/202416测验理论的基本假设第四章第四章测量信度测量信度7/6/202417测验理论的基本假设请列举一些你所使用过或接触过的量表思考:量表的作用是什么？7/6/202418测验理论的基本假设你如何解释下述现象你如何解释下述现象？一个很聪明的孩子，测得智商是一个很聪明的孩子，测得智商是8080分分一个学习很好的学生，考试成绩为一个学习很好的学生，考试成绩为6060分分一个人缘很好的人，人际关系测量低于一个人缘很好的人，人际关系测量低于常模值常模值7/6/202419测验理论的基本假设量表帮助我们了解心理现象（心理特质），量表帮助我们了解心理现象（心理特质），就像尺子帮助我们测量身高。就像尺子帮助我们测量身高。思考思考:我们如何知道我们有多高？我们如何知道我们有多高？有两个工具：尺子有两个工具：尺子 /秤秤 7/6/202420测验理论的基本假设尺子的数据与我们的目测更一致，而秤盘的数据尺子的数据与我们的目测更一致，而秤盘的数据则与我们的目测不一致。因此，尺子是测量身高则与我们的目测不一致。因此，尺子是测量身高的有效工具的有效工具效度。效度。什么材料的尺子？什么材料的尺子？钢铁（热胀冷缩）钢铁（热胀冷缩）涉及到一致性的问题。涉及到一致性的问题。信度信度7/6/202421测验理论的基本假设1.70=1.7?7/6/202422测验理论的基本假设量表是我们用来了解心理特质的工量表是我们用来了解心理特质的工具，但这个工具是有误差的。误差具，但这个工具是有误差的。误差是不可避免的是不可避免的,但误差要控制在一个但误差要控制在一个许可的范围内。许可的范围内。7/6/202423测验理论的基本假设回顾什么是误差?误差的种类有哪些?7/6/202424测验理论的基本假设第一节信度概述一、什么是信度？一、什么是信度？信信度度（reliability）是是指指测测量量结结果果的的稳稳定定性性程程度度，也也叫叫测测量量的的可可靠性。靠性。操作定义：指真实方差除以测量方差所得的商操作定义：指真实方差除以测量方差所得的商.注意：注意：（1 1）信信度度指指的的是是一一组组测测验验分分数数或或一一系系列列测测量量的的特特性性，而而不不是是个人分数的特性；个人分数的特性；（2 2）真真分分数数的的变变异异数数是是不不能能直直接接测测量量的的，因因此此信信度度是是一一个个理理论上构想的概念，只能根据一组实得分数作出估计。论上构想的概念，只能根据一组实得分数作出估计。7/6/202425测验理论的基本假设三种等价的信度定义定义一信度乃是一个被测团体真分数的变异数信度乃是一个被测团体真分数的变异数(方差方差)与实得分数的变异数与实得分数的变异数(方差方差)之比之比。如果他们的比率是如果他们的比率是.87.87，说明了什么？，说明了什么？测量方差的测量方差的87%属于真属于真实方差实方差7/6/202426测验理论的基本假设7/6/202427测验理论的基本假设信度的定义二信度乃是一个被测团体真分数与实得分数的相信度乃是一个被测团体真分数与实得分数的相关系数的平方。关系数的平方。r rXXXX=P=P2 2TXTX思考：相关系数的平方？思考：相关系数的平方？7/6/202428测验理论的基本假设7/6/202429测验理论的基本假设信度的定义三信度乃是一个测验信度乃是一个测验X X与它的任意一个平行测验与它的任意一个平行测验X X的相关系数。的相关系数。r rXXXX=P=PXXXX7/6/202430测验理论的基本假设A A卷：你是一个喜欢热闹的人吗？卷：你是一个喜欢热闹的人吗？1=1=绝对是绝对是 2=2=是是 3=3=不一定不一定 4=4=不是不是 5=5=绝对不是绝对不是7/6/202431测验理论的基本假设B B卷：你是一个喜欢安静的人吗？卷：你是一个喜欢安静的人吗？1=1=绝对是绝对是 2=2=是是 3=3=不一定不一定 4=4=不是不是 5=5=绝对不是绝对不是7/6/202432测验理论的基本假设二、信度系数与信度指数信度指数：相关系数信度指数：相关系数信度系数：相关系数的平方信度系数：相关系数的平方注意：注意：（1 1）信度系数有多种。）信度系数有多种。（2 2）同一种信度系数也会因样本、测查时间不）同一种信度系数也会因样本、测查时间不同而有多个。同而有多个。（3 3）信度系数只是对测量分数一致性的估计，）信度系数只是对测量分数一致性的估计，但并没有指出不一致的原因。但并没有指出不一致的原因。（4 4）获得较高的信度只是测验有效的必要条件。）获得较高的信度只是测验有效的必要条件。7/6/202433测验理论的基本假设三、信度的作用1 1信度是测量过程中所存在的随机误差大小信度是测量过程中所存在的随机误差大小的反映的反映2 2信度可以用来解释个人测验分数的意义信度可以用来解释个人测验分数的意义 SE=S SE=Sx x1 r1 rxxxx真分数的置信区间（真分数的置信区间（95%95%）=X1.96SE=X1.96SE3 3信度可以帮助进行不同测验分数的比较信度可以帮助进行不同测验分数的比较7/6/202434测验理论的基本假设注意：信度参照的是测验分数或测量值，而非测验本身。测验由题目组成，而这些题目本身并不能提供信度的估计值。估计信度前必须先进行施测和计分。7/6/202435测验理论的基本假设第二节信度的估计方法一、重测信度(稳定系数)1含义和计算同一量表，同一被试群体，在不同时间，两次施测，求其相关。皮尔逊积差相关系数皮尔逊积差相关系数2使用的前提条件所测量的心理特质必须是稳定的；所测量的心理特质必须是稳定的；(人格测验人格测验)练习和遗忘的效果基本上相互抵消；练习和遗忘的效果基本上相互抵消；在两次施测的间隔时期内，被试在所要测查的心在两次施测的间隔时期内，被试在所要测查的心理特质方面没有获得更多的学习和训练。理特质方面没有获得更多的学习和训练。7/6/202436测验理论的基本假设l3.实质：表示测验结果的稳定性。故称之为稳定表示测验结果的稳定性。故称之为稳定性系数（性系数（Coefficient of StabilityCoefficient of Stability）4.形式：施测施测适当时间适当时间再施测再施测 7/6/202437测验理论的基本假设5.时间间隔的把握一个校区每年都对学生进行一个校区每年都对学生进行IQIQ测验，而另一个测验，而另一个校区则两年一次。第一个校区的老师可能认校区则两年一次。第一个校区的老师可能认为为IQIQ测验的分数在一年中会保持稳定，所以测验的分数在一年中会保持稳定，所以有必要进行再测，因为学生在一年后的回答有必要进行再测，因为学生在一年后的回答可能不一致。第二个校区的老师则认为在一可能不一致。第二个校区的老师则认为在一年中分数并没有明显的波动，那么施测的频年中分数并没有明显的波动，那么施测的频率没有必要高于两年一次。率没有必要高于两年一次。哪种结果正确呢？哪种结果正确呢？取决于第一年和第二年成绩的相关。通常来取决于第一年和第二年成绩的相关。通常来说，大约为说，大约为0.800.80或或0.900.90，且保持相对稳定，且保持相对稳定（Bayley,1949Bayley,1949）所以，频率没必要高于两）所以，频率没必要高于两年一次。年一次。7/6/202438测验理论的基本假设间隔时间越长，稳定性系数越低。适宜时间间隔时间越长，稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。间隔依照测验目的、性质及被试特点而定。几分钟至几年。几分钟至几年。年幼儿童，间隔要小；年长群体，间隔可年幼儿童，间隔要小；年长群体，间隔可大。智力测验的间隔不能太短，成就测验的大。智力测验的间隔不能太短，成就测验的间隔不能太长。间隔不能太长。一般间隔时间不超过六个月。（即不能让一般间隔时间不超过六个月。（即不能让被试记住上一次测验的内容，又不能让其特被试记住上一次测验的内容，又不能让其特质发生变化，或对所学知识产生遗忘）质发生变化，或对所学知识产生遗忘）适用于速度测验和人格测验适用于速度测验和人格测验,而不适用于难而不适用于难度测验度测验.7/6/202439测验理论的基本假设注意注意:同样一个量表同样一个量表,随着第二次测量的时随着第二次测量的时间不同间不同,它可以有不同的重测信度它可以有不同的重测信度在报告重测信度时在报告重测信度时,要说明两次施测的间隔要说明两次施测的间隔,以以及在此期间内被试的有关经历及在此期间内被试的有关经历。在中国修订在中国修订韦氏儿童智力量表手册韦氏儿童智力量表手册(C-(C-WISC)WISC)中中,就曾对重测信度的计算报告了被试就曾对重测信度的计算报告了被试情况情况(6-16(6-16岁城市儿童岁城市儿童151151名名,农村儿童农村儿童7474名且名且各年龄儿童分配较均匀各年龄儿童分配较均匀),),并报告了两次测验的并报告了两次测验的间隔间隔(2-7(2-7周周)及两次的相关系数及两次的相关系数(城市城市:0.59-:0.59-0.86,0.86,农村农村:0.56-0.81):0.56-0.81)。7/6/202440测验理论的基本假设二、复本信度1含义和计算复本信度（复本信度（Alternate-form reliabilityAlternate-form reliability）是指两）是指两个平行的测验测量同一批被试所得结果的一致性程度。个平行的测验测量同一批被试所得结果的一致性程度。复本等值要符合下列条件：各份测验测量的是同一种心理特性。各份测验测量的是同一种心理特性。各份测验具有相同的内容和形式。各份测验具有相同的内容和形式。各份测验的题目不应重复。各份测验的题目不应重复。各份测验题目数量相等，难度和区分度大体相同。各份测验题目数量相等，难度和区分度大体相同。各份测验的分数分布（平均数和标准差）大致相各份测验的分数分布（平均数和标准差）大致相等。等。复本编好后，应再测一次，以确保各份测验的等复本编好后，应再测一次，以确保各份测验的等值。值。7/6/202441测验理论的基本假设2使用的前提条件两测验真正平行；两测验真正平行；被试要有条件接受两个被试要有条件接受两个测验。测验。(时间时间,经费的限制经费的限制)等值性系数：同时连续等值性系数：同时连续施测，反映内容变异。施测，反映内容变异。形式：复本形式：复本AA最短时间最短时间复本复本B B稳定性与等值性系数：稳定性与等值性系数：时间间隔施测，内容变异重测信度误差时间间隔施测，内容变异重测信度误差形式：复本形式：复本AA适当时间适当时间复本复本B B 7/6/202442测验理论的基本假设3.缺点缺点:只能减少而不能完全排除练习和记忆的影响只能减少而不能完全排除练习和记忆的影响.对许多测验来说对许多测验来说,建立复本是相当困难的建立复本是相当困难的.4.4.误差来源误差来源:(1)(1)测验的两种形式是否等值测验的两种形式是否等值:测题取样是否匹配测题取样是否匹配,格式是否相同格式是否相同,内容、题数、难度、平均数、内容、题数、难度、平均数、标准差是否一致；标准差是否一致；(2)(2)被试方面情绪波动、动机变化等；被试方面情绪波动、动机变化等；(3)(3)测验情景的变化；测验情景的变化；(4)(4)偶发因素的干扰。偶发因素的干扰。7/6/202443测验理论的基本假设三、分半信度1含义和计算分半信度（分半信度（split-half reliabilitysplit-half reliability）是指将一个测验分成对等的两）是指将一个测验分成对等的两半后，所有被试在这两半上所得分数的一致性程度。半后，所有被试在这两半上所得分数的一致性程度。计计算算分分半半信信度度先先要要对对测测验验分分半半。不不同同的的分分半半法法可可能能会会得得到到不不同同的的信信度值。度值。为为了了使使两两半半基基本本等等值值，可可将将项项目目按按由由易易到到难难的的顺顺序序排排列列编编号号，然然后后按按奇奇数数和和偶偶数数序序号号将将项项目目分分半半。要要注注意意使使那那些些性性质质相相同同、联联系系紧紧密密的项目分在相同的一半，否则会使信度值偏高的项目分在相同的一半，否则会使信度值偏高7/6/202444测验理论的基本假设分半信度（Split-Half Reliability）被被试试在在两两半半测测验验上上得得分分的的相相关关系系数数只只是是半半个个测测验验的的信信度度，还还必必须须用用斯斯皮皮而而曼曼布朗公式校正布朗公式校正校正公式：斯皮尔曼校正公式：斯皮尔曼-布朗公式布朗公式r rxxxx=2 r=2 rhhhh/（1+r1+rhhhh）但只能在两半测验分数但只能在两半测验分数的变异数（的变异数（s sa a2 2 、S Sb b2 2 ）相等时才能用。相等时才能用。7/6/202445测验理论的基本假设弗朗那根公式：弗朗那根公式：r rxxxx=2 1-=2 1-（s sa a2 2 +S +Sb b2 2）/S/Sx x2 2 卢仑公式：卢仑公式：r rxxxx=1-S=1-Sd d2 2/S/Sx x2 22 2使用的前提条件使用的前提条件7/6/202446测验理论的基本假设例题：100个题目，分半信度r.70，整个测验的估计信度是多少？7/6/202447测验理论的基本假设四、同质性信度1.1.含义含义同同质质性性指指测测验验的的所所有有题题目目测测量量的的是是同同一一种种心心理理特特质质，表表现现为为各各个个题题目目得得分分之之间间有有较较高高的的相关，相关越高则同质性越强。相关，相关越高则同质性越强。同质性信度（同质性信度（homogeneity reliabilityhomogeneity reliability），），也叫内部一致性系数，是指测验内部所有题也叫内部一致性系数，是指测验内部所有题目间的一致性程度。目间的一致性程度。2计算及适用范围rxx=Krij/1+（K-1）rij7/6/202448测验理论的基本假设l KR20KR20公式公式（仅适用于（仅适用于（0 0，1 1）记分的测验）记分的测验）rxx=K/（K-1）1-（piqi）/Sx2pi为答对第为答对第i题的题的人数的比例；人数的比例；qi为为答错第答错第i题的人数的比例。题的人数的比例。K为题目数，为题目数，Sx2为测验总分的变异。为测验总分的变异。l KR21KR21公式公式（所有题目难度接近时才适用）（所有题目难度接近时才适用）rxx=K/（K-1）1-（Kpq）/Sx27/6/202449测验理论的基本假设q 克龙巴赫克龙巴赫系数系数（可处理任何内部一致性系数的计算问题）（可处理任何内部一致性系数的计算问题）=K/（K-1）1-（Si2）/Sx2q 菏伊特信度：菏伊特信度：rxx=1-MS人人题题/MS人人一般用于预测的测验或学绩测验可不考虑同质性。而验证理一般用于预测的测验或学绩测验可不考虑同质性。而验证理论构想时必须考虑同质性。因此，同质性不但与信度有关，论构想时必须考虑同质性。因此，同质性不但与信度有关，还与效度有关。还与效度有关。7/6/202450测验理论的基本假设五、评分者信度五、评分者信度1含义和计算含义和计算评评分分者者信信度度（scorerreliability）是是指指多多个个评评分分者者给给同同一一批批人人的答卷进行评分的一致性程度。的答卷进行评分的一致性程度。在在心心理理测测验验中中,评评分分者者信信度度的的计计算算,通通常常是是随随机机抽抽取取若若干干份份试试卷卷,由由至至少少两两位位受受过过训训练练的的评评分分者者按按计计分分规规则则分分别别判判分分,然然后后计计算它们的相关。几个评分者的评分越一致算它们的相关。几个评分者的评分越一致,评分者信度越高评分者信度越高2人人时时：最最简简单单的的估估计计方方法法就就是是随随机机抽抽取取若若干干份份答答卷卷，由由两两个个独独立立的的评评分分者者打打分分，再再求求每每份份答答卷卷两两个个评评判判分分数数的的相相关关系系数数。这这种种相相关关系系数数的的计计算算可可以以用用积积差差相相关关方方法法，也也可可以以采采用用斯斯皮皮尔尔曼等级相关方法。曼等级相关方法。相关系数相关系数7/6/202451测验理论的基本假设多人时：肯德尔和谐系数多人时：肯德尔和谐系数 W=12 R i2-（R i）2/N/K2（N3-N）（K=3 20；N=3 7时，查时，查W表检验）表检验）R I为第为第i个被试个被试被评的水平等级之和被评的水平等级之和若若N7，用，用2检验。检验。2=K（N-1）W，df=N-1若评分中有相同等级时，需校正：若评分中有相同等级时，需校正：W=12Ri2-（Ri）2/N/K2（N2-N）-K（n3-n）/127/6/202452测验理论的基本假设信度信度误差变异来源误差变异来源重测信度重测信度时间取样时间取样复本信度（连续施测）复本信度（连续施测）内容取样内容取样复本信度（间隔施测）复本信度（间隔施测）时间与内容取样时间与内容取样分半信度分半信度内容取样内容取样同质性信度同质性信度内容取样和内容的异质性内容取样和内容的异质性评分者信度评分者信度评分者间的差异评分者间的差异各种信度系数相应误差变异的来源各种信度系数相应误差变异的来源7/6/202454测验理论的基本假设估计信度的方法与测验复本的数目估计信度的方法与测验复本的数目以及施测次数的关系以及施测次数的关系所需要所需要施测的次数施测的次数所需要复本的数目所需要复本的数目一一二二一一分半信度分半信度同质性信度同质性信度评分者信度评分者信度复本信度复本信度（连续施测）（连续施测）二二重测信度重测信度复本信度复本信度（间隔施测）（间隔施测）7/6/202455测验理论的基本假设在一般情况下，间隔施测的副本信度最低，因在一般情况下，间隔施测的副本信度最低，因为很多因素有机会影响到分数。相反，校正过为很多因素有机会影响到分数。相反，校正过的分半相关，因为影响的因素少，所得的信度的分半相关，因为影响的因素少，所得的信度估计为最高。估计为最高。7/6/202456测验理论的基本假设假设对假设对100个六年级学生以两个月的时间间隔个六年级学生以两个月的时间间隔先后施测一个创造力测验的先后施测一个创造力测验的AB两个复本，所两个复本，所得的等值性与稳定性系数为得的等值性与稳定性系数为0.70。我们还根据。我们还根据被试对每个复本的反应计算出分半信度为被试对每个复本的反应计算出分半信度为0.80（先计算每个复本的分半相关系数。将二（先计算每个复本的分半相关系数。将二者平均后再用斯皮尔曼者平均后再用斯皮尔曼-布朗公式校正）。同时，布朗公式校正）。同时，我们让另一个评分者随机抽取我们让另一个评分者随机抽取50份卷子另外评份卷子另外评分，得到评分者信度为分，得到评分者信度为0.92。然后，我们对这。然后，我们对这三种方法所产生的误差变异进行分析。三种方法所产生的误差变异进行分析。7/6/202457测验理论的基本假设一个假想测验的误差变异来源分析一个假想测验的误差变异来源分析信度类型信度类型误差变异量误差变异量误差变异来源误差变异来源复本信度（间隔施测复本信度（间隔施测)1-0.70=0.30时间与内容取样时间与内容取样分半信度分半信度1-0.80=0.20内容取样内容取样上述二者差异上述二者差异0.30-.20=0.10 时间取样时间取样评分者信度评分者信度1-0.92=0.08评分者差异评分者差异误差变异总和误差变异总和0.20+0.10+0.08=0.38真实变异真实变异1-0.38=0.627/6/202458测验理论的基本假设一个假想测验的误差变异来源分析一个假想测验的误差变异来源分析真实变异真实变异误差变异误差变异时间上的稳定性，复时间上的稳定性，复本之间的一致性，评本之间的一致性，评分者之间的一致性分者之间的一致性内容取内容取样误差样误差时间取时间取样误差样误差评分者评分者间差异间差异62%20%10%8%7/6/202459测验理论的基本假设第三节第三节提高测量信度的方法提高测量信度的方法7/6/202460测验理论的基本假设一、影响测量信度的主要因素一、影响测量信度的主要因素（2007心理学统考真题：）心理学统考真题：）（一）被试方面1、单个被试：身心健康情况、应试动机、注意力、耐心、求胜心、作答态度等会影响测量误差，它们会影响被试心理特质水平的稳定性。2、被试团体：（1）被试团体同质性越高（个体差异越小），所得相关系数（信度）就越低。（2）被试团体异质性越高（个体差异越大），所得相关系数（信度）就越高。7/6/202461测验理论的基本假设不能认为当该测验在一个团体中有较高的信度不能认为当该测验在一个团体中有较高的信度时，在另一个团体也具有较高的信度。时，在另一个团体也具有较高的信度。当将测验用于异质性团体时，用下面的公式推当将测验用于异质性团体时，用下面的公式推算出新的信度系数。算出新的信度系数。rnn=1-So2(1-roo)/Sn2 r roooo为为用于原团体的信度用于原团体的信度，r rnnnn为用于异质程度不同的为用于异质程度不同的团体的信度团体的信度，S Sn n为异质程度不同的团体的分数分布的标为异质程度不同的团体的分数分布的标准差，准差，S So o为原团体的的分数分布的标准差为原团体的的分数分布的标准差某测验的被试为某测验的被试为2525年级的小学生，已知信度年级的小学生，已知信度是是0.850.85，标准差为，标准差为1010，现欲知道仅用于，现欲知道仅用于4 4年级年级时信度是多少，时信度是多少，4 4年级的标准差是年级的标准差是5 5。（。（0.40.4）7/6/202462测验理论的基本假设（二）主试方面（二）主试方面施测者施测者:指导语、态度、期望等指导语、态度、期望等评分者：评分标准评分者：评分标准（三）施测情境（三）施测情境考场是否安静，光线和通风，设备，桌面，空间等考场是否安静，光线和通风，设备，桌面，空间等（四）测量工具（四）测量工具测测验验内内容容：试试题题取取样样不不当当，内内部部一一致致性性低低，题题意意模模糊糊，信信度度则低。如：押题则低。如：押题7/6/202463测验理论的基本假设测验长度：测验越长，信度越高。测验长度：测验越长，信度越高。rkk=Krxx/1+(K-1)rxx K为改变后的测验长度与原来长度之比，为改变后的测验长度与原来长度之比，rxx为原测验的信度，为原测验的信度，rkk为测验长度增加为为测验长度增加为k倍后测验的信度。倍后测验的信度。测验难度：过难或过易都会使个体间得分差测验难度：过难或过易都会使个体间得分差异减小，降低信度。异减小，降低信度。（五）两次施测的间隔时间（五）两次施测的间隔时间间隔时间越短，信度越高；间隔时间越长，信度越低。7/6/202464测验理论的基本假设二、提高测量信度的常用方法二、提高测量信度的常用方法（一）适当增加测验的长度（一）适当增加测验的长度1.新增项目必须与试卷中的原有项目同质。新增项目必须与试卷中的原有项目同质。2.新增项目的数量必须适度。新增项目的数量必须适度。（二二）使使测测验验中中所所有有试试题题的的难难度度接接近近正正态态分分布布，并并控控制制在在中中等水平等水平（三）努力提高测验试题的区分度（三）努力提高测验试题的区分度（四四）选选取取恰恰当当的的被被试试团团体体，提提高高测测验验在在各各同同质质性性较较强强的的亚亚团体上的信度团体上的信度（五五）主主试试者者严严格格执执行行施施测测规规程程，评评分分者者严严格格按按照照标标准准给给分分，施测场地按测验手册的要求进行布置，减少无关因素的干扰施测场地按测验手册的要求进行布置，减少无关因素的干扰7/6/202465测验理论的基本假设三、信度的特殊问题三、信度的特殊问题1速度测验的信度问题速度测验的信度问题因因为为速速度度测测验验的的题题目目难难度度都都很很低低，所所以以不不能能用用奇奇偶偶分分半半求求分分半信度；可以将测验分两半来施测。半信度；可以将测验分两半来施测。因为几乎不可能把题目做完，所以同质性信度不适用。因为几乎不可能把题目做完，所以同质性信度不适用。可以用重测信度和复本信度。可以用重测信度和复本信度。2标准参照测验的信度问题标准参照测验的信度问题总体越同质，相关系数越低。总体越同质，相关系数越低。用复本，通过人数的百分比差别越小，信度越高。用复本，通过人数的百分比差别越小，信度越高。7/6/202466测验理论的基本假设3分测验的信度分测验的信度除除整整个个测测验验的的信信度度外外，各各个个分分测测验验也也应应有有信信度度，否否则则，从从分测验得分来做推论就会出问题。分测验得分来做推论就会出问题。4差异的信度差异的信度比比较较两两门门课课成成绩绩的的差差异异，若若两两门门课课的的信信度度都都不不可可靠靠时时，二二者的差别更不可靠。者的差别更不可靠。5行为改变（变迁）的测量行为改变（变迁）的测量7/6/202467测验理论的基本假设四、信度好坏的判断标准四、信度好坏的判断标准标准化能力或学绩测验：标准化能力或学绩测验：0.90人格测验：人格测验：0.80教师自编学绩测验：教师自编学绩测验：0.60五、测验使用时的信度标准五、测验使用时的信度标准一一般般来来说说，当当信信度度0.70，测测验验不不能能用用于于对对个个人人作作出出评评价价与预测，而且不能作团体间比较；与预测，而且不能作团体间比较；当当0.70信度信度0.85时，可用于团体比较；时，可用于团体比较；当信度当信度0.85时，才能用来鉴别或预测个人成绩。时，才能用来鉴别或预测个人成绩。7/6/202468测验理论的基本假设

展开阅读全文

测验理论的基本假设培训课件

最新文档