体育测量与评价-第二章-体育测量与评价的基础理论-课件

上传人:风*** 文档编号:241989654 上传时间:2024-08-09 格式:PPT 页数:121 大小:825.86KB
返回 下载 相关 举报
体育测量与评价-第二章-体育测量与评价的基础理论-课件_第1页
第1页 / 共121页
体育测量与评价-第二章-体育测量与评价的基础理论-课件_第2页
第2页 / 共121页
体育测量与评价-第二章-体育测量与评价的基础理论-课件_第3页
第3页 / 共121页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,第二章 体育测量与评价的基础理论,第二章 体育测量与评价的基础理论,1,第一节 体育测量的基础理论,体育测量是体育教学、运动训练和体育科研的重要基础。只有实施科学的测量,才能获得准确而可靠的数据,并通过分析和研究,得出科学的结论。,为了收集准确的资料,获得可靠的信息,达到测量的目的,必须在体育测量的理论指导下实施测量。,第一节 体育测量的基础理论 体育测量是,2,一、体育测量的基本概念(一)测量,测量(史蒂文斯):,是,根据法则给事物赋予数量。即用一定的法则给事物属性指派数字或符号的过程。,体育测量:,是指依照一定的法则,对体育领域中事物的属性或特征赋予数量的过程。包括物理量测量和非物理量测量。(内容和形式多样),A:物理量测量:,身高、体重、跳高高度、跳远远度、血压等;,B:非物理量测量:,有氧工作能力、技战术水平、疲劳程度、心理素质、身体素质等。,测验:,为了某种测量目的所进行的一系列测量构成的系统。,一、体育测量的基本概念(一)测量测量(史蒂文斯):是根据法,3,(二)测量的要素,测量的要素:,待测属性或特征、法则和数字符号。,A.待测属性或特征:,由于测量的目的就是反映事物的属性或特征,它是测量的第一要素。举例:100米、立定跳远、灵敏性、心理素质、技战术水平、意志品质等。,B.法则:,能有效衡量事物属性的规则和尺度,或是能显示事物属性的程序。,举例:身高的测量、心理素质的测量,(二)测量的要素,4,心理素质的测量(包含认识能力、情绪和情感品质、意志品质、气质和性格等。如测量智力量表:比奈西蒙智力量表,韦克斯勒成人智力量表,瑞文智力量表等)。,C.数字符号:,数字的含义与测量内容相关。,心理素质的测量(包含认识能力、情绪和情感品质、意志品质、气质,5,(三)测量量表,测量量表:,是指测量所获得数据属性的表述规则(反映表示测量结果的数字符号的性质和类型)。这种规则由实数列的诸特性所决定的,这些特性包括:,A.顺序:,两个或两个以上的实数有次序之分、大小之分;,B.距离:,两个实数之间的差距可以描述;,C.原点:,对应于零位数的那一点(绝对零点和相对零点)。,(三)测量量表,6,测量量表的分类,1、名称量表,不含实数列的任一特性,即无顺序、无距离、无原点。是各种测量尺度中含信息量最少、最低级的一种测量尺度,。(如运动员的号码),2、有序量表,有序量表含有实数列的顺序特性,但无距离、无原点。其信息量比名称量表要丰富,属于低等级的测量尺度。,(比赛名次),测量量表的分类,7,3、等距量表,等距量表含有实数列的顺序、距离特性,但无原点。等距量表又较有序量表含信息量多,属高等级的测量尺度。(,角度、高度,),4、比例量表,比例量表具有实数列顺序、距离、原点的全部特性。其含信息量最多,属于最高级量表。(,运动水平、进步率、进步度,),3、等距量表,8,四种测量尺度的特征、功能和适用的统计分析方法表:,特点,基本功能,数字特征,适用的统计方法,名称量表,分类、标记,百分比,卡方检验,列联相关系数,有序量表,顺序,可按照次序排列,中位数,百分位数,等级相关,非参数检验,等距量表,距离,差距的确定与比较,算术平均数,标准差,积差相关,参数检验,比例量表,原点,比值的确定与比较,几何均数,四种测量尺度的特征、功能和适用的统计分析方法表:特点基本功能,9,(五)测量的类型:不同的分类标准,A.按测量方法分类:直接测量和间接测量。,B.按测量属性分类:物理量测量和非物理量测量。,C.按测量的组织形式分类:连续性测量和横断面测量。,(六)体育测验的类型,1、按测试者人数分类,(1)单个测试者的测验:以一个测试者的测量值作为受试者的测验值。如身高、体重等测验。,(2)多个测试者的测验:多个测试者同时对某个受试者进行测量,以多个测试者测量结果的综合值作为受试者的测验值。,(五)测量的类型:不同的分类标准,10,2、按重复测量次数分类,在体育测量中,测量次数的确定和测量结果取值方式有以下几种情况:,(1)测一次,受试者需要承受极限生理负荷完成的测验。如,一般耐力测验,,一般只测一次。,对于瞬时性、损伤性和操作难度大的测验,,如运动后即刻脉搏、血压、血乳酸、肌肉活检及其它生理生化指标的测验。一般只测一次。,对于测量误差很小,可靠性较高的测验,,如形态测量中的身高、体重等,一般只测一次。,2、按重复测量次数分类在体育测量中,测量次数的确定和测量结果,11,(2)可以测2-3次或多次。,持续时间短的大强度非极限负荷的最大能力测验,如立定跳远、投掷和灵敏性等测验。,(3)重复次数较多的测验,对于负荷小,但测量结果波动大,敏感和易受干扰的测量验,如反应时或感知觉测验,为减少随机误差,重复测量的最佳次数为30次。观测值可取测验的平均值或总和,如果除去测验中的最高和最低的成绩,取其余测验成绩的平均值作为观测值则更好。,(2)可以测2-3次或多次。,12,(七)测量误差,定义:,是指与测量目的无关的变因产生效应,所引起的观测值与真值之间的差异。,误差的分类:,1.随机误差,2.系统误差,3.过失误差,4.抽样误差,(七)测量误差定义:是指与测量目的无关的变因产生效应,所引起,13,1 随机误差,随机误差又称为,偶然误差,,指在测量中由一些主观或客观,偶然因素,引起,又不易控制的测量误差。,随机误差随着测量次数的增加,其变化会呈现一定规律性。它总是围绕被测量的真值波动,(,真值以重复测试的均值为代表)。,推论:除标准化测试外,,增加测量次数也是减少随机误差的有效办法。,1 随机误差随机误差又称为偶然误差,指在测量中由一些主观或,14,2 系统误差,系统误差,是指在测量中,由于,仪器未校正,至测试要求,或对测量条件掌握过宽或过严,而使测量结果出现规律性的偏大或偏小。后果:使数据统计结果偏离方向。,消除办法:严格执行标准化测量,随时检查,及时发现并纠正错误。,另外,通过增加测量次数,也可以将由于测量方法掌握过宽或过严而产生的系统误差转化为随机误差,使其降低到最低程度。,2 系统误差系统误差,是指在测量中,由于仪器未校正至测试要求,15,3 过失误差,过失误差,指在测量中由于,测试者过失,所造成的误差,如测错、读错、记错。,这类误差只要认真负责,,加强测试者的责任心,并加强测试现场的监督检查,,严格管理并执行验收制度。,在最后资料整理过程中再进一步检查、鉴别、舍弃,就会避免或减少由于过失误差而得出错误统计结论。,3 过失误差过失误差,指在测量中由于测试者过失所造成的误差,,16,4 抽样误差,抽样误差是由于,抽样的原因,而引起样本统计量与总体参数之间的差异。,测量中虽严格遵守抽样原则,但不论用何种方法抽样,从总体中抽取样本进行研究,样本统计量与总体参数都不会完全一致,这是因为个体之间差异是客观存在的,,即使采取随机抽样仍然无法避免样本统计量与总体参数之间的差异。,4 抽样误差抽样误差是由于抽样的原因而引起样本统计量与总体参,17,经典测量理论的基本假设:,真值的含义:,“实测值”(简称X):测量对象的某种测量内容(或特征)经测量后表现为一个数值。也称“观测值”、“观测数”、“测量所得的值”、“实测分数”、“观察分数”、“原始观测数”等。,“真值”,也称“真分数”(简称T):反映测量对象(或受试者)某种特征的真正水平(或能力)的那个数据。,T和X的关系怎样?,经典测量理论的基本假设:,18,测量误差可以使用下式表示:,EXT,(21),式中:,E表示误差;X表示测量结果;T表示真值。,所有的被测事物或现象在特定的条件下,理论上都有一个对应的客观、实际值存在,我们称之为,“理论真值,”。它只是个理想的概念,这在误差理论研究中非常重要。为了进一步理解体育测量的误差,可人为地把体育测量过程分为三个子过程。,测量误差可以使用下式表示:,19,1.测量过程的分解,测量的目的在于了解被测事物或现象的真值。根据测量真值的近似可知性和体育测量的推测过程的基本特点,可把测量过程分解位以下过程:,式中:,X指标测量值;T1现象真值;T2指标真值;T待测真值,。,(1),第I过程,:由测量值推测现象真值的过程。,(2),第II过程,:由现象真值推测指标真值的测量过程。,(3),第III过程,:由指标真值推测属性的过程。,1.测量过程的分解 测量的目的在于了解被测事物或现象,20,2.测量误差的分解,公式(21)给出了总测量误差,即由测量值推测真值存在的误差。依据测量过程的分解,可以将总误差分解为,测试者误差、受试者误差和指标误差,三部分。,误差的来源,1.测试者,2.受试者,3.指标误差,2.测量误差的分解 公式(21)给出了总测量误差,21,测试者误差,在第I过程中,现象真值(T)是确定的,而测量值(X)与之有差异,很明显,误差来源是测试者。第I过程中的测量误差称为测试者的误差。,误差来源于测试者,(包括测试者测量方法的正确,对测量的重视程度,测量条件等。),这类误差称为测试者误差。,测试者误差在第I过程中,现象真值(T)是确定的,而测量值(X,22,受试者误差:,在第II过程中,相对于T,1,来说,T,2,是确定的。该过程的误差表现为现象真值与指标真值之间的差异。,造成这种误差的原因有受试者本身、测量方法以及测试条件等多方面,但该误差最终是通过受试者表现出来的,所以该过程的误差称为,受试者误差,。,受试者误差:在第II过程中,相对于T1来说,T2是确定的。该,23,指标误差:,第III过程是通过指标真值去推测属性的过程,其误差大小主要决定于指标能否真实地反映测试属性。,如果测量指标中含有非待测属性的因素较多,那么该过程的测量误差较大。所以,这一过程的误差主要来源于测量指标,又被称为指标误差。,指标误差:第III过程是通过指标真值去推测属性的过程,其误差,24,以上所述为一般性的测量过程和测量误差的分解,,在实际应用中,具体到某一次测验,可能没有三个过程,测量误差也可能不需要考虑三部分,。,例如,,,标枪我们一般不考虑测试者误差,而主要考虑受试者误差,;而体操、武术等主管评分项目的比赛中,人们往往关心的是测试者的误差。,以上所述为一般性的测量过程和测量误差的分解,在实际应用中,具,25,产生误差的原因:主观原因是造成误差的主要原因,受试者的具体情况:生理、心理状态和配合程度;,测试人员状态:熟练程度、知识水平、责任心;,测量方法:测量方法自身所产生的误差;,测试环境:温度、海拔、天气等;,测试工具和仪器精度或不正确使用;,抽样误差中样本含量、抽样方法、样本量的代表性。,产生误差的原因:主观原因是造成误差的主要原因 受试者的具体情,26,数学模型及其假设,经典测量理论假定,实测值(X)与真值(T)之间是一种线性关系,并只相差一个随机误差(E):,X=T+E,1.测试者误差客观性,2.受试者误差可靠性,3.指标误差 有效性,数学模型及其假设,27,二、体育测量的客观性,一、客观性概述,测量的客观性(又称评价的可靠性):是指同一测试者或两个以上(含两个)的测试者对同一受试者测量结果的一致性程度。,客观性,是间接衡量,第I过程中测量误差,(测试者误差)大小的一种量度。,所谓,间接衡量,是,指不同测试者对同一受试对象同时测量,通过测量结果的一致程度来衡量测试者误差大小。,二、体育测量的客观性 一、客观性概述,28,直观上看,如果测试者误差小,那么由不同的测试者对同一受试者实施测量时,会得出极为接近的测量结果,即所有测量值应具有较高的一致性;反之,如果不同测试者测量结果的一致程度低,则说明测试者的测量误差大。如果某一项测验的测试者误差小,则该测验的客观性高;反之,测验的客观性低。,体育中主要用于主观评分类的运动项目。,例如体操或武术等测试中,数个裁判员对同一运动员进行评分,若他们所评的分数很接近,说明评分的客观性较高,反之则低。,直观上看,如果测试者误差小,那么由不同的测试,29,测验的客观性定义,设从测验总体中随机抽取一名测试者(或若干名测试者)和一个受试对象,测验值为X,根据误差理论和测量过程的分解,测验的第I过程误差模型为:,XT,1,e,1,(23),式中,,T,1,受试对象表现的现象值;e,1,测试者造成的误差;e,1,和T,1,相互独立。,从而:,测验的客观性定义 设从测验总体中随机抽取一名测试者,30,(24),可见,客观系数是一个相对数,反映测试者的测量误差相对于个体差异的大小,若测量误差相对较大,则客观系数较小,反之亦反。,客观性系数介于0和1之间,。公式(25)定义的客观性系数是测验关于全体测试者和受试对象的客观性系数,即关于测验总体的客观性系数,称之为,测验的总体客观性,,也称,测验的客观性,,一般总是未知的,实际应用中需要通过样本进行检验。,31,测验的总体,在体育测量中,测验本身对测试者和测试对象都有一定的要求,我们称,满足测验要求的所有测试者和测试对象构成的全体称为,测验的总体,,记为(A、B),,其中A代表测试者,B代表测试对象。明确了测验的总体,也就明确了测验的适用范围。,测验的总体 在体育测量中,测验本身对测试者和测试对,32,二、客观性的分类,1、,多人测量客观性,:两名或两名以上的测试者对同一受试者测量结果的一致性程度。,原因,:对测量尺度掌握不一样。,提高方法,:提高测试者测试水平、规定测试细则及严格控制测试条件等方法。,二、客观性的分类1、多人测量客观性:两名或两名以上的测试者对,33,2、一人测量客观性,同一测试者对同样事物多次重复测量结果的一致性程度。,对同一项包含主观因素较多的测量来说,难以在每次测量时,都保证尺度一致,。如对同一人的技术录像多次评分时,另外,同一人对不同受试者实施同样测量时,也存在客观问题,。,2、一人测量客观性,34,三、客观性的检验方法,单个测试者的测验,抽取若干名测试者对同一受试者进行测量,以便对测试者的误差做出估计。常用检验方法有两种:,(1)一致性系数(W系数)法:测量值为受试者的成绩等级(名次)。,W=12S/m,2,(n,3,-n),W:为客观性系数;m:为测试者人数;n:为受试者人数;S:为受试者名次之和的离均差平方和。,(2)方差分析法,R=1-MS,内,/MS,总,三、客观性的检验方法 单个测试者的测验,35,多个测试者的测验(主观评分项目比赛),(1)裂半相关法,(2)方差分析法,R=1-MS,内,/MS,间,客观性常用于一些主观评分类项目,如体操、跳水、花样滑冰等体育比赛中。,多个测试者的测验(主观评分项目比赛),36,四、影响客观性的因素,1、测试者水平,2、测试者的人数级,3、测试尺度:应尽可能明确规定测试细节并且将其具体化,尽量减少测量中的主观因素,实施标准化测量以提高测量的客观性。,4、测验的规范性、标准化程度,5、测量的指标特征:在条件允许的情况下,应尽量选择可以定量测量的指标。,四、影响客观性的因素 1、测试者水平,37,三、体育测量的可靠性,(一)可靠性概述,测量的可靠性(信度)在相同测量条件下,对同一批受试者使用相同测量手段,重复测量结果的一致性程度。(狭义的操作定义)。一般定义:测验结果的一贯性、一致性、再现性、稳定性。,间接衡量第,过程中测量误差(受试者误差)大小的一种量度。,三、体育测量的可靠性(一)可靠性概述,38,测量中常用R表示可靠性系数。,例:某同学的身高为178cm(真实值-以重复测量的均值为代表),第一次测量所得身高为177cm,第二次测量所得身高为179cm,测量值与真实值中间的差值即为误差值。X=T+E;其中(X实测值;T测量的真值;E测量误差值),可靠性系数的范围(0,1)越接近1则可靠性越高,有些可靠性高的测量,如身高、体重等,这类指标只要保持与原测量条件一致,多次重复测量结果一致性程度较高。,测量中常用R表示可靠性系数。,39,然而,有些指标,如,VO,2max,,即使进行最严格的标准化和规范化测量,使用最精密的量具和仪器,由最有经验的测试人员进行测试,其测量结果还会存在定的误差。,这种误差的大小,在很大程度上决定了测量的可靠性。,从“,最严格的标准化和规范化测量,使用最精密的量具和仪器,由最有经验的测试人员进行测试,其测量结果还会存在定的误差。”,可以判断出:与测试人员无关,如果存在误差,那么就应当是受试者自身造成的。,因此,可靠性就是衡量第II过程的测量误差(受试者误差)大小的一个客观性指标,有严格的统计学定义。,然而,有些指标,如VO2max,即使进行最严格的标准化和规范,40,根据可靠性数学理论,对一名受试者进行任何一次测量的结果(实测值),都是两个量的和,即,被测量的真值,与,由于不能被控制的受试者状态变化和随机误差而引起的误差之,和,,这就是可靠性的理论依据,可用下面公式表示:,x,i,(x),x,(T),x,(e),式中,x,i,为某次测量的实测值;x,为被测量的真值;x,为由不能被控制的受试者状态变化和随机误差而引起的误差,。,根据可靠性数学理论,对一名受试者进行任何,41,可靠性高低,是用,可靠性系数(或称信度系数),进行描述的。,可靠件系数(,ii,),即真值方差与实测值方差之比。可靠性系数可用下面公式表示:,从上式可以看出,假如没有测量误差,即 0,则可靠性系数,ii,就等于1。随着测量误差的增大,可靠性系数值也就越小。,因此,可以认为,测量的可靠性在很大程度上取决于测量误差的大小。,测量误差越小,可靠性越高。,可靠性高低,是用可靠性系数(或称信度系数)进行描,42,(二)体育测验的可靠性检验,1、频数等于1的测验,(1)两次重复测验,(2)多次重复测验:方差分析法,R=1-MS,内,/MS,总,2、频数大于1的测验:方差分析法,R=1-MS,内,/MS,间,(二)体育测验的可靠性检验1、频数等于1的测验,43,(三)可靠性的分类,测量的可靠性,人们习惯于将它分为3类:,即,一致可靠性,稳定可靠性,等价可靠性。,(三)可靠性的分类 测量的可靠性,人们习,44,1、一致性可靠性,一致可靠性,指同一天内,测试者对同一批受试者重复测量结果的一致程度。,受试者人数较少时,,在相同条件下进行重复测量。用测量再测量结果的相关系数估价其内部一致性程度。,大群体测量时,,采用按人数比例随机抽样的方法,实施重复测量检验其可靠性。,1、一致性可靠性一致可靠性指同一天内,测试者对同一批受试者重,45,2、稳定可靠性,稳定可靠性,指两天或数天内,测试者对同一批受试者重复测量结果的一致程度。,如果被测事物属性相对稳定,,即使间隔一定时间再测,结果应当也一致的;若测量结果差异很大,说明这些指标信度不高,不可靠。,在估价测量的稳定可靠性时,应注意根据不同测量指标,确定适宜的不同测量间隔时间,以避免因过长或过短的测量间隔时间而高估或低估测量稳定可靠性。,如运动即刻的血乳酸值和几天之后的值。,2、稳定可靠性稳定可靠性指两天或数天内,测试者对同一批受试者,46,3、等价可靠性,等价可靠性,指在不同的测量时间,对受试者实施难度相同,而方式或题目不同的同质测量结果的一致程度。,等价可靠性常用于对受试者的理论知识测验。,另外在教学训练中也常用于检查学员技术掌握程度,或进行性格、智力等心理方面的测量。,3、等价可靠性等价可靠性指在不同的测量时间,对受试者实施难度,47,(四)影响可靠性的因素,影响可靠性的因素主要来自测量的随机误差和抽样误差。,1、测量误差,影响可靠性的因素较多,但测量误差是影响可靠性的直接因素。测量误差越大则可靠性越低;反之,则可靠性越高。,测试者;受试者;测试仪器;测试方法;测试环境;抽样误差:抽样方法、样本量、样本代表性。,(四)影响可靠性的因素,48,2、受试者个体差异和受试群体的能力水平,同一种测量手段,用于个体差异不同的群体时,个体差异较大的群体,估价出的信度系数较高,个体差异较小的群体信度系数较低。,在某种能力水平上信度高的测验,对于其它能力水平的群体信度未必就高。,例如:适应能力问卷在本科文化程度人群中使用重测信度可以,但用于小学文化程度的人群信度未必够。,2、受试者个体差异和受试群体的能力水平,49,3、重复测量的间隔时间,重测信度、复本信度中,重复测量间隔时间越长,估价出的信度系数越低,4、测量的长度,(组数、次数),重测信度、复本信度中重复测量的次数,评分者信度中的评分者人数,内部一致性信度中的题目数统称为测验的长度,长度越长信度越高,但长度增加的同时测量工作量增加,其它影响影响测量结果的因素也增加。,5、测量指标的类型,稳定性高、不易变化的指标重测信度高;定性评分项目中,受主观因素影响小的指标评分者信度高;,3、重复测量的间隔时间,50,6、测试细则,测试细则详细准确的测量重测信度高;评分规则详细准确的评分者信度高,7、估价可靠性时使用的方法,如果同时可以使用几种方法估价信度系数,可能计算结果会稍有不同。,8、测试人员的人数、水平、责任心等对评分者信度影响较大,6、测试细则,51,可靠性程度的一般判断标准:,可靠性程度的一般判断标准:,52,(五)提高可靠性的方法,严格实施标准化的测量程序。包括测量仪器设备的标准化,测量方法的标准化,测量实施的标准化。这样可以减少随机误差和系统误差。,适当增加测量的长度。在运动技术测量当中,增加测量或测验的次数,在体育社会、教育心理测量中,适当增加题目的数量。,适当地增加平行测验项目,可以增加对信度的检验,获得更丰富的信息。,适当增加样本含量,并提高抽样的科学性(使样本具有代表性),这样可以减少抽样误差。,(五)提高可靠性的方法 严格实施标准化的测量程序。包括测,53,测验的难度要适中,使受试者表现出应有的成绩差异。,在选取受试者群体时,要兼顾他们的水平差异(最好接近正态)。,提高测试人员的责任心、业务素质和测量技巧,以减少过失误差、系统误差和随机误差。,在有些测量中,要对受试者进行必要的宣传鼓动,诱发其正确的动机和兴趣,使之事先对测量方法、要求有所了解,更好地配合测试。尤其在机能测验和运动能力测验中,以及在量表测试过程中,正确的动机、认真的态度、全力以赴的作风将直接关系到测量结果的准确与可靠。,测验的难度要适中,使受试者表现出应有的成绩差异。,54,重复测量时要考虑间隔时间的长短,以及要保证两次测验的独立性(完整性)。,要注意测量时间和环境的选择。如不要在大型赛事(如校运会)和重大节日(如国庆节)前后安排测试;测试要求适当充裕的时间;要注意考试环境的选择和控制(如噪音太大、考场纪律混乱等)。,除了对可靠性进行定量的检验外,还可以通过其它途径对信度检验进行补充和修正,例如:受试者的平时表现、出勤、作业、回答问题等是否与测试结果有特别大的出入等等。,重复测量时要考虑间隔时间的长短,以及要保证两次测验的独立性,55,四、体育测量的有效性,(一)有效性概述,测量的有效性(又称效度):,是指所选择的测量手段在测量欲测量属性时的准确性程度,即为所测量的属性与欲测属性之间的一致性程度。,欲测属性:常是一个模糊不可直接测量而得到的。,四、体育测量的有效性(一)有效性概述,56,有效性的两层含义:,1、测量结果与测量目的的一致性(测量是否能测出原打算要量的属性),2、测量的准确度(测量结果的可靠性)现在测量与原打算测量之间的相关性和可靠性;,效度系数 r,-1r1,如30m绕杆跑,多次重复测量成绩非常接近,作为一项灵敏性测量指标,可靠性高,有效性亦高,但如果作为速度指标,虽可靠性高,但有效性不及30m跑。,有效性的两层含义:,57,有效性与可靠性的关系,可靠性是有效性的必要条件,即要想有效性高,可靠性必需高;有效性是可靠性的充分条件,即有效性高,可靠性一定高。同一测验的信度系数高于其效度系数。,有效性与可靠性的关系,58,(二)有效性的分类,1、内容有效性,所选择的测量内容反映总体属性的准确程度。常用于理论知识的测验。,考察内容效度的前提是:要有定义较完整的总体属性的内容范围。,确定内容效度的方法:,A.专家调查:一定数量专家逻辑分析的结果,也称逻辑效度。,B.统计分析相关计算:一项测验与公认有较好内容效度的测验的相关越高,说明内容效度越好。如高中毕业前的摸底测验,其内容效度可与高考成绩比较。,(二)有效性的分类 1、内容有效性,59,内容有效性,,是指测验项目和指标的内容能有效地代表总体属性的准确程度,即测验的内容与拟测属性的一致性程度,。,用,有限的几个测量中代表总体内容是比较困难,的,特别是一些心理测量,有时很难判断其内容是否能反映总体属性。,韦克斯勒成人智力量表中国修订本(WAIS-RC),内容有效性,是指测验项目和指标的内容能有效地代表总体属性的准,60,2、结构有效性,一组测量所包含的各种属性与总体属性的各种拟测成分在结构上的一致性程度。即可以实际操作的测验与理论上的构想的符合程度。常用于心理与运动能力的成套测验。,确定构想效度的方法,A 因素分析:探索性和实证性因素分析,B 相关计算:与已有的构想效度较好的测验的相关,C 聚合效度和区分效度,2、结构有效性,61,结构有效性,指一组测量所包含的各种属性与总体属性各种拟测成分在结构上的一致性程度。如篮球运动技能由投篮、传球、运球组成。,结构有效性的拟测属性是一种综合的、整体的属性,而实际测量出来的只是构成总体属性的各个成分或特征。,结构有效性,指一组测量所包含的各种属性与总体属性各种拟测成分,62,结构有效性与内容有效性有时很容易混淆,,它们在要求达到测量目的的这一点上是相同的,,但在使用时有区别。,结构有效性常用于心理测量与运动能力成套测验,特别是编制运动技术测验时经常使用,而,内容有效性则常常用于理论知识测验,(如文化考试)。,结构有效性与内容有效性有时很容易混淆,它们在要求达到测量目的,63,3、效标有效性(criterion related validity)。,所选择的测量与效标之间的关联一致性程度。,效标:即检验效度的标准,是指已被证明具有高有效性,可以作为参照标准的指标。效标有定量和定性两类。,3、效标有效性(criterion related vali,64,体育测量中常用的效标:,A、可定量测量的专项成绩:如100米、跳远的成绩;,B、比赛的名次或运动等级;,C、具有数量特征的量:100米跑的步频和步幅,跳远的助跑速度;,D、合成效标:如体质评价总分、成套测验总分。,E、标准的实验室结果:如水下称重法测得的身体成分、用气体分析仪和电动跑台测得的最大吸氧量。,体育测量中常用的效标:,65,效标有效性指,所选择的测量与效标之间的关联一致性程度,。,效标:指已被检验证明能够作为参考标准,并被证明是一项有效性高的测量。如果两者之间的相关程度高,说明所选择的测量的效标有效性高。,效标有效性指所选择的测量与效标之间的关联一致性程度。,66,许多测量指标在使用之前不知其是否有效,或从逻辑分析推断其有效,却不知道其有效性高低,此时就要选择适宜效标,经测量后计算与效标之间的相关程度如何,如果相关程度高,说明效标有效性高,反之则低。,往往用一些指标价格昂贵,条件限制挺大,尽量寻找一些经济、适用、可行的指标来代替,选来作为大面积群体测量适用。这就需要先验证该指标的效标有效性。,许多测量指标在使用之前不知其是否有效,或从逻辑分析推断其有效,67,(三)有效性的检验,1、逻辑分析法:-专家调查法,逻辑分析法对估价内容有效性和结构有效性是最为适宜的。,2、相关法常用于效标有效性的计算:,等级相关法、积差相关法,(三)有效性的检验,68,(四)影响有效性的因素,1、受试群体特征:年龄、性别、能力的个体差异等;,2、样本含量及其代表性:扩大样本含量,测量的可靠性提高,有效性也随之提高。应坚持随机抽样原则,以提高样本的代表性;,3、测量的可靠性:可靠性是有效性的必要前提,即有效性的测量必须是可靠的,所以要想提高测量的有效性,首先要保证测量的可靠性。,(四)影响有效性的因素1、受试群体特征:年龄、性别、能力的个,69,4、效标的选择:对于同一项测量手段,选择不同的效标,计算出来的效标有效性就不相同:例某一测试所选择的效标缺乏有效性和可靠性,这样所选择的这种测试方法就不能很好的评价实测项目的指标。,5、测量的难度与区分度:测量难度适中时,区分度最高,有效性也会提高。例:某种测验能把不同能力水平的受试者区分出来,那么这种测验的有效性就高;反之则有效性就低。,4、效标的选择:对于同一项测量手段,选择不同的效标,计算出来,70,六、体育测验的编制与实施,(一)、体育测验编制的基本原则,1.科学性原则,科学性原则是指所编制的测验或所选择的测验手段必须符合测量的有效性、可靠性和客观性。,2.可比性原则,可比性原则是要求编制者按测量与评价的理论和测量的有关规定来编制规范化的测验。,尽量采用已有的、国际或国内通用的标准化测量。,六、体育测验的编制与实施(一)、体育测验编制的基本原则,71,3.适用性原则,测验的编制必须符合受试对象的实际情况,全面地考虑受试者的年龄、性别、形态、机能和运动能力、普通人或运动员等方面的特点。还要考虑客观条件和实际情况,如当地的地理环境、文化传统、教育水平、经济状况、场地设备以及测试者的具体情况。,一般来说,难度适中的测验具有较大的鉴别性。,4、相关、独立性原则,条件:编制成套测试。,相关性:各个测验与总体属性的相关关系;,独立性:各个测验指标应具有的单一属性和独立性,。,3.适用性原则,72,(二)体育测验编制的基本程序,1、确定测验目的和拟测属性,编制测验,,首先要考虑的是测验的目的,亦即测验编制者要解决什么问题。,它是整个编制的核心,必须首先确立。它将,决定测验对象和测验指标的选择、组织工作安排、仪器和经费等一系列问题。,目的一般不宜定得过多,以解决一两个具体问题为宜。,(二)体育测验编制的基本程序 1、确定测验目的和拟测属性,73,2、选择有效的测验手段,A、分析拟测属性及其结构成分,测验目的确定后,则要,分析拟测属性的概念、内容、结构、内在联系和外部特征等,,然后用定性和定量的方法去选择相应的测验指标。,B、选择有效的测验手段:定性分析;定量分析,定性分析,选择测量指标,是基于理论和经验,运用逻辑判断、分析、比较的方法选择测验指标。,定量分析,选择测量指标,是在定性分析的基础上,运用数理统计的方法和手段,对待定的测验指标做定量分析后进行选择的。常用的数理统计方法有回归分析、聚类分析、主成分分析等。,2、选择有效的测验手段定性分析选择测量指标,是基于理论和经验,74,3、预备测验,为使所确立的测验更能体现科学性及符合测量的实际情况,我们可以在小范围内或抽取小样本对测验进行试验。这种试验的目的是:,A、检验测验的有效性、可靠性和客观性,并确立其系数;,B、检查所编制或选择测验的可行性和实用性;,C、根据试验情况和出现的问题,对测验做进一步的修改使之趋于完善。,经过预备试验后,精选测验指标,剔除测量值不稳定、有效性和可靠性低或测验结果呈极度偏态的指标。,3、预备测验,75,4、科学性检验:“三性”检验,科学性检验是指对测量进行“三性”检验。,如待定测验指标的“三性”达到了使用标准便可选用,否则要另行选择。,另外,还应对筛选出来的各个指标进行相关程度的检验,如某两项指标的相关程度高且效标的相关程度又很接近,说明这两项指标属同质测验,要剔除其中一项。,总之,最后确定的指标,互相之间的相关程度要低,(独立性),,与属性的相关程度要高(,相关性,)。,4、科学性检验:“三性”检验科学性检验是指对测量进行“三性”,76,5、编写测验实施细则,A、测验目的;,B、受试者的年龄与性别;,C、测验的“三性”;,D、测验场地和设备;,E、测验的方法和要求;,F、记录、评分的方法和要求;,G、测验的安全措施。,I、测验的注意事项,5、编写测验实施细则,77,(三)测验编制的程序,在实行多项测验或群体测验时,要考虑测验程序的编排问题。,测验程序是指实施测验的先后次序,它是根据测验时间、测验项目、测验内容、测验人数、测验难易度和强度、测验条件(场地、设备)和测试人员等方面的情况而进行编排的,。,编排测验程序的原则是:,第一,省时,便于组织实施;第二,保证前后测验之间不会产生不良影响。,(三)测验编制的程序 在实行多项测验或群体,78,在体育测验实践中,测验程序的编排通常采用以下三种方法:,1.逐一测验编排法,2.连续测验编排法,3.循环测验编排法,在体育测验实践中,测验程序的编排通常采用以下三种方,79,(四)有关体育测验编制的几个问题,1,、测验对象:用于评价的测验样本数,全国性标准应1000,地区性标准应200;用于诊断的测验样本数,通常应30;用于测量三性测验的样本数,通常应 100,但在严格控制测量条件的情况下,也可采用小样本数(20-30)方案进行。,2、测验形式:,A、从测量目的来分:教学性测验是为教学训练提供有效依据的简单、具体的测验;研究性测验是为科研专门设计的详细、周密、完整的测验。,B、从测验项目来分:单项测验、成套测验,C、从测验手段来分:计时型测验、计数型测验、丈量型测验、专家评分测验、操作仪器测验、理论测验、临场观测,D、从时间延续长短来分:横向测验、纵向测验,(四)有关体育测验编制的几个问题1、测验对象:用于评价的测验,80,有一些机能领域的测验项目(指标),不只是一项而是有多项组成。这样,由多项指标来测定某个同一机能领域的测验,,称,成套测验,,又称组合测验或系列测验等,它主要用于测量体育范畴中某一方面或某些行为(或现象)的综合属性,并同样具有诊断、评价和预测等功能。,成套测验:是指由若干单项测验组成的一种有特征的、具有完整属性的测验,通常又称“组合测验”或“系列测验”。,(五)成套测验,有一些机能领域的测验项目(指标),不只,81,1、成套测验的特点:,成套测验的总体属性常常难以直接测量获得,一般只是测量构成其总体属性的各个测验项目(各个指标),把它们的测量观测值综合起来以对总体属性进行估价。特点:,A、总体属性与其结构成分(各单项测验)间具有高相关性。,B、各结构成分间具有高独立性。,C、评价具有高综合性,是在确定各结构成分权重、分值转换及评价法基础上的综合评价。,1、成套测验的特点:,82,2、成套测验的编制,“测验编制的基本程序”一致,注意各组测验之间的关联先后。成套测验的有效性、可靠性和客观性检验包括项目的难易度检验、项目的区分度检验、项目间的相关分析。,(1)项目的难易度检验:受试者在测验中的成功率表示;,项目的难易度,,可用受试者在该项测验中的成功率表示,成功率愈高,难度愈小,,当然亦可用失败率表示,失败率愈高,难度愈大。,例2.10:,2、成套测验的编制,83,(2),项目区分度检验,:,所谓项目的区分度,是指该项目的测验成绩,能够区分受试者不同能力水平的程度。,设成套测验总分的上位25与下位25的人为“上位群”及“下位群”,而且“上位群”在某项测验中的失败者(不合格者)为W,上,,“下位群”在同一个测验中的失败者为W,下,,,则W,上,W,下,的值越大,该项目的区分度越好,。,若受试者人数为N,则上、下位群的人数为:N,上,N,下,=0.25N,则W,上,与W,下,的最大值分别为:W,上,N,上,,W,下,N,下,而最小值均为0。,显然,区分度的最大值,只有当“上位群”全部成功,而“下位群”全部失败时才会得到。,从而,可得到计算区分度指数的公式:,dW,上,W,下,/0.25N (课本50例2.11),一般认为,区分度指数至少应达到0.20。,(2)项目区分度检验:所谓项目的区分度,是指该项目的测验成绩,84,(3)项目间的相关分析:,理想的成套测验,要求各项目之间的相关程度要低,若项目间呈高度相关,则意味着这些项目所代表的是共同属性,因而只采用其中的一项也不影响测量的效果。,项目之间的相关程度可计算每两项目间的积差相关系数或等级相关系数。,(3)项目间的相关分析:,85,3、成套测验编制的注意事项,(1)成套测验编制必须遵循前面所谈到的测验编制基本原则和程序,并着重对成套测验的有效性、可靠性和客观性进行分析和研究。,(2)成套测验以3-5个项目组合为宜;,(3)编制成套测验时,必须要考虑综合评价的问题。,3、成套测验编制的注意事项,86,(五)体育测试的实施,按照测验的实施过程,体育测验的组织实施过程分为三个阶段。,(五)体育测试的实施 按照测验的实施过程,体育测验的组,87,1.测验前的准备工作,在测验计划确立后及测验实施前,应作如下准备工作:,I组建测试队伍;,II组织测试者认真学习测验计划、测试细则,明确分工;,III测试实习;,IV准备测验场地、设备和仪器;,V准备成绩记录的表格或测试卡片及其用具。,1.测验前的准备工作 在测验计划确立后及测验实施前,88,2.测试工作的进行,I向受试者说明有关事项;,II准备活动;,III测验前的练习;,IV必要的提示;,V思想鼓动。,2.测试工作的进行I向受试者说明有关事项;,89,3.测试后的工作,I,放松活动;,II,整理测验场地、设备及仪器;,III,检查所记录的测验成绩;,V,按原计划及时分析处理测量资料。,3.测试后的工作I 放松活动;,90,第二节 体育评价的基础理论,体育测量,是将一些可以测得的物理量和非物理量转换为数值或符号,进行资料汇集、信息收集的过程。,评价,则是对所获得信息进行加工处理,通过科学地分析进而作出,价值判断,,且赋予被测量事物或现象某种意义。所以说,测量是基础,是前提;评价是结果,是目的。二者紧密联系,不可分割。,第二节 体育评价的基础理论 体育测量是将一,91,一、体育评价的基础知识,(一)体育评价的概念,评价是指评定事物的属性或特征的价值。目的是在正确地解释事物现状的基础上,为改善现状和实现理想的目标而制定决策提供判断依据。,体育评价,是指依据一定的标准,判断体育测量结果,并赋予其价值或意义的过程。,一、体育评价的基础知识(一)体育评价的概念,92,1、比较标准:,是借助于标准化测量程序和统计方法,以及一定的评价量表而制订的规范化的评价标准。现状、大样本测试。,2、理想标准:(,优化标准)是指个体或群体经过努力可能达到的标准。可用于个体或群体已具备的能力水平与应达到的能力水平进行比较。例:父母身高推测子女未来身高。,3、个体标准:(,特色标准)根据个体在不同时期、不同状态下的测量结果制订的标准。,体育评价的标准,1、比较标准:是借助于标准化测量程序和统计方法,以及一定的评,93,比较标准是用于个体与个体之间,群体与群体之间现实水平进行比较的评价标准,,理想标准是用于个体或群体己具备的能力和水平与可能达到的能力和水平进行比较的评价标准;,个体标准则用于对同一个人不同时期,不同状态之下的指标进行比较的评价标准。,所以说,评价的目的任务不同,所使用的评价标准也不同。,在实际应用中,有时根据需要还可把以上三种标准结合使用。,比较标准是用于个体与个体之间,群体与群体之间现实水平进行比较,94,(二)体育评价的基本形式,在体育实践中,根据诊断目的,体育评价有三种基本形式:,1.诊断性评价,诊断性评价,又称初始评价,是指在教学和训练开始前的评价。其主要目的是为了解学生的身体、能力、技能等状况及初始水平,做到心中有数,并且可根据初始状况、水平进行分组教学与训练,以达到因材施教、获得最佳效果的目的。,(二)体育评价的基本形式 在体育实践中,根据诊断目的,体,95,2.形成性评价,形成性评价,又称,阶段性评价,。教学和训练是分阶段进行的,在确定整个教学和训练总目标的同时,也要确定若干个阶段性目标。,形成性评价,就是把某一教学或训练的总目标分解称若干个阶段目标,并在教学和训练过程中随时检查评定阶段目标完成的情况,以便及时反馈有关计划的完成情况,并为最终达到教学和训练总目标而不断地调整、改善、控制整个教学和训练过程。,故形成性评价是科学地控制、调整、改进教学与训练的中心环节。,2.形成性评价 形成性评价,又称阶,96,3.终结性评价,终结性评价,又称,终末性评价,。是指在教学、训练过程的最后(如学期、学年末或训练周期末)进行的评价。,它主要对学生体能、机能、成绩和身体能力的提高及体质的增强、个体的进步等方面进行评价,确定个体在集体中的位置以及进行不同群体间的相互比较。,通过终结性评价可以获得全面的反馈信息,以检查教学或训练方法、手段的效果,总结经验,发现问题,为确定下一阶段教学和训练的目标提供科学的依据。,3.终结性评价 终结性评价,又称,97,二、体育评价量表及常用评价方法,有了评价标准以后,如何对个体或群体进行评价,则需要制定一种标尺,即制定评价量表。,评价量表,是指能辨别事物属性、特征价值的一种标尺,它是,用统计方法把测量获得的,实测值转换为一组导出数据,所组成的参照标准。,在体育测量中,常见的评价量表主要有两种:,分值量表,和,等级量表,。,二、体育评价量表及常用评价方法有了评价标准以后,如何对个体或,98,(一)分值量表,是以分值对事物的属性或特征进行评价的量表。,1、标准分评分量表,2、百分位评分量表,3、累进评分量表,(一)分值量表是以分值对事物的属性或特征进行评价的量表。,99,1、标准分量表,标准分量表,是,以标准差为单位,划分评价等级或分数区间值的一种评价量表。三个特点:,以标准差为单位划分评价等级的间距,成绩的递增或递减的间距是相等的。,适用方便、广泛,在正态分布表上容易查出某个成绩范围内的人数占总人数的百分比。,在多指标、计量单位不一的综合评价中,它可以把原始测量值全部换成标准分(是相对分值),可以相互比较,并能进行算术运算,这就更加显示其优越性。,1、标准分量表 标准分量表是以标准差为,100,(1)Z分量表,Z分量表是一种最基本的标准分量表,它,把平均数定为0分,相差1个标准差为1分,。Z分的计算公式为:,田赛:,径赛:,式中:X实测值(成绩);平均值;S标准差,由于原始数据服从正态分布,故X分一般在3+3之间。一般转化为T分量表。,(1)Z分量表 Z分量表是一种最基本的标准分量表,101,(2)T分量表,为了是Z分全变为正数,可,将Z分的计算公式做简单变换,,便得到T分计算公式:,田赛:,径赛:,即有:T10Z+50,(2)T分量表 为了是Z分全变为正数,可将Z分的计,102,(3)标准分量表,标准分量表:T分的满分为100分,如果满分取值一般化的值,如20分、25分、50分等,则应该制定一般化的量表。,设满分为A,考虑到原始成绩的范围为(,),则相差1个单位,标准分相差为:,显然的,分数相差1分,则该项成绩应该相差:,(3)标准分量表 标准分量表:T分的满分为100分,103,例:测得某市10岁男生立定跳远成绩,经计算,149.7cm,S15.3cm,试制定该市10岁男生的立定跳远成绩的标准分评分表(满分为20分和100分),例:测得某市10岁男生立定跳远成绩,经计算,149.7c,104,A:20分制标准量表制定方法,解:当A20时,根据,将 149.7cm定在10分位置上,则可以制表。,A:20分制标准量表制定方法解:当A20时,105,得分,成绩,得分,成绩,20,9,19,8,18,7,17,6,16,5,15,4,14,3,13,2,12,1,11,0,10,149.7,得分成绩得分成绩2091981871761651541431,106,得分,成绩,得分,成绩,20,9,19,8,18,7,17,6,16,5,15,4,14,3,13,2,12,1,11,154.3,0,10,149.7,得分成绩得分成绩2091981871761651541431,107,得分,成绩,得分,成绩,20,9,145.1,19,8,18,7,17,6,16,5,15,4,14,3,13,2,12,1,11,154.3,0,10,149.7,得分成绩得分成绩209145.119818717616515,108,得分,成绩,得分,成绩,20,195.7,9,145.1,19,191.1,8,140.5,18,186.5,7,135.9,17,181.9,6,131.3,16,177.3,5,126.7,15,172.7,4,122.1,14,168.1,3,117.5,13,163.5,2,112.1,12,158.9,1,108.3,11,154.3,0,103.7,10,149.7,得分成绩得分成绩20195.79145.119191.181,109,A:100分制标准量表制定方法,解:当A100时,根据,将 149.7cm定在50分位置上,则可以制表。,A:100分制标准量表制定方法解:当A100时,110,得分,成绩,得分,成绩,49,149.7-0.918,51,149.7+0.918,50,149.7,得分成绩得分成绩49149.7-0.91851149.7+0,111,得分,成绩,得分,成绩,100,45,149.7-0.9185,95,40,90,35,85,30,80,25,75,20,70,15,65,10,60,5,55,149.7+0.9185154.29,0,50,149.7,得分成绩得分成绩10045149.7-0.91859540,112,得分,成绩,得分,成绩,100,45,95,40,90,35,85,30,80,25,75,20,70,15,65,10,60,5,55,154.3,0,50,149.7,得分成绩得分成绩1004595409035853080257,113,得分,成绩,得分,成绩,100,45,145.1,95,40,90,35,85,30,80,25,75,20,70,15,65,10,60,5,55,154.3,0,50,149.7,得分成绩得分成绩10045145.1954090358530,114,得分,成绩,得分,成绩,100,195.7,45,145.1,95,191.1,40,140.5,90,186.5,35,135.9,85,181.9,30,131.3,80,177.3,25,126.7,75,172.7,20,122.1,70,168.1,15,117.5,65,163.5,10,112.1,60,158.9,5,108.3,55,154.3,0,103.7,50,149.7,得分成绩得分成绩100195.745145.195191.1,115,2.百分位评分量表,百分位评分量表,是以百分位数为单位划分评价等级或分数区间值的一种评价量表。这种评价量表有如下特点:,对资料的分布没有特殊要求:适合于正态以及非正态分布的资料;,量表的分数直接反映了相应的成绩在群体中所处的位置;,百分位数只是一种序数,不能进行算术运算。,中等成绩分值偏高,两端成绩分值偏低.,2.百分位评分量表 百分位评分量表,是以百分位数为单位划,116,将样本数据由小到大排序(田赛),然后再100等分,如果成绩X对应的H等分位置,则X的位置百分为H。,比如:共有n250人,某人的成绩排序号为150,则其位置百分为,这种量表的分数直接反映了相应的成绩在群体中的位置所处的位置。告诉我们比此成绩低的人数百分比。一般用于生长发育的评价和群众性锻炼效果的评价。,将样本数据由小到大排序(田赛),然后再100等分,如果,117,百分位数是指位置百分所对应的原始数据,若X的位置百分为H,则H的百分位数为X,记为P,H,。所以,求百分位数是位置百分的逆运算。其公式可以表示为:,式中:LP,H,所在组的组下限;,f,x,组频数;i组距;n总人数;C P,H,所在组上一组的累积频数。,百分位数是指位置百分所对应的原始数据,若X的位置百分为,118,3.累进评分量表,累进评分量表是根据累进计分法制定的评价表,其主要特征是能使分值增加的幅度与成绩提高的难度相适应。,一般来说,水平越高,成绩每提高0.1s的难度也愈大,所以相应增加的分值也就应愈高。,对优秀运动员有利,对成绩差的人明显不利,因而它
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学培训


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!