资源描述
单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,课堂教学评价原理和方法,顾云虎,一、教学评价改革的呼声和政策,二、课堂教学评价和教学的关系,三、检验评价合理性的三个维度,四、评价什么和怎么评价,一、当前教学评价改革的诉求,“评价”通常借助考试(测试)进行。,教师:“考试评价制度不改革,课程与教学怎么改都落空”。教师以经验看出了问题关键,但缺了追问,被动等待。,政策:“改变课程评价过分强调甄别与选拔的功能,发挥评价,促进,学生发展、教师提高和,改进,教学实践的功能。”,基础教育课程改革纲要(试行),评价改革的呼声强烈,上下有共识,但评价改革非常缓慢,为什么?需要检视评价观念背后一些预设:,所有的教学都必须经历评价这个环节;通过评价,教学的价值才获得证明和确定。,教学评价不是一次性行为,是前后联系的链条系列,每一次评价有自身目的,但同时又作为在后的评价的手段,,N,个在先的评价以中考或高考为最后目的。中高考成为第一的目的。,评价既可以看作教学过程必要组成部分,也可以看作独立的行为过程,在教学系统外部运转。,评价对于课程与教学来说是必须的,但不是所有的评价是可接受的。只有恰当合理的评价才能作为教学好与坏判断的标准,用作学业成绩和教师荣誉利益的奖惩等级尺度。,上述假设得到经验支持,根深蒂固,隐含着评价的必要性、持续性、离合性和工具性。,要改革教学评价,先要了解评价和教学是什么关系。,二、课堂教学评价和教学的关系,(一)传统理论中评价和教学的关系,1.,教学评价,观念:,教学评价是基于某种信息数据对教学过程、教学结果进行价值判断。形式和手段多样,但都指向结果(如行为改变,知识增加)。,这是一种变化的结果,归因于课堂教学。而不是先天或生活偶然性。,因教学而出现的教学结果,在评价理论中称为教学变量。通过教学变量这个前提来判断教学质量,学生的发展情况。例如教学过程中学生之间成绩存在很大差异,对某一个内容(工业革命或一个不定式或一个方程)掌握的情况不同,对教师布置的作业态度不同等等,都是教学变量。,2.,教学评价和教学的关系(评价的功能),正是因为所有的变量(数据信息)指向教学结果,教学评价之于教学的关系就合逻辑地是:,诊断,(检测)学生的优势和不足(知识到能力倾向);,反馈,(监测)学生的发展(量到质);,定向,调整后续的教学过程和活动;,鉴别,和评定教学目标达成程度、能力水平和学业等级;,训练,(教学)应试的技能,优化效果;,上述累积着作为手段,目的是通过,选拨,(二)评价与教学关系的新趋势,评价原理内部蕴含冲突,尤其用评价来做什么,两种矛盾的倾向间对抗日趋激烈:,评价代表着学习结果,等级,资质,以知识学习数量等级为尺度分配给学生个体不同的社会现实利益和发展空间,日益成为公共事件,引发公众对教育资源分配和效能评定的争论。教学评价意义日益超出教育教学的范畴。中国高考自不必说;美国布什政府,2002,年,不让一个孩子掉队,(,No child left behind,),NCLB,法案,以考试为基础问责。,教学评价承担社会调节器作用,加剧评价的甄别和选拔功能,撕裂教学自身价值,在教学内部引发另一种张力,要求弱化评价的甄别和选拔功能,加强评价“促进学生发展、教师发展和改进教学实践的功能。”把评价的作用限制在教育教学范畴。,把教学评价作用限制在教学范畴还是超出教学范畴两种趋势在角力。,(三)教师需要了解评价原理和方法,测试评价在传统评价理论中只是教学系统一个组成部分,是教师教学的附属结构行为和能力,但今天已成为一种独立于教学的前提性的行为能力,只有会测试评价才能会教学。即,评价教学,成为今日教师必须掌握的两项技能。测试评价能力包括:,按照自己的教学观念假设(意图)编制测试评价工具和有选择的使用他人编制的测试评价工具,依据教学评价结果的启示有针对性地开展和改进教学。,什么样条件下,教学评价才能合理科学?借助哪些概念工具?,三、检验评价合理性的三个维度,所有的测试和评价自身都接受评价,(一)信度,信度的本质是评价值得信赖。何谓值得信赖?,答:一致性;多次测量的一致性。(如打开冰箱拿出的啤酒必定是冰凉的。),所以,信度一致性,信度有两种主要表现形式:,稳定性信度:,不同测试情境中测试结果的一致程度。即信度必须假设两次测试结果不变,所以又称,再测信度。,信度的证据:分类一致百分比计算方法,假定要判断学生是否掌握,X,知识点,给学生测试两次,学生每次,60,分为合格,:,A.,在两次测试中均,60,分以上学生,42%,B.,在两次测试中均,60,分以下学生,46%,C.,两次测试中归为不同类别学生,12%,D.,测试分类一致性比例(,A,B,),88%,复本信度:,同一测验的两个或多个复本的测量结果一致性程度,仍假定要决定学生是否掌握,X,知识点,出,20,道小题分两组,每组随机,10,小题,以每组答对,7,题为合格,以上述的方法求出两组题目测试的一致性。,求稳定性信度要考虑排除两次测试之间可能发生改变学生成绩的事件。假设想测量学生所掌握的的二次世界大战知识,在两次测试之间电视台播放了二战纪录片,看过记录片的学生成绩前后一致性就受到影响;再比如测量学生对一元二次方程的理解,两次测试之间学生恰好上了补习班,一致性程度也受影响。,教师不一定非要计算评价信度,但有信度意识,就可以考虑在测试评价中控制非教学的因素,提高评价的信度。,(二)效度,信度(一致性)不能保证测试有效可靠。例如一份编制很好的高一化学测试题用来测试初三学生,信度稳定,但不能说明测试可靠。这就引出效度概,念。效度概念有分歧,一种看法是测出欲测,指向测试本身;另一看法,效度不是指测试本身,而是指,以分数为基础所作的推论的效度,。比如高分代表教学内容掌握程度好。,效度表示教师对学生进行推断的精确性。效度决定教师教学决策正确程度,因此它比信度更关键。,效度主要表现是内容相关效度,即测试的内容对所要推论的课程目标内容的代表程度。由于“内容”概念的模糊性,内容抽样(题目)容易偏差。比较好的效度抽样是完全匹配,见下图,a,。,例,1.,生物体能够由小长大的主要原因是(),A.,细胞的分裂和体积增大,B.,细胞数目的增多,C.,细胞的体积不断增大,D.,营养状况的好坏,这里“生物长大主要原因”不是一个很好的生物学课程目标的抽样(代表)。“原因”是哲学范畴;将细胞分裂增大和停止增长、死亡联系起来是否更好?,例,2.,结合上下文,根据你的见解,给学校图书馆提供三条建议?,这个“图书馆建议”(主观建构)是否语文课程目标很好的抽样?,内容,效度审查建议,:这道题(试卷)是否恰当地测量了学生的数学(英语、地理等)知识和技能?它是否重要到如果学生没掌握,就必须补习?它对课程目标的代表程度是,%,。,效度和信度关系:效度成立,则信度成立;反过来未必,结果可信,既可能产生有效的推论,也可能产生无效的推论。,(三)偏差的克服,因学生的个体特征而歪曲学生的成绩,称偏差。如人格倾向:,07,年高考作文题“提篮春光看妈妈”就对感情细腻擅长抒情的学生有利。,成长环境:农村和城市学生对特定内容表现不一样。比较典型英语学科,农村和城市差异很大。,四 评价什么和怎么评价,(一)评价的内容及其决定,评价什么由为什么评价问题决定。,目标驱动的评价内容,评价意在促使课程目标(教学目标)的实现,评价内容来自课程标准的概念化,即课程标准内容的“可测量”表达(如“上下文理解”,怎样让“理解”可测量);把测试当作教学,测试数量必须有保证;诊断学困(优),内容难度拉开;,目标分类的评价内容,认知、情感和运动能力,知识和能力双向内容,记忆和高于记忆;表现性标准,高分宗旨的评价内容,学科知识技能知识谱系化,数量化,如语文:,(二)评价的类型和方法,1.,常模参照评价与标准参照评价,:先前参加过测验的考生被称为常模。常模参照评价是对学生成绩的相对性解释;标准参照评价是绝对性评价。用途不同,二者没有绝对的界限。,2.,选择性反应和建构性反应,:在评价中,要求学生呈现的反应分选择性和建构性两种。前者用判断题、选择题、匹配题,后者用填空题、主观题。它们一致的要求是,除非专门目的,题干一般不要用复杂句型(长,否定,全称)。在主观题中,分数点不要超过四个以上。,连续建构性:,上海,09,综合卷中的第,13,题,近年来上海城市交通显著改善,但还跟不上经济和社会发展的步伐。未来五年上海将计划形成,“,海、空、铁、陆、水五路并举的格局,”,。然而,城市交通的改善涉及到方方面面,并不只是一个领域内的问题。,第,1,题,根据上述计划,上海城市内外交通建设(交通工具除外)应包括海港、越江隧道、等。,第,2,题,解决上海城市交通建设的问题,必须运用多学科的知识。请从化学、生物、物理、地理、政治、历史、美术等学科中,选择与下表中各问题紧密相关的两门学科,填入表格相应的位置。,问题例举,主要涉及的学科,路名研究,路面材料的分析,高架道路两侧的隔音板设施研究,行道树种植,道路景观设计,GIS,第,3,题,有人设想通过建造地下城来解决交通拥堵问题。他打开了如下网页,希望了解有无该方面的信息动态。除使用“站内搜索”引擎外,还可通过哪个链接来获取信息?请用圆圈标出应该点击的那一链接。,3.,表现性评价和档案袋,:以行为或作品来作评价对象。注重创造性。如化学实验操作、撰写实验报告、解释实验结果、分析实验程序;口语交际;档案袋评价以作品形式让学生全方位参与自我评价,要点是确保每个学生拥有并保存好一个档案袋,但不是杂物袋,作品能对比印证学生能力的提高。,科学:学生做的最佳实验室成果;开发的最佳原创假设;对教师提出的科学问题的最佳解决;对科学问题阐明自己主张的最佳论文(用那些能在科学家的讨论会上展示的风格写成);对科学杂志或期刊上的文章做的最佳评论;从学生长时间的实验中所做的最佳记录或日记。,4.,观察和访谈,把观察和访谈纳入评价数据材料范畴是有限进步。,观察和访谈都有是否控制问题,情境因素,教师自身主导因素,需要高超的教学艺术,非单纯科学。,注意项:,不以正确答案获得为结果,三角形面积计算;苏格拉底的谈话,教师自身的深度和广度,案例如辣椒形状 南瓜皮颜色,(三)“考什么教什么”的合理性和局限性,考什么教什么,为评价而教,以评价驱动课程内容的学习和掌握,经济合理。,但“考什么教什么”也可能仅注重眼前分数,对学习的多样性、建构性、长远意义有可能损害。,保持一种张力。,谢谢!,
展开阅读全文