外语测试的分类(共2页)

资源描述

精选优质文档-倾情为你奉上外语测试的分类2009/03/27 15:16 考试的定义为“用来获取某些行为的方法，其目的是从这些行为中推断出个人具有的某些特征。” 四种语言测试法包括写作-翻译法、结构主义/心理测量法、综合法和交际法。一、按学习阶段来分 1、编班测试（placement test）也叫分级测试。我们都知道学生程度不齐。教师难教,学生也难学。所以常常需要将学生按程度分班，以利教学。分班测试就是为这一目的而设计的。它要考查的是学生目前现有的语言能力，所以水平测试的题目常可作分班测试用。有时上一个学期的成绩测试结果也可作为下一个学期的分班依据。由于分班测试往往时间紧迫，没有太多的时间准备试题和改卷，所以常选用间接测试的客观试题，如多项选择题和完型填空等。 2、随堂测试（classroom tests）教完一课书之后进行的小型测验。测试的分量小，时间短，内容可以多样：拼写、听写、填空、释义、翻译等。题目不宜过难，大部分项目是复习本课的内容。 3、期中测试（mid-term tests） 4、期末测试（mid-term test）三个目的：促使学生巩固所学的知识，评价一学期的教学效果，调整下学期的教学安排。二、按照用途来分 1、水平测试（proficiency tests）衡量受试者综合运用外语能力的测试。它的目的是确定受试者目前是否具有所需要的外语水平。它的特点是并不限制任何一个教学大纲或任何一本教材命题。要考查的不是对所教的课程学得怎样，而是根据未来对外语的使用要求考查受测者目前的外语熟练程度。典型的水平测试例子有中国的EPT，大学英语四六级、英语专业四八级、美国的TOEFL和英语的ELTS。 2、成就测试（achievement tests）成就测试的目的是评价、衡量学生在掌握所学教材方面取得的进展。通过成就测试，我们能确定学生在其所在班级中的相对位置，了解其掌握知识的程度和应达到的学业标准之间的差异，并达到巩固所学知识的目的。成就测试的例子有期末考试、中学毕业会考以及某门课程结束时所进行的考试。评价教学效果的测试也是成就测试。 3、潜能（或素质）测试（aptitude tests）(语言禀赋测试)（学能测试）语言禀赋测试的目的是评估受测者在语言学习方面的禀赋或潜在能力，以预测其在学习外语时取得成功的可能性。禀赋高的人学得就快、就好。语言禀赋测试一般是用一种人造的语言来进行测试，所以受测者参试时的外语程度不影响测试结果，有的人也许从未学过外语也可以考得较好。测试的内容主要有:语音与符号的配对能力、辨认能力、记忆力、对语法结构的感受力以及归纳能力等等。但目前对语言禀赋测试的实际效果仍有争议。 4、诊断测试（diagnostic tests）诊断性测试是为教学服务的。它不是考察学生的总体语言水平，而是针对所学的某些具体内容和语言知识进行测试，以了解学生的困难所在。我们可以对某些学习难点进行诊断性测试。如果结果显示学生对此已经掌握，则不必再花太多功夫。通过诊断性测试，可以查明学生的困难之所在以及产生这些困难的原因，使学生知道哪里需要多加努力，而教师则可有针对性地采取补救措施。通过分析学生的错误，教师的教学也就更加有的放矢。诊断性测试宜采用分列式测试，哪里有问题，一目了然。若采用综合性测试，则不易查明问题所在。比如采用听写的形式，就不容易分清造成考得不好的原因到底是因为听不懂还是因为不会写。三、按照考试方式来分 1、分离性测试（discrete-point tests）把知识和能力分成若干小的单位，逐个的进行测量。例如，我们可以把语言分成语音、语法、词汇等，然后在设计相应的测试题目。分离性测试一般集中考查语言的某一方面，或考查学生单方面的技能。其考试形式主要为多项选择题。在分列式测试中，每个题目只考一个语法构成成分的某一点，如某个音素、某个单词、某条语法规则等。此外，每个题目必须是独立存在的，与前后的其他题目无关。更换其中一题不会影响学生对其他题目的回答。最典型的分列式测试题为多项选择题。但看完一篇阅读材料后考理解能力的多项选择题则不属于分列式测试。分列式测试的长处在于：(1)针对性强。学生无法回避所考内容，尤其适宜作诊断性测试用。(2)评分客观、准确。不受人为因素的影响。(3)易于更换不合适的题目。便于在需经难度检验的大规模测试中使用。 2、综合性测试（integrative tests）一次同时考查语言的多方面的知识和技能的测试。现在常用的听写、完型填空、翻译、作文等都属于综合性测试。综合性测试考察的是受测者理解和运用语言的综合能力。国此各种各样的语言构成成分和技能都将同时受到检验。例如外语面试，受测者不仅要听得懂对方的问话，还要运用所掌握的语言知识和技能准确地表达自己的意思。又例如作，受测者的许多技能都同时受到考查，如词汇、语法、拼写、构思、组织材料等。其他的例子还有完型填空、听写、作文等。四、按照对考试分数的解释来分 1、常模参照性测试（norm-referred tests）当我们判断一个分数是好还是不好时，主要有两种解释方法：一个是参照常模，另一个是参照标准。常模指的就是一群类型相同的人的水平的平均值。常模的功用就是给测试分数提供比较的标准，即给测试分数提供参照点，从而使人们可以对测试分数加以解释。常模参照测试就是参照其他考生的情况来解释某人的得分的测试。在这种情况下，衡量的标准是相对的，而不是绝对的。常模参照测试的目的是要显示考生间外语水平上的差异，提供相对的等第顺序，所以它必须能将分数拉开，以确保可靠的区分性。如果在一个常模参照测试中，人人都得高分，那它决不可能是一个成功的测试。水平测试属于常模参照测试。尤其是大规模的标准化测试，因为要保持每次测试的难度相等，具有可比性，单靠在题目上下功夫很难做到，而考生群体的水平则是相对稳定的，所以得靠常模参照测试来达到这一要求。假设某次TOEFL成绩的平均分位512分，标准差位66，某考生在这次考试中得了578分，正好比平均分多出一个质，即一个标准差的分数(51266=578)。按正态分布的原理，84.13%的考生成绩低于578分。 2、标准参照性测试（criterion-referred tests）判断一个分数好坏的另一个方法，就是将考生的表现(分数)与事先定好的标准对比来决定他是否具备某种能力。这样的测试就叫作标准参照测试。这种测试所要达到的目的就是表明某人是否达到了既定的标准,而不关心考生间的成绩差异。如果在一次标准参照测试中，人人都得高分，是值得庆贺的事，因为这表明人人都达到了既定的目标，学习掌握得很好。标准参照测试的例子有单元测试、诊断性测试等。驾驶员领取驾驶执照，律师领取营业执照的考试都是标准参照性考试。五、按照试卷的评阅方式来分 1、主观性测试（subjective tests）主观测试指的是需要评分者作出主观判断的测试。例如作文就是种典型的主观测试。 2、客观性测试（objective tests）客观测试指的是评分方式上的客观。评分人不需要作出自己的主观判断，只需根据答题是否与正确答案相同来给分。评分结果不会因评分人不同或评分时间不同而改变。最典型的客观测试题是多项选择题。六、按照考试方法来分 1、笔试（written tests） 2、口试（oral tests） 3、实践法（practice）写论文等。什么叫实力型测试(Power Tests) 在实力型测试(也称难度测试)中，考生有足够的时间做完所有的题目。个别考生无法完成全部答题是因为不会做，做不出,而不是因为时间不够。这类测试的目的是要使考生充分展示其掌握的语言知识和能力的程度，因此题目的编排往往由易到难。如果把难的题目放在前面，有的考生就会因题目一开始就这么难而失去信心，放弃继续做下去的努力。或者因为在难题上费时过多而无法做完全部题目，致使后面容易做的也没有做。这样就会影响测试结果的准确性。什么叫速度测试（speed tests）速度型测试所给的答题时间非常有限,考生必须尽可能快地完成答题。一般只有极少数人或根本没有人能够做完全部题目。它所测试的不仅仅是语言知识和理解能力，而且还有运用这些知识和能力的速度。通常题与题之间的难度相当。如考快速阅读就是一例。什么是语言测试(Linguistic Tests) 语言测试考查的是受测者对语言各构成成分掌握的精确程度。例如语法是否正确、发音是否标准、词汇搭配是否得当等等。什么是交际能力测试 (Communicative Competence Tests) 交际能力测试注重的是学生使用语言进行交流的能力。重要的不是语言的精确性，而是通过语言来理解和传达信息的能力。其中也包括在各种语言环境中正确使用语言的能力。比如，应征面试就是一种交际能力测试。这时发音是否标准、语法是否规范都不是最主要的，只要不影响意思的表达，可以接受就行。重要的是能听懂问话，并作出恰当的回答，语言流利，使用域正确。 Bachman提出的交际语言能力模式包括三部分：语言能力、策略能力和心理生理机制，每一部分可进一步划分。语言能力包括组织能力和语用能力；策略能力包括判断能力、计划能力和实施能力；心理生理机智则指在语言使用中的神经和生理过程，比如区分视觉和听觉途径，或产出和接受方式。交际法测试的特点：1）考试内设计“信息沟”，要求学生通过各种已馈入的信息来获取未知信息。2）考试任务或项目之间存在关联性，即一个项目要基于前一个项目完成的基础上。3）考试强调针对性，根据考生的具体需求设计考试内容。4）侧重广泛的测试语言能力，包括语言知识、语言功能、语言使用的合适性等。5）考试采用定性评估方式，取代纯粹的定量评估方式什么是形成性评价(Formative Evaluation 形成性评价是指在教学过程中为了解教学的结果和学生学习的进展情况及存在问题，以便及时调整和改进教学所进行的评价活动。例如我们熟悉的期中考试和单元测验就属于形成性评价的范畴。通过形成性评价，教师可以及时发现问题,修正教学计划，给学生提供最适当的指导；学生可以了解自己达到目标的程度，发现自己在学习中的缺陷，及时进行补救。形成性评价能起到及时反馈、及时调节的作用，达到强化和矫正的效果。什么是总结性评价(Summative Evaluation) 总结性评价的目的是为了了解学生一学期或一学年的学习是否达到教学目标的要求，对教学成果作出较全面的综合总结和成绩评定，以便确定能否升级或给予学分。期未考和课程结束所进行的考试就属于总结性评价的范畴。这种测试因为是全面检查学习效果的，所以要求命题范围较广并具有代表性。题目的难度和区分度必须适中。信度和效度必须达到一定的标准。什么是标准化测试(Standardized Tests) 标准化考试是指在命题、施测、评分等程序上具有明确标准的考试。通常是由权威机构采用系统的科学程序来组织和实施、具有统一的常模而又相对稳定的大规模考试。标准化考试的特点是： 1）题目编制标准化。制定考试大纲,规定考试内容、题盟、时限和评分原则。编写试题并进行试题质量检测。检测内容包括专家评审，试测和计算试题难度及区分度。然后从中筛选出好的题目，再按要求拼制出试卷。其信度和效度都有数量指标作为质量保证。 2、施测过程标准化。有明确的考试指导书，使学生明确复习方向，平衡不同学生在对题目形式熟悉程度上的差异。考试过程必须在同等条件下进行，以确保公平合理。 3）阅卷评分标准化。大量采用客观性试题。对主观性试题采用明确的统一评分标准。尤其是通过使用机器阅卷，使评分做到又快又准。 4）分数解释标准化。采用标准分。建立常模，给考分的解释提供参照点，以使考分的意义得到解释。由于标准化考试的这些特点,使得不同次考试的结果具有可比性。具有了上述这些特点，才能称之为标准化考试。应注意不要将标准化考试与选择题划等号，也不能以考试的规模来作为判断标准化考试的条件。n 按对考试分数的解释来分：n 常模参照性测试（norm-referenced test）n 常模是指一群类型相同的人在一类考试中的成绩，这个常模一般用该考试的平均分与标准差来表示。n 常模参照性测试是指参照某一个常模来对某考生的分数作出解释。实际上是结合其他考生的得分情况来反映一个考生的分数，说明他在这群人当中的位置。如：n 某次HSK成绩的平均分是512分，标准差为66，某考生在这次考试中得了578，比平均分正好多出一个单位的值，即一个标准差的分数（512+66=578）。按照正态分布的原理，有84.13%的考生成绩低于得578分的考生。n 这种测试有利于选拔学生。n 标准参照性测试(criterion-referenced test)专心-专注-专业

展开阅读全文

外语测试的分类(共2页)

最新文档