语言测试学第二组

上传人:ch****o 文档编号:245131638 上传时间:2024-10-07 格式:PPT 页数:34 大小:1.36MB
返回 下载 相关 举报
语言测试学第二组_第1页
第1页 / 共34页
语言测试学第二组_第2页
第2页 / 共34页
语言测试学第二组_第3页
第3页 / 共34页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,08,机电,1,班,Electrical and Mechanical,My class one,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,08,机电,1,班,Electrical and Mechanical,My class one,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第,一部分,Electrical and Mechanical,My class one, our home,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第,二部分,Electrical and Mechanical,My class one, our home,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第,三部分,Electrical and Mechanical,My class one, our home,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,班风展示,08,机电,1,班,Electrical and Mechanical,My class one,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,王敏,骆明丽,陈丹,侯宇飞,马亚丽,语言测试,第二组,概说语言测试,语言测试的总体设计,语言测试的质量评估,目录,测量,测试,评价,语言测试的主要类型,语言测试的作用,发展,,第,一部分,总体概况,概说语言测试,调研方法,测量,测试,评价,第,一部分,测量(,measurement,)就是按照一定的规则给事物的属性指派数字或符号的过程。,事物及属性。这是测量的对象及其属性。,指派数字或符号。即用数字或符号来代表某 一事物或事物的某一属性的量。,法则。法则是指测量所依据的规则和方法, 这是测量的关键。,调研方法,第,一部分,测量,测试,评价,测试包括以下三个基本要素:,行为样本:所谓行为样本,是指对语言能力表现行为的有效的抽样。,客观的测量:所谓客观的测量是指测量的标准是否符合实际。,标准化的测量:是指在测试题目的编制、测试的实施、计分以及对分数的解释等方面有一套严密的系统的程序。,2.,测试(,Test,)又称测验。不同的心理学家对此下的定义不同。,Anastasi,(,1982,)认为,测试实际上是对行为样本所做的客观的标准化的 测量,。,这是公认的最有权威的定义。,调研方法,第,一部分,测量,测试,评价,3.Weiss,(,1972,)认为,评价 (,evaluation,)是指为作出某种决策而收集资料,并对资料进行分析,作出解释的系统过程。 与测量、测试相比较,评价的含义更 广、综合性更强。,并非所有的 测量都是测试,并非所有的测试都属于评价,而且并非所有的评价活动都涉及到测试或测量。,调研方法,第,一部分,水平测试,proficiency test,成绩测试,achievement test,也叫学业测试。,分班测试,placement test,潜能测试,aptitude test,(能力倾向),诊断测试,diagnostic test,以测试用途为标准的分类:,语言测试的主要类型,调研方法,第,一部分,按学习阶段来分:,分班测试(,placement test,),随堂测试(,classroom test,),期中测试(,mid-term test,),期末测试(,end-of-term test,),按考试方式来分:,分离式测试(,discrete-point test,),:,把知识和能力分解为若干小的单位,如集中考查语言的某一方面,或考查学生单方面的技能。,综合性测试(,integrative test,):听写、完形填空、写作、翻译。,语言测试的主要类型,调研方法,第,一部分,语言测试的主要类型,按对考试分数的解释来分:,常模参照性测试(,norm-referenced test,),标准参照性测试,(criterion-referenced test),按试卷的评阅方式来分:,主观性测试,(subjective test),:作文、口试、简述、翻译等。,客观性测试(,objective test,):选择、判断、配对题等。,调研方法,第,一部分,(1),一般作用:,评价,学习者的学业成就和语言水平。,评估,教学的实际效果。为,选拔,人才提供依据。为改进教学中的问题提供,反馈,。,(2)对于各种有关人的语言能力的假说,需要实证性数据的证实,语言测试在这方面可以为语言研究(语言教学研究)提供信息,发挥重要作用。,(3)语言测试研究能够为第二语言习得研究提供更为可靠而有效的方法和手段。,语言测试的作用:,语言测试的作用,发展,调研方法,第,一部分,语言测试的作用,发展,(,1,)传统时期或前科学时期(,20,世纪初,-50,年代初):依靠直觉判断。作文、口试、翻译等方法。,(,2,)心理测量,-,结构主义时期或科学时期(,50,年代末,60,年代初,-70,年代):以结构主义语言学、行为主义心理学、心理测量学为基础,,Robert Lado ,语言测试,外语测验的开发与使用,(1961),为标志。主要是分立式测试。,(,3,)心理语言学社会语言学时期或后现代时期(,70,年代,-80,年代初):注意功能性社会性和语言应用。综合式测试,出现完型填空(,Cloze Test,)等形式。,(,4,)交际法语言测试时期(,80,年代初至今):,ACTFL,和欧洲,功能意念大纲,、,交际大纲,为基础。,Bachman,的“语言交际能力模型”。,语言测试主要发展阶段:,外语测试的发展,Language Teaching Movement,语言教学的发展,Language Testing Movement,语言测试的发展,Linguistic Basis,语言能力观,Prescientific,前科学时期,Ability to translate,翻译能力,1960s-1970s: Audiolingual + Structuralist,专门人士,学生,听说,+,结构训练,Psychometric-structuralist,心理测量,-,结构主义语言学时期,Ability = Component + skills,语言知识,+,语言技能,1980s-1990s: Communicative language teaching,普及,交际教学,Communicative,交际语言测试时期,Ability to communicate,交际能力:功能、意念、任务,21,th,: Education for intercultural citizenship,?,Integrative-sociolinguistic,Task-based language assessment,基于任务的测试时期,-1950s: Grammar translation,精英,语法翻译,调研方法,第,一部分,(,1,)中国是最早使用考试(西周)。,(,2,)科举是一个标准化程度很高的测试体系。,(,3,),70,年代末受,TOEFL,等影响开始第二语言测试,出现“英语水平考试(,EPT,)”“大学英语考试(,CET,)”。,(,4,)对外汉语教学界“汉语水平考试(,HSK,)”影响广泛。,中国的语言测试:,语言测试的作用,发展,语言测试的作用,发展,哲学观:分析转向综合,语言观:形式、知识转向内容、运用,测试方式:个别技能转向多项技能,题型:客观题转向主观题,从只注重测试结果转向注重考试过程,从间接测试到直接测试,语言测试以人为本,语言测试发展趋势,第,二部分,1,、确定考试类别,2,、确定考试内容,3,、确定考试题型,4,、确定试卷结构,5,、制定考试细目表,6,、命题及编辑试卷,编写试卷,语言测试的总体设计,第,二部分,考试目的不同,试卷的内容、要求也不一样。,1,、确定考试类别,2,、确定考试内容,3,、确定考试题型,(,1,)根据测试目的选择题型,(,2,)纵横结合,确定题型是否有效,(,3,)考虑被试的能力范围,(,1,)多项选择题,(,2,)是非题、判断题,(,3,)配对题,语言测试的总体设计,第,二部分,语言测试的总体设计,第,二部分,语言测试的总体设计,第,二部分,语言测试的总体设计,第,二部分,语言测试的总体设计,第,二部分,语言测试的总体设计,4,、确定试卷结构,首先,要确定试卷各部分的比例;,其次,是研究每一部分有多少题目才能保证测试起码的效度;,第三,题目数确定了,还要看时间是否够。,第,二部分,语言测试的总体设计,5,、制定考试细目表,知识,理解,应用,分析,综合,总计,比重,时间(分),语法,10,10,20,12.5,20,词汇,20,20,12.5,60,阅读,40,40,25,综合填空,20,20,12.5,20,听力,35,35,21.9,30,写作,25,25,15.6,30,总计,30,75,10,20,25,160,100,160,6,、命题及编辑试卷,整个命题过程包括选材、编写试题、审题等环节。,命题原则:先出容易的题,后出现较难的题目;题型相同的题应放在一起;客观题在前,主观题在后。,规模大、影响大的测试在正式实施前还要进行试测,以验证试卷有没有缺失,要不要作一些改动等。,命题要求:,效度、信度,注意试题的难度和区分度等。,第,二部分,语言测试的总体设计,第,二部分,语言测试的总体设计,1.,区分度:,指一个题目对于鉴别被试的水平所起的作用有多大。,(,1,),区分度指数,(极端分组法),:,27%,D=(高分组答对此题人数-低分组答对此题人数)/高分组或低分组人数。,例题,:,P326-327。 D在-1,+1之间,一般要求在0.3左右。,特点:,简便;不够精确,题目分析的方法,难度的形成,知识的综合程度,试题的呈现形式,试题提问的思维跨度,有用信息的提取难度,第,二部分,语言测试的总体设计,试题的难易度,第,二部分,语言测试的总体设计,2.,难易度:,指某个题目的答对率,即答对某题目的被试占全部参加测试的被试的比例。,p,=答对此题人数/总人数,范围应在0.2-0.8之间。,平均难易度,(一个测试的各个题目的难易度相加,再除以题目的数量),宜在0.5左右。,特别要求:,被试的,同质性,题目分析报表,题目编号:,IT98CR-107,标准答案:,A,题目质量:不合格,题目正文,107.,大学生们十分,感动,。,A.,激动,B.,感激,C.,震动,D.,感慨,一,年级组,考生数:,173,难易度:,0.1053,区分度:,0.0180,选项 人数 平均分数 双列相关 点双列相关,A 26 20.81 0.0276,0.0180,B 95 21.82 -0.2921 -0.2324,C 19 16.26 0.4180 0.2493,D 32 19.22 0.1528 0.1050,E 1 17.50 0.1907 0.0048,报告人:,XX,考试中心 报告日期:,1998,年,X,月,X,日,题目的修改,题目的修改,题目分析报表,题目编号:,IT01CR1-107,标准答案:,A,题目质量:合格,题目正文,107.,大学生们十分,感动,。,A.,震撼,B.,可怜,C.,努力,D.,骄傲,一年级组,考生数:,138,难易度:,0.5036,区分度:,0.3976,选项 人数 平均分数 双列相关 点双列相关,A 70 21.63 0.4983,0.3976,B 5 18.60 0.0777 0.0317,C 34 17.35 0.3069 0.2243,D 28 17.36 0.2819 0.1976,E 1 17.00 0.6710 0.1648,报告人:,XX,考试中心 报告日期:,2002,年,X,月,X,日,用语表达:注意准确规范,试卷格式:注意整齐美观,试题内容:注意科学无误,知识点覆盖面广、重点突出,难度、比例和区分度适宜,设计的题目是否如实地反映出考试细目表中的内容和要求?,题目的要求是否明白无误?,试题前后是否有提示?,题目的难度是否适中?,题目的覆盖面是否够广?,第,二部分,语言测试的总体设计,第,三部分,语言测试质量评估,第,三部分,语言测试质量评估,第,三部分,1.,信度,2.,效度,3.,真实性,4.,互动性,5.,可行性,6.,后效作用,语言测试质量评估,第,三部分,1.,信度,信度,(,reliability,),指同一个卷面和难易程度相同的试题用于水平基本相同的测试对象,测试结果是否基本相同。,阅卷员信度,阅卷员自身信度,2.,效度,效度(,validity,),指测试的有效程度,也就是测试的内容和方法是否达到了测试目的。,要求:该测的当测,不该测的尽量不涉及;是否有缺漏或出现偏题、怪题;代表性、准确度和覆盖面如何。,类型:构念效度、内容效度、表面效度、预测效度,方法效度,语言测试质量评估,第,三部分,3.,真实性,语言测试的真实性指,目标语言使用任务,特征,( target language use task),与,测试任务特征,( test task),的一致程度。,目标语言使用任务,指通过测试所要预测的被试者在将来工作中为达到一定目的在特定场合用所学语言所进行的一系列活动。,测试任务,指能够考察、预测、判断被试者在将来工作中目标语言使用能力的最佳测试方式。,语言测试质量评估,第,三部分,交互性指被试者在完成一件测试任务,( test task),时所涉及到的个人特征类型,( individual characterist ics ),及程度。,与语言测试最有关的个人特征主要有:,语言能力,(,language ability,其中包括语言知识,language knowledge,、策略能力,strategic competence,或称元认知策略,metacognit ive st rategies ),话题知识,( topical knowledge ),情感图式,( affective schemata),4.,互动性,语言测试质量评估,第,三部分,可行性主要指考试在现实的条件下能否行得通,即可操作性,主观愿望是否符合客观条件的问题。,Available resources,Practicality = -,Required resources,If practicality 1, the test development and use is practical.,(分子大于分母,即可利用资源要大于考试所必需资源),If practicality 1, the test development and use is not practical.,5.,可行性,语言测试质量评估,第,三部分,5.,可行性,制约施考过程的因素有三方面:,人力资源:命题人员、考官、监考人员、阅卷人员等。(足够数量的精通业务的人员),物质资源:考试场地、考试所需的设备,(,录音机、计算机、阅卷机,),、印制考卷的纸张和设备等。,财力:钱。测试对于人力和物力的要求都要有财力的支持才能满足。,语言测试质量评估,第,三部分,6.,后效作用,反拨作用或称反拨效应,(washback effect),是测试对教学和学习产生的影响,这种影响有正面的,也有负面的。,举例:,正面(对老师,;,对学生),负面,(对老师,;,对学生),反思小结,A.,没有一个广泛接受的测试方法,B.,测试通常以有限的行为样本为依据,C.,测试提供的分数总会有误差,D.,难以说明某一心理结构或其他心理结构与测试结果或真实时间之间的关系,E.,中国的特殊国情对于语言测试的考验,反思小结,谢谢,观看,!,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!