大规模教育考试理论和实践问题课件

上传人:文**** 文档编号:242642603 上传时间:2024-08-30 格式:PPT 页数:166 大小:4.44MB
返回 下载 相关 举报
大规模教育考试理论和实践问题课件_第1页
第1页 / 共166页
大规模教育考试理论和实践问题课件_第2页
第2页 / 共166页
大规模教育考试理论和实践问题课件_第3页
第3页 / 共166页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,大规模教育考试,理论和实践问题,雷 新 勇,上海市教育考试院,大规模教育考试理论和实践问题雷 新 勇上海市教,1,考试考学生什么?,考试分数准确、可靠吗?,考试对所有的考生公平、公正吗?,考试的价值观与社会的公认价值观一致吗?考试对学校的教育、教学有正面的作用吗?,大规模教育考试关注的基本问题,考试考学生什么?大规模教育考试关注的基本问题,2,抽象出的考试理论和实践问题,考试的信度可靠性或分数的误差,考试的效度考试的有效性或对考试结果的解,释和适用是否适当、有效。,考试的公平、公正性考试平等对待所有考生,考试的后效影响考试对社会价值观、对学校,教育教学有何影响,抽象出的考试理论和实践问题,3,教育考试的心理学基础基本假设,假设1:人的心理特质是存在的,心理特质:一个个体与其他个体不同的、可以识别的、相对稳定的特征(Any distinguished, relatively enduring way in which one individual varies from another) 。例如,人的智力、认知方式、适应性、兴趣、态度、价值观、一般个性、特殊个性等,根据对人的行为样本的观察可以确定心理特质及其强度。,观察方式:direction observation,analysis of self-report statements,testing,教育考试的心理学基础基本假设假设1:人的心理特质是存在的,4,教育考试的心理学基础基本假设,假设1:人的心理特质是存在的,心理结构(construct):an informed, scientific,concept to explain behavior.,知识与技能、过程与方法、情感、态度和价值观,相对稳定(relatively enduring):,个体在某种程度上表现出某一特质是具有环境依赖性的.,一个个体与其他个体不同的特征(one individual varies from another):心理特质的这个属性说明心理特征是一个相对现象,在教育和心理测试与评价中,评价者也要将对象的评价情况与假设的一般人,做出比较,或者直接将同一评价群体中的不同个体作比较。,教育考试的心理学基础基本假设假设1:人的心理特质是存在的,5,教育考试的心理学基础基本假设,假设2:心理特质或心理结构是可以量化并且测量的,定义心理结构,行为目标:根据什么样的行为来判断对象具备的心理结构的强度。,如何使考生表现出要观察的行为:用何内容的试题,如何对行为进行量化:赋分,如何用数学模型进行处理,教育考试的心理学基础基本假设假设2:心理特质或心理结构是,6,教育考试的心理学基础基本假设,假设3:与考试相关的行为可以预测非考试相关的行为,预测什么非考试环境下的行为,?,高考:高等教育条件下的行为,考试中,创造哪种测试环境,英语:真实的交际语言环境,数学:抽象的、academic circumstances,物理:真实的、抽象的、academic、experimental,化学:真实的、抽象的、academic、experimental,地理:真实的、earth-related,教育考试的心理学基础基本假设假设3:与考试相关的行为可以,7,教育考试的心理学基础基本假设,假设4:每种测试方法或技术都有其优势和弱势,Paper and pencil Testing,Oral Test,Interview,Class Observation,School Observation,常模参照和标准参照考试,教育考试的心理学基础基本假设假设4:每种测试方法或技术都,8,教育考试的心理学基础基本假设,假设5:测量过程中必然会产生误差。,误差是指测量心理结构以外的因素所产生的效应。,教育考试中考生的行为表现除受到测量的心理结构影响外,还会受到其他因素的影响,这些因素所产生的效应就是误差。,误差是所有测量过程一定存在的。,误差是测量过程必须要考虑的一个变量,由该变量产生的分数变化称为误差方差。,经典的真分数理论、概化理论、项目反应理论,教育考试的心理学基础基本假设假设5:测量过程中必然会产生,9,教育考试的心理学基础基本假设,假设6:测试和评价可以是公平的、无偏的,这是心理测量领域争议最大的一个假设,公平、无偏就是要平等地对待每一个考生,无论其性别、民族、居住地如何;考生的与测量的心理结构无关的个性特征对考试结果以及结果的解释没有明显的影响。,公平、无偏的关键是所有考生对测试、评价有足够的了解,教育考试的心理学基础基本假设假设6:测试和评价可以是公平,10,教育考试的心理学基础基本假设,假设7:测试和评价可以造福社会,没有测试和评价就没有甑别,就会出现社会混乱,。,学校教师无法诊断、无法因材施教,社会无法选择适合各行各业的人才,测试和评价可以对社会的价值观产生影响,测试和评价可以对学校的教育、教学产生积极影响。,教育考试的心理学基础基本假设假设7:测试和评价可以造福社,11,考试的效度有效性,效度是指各种证据和理论对考试结果的解释和使用的支持程度。,有效性是一种价值判断,建立价值判断的标准,收集支持价值判断的证据,标准,测量目标,证据来源,考试大纲、试题、试卷、考试 结果数据等。,证据类型,内容、应答过程、内部结构、与其它变量的关系、考试的后果。,考试的效度有效性效度是指各种证据和理论对考试结果的解释和,12,课程标准,课程标准中学习目标的基本要求,可评估性,可理解性,可执行性,可完成性,教育考试的测量目标来源,课程标准教育考试的测量目标来源,13,中外课程标准学习目标的对比,美国课标,中国课标,注重目标好,内容规定较笼统,教学建议较笼统,无教材编写建议,目标规定较笼统,内容规定很细,有教学建议,有教材编写建议,教材编写目标明确,教学目标明确,需要选择教材或内容,课难上,好评价,教材与目标不完全一致,不太关注总的教学目标,不需要选择教材或内容,课好上,不太好评价,三个层次的目标体系,目标层次混乱,中外课程标准学习目标的对比美国课标中国课标注重目标好内容规定,14,考试的测量目标构成,测量目标Goals,Goals are broad statements which specify what the students are supposed to be able to know and to do.,具体目标Objectives,Objectives are specific statements which specify what behaviors the students are supposed to show to demonstrate their knowledge and abilities.,表现水平标准Performance Standards,Performance Standards specify how good of the students behaviors is good.,考试的测量目标构成测量目标Goals,15,考试的效度证据类型,考试或试卷的内容,应答过程,内部结构,与其它变量的关系,考试的后果,考试的效度证据类型,16,考试的效度内容方面的证据,试卷覆盖的学科知识、学科的思维方法(过程)、学科的(实验)技能的主要行为;这些行为是否进行了适当的描述;,这些需要由学科专家和测量专家共同做出的判断。,试题样本是否适当地代表一定的内容领域。,这一证据主要关注的是试题内容的代表性,即试题覆盖的学科知识、学科的思维方法(过程)、学科的(实验)技能等,是否足以反映学科知识、思维方法和(实验)技能。,考试的效度内容方面的证据试卷覆盖的学科知识、学科的思维方,17,考试的效度应答过程方面的证据,考生的应答或在考试中的表现与考试欲测量的心理结构的一致程度,这一证据主要通过观察、交流以及应答结果分析获得。,考生应答过程的理论和经验分析,这个证据需要既有学科背景,又有测量学背景的专家来分析,考生应答过程的观察记录,考试的效度应答过程方面的证据考生的应答或在考试中的表现与,18,考试的效度应答过程方面的证据,试题及试题包测量的行为与考试欲测量的心理结构的一致程度,试题要有明确的测量具体目标,命题要按照确定的具体目标命题,要对命题教师命制的试题,尤其是设问进行检查,要对试题的具体目标与总的测量目标的一致性进行评价,内部结构统计结果,试题包之间的相关关系,因子分析结果。,考试的效度应答过程方面的证据试题及试题包测量的行为与考试,19,考试的效度与外部变量关系的证据,考试分数与外部变量之间的关系所揭示出的与考试欲测量的心理结构之间的关系,对大规模教育考试而言,外部变量主要是指与考试测量的心理结构相关或不同的变量。,一致性关系(convergent evidence),不一致性(discriminant evidence),心理结构A成绩,心理结构A,成绩,心理结构,B,成绩,心理结构,A,成绩,考试的效度与外部变量关系的证据考试分数与外部变量之间的关系,20,考试的效度与外部变量关系的证据,考试与标准测试之间的关系,关注考试结果可以多大程度上准确地预测考生在标准测试中的行为,。,预测有效性,同期有效性,现在的考试成绩,未来考试成绩,现在的考试成绩,同期考试成绩,考试的效度与外部变量关系的证据考试与标准测试之间的关系,关,21,考试的信度传统的认识,信度不同测量的一致性,Temporal stability 相关系数r,Form equivalence 相关系数r,Internal consistencyalpha信度系数,内部一致性信度,内部一致性系数一般是指Cronbach系数、KR-20系数或分半系数,最广泛使用的是Cronbach系数,Cronbach系数,信度是效度的前提条件,没有高的信度就没有高的效度,考试的信度传统的认识信度不同测量的一致性,22,考试分数的信度 经典的真分数理论,基本方程,观察分数,真分数,误差分数,考试分数的信度 经典的真,23,考试分数的信度 经典的真分数理论,信度系数的解释(Nunaally 1967),信度系数,解 释,0.90或以上,信度很好,达到了最好的标准化测试的水平。,0.80到0.90,对学校测试而言,已经是非常好了。,0.70到0.80,对学校测试而言,大部分试题都很好;可能有少数试题需要改进。,0.60到0.70,信度偏低,需要补充其他测试以确定分数或等第。部分试题可能需要改进。,0.50到0.60,信度低。建议对试卷进行修改,除非试卷的试题量很少(10题或少于10题)。需要补充其他考试来可靠地确定分数或等第,小于0.50,信度有问题。考试基本无效,需要修改。,考试分数的信度 经典的真,24,考试的信度新的认识,不能再将Cronbach系数公式看作是检查大部分考试数据可靠性的最适宜方法 。,标准测量误差 是衡量考试结果可靠性的唯一指标。,根据考试结果使用的目的设置可以接受的最低测量误差,最低测量误差决定了试卷的结构,如试题的数量、试题的题型及其比例等等。,试题样本采集的独立性,局部独立,测试内容的不均匀性,单维/多维评价结果可靠性的方法不一样,如何使用测试结果,绝对决策/相对决策,考试的信度新的认识不能再将Cronbach系数公式看作是,25,考试的信度新的实践,首先根据考试结果使用的目的确定可以接受的测量误差,正式考试推出前,要试测,抽出代表性样本,检查试测卷的测量误差,以便对试卷结构进行修改。,命题之前要根据分数合成的要求,确定试卷的维度。,单一合成分数单维试卷,多维试卷根据测量的能力目标、内容领域分别报道分数。试题难度、区分度、测量误差的评价方法不一样。,命题中要避免局部依赖性,相当部分试卷都存在这种情况,常模参照考试与标准参照考试测量误差评价方法不一样。,考试的信度新的实践首先根据考试结果使用的目的确定可以接受,26,经典的真分数理论中 测量的标准误差与信度的关系,CTT中考试的标准差与信度、测量的标准误差关系,0,1,2,3,4,5,6,7,8,1,2,3,4,5,6,7,8,9,考试的标准差,测量的标准误差,r=,0.85,r=,0.90,r=,0.95,经典的真分数理论中 测量的标准误差与信度的关系CTT,27,考试的信度概化理论,误差方差是多来源的,评分者,试题,其它,概化理论的重要贡献之一,就是研究不同来源的误差,考试的信度概化理论 误差方差是多来源的评分者试题其它概化,28,典型的考生分数变化可以归结为以下因素:,概化理论通过估计出这些来源的方差,就可以对这些方差作出比较,确定不同来源的方差对考生分数方差的贡献。对一个信度较高的考试,其全域分数方差要大,其他来源的方差(潜在的误差方差)要小。,2,(,X,pir,)=,2,(,p,)+,2,(,i,)+,2,(,r,)+,2,(,pi,),+,2,(,pr,)+,2,(,ir,)+,2,(,pir,),考生方差,试题方差,评分者方差,交互作用方差,考试的信度概化理论,典型的考生分数变化可以归结为以下因素:概化理论通过估计出这些,29,相对误差方差,考试的信度概化理论,概化系数,可靠性指数,绝对误差方差,相对误差方差考试的信度概化理论 概化系数可靠性指数绝对误,30,这些系数和误差方差是我们研究考试分数可靠性、控制测量误差、对考试作出改进的主要依据。,相对误差方差,考试的信度概化理论,绝对误差方差,这些系数和误差方差是我们研究考试分数可靠性、控制测量误差、对,31,考试的信度项目反应理论,可以估计每个考生的能力水平能力分数,真分数理论和概化理论均不能估计被试个体的能力水平。两种方法都是围绕观察分数,确定一个置信区间内,合理的推测被试个体的能力水平真分数或全域分数位于该区间之内,区间的大小是由置信度和测量误差共同确定的。,确定置信区间时,是以被试群体的表现为基础的,因此无论被试个体的能力是高,还是低,或是中等,置信区间对每个被试是相同的。,如果测量同一特质的试题数达到一定的数量,则被试的能力估计就与考试采用的试题无关。,如果用来进行参数估计的样本达到一定的数量,则估计出的试题参数就与估计采用的样本无关。,试题和考试提供的信息量或试题和考试的测量精度与考生群体无关。,考试的信度项目反应理论可以估计每个考生的能力水平能力,32,考试的信度项目反应理论,考试信息函数:,试题信息函数,:,两参数模型,:,三参数模型,:,考试的信度项目反应理论考试信息函数:试题信息函数: 两参,33,考生能力估计值的标准误差,确定能力分数的测量误差,考试的信度项目反应理论,考生能力估计值的标准误差确定能力分数的测量误差考试的信度,34,大规模教育考试理论和实践问题课件,35,考试的公平性,考生的与测量的心理结构无关的个性特征对考试结果以及结果的解释没有明显的影响,不同的考生群体,如男、女考生,城市与农村或郊区的考生,不同省市的考生之间考试结果的统计差异只能是由考试要测量的心理结构的差异引起的,其他因素对其没有明显的可以探测出的影响。,试题的情景材料,包括有声、图像材料,对所有的考生群体都是公平的。,所有考生都能同等地获取考试的信息,考生不会因为其所就读的地区、学校的差异,生活的家庭的差异,不能同等地获得考试的相关信息。,考试的公平性考生的与测量的心理结构无关的个性特征对考试结果以,36,试题功能偏差(,DIF &,DTF),不同子群体分数有明显差异,或者分数相近但能力测度有明显差异,差异来源,能力上的差异两个群体的确有差异,试题功能偏差试题或试卷对不同子群体不公平,试题或试卷功能偏差,试题或试卷的多维性,对试题或试卷进行多维性分析,影响维度与测量的心理结构相关的维度,干扰维度与测量的心理结构无关的维度,试题功能偏差(DIF & DTF)不同子群体分数有明显差异,,37,考试的公平性试题功能差异,考试的公平性试题功能差异,38,考试的公平性试题功能差异,PD,DL,考试的公平性试题功能差异PDDL,39,考试对社会、学校教育教学的影响,大规模教育考试结果的使用会对社会、对学校的教育、教学产生深刻的影响。,大规模教育考试本身的情景材料、内容、题型、难度以及蕴含在其内容、材料以及考查目标中的价值观,对社会、对学校教育、教学也会产生巨大影响。,考试目标的设计、试题情景材料的选择、试题的设问等不但要考虑其测量学要求,也要考虑其蕴含的价值观是否与社会的主流价值观相一致,从教育的角度看是否有积极意义。,考试的学科内容、题型、难度既要符合测量学要求,又要考虑有利于学校按照课程标准要求组织教育和教学,有利教师改进教学策略和教学方式,提高教育和教学质量;有利于学生改进学习方式,提高学习效果。,考试对社会、学校教育教学的影响大规模教育考试结果的使用会对社,40,理论问题引发的实践思考,命题的问题,效度,题 型,题 量,内 容,(知识技能,过程方法),目标和行为标准,难度和区分度,及格和等第标准,情 景 材 料 选 择,公平公正,信度,后效影响,试卷结构,评分标准和评分操作,理论问题引发的实践思考效度题,41,试卷结构 测量目标和内容领域问题,试卷层面的问题,试卷要测量哪些目标、覆盖哪些行为标准?,在哪些知识内容领域测量该目标?,每一测量目标、行为标准和内容领域的题量?,试题层面,试题要测量何具体目标?,在哪个知识内容领域测量该目标?,如何设问才能引导学生表现出期望表现的行为?,(排除法只是考试技巧,不是测量的目标或行为标准),试卷结构 测量目标和内容领域问题试卷层面的,42,试卷结构难度问题,考试的难度问题是科学问题,也是社会问题,。,难度影响到考生分数分布,因此影响到招生录取决策误差。,难度影响学生和家长的应试心理,因此影响社会稳定,难度影响学校教学深度和广度,影响学生学习的深度和广度。,难度涉及到两个层面,试卷层面,试题层面,试卷结构难度问题考试的难度问题是科学问题,也是社会问题。,43,难度科学问题,难度对考生成绩分布的影响,难度系数为0.5时,考生成绩大致呈正态分布,试卷的标准差也相应大致达到最大,此时,考生成绩在平均分两侧的分布最分散。因此,依据考试成绩对考生进行选择决策时,发生决策误差的人数也会最少。,难度系数越高,考生成绩越向高分一端集中,分布范围变小,因此,依据考试成绩对考生进行选择决策时,发生决策误差的人数也会增多。,难度科学问题难度对考生成绩分布的影响,44,难度科学问题,0,500,1000,1500,2000,0,20,40,60,80,100,110,130,150,考试分数,人数,图11.3 考试分数概率分布(平均分105,标准差17),图11.1 考试分数概率分布(平均分75,标准差20),0,500,1000,1500,2000,0,20,40,60,75,90,110,130,150,考试分数,人数,难度科学问题0500100015002000020406,45,难度科学问题,曲线1:均分423,难度系数0.67;曲线2:均分378,难度系数0.60;曲线3:均分315,难度系数0.50;实线相当于第一批分数线位置;虚线相当于第二批分数线位置。,曲线1,曲线3,曲线2,图4,选择决策卡帕指数与考试平均分、录取分数线的关系,0.80,0.85,0.90,0.95,1.00,270,290,310,330,350,370,390,410,430,450,470,490,510,530,分数,卡帕指数,难度科学问题曲线1:均分423,难度系数0.67;曲线2,46,试卷结构试题难度,4.00,3.50,3.00,2.50,2.00,1.50,1.00,.50,0.00,-.50,-1.00,-1.50,-2.00,-2.50,20,10,0,试题难度参数分布,图11.5 样本考生能力参数分布,频数,2.00,1.50,1.00,.50,0.00,-.50,-1.00,-1.50,-2.00,-2.50,-3.00,频数,300,200,100,0,考生能力参数分布,试卷结构试题难度4.003.503.002.502.00,47,试卷结构试题难度,试卷结构试题难度,48,20,40,60,80,100,120,0.2,0.4,0.6,0.8,1.0,试卷长度(题数),信,度,图1 试卷长度与信度关系(据谢小庆 2019),试卷结构题量,204060801001200.20.40.60.81.0试,49,平行试题模型法,真分数等值试题模型,试卷结构题量的计算,),1,(,1,2,1,2,X,m,i,i,m,m,m,s,s,a,=,-,-,=,平行试题模型法真分数等值试题模型试卷结构题量的计算),50,多元概化理论模型,试卷结构题量的计算,全卷最佳题量,部分最佳题量,常模参照考试,标准参照考试,全卷最佳题量,部分最佳题量,=,n,n,n,n,n,n,s,s,),(,),(,2,2,pi,w,pi,w,n,n,i,i,=,n,n,n,n,n,n,s,),(,96,.,1,2,2,2,pi,w,n,n,N,i,+,=,n,n,n,n,n,n,n,s,s,),(,),(,96,.,1,2,2,2,2,pi,i,w,n,n,N,i,+,+,=,n,n,n,n,n,n,n,n,s,s,s,s,),(,),(,),(,),(,2,2,2,2,pi,i,w,pi,i,w,n,n,i,i,多元概化理论模型试卷结构题量的计算全卷最佳题量部分,51,试卷结构题量的计算,大 题,听力,语法,词汇,CLOZE,阅读,翻译,过 去,20,20,10,35,5,理论,情况,常模,参照,条件,21,10,5,39,10,85+1,标准,参照,条件,26,11,5,40,13,95,现,在,常模,参照,24,20,40,6,90+1,试卷结构题量的计算大 题听力语法词汇CLOZE,52,大规模教育考试:命题与评价(2019),考试数据的统计分析和解释(2019),雷新勇,华东师大出版社,大规模教育考试:命题与评价(2019),53,试卷结构题型,题型代表了测量方法,它与教育考试关注的核心问题密切相关。,题型与考试的效度和信度有相当强的关系。,大规模教育考试的题型对学校的教学方式和教学训练方式有明显的影响。,从经济的角度看,大规模教育考试题型对评分的成本也有很大的影响。,最常见的题型分类:客观题、主观题,试卷结构题型题型代表了测量方法,它与教育考试关注的核心问,54,试卷结构客观题与主观题的比较,客,观,型,主,观,型,测量的学,能有效地测量事实性知识。某些,能够测量理解、思维技能和其他复杂,习成果,题型也能测量理解、思维技能和,的行为目标。测量与现实贴近的行为,其他复杂的行为目标。但是不适,目标比较有效,但不适合用来测量事,合测量选择和组织观点的技能、,实性知识。,写作能力或某些问题解决技能。,命题的,考试所,需的试题,量,较大,命题时,考试要求的题量少,命题相对比较容,准备,间长,难度比较大。,易,内容领,由于试题量较大,内容覆盖面较,由于考试的试题量较少,内容覆盖面,域样本,广,考试内容领域样本代表性较,较小,考试内容领域样本的代表性有,好。,限。,对学生应,完全结构化的试题限制了考生的,考生可以按照自己的理解进,行自由应,答的控制,应答类型,能够防止许多非测量,答,可以使考生表现自己的创造力,,目标因素,如写作能力的影响,,有效地减少猜测的概率。,但选择题有一定的猜测概率。,试卷结构客观题与主观题的比较,55,试卷结构客观题与主观题的比较,评分 客观,信度高,试题越严谨, 主观评分,多人评分的不一,误差越小。 致,降低了评分结果的信,度,增加了误差。,对学习 通常鼓励考生掌握具体的 鼓励学生关注大的内容单元,,的影响 细节内容,注重对具体概 注重对所学内容的整合和建构。,念、原理的区分。如果试 强调组织、整合和有效表达思,题设计的好,也可以促进 想的能力。,学生发展理解力,思维能,力以及其他的高级认知能,力。,信度 考试设计的越严谨,结果 信度通常低于客观题型,主要,信度越高。 是因为评分信度较低以及试题,数量有限。,试卷结构客观题与主观题的比较评分 客观,信度,56,试卷结构题型选择的原则,从认知特征、试题和考试的特征以及考试的经济性来看,每种题型都有其优势,也有其缺点,任何一种题型都不能独自完成所有的教育测量目标。因此,考试中应该采用多种题型,发挥每种题型的优势,减少其劣势。,如果两种题型的测量结果有很强的类似性时,选择测量效率高的题型(通常是选择型题型)是合理的;如果两种题型的测量结果类似性比较低时,应该考虑试题的在认知过程、内容等方面与测量目标的一致程度,通常选择一致程度高的题型建构型题型。,试卷结构题型选择的原则从认知特征、试题和考试的特征以及考,57,题型的选择要考虑试题测量的行为或者认知过程、涉及到的内容以及需要的条件,即题型应该与测量目标的行为要求一致。这反映了考试的效度为第一考虑的观点。,题型的选择要保证考试结果达到预先设定的信度要求,即必须考虑不同题型试题的比例。这反映了考试结果的高信度是考试高效度前提的认识。,题型的选择要考虑学校课堂教学方式和学生学习方式的转变,题型要考虑反映高质量的教学活动和学习活动。,试卷结构题型选择的原则,题型的选择要考虑试题测量的行为或者认知过程、涉及到的内容以及,58,试卷结构材料选择,考试学校学习结果的迁移。,学科性的考试主要是专门迁移。,专门迁移成功与否取决于两个条件:,考生对相关知识,如概念、原理的理解及其本身的思维,能力;,考生对迁移的新情景的熟悉程度。,试题背景材料选择不当,易于导致出现试题的功能偏差,降低考试的效度和信度。,试卷结构材料选择考试学校学习结果的迁移。,59,材料应该与考试的测量目标以及试题欲测量的行为目标相关,材料应该与考生的学习经历和生活经历相适应,材料提供的信息类型,有新知识信息,无新知识信息,材料的信息量,材料提供的信息与应答间的关系,关系的范围指的是完成试题的应答,必须加工、处理的信息的数量,包括宽泛范围和狭窄范围。,关系的直接性是指期望的应答对所提供的信息的依赖程度,。,试卷结构材料选择的基本原则,材料应该与考试的测量目标以及试题欲测量的行为目标相关 试卷结,60,主观题评分标准的制定,赋分,赋分值与等第,选择最合适于试题和评价目的的评分方法,总体评分法分值稍低的、测量目标较单一的试题,分析评分法高分值的、测量目标非单一的试题,评价的行为特征应该与测量的行为目标相一致,在分析评分法中,每个评分项目一般应只包含一个独立的行为特征,要明确评价的行为特征等级数,对评价的行为特征和标准中的每个等级应该进行清楚的定义,主观题评分标准的制定赋分,61,Thank you,Thank you,62,蒙大拿州数学课程标准,能够运用适当的技术,参与到解决问题、推理、估算、交流、联系和应用的数学过程中。,能够理解和运用各类数和各类数的运算。,能够运用各种代数的概念、过程和语言来模拟和解决真实问题和数学问题。,能够理解几何图形,运用几何学原理。,理解可测的特质,并能够运用测量过程解决问题.,能够理解和运用数据分析、概率和统计原理解决问题。,能够理解、运用各类模型、关系和函数。,蒙大拿州数学课程标准能够运用适当的技术,参与到解决问题、推理,63,蒙大拿州数学课程标准,能够运用适当的技术,参与到解决问题、推理、估算、交流、联系和应用的数学过程中。,根据数学或非数学情景,确认和形成问题;并运用解决问题策略来解决这些问题。,在问题解决过程中,选择、应用和评价适当的估算策略。,形成定义,做出推断并对推断的合理性进行判别,表达各类概括和推广,交流各类数学思想和关系。,对同一问题情景或同一数学概念的不同表达方式进行转换和应用;对非数学学科的问题情景建立数学模型。,选择和运用适当的数学技术来加强数学理解。适当的技 术可以包括,但不仅限于,纸、笔、计算器、计算机和数据收集装置。,蒙大拿州数学课程标准能够运用适当的技术,参与到解决问题、推理,64,蒙大拿州数学课程标准,能够理解和运用各类数和各类数的运算。,理解和运用实数,及其运算、符号、和实数范围的其他数。,运用复数的定义和基本运算。,蒙大拿州数学课程标准能够理解和运用各类数和各类数的运算。,65,蒙大拿州数学课程标准,能够运用各种代数的概念、过程和语言来模拟和解决真实问题和数学问题。,运用代数表示各种模型变化。,运用代数表达式的基本运算。,解代数方程和不等式:线形方程、四次方程、指数方程、,对数方程和幂函数方程。,解代数方程组、不等式组,包括运用矩阵。,运用代数模型来解数学问题和真实问题。,蒙大拿州数学课程标准能够运用各种代数的概念、过程和语言来模拟,66,蒙大拿州数学课程标准,能够理解几何图形,运用几何学原理。,构筑和解释三维物体,绘制三维物体图形。,根据全等、相似对图形进行分类,并运用这些关系。,能够进行综合法和坐标法之间的转换。,在问题解决中,运用转换、坐标和矢量来推导图形的性质。,运用三角函数(正弦、余弦、正切)解与三角有关的问题。,蒙大拿州数学课程标准能够理解几何图形,运用几何学原理。,67,蒙大拿州数学课程标准,理解可测的特质,并能够运用测量过程解决问题.,运用间接测量的概念。,运用维度分析检查过程的合理性。,研究导出的测量单位系统。,适当地运用测量中估计、误差、容忍度和精确度的概念。,蒙大拿州数学课程标准理解可测的特质,并能够运用测量过程解决问,68,蒙大拿州数学课程标准,能够理解和运用数据分析、概率和统计原理解决问题。,根据数据运用曲线拟合方法进行预测。,运用趋中测量参数,理解变化和相关的概念。,对一定统计分析选择适当的采样方法。,运用实验概率、理论概率和模拟方法表示和解决问题,包,括期望值问题。,设计统计实验来研究问题,交流成果。,用一般的术语描述正态曲线,用正态曲线的性质回答有关假定是正态分布的各类数据的问题。,蒙大拿州数学课程标准能够理解和运用数据分析、概率和统计原理解,69,蒙大拿州数学课程标准,能够理解、运用各类模型、关系和函数。,运用图形、数字、物理的、代数的和语言的数学模型和表示方法,来描述函数和反函数。,分析多项式函数、有理函数、幂函数、指数函数、对数函,数和周期函数图形。,分析参数变化对函数图形的影响。,用各种函数来建立真实问题模型。,将作图技术应用于参数方程、三维方程和递归关系。,蒙大拿州数学课程标准能够理解、运用各类模型、关系和函数。,70,蒙大拿州数学课程标准 -表现水平标准,高级水平:在数学领域达到高级水平的毕业生应该能够展示:,能够自我激励,独立学习;能够拓展和联系各种思想。,能够准确、清晰和有效地应用所有数学过程。,有效地运用多种策略,将各种概念拓展到新的情境中,并且熟练地交流成果。,探索假定的问题,使用复杂的推理操作各种有效论证,形成各种证据。,运用适当的技术、应用函数、图形和代数的概念解决真实和理论问题。,应用复杂的测量以及几何、代数关系模拟各种问题和情境。,根据数据、概率和统计一致性地做出准确、合理的预测和决策。,能够确认数学学科内以及学科外各种问题的相互联系。,蒙大拿州数学课程标准 -表现水平标,71,蒙大拿州数学课程标准 -表现水平标准,熟练水平:在数学领域达到熟练水平的毕业生应该,能够展示:,一致性地、正确地应用各种数学过程,解决各种问题,交流各种成果。,在各种情境下应用数学过程。,一致性地使用各种技术,应用函数、图形和代数概念解决真实和理论问题。,运用复杂的推理,使用适当的数学思想,形成各种逻辑论证和证据。,一致性地应用复杂的测量和几何、代数关系模拟各种问题和情境。,根据数据、概率和统计做出合理的预测和决策。,能够确认数学学科内以及学科外各种问题的相互联系。,蒙大拿州数学课程标准 -表现水平标,72,蒙大拿州数学课程标准 -表现水平标准,准熟练水平:在数学领域达到准熟练水平的毕业生应该部分掌握了熟练水平必须的预备知识和基本技能。,应用不完全或不正确的数学过程解决问题,且常常是不准确的。,能够交流数学思想,有时能够拓展数学思想,但常常不准确。,有时能够理解和使用适当的技术,运用函数、图形和代数概念解决真实问题和数学问题。,在确认复杂的测量以及几何、代数关系方面有时会有困难,导致产生不准确性。,有时能够根据数据、概率和统计做出预测和决策,但常常不准确。,能够做出各种联系,但不能拓展或证明这些联系,论证常常缺乏适当的数学思想的支持和严格的推理。,蒙大拿州数学课程标准 -表现水平标,73,蒙大拿州数学课程标准 -表现水平标准,初级水平:在数学领域达到初级水平的毕业生刚刚开始获得数学领域美中要求必须的预备知识和基本技能。,能够有限地、不完全地使用各种数学过程和问题解决策略。,常常使用有限的和不完全的推理,形成逻辑论证,交流数学思想。,只能做出一些具体的,数学联系。,很少使用适当的技术,运用函数、图形和代数概念解决问题。,确认一些有限的复杂测量、几何关系和性质。,根据数据做出有限的预测和决策,但是很少能够确认统计或概率的概念。,蒙大拿州数学课程标准 -表现水平标,74,中国高中数学课程标准,高中数学课程的总目标,使学生在九年义务教育数学课程的基础上,进一步提高作为未来公民所必要的数学素养,以满足个人发展与社会进步的需要。,中国高中数学课程标准高中数学课程的总目标,75,获得必要的数学基础知识和基本技能,理解基本的数学概念、数学结论的本质,,了解概念、结论等产生的背景、,应用,体会其中所蕴涵的数学思想和方法,,以及它们在后续学习中的作用。通过不同形式的自主学习、探究活动,体验数学发现和创造的历程。,提高,空间想像、抽象概括、推理论证、运算求解、数据处理等基本能力。,提高,数学地提出、分析和解决问题(包括简单的实际问题)的能力,数学表达和交流的能力,,发展,独立获取数学知识的能力。,发展,数学应用意识和创新意识,力求对现实世界中蕴涵的一些数学模式进行思考和作出判断。,提高学习数学的兴趣,树立学好数学的信心,形成锲而不舍的钻研精神和科学态度。,具有一定的数学视野,逐步认识数学的科学价值、应用价值和文化价值,形成批判性的思维习惯,崇尚数学的理性精神,体会数学的美学意义,从而进一步树立辩证唯物主义和历史唯物主义世界观。,中国高中数学课程标准,获得必要的数学基础知识和基本技能,理解基本的数学概念、数学结,76,上海市高考数学测量目标,数学的基础知识和基本技能,数学思维能力,运算能力,空间想象能力,分析问题和解决问题的能力,上海市高考数学测量目标,77,上海市高考数学测量目标 行为标准,数学的基础知识和基本技能,概念、公理、定理、法则、性质、公式以及其中蕴涵的数学思想和方法。,按照一定的程序与步骤进行运算、数据处理和绘制图、表的技能。,思维能力,对数学问题或资料进行观察、分析、综合、比较、抽象、概括、探索和创新的能力。,运用归纳、演绎和类比的方法进行推理,并正确地、有条理地表述推理过程的能力。,空间想象能力,由较复杂的图形分解出简单的、基本的图形,在基本的图形中找出基本元素及其相互关系的能力。,根据条件画出简单空间图形的能力。,分析问题和解决问题的能力,阅读理解陈述的材料,用数学语言正确地表述数量关系,,运用有关数学知识、思想方法分析问题和解决问题。,上海市高考数学测量目标,78,英语阅读课程目标,Content Standard 1Students construct meaning as they,comprehend, interpret, and respond to what they read.,Content Standard 2Students apply a range of skills and,strategies to read.,Content Standard 3Students set goals, monitor, and evaluate,their progress in reading.,Content Standard 4Students select, read, and respond to,print and nonprint material for a variety of purposes.,Content Standard 5Students gather, analyze, synthesize, and,evaluate information from a variety of sources, and,communicate their findings in ways appropriate for their,purposes and audiences.,英语阅读课程目标 Content Standard 1St,79,英语阅读课程目标,When reading, students will:,1. make predictions and describe inferences and connections within material and between new material and previous information /experiences.,2. integrate new important print/nonprint information with their existing knowledge to draw conclusions and make application.,3. provide oral, written, and/or artistic responses to ideas and feelings generated by the reading material, providing examples of the way these influence ones life and role in society.,4. demonstrate understanding of main ideas and formulate arguments using supporting evidence.,5. accurately paraphrase reading material, reflecting tone and point of view.,英语阅读课程目标When reading, students,80,英语阅读课程目标,Advanced:,(a) is self-motivated, an independent learner, and extends and connects ideas;,(b) describes abstract themes and ideas in the overall reading material;,(c) consistently makes, confirms, and revises complex predictions, supports inferences,and analyzes and evaluates causal relationships when reading increasingly complex,material;,(d) consistently and accurately paraphrases, formulates complex arguments with strong,supporting evidence, and responds thoroughly, thoughtfully, and creatively to,reading material;,(e) effectively monitors and flexibly uses a variety of strategies to interpret the language,literary characteristics, and overall intent of print and nonprint material;,(f) uses an enriched reading vocabulary beyond the twelfth grade;,(g) successfully monitors his/her own reading progress;,(h) consistently sets ambitious reading goals as he/she selects, analyzes, and evaluates;,(i) self-selects material appropriate to a variety of reading purposes; and,(j) consistently applies complex thinking skills as he/she gathers, uses, and responds to,information from a variety of sources.,英语阅读课程目标Advanced:,81,英语阅读课程目标,Proficient,makes, confirms, and revises predictions, explains inferences, and,analyzes causal relationships when reading material appropriate to twelfth grade;,(b) usually paraphrases accurately, formulates arguments with supporting,evidence, and responds creatively to reading material;,(c) monitors and uses a variety of strategies to interpret the language, literary characteristics, and overall intent of print and nonprint material;,(d) uses a substantial reading vocabulary appropriate to twelfth grade;,(e) monitors his/her own reading progress;,(f) sets and consistently meets reading goals;,(g) selects, analyzes, and evaluates material appropriate to a variety of reading purposes;,(h) applies complex thinking skills as he/she gathers, uses, and responds to information from a variety of sources; and,(i) analyzes the authors uses of literary devises.,英语阅读课程目标Proficient,82,Nearing Proficiency,makes predictions, identifies inferences, and describes causal relationships when reading material appropriate to twelfth grade;,frequently paraphrases accurately and formulates arguments with limited supporting evidence;,monitors his/her reading, but uses a limited variety of strategies to interpret the language, literary characteristics, and overall intent of print and nonprint material;,uses a limited twelfth-grade reading vocabulary;,monitors his/her own reading progress and often sets reading goals while selecti
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!