推荐文档列表

大学英语四、六级考试的分数解释二

时间:2021-09-07 10:22:08 大学英语 我要投稿

大学英语四、六级考试的分数解释(二)

 

  其中数据输入后的数据处理包括三个部分:

大学英语四、六级考试的分数解释(二)

1)客观题部分首先要作加权处理,加权反映了语言测试设计者对语言能力不同部分的不同要求,反映了对不同教学目标的侧重。大学英语四、六级考试中阅读能力、听力、词汇等各个部分每答对一题的得分都是不同的。在经过加权处理后,还要对客观题部分用IRT(试题响应理论)模型作等值处理,以滤除不同考次间题目难易变化对得分的影响。尽管大学英语四、六级考试的全部题目在实际使用前都要经过“命题—审题—试题项目分析—复审—构卷”的漫长过程,在实考前整个试卷的难易度均已得到控制,但预测是在考生中抽样进行的,与实考结果难免会有所差异,这些差异须要通过IRT等值处理加以滤除,不能因题目难易而影响考生得分,这样做也保证了不同考次之间分数的可比性(见图2);

2)主观题部分,如作文,要通过调整以滤除阅卷员主观因素的影响。

  为了保证阅卷员的阅卷信度(包括阅卷员本人的评分一致性、阅卷员之间的评分一致性、阅卷点之间的评分一致性),大学英语四、六级考试采取了一系列措施,包括制定明确的评分标准、确定评分参照卷(range-finders)、严格的阅前培训、阅卷过程随机抽查等等。在采取以上这些有效措施后依然存在的误差可以称为系统误差,大学英语四、六级考试开发了一套软件系统,根据考生在主、客观题上得分的相关性进行调整,以滤除系统误差。

  事实上,四、六级考试每次要在全国范围内动员1500~2000名教师阅卷,阅卷工作是一种辛苦的付出,阅卷过程有严格的质量控制措施,并且用计算机滤除阅卷员的主观因素,使阅卷信度达到0.87,这在国内各种大规模考试中是很不容易做到的。

3)分数的正态化处理。

  大规模标准化考试的记分体制根据考试目的的不同通常采用正态分制或等级分制。这两种记分体制所表示的分数都带有大量信息,便于用户使用。

  大学英语四、六级考试的性质和目的,决定大学英语四、六级考试是一种尺度相关-常模参照考试(criterion-related norm-referenced test), 其记分体制采用以百分制为形式的正态分制。

  所谓常模参照考试是指以某一常模作为参照系来反映考生成绩的考试,首先要按照某一参照性群体建立常模,通常用均值和标准差来表示;某一考生的成绩是通过他的成绩在常模群体中与其他考生成绩比较的相对位置来表示的。常模参照考试所表示的分数是相对的,只有保持常模的稳定性才能保证分数解释的稳定性。尺度参照考试则要参照一定的尺度对学生进行考核。学生的成绩不是通过与其他考生的比较,而是通过与某种特定的尺度进行比较而得到解释的,学生的成绩必须达到某一尺度方能及格。这种特定尺度的选择或制定是尺度参照考试的关键,对于大学英语四、六级考试来说,这一尺度就是教学大纲中规定的教学要求。但不论哪一种性质的考试,分数的解释必须与某个参照系作比较,才能表示出分数所代表的意义。而常模一经建立,其分数的意义和解释也是确定的,不会发生考生相互影响得分的问题。(未完待续)