从一项调查看大学英语考试存在
大学英语考试及英语专业的全国统考属于教学考试,都是以学期的方式命名的。最低级别的统考(全省统考,大学英语)为三级,最高级别的统考(英语专业)为八级。据调查,四成以上的教师认为目前以学期和专业划分考试的做法有一定的问题,需要重新研究并制定统一的英语语言能力标准。绝大多数教师(94.5%)不赞成按照目前的考试分类标准做下去,只有5%左右的人认为可以按照目前的标准做下去。约30%的人认为,现行各级考试混淆视听,大学英语四、六级和英语专业四、八级考试根本不在同一个等量级上,考试名称却差不多,社会上对这种以学期来划分考试的做法不了解,这些分类不甚明了,不同类型考试的级别在社会上产生了混乱。
广大教师的看法表明,现行统考存在一定问题,需要对其进行必要的改革,以便能更好地评估和指导教学。
大学英语考试自身存在的问题
大学英语考试是1987年开始实施的,设计之初基本上仿照美国ETS的托福考试,在内容的排列组合上参考了国内其他英语考试,基本上属于结构主义类型的测试模式,重视语言知识和语言形式,忽视语言能力的实际运用。例如,他们提出用词汇语法选择的方法来测“语言知识的掌握程度”,用“综合法”测“语言运用能力”(杨惠中金艳,2001)。李炯英(2002)指出:1)四级考试的设计把语言能力看成一个离散的系统,抹煞了语言的本质,因而构卷效度不高。2)有些题型违背了测试目的,例如带四个选择项的完形填空就不是什么完形填空,很难考核语言综合运用能力。作文题型单一,模式固定,与语言的实用性相距甚远,测试材料缺乏真实性影响由测试成绩所做出的推理。此外,语言能力测试项目不全,比如,作为一项语言考试,口语不是必考项目,不符合语言运用的实际情况。近年来,大学英语考试虽然也开发了一些新的题型,但使用率很低,主要还是采用大量四选一客观题。大学英语考试作为全国规模最大、影响最广的一种外语测试,如果不能跟上测试领域新发展而仍然在走老路,不做本质上的改进,这样的测试系统必将成为一种陈腐的机制而误人子弟(肖云南罗晓英,2002)。除了设计理念存在问题外,大学英语考试还存在其他方面的问题。
为求信度牺牲效度
信度与效度是评判测试质量的两个重要标准。语言测试的信度是指测试结果的可靠性和稳定性。效度指“一个测试能测出预定要测量的事物的程度”,表明一种相关性,即测试与测试目标的关联程度。根据结构主义测试学家的传统解释:语言测试的效度是指测试是否测了它所要测的东西;一个测试如果测了它所要测的就是有效度的,否则就是没有效度的;语言测试只要测了语言要素(languageelements)和语言技能(languageskills)就有了内容效度(Lado,1961)。而交际测试理论则强调,一个语言测试效度的高低不仅在于它是否考了它要测的,还在于它测的是什么(Tyler,1971),语言测试的内容应由那些能充分反映受试者语言能力的语言表现(languageperformance)和语言行为(languagebehavior)构成(Bell,1981)。由于结构主义语言学有关语言本质及语用学习过程的理论本身就有问题,因此结构主义语言测试的结构效度受到怀疑。
按照现代语言测试理论设计或开发一项考试,应考虑语言测试行为与语言的实际使用情况相一致,即语言使用任务和情景的特征及测试任务和情景的特征相一致,这样可提高测试的真实性;测试任务越真实,被试的测试行为就会发挥得越好,根据测试结果(分数)对被试者语言能力所做的推论就越准确,因而测试的结构效度就越高。
用以上这些标准去衡量大学英语考试,可以看出其效度是令人置疑的。首先,从考的是什么这个问题来看,现在大学英语考试没有考多少语言的运用和产出能力,因为其80%的题是多项选择。“有证据表明,参加多项选择考试的学生能够学习一些应试技巧使自己的分数`人工地'提高许多”(Aldersonetal.,2000:45)。作为一个教学考试,大学英语考试并没有考到大纲上所规定的“交际能力”。
作为大规模的外语测试,大学英语考试效度低的原因是,考试的设计者为了使测试更具有科学性、更符合一些质量标准而积极地追求信度,因为信度被认为是一种最常规的、传统的、并且容易验证和控制的质量标准。对信度的追求自然牺牲另一个难以琢磨和控制但却更有价值的属性——效度为代价(Skehan,1990)。其主要表现为:测试内容和形式脱离语言运用的实际,重知识轻能力,注重领会性技能(receptiveskills)的考查,忽视产出性技能(productiveskills)的考察。这种偏向在测试题型上的表现是测试以客观题为主,从而导致多项选择题的泛滥使用。语言测试的这种偏向在应试教学的作用下给外语教学带来了严重的负面影响,阻碍了交际能力的培养。