评价既可能促进教育,也可能阻碍教育,其实际上发挥何种作用,最终取决于评价质量。从历史上看,自测验在教育领域得到广泛运用以来,人们就开始认识到其可能带来的负面影响,因此在保障评价质量方面进行了诸多努力。尽管其中有些只是观念而不是一种实践,相关的实践也并不普遍,但这些观念和实践还是能为我们在学校课程实施过程中开展评价监测提供一些启发。 (一)从关注测验本身扩展到关注测验运用 早在1925
年,著名标准化测验编制者鲁赫(Ruch,G.)就呼吁,“测验购买者必须要像食物购买者那样得到保护”[5]。他期望测验出版商能够通过提供相关的信息来接受测验消费者的监督。20
世纪40 年代,美国心理学会(American Psychological
Association,APA)为落实他们制定的测验标准,提议设立测验标准局(Bureau
of Test
Standards),负责测验审查和认证。但在当时这些更多是一种观念或提议,无论是鲁赫的呼吁,还是美国心理学会的提议,在当时都没有得到响应。 1938
年,巴罗斯心理测量研究所(BurosInstitute of Mental
Measurements)启动了一个测验审查项目,对测验出版商出版的测验进行严格的审查和详细的质量分析。[6]1954
年,美国心理学会、美国教育研究会(American Educational Research
Association,AERA)和美国教育测量委员会(National
Council on Measurement in
Education,NCME)共同制定的《关于心理测验和诊断技术的专项建议(Technical
Recommendations for Psychological Tests and Diagnostic
Techniques)》,以及后来的《教育与心理测验标准(Standards
for Educational and Psychological
Testing)》都强调“测验审查”。一些考试机构,如美国教育考试服务中心(Educational
Testing Service,ETS)专门设立了公司质量保证部(Office
of Corporate Quality
Assurance),每三年对教育考试服务中心的每个产品至少审查一次,以保证每一产品都符合他们根据《教育与心理测验标准》制定的标准。[7]