“戴维森教授,既然你那么聪明,你准备如何改变当前的评估手段?”博客的评论似乎都在问这个问题。与许多优秀的教师共事很长时间以后,我有一些想法。
首先,我会马上停止对美国公立学校进行强制性的年终考试。这些考试与孩子所需要的真正的学习毫不相关,对学生和老师都没能提供有益的反馈,相反,考试的失败后果会成为压在学生肩上的负担。年终考试已经变成了常规的义务,就像纳税一样,可是没有人愿意将孩子们培养成为满脑子都是“人生来就会经历死亡、纳税和考试”这样想法的人。如果说这也算是学习的话,那只能说是一种抑制性的学习。想要在全美范围内,跨学校、跨学区、跨州、跨地域、跨城乡、跨越财富鸿沟地来提高学习水平的想法是非常好的,但是现在的年终考试却不能达到这个目的,它甚至无法测量孩子们在当今社会所需要的不同技能及思维方式。这个全国性的政策才执行不到10年,但我们必须承认实验失败了。
其次,在数字时代,我们需要对更复杂、彼此联系和互动的技能进行测试,我们可以将其称为“未来素养清单”(见附录)。毫无疑问,这个清单包括了3R(阅读、写作和算术),但是对于这些技能来说,任何一种由老师设计来了解学生学习情况的考试都是很好的。如果一个老师做得不称职,家长和学生都会心知肚明。我们不需要多选题考试来证明老师的工作是失败的,进而证明整个学校都是失败的。还不如把花在考试上的钱用来为那些在课堂上不太成功的老师提供一些额外指导,这至少是对老师的帮助。如果她仍然表现不佳,那可能说明教师这个职业不太适合她。目前教师离职率问题比学生退学率还要严重,其实也不奇怪,因为在制度上是以一种惩罚的态度来对待他们的。
我并不反对考试,一点都不。研究表明,学生接受的挑战越多,挑战的种类越多,收获的反馈越多,压力就越小。而且,适应性或者渐进式的考试可以帮助他们随时看到自己在学习过程中的表现。现在,我们已经离靠机器生成、阅读和打分的考试形式很近,如果想跨学区、州甚至在全国范围内进行大规模的考试,我们很快就可以做到。通过人工辅助、机读的“测试—学习”程序,采用实时评估机制,我们可以根据每个学生的学习风格进行自适应调整。从凯利的堪萨斯默读测试到现在由美国教育考试服务中心(ETS)和其他公司提供的考试,经历了100多年,如今我们站在了为评估数字时代所需技能而设立考试的起点。可能在10年之内,每个学习者,不管是学生还是终生学习者,都可以建立自己的私人电子学习档案,里面有徽章和证书,用来记录学习者所有的学习过程、完成的挑战和所有学期末的分数,这个档案在几年后可以帮助他们重新回忆起学习的过程或者用来向未来的雇主展示个人能力水平,所有这些资料都可以进行索引和整理。36
我们正处在数字时代新测试形式的边缘,应该思考一下到底想要测试什么,以及如何改变我们的教育、考试机构和政府政策,因为这些机构和政策都是用来强化那种根植于20世纪的评估方法和“条目式”的学习的。37由于我们已经来到了能够让老师轻松、对学生有益的计算机化、个体化、自适性的测试时代,那通过项目反应方法我们究竟想要测得什么?
我们在进步,评分也要进步,越来越多的教育家、决策者、父母和学生认为我们应该赶快思考21世纪需要的那些相互联结的,而非那些彼此分离的技能。我们需要的不是对某个单一问题的最佳回答,而是通过测试考查一种新的能力,这种能力让我们能够建立联结、协同合作、搭建网络、管理项目、解决问题、应对挑战,最终在职场里可以应对新的劳工制度和经济形式。对于学校来说,这意味着除了3R之外,学生们应该培养批判思维、创新和解决问题的能力,这些技能之间都是紧密相关的。我们需要测试的是学生对数字时代的问题,例如隐私性、安全性和可信度是否具有批判思维。我们可以写一些程序来测试孩子们对信息进行分类的能力,看他们如何决定一个信息是否可信。同时,还有助于测试他们对新技术和多媒体工具使用的效率如何,因为这些工具不仅现在可以供他们自由使用,而且对未来的工作也是必要的。如果你不使用推特,则通过不了这个考试。正如你可以把有版权的东西变成免费的在线资源,你也可以很容易测试出孩子们下载或者合成的方式,测试他们对与他人知识产权相关的伦理或法律问题的敏感性。
如果说“改变”是技术剧变时代的关键词,那么我们需要有合适的测评方法,不是要测量学生如何从五个选项中选择出一个正确率最高的答案,而是要评估他们将知识应用到新情境中的能力,评估他们的灵活度、适应性、对外来反馈吸收和做出反应的能力。我相信,一些电视节目如《美国偶像》《你觉得你可以跳舞》《逃生》《顶级大厨》受到追捧的原因之一就是他们比学校更能教会我们如何做出好的判断,以及如何对反馈做出回应。
我们需要测量的是实用的、现实的技能,比如如何在一个项目中保持专注和进行时间管理。在这个“自己动手”(DIY)的文化中,没有打卡机等着你打卡,那么孩子们通过什么学习时间管理呢?又该从哪儿学?是网络上还是面对面,是学校还是职场?每个雇主都会说,与他人相处的能力是成功的关键。但是在学校里,每个小孩的成就都是通过和他人比较而得到的,你是前1%的还是垫底的呢?这样的教学方法怎么教学生合作?一旦我们想出教育学生如何合作的方法,那又要怎么评估?孩子们不应该在第一次工作时只有让人眼前一亮的考试分数,却完全没有与他人一起工作的经历。假设第一份工作失败了,你不会得到成绩C,只会得到一张解雇通知书。
我们还需要评估年轻人与他人沟通的能力,包括与那些和自身理论和背景存在差异的人的沟通能力。在网络和现实的社会群体中,我们通常生活在一个相对同质的世界里。38但是在职场中,我们面对的是日益全球化的工作环境和一个进行数字交流的新世界,这使我们可能要与那些使用不同语言的人进行交流。通过电脑的翻译软件,我们不需要了解对方深层的文化价值就可以交换信息,这也是为什么现在的商学院都强调“文化”和“背景”是全球经营管理教育的两个最重要特征。总裁们需要知道如何进行有效推理,如何使用系统和网络思维来理解一个问题与其解决方案之间的关系,也要理解各种问题可能引起的其他后果。气泡试验不能让学生学会如何分析系统与系统间是如何相互影响的。我们需要教他们对什么可信和什么不可信做出正确判断和决定,尤其是在这个信息繁杂的数字时代。39
如果你认为所有这些听起来都是不可能的,那是因为我们在过去的100多年都相信多选题测试可以告诉学生他们的学习成果,相信这些测试比戴维森女士、凯特·莎伦及过去和现在无数启发心智的老师做得更好,但是这些老师可以在没有任何测试、机读考试或其他形式考试的辅助下,发现学生的优势或学习方面的困难。