第10章美国人的阅读水平

2025年1月25日　　来源：如何阅读　作者：马克·塞登伯格　提供人：zhanbai93......

1843年，新成立的马萨诸塞州教育委员会委派其秘书霍勒斯·曼（Horace Mann）前往欧洲，考察各国的学校教育。霍勒斯此行有非常明确的目的和强烈的诉求，希望了解这些国家在教育上的优势，找到可以借鉴和参考的样本。霍勒斯对苏格兰和普鲁士的学校印象深刻，发现“许多国内可以效仿的举措”。1

教育是一项国际性的事业，需要全世界人民一起为之努力奋斗。对于教育的关注不可避免地引发了一系列国与国之间的相互比较，这一点充分体现出人们对于多样性文化的浓厚兴趣。不同国家之间教育体制的相互比较越来越紧迫，这种紧迫感传递出一种信息：在政治经济全球化的背景下，各国从自身的利益出发，衡量其他国家民众的文化素养。众多的美国人民和他们选举出来的代表认为，美国在儿童阅读、数学和科学教育上的举措存在诸多不完善的地方。情况果真如此吗？霍勒斯曾对苏格兰和普鲁士的教育相当崇拜。现如今，芬兰和中国是否已经成为当代的苏格兰和普鲁士，成为其他国家效仿的对象呢？

国家教育进步评价和国际学生评估项目这两项大规模评估项目2数据的公布，进一步激发了美国人对于本国民众阅读情况的关注。每一次最新数据的发布都会引发更多的讨论，这样的情况迫使总统或教育部长持续关注情况的进展。两项评估项目的有效性及其对于教育现状的启发，取决于研究实施和数据分析的进展情况，以及某些不适宜公开的技术问题。我想要说的是，尽管实际情况比媒体公开的信息要复杂得多，但是这个过程中所透露出的基本信息是正确的，那就是：两项评估的结果表明，美国民众存在的读写能力问题将产生直接和长期的不利后果。阅读教育对某些人来说效果很好，对很多人来说尚可接受，但对另外一些人来说情况就完全不同了。这样的情况不仅对美国不利，而且与其他同样关注阅读教育的国家的情况形成对比。然而，这种说法受到教育工作者的质疑，他们认为这些数据歪曲了事实。这些评估结果已经引发了政界持续的争论，从而对学校教学产生了极大影响，因此对这些评估展开进一步分析是很有必要的。

我们必须认识到，这些评估与“高风险测试”无关。“高风险测试”是《不让一个孩子掉队法案》（No Child Left Behind）的主要组成部分。3国家教育进步评价和国际学生评估项目的结果，并不会引发诸如关闭表现不佳的学校或重新分配政府资金等后果。对高风险测试的反感已经转移到这些评估上，但这两项评估的目的与高风险测试完全不同。

国际学生评估项目对阅读、数学和科学3门学科进行评估，这些都是人们所熟悉的排行榜，参评国家按照得分进行排名。这项评估由经济合作与发展组织开展，目的是促进其成员国的经济发展目标。这些成员国是由34个市场经济国家组成的核心集团。(16)国际学生评估项目在这些成员国、许多伙伴国家以及中国的上海、澳门和香港等地区展开。国际学生评估项目是若干跨国评估项目中规模最大、执行标准最严格的一个。

自2000年以来，国际学生评估项目每3年进行一次。这个项目是一项浩大的工程，2012年总计51万名学生参加，这是距离本书写作时间最近的一次测试。接受测试的学生年龄为15岁。之所以选择对这个年龄段的学生展开测试，是因为国际学生评估项目的目的是了解和掌握在义务教育即将结束的这个时段里，学生已经掌握的知识和技能水平。在测试内容、测试实施方法、结果分析和呈现方式以及测试规模等大方面，国际学生评估项目给人们留下了深刻的印象。开发一种智能评估阅读技能的工具是一项极大的挑战，但能在不同国家之间以一种有效对比的方式对阅读技能进行评估，则是一件非常了不起的事情。阅读技能评估基于一种深思熟虑的、包容性的读写观念，重点关注与阅读相关的各项技能，以及学生在实践中运用这些技能的能力。

国际学生评估项目是一项开卷测试：项目技术报告中详细描述了这些方法的各个方面。该项目的组织方还提供在线工具，使得每个人都能以简单易懂的方式进行数据分析。尽管项目结果的排行榜引起了人们极大的关注，但项目组织方认为，其重点是解析造成这些结果的因素，而不是过分关注分数的多少。即使是对于那些原本对数据感到极恐惧的人，这些公布出来的结果也足以吸引他们的眼球。例如，在2012年的评估中，每个参与国的女孩都比男孩表现好，这一点与之前进行的一轮测试结果相同。男女生之间差距最小的国家是阿尔巴尼亚，差距最大的国家是约旦。与许多其他测试的结果一样，美国的男女生差距接近经济合作与发展组织成员国的平均水平。令人惊讶的是，一向表现出色的芬兰在其中一次项目评估中成为男女生差距最大的国家。

国际学生评估项目是一个极其严格的评估项目，它是由来自世界各地的研究人员组成的“科研梦之队”集体努力的成果。该项目得出了前所未有的大量有价值的数据。如果参与国在政治、环境和经济政策等方面也能开展这样的合作，那么世界将会变得更加美好。然而，国际学生评估项目并不是完美的化身。任何一个评估认知能力，并在全世界范围内多种语言背景下实施的项目都无法达到完美的境地。任何一个理解这个项目本质的人都无法承诺可以得到完美的结果。

自2000年以来，国际学生评估项目已经进行了5次。对于美国来说，其阅读测试的结果就像给一个成绩不佳的孩子的评价一样：成绩刚刚及格；应该可以做得更好；这个成绩和前几年相比，并没有发生太大的变化。在每一轮评估中，美国的成绩都接近经济合作与发展组织核心成员国的平均水平，但是低于加拿大、韩国、芬兰、日本和德国等国家的成绩。2009年，中国首次参与该评估项目，评估结果公布后引起了更为广泛的关注。中国学生在阅读、数学和科学方面的得分最高，成为所有参与测评的国家中首个在3门学科中都获得冠军的队伍。新加坡、韩国、日本获得高分后，反响更加热烈。他们所受到的关注远远超过美国被芬兰、加拿大和澳大利亚等国超过时的情况。如果我们用英国足球比赛来打个比方，那么美国队就是英超联赛里面临降级风险最大的一支队伍。全球的经济竞争也是如此。如果以棒球作类比，那就是弱队会被降级到更低级别的比赛中。

国家教育进步评价是美国对学生在数学、阅读、科学和其他学科中表现的评估。这是一项美国国会授权教育部实施的项目。4自1992年以来，这项测试大约每两年进行一次。国家教育进步评价的数据主要针对四年级和八年级学生的表现，同时也利用不同的方法对十二年级的学生进行了评估。参与这项测试的学生来自美国50个州、哥伦比亚特区和国防部隶属的学校，2015年共有大约139 100名四年级学生和136 500名八年级学生参加，参与的学校和学生分别代表国家级、州级和区级水平。5

与国际学生评估项目一样，国家教育进步评价也是基于复杂的阅读理论，该理论明确了每个年级的学生应该具备的技能。评估得出的数据是关于学生整体，而不是学生个人的情况。评估的结果被定为1～500分的不同分值，同时根据学生的分值划定档次（不合格、合格、良好和优秀）并列出各个档次学生所占的百分比。与国际学生评估项目一样，国家教育进步评价也是一项开卷测试。官方网站提供免费的数据资料下载，从这些数据中人们可以了解到测试的方法、数据和结果。国家教育进步评价官方网站同时还提供了一些用于简单分析的工具，便于了解分数与参评学生的种族、性别、家庭收入、公立学校和私立学校等因素之间的关系。6

针对国家教育进步评价的主要发现，各界媒体展开了广泛的讨论，其内容包括：在20多年的测试中，总分变化不大，在合格线内略有上升（见图10-1）。每次测试结果发布时，人们的评论都聚焦在统计数据是否有显著变化，而非这样的变化是否有意义。从统计数据层面分析，1～2个点的差异是具有可信度的。如此微小的差异都能够被检测到，这足以证明测试设计者的高超技能。如此微小的差异还表明这期间只发生了非常细微的变化。图10-2显示了学生的阅读技能在4个档次上得分的百分比。在每轮测试中，得分在最低两个档次的学生约占据了2/3。

图10-1 国际学生评估项目的整体分数（趋势线）

上图，八年级；下图，四年级。*号表示与2015年的数据存在差异。

资料来源：“National Average Scores，” Nation’s Report Card.

图10-2 各分数段学生所占的百分比

左图，四年级；右图，八年级。根据教育部的数据，*号表示与2015年的数据存在差异。

资料来源：“Overall Achievement Levels”Nation’s Report Card.

这些关于美国学生阅读状况的统计数据看起来相当糟糕，但这些数据真的准确吗？国际学生评估项目和国家教育进步评价都遭到了持续不断的批评，内容主要是质疑这些评估结果的有效性、数据分析和结果的相关性。学者、政治家、教育家和新媒体以及传统媒体都对此表示出了极大关注。

国家教育进步评价和国际学生评估项目的评估数据是免费提供的，我们可以通过对这些数据的研究来评判这些争议。对这些数据的分析也进一步强化了本书强调的一个目标：帮助读者训练自己的思辨能力，最终能够批判性地分析有争议的话题。当专家们在一个重要问题上存在分歧时，我们能做些什么呢？深入研究文献来剖析相互矛盾的意见，但只有真正从事这项工作的人这么做才是合理的。人们真的能通过这样的方法来提高自己的能力吗？让我们反思一下。7有人对什么才是事实真相做出了明确而令人惊讶的断言。事实果真如此吗？如果在其他情况下，这个论断也会是真的吗？其他方面的证据能够证明它的真实性吗？引用了哪些证据来支撑这一论断？为了证明这个论断的有效性，我们还需采纳哪些证据呢？那些依赖权威机构的认证，而没有证据支撑的论断是正确的吗？8其实，服务于政治、意识形态或商业领域的某些论断未必是错误的，但是其真实性需要进一步核验。

在相关的背景下，对教育改革和公立教育未来前景的持续不断的争论，引发了许多对于测试的负面反馈。我对此持有不同的意见。这些测试项目并不是暴风雨来临时的避雷针。有人认为，使用项目反应理论（Item Response Theory）计算国家教育进步评价的分数，造成了误导性的结果。最有可能的情况是，正如一些人观察到的那样，结果无法忍受是因为它们揭示了一些不便于明示的真理。

最后，我还有一个“理由”，可以引导读者突破有关数据和方法论争论的重围。因为这些争论并不像牛耕式转行书写法那么有趣。其实对于读者们来说，这些数据和方法论并没有那么复杂，只不过是有可能被人故弄玄虚，从而使它们看起来晦涩难懂。请随我一同来了解一下，科学的价值是如何遭到践踏的，又是如何被用来作为障碍，导致数据在企业中无法得到信任的。国家教育进步评价和国际学生评估项目得出的庞大数据非常容易成为造假的对象，被频繁曝光。这样的问题又进一步造成人们的误解，觉得量化研究的数据总是与很多解释完全一致，因而准确无误。虽然科学家无法控制研究结果的运用，但是我们可以明确指出那些公然滥用的情况。

不让一个孩子掉队

国家教育进步评价和国际学生评估项目的结果不具备直接可比性，因为这两项测试本身及其目标测试群体的年龄都不同。但是，许多问题都可以通过这两种评估方法得以解决，从而使得这两项测试的结果可以进行交互验证。这两项测试的结果得出了相同的结论：自测试开始以来，美国学生的阅读成绩总体上是持平或几乎持平的。在国际学生评估项目的测试中，美国学生的表现比很多国家学生的表现差。但是美国学生中有一部分，例如来自马萨诸塞州高收入家庭的学生，他们的成绩与成绩顶尖的国家学生成绩一致。两项测试的数据都显示，学生成绩会受到性别、种族、民族和收入等因素的影响而存在一定的差异。这两项评估结果都表明，有相当一部分学生阅读技能欠缺，但很少有学生阅读技能超强。

然而，学术界对于这些测试的看法也是众说纷纭。其中，美国著名作家和教育改革的积极倡导者戴安娜·拉维奇（Diane Ravitch）对于这些测试的批评最引人注目。她在新近出版的图书、发表的文章和演讲、接受的访谈以及社交媒体发表的简报中，对这些测试进行了深度剖析。在这里我主要就她的一些有影响力的观点进行讨论，这些观点已经受到了许多人的推崇。9

有关这些测试的争论，归根结底是关于美国公共教育质量和教育政策的看法。这些争论的大背景是，美国开始在全国范围内实施教育改革，并于2001年颁布了《不让一个孩子掉队法案》。这一法案中的某些内容在2015年《让每个学生成功法案》（Every Student Succeeds Act）颁布后已经被废除。

接下来，我将介绍一下《不让一个孩子掉队法案》诞生的背景。1983年，美国公布了一份报告，名为《国家处在危机之中：教育改革势在必行》（A Nation at Risk: The Imperative for Educational Reform）。这份报告措辞严厉，对当时的教育提出了警告，认为“美国全社会的教育基础盛行着一种平庸之风，这样的风气已经严重影响了美国这个国家和民族的未来”。10为了应对当时席卷而来的对于教育的各种担忧，美国政府出台了《不让一个孩子掉队法案》。人们对于阅读教育现状的担忧在两份报告11公布之后进一步加剧。这两份报告分别是：美国国家艺术基金会于2004年公布的《阅读危机》（Reading at Risk）和2007年公布的《读书还是不读书：这是一个关乎国家利益的问题》（To Read or Not to Read: A Question of National Consequence）。这两份报告对于美国民众未来的阅读情况和民众的文化素养提出了严重警告。这是在参考了文献中大量的图表数据后得出的结论，这些数据表明，美国民众对于阅读的兴趣和阅读的参与程度都呈现逐渐减弱的趋势。

《不让一个孩子掉队法案》是倡导实施标准化教育改革的先锋。法案规定的年度标准化测试，考核学生在数学和阅读方面的表现，进而依据测试的结果对学校和教师进行评定。同时，该测试将政府对于教育的资金投入与学校成绩的量化结果挂钩。通过实施特许学校和教育券政策来扩大学生对于学校的选择，并且允许商业机构参与公立学校的运营管理。

拉维奇本人的故事一直为人们所熟知：在布什和克林顿总统执政期间，她曾在教育部门中任职，是上述政策的忠实拥护者。她完全无法接受这些政策是无效政策的观点，不承认这些政策对公共教育造成负面影响。她只是表面上赞同要废除这些政策。对于拉维奇来说，这些改革的失误是对美国教育现状的错误认知造成的。12除此之外，还有一个原因就是，这场改革将规模巨大但尚未发育健全的教育市场引入商业化的发展轨道。我们必须承认，她的部分论点是基于无可辩驳的事实，并且内容也至关重要。的确，正如她所指出的那样，因为备受关注的“白皮书”的发布，美国民众和政府对于国内教育质量的担忧进一步加剧，而这些报告本身并不是完全真实可信的。美国国家艺术基金会关于阅读状况的报告就存在很大问题。13

拉维奇同时指出，依据《不让一个孩子掉队法案》实施的高风险测试完全是一场灾难。正是因为有了来自拉维奇的一系列不同意见，在后来实施的《让每个学生成功法案》里，一些明显过于苛刻的要求被废除了，但是在一些成绩不佳的学校里，校方还在继续执行这样的要求。

对高风险测试的反感并不能解释对国家教育进步评价和国际学生评估项目的反对，这与《不让一个孩子掉队法案》中的测试政策无关。这两项评估项目类似于信息排名检索，通过调查报告的形式来反映学生在阅读、科学和数学科目中的表现。我们急需这些能够对学生水平进行深度评估的项目，用于纠正那些来自美国国家艺术基金会等权威机构报告的不实信息。然而，这一结果并不符合拉维奇和她的同事们的主要观点。他们认为美国教育体系比以往任何时候都做得更好，因此，类似《不让一个孩子掉队法案》这样的教育改革既欠考虑又完全没有必要。基于这种观点，这些法案旨在解决的缺陷被无限夸大了，目的是服务于政治和企业利益。国家教育进步评价和国际学生评估项目之所以陷入论战之中，主要是因为它们提供了美国教育体系存在缺陷的实质性证据。需要指出的是，这些高风险测试是以政治利益为出发点的，而国家教育进步评价和国际学生评估项目则是完全独立的，与任何具体的政策、政党或总统都无关。14如果拉维奇的观点是正确的，那么国家教育进步评价和国际学生评估项目必然存在问题。因此，许多人试图解释这两个测试项目究竟展示了什么内容。15拉维奇的观点如下：

1．美国当前的教育体系已经非常成功，因为学生学到的东西比以往任何时候都要多。与四五十年前的同龄人相比，现如今，学生学习和掌握的科学和数学知识都更难。当前民众对教育的期望值也更高，课程也更具挑战性。20世纪70年代在中学数学和科学方面成绩优异的学生，如果走进今天的课堂，那么他们学习起来将会很吃力。

2．对大多数学生来说，当前的教育体系运行得非常好。高中毕业率提升到了历史最高水平，更多的学生进入了大学。

3．评估成绩与现实世界没有多大关系。评估成绩无法准确地预测经济增长。美国的测试成绩虽然一直表现平平，但这并不妨碍美国成为全球最大的经济体。

4．在国家教育进步评价中，四年级和八年级学生的阅读成绩都有了稳步提高。从1992年开始，几乎所有学生都有显著的进步。

5．国家教育进步评价和国际学生评估项目都低估了学生的真实阅读水平，因为这些测试都是低风险测试，不能引发直接的结果。因而，学生、教师和学校都缺乏努力表现的动机，从而导致学生的分数并不像那些重要测试中的分数那么高。

6．总体趋势线（见图10-1）看起来几乎是趋于平缓的，但这只是一个假象。小组分数增加而总分并未增加是辛普森悖论（Simpson’s paradox）的一个例子，下面会详细解释这个统计学上非常有趣的现象。

7．国家教育进步评价的成绩数据（见图10-2）表明，学生的成绩看起来不容乐观。两个低水平档次上的学生数量远比两个较高水平档次上的学生数量要多，但这是因为设定的上限太严格了。拉维奇给出了她自己获取的数据。依据这些数据，大多数孩子的成绩是B、C或更高。

拉维奇据此得出结论：“如果有人认为，过去20年来学生的阅读水平没有得到提高，请你一定不要相信这样的论断，因为这是毫无根据和道理的。”16

我们确实需要对这些论断进行仔细剖析。有些论断是正确的；有些论断在论证方法上是正确的，却无法支撑其结论；有些论断是具有误导性的，因为有意省略了相关信息；有些论断与其他未提及的研究相互矛盾。拉维奇对到底谁的分数才“算数”的分析，令人反感。

第一点中，关于学生比以前获取了更多知识这一点是完全正确的。这反映了著名的弗林效应（Flynn effect）(17)，即20世纪30年代以来人们智商的稳步增长。17人们确实需要知道更多，学校也需要教授更多知识。问题是他们如何满足这些需求。如果以实施了50年的标准来衡量，学校的表现无疑是卓越的，但是这毫无意义。

第二点中，关于高中毕业率是否正处于上升态势则备受争议，因为它取决于如何计算普通同等文凭持有者的数量。18美国的中学毕业率曾经是经济合作与发展组织国家中最高的，但如今却低于平均水平。19拉维奇对毕业人数和大学入学人数的关注忽略了更重要的问题，那就是为什么这个比例会发生变化。除了教育因素以外，毕业率也会受社会、经济因素的影响。

说到第三点提及的内容，不幸的是，美国确实历年来都无法在国际学生评估项目和类似的评估中拔得头筹。基于1964年进行的第一次国际数学研究的结果，拉维奇指出，这些结果与现实世界无关。她写道：“在我的新书《错误的统治》（Reign of Error）中，我大量引用了基思·贝克（Keith Baker）于2007年发表的一篇精彩的文章‘Are International Tests Worth Anything’。”20贝克认为，早期跨国评估项目中的数学成绩与12个参与国家随后的经济发展并无关联。拉维奇和贝克据此得出结论，来自跨国评估项目的数据与现实世界的状况并无关联，因而国际学生评估项目的结果也可以被忽略。

我们可以运用以下两个标准来判断一个专家的论断是否值得信赖。首先，专家不采用双重标准评判与自己意见相左的观点。其次，专家会综合考虑所有的证据，而不是有意忽视那些不支持其观点的证据。

贝克的文章是一份包含4页内容的文件，描述了一项历时50年的研究。公布的研究结果中，用英语描述的细节信息少之又少。这一点，与国际学生评估项目和国家教育进步评价公布的大量翔实的数据形成鲜明的对比。贝克也在文章中对后续进行的跨国研究发表了简短的评价，表现出了对这些研究的不屑一顾。拉维奇不加批判地接受了贝克的研究方法。尽管无法进行单独的评估，但拉维奇对国家教育进步评价和国际学生评估项目两项测试的方法和结果的细节问题提出了异议。

拉维奇也忽略了关于这一问题的其他研究。斯坦福大学胡佛研究所高级研究员埃里克·哈努谢克（Eric A. Hanushek）和慕尼黑大学经济学教授卢德格尔·沃斯曼因（Ludger Woessmann）利用1964—2003年国际学生评估项目的12轮国际测试的结果，分析了学术成就和经济成果之间的关系21，该分析还参考了来自其他评估项目的各项数据。22这些分析表明：“对相关规范、时间周期和一定的国家样本进行大范围的敏感性分析，就会发现教育成就与国内生产总值的增长之间存在非常稳定的密切关系。”23哈努谢克等人对这些问题进行了更为深入的研究。24毫无疑问，教育成就与经济增长之间存在正相关。

第四点中提出，与美国国家艺术基金会一样，拉维奇关注的是数值上的变化，而非这些变化是否具有意义。正如我所指出的，自1992年以来，阅读上的差异微乎其微。23年的时间里，在500分的基本范围内，5分或8分的变化都是极其微小的。25在讨论2007年的报告中显示的增长趋势时，哈努谢克指出，不能将当时的阅读结果看作处于上升态势。“如果在未来的10年时间里，我们每年都能实现2分的增长，那结果将是不可限量的，”他说道，“如果只是这样的话，那么2分的增长本身并没有什么实际的意义。”从2007年到2013年，四年级学生的分数增加了1分，平均每年增加约0.17分；八年级学生的分数增加了5分，平均每年增加约0.8分。

关于这些低风险测试的第五点是否该引起强烈的反应？学生在国家教育进步评价或国际学生评估项目的测试中表现不佳，是因为这些测试都是低风险测试吗？或者他们表现得更好，是因为他们压力更小吗？很显然，学生在这些测试中的表现对很多人来说都尤为重要，例如总统、教育部门的官员，以及拉维奇这样的评论员。这样的影响会逐渐扩散至每一位测试者身上。风险程度关系到他们所在州甚至是整个国家的声誉。其重要性足以引起人们的关注，有些州将表现不佳的学生划分为残疾学生，以此达到将他们排除在测试之外的目的，从而妨碍了国家教育进步评价的实施。26在国际学生评估项目中得分较高的一些国家，也可能发生了同样的情况。有人声称，因为学生没有获得更高成绩的动力，所以这些评估的分数才会很低。

接下来的第六点和第七点主要涉及两个问题。其中，更重要的一点是，这一测试对后续的发酵作用。它涉及各个学生群体的表现及其对成绩的影响。次要的一点是，关于成绩档次划分中的分数设置问题。

国家教育进步评价的评分太苛刻了吗

令人担忧的是，优秀或者良好的评分标准设置得过高。国家教育进步评价的设计者建立了一系列的分数标准，这些分数可以分为及格、良好和优秀。分数设置反映了专家顾问委员会的一致意见。拉维奇曾于1998—2004年间在该委员会任职。难道真的只有3%～4%的八年级学生达到优秀读者的标准吗？拉维奇不这么认为，所以她采用更宽松的标准重新划分档次。任课教师都懂得，在变化相对缓和的曲线上设置更高的分数并不意味着学生学得更多，但这可能有利于增强学生的自信心。

如何利用图表将测试结果表示出来其实是一个微不足道的问题，因为无论如何它都不会改变学生的阅读能力。尽管如此，成绩档次的划分仍然是一种有用的统计数据。人们不禁会问，怎样的分数设置能够更好地反映学生的技能呢？在这里，国际学生评估项目的数据是很有帮助的。该评估项目将学生的成绩分为6级而非4级。测试的内容各不相同，考生的年龄、对阅读表现的期望以及分数的设置也各不相同。尽管如此，还存在两个问题。首先，美国与其他使用国际学生评估项目的国家相比，表现如何？美国的调查结果再次接近经济合作与发展组织国家的平均水平。与成绩较高的国家相比，得分在5～6级之间的美国学生比例较小，得分在2级以下的美国学生比例较大（见表10-1）。27因此，与其他使用相同测试和评分标准的国家相比，美国处在高分段的学生人数更少，而处在低分段的学生人数更多。积极推进教育事业的马萨诸塞州、康涅狄格州的成绩与芬兰和加拿大并列。

表10-1 2012年国际学生评估项目阅读分数

其次，我们可以参照国际学生评估项目的评分标准，来判断国家教育进步评价的分数设置是否过于严格。对比结果清晰地表明，国家教育进步评价的分数设置更为严格，但并没有到非常苛刻的程度28：

这些测试是否有意歪曲学生的阅读能力或者故意丑化学生成绩呢？如果将评分标准稍做改动，情况是否会发生翻天覆地的变化？我认为发生这种情况的可能性很小，但还是将最后解释的话语权交给拉维奇吧。2005年，在《纽约时报》的一个专栏“落后的各州”中，拉维奇撰文指出：各州为了达到《不让一个孩子掉队法案》的要求，开始使用标准化测试。但是这一测试的结果和国家教育进步评价的结果之间存在很大差异。各州通过降低测试难度和调整评分标准的方式来确保学生取得高分。拉维奇对此表示反对：“如果我们将中等水平的学生成绩认定为优秀，那么就意味着我们将无法完成既定的目标，即无法培养出受过良好教育、踏实肯干、训练有素和富有创造力的社会工作者。”29

造成阅读能力不足的原因

与国家教育进步评价所得出的结论相比，为高分段学生设置评分标准实在是一件吹毛求疵的小事。在国家教育进步评价的每一个项目中，大约有1/3的四年级学生和3/4的八年级学生成绩处于不合格水平；约2/3的学生成绩处于刚刚合格甚至不合格水平。盖瑞森·凯勒再次强调，指导学生学习阅读是每个学校应尽的责任和义务。他引用的一个例证就是，明尼苏达州27%的四年级学生在2007年的测试中成绩处于合格线以下。他认为：“这高达27%的重度文盲比例是难以容忍的耻辱。”30我们再也不能沉醉于乌比冈湖效应，自诩自身的水平有多么高。

拉维奇和她的同事们认为贫穷是造成学生成绩低的原因。他们认为，美国的教育体系目前看来没有什么问题，但是来自低收入家庭的学生成为这一体系的绊脚石。

出现这样的情况，我认为主要有以下原因。

国家教育进步评价的每一轮测试，在选取测试样本时都会充分考虑样本的代表性，以便确保测试结果能够充分代表全体学生的水平。例如，假设威斯康星州四年级中非裔美国学生的比例是n，那么该州参与测试的非裔美国学生的比例也要尽可能与这个数值接近，其他州乃至整个国家亦如此。在每一个测试周期内，样本构成会随着美国人口结构的变化而变化。

随着人口结构的变化，国家教育进步评价参与对象的主要变化体现在这两个方面：（1）西班牙裔学生比例的增加和白人学生比例的下降（见表10-2）；（2）有资格获得免费午餐的学生比例的增加（见表10-3）。在美国“国家学校午餐计划”（National School Lunch Program）中，参加人数常被用作衡量社会经济地位的指标。与免费午餐、折扣午餐、不具备免费午餐资格这三个类别相对应的社会经济地位分别是：较低、中等、较高。它只是一个粗略的衡量指标。31和国际学生评估项目采用的方法一样，社会学家评估社会经济地位时，会综合使用多种方法，从而得出更准确的结果。

表10-2 国家教育进步评价中三大种族学生的比例

表10-3 国家教育进步评价受试对象中，三组不同类别所占的比例

1998年以前的数据不详。

这里有一个关键的因素：白人学生的总体得分要高于西班牙裔和非裔学生。与白人学生相比，非裔和西班牙裔学生在低分段的比例更高。这三类学生在低、中、高三种社会经济地位分组中的得分也存在同样的差异。

拉维奇实事求是地指出，所有这些群体的得分都在以相似的速度递增。如果分数增加了，为什么总体趋势线是平缓的？因为来自低分群体的学生比例也有所上升，这一增长抵消了总体上的增长。因此，净增长效应呈现出一条直线。

对拉维奇来说，分数的递增表明教育体系也在不断进步。事实上，按照她的评分标准，大多数学生的成绩都在C或C以上，这表明教育工作者知道如何指导学生学习阅读。在大规模、类型多样的国家教育进步评价受试学生样本中，可以找到非常优秀的群体，例如马萨诸塞州20%的四年级学生，他们的成绩达到优秀，但从经济上来衡量，他们却没有资格享受免费午餐。这些教育上的成功表明，低分必定是由其他因素造成的。拉维奇关注的是贫困问题，贫困对非裔和西班牙裔学生的影响尤为严重。解决美国文盲问题的方法是消除贫困。因此，阅读、数学或科学成绩低是一个经济和社会公正的问题，而不仅仅是教育问题。32

这些观点提出了有关公共教育功能的基本问题。

教育机会的差距是真实存在的。33不仅美国存在贫困问题，世界上的其他国家和地区也同样受到这一问题的困扰。消除贫困将产生巨大的积极影响，其中包括提高学生的阅读成绩。这里争论的焦点是造成贫困的原因和消除贫困的办法，而不是贫困的存在或维持一个较低的贫困水平是否有益。虽然针对如何将贫困减至最低限度这一问题，人们并未达成一致意见，但已经有很多人致力于减少贫困或改善贫困的影响，尽管他们在投入的力度上有所不同。拉维奇不遗余力地向大众广泛宣传贫困对教育的毁灭性影响，引起人们对这一问题的持续关注，并努力寻找恰当的解决办法，从而为此做出了贡献。

我必须坚决把这个问题，即真正的经济问题，与贫困引发的有关教育成果、公共教育目标和义务的争论区分开来。

这里有必要指出，贫穷并不能解释美国在跨国评比中的平庸表现。每轮国际学生评估项目都对社会经济地位及其各种组成因素对各国分数的影响进行了广泛分析。34这些分析表明，美国并未因为来自低收入家庭的参与者比例非常高，而导致其表现比其他国家差。美国与其他经济合作与发展组织国家的主要区别在于，美国社会经济条件优越的学生所占的比例更高。按照“国家学校午餐计划”中划分的社会经济地位，美国处于3种不同社会经济地位的学生在得分上都落后于加拿大和芬兰等国家，而不仅仅是社会经济地位低下的学生得分才低（见表10-4）。针对2012年国际学生评估项目的测试结果，去除社会经济地位的影响后，美国的排名或分数几乎没有改变。最后，社会经济地位对阅读成绩的影响在每个国家都不尽相同。举个邻国的例子，在美国和加拿大，社会经济地位的差异都很大，但在美国，它能更有效地预测教育成果。35当时的教育部长阿恩·邓肯（Arne Duncan）提醒人们注意以下这些反差：

表10-4 2012年国际学生评估项目的阅读分数（按经济、社会和文化地位指数的四分位数(18)计算）

美国学生成绩落后于其他成绩优异国家的学生，主要原因不是学生群体的多样性，也不是大量的公立学校学生来自贫困家庭。经济合作与发展组织总结认为，出现这一问题的原因在于“与其他许多国家相比，美国的社会经济劣势会更直接地导致教育成果的落后”。换句话说，我们的学校在缩小成绩差距方面没有尽其所能。经济合作与发展组织表示，随着美国学生年龄的增长，他们“每年取得的进步比成绩优异国家的学生要少”。相比之下，成绩优异的国家不仅显著提高了学生的成绩，同时还缩小了学生之间的成绩差距。在芬兰，无论学生在哪里上学，他们都能获得统一的、强有力的、可预测的教育成果。36

有人以贫困为借口，坚持认为美国教育状况整体是良好的，只是受到了极度贫困的拖累。很遗憾，这样的观点没有获得国际学生评估项目数据的支持。然而，正如华盛顿智库经济政策研究所在2013年的一份报告中所指出的那样，通过重新定义贫困可以维持生活。37国际学生评估项目对社会经济地位的衡量基于对以下指标的综合评估：“父母的受教育程度和职业、被视为财富代表的家庭财产的数量和类型，以及家庭中可利用的教育资源”。表10-4中衡量的是经济、社会、文化地位，华盛顿智库经济政策研究所的研究人员采用一种方法来评估社会经济地位：家中图书的数量。其结果是，美国有更大比例的受试学生被归类为“低社会经济地位”群体。这些研究人员还做了另一项改变：他们将美国与其他6个国家进行了比较，这6个国家分别是加拿大、芬兰、韩国、法国、德国、英国。由于参与比较的国家数量较少，在可以任意选择的情况下，评估社会经济地位的指数更有利，因此研究人员完全可以据此得出结论，美国的学生成绩受社会经济地位低的影响更大。如果考虑到这一点，那么美国的得分便会提高。

这个分析令人信服吗？与之相对应的是，一个国际组织的研究人员和其他研究这些数据的人在多年时间里，对此进行了更为深入的分析。不幸的是，批评人士质疑既定的结果不一定是正确的。如今，互联网上充斥着关于国际学生评估项目有效性的讨论，一个由100名教育工作者组成的国际组织呼吁经济合作与发展组织停止这项测试，因为它“在全世界范围内产生了有害的影响”。38

《夏洛特观察家报》（Charlotte Observer）的凯·麦克斯帕登（Kay McSpadden）报道称，已经找到了一个提高美国学生成绩的更简单的方法39：

美国国家教育统计中心最近发布的一份报告显示，在贫困率不到25%的学校里，美国学生的阅读成绩比世界上任何其他国家的学生都要高。40

结论很简单。来自中产阶级和经济实力雄厚的家庭的公立学校的学生正在茁壮成长，而来自贫困家庭的学生却在苦苦挣扎。这并不是因为他们就读的学校每况愈下，而是因为他们上学时背负着贫困带来的各种有形或无形的负担，其中包括产前护理不良、发育迟缓、饥饿、疾病、无家可归、情感和精神疾病，等等。

事实果真如此吗？只有把低收入学校的分数从美国的测试数据中剔除，而其他任何国家的数据中并不做这样的调整，才能确保美国学生的阅读成绩高于世界上其他国家和地区的学生。这样的做法确实奏效了。“贫困率低于25%”的学校指的是那些只有不到25%的学生有资格享受免费或折扣午餐的学校。2012—2013学年，符合这一标准的美国公立学校占比为18%。依据此标准，美国有资格与其他国家进行比较的就会是这18%的富裕学校，而与其对应的则是其他国家所有的学校。

这里我们找到了问题的症结所在。关注贫困对于美国教育失败的影响，会转移人们的注意力，使人们忽视造成教育失败的其他因素，从而认为贫困似乎是唯一的决定因素。于是就形成了这样一种观点：似乎只有解决贫困问题，才能改善教育的结果。我对这些说法的有效性提出质疑，并反对这种没有经过论证的观点，即教育体系不再对来自低收入家庭中成绩较差的孩子负责。

在针对学生成绩不佳的讨论中，政策讨论方面的焦点是认为较低的成绩是由“贫困”造成的，而不是“教育”出现了问题。这无形中将问题简单化，认为贫困和教育是两种截然不同的因素。社会学家和经济学家试图利用社会经济地位的统计数据来量化经济条件的影响，以解决某些研究问题，例如，20世纪90年代的福利改革对人们的经济条件有什么影响？社会经济地位通过各种相关条件影响人们的生活，这些条件受变化的影响各不相同，其中许多都与教育有关，如进入优质学校的机会，接触公共图书馆、计算机和互联网的机会等。教育实践会放大社会经济地位的差异，因为这些差异是建立在是否有机会接触计算机、互联网，以及获得补充教学资源等条件的基础上的。教育也可以作为一个“保护”因素，防止学生受到不利环境的影响。然而，与其他经济合作与发展组织中的国家相比，美国具有“坚韧不拔”特质的学生比例较低。41这样的学生是指那些来自低收入家庭但是最终通过自己的努力在阅读上取得成功的人。简而言之，教育与社会经济地位的差异密切相关，它绝对不是一个中立的旁观者。

对社会经济地位的关注也滋生了一种“等待贫困问题解决”的态度，即认为只有通过超人的努力消除贫困，结果才会发生改变。我并不赞同过度关注教育政策，而忽视对贫困问题的解决。相反，对贫困问题的关注过于狭隘，也会导致人们将目光集中在贫困问题本身，而没能采取有效的措施去解决那些原本应该解决的问题。教育可能不是“伟大的均衡器”，但它可以改善许多人受到的不平等待遇。例如，学生虽出生在贫困的家庭，但他们没有出生在贫困的学校。而实际的情况却是，与那些出生在经济条件良好的家庭的学生相比，出生在贫困家庭的学生就读的学校在人员、设备、安全、教材和资源等方面都要逊色很多。贫困是如此难以消除，我们可以从芬兰人那里得到启示：“芬兰教育的基本原则之一是，所有人都应该平等地接受高质量的教育和培训。所有公民都应享有同样的受教育机会，无论其种族、年龄、财富或居住在何处。”42

我真正关心的是，无论拉维奇等人的初衷是什么，也不管他们对消除贫困做出多么真诚的承诺，对贫困的强调也为减轻教育机构对教育失败应负的责任提供了便利，从而为貌似合理的否认提供了说辞。查看成绩档次的数据（见表10-2），是否可以得出这样的结论：当前的教育体系对大多数人来说都运作良好？而那些人又是谁？全方位的深入分析表明，如果没有越来越多的低分者（这里主要是指来自低收入家庭的少数族裔学生），那么国家教育进步评价的分数看上去会好得多。我们不禁要问，这样的情况说明这种教育体系到底是在为谁服务？是为了“我们的中产阶级和富裕家庭的孩子”吗？考虑到截至2015年，超过一半的公立学校学生获得了免费或折扣午餐的资格，这一信息尤其令人不安。43拉维奇和她同事们的观点似乎为重新规划教育提供了一个理论依据44：从教育的角度来说，对这一领域进行投资是不明智的，因为人们太穷而无法从中受益。这就好比重新规划抵押贷款一样，使得打破贫困的恶性循环变得更加困难。

不同人群阅读成绩差异的原因

国际学生评估项目的数据显示，与其他参与测评的国家相比，美国学生在成绩上存在差距。与其他国家一样，社会经济地位是影响美国学生成绩的重要因素。除此之外的其他因素也很重要。在某种程度上，表明成绩与社会经济地位的衡量指标有关会导致成果的减少，因为我们需要找出根本原因。美国内部不同种族之间的差距也带来了同样的问题。

如果不考虑成绩差距的问题，就不可能对美国学生的阅读水平进行严肃讨论。成绩差异指的是在阅读、数学和科学等领域，不同群体之间的个人在表现上的差异。与白人群体相对应，这些群体主要是指少数族裔群体，例如非裔美国人、西班牙裔美国人、印第安人等，但是差距其实无处不在。这些差距包括：与收入相关的差距，移民的第一代子女与后一代子女之间的差距，以及地理区域之间的差距。男性得分低于女性，白人得分低于亚裔美国人。我感兴趣的是，我们对阅读的了解是否有助于弄清楚这些差距存在的原因，以及减少这些差距可以采取的方法。

虽然存在许多差距，这次讨论将集中在非裔美国人存在的阅读差距。为什么单单就这一群体进行讨论呢？因为这一差距对一大批美国民众产生了严重的负面影响。因为它是漫长的美国种族不平等历史的一部分。因为它多年来一直是政治家、教育家和经济学家关注的焦点。因为自从相关数据公布以来，这一差距就一直客观存在，尽管在此期间美国公布了一系列法案，其中包括《向贫困宣战》（War on Poverty）、《不让一个孩子掉队法案》、《力争上游》（Race to the Top）等，但是非裔美国人的成绩差距几乎没有什么改善。研究最关注的一点是，每个群体所拥有的条件和所处环境的不同造成了这种差距。如果力求取得更大的进展，那么就有必要将重点放在非裔美国人这一群体上。然而，更重要的是要认识到，这种差距并不是这个群体所特有的，而是国家教育进步评价、国际学生评估项目和其他研究项目中一个更广泛现象的一部分，即美国教育体系对一部分学生的作用比其他学生要大得多。

非裔美国人和白人在阅读、数学和科学方面的成绩差距可以通过很多指标来衡量，其中包括：年级成绩、标准化测试分数、学生所在学校的类型、高中和大学的完成率以及其他衡量标准。许多研究都详细记录了这种阅读差距。图10-3和图10-4显示了国家教育进步评价中的这种差距。在每年对这两个年级进行的测试中都能观察到一个显著的差异，非裔美国学生的成绩落后了10%～20%。令人欣慰的是，自1992年以来，这种差距在缓慢缩小。然而，这种差距的严重程度可以通过成绩档次的数据传达出来，数据显示，非裔美国学生在低分段的学生中所占比例过高，而在高分段的学生中所占比例过低。

图10-3 国家教育评价中测出的成绩差距

○号表示白人；＋号表示非裔美国人。上图：八年级学生；下图：四年级学生。*号表示与2015年的数据存在差异。

资料来源：“National Score Gaps，” Nation’s Report Card.

图10-4 八年级学生成绩水平

上图：白人；下图：非裔美国人。*号表示与2015年的数据存在显著差异。上角标1表示该年份还未对行动不便的学生和英语学习者提供住宿。#号表示得分为0。四年级学生的成绩水平与此相似。

资料来源：“National Achievement Level Results，” Nation’s Report Card.

造成这种成绩差距的因素有很多，在此我无法一一讨论。45我的主要目标是持续讨论阅读科学。由于各种原因，这个话题也很敏感。其中之一就是，“差距”是指不同群体间总体差异的概括。对于阅读这种技能来说，每个群体内的个体差异很大，而各个群体的得分分布重叠（见图10-4）。因此，不同群体之间的数据差异并不适用于群体内的所有成员，也无法运用到某一特定的个人身上。其他那些引人注目的群体差异也是如此，比如男性和女性之间的差异，或者东西方文化之间的差异。这类群体是重叠的，但记者和科学家有时会把它们写得好像并没有重叠一样，如“东方与西方：一方看到大局，另一方聚焦大局”。46

关于这个问题，还有一点我是非常清楚的。那就是，关于这个问题的任何说法，都可能出于研究人员无法控制的政治目的而遭到歪曲，无论内容阐述多么详尽，有多么充足的证据支撑，并且附有多么必要的条件。尽管如此，我认为在这里探讨这个问题还是很必要的，因为成绩差距是真实存在的。群体之间的巨大差异影响着许多个体，并且会造成非常严重的后果。通过适当地抽取不同群体的数据，我们希望能够找出使个体面临失败的巨大风险，或那些能够起到保护作用的因素。如此一来，家长、社区负责人、教育工作者、政治家和慈善家就可以更好地就如何达到预期的效果，做出更加明智的决定。

关于成绩差距的大规模社会经济研究表明，社会经济地位是造成这一差距的一个重要因素，但也只是其中的部分原因。斯坦福大学教育社会学家肖恩·里尔登（Sean Reardon）及其同事在《纽约时报》上发表了一篇文章，文中很好地展示了复杂数据是如何通过可视化图像的形式呈现出来并供人们研究使用的。47研究结果显示，阅读成绩与收入有关，白人的收入一般高于非裔美国人或西班牙裔美国人。因此，即使他们上的是同一所学校，非裔美国学生和西班牙裔美国学生的分数往往低于白人学生。这是不可辩驳的事实，所以说，社会经济地位是造成这一差距的重要因素。

在社会经济地位相同的非裔美国人、白人和西班牙裔美国人之中，也存在这种差距，只是较难发现。英国《泰晤士报》的专栏文章中也强调了这样的情况。此外，与美国和其他国家的比较一样，这种差距并不仅限于低收入群体。如图10-5所示，该图按照学生是否有资格获得免费或折扣午餐这一社会经济地位的衡量指标，来呈现国家教育进步评价的阅读测试结果。两个群体均呈现出明显的社会经济地位效应，但在每一测评指标中也存在非裔美国人和白人的差距。对来自高收入家庭和父母受教育程度更高的非裔美国学生的研究表明，他们在学校的表现比那些缺乏这些优势的同龄非裔美国人要好得多，但不如拥有相似背景的白人。48这些数据表明，除了社会经济地位之外，还有其他一些因素造成了群体间的差异。49

图10-5 国家教育进步评价中八年级学生的分数

它是按照学生是否有资格获得免费或折扣午餐进行呈现的，这也是社会经济地位的衡量指标之一。左图：非裔美国人；右图：白人。

从本书的其他章节可以明显看出，造成这种差异的一种可能性就是语言。在这一点上，我们能够找到其中的原因：

· 阅读与言语紧密相连。儿童的口语知识是早期阅读能否成功的决定因素。

· 儿童之间的语言技能差异很大，包括掌握的词汇量和词汇的难度。

· 儿童在最初几年的学习中不断进步，而语言扮演着越来越重要的角色。随着课程要求的提高，语言技能的差异及其对阅读的影响变得更加明显。

· 语言并不是宏观社会经济研究的主要关注点，这些研究很少涉及儿童对口头语言的了解，也很少涉及他们在家庭、托儿所或学前班中接触的口语的特质。

我们知道，儿童的词汇量和掌握程度与早期阅读成绩密切相关。贝蒂·哈特（Betty Hart）和托德·里斯利（Todd Risley）进行了一项开创性的研究，记录了成人对儿童言语输出的数量和种类的巨大差异，以及二者之间与社会经济地位有关的言语互动的不同类型。他们发现，与来自高收入家庭的儿童相比，来自低收入家庭的儿童接触的话语更少，获得的词汇量也更少，从而导致他们后来在学习阅读方面的进步也更缓慢。50与社会经济地位相关的口语习得的差异早在儿童18个月大时就已经显现出来。51

与贫困一样，儿童早期口语的发展无疑是一个需要密切关注的重要因素。认识到儿童口语环境的重要性，从而引入语言强化项目，就可能会产生有益效果。52然而，这一因素在多大程度上导致了非裔美国人和白人之间的差距尚不明晰。自哈特和里斯利的研究后，不断涌现出来的事实是，在所有社会经济地位层级和种族／民族的群体中，口语环境的变化都很大。例如，一项针对53位来自不同背景的低收入家庭的母亲所进行的研究发现，她们在对孩子说话的数量、词汇量和语言互动等方面存在很大差异。53在对低收入白人家庭、拉丁裔家庭以及中高社会地位家庭所进行的研究中也发现了类似的差异。54正如安妮·弗尔纳德（Anne Fernald）和阿德里安娜·韦斯勒德（Adriana Weisleder）所指出的：“父母与婴儿的语言接触，往往比家庭的社会经济地位更能预测孩子的语言能力发展。”55此外，成年人对孩子所说的话的差异并不局限于家庭环境。一项针对85名来自低收入家庭的儿童所进行的纵向研究发现，教师与学龄前儿童的语言接触也是预测儿童阅读能力发展的一个重要因素。

这些研究发现表明，儿童的口语环境存在很大差异，并且对阅读有着直接的影响。然而，这种差异是一种普遍现象，不仅仅局限于社会经济地位较低的少数族裔群体。非裔美国人和白人之间的成绩差距似乎涉及一个或多个其他因素，这些因素在这些群体中明显不同。此处，口语环境的另一个方面，即方言，也可能是与阅读相关的一个因素。

大多数非裔美国儿童和他们的家庭通常会说一些非裔美式英语。56这是一种少数族裔方言，与主流美式英语或“标准”美式英语（主流方言）有交叉重叠之处，但在许多方面不相同。在家里和社区说非裔美式英语的儿童，还必须适应学校使用的语言。白人儿童的情况则不同，他们很可能在家里和学校都使用主流美式英语。

接下来的问题是，这些语言经验的差异是否造成了在阅读方面的成绩差距，以及儿童从学校教育中受到有效指导的能力差距。这个问题不是关于非裔美式英语的语言有效性，因为毫无疑问，非裔美式英语已经形成了。57它也不是关于非裔美式英语使用者的特点或他们的文化。相反，这个问题的产生是基于一种特殊的社会环境：儿童的家乡方言可能与学校语言相同，也可能不同。抛开其他因素暂且不谈，与讲主流语言的儿童相比，在家里讲非裔美式英语方言的儿童，在测试中成绩更差的风险会更大。少数族裔方言使用者面临的任务是，在学校学习阅读、写作和算术技能的同时，还要更好地掌握主流语言。但是，主流语言使用者并不会面对这些额外的语言学习的要求。虽然面对的任务要求从本质上来说，一个群体可能比另一个群体要困难，但两个群体所拥有的时间和评估标准是一样的。因此，我们可以得出结论，有一部分的“成绩差距”是由这些环境因素造成的。58

很容易看出，如果一个儿童说的不是英语，那么他在课堂上就会遇到更大的困难，因为英语既是教学语言，也是他们正在学习阅读的书籍的语言。讲少数族裔方言的人也会遇到同样的困难。作为一名阅读研究人员，我关注的是所说方言的差异是如何改变儿童学习阅读的过程的，从而使得说两种方言的儿童比只说主流美式英语的儿童学习阅读的过程更加复杂。举个例子，掌握文字与言语之间的关系是比较困难的，因为许多单词的发音在不同的方言中是不同的。出现这种情况有几个原因，其中一个是，在某些情况下，非裔美式英语使用者会选择性地省略最后的辅音，比如gold（与非裔美式英语中的bowl押韵）、end（与pen押韵）和drift（与cliff押韵）。59

假设，一位教师对学生解释说，单词gold的拼写是“gee”-“oh”-“el”-“dee”，请拼写出字母。对于一个说主流美式英语的儿童来说，这只是一节关于字母原则的课程，以及组成单词的4个字母的字素与音素之间的对应关系。但是对于一个说非裔美式英语的儿童来说，学会gold这个词的信息转换过程就相对复杂了。在主流美式英语中，从一个单词中删除一个音素后，留下的通常会是一个完全不同的单词（如bust→bus）或一个非单词（如dust→dus）。对于说非裔美式英语的人来说，语言所起的作用是不同的，因为删除最后一个音素通常会产生同一个单词的另一种发音。60儿童还必须了解到，gold这类单词的最后一个字母要么映射到音素上，要么是不发音的，这取决于他们所说的方言。这种发音差异造成的影响是，它采用了一种已经不明晰的拼写系统，使其对于非裔美国读者来说更加困难。61

就像儿童在家里说不同的语言一样，说少数族裔方言的人必须学习一种可替代他们已经掌握的词汇和表达方式的语言。例如，说主流美式英语和非裔美式英语的5岁儿童都使用屈折形态学来标记时态和动名词一致问题，但他们所使用的系统有所不同。非裔美式英语使用者需要学习主流美式英语的版本，因为他们会遇到这样的句子：There is no lake at Camp Green lake（绿湖营地并没有湖）；Grace was a girl who loved stories（格蕾丝是一个喜欢故事的女孩）。这些句子使用的是主流美式英语中正常的语法结构，但通常非裔美式英语中却有其他的表达方式。说两种语言和说两种方言的人还必须学习何时、何地以及和谁，应分别使用哪一种代码来交流，并学会在它们之间自由切换。

获得这种额外的语言专长虽然有好处，但也需要付出一定的成本。62与只说一种语言的儿童相比，在词汇和阅读等方面，说两种语言的儿童在语言发育的早期阶段通常会表现得更差，因为他们的语言经验常常被一分为二。当一名英语学习者落后时，原因在于他们仍在学习学校里使用的英语。说非裔美式英语等少数族裔方言的人可能会落后，因为他们同样也在学习学校里使用的英语，但这种情况却很少有人关注。63

与社会经济地位低的群体一样，说少数族裔方言也是一种风险因素，会对其他情况产生影响，从而产生一系列后果。非裔美国儿童在学习阅读方面的进展情况与他们对主流美式英语知识的掌握程度密切相关，因为书本上的内容完全是使用主流美式英语编写的。经常使用非裔美式英语会对阅读的进展产生负面影响，因为这些儿童对主流美式英语知识的掌握更少。然而，情况并非总是如此。对于语言熟练的儿童来说，说非裔美式英语并不是什么问题，因为他们也精通主流美式英语。64此外，在有利的条件下，儿童可以迅速掌握第二种方言。当其他方面的条件处于不利情况时，如学习机会有限等，与使用两种方言相关的额外要求会产生更大的影响。社会经济地位低是一个非常明显的风险因素，也是很多人关注的焦点。这一点对于英语学习者也一样。方言是一个容易被误解的微妙概念，少数裔族方言一直是政治和文化争议的焦点。方言差异对于儿童从学校学习中获益的机会的影响没有得到人们充分认识，并且有关改善或消除这种影响的讨论也很少。65

在过去的十年里，研究人员积累了更多的证据，证据显示少数族裔方言是造成儿童阅读成绩低的因素之一。66由于长期以来，人们对方言存在严重的偏见和分裂性的对立观点，这些发现值得格外关注。67我必须再次强调，这个问题与方言语言的有效性、其他文化差异或儿童的能力无关。它与环境有关。我使用了单词阅读的计算模型来证明这一点。68这一模型可以用来研究独立于社会经济地位和词汇等因素之外的语言背景是如何影响阅读学习的。我之前描述的模型与主流美式英语的使用者非常相似，他们在说话和朗读单词时使用相同的语音编码。后来，我和同事们探讨了一种假设的情况，即在说话和阅读中都使用非裔美式英语的语音体系。得到的结果是，人们的表现就像主流美式英语模型一样，完全没有问题，这表明非裔美式英语的特性并不是一个障碍。然后，我们研究了说两种方言的情况：在该模型中，非裔美式英语作为家庭方言，其语音用于言语，但必须生成主流美式英语作为学校方言，其语音用于阅读。大约一半的单词在两种方言中有不同的发音。拥有两种发音，使得学习这些单词的拼写-发音映射变得更加困难。当主流美式英语被当作家庭方言，而非裔美式英语被当作学校语言的时候，同样的情况也会发生。不过这种情况在现实世界中是不会发生的，如果发生的话，这表明使用主流美式英语的人也会继承这种“差距”。简而言之，当家庭方言和学校语言的发音不同时，学习单词的拼写-发音映射就会更加困难。我们还发现，通过提供可靠的上下文线索来提示需要使用的是非裔美式英语还是主流美式英语，便可以大大减少这些影响。

方言差异使阅读学习变得更加复杂，但是这种影响可以通过社会经济地位、父母受教育程度、课堂经验、个人性格特征等因素来调节。语言背景十分重要，但结果是由多种因素决定的。

如果说熟悉学校语言很重要，那么教育和社会文化会有什么影响呢？有一种观点认为，对主流美式英语知识的掌握与早期阅读成绩密切相关。如果有机会，在家里说非裔美式英语的儿童，在上学前也能够熟悉主流语言。幼儿是出色的语言学习者，他们有足够的经验去理解两种方言。正如在学前班环境下，引导他们的教职员工都是以不同语言为母语的。儿童如果想要进一步熟悉主流美式英语，并不需要消除他们的非裔美式英语。儿童能够变成掌握方言的人。我们也可以看看其他国家是如何处理类似问题的。澳大利亚和加拿大都有第二套方言习得项目，旨在提高少数族裔中社会经济地位低的人士对主流英语语言的了解。69最后，最重要的是要让教师意识到，主流语言不流利是妨碍阅读提升的一个重要因素。教师职前教育很少涵盖方言和其他基本语言概念的教学。70其实，这种“知识鸿沟”是可以填平的，这也可以纠正人们对非裔美式英语及其使用者的负面看法，从而降低对他们的预期。71

另一种观点认为，家庭方言和学校方言的差异使非裔美式英语使用者处于一种固有的劣势，这种劣势被人们忽略了，并且也没有得到解决。为了在学校取得成功，他们必须努力学习两种方言。72这又是一个生动的实例，说明要想取得成功，他们必须付出双倍的努力。然而，语言学理论表明，有些做法实际上是将非裔美式英语定性为“糟糕的”英语，认为其在本质上逊色于主流美式英语。这些做法包括：强迫儿童学习主流美式英语，甚至指出非裔美式英语和主流美式英语之间的差异会影响学习效果等。73考虑到历史上对非裔美式英语的偏见，这种担忧自然是有道理的。

正如戴维·斯坦纳（David Steiner）和苏珊·罗森（Susan Rozen）在教师教育研究中发现的那样，实施教师教育的学校已经强调了认识、理解和适应文化多样性的重要性。他们列举了一些课程中使用的书籍，例如格洛丽亚·雷得森-比林斯（Gloria Ladson-Billings）的《追梦者》（Dream Keepers）和薇薇安·佩利（Vivian Paley）的《白人教师》（White Teacher）。通过认真的分析和阅读，他们发现：“这些文字通常是有力的、充满挑衅的、令人不安的，它们在很大程度上促进了一个特定教育论点的形成：教师应该支持受压迫的少数族裔群体发出他们自己的声音，分享他们独特的经验，并将这些内容融入雷得森-比林斯所称的与文化相关的教学中。还有另外一种观点认为，教师应该专注于确保所有学生都能够掌握具有普遍价值的知识。但是这种观点并没有得到充分的表述。我们在一个项目中只找到了课程大纲，这份大纲提供了呈现这种对立观点的阅读材料。”74

我们迫切需要深入了解语言的变化，其中包括清楚地认识到，是社会、历史和经济等因素，而不是语言本身的优势，对确定方言是否作为“标准”具有决定性作用，一旦像非裔美式英语这样的少数族裔方言的语言完整性和文化重要性得到人们的重新认识，那么问题就出现了——我们到底应该教什么？非裔美式英语是一种口语化的方言，而我们在学校里学习的课文却是使用主流美式英语编写的。

前面提及的第一种观点基于一种发现，即阅读能力对身心健康和经济发展都至关重要。对于在现有条件下使用非裔美式英语的人来说，要想能够熟练阅读，他们需要有习得主流美式英语的便利。从这个角度来看，我们的目标应该是使所有儿童获得这些技能。我认为应该采取一系列有效措施，包括改变教师培训、在学前班阶段关注语言接触、修改课程和评估实践以反映不同语言背景的差异等，尤其要注意消除不经意但有害的偏见和不公平的比较。75最近，人们的注意力多集中在个人品质的诸多方面，如自我激励、坚韧、毅力和取得成就的“勇气”等。我想补充的是，对学习阅读等任务的投入程度，取决于是否能够获得成功。而失败是一种强烈的抑制因素，尤其是当它在一定程度上是作为内在因素存在的时候。

另一种观点认为，与使用非裔美式英语相关的缺点是由社会和文化习俗导致的，可以说，这是一种不公平的方言特权。作为自我认同的社会正义和文化变革的推动者76，教育者的目标应该是创造一个新的体系来取代现有的带有偏见的体系，而不是使之延续下去。数字技术的出现使得以不同的方式获取信息成为可能，这些替代方案可能就建立在这些方式的基础上。观看视频或收听录音可以减少对阅读的依赖。正如教育理论家道尼·哈西特（Dawnene Hassett）所写的：“运用一种理论方法，将有关权力和知识的后结构理论与有关文化素养的社会文化理论相结合，（我的）分析挑战了一种有关字母识读的传统论调，即认为字母素养是一个时代政治和历史的标识。同时，从新技术、不断变化的文本、读写能力的社会文化形式等方面，我重新定义了教育推理中有关‘恰当的’早期阅读指导。”77换句话说，如果传统的阅读是一种障碍，那就考虑以其他形式体现“读写能力”，包括那些不涉及书面文字的形式。与其努力缩小学习成绩的差距，不如正视它。

有证据表明，这种差距在某种程度上是“内在的”，这一点与某些观察结果是一致的。然而，提倡以其他形式体现读写能力似乎并不是一个值得采纳的建议，因为印刷的文字仍然是一种基本的媒介，而传统意义上的阅读技能仍然是我们与社会主体进行交流的前提条件，这些社会主体对我们的生活质量有着重大的影响。其他形式所体现的读写能力是赋予少数族裔群体权利的一种手段，还是剥夺他们公民权的一种手段？对于我这样一个从传统读写概念中获益，并且社会地位较高的白人来说，设置多余的读写障碍或鼓励退出的前沿理论看起来并不像是什么进步。这些选择也许会遭到家长们的评判，因为对他们来说，这其实就是一个障碍。更有可能的是，他们并不会对这件事做任何评判，因为他们并未意识到他们的孩子正在成为这种教育理论的实验品。

教育与收入水平

虽然教育对所有人来说都很重要，对那些处于不利因素影响下的儿童，包括来自较低社会经济地位家庭的儿童以及使用少数族裔方言的儿童来说，教育就显得尤为重要了。对于那些真正处于较高社会经济地位的人，如果使用之前提到的“国家学校午餐计划”来衡量，这些人绝不仅仅是指处于享受免费午餐这个标准以上的那些人，他们拥有众多在生活上和学校里获得成功的条件。教育质量至关重要，但是在不利的环境中，教育质量还不是最重要的影响因素。我认为这一点已经很明显，如今它获得了新证据的支持。

我之前提到过，从基因对于阅读的影响这一角度来分析，高智商儿童受到的影响要高于低智商儿童。这一结果来自针对双胞胎的遗传能力研究所获得的统计数据。社会经济地位因素也具有类似的影响效果。对于社会经济地位更高的个体来说，阅读等相关技能的遗传性很高，而其受环境因素的影响很低。当个体持续处于积极的环境时，在观察到的儿童的阅读变化中，遗传因素的影响很大。对于社会经济地位较低的个人来说，这种影响是相反的，环境的变化对其阅读和学业成绩的影响要比遗传因素大得多。78

这一证据使拉维奇和她的同事关于美国教育发展状况的争论处于更加令人担忧的境地。据报道，美国的教育体系运行良好，但是对于那些来自社会经济地位较低家庭的儿童来说却并非如此。对于那些来自中高等社会经济地位家庭的儿童来说，他们在美国目前的教育体系中得到的是较高的分数。在这一群体中，亲子关系比教育体系发挥的作用更大。而对于来自低收入家庭的儿童来说，环境是重要的影响因素，其中教育发挥着重大的作用，这些儿童在教育体系中得到的却是较低的分数。拉维奇和她的同事的理论只会对那些受教育质量影响较小的儿童发挥作用。对于那些受教育质量影响较大的儿童来说，拉维奇等人的理论则完全放弃了教育对这些儿童应负的责任。与其狭隘地关注贫困对于学生成绩低的巨大影响，不如集中精力努力提升教育质量，因为教育质量对于提高教育成果发挥着巨大的作用。

我用拉维奇的告诫来结束本章：“如果有人声称，在过去20年里，阅读没有发生丝毫改善，那你千万不要相信他。这绝对不是真的。”阅读确实有所改善，只是受益的人还不够多。

如涉及版权，请著作权人与本网站联系，删除或支付费用事宜。

第10章 美国人的阅读水平

第10章美国人的阅读水平