• 精选
  • 会员

04 每个人的头脑中都装着一套构词法

2020年9月23日  来源:语言本能 作者:(美)史蒂芬·平克 提供人:pigu61......

通过构词法,人们就可以将词根扩展为词干,将词干扩展为词语,从而创造出千千万万的词语。符号与意义之间的关系深深地扎根于儿童的头脑中。我们的心智天生就是为了发现这个世界上所存在的各式各样的物体和运动,并用单词来一一标记它们。


在英语中,“glamour”(魅力)一词是“grammar”(语法)的变体,而自“乔姆斯基革命”以来,这种词源关系就显得更为贴切了。面对心理语法的创造力,看着它用一组有限的规则传递出无限的思想,谁能不为之目眩神迷呢?曾经有一本探讨心智与外物的书,书名就叫作《合乎语法的人》(Grammatical Man),而某位诺贝尔奖获得者在其获奖演说中也将生命机制比作生成语法。如今,不但杂志《滚石》(Rolling Stone)对乔姆斯基进行过专门采访,就连《周六夜现场》(Saturday Night Live)这样的综艺节目也不时提及他的名字。在伍迪·艾伦的小说《门萨的娼妓》(The Whore of Mensa)中有这样一个情景:

顾客问道:“假如我想让两个女孩给我解释一下诺姆·乔姆斯基呢?”

她回答说:“这会花你不少钱的。”

形形色色的构词法和不计其数的单词

与此相对的是,心理词典却缺少这种光环。它看上去仅仅是一张枯燥乏味的单词表,必须通过死记硬背才能录入大脑之中。作家塞缪尔·约翰逊(Samuel Johnson)在自己编纂的《英语词典》的序言中说道:

从事卑微工作的人注定要接受这样的命运:他们的努力完全是出于对不幸的恐惧,而并非是为美好前景所吸引。他们备受责难,得不到任何赞扬。他们因为失败而名誉扫地,因为疏忽而遭受惩罚,而且即便成功也听不到掌声,付出也得不到回报。

词典编纂者就是这些不幸人士中的一员。

约翰逊在词典中将“词典编纂者”定义为“一种无害的苦工,整日埋头于探寻词源、描述词义的工作”。然而,我们将在本章中看到,这是一种有失公允的见解。就神奇精妙而言,词语世界并不逊于语法世界,甚至还更胜一筹。因为人们不但在造字构词上表现出与构造短语和句子同样丰富的创造力,而且在对个别单词的记忆上也需要用到某种专门的技艺。

回想一下前面提到的“wug测试”,几乎所有学龄前儿童都可以顺利通过。“这是一只wug,现在这里有两只了,这里有两只______。”在接受测试之前,孩子们既没有听过“wugs”一词,也不曾因为说出“wugs”一词而得到过奖赏。因此,单词并不是简单地从心理档案中调取出来的,人们必定拥有一套心理规则,能够在现有单词的基础上生成新的单词,好比说“如果要将名词变成复数,必须在词尾加上后缀‘-s’”。作为一种离散组合系统,人类语言背后的工程技巧至少表现在两个不同层面:一是依据句法规则,将单词组成句子和短语;二是依据一套所谓的“词法”(morphology)规则,将一些更小的元素组合成单词。

与其他语言相比,英语词法的创造力就显得相形见绌。在英语中,名词只有两种形式(“duck”和“ducks”),动词只有四种形式(“quack”“quacks” “quacked”和“quacking”)。而在现代意大利语和西班牙语中,每个动词都有大约50种形式。在古希腊语中,动词形式达到350种。土耳其语的动词形式则更为惊人,居然有200万种!我前面提到的许多语言,如爱斯基摩语、阿帕切语、霍皮语、奇温久语和美国手语,都以这种惊人的创造力著称于世。它们是如何做到这一点的呢?我们不妨以奇温久语为例:奇温久语是班图语的一支,据说这种语言与英语比起来就像是国际象棋与国际跳棋。在奇温久语中,动词“N??kìm′lyì?à”的意思是“他在替她吃它”,这个单词一共由8个部分组成:

● N-:“主题”标记。它表明这个单词是当前谈话的“中心”。

● -?-:“主语一致性”标记。它表示“吃东西的人”属于16种词性中的第一性,即“单数的人”(前面已经说过,语言学家所说的“性”与性别无关,而是“种类”的意思)。其他名词词性还包括:复数的人、狭窄或长形的物体、成双或成群的物体、量词“双”或者“群”,工具、动物、身体部位、指小词(事物的缩小状态或小巧形态)、抽象的特性、准确的位置以及一般的地点。

● -?-:现在时态。班图语中的时态类型还有:今天、今天早些时候、昨天、不早于昨天、昨天或更早的时候、遥远的过去、日常性的、正在进行的、连续性的、假设中的、将来发生的、时间未定的、尚未发生的、有时发生的。

● -kì-:“宾语一致性”标记。此处表示“被吃的东西”,属于第7性。

● -mˊ-:“受益者”标记。它表明该动作的发生是为了谁的利益,此处的受益者属于16种词性中的第1性。

● -lyì-:动词“吃”。

● -?-:“受事”(applicative)标记。它表明在整个动作中多出了一个参与角色,此处指的是受益者。如果用英语来打比方,这就如同要求我们在说到“I baked her a cake”(我为她烤了一块蛋糕)时,必须在动词“bake”后加上某种后缀,以区别于“I baked a cake”(我烤了一块蛋糕)。

● -à:词尾元音。表明此处是陈述语气,而非虚拟语气。

如果你将以上7种前后缀的组合方式全部列举出来,大致可以得到50万个结果,而奇温久语中的每个动词都有这么多的可能形式。可以说,奇温久语和其他类似的语言是将整个句子装进了一个复杂动词之中的。

不过,我对英语的看法似乎略欠公平。在“屈折”(inflectional)构词——通过词形变化来实现语法功能方面,英语的确显得简单粗糙,例如给名词加上“-s”表示复数,或给动词加上“-ed”表示过去时态。但是,英语拥有自己的“派生”(derivational)构词法,即在原有单词的基础上派生出新的单词。比如后缀“-able”可以将表示“去做某事”的动词转变为形容词,表示“能够做成某事”,例如“learnable”(可学会的)、“teachable”(可教会的)以及“huggable”(可拥抱的)。在英语中,派生后缀的数量多得惊人,以下是一些较为常见的后缀:

?

此外,英语拥有一套轻松自如的“复合”(compounding)构词法,它可以将两个单词灵活地组合起来,构成一个新的单词,例如“toothbrush”(牙刷)和“mouse-eater”(食鼠怪)。多亏有了这些方法,才使得“词法贫瘠”的英语可以拥有海量词语。计算机语言学家理查德·史伯乐(Richard Sproat)曾将美联社自1988年2月中旬以来的新闻稿件中共计4 400万个单词进行了汇集,以便从中梳理出个体单词的数量。截至当年12月30日,他一共收集到30万个不同的单词,大约相当于一部足本英语词典的收词量。你或许会认为这一定已经包含了所有可能出现在新闻稿件中的英语单词,但当史伯乐翻到12月31日的新闻稿时,他又发现了至少35个新词,如“instrumenting”“counterprograms”“armhole” “part-Vulcan”“fuzzier”“groveled”“boulderlike”“mega-lizard”“traumatological”和“ex-critters”。

更令人印象深刻的是,每种构词规则又可以与其他规则相结合,或者进行自我重复,以形成新的单词。例如,我们可能会说到某些炸薯条是“不可以用微波加热的”(unmicrowaveability),或者提到某个用来存放牙刷架吸盘的“牙刷架吸盘存放盒”(toothbrush-holder fastener box)。这使得语言中可能拥有的单词数量更为庞大,它就像句子的数量一样,可以是无穷无尽的。撇开那些为打破吉尼斯纪录而杜撰出来的古怪单词不谈,迄今为止,英语中最长的单词或许是“floccinaucinihilipilification”,《牛津英语词典》对其的解释是“将某物看得一文不值”。但纪录总是要被打破的:

floccinaucinihilipilificational:

与“将某物看得一文不值”有关的。

floccinaucinihilipilificationalize:

使某物与“将某物看得一文不值”有关。

floccinaucinihilipilificationalization:

使某物与“将某物看得一文不值”有关的行为。

floccinaucinihilipilificationalizational:

与使某物与“将某物看得一文不值”有关的行为有关的。

floccinaucinihilipilificationalizationalize:

使某物与使某物与“将某物看得一文不值”有关的行为有关的行为。

如果你患有“恐长字症”(sesquipedaliaphobia)的话,你可以想一想你的曾祖母(great-grandmother),你的曾曾祖母(great-great-grandmother),你的曾曾曾祖母(great-great-great-grandmother),而一共可以有多少个“曾”字,就看你的家族自夏娃以来一共经历了多少代了。

更重要的是,单词和句子一样有精密的层级结构,而并非出自字串机之手(这种机器从某个列表中选取一个元素,再移到下一个列表选取一个元素,然后是再下一个列表……)。当里根总统提出战略防御计划,也即人们熟知的“星球大战”计划时,他设想在未来的世界里,美国可以用“反导弹导弹”(anti-missile missile)拦截苏联发射的导弹,但批评人士指出,苏联完全可以用“反反导弹导弹导弹”(anti-anti-missile-missile missile)予以还击。不过这并不是问题,那些毕业于麻省理工学院的工程师们宣称,我们只须制造一个反反反导弹导弹导弹导弹”(anti-anti-anti-missile-missile-missile missile)就行。这些高科技武器也需要一种高科技语法,用以记录单词的开头有多少个“anti”,以便在同等数量的“missile”之后再添加一个“missile”,从而结束这个单词。单词的结构语法(即单词的短语结构语法)能够通过在“anti”和“missile”之间嵌入单词来实现造词目的,而字串机则做不到这一点,因为当它移动到这个冗长单词的末尾时,早已忘记了自己在词头部分放置了什么。

词是词干的扩展

和句法一样,词法也是一个设计精巧的系统,许多看似古怪的单词都是其内在逻辑的预期结果。单词拥有一个精密的结构,构成部件叫作“语素”(morpheme),它们以特定方式组合在一起。单词的结构系统是X-杠短语结构系统的延伸,在这个系统中,大的名词性成分建立在小的名词性成分之上,而小的名词性成分又建立在更小的名词性成分之上,以此类推。与名词有关的最大短语是名词短语,名词短语中包含了一个N-杠,而N-杠中包含一个名词——单词。我们只需要将这个解剖过程继续下去,将单词分解成更细小的名词性部件,就可以从句法跳到词法了。

下面是单词“dogs”的结构图:

位于这棵小树顶端的N代表“名词”,这意味着整个单词可以插入任何一个名词短语的名词插槽之中。在单词之下的层级中,我们看到了两个部分:一是名词原形“dog”,通常被称为“词干”(stem);一是复数的词形变化“-s”。此处涉及的词形变化规则(即著名的“wug测试”)十分简单:

N → Nstem Ninflection

一个名词可以由一个名词词干加上一个名词词形变化构成。

这一规则能够与心理词典很好地衔接:“dog”可以被列为名词词干,意为“狗”;“-s”则可以被列为名词的词形变化,意为“复数的”。

这是最简单、也最精练的语法规则。在我的实验室中,我们将它看作一个易于研究的心理语法实例。通过它,我们可以详细了解语言规则的心理表现,从婴儿到老年,从正常人到神经受损的患者,这与生物学家通过果蝇来研究基因机制大致相同。将词干与词形变化黏连起来的规则虽然简单,但却是一项功能强大的运算操作,因为它能够辨认出抽象的心理符号,例如名词词干,而不是与某个特定的单词、语音或者意义列表相关联。我们可以将这个规则应用于位于心理词典“名词词干”条目之下的任何项目,而不必在意这个单词的含义。我们不仅可以将“dog”转变成“dogs”,还可以将“hour”转变成“hours”、“justification”转变成“justifications”。同样,这个规则允许我们将任意一个名词转换成复数,而不必管它的读音是什么,我们同样懂得如何将不规则发音的单词变成复数,例如“the Gorbachevs”“the Bachs”。同样的道理,这个规则可以完美地应用到全新的名词上,例如“faxes”“dweebs”“wugs”和“zots”。

正因为我们可以毫不费力地运用这个规则,所以也许只有将它和许多计算机学家标榜为未来潮流的计算机程序进行对比时,才能吸引些许赞赏的目光。这些被称作“人工神经网络”(artificial neural networks)的程序运用的是不同的规则,它们依靠的是类比。“wug”之所以应该转变成“wugged”,是因为它与网络所能识别的“hug-hugged”“walk-walked”等成千上万个动词变形实例大体相似。但是,当网络碰到一个与以往经验毫不类似的全新动词时,它就不知所措了,因为这种网络缺乏一个抽象的、包罗万象的范畴“动词词干”助它一臂之力,为它添加词缀。我们不妨将人和人工神经网络在“wug测试”中的一些典型做法进行对比:

同样,词干也可以由位于复合词较深层级的部分构成,例如复合词“Yugoslavia report”(南斯拉夫报告)、“sushi-lover”(寿司爱好者)、“broccoli-green”(西兰花般的绿色)、“toothbrush”(牙刷):

这两个词干连在一起,构成一个新的词干。规则如下:

Nstem → Nstem Nstem

一个名词词干可以由一个名词词干加上另一个名词词干构成。

在英语中,复合词通常由一个连字符来连接,或者直接将两个单词合并而成,不过也可以将两个部分分开拼写,就像两个独立的单词。这种情况往往会让你的语法老师产生混淆,他会告诉你说,这里的“Yugoslavia”(南斯拉夫)是一个形容词。然而,只要将“Yugoslavia”和真正的形容词(如“interesting”)进行一番比较,你就知道语法老师的说法并不正确,你可以说“This report seems interesting”(这份报告似乎很有趣),但不能说“This report seems Yugoslavia”(这份报告似乎很南斯拉夫),这是区分复合词与短语的一个简单方法。复合词的重音通常落在第一个单词上,而短语的重音则往往在第二个单词上。例如短语“dark róom”指的是没有光亮的房间,而复合词“dárk room”(暗室)则是指摄影师冲洗照片的暗室,在冲洗完照片之后,暗室是可以开灯的。短语“black bóard”指的是黑色的木板,而复合词“bláckboards”(黑板)则可以是绿色的,甚至可以是白色的。如果缺乏读音或标点上的线索,一些字串既可以被看作是短语,也可以被看作是复合词。例如下面几则新闻标题:

Squad Helps Dog Bite Victim

警方救护被狗咬伤的受害者。——又可理解为:警方助狗咬伤受害者。

Man Eating Piranha Mistakenly Sold as Pet Fish

吃人的水虎鱼被误作为观赏鱼出售。——又可理解为:吃水虎鱼的男人被误作为观赏鱼出售。

Juvenile Court to Try Shooting Defendant

少年法庭审问枪击事件的被告。——又可理解为:少年法庭试图枪击被告。

旧的词干加上某种词缀(前缀和后缀),也可以形成新的词干,例如“-al”“-ize”和“-ation”。通过循环使用这些词缀,我可以制造出长度无限的单词(就像“sensationalizationalization”)。举例而言,动词加上“-able”可以创造出一个形容词,如“crunch-crunchable”,后缀“-er”可以将任何动词变成名词,如“crunch-cruncher”,后缀“-ness”可以将任何形容词变成名词,如“crunchy-crunchiness”。

它的结构规则是:

Astern →Stem Astemaffix

一个形容词词干可以由一个词干加上一个后缀构成。

在心理词典中,后缀“-able”的条目大体如下:

-able:

形容词词干的词缀

意思:能够被X的

附着于动词词干之上

与屈折变化一样,词干词缀也具有杂交性,它可以与正确类别下的任何词干进行匹配,所以我们可以创造出“crunchable”“scrunchable”“shmooshable”“wuggable”等一系列形容词,它们的含义也是可预测的:“能够被压碎的”“能够被碾碎的”“能够被缓解的”,甚至“能够被wugged的”,无论wug的意思是什么。当然,我可以找到一个例外:句子“I asked him what he thought of my review of his book, and his response was unprintable”(我问他怎么看待我为他的书所写的评论,他的回答是不宜刊登的),“unprintable”一词的意思比“incapable of being printed”(不能够被刊登出来)更具深意。

我们可以依据构成元素的意义来计算整个词干的意义,这类似于句法中所使用的方法。一个特殊的元素是中心语,它决定了整个单词的指涉对象。正如短语“the cat in the hat”涉及的是一只猫,“cat”是它的中心语一样,“Yugoslavia report”涉及的是一份报告,“shmooshability”涉及的是一种能力。因此,“report”和“ability”是这些单词的中心语。英语单词的中心语就是位于最右边的语素。

词根,词干的最小组成部分

如果继续解剖下去,我们可以将词干划分成更小的部分。单词的最小部分,即不能再被切分的部分,叫作“词根”(root)。词根可以和特定的后缀结合在一起形成词干,例如词根“Darwin”(达尔文)就包含在词干“Darwinian”(达尔文的)之中,词干“Darwinian”又可以借助后缀规则形成新的词干“Darwinianism”(达尔文主义),由此出发可以衍生出单词“Darwinianisms”(达尔文主义者们),它体现了单词结构所包含的三个层级:

有趣的是,这些部件只能以特定的方式组合在一起。“Darwinism”这个由词干加后缀“-ism”形成的词干不能再做“-ian”的宿主,因为“-ian”只能与词根相连,所以“Darwinismian”这个词(表示“与达尔文主义有关”的意思)听起来就非常可笑。同样,“Darwinsian”(表示“与查尔斯·达尔文或伊拉斯谟斯·达尔文有关”的意思)“Darwinsianism”“Darwinsism”也是不能成立的,因为已经发生了屈折变化的单词不能再添加任何词根或词干后缀。

如果深入到词根和词根词缀的层级,我们就如同进入了一个奇特的世界。以“electricity”(电力)一词为例,它似乎包含了两部分:“electric”和“-ity”:

但是,这些单词真的是依据一定的规则,将心理词典中的条目“-ity”与词根“electric”黏连而成的吗?就像如下表述:

Nstem → Nroot Nrootsuffix

一个名词词干可以由一个名词词根和一个后缀构成。

-ity:

名词词根后缀

意思:某种状态

附着于名词词根上

然而,这一次却不是这样。首先,你不能将“electric”一词与后缀“-ity”简单相加得到“electricity”,因为这样一来它的读音就变成了“electrick itty”。在单词“electricity”中,“-ity”所附着的词根在发音上出现了变化,读作“electríss”。当我们把后缀移除之后,剩下的那部分就是词根,而它是没有固定发音的。

其次,“词根-词缀”的组合在意义上也是不可预测的,从局部解释整体的解读方法在这里行不通。“complexity”表示的是一种复杂的状态,但“electricity”却并非表示有电的状态,你显然不会说出“the electricity of this new can opener makes it convenient”(这个新型开瓶器的电力使其它非常好用)这样的句子,它表示的是一种促使某物发电的力量。同样,“instrumental”(有帮助的)与“instruments”(仪器)无关,“intoxicate”(使陶醉)也并非有毒(toxic)的物质,我们不会在“recital”(演奏会)上朗诵(recite),“five-speed transmission”(五档变速器)也并非是一种传递(transmit)行为。

最后,这种假定的规则和词缀并不能毫无限制地应用于单词之上,这与我们之前考察的其他规则和词缀不同。例如,我们可以找到“academic”“acrobatic”“aerodynamic”和“alcoholic”这些单词,但却找不到“academicity”“acrobaticity”“aerodynamicity”和“alcoholicity”(这还只是用我的电子词典检索到的以“-ic”结尾的前4个单词而已)。

因此,在单词结构的第三个,也是最低端的层级(即词根和词缀)上,我们找不到一个名副其实的规则,可以根据“wug测试”的可预测公式来构建单词。在心理词典中,词干似乎都具有某种独属于自己的特殊含义。许多复杂词干都形成于文艺复兴之后。当时,学者们从拉丁语和法语中“进口”了许多单词和后缀,并采用了一些与之相适应的规则。我们继承了这些单词,但却抛弃了它们的规则。我们之所以认为现代英语的使用者是通过树形图的方式来分析这些单词的,而非依靠语音的异同,是因为我们都觉得在“electric”和“-ity”之间存在一个自然的间隙停顿,而且我们也认识到其他任何以“-ity”为结尾的单词都是名词。

我们能够识别出单词内部存在的模式,虽然我们知道这个模式并非某种硬性规则的产物,这种能力正是文字游戏的灵感源泉。一些注重辞藻的作家和演说家常常用类比的方式,用拉丁语的词根后缀来制造新的单词,例如“religiosity” “criticality”“systematicity”“randomicity”“insipidify”“calumniate”“conciliate,”“stereotypy”“disaffiliate”“gallonage”和“Shavian”。这些单词给人以冠冕堂皇之感,因此很容易成为模仿、打趣的对象。1982年,有“大话篓子”之称的美国国务卿亚历山大·黑格(Alexander Haig)提出辞职,漫画家杰夫·麦克内里(Jeff MacNelly)在他的一幅社论漫画中为黑格编排了一段辞职演说:

I decisioned the necessifaction of the resignatory action/option due to the dangerosity of the trendflowing of foreign policy away from our originatious careful coursing towards consistensivity, purposity, steadfastnitude, and above all, clarity.

我们外交政策的制定原本是要坚持一贯性、目标性、坚定性以及最为重要的清晰性。然而,我发现事态发展的走向性有偏离这一初始性目的的危险性,于是我决定了辞职性行为的必要性。

另一幅漫画出自汤姆·托尔斯(Tom Toles)之手,它描绘了一位大胡子院士正在向人们解释为什么美国的大学本科标准入学考试成绩会跌至历史最低水平:

Incomplete implementation of strategized programmatics designated to maximize acquisition of awareness and utilization of communications skills pursuant to standardized review and assessment of languaginal development.

建立在对语言发展的标准化的检讨和评估之上的、并旨在最大程度地获取知识和发挥沟通能力的战略性的教育大纲没有得到完整的实施。

在计算机程序员和管理员的世界里,这种类比的方法常常被当作一种玩笑,以显示文字的精确性,而非炫耀辞藻。在专门收集黑客术语的《新黑客词典》(The?New Hacker’s Dictionary)中,几乎全面收罗了英语中那些不能自由添加的词根词缀:

ambimoustrous

形容词,能够用任意一只手操作鼠标。

barfulous

形容词,可以使任何人呕吐的。

bogosity

名词,某样东西的虚假程度。

bogotify

动词,使某物失去效用。

bozotic

形容词,像马戏团小丑一样愚蠢的。

cuspy

形容词,设计上优雅整洁。

depeditate

把……的脚砍掉。(例如,在打印时漏打了页面的底部)

dimwittery

名词,愚蠢说法的例子。

geekdom

名词,技术怪咖的状态。

marketroid

名词,公司营销部的成员。

mumblage

名词,一个人喃喃自语的话题。

pessimal

形容词,“最佳的”的反义词。

wedgitude

名词,被卡住的状态(不借助外力则无法前进)。

wizardly

形容词,与专业程序员相关的。

一旦深入到词根层级,我们还会发现一些杂乱无章的情形,即不规则的复数形态(例如“mouse-mice”“man-men”)和不规则的过去时态(例如“drink-drank”“seek-sought”)。不规则的形式常常结伴而行,比如说“drink-drank”“sink-sank”“shrink-shrank”“stink-stank”“sing-sang”“ring-rang”“spring-sprang”“swim-swam”“sit-sat”,或者“blow-blew”“know-knew”“grow-grew”“throw-threw”“fly-flew”和“slay-slew”。这种情况的出现,是因为数千年前的原始印欧语(即包括英语在内的大多数欧洲语言的祖语)拥有这样一个规则:通过元音的替换变成过去时态,就像我们现在在词尾添加“-ed”的规则一样。现代英语中的不规则动词或者说“强变化”(strong)动词只不过是古老规则的化石,而规则本身早已不复存在。大部分看起来本应归于不规则动词之列的动词被粗暴地排除在外,正如我们在下面这首英文打油诗中所看到的情况:

Sally Salter, she was a young teacher who taught,

And her friend, Charley Church, was a preacher who praught;

Though his enemies called him a screecher, who scraught.

His heart, when he saw her, kept sinking, and sunk;

And his eye, meeting hers, began winking, and wunk;

While she in her turn, fell to thinking, and thunk.

In secret he wanted to speak, and he spoke,

To seek with his lips what his heart long had soke,

So he managed to let the truth leak, and it loke.

The kiss he was dying to steal, then he stole;

At the feet where he wanted to kneel, then he knole;

And he said, “I feel better than ever I fole.”

人们只能通过死记硬背的方法来记住每个不规则动词的过去时态,不过,正如这首打油诗所显示的,人们可以敏锐地察觉出其中的变化模式,并将其运用到新的词语上,以制造出幽默的效果,就像在“官腔”(Haigspeak)或者“黑话”(hackspeak)中一样。我们当中的许多人会忍不住地使用“sneeze-snoze”“squeeze-squoze”“take-took-tooken”“shit-shat”等变化形式,觉得它们更加精巧可爱,而这正是以“freeze-froze”“break-broke-broken”“sit-sat”为类比对象。在《疯狂英语》一书中,莱德勒撰写了一篇题为《鸡舍狐狸》(Foxen in the Henhice)的短文,对英语中的不规则复数形式进行了疯狂恶搞:例如“booth-beeth”“harmonica-harmonicae”“mother-methren”“drum-dra”“Kleenex-Kleenices”和“bathtub-bathtubim”。计算机黑客则肆无忌惮地使用“faxen”“VAXen”“boxen”“meece”和“Macinteesh”等词语。《新闻周刊》(Newsweek)曾经把身着白色镶石服装的拉斯维加斯表演者称为“Elvii”(“猫王”们)。在连环画《史努比》(Peanuts)中,莱纳斯(Linus)的老师欧特玛(Othmar)小姐要求班上的学生用蛋壳制作“igli”(爱斯基摩人用雪块砌成的圆顶小屋,单数形式为“igloo”)模型。玛吉·沙利文(Maggie Sullivan)曾在《纽约时报》上撰稿,要求对更多的动词进行强变化,以达到“强化”英语的目的:

Subdue(征服),subdid,subdone:Nothing could have subdone him the way her violet eyes subdid him.

没什么能像她的蓝紫色眼睛那样把他征服了。

Seesaw(玩跷跷板),sawsaw,seensaw:While the children sawsaw, the old man thought of long ago when he had seensaw.

当孩子们玩翘翘板时,老人想起自己玩翘翘板已经是很久以前的事了。

Pay(付出),pew,pain:He had pain for not choosing a wife more carefully.

择妻不慎让他付出了代价。

Ensnare(诱惑),ensnore,ensnorn: In the 60’s and 70’s, Sominex ads ensnore many who had never been ensnorn by ads before.

在20世纪60~70年代间,盐酸苯海拉明片剂的广告诱惑了许多之前未受广告诱惑的人。

Commemoreat(纪念),commemorate, commemoreaten:At the banquet to commemoreat Herbert Hoover, spirits were high, and by the end of the evening many other Republicans had been commemoreaten.

在纪念赫伯特·胡佛的宴会上,人们情绪高涨,到晚宴结束的时候,许多其他的共和党人也一并受到纪念。

波士顿流传着一个古老的笑话,一位妇女在洛根机场下了飞机,她询问出租车司机说:“Can you take me someplace where I can get scrod?”(你能把我载到有卖鳕鱼片的地方吗?)司机回答说:“Gee, that’s the first time I’ve heard it in the pluperfect subjuctive”.(哈!这可是我第一次听到有人在虚拟语气的过去完成时中使用“screw”一词。)

有时,某个幽默的或者听起来很酷的词形变化会在语言社区中得到认同,并传播开来,例如几百年前的“catch-caught”因为“teach-taught”的类比关系而固定下来,今天的“sneak-snuck”也因为“stick-stuck”的类比关系而被人们接受。我还听说在爱逛商场的年轻人中,“has tooken”已经成为他们的首选形式。当我们将不同的方言进行比较时,就可以清晰地看到这一变化轨迹,因为方言中保存了各自早先风尚的产物。脾气乖张的专栏作家H. L.门肯(H. L. Mencken)同时也是一位颇受尊敬的业余语言学家,他记录了美国各地方言中的许多过去式。例如“heat-het”(与“bleed-bled”类似)、“drag-drug”(与“dig-dug”类似)、“help-holp”(与“tell-told”类似)。圣路易红雀队投手、哥伦比亚广播公司棒球解说员迪齐·迪安(Dizzy Dean)因为一句“He slood into second base”(他溜到了二垒)的解说辞而臭名昭著,然而,这种变化形式在他的家乡阿肯色州十分常见。在40多年里,全美国的英语教师都在前仆后继地给哥伦比亚广播公司写信,要求把迪安开除,这反而让他倍感得意,他在大萧条时期曾经反唇相讥:“A lot of folks that ain’t sayin’ ‘ain’t’ ain’t eatin’”(凡是不说“ain’ t”的人都没饭吃。)他还在某次现场直播时说出这样一番解说辞,目的就是为了折磨那些英语教师的耳朵:

The pitcher wound up and flang the ball at the batter. The batter swang and missed. The pitcher flang the ball again and this time the batter connected. He hit a high fly right to the center fielder The center fielder was all set to catch the ball, but at the last minute his eyes were blound by the sun and he dropped it!

投手卯足了劲,向着击球手奋力掷球。击球手挥棒击球,但没有击中。投手再次掷球,这一次击球手击中了球,他打了一个高飞球,球向中场手直飞而去。中场手做好了接球的准备,但是在最后一刻,他的视线受到阳光的干扰,他失了手!

但是,在这些创造性的运用中,真正成功的例子并不多见,不规则的词形变化依然属于独来独往的异类。

是Walkmen,还是Walkmans?

语法中的不规则现象就像人类某些古怪变态的行为一样。不规则的形式在“理性设计”的语言中被明确地废除,例如世界语、奥威尔的新话以及罗伯特·海因莱因(Robert Heinlein)的科幻小说《星际时代》(Time for the Stars)中行星联盟所使用的辅助性语言。也许是为了挑战这种严格的控制,某位女士最近在《纽约书评》(New York Review of Books)上刊登了一则别出心裁的广告,希望寻求到一位不拘传统的灵魂伴侣:

你是不是一个不规则动词,相信名词比形容词更有力量?本人离异5年,白人,职业女性,身居欧洲,兼职小提琴手。本人身材苗条、具有魅力,孩子已婚……寻求一位情感细腻、积极乐观、充满活力的男子为伴,要求年龄在50~60岁之间,注重健康,爱动脑筋,为人诚实、忠贞和坦诚。

小说家玛格丽特·尤瑟纳尔(Marguerite Yourcenar)也曾对语法的不规则现象和人类的普遍处境进行了一番点评:

语法,既拥有逻辑的规则,又掺杂着武断的用法,它让年轻的头脑预先品尝到法律、道德这些关乎人类行为的科学,以及建立在人们本能经验之上的一切固有秩序带给他们的滋味。

虽然不规则现象象征着不受羁绊的人类精神,但它却被严格地密封于单词的构造系统之中。总体而言,这个系统设计得非常巧妙。不规则形式是词根,它位于词干之内,词干则包含在单词之内,而部分单词又可以通过常规变形来生成。这种分层方法不仅可以对许多英语单词的合理性做出预测(例如,为什么“Darwinianism”听起来比“Darwinismian”要更加顺耳),它还提供了一个简明的解释,可以回答与那些看似不合逻辑的用法相关的许多琐碎问题。例如,为什么在棒球比赛中,击球手是“flied?out to center field”(击出腾空球至中外场被守方球员接住而出局),而不是“flown?out to center field”?为什么多伦多冰球队名叫“Maple Leafs”(枫叶)而不是“Maple Leaves”?为什么多数人认为“Walkman”(随身听)的复数形式是“Walkmans”而不是“Walkmen”?当一个人说自己女儿的朋友都是“low-lives”(人渣)时,我们为什么会觉得非常别扭?

为什么这些不规则形式都被弃之不用?翻开任何一本写作手册或者语法指南,它们提供的解释不外乎以下两种,而这两种解释都是错的。第一种解释是,现代英语已经对不规则单词关上了大门,所以新加入的单词都必须以规则的形式出现。这种说法并不正确,我可以创造出一些新的单词,例如“re-sing”和“out-sing”,它们的过去式显然是“re-sang”和“out-sang”,而不是“re-singed”和“out-singed”。同样,最近我读到一篇文章,说的是一些中国农民带着小油罐在油田四处转悠,从无人看守的油井中盗取石油的事情。文章把这些人称作“oil-mice”(油耗子),而非“oil-mouses”。第二种解释是,当一个单词获得了与字面内容毫不相干的全新意思时,例如棒球中的“fly out”,它就必须遵循规则变化。然而,“oil-mice”的例子就是一个明显的反例,此外,还有许多具有象征意义的词语由不规则名词构成,它们依然保持着不规则的变化形式,例如“sawteeth”(而非“sawtooths”)、“Freud’s intellectual children”(而非“childs”)、“snowmen”(而非“snowmans”),等等。同样,动词“blow”在俚语“to blow him away”中表示“暗杀”的意思,在“to blow it off”中表示“无视”的意思,但它的过去式仍然采用不规则变化,例如“blew him away”和“blew off the exam”,而非“blowed him away”和“blowed off the exam”。

能够真正解释“flied out”和“Walkmans”等形式变化的是我们用以解读复合词的心理算法,即依据其内部单纯词的意思来诠释复合词的意思。我们曾经提到,如果某个大词是由较小的单词建构而成的,那么这个大词的所有特性都来自其内部最后端的那个单词,也就是中心语。动词“overshoot”的中心语是动词“shoot”(发射),因此“overshooting”属于“shooting”的一种,而且它是一个动词,因为“shoot”是一个动词。同样,“workman”(工人)是个单数名词,因为它的中心语“man”是个单数名词,它指的是一种人,而不是一类工作。这两个单词的结构如下:

重要的是,这条从中心语一直延伸到树形图顶端的管道将中心语携带的所有信息都传递了上去,其中不仅包括中心语的名词性或动词性和包括中心语的意思,还包括它的不规则形式。举例而言,在心理词典中,“shoot”一词的条目会注明:不规则的过去式“shot”。这一信息将会向上传递,并和其他信息一样,成为复合词“overshoot”的特性,因此“overshoot”的过去式是“overshot”而非“overshooted”。同样,“man”一词携带着复数形式“men”的标签,由于“man”是“workman”的中心语,这个标签也会上移到代表复合词“workman”的上,所以“workman”的复数形式是“workmen”。这也是我们为什么采用“out-sang”“oil-mice”“sawteeth”和“blew him away”的原因。

现在我们可以回答那些琐碎的问题了。“flied out”和“Walkmans”之所以显得有些奇特,是因为它们都没有中心语。无中心语单词是一种特殊词干,出于某种原因,它们的特性与位于词中最右端的元素有所不同,而普通单词的特性则往往取决于词中最右端的元素。举一个简单的例子,“low-life”就是一个无中心语单词,它指的不是一种“生活”(life),而是一种人,一种活在社会底层的人。因此在“low-life”一词中,正常的传输管道被阻塞了。而且,单词内部的管道不可能只阻塞某一种信息,一旦管道因为某种原因出现了阻塞,所有的信息都不能通过。因此,如果“low-life”无法获取“life”的意思,它也就无法拥有“life”的复数形式。“life”一词的不规则形式“lives”被束缚于心理词典之内,无法应用到“low-life”上,而通用的规则变化“添加后缀-s”则趁机占领了阵地,因此出现了“low-lifes”的形式。通过类似的无意识推理,英语使用者很自然地选择了“saber-tooths”(剑齿虎,它指的是一种老虎,而非一种牙齿)、“tenderfoots”(初级童子军,它指的不是某种类型的脚,而是身体还很柔弱的小孩)、“flatfoots”(它也不是某种类型的脚,而是“警察”的俚语)和“still lifes”(静物画,它指的不是一种生活,而是一种绘画类型)。

自从索尼公司发明“Walkman”(随身听)以来,人们都不确定它的复数形式应该是“Walkmen”还是“Walkmans”(即便是毫无性别歧视的替代词“Walkperson”也解决不了这个难题,因为我们仍然必须在“Walkpersons”和“Walkpeople”之间作出选择)。很多人觉得“Walkmans”正确,是因为它是一个无中心语单词:“Walkman”指的不是某种类型的人,因此它的意思并非获自其内部单词“man”,而根据无中心语词的结构逻辑,它也无法借用“man”的复数形式。不过,无论采用哪一种复数形式,它都显得很不自然,因为“Walkman”和“man”之间的关系令人颇感费解,之所以这么说,是因为这个单词并非是依据某种广受认可的方式组合而成的。它是一种在日本非常流行的“伪英语”,常常用于标语和产品名称。例如,日本有一种名为“Sweat”的软饮料,深受大众喜爱,此外在一些T恤上还印着“CIRCUIT BEAVER”“NURSE MENTALITY”、“BONERACTIVE WEAR”等不知所云的标语。对于如何表述两个以上的随身听,索尼公司曾有一个正式的答复。由于害怕自己的商标像“阿司匹林”(aspirin)、“舒洁”(kleenex)一样沦为普通名词,索尼公司坚持认为“Walkman”的复数形式是“Walkman Personal Stereos”,以此绕开语法上的问题。

那么“fly out”一词呢?作为一个棒球术语,它并非直接源于我们熟知的动词“fly”(飞行),而是源于名词“fly”(腾空球)。“fly out”的意思是“因击出腾空球而被接杀出局”,当然,作为名词的“fly”本身是源自动词“fly”,这种层层引申的结构可以用下面这个竹竿状的树形图来表示:

根据树形图最顶端的标签,整个单词属于动词的范畴,但位于下一层级的构成元素却是一个名词。因此,“fly out”就像“low-life”一样,是无中心语单词。如果名词“fly”是中心语,那么“fly out”也应该是个名词,但它不是。由于缺少中心语和联通管道,原动词“fly”的不规则形式(“flew”“flown”)被束缚在树形图的最低层级,不能上升至整个单词的层面。所以,“添加后缀-ed”的常规方案便临危受命,充当起表明时态的角色,因此我们才会说出“Wade Boggs flied out”这样的句子。让“fly out”失去不规则变化能力的并不是它的特殊含义,而是因为它是一个基于名词生成的动词。正是依照相同的逻辑,我们才会说“They ringed the city with artillery”(他们用大炮包围了这座城市)而非“They rang the city with artillery”,“He grandstanded to the crowd”(他在人群面前招摇地表演)而非“He grandstood to the crowd”。

这是一个普遍适用的原则。还记得宇航员萨利·莱德(Sally Ride)吗?她是美国首位飞上太空的女性,因此受到广泛关注。但就在最近,一位名叫梅·杰米森(Mae Jemison)的女性抢了她的风头。杰米森不仅是美国第一位黑人女航天员,而且她还被《人物》(People)选为1993年度“全球50位最美人士”之一。因此就知名度而言,她可谓“比萨利·莱德还萨利·莱德”(out-Sally-Rided Sally Ride,而非out-Sally-Ridden Sally Ride)。一直以来,新新监狱(Sing Sing)都是纽约州最为臭名昭著的监狱,但自从1971年阿提卡(Attica)监狱爆发骚乱之后,阿提卡监狱就变得“比新新监狱还新新监狱”(out-Sing-Singed Sing Sing,而非out-Sing-Sung Sing Sing)。

至于“Maple Leafs”,这个复数形式并不是加在单词“leaf”(叶子)上,而是加在专有名称“Maple Leaf”(枫叶)上的,它是加拿大的国家象征。名称与名词有所不同。例如,名词前面可以加冠词“the”,而名称则不行。例如你不能把某个人称为“the Donald”,除非你是唐纳德·特朗普(Donald Trump)的前妻、以捷克语为母语的伊凡娜·特朗普(Ivana Trump)。因此对于冰球队而言,“Maple Leaf”是一个无中心语名词,因为这个名词是基于一个非名词的单词形成的。如果一个名词的名词性并非源自其内部的某个名词,那么它也无法获得其内部名词的不规则变化。因此,“Maple Leafs”便成为了默认选项。这个解释也可以回答脱口秀主持人大卫·莱特曼(David Letterman)提出的一个问题,在最近一期《深夜秀》(Late Night)节目中,莱特曼一直困惑不解:为什么迈阿密新组建的棒球大联盟球队被叫作“Florida Marlins”(佛罗里达马林鱼队)而非“Florida Marlin”呢,“marlin”(马林鱼)一词本身不就是复数形式了吗?事实上,这个解释适用于所有建立在名称之上的名词。

I’m sick of dealing with all the Mickey Mouses(而非“Mickey Mice”)in this administration.

我讨厌处理这个部门的琐碎事务。

Hollywood has been relying on movies based on comic book heroes and their sequels, like the three Supermans(而非“Supermen”)and the two Batmans(而非“Batmen”).

好莱坞一直以翻拍英雄漫画及其续集为支撑,例如三部《超人》电影和两部《蝙蝠侠》电影。

Why has the second half of the twentieth century produced no Thomas Manns(而非“Thomas Menn”)?

为什么20世纪下半叶产生不了托马斯·曼式的人物?

We’re having Julia Child and her husband over for dinner tonight. You know, the Childs(而非“the Children”)are great cooks.

我们今晚和朱莉娅·查尔德夫妇共进晚餐。你知道的,查尔德一家厨艺非凡。

可见,不规则形式位于单词结构树形图的最底层,也就是心理词典中的词根、词干的插入层。发展心理语言学家彼得·戈登(Peter Gordon)曾利用这一特性,通过一个巧妙的实验,揭示出孩子们的心智结构是如何依据单词的结构逻辑设计的。

戈登关注的是一个古怪的语言现象,这个现象最早为语言学家保罗·柯帕斯基(Paul Kiparsky)所发现:复合词可以由不规则复数构成,但不能由规则复数构成。例如一间鼠患成灾的房子可以形容为“mice-infested”,但如果用“rats-infested”就显得不伦不类了。我们可以“rat-infested”来表示鼠患成灾的意思,尽管从定义上说一只老鼠(rat)构不成一场灾害。同样,人们只会说“men-bashing”(对男性的攻击),但不会说“gays-bashing”(正确的说法是“gay-bashing”,对同性恋的攻击),只会说“teethmarks”(牙印)但不会说“clawsmarks”(正确的说法是“clawmarks”,爪印)。曾经有一首名为“purple-people-eater”(紫色吃人怪)的歌曲,但如果把它改成“purple-babies-eater”就不合语法了。虽然不规则复数和规则复数一个符合要求,一个不符合要求,但它们在意义上却是相同的,因此一定是语法的不规则性导致了这种差别。

单词结构理论可以轻松解释这一效应。不规则的复数形式显得特立独行,因此被作为词根和词干存储于心理词典中,而无法通过规则来生成。由于这种特殊的身份,它们可以用于复合词的构造,通过“词干+词干”的方式形成新的单词。但是,规则复数却不是作为词干存储于心理词典之中,它们是在必要的时候,依据词形变化规则临时组装的合成词。它们出现在“词根→词干→单词”的装配过程的末尾阶段,因此无法应用于复合规则之中,因为复合规则只能从心理词典中提取词根或者词干。

THE

INSTINCT

LANGUAGE

语言认知实验室

戈登发现,3~5岁的孩子能够严格地遵从这一规则。他首先向孩子们展示一个木偶,并对他们说:“这是一只喜欢吃泥巴(mud)的怪物,你该怎么称呼它呢?”然后把答案公布出来:“mud-eater”。孩子们很喜欢这个游戏,而且这个怪物吃的东西越是恶心,孩子们就越兴奋,急切地想填上问题的答案,这常常使一旁观看的家长感到十分无奈。接下来是实验的关键部分,当戈登问“喜欢吃老鼠(mice)的怪物叫什么”时,孩子们的回答是“mice-eater”,但如果戈登将“mice”换成“rats”时,孩子们的回答却不是“rats-eater”了,而是“rat-eater”。而且,即便有些孩子平时会将“mouse”的复数形式错认成“mouses”,他们也不会把这个木偶叫作“mouses-eater”。换句话说,对于复合词构造过程中的这些细微要求,孩子们表现出了充分的尊重。这表明,这些规则既存在于成人的潜意识中,也存在于孩子们的潜意识中。

不过,当戈登着手调查孩子是如何掌握这一语法要求时,他的发现就显得更为有趣了。戈登一开始的想法是:通过倾听父母的日常谈话,孩子们懂得了复合词中出现的复数形式应该是不规则的,然后将这一原则应用到其他各类复合词上。但他发现这是不可能的,母亲对孩子的谈话中不可能出现包含复数的复合词。大多数复合词包含的都是单数名词,例如“toothbrush”。像“mice-infested”这样的复合词虽然有语法上成立,但却很少有人这么说。虽然儿童无法从成人的言语中获悉相关的语法规则,但却能正确地选择“mice-eater”而非“rats-eater”,这再一次证明了儿童能够在“输入贫乏”的前提下掌握语言,同时也说明语法的另一个基本层面具有先天性的特点。正如我们在前文所见,史蒂芬·克雷恩和中山峰春的实验表明,在句法的层面上,儿童能够自动区分字串和短语。同样,戈登的“mice-eater”实验证明,在词法的层面上,儿童能够自动区分心理词典中的词根和依据规则创造出来的屈折词。

单词,句法规则下的最小单位

总之,单词是一个复杂的东西,但单词究竟是个什么东西呢?我们已经看到,“单词”是依据词法规则由各个部件构造而成的,但它与短语和句子有什么不同呢?它是不是就是索绪尔所说的那种必须死记硬背、毫无道理的“符号”,例证了语言机制的第一原理呢(另一原理是离散组合系统)?我们之所以感到困惑,是因为我们日常所说的“单词”(word)一词并不是一种科学的精确表述。它拥有两种含义。

到目前为止,我在本章所使用的“单词”一词都是一个语言学概念,虽然它是依据词法规则由各个部件构造而成的,但相对于句法规则而言,它却是不可分割的最小单位,相当于“句法原子”(syntactic atom)——在希腊语中,原子一词就是“不可分割”的意思。句法规则可以深入到一个句子或短语的内部,对包含其中的更小短语进行切割和黏连。例如,疑问句的生成规则可以深入句子“This monster eats mice”(这只怪物吃老鼠)的内部,将与“mice”对应的短语移到句子开头,变成“What did this monster eat”(这只怪物吃什么)。但是,句法规则在短语和单词的分界线上止步不前,尽管单词也是由各个部件组合而成的,但句法规则却不能探入单词内部去摆弄这些部件。例如,问句规则无法探入句子“This monster is a mice-eater”(这只怪物是个食鼠者)中的“mice-eater”一词之内,将与“mice”对应的语素移到句子开头,由此形成的问句就会显得莫名其妙:“What is this monster an-eater?”(答案是“mice”)。同样,句法规则可以将副词插入短语之中,例如“This monster eats mice quickly”(这只怪物迅速地吃老鼠),但却不能将副词插入单词之中,例如“This monster is a mice-quickly-eater”。鉴于以上原因,我们认为,虽然单词是依据一套固定规则由各个部件构造而成的,但它与短语存在差别,短语依据的是一套不同的规则。因此,通常所说的“单词”一词的精确定义是:一种建立在词法规则之上且不能被句法规则分割的语言单位。

“单词”还拥有另一个迥然不同的含义,它指的是一种需要我们死记硬背的语块:即一串与某个特定意义形成任意关联的语言材料,也就是我们的心理词典列出的一个个条目。语法学家安娜·迪休洛(Anna Maria Di Sciullo)和埃德温·威廉姆斯(Edwin Williams)创造了一个术语“句素”(listeme),即需要死记硬背的语言单位,用以指代“单词”这一含义(这个术语以词法单位语素和语音单位音素为参照对象)。需要注意的是,句素的概念与“单词”的第一个精确含义(即句法原子的概念)并不完全吻合。句素可以是树形图上任意大小的分支,它不是由某个规则自动产生的,而是必须强行把它记住。不妨以成语为例,我们无法依据中心语和扮演角色的关系原则,通过构成部件的字面意义推导出以下成语的意义:“kick the bucket”(一命呜呼)、“buy the farm”(死于非命)、“spill the beans”(泄露秘密)、“screw the pooch”(把事情搞砸)、“give up the ghost”(驾鹤西游)、“hit the fan”(遭遇麻烦)、“go bananas”(精神错乱)。我们必须强行记住这些短语大小的语言单位所表达的意义,就好像它们是一些简单的单词,这就是句素。从这个意义上说,这些成语是名副其实的“单词”。迪休洛和威廉姆斯以“语法沙文主义者”的口吻对心理词典做了如下描述:“如果将心理词典看成是一群句素的集合,那么就本质而言,这部词典也显得太过乏味了……心理词典就像是一个监狱,它只容纳那些不法之徒,它的收容对象只有一个共同点:无法无天,不受管束。”

在本章的余下部分,我将专门探讨“单词”的第二个含义:句素。这将是一场“监狱改革”,我想证明的是,虽然心理词典容纳的都是一些不守规则的句素,但它仍然值得我们的尊敬和重视。也许在语法学家看来,让孩子们将父母所说的单词一个个强记心中是种非常野蛮的刑罚,但它其实是一门精妙绝伦的技艺。

句素

心理词典有一个非凡的特征,它拥有令人惊叹的记忆能力。一个普通人大约知道多少个单词?如果你像大多数人一样,以人们听过或读过的单词数量为计算标准,你可能会认为未受教育者的单词量大概是几百个,受过教育的人的单词量大概是几千个,而像莎士比亚这样的天才作家则可以达到15 000个(这是莎翁戏剧集和十四行诗里出现过的单词总数)。

然而,这与真正的答案相去甚远。人们认识的单词比他们在具体的时间、场合下使用过的单词要多得多。为了检测一个人的词语量(这里的词语指的是句素的概念,而非词法规则的产物,因为后者是无穷无尽的),心理学家采用了以下方法。首先,找来一本容量最大且未经删节的词典,如若词典太小,人们知道的许多单词就有可能没有收录进去。此处以芬克与瓦格诺出版社(Funk & Wagnall)出版的《新版标准足本词典》(New Standard Unabridged Dictionary)为例,它一共有45万个词条,数目非常可观。不过对于测试而言,这个数目显得太大了一点,即使一个单词30秒钟,一天工作8个小时,也需要一年多的时间才能全部测完。因此我们可以进行抽样,比如说,每8页的左手页第一列第三个词条。每个词条通常都含有多个含义,例如:“hard:(1)坚固的(2)困难的(3)严厉的(4)费力的……”,如果把它们都计算在内,就需要硬性地对这些含义进行合并或者区分,因此可行的方法是,一个人只要知道某个单词的一个含义,就可以将这个单词计入他的词语量中,而不必知道该单词的所有含义。研究人员向测试对象展示样本中的每个单词,并要求他们从提供的选项中选出意思最为接近的词。经过猜测校正后,再将正确率乘以词典的收词数,就可以估算出一个人的词语量。

事实上,还有一个校正工作必须事先执行。词典是一种商品,而非科学工具。出于广告的目的,词典编纂者通常会虚报他们的收词数量(例如:“最具权威!包罗万象!总字数超过170万,16万个词条,还包括16页彩色图表!”)。他们常常将一些复合词或者词缀形式加入词条,以达到“增肥”的目的,而这些都是可以依据词根的意思和词法规则来推测其意思的语言单位,而非真正的句素。例如,我的案头词典在词条“sail”(帆)之下就列有许多派生词:“sailplane”(滑翔机)、“sailer”(帆船)、“sailless”(无帆的)、“sailing-boat”(帆船)以及“sailcloth”(帆布)。事实上,即便我以前从未见过这些单词,也可以推断出它们的意思。

THE

INSTINCT

LANGUAGE

语言认知实验室

最精确的估算来自心理学家威廉·纳吉(William Nagy)和理查德·安德森(Richard Anderson)。他们从一份包含227 553个单词的列表入手,其中有45 453个词根、词干。在剩下的182 100个派生词和复合词中,他们认为除了42 080个单词之外,其他的都可以根据其构成部件的含义进行解读。因此,整个列表中句素的总量为45 453+42 080=87 533。通过进一步的抽样和测试,纳吉和安德森计算出美国一名普通高中毕业生的词语量大致为45 000个单词,这是莎士比亚的单词使用量的3倍!实际上,这还是一个低估了的数字,因为专有名词、数字、外来词语、缩略词以及许多不可拆分的常用复合词仍被排除在外。我们没有必要在估算词语量的时候遵循拼字游戏的规则,这些单词都属于句素,完全应该被计算在内。如果把它们包括在内的话,美国一名普通高中毕业生的词语量可能上升到60 000个单词(相当于4个莎士比亚),而那些阅读量更大的优秀学生的词语量则可能再翻一番,相当于8个莎士比亚。

60 000个单词是多还是少?我们可以计算一下学习这些单词所需的速度,以帮助我们了解这一问题。一个人通常是在12个月大的时候开始学习单词,因此一位高中毕业生有17年的时间学习这些单词,这等于说从他们一岁起平均每天必须学习10个单词,或者说在睡觉之外的时间里平均每90分钟就必须学习1个单词。运用同样的方法,我们可以推算出6岁大的孩子的平均词语量约为13 000个,所以像《迪克和简》(Dick and Jane)这样的儿童读物才会显得乏味枯燥,因为它们极大地低估了儿童的词语量。通过这些简单的计算,我们可以发现学龄前儿童虽然接触到的语言环境比较有限,但却像一台真空“吸词器”,在他醒着的时候,每隔两个小时就会吸入一个新的单词,日复一日,连续不断。而且需要注意的是,我们所谈论的对象是句素,它们的意思都是任意生成的,这就像你从蹒跚学步开始每醒着的90分钟内就要记住一个全新的击球率、约会日期或者电话号码。大脑似乎为心理词典预留了一个容量超大的存储空间和一个运转迅速的转录设备。事实上,心理学家苏珊·凯里(Susan Carey)的一项自然性研究已经证明:当你和一个3岁的孩子聊天时,如果你无意之中说出某个新的颜色词,比如说“橄榄色”,这个孩子很可能在5个星期之后还能记起这个单词。

单词的记忆过程

现在让我们探讨一下单词记忆的过程。每个单词都是一个典型的符号,它的力量来自这样一个事实:使用这种语言的社会成员都不约而同地用它来进行交流与沟通。如果你使用了某个单词,只要这个单词不是太晦涩,我就理所当然地认为自己也可以在另一个人面前使用这个单词,而且他也会理解我所表达的意思,就像我能够理解你的意思一样。我无须再将这个词反用于你,以观察你的反应;或者将它用到其他人身上,看看他们的反应;又或者观望你如何在另一个人面前使用这个单词。这其实是一件耐人寻味的事情。毕竟,假如我看到一只熊在发动攻击之前会发出怒吼,我并不会也用这种吼声来吓唬蚊子;假设我用敲打盆的方式吓跑了一只熊,我也不会指望这只熊会用同样的方法吓跑猎人。即便在我们人类之间,单词的学习过程也不仅仅是一种对他人行为的模仿。行为总是涉及特定的实施者和实施目的,这与单词并不一样。假如一个女孩从她姐姐那里学会了调情,她显然不会和自己的姐姐或者父母调情,而是根据自己的观察所得,将它用到那些乐于接受调情的特定对象上。单词则恰恰相反,它就像一种通用货币。仅仅通过倾听他人言谈,婴儿就能学会使用单词,这个事实说明:婴儿能够暗自认定单词并不是某个人用来影响另一个人的特殊行为,而是一个为人们所共享的双向符号。通过这种符号,说话者可以将自己的意思转化为声音,而听者则可以将这些声音转化为意思,他们依据的是相同的代码。

由于单词是一种纯粹的符号,因此它的读音和意思之间没有一丝必然的联系。正如莎士比亚极其精练地说道:

名称有什么要紧的呢?

玫瑰不叫“玫瑰”,依然芳香如故。

正是由于音义关系的任意性,我们无法指望能通过某种巧妙的记忆方法来减轻记忆的负担,至少对于那些单纯词来说是如此。婴儿不能(也显然不会)指望“cattle”(牛)与“battle”(战斗)之间有什么意思上的关联性,或者说“singing”(唱歌)与“stinging”(刺痛)之间、“coats”(大衣)与“goats”(山羊)之间有什么相同之处。人们还发现,即便是拟声词也不例外,因为它的读音几乎和其他单词一样,都是约定俗成的结果。猪在英语中是“吭吭”(oink)地叫,在日语中却是“噗噗”(boo-boo)地叫。即便在手语中,用手来模拟意思的方法也被人们所抛弃,手势和意思完全是一种任意的配对。当然,在手势和意思之间还残留着一些相通之处,可供我们识别、推断,但它们和拟声词一样,不同的人完全有不同的理解,因此对于单词的学习并没有什么帮助。例如,在美国手语中,“树”的手势是把手摆来摆去,就像在风中摇摆的枝叶。而在中国手语中,“树”的手势则是比画树干的形状。

心理学家劳拉·佩蒂妥(Laura Ann Petitto)曾经有一个惊人的发现,它揭示出符号与意思之间的任意关系深深地扎根于儿童的头脑之中。在差不多快到两岁的时候,以英语为母语的小孩开始懂得使用代词“你”和“我”。但他们经常将这两个词弄反,用“你”来代称自己。这是情有可原的,因为“你”和“我”都是指示(deictic)代词,说话者不同,它所指的对象也不同。当我说“你”时,“你”指的是你;但你说“你”时,指的却是“我”。因此,孩子们可能需要一点时间来消化它。毕竟,当一个名叫杰西卡的女孩听到她母亲称她为“你”的时候,她怎么不会认为“你”就是“杰西卡”的意思呢?

现在让我们对比一下美国手语。在美国手语中,“我”的手势是指向自己的胸前,“你”则是指向对方。这算是最简单易懂的手势了吧?人们不免认为,在美国手语中,学会“你”和“我”的手势肯定易如反掌,这只不过是动动指头的事,所有的婴儿,无论他的听力正不正常,在一岁之前就会用手指来指去了。但是对于佩蒂妥所研究的失聪儿童来说,事情并没有那么简单。他们在差不多两岁的时候仍会错误地将手指向自己的谈话对象,以表示“我”的意思,就像同龄的正常孩子在口语中用“你”来指代自己一样。可见,失聪儿童是将这一手势看成一个纯粹的语言符号,它的实际指向和它所代表的意思并没有必然联系。这也是手语学习的一个正确法门。在美国手语中,手指的指向就像没有实际意思的辅音或元音一样,可以成为其他手势(比如说“糖果”“丑陋”)的组成部分。

还有一个原因足以让我们对单词学习这个简单的行为充满敬畏。逻辑学家W. V. O. 奎因(W. V. O. Quine)曾经设想了这样一个场景:一位语言学家正在研究一个新发现的部落,突然一只兔子飞奔而过,一位土著人大声喊道:“Gavagai!”这个“gavagai”是什么意思呢?从逻辑上说,它不一定是“兔子”的意思。它可能是特指那只飞奔而过的兔子,就像《彼得兔的故事》(The Tale of Peter Rabbit)一书中那只名叫“耷拉”的兔子一样。它也可以指任何毛茸之物、任何哺乳动物、兔子家族中的任何一个种类(比如“穴兔”)或者品种(比如“青紫蓝兔”)。它的意思可能是“飞奔的兔子”“飞奔的物体”“兔子和它飞奔过的地面”,或者单指“飞奔”。它还可能是指“留下脚印的动物”“兔蚤的宿主”“兔子的上半身”“跑动着的兔肉”或者“兔脚的拥有者”。它既可以指一只兔子,也可以指一辆别克汽车。它可能是指“兔子各个部分的集合”,也可能是说“瞧!又一只兔子”,或者说“兔子来了”就像说“下雨了”一样。

如果将孩子看成语言学家,将父母看成土著人,问题也是一样的。然而不知何故,婴儿总是能够排除不计其数的、在逻辑上同样成立的其他选项,直觉般地了解一个单词的正确含义。这一现象例证了奎因所说的“归纳法的耻辱”(the scandal of induction)。它既适用于科学家,也适用于儿童:他们能够通过观察数量有限的某类事件,成功地对未来所有同类事件做出正确的概括,同时将与最初观察结果并不矛盾的无数错误概括排除在外。这是为什么呢?

我们都能成功地用归纳法来解决问题,因为我们不是乐于接受无限可能的苏格拉底,而是没有太多想法的快乐“小猪”。面对世间万物的种种谜团,我们天生就倾向于做出某些特定的猜测,而这些猜测往往都能切中要害。我们可以假设牙牙学语的婴儿的大脑能够把世界切分成无数个独立、有限且内聚性强的物体,以及这些物体表现出的运动方式,并且能够将同类的物体合并在一起,形成一个个心理范畴。我们也可以假设婴儿本能地认为语言中包括两类单词,一类单词表示不同类型的物体,另一类单词表示不同类型的运动,也即名词和动词之别。因此,婴儿也就不会将“gavagai”一词理解为“兔子的各组成部分”“兔子践踏过的地面”“兔子每时每刻的状态”或者其他精确的场景描述,这不能不说是件幸事。

但是,孩子和父母之间是否真的存在这种“心灵感应”?许多思想家,无论是思维跳跃的神秘主义者,还是思路清晰的逻辑学家,都不约而同地对这一常识发起了猛烈攻击。他们宣称,物体和运动的分离现象并不存在于客观世界,甚至也不存在于我们的心智之中,而是由人类语言对名词和动词的划分造成的结果。因此,如果真的是单词区分出了物体和运动,那么显然不是物体和运动的概念让我们理解了这些单词。

然而,我认为,这一次的赢家是常识。非常重要的一点是,这个世界上的确存在着各式各样的物体和运动,我们的心智天生就是为了发现它们,并用单词来一一标记的。这是达尔文学说的要义所在。这就像在一个丛林世界里,能够对下一步的情形进行成功预测的有机体能够养育更多的后代,并将这一优势遗传给他们一样。鉴于整个世界的构成状态,将时空切分成不同的物体和运动是一种非常高明的预测手段。它将世上种种具有固定形态的物质设想为一个个物体,换句话说,就是用一个总的名称来概括这些物质的所有组成部分。据此我们就可以预测这些组成部分将持续占据一定的空间区域,并以整体的方式进行运动。对世界上的大部分物体而言,这个预测是正确的。即使我们把目光移开,兔子仍然存在。如果我们抓住兔子的颈背把它拎起来,它的四肢和耳朵也会一并上升。

那么物体的种类,或者说范畴又是真实存在的吗?不是说这个世界上没有两个完全相同的人吗?的确如此,但是这些范畴也并非物体的随意集合。比如说,一个物体长着毛茸茸的长耳朵、绒球一样的尾巴,喜欢吃胡萝卜,喜欢躲进洞里,而且繁殖力超强,这不就是兔子吗?将诸多物体归于一个范畴,并在心语中给它们贴上分类标签,可以帮助人们在审视某个物体时,对一些无法直接观察到的特性做出判断。如果“耷拉”长着毛茸茸的长耳朵,它就是一只“兔子”,而如果它是一只兔子,它就能够迅速地钻入洞里,并生养出更多的兔子。

此外,我们还需要给同一个物体贴上多个标签,以标明范畴的大小,例如“棉尾灰兔”“兔”“哺乳动物”“动物”和“生物”。在对不同范畴进行选择时,我们会有一个权衡的过程。例如,确定“彼得”是一种动物要比确定它是一只棉尾灰兔要容易得多(只要看到它的一些动物行为,我们就能断定它是一种动物,而不必知道它是不是一只棉尾灰兔)。然而,相对于“动物”标签而言,如果我们知道彼得是一只棉尾灰兔,就可以对它有更多的了解。如果它是一只棉尾灰兔,它就会偏爱胡萝卜,以空旷的野外或者森林空地为栖息地;但如果它只是一种动物,那我们就无法知道它具体吃些什么东西,或者喜欢怎样的栖息地。相对而言,“兔子”这个不大不小的基本范畴是一个两全之策,它既不像“棉尾灰兔”标签那样难以张贴,又不至于像“动物”标签那样过于空泛。

最后,为什么要将“兔子”的概念与“奔跑”分离开来呢?这或许是因为无论一只兔子是在奔跑、进食还是睡觉,只要一声巨响,它就会疾速地钻进洞里去,这是我们可以预料的结果。然而,如果是一只狮子,无论它是在奔跑、进食还是睡觉,当它听到一声巨响时,显然会有不同的反应。这种不同正是兔子和狮子的区别所在。同样,无论是谁在奔跑,都会产生一些特定的后果,无论奔跑者是一只兔子还是一只狮子,它都不会在某个地点停留太久。同样,睡觉也一样,无论是兔子还是狮子,只要它睡着了,都会趴在原地一动不动。因此,一个聪明的预测者应该对物体和动作贴上不同的心理标签,如此一来,他就不需要再分别学习兔子奔跑是怎么回事,狮子奔跑又是怎么回事;或者兔子睡觉是怎么回事,狮子睡觉又是怎么回事;乃至奔跑、熟睡的羚羊又是怎么回事,等等。他只要了解“兔子”“狮子”和“羚羊”的一般概念,再了解“奔跑”“睡觉”的一般概念即可。假设世界上存在M种物体和N种行为,认知者不必学习M×N个概念,他只要轻松地掌握M+N个概念就行了。

因此,即便是那些目不识丁之人,也可以将连续不断的经验切分为各种物体、种类和运动,更不用说地点、路径、事件、状态、材质以及其他类型的概念了。婴儿认知实验证明,正如我们所认为的那样,婴儿在学会物体的各种名称之前就已经有了对物体的概念。早在婴儿未满周岁,还没有接触任何单词之前,他们似乎就已经意识到一些我们称之为物体的东西了。当他们看到一个物体的组成部分突然脱离物体、擅自行动时,会流露出惊讶的表情。同样,如果某个物体神秘地出现或消失,或者径直穿过另一个固体,又或是不依靠任何支撑悬浮在空中,都会让他们倍感惊讶。

当然,给这些概念冠以名称,可以让我们将自己来之不易的发现与理解分享给那些经历有限或者不善观察的人。“gavagai难题”涉及的其实就是单词和意思的配对问题。如果婴儿一开始就明白这些概念与语言中的各种意思的类型有对应关系,那么这个难题就算得到了部分解决。实验证明,幼儿能够假设某些概念能够成为单词的表述对象,而其他一些概念则不能用单词来形容。发展心理学家埃伦·马克曼(Ellen Markman)和珍妮·哈钦森(Jeanne Hutchinson)给2~3岁的小孩观看一组图片,并要求他们“寻找与这张图片类似的另一张图片”。孩子对存在互动关系的物体十分感兴趣,在接受命令之后,他们倾向于选择可以形成角色关系的图片,比如说一只冠蓝鸦和一个鸟巢,或者一条狗和一根骨头。但是,当马克曼和哈钦森要求他们“寻找与这个‘dax’相同的另一个‘dax’”时,孩子的选择标准就会发生改变。他们似乎认为,一个单词肯定是代表一类事物,因此他们会将一只鸟和另一只其他种类的鸟、一条狗和另一条其他种类的狗放在一起。对孩子来说,“dax”不可能指的是“一条狗或它的骨头”,虽然这个组合对他们来说更加有趣。

一个事物可以用不同的单词来代表。棉尾灰兔“彼得”不仅是只兔子,它也是一只动物,更是一只棉尾灰兔。孩子们偏向于将名词理解为像“兔子”这样的中级范畴,但他们也必须克服这种偏好,学习像“动物”这样不同范畴的单词。孩子似乎是借助语言的一个显著特征做到这一点的。虽然大多数常见单词都拥有很多个意思,但每个意思往往只有一个单词来代表。换句话说,同形异义的单词比比皆是,而同义异形的单词却极其罕见。几乎所有被认为是同义的单词都有着意思上的差别,尽管差别很小。比如说“skinny”(干瘦)和“slim”(苗条),一个具有贬义,一个具有褒义;而“policeman”(警察)和“cop”(警察的俚语)则一个是正式用语,一个是非正式用语。谁也无法解释为什么语言对单词如此“小气”,对意思却如此“大方”。不过,孩子们却似乎预料到了这一点(也许正是这种预料导致了这一现象的产生),这帮助他们进一步解决了“gavagai难题”。如果一个孩子已经知道某个单词是代表某个事物,那么当另一个单词被用来指代这个事物时,他就不会简单地将它看成上一个单词的同义词;相反,他会试着将它理解为其他一些可能的概念。例如马克曼发现,如果你给某个孩子一个锡做的V型夹,并把它称作“biff”,孩子就会将“biff”理解为夹子的一般概念,这显示出他对中级范畴的偏爱。因此,当你要求他找出更多“biffs”时,他会挑选出一个塑料做的V型夹。但是,如果你给孩子一个锡杯,并把它称作“biff”,孩子就不会将这个“biff”理解为“杯子”的意思,因为多数孩子已经知道有一个单词的词义是“杯子”,即“cup”。出于对同义词的反感,孩子会认为“biff”一词一定表示其他的意思,而这个杯子的材质是最为现成的对象。因此,当要求他找出更多的“biffs”时,他会选择一个锡做的勺子或者夹子。

THE

INSTINCT

LANGUAGE

语言认知实验室

还有许多精巧的研究揭示出儿童是如何锁定各类单词的正确意思的。一旦儿童掌握了一些句法知识,他们就能够用它来厘清各类不同的意思。例如,心理学家罗杰·布朗给一些孩子观看一张图片,图片中是一双手正在揉搓一堆搁在碗里的小方块。如果他问“Can you see any sibbing”(你们看到有什么东西在“sibbing”吗),孩子们会指向图片中的那双手。但如果他问道“Can you see a sib”(你们看到了一个“sib”吗),孩子们则会指向那个碗。如果他再问“Can you see any sib”(你们看到了一些“sib”吗),他们又会指向碗里的小方块。其他实验也揭示了儿童能够极其深刻地理解不同词类在句子结构中的身份地位,以及它们与概念和种类之间的关系。

因此,名称到底有什么意义呢?正如我们所看到的,它的意义非比寻常。从词法意义上说,一个名称就是一个复杂的结构,它由一套套规则精美地组装而成,即便有时看上去异常古怪,也有其合理的一面。从句素的意义上说,一个名称就是一个纯粹的符号,它是成千上万个同类中的一员,我们能够迅速地了解它的含义,是因为它与孩子的心智、成人的头脑以及现实的本质相契相合。

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000