或许在早期阶段,故事的讲述不过是人们试图表达自己的经历时,所做的手舞足蹈式的哑剧表演。可是打手势的效率太低,而且常常含混不清容易引起误解,需要发展成一个表意清晰的、能够让群体内所有成员理解的符号体系。我曾经在莫斯科的一家宾馆尝试向前台的服务人员借用开瓶器,由于对俄语一窍不通,我只能借助各种手势来表演:打开瓶子,把虚拟的液体倒进虚拟的杯子,举到唇边并发出咕噜咕噜的声响。前台人员惊愕不已,等终于弄明白我的意图,她们不禁哑然失笑并找来了我想要的东西。如果我能够简单地说明我想用一下开瓶器的话,就不用这么大费周章了。
在更新世早期,我们的祖先所能理解的繁复动作(比如一路追捕并杀死猎物)最初可能是通过身体动作表现出来的,但此后会形成惯例,以确保表意清晰。在终极版本里,整个过程不会以完整的形象化的形式呈现,独立的动作会被设计成特定的指代内容:动物、长矛、投掷动作、位置,或许还包括时间(昨天或是今早之类)。每一个动作都会简化成一个标准的模式,不需要再保留哑剧般的形象化元素。群体的所有成员会就这些特定动作的涵义达成共识,并传授给自己的后代。在失聪群体发明手语的过程中,我们也可以看到这种手势示意的形式。
一旦示意动作形成了惯例,哑剧元素便不复存在了,很大程度上有声动作取代了身体动作。尽管如此,我们之中的许多人,尤其是意大利人,在交谈时还是会保留手部动作。这些形象化或者空间线索的补充,使得我们想表达的内容更加详尽,有时我们会完全依靠手势交流。你可以试试问大家什么是“旋涡”。通常用词语很难形容,于是大家会求助于手势。手语确实保留了哑剧元素,但是经验丰富的手势示意者不会注意这些。动作已经化为符号,而不再是移动的画面。不论是比划姿势还是发出声响,这些形成惯例的符号都被称作“词汇”。
于是,人们制定了一些规则来表达次序以及故事要素之间的关系。这些规则决定了词汇应遵循的顺序。顺序也可以随意调整,但一旦确定就必须要使叙述的内容清晰无误。于是乎就产生了“语法”。许多简单的事件都包含语言学家所谓的施动者、行为和受动者。举例来说,这个事件可能是一位女士(施动者)挑了(行为)一个苹果(受动者)。这些成分以词的形式呈现并充当句子的主语、谓语以及宾语,而它们所遵循的顺序完全是约定俗成。英语是“主谓宾”结构语言,但其他语言中的大部分是“主宾谓”结构语言,比如拉丁语中的动词是放在句子末尾的。全世界7000多种语言,一共有6种顺序结构,其中最罕见的是“宾主谓”结构语言,仅包括4个已知语种(你旅行时也许会去到说这些语言的地方,它们分别是:委内瑞拉的Warao,巴西的Nad?b,澳大利亚东北部的Wik Ngathana,印度尼西亚西巴布亚省的Topati)。
有些语言会用到一些其他的方法来标记主语、谓语、宾语之间的不同,以及在用词语设定场景或事件时所需要的详细说明地点、时间、数量、质量和其他细节的符号之间的差异。一些这样的语言被称作是“乱序的语言”(scrambling language),因为语序已经不再重要。沃皮瑞语(Walpiri),一种澳大利亚的语言,就是一个例子。拉丁语也可以语序置乱而表意不变,因为其复杂的后缀系统已经使得主语和宾语、特定的时态、数目及其他诸如此类的要素异常清晰。不管构成方式如何,语言都是一种手段,让我们可以讲述复杂的事物和故事,脱离当下,去到其他时空,甚至有时还会闯进别人的意识,除了记忆力和关注的持久度以外,不受任何其他限制。
如果语言真的如许多人所猜测的,发展自手势,那么它更早的起源一定是动作示意而非声音示意,在这一方面,可能要一路追溯到我们灵长类祖先的习性。语言的技术性细节或许不是来自于叫声,而是来自于以抓取为目的的手部运动。猴子和类人猿的叫声主要是出于激动的情绪或是本能反应,与直接语境紧密相关,大多对故事讲述毫无帮助。相比之下,它们双手的运用却灵活且有明确目的性,似乎是为传达事件的信息而特别设计过的。确实,“抓取”这一概念在我们的话语中似乎仍然根深蒂固,如果运用比喻的话。grasp这个词本身也有“理解”的意思,如果你理解我的意思的话。comprehend(理解)和apprehend(领悟)来自于拉丁语中的prehendere,意思是“抓住”。intend(打算),contend(斗争)和pretend(假装)来自拉丁语中的tendere,意思是“用手去够”。我们可以press(发表)某个观点,expression(表达)和impression(印象)也暗含“发表观点”的意思。我们hold(进行)对话,point out(指出)目标,seize upon(抓住)想法,grope for(寻找)字眼——好让你catch(听懂)我的意思。在视觉层面也说得通,就像我所希望的,你能够see(明白)我的意思。
语言的发明一定是在人类从类人猿分离出来之后。虽然教会类人猿说话的努力均已惨淡收场,但黑猩猩、倭黑猩猩和大猩猩在简单的符号语言学习方面却非常熟练。由休·萨瓦戈·鲁姆博夫(Sue Savage-Rumbaugh)所饲养的倭黑猩猩坎兹(Kanzi)堪称其中的明星人物。坎兹可以在特制的排字板上指出不同符号并以此进行交流,还能通过对会使用手语的大猩猩可可(KoKo)的观察学到一些手势,并用做自己符号示意的补充。自然环境中生长的类人猿在相互交流的过程中会用到非常多的身体动作,通常是在玩耍的情景下。罗宾·邓巴(Robin Dunbar)认为语言源于整理仪容,即动物之间温和地为彼此梳毛清理的行为,这也是一种巩固社会关系的重要手段。与之相关的另一交流行为是“指向性瘙痒”,比如黑猩猩会有意识地去抓它想要别人帮它清理的身体部位。
就在有声语言取代手势还是种猜想的时候,琼·奥尔(Jean Auel)把她的小说《洞熊家族》(The Clan of the Cave Bear)设定在约27000年前的冰河时代,那是早期人类与尼安德特人并存的时代。5岁的小女孩艾拉在一场地震后沦为孤儿,家人全部丧生,而她自己最终被尼安德特人收养。故事中的尼安德特人不会说话,只能通过手语交流。当然我不应该把虚构的小说当作合理的科学证据,但奥尔真可谓是早期人类和尼安德特人方面的专家,而且尼安德特人对手语的使用在她的其他小说里也是一个主题。比较奇怪的是,《洞熊家族》中的尼安德特人既不会说话也不会哭或笑,所以当他们看到艾拉哭的时候,还以为是她患了什么眼病。而事实上,即使是黑猩猩也是会笑的。在奥尔的小说里,尼安德特人也能够通过心灵感应进行交流。
在某种程度上,真正的尼安德特人与我们人类的祖先确实曾有过性接触。他们的灭绝距今不过30000年,而且我怀疑他们和我们一样,能清楚地说话。从手势到有声语言交流方式的转变在更新世时期可能是缓慢进行的,而且至今尚未结束。我们在说话的时候仍然会做出手势,而且与我们的有声语言相比,失聪人士及一些其他的群体所使用的手语一样有效、一样具备语言学层面的复杂性。那么,为什么是有声语言被采纳并最终占据主导地位呢?我认为原因有很多。除了在说话时挥舞手臂的长期习惯之外,说话也使我们的双手解放出来,用于制作工具、负重,或者照料婴儿。语言本身也是一种身体姿势,舌头、嘴唇和声带的运动,有条不紊地在口腔中进行着,除了一些间歇性活动(比如吃饭或者接吻)什么都不妨碍。我们教导孩子不要在吃东西的时候说话,并且心怀同情地看待约翰·多恩(John Donne)1633年的诗作《爱情的圣徒》(The Canonization)中痛苦的恳求:“看在上帝的面上,闭上嘴,让我爱你吧。”
与身体语言相比,有声语言也远没有那么劳累,因为它只增加了一些非常细微的运动和呼吸负担,而为了生存我们本来也需要呼吸。另外,在看不见对方的黑夜,语言依然可以传情达意——这一属性完全可以被应用于无线电和手机通讯。类似的优势我还可以举出很多。 [13]
但不论语言还是手势,我们人类都获得了其他物种力所不能及的高端技能。与我们最接近的非人类亲戚——类人猿,就不会讲故事,就算用手势示意也不行。它们最多可以提出一些简单的请求,或者是对简单的指令做出回应。创造符合语法规则的语言并向听者转述故事的能力似乎是人类独有。而这样的特性究竟是来自想象事件的内部结构,还是只与此类事件的讲述相关,至今依然争论未决。不论怎样,我们可能都会赞同法国心理学家兼精神治疗医师皮埃尔·让内(Pierre Janet)的说法:“叙事创造了人类。”