象形字与抽象符号之间不仅仅是表达方式上的转变,这种转变给人类带来了翻天覆地的变化,通往文字系统的大门就此打开。接下来的问题就是如何使用符号表征所有的口头语言,而不仅仅只是几百个重要的单词。作为现代人,我们当然知道如何完成这一过程。音素、音节以及语素是组成单词的三要素。语言是一种编码,它通过有限的三要素表达全部的信息。文字系统基于一组合适的要素呈现所有单词,进而表达语言的全部内容。我们需要进一步研究使用文字表达不同种类的口头语言的指导原则。
实现了最初的突破之后,楔形文字在接下来的2000多年中飞速发展。然而该文字系统并未缓慢扩张,因为天才也并不经常出现。主要原因是文化方面的因素:该文字系统的使用方式、使用人数以及运用的技术。在古美索不达米亚文明中,人类只需要掌握少数符号便可以编撰图书。也许正是因为在那个时期,数量不多的符号已经可以满足人们的需求,人们便未能认识到文字潜藏的巨大力量。这一切似乎也很好理解。这就好比在蒂姆·伯纳斯-李(TimBerners-Lee)发明功能更加多元的万维网之前,互联网已经投入使用多年,早期接触互联网的学者和政客也只是通过它完成发送邮件、聊天或传送文件等简单的工作。
无论外形是形象还是抽象,大多数楔形文字都是用符号表示单词的图像文字。但是为每一个物体赋予不同的符号逐渐变得不再可行。原因主要有两点:第一,人类的记忆力是有限的;第二,这种方式记录难度大而且可读性很低。自然语言中包含很多单词,我们无法为所有单词赋予符号。这也就是世界上没有任何一种文字系统完全由图像文字组成的原因。为此,楔形文字的使用者想出了两种应对方式。第一种是为同一个符号赋予更多的含义。第二种是使用符号组合表示更多的单词。用符号表示物体的名称是文字发展过程中的一大突破,既然人类的认知水平已经达到了新的高度,人类就可以拥有更多的表达方式。虽然楔形文字发展到最后也可以表征整个语言,但是终究因过于复杂而被取代。在楔形文字的进化过程中,这种取代它的新型文字就已经出现。
楔形文字在符号再造的过程中一度陷入混乱。符号具备了多种功能,因此在特定的环境下,正确使用符号变得越来越困难。表示大麦的符号究竟是表示大麦本身还是另有其他含义?例如,它是否可以代表一种相当于1.5厘米长的测量单位?它是一个单独的符号,还是几个符号的组合?它是表示众多与大麦相关的单词之一,还是表示其他发音为“?e”“?i”“?el”的单词呢?
使用抽象符号表示单词虽然是一项突破,但这种方式也引发了比较复杂的问题。苏美尔人最后想到了一种策略用于表示抽象概念。以“生活”与“箭头”这两个单词为例,这两个词在楔形文字中都有相同的发音“ti”。一支箭很好描绘,但生活则难以用图像表述。苏美尔人通过使用“箭”一词的象形字来表达与其发音相同的“生活”一词。同音异义词就此问世,这类单词具有相同的发音以及拼写方式,却有着不同的含义。例如watch一词既可以表示手表,还可以表示看。“生活”一词的楔形文字只是组字原则中的一个例子。苏美尔人也曾根据该原则,使用bee(蜜蜂)和leaf(叶子)的图像来表示belief(相信)一词。这种做法也有负面作用,它让人们在看到arrow(箭)这个简单的单词时都要再三思考它的含义,这一符号在外观上与“箭”相似,可是它的发音却与“生活”一致。
组合图形元素来创造单词是现代文字系统的突出特点。楔形文字在推动文字系统发展的同时,也在一定程度上阻碍了它的前进。根据符号的发音及其指代的含义来创造单词是一件好事,这一点在现代文字系统中也得以沿用。但使用代表头部的符号sag以及代表碗的符号sila来表示食物gu就阻碍了文字系统的发展。这两个符号在含义上与食物相关,可是读音却不同。多音字,即使用一个符号表示若干个含义与之相关,可发音却完全不同的单词,便是楔形文字的缺陷之一。
楔形文字的策略及缺陷使得这种文字系统虽然能够取得一定成果,却终究没有走到最后。如果每一个符号都包含若干种含义,而且能以多种方式与其他符号组合,这些符号所代表的意义就一定会激增。使用这种文字系统就像是在解谜,人类因要猜测符号的含义而无法顺畅地阅读。楔形文字终究在使用了数千年后,无奈地退出了历史舞台。
文字,语音和语义的载体
虽然苏美尔人没有创造出最合理的文字系统,但是他们的方向是正确的。文字系统的潜在逻辑其实十分简单:
各种文字系统之间差别不大,它们都是以可视化的方式表达语音和语义。
口头语言的关键信息被隐藏在可视的符号中。如图3-2中表示大麦的象形字所示,该符号传达了声音和含义两种信息:通过与大麦一词在口语发音上的相似之处表示读音,通过象形字的外形特征传达它的含义。表示“大麦”一词的象形字的思路是正确的,可它在表达读音及含义上的效果却不尽如人意。后来出现的文字系统在遵循上述原则的基础上,使用更好的方法表达了单词的读音与含义。
表示大麦的符号由图像元素组成,并不能准确地表达其含义。图像元素的局限性非常大,因此这种表达方式注定无法走到最后。而表示绵羊等较为抽象的符号,其含义与形式之间没有固定联系。只有在人类记住这些符号,而且符号数量不多的情况下,它们才能发挥作用。表示大麦的符号也通过另一种任意性联系表示该词的读音。后来人类提出了两种解决上述问题的方法。一是将语音提示和语义提示分离,二是找到一种更加系统且高效的方式同时表现二者。这两种方法一直沿用到了现代。
在更为高级的楔形文字中,人类使用两个符号分别表示一个单词的读音及含义。在历经长时间的研究之后,语言学家马克·利伯曼(MarkLiberman)将此称为“猜字谜原则”:如果一个词的语义提示是fruit(水果),而它的语音提示是line(线),那么这个词的含义即为lime(酸橙)。22这种想法不错,但是实践起来效果却很差。如果将楔形文字比作当代硅谷的初创企业,它可能已经通过了好几轮融资,最终由于采取了不恰当的举措,如使用符号分别表示一个单词的语音和语义,而走向了灭亡。
埃及象形文字的发展过程与楔形文字十分相似,但其水平已有显著的提升。该文字系统最初使用象形字代表实物,例如曾使用过代表猫头鹰的象形字。楔形文字与埃及象形文字都拥有长达3000年的历史,在此期间都得到了广泛使用。代表猫头鹰的象形字经过再造后,既可以表示口头语言中的猫头鹰,又可以表示其读音。埃及象形文字取得了一定的突破,它在后期进化出了代表24个辅音字母的象形字,以及代表2至3个音节组成的辅音的象形字。与楔形文字一样,该文字系统也十分复杂。它没有将语音与语义区别对待,比如,猫头鹰的象形字在表示其语义及语音的同时,还代表了它的种类。猫头鹰在象形字中代表神灵或帝王。图3-3为象形字中“埃及”一词的语音提示以及语义提示。象形字中的象形信息并非必不可少,在“日常的”埃及象形文字(有时也称为草书体)中已经寻不见图像信息的踪影。23
图3-3 象形字“埃及”的语音提示和语义提示构成
左侧的符号代表鳄鱼皮,中间的符号代表猫头鹰,右上方的符号代表面包,右下方的符号代表十字路口。前三个符号代表该字的发音,其中包含/k/、/m/、/t/这三个辅音。最后一个符号十字路口,则表示地点名称的含义。
中国人使用的汉字距今已有两千多年的历史,该文字系统也采用了将语音提示和语义提示相结合的方法。与苏美尔的楔形文字和埃及的象形文字不同,汉字随着时间的演变,一直沿用至今。尽管汉字的历史悠久,但是英语中却没有描述汉字的标准术语。因为找不到专门的术语描述汉字的特征,汉字经常被称为“语标文字”。这样的说法其实并不准确。相反,汉字并不具有语标性,并非每一个汉字都有各自的符号,其中虽包含语标,但也只是一小部分。
现代汉语中,80%的词都由语义提示(形旁)以及语音提示(声旁)组成,如图3-4所示,汉字“马”的发音为“mǎ”,标注在元音上的附加符号代表该元音的声调。汉字“妈”的发音为“mā”,这个字由“马”与“女”组成,“马”是其语音提示(声旁),而“女”则是其语义提示(形旁)。一些汉字既可以是语音提示,也可以是语义提示。24“马”在“妈”字中是语音提示,而在“驹”(其发音为“jū”)字中则是语义提示。
图3-4 汉字中的一些语标及汉字示例
在“妈”字中,位于右侧的“马”字为声旁。在“驹”字中,位于左侧的“马”为形旁。
汉字由语音提示与语义提示组成,这种方式虽然有效,但也伴随着负面作用。因为声旁会影响汉字的含义。从词源学上讲,“马”是“妈”字的声旁部分,而汉语中,语音与语义间的联系是十分紧密的。在我所在的实验室,研究员王天林(TianlinWang)发现,当人们朗读“妈”字时,脑中就会联想到“马”字的含义。从意义上来说,“马”与“妈”的含义没有任何联系,可是“马”的含义还是会浮现在脑海中。所以“妈”字的语义会些许受到“马”字的影响。换一种说法,汉字的书写方式也会在一定程度上影响一个词的含义,例如“妈”字。
日语的语音提示与语义提示是两套不同的图形符号。日语的语音与语义是进一步分离的。最初,日语中也使用汉字。现在,日语中还保留着部分汉字,我们把它称为日文汉字。多数实义词均可用日文汉字表达。出于历史原因,这些词语兼具中文发音和日文发音。假名是日语中的第二种文字系统,它可以表示日语口语中的100多个音节。25假名还可以表示语义较轻的元素,如语法上的音调变化、小品词、外来词等,比如コンヒュータ(该词读音为“konpyuta”,意为电脑)。日文汉字与假名通常在日语书面语中混合使用。
日文汉字及假名分别通过语义提示和语音提示传递含义。日文汉字更贴近语义,而假名则侧重发音。但和其他文字一样,日语的语义和语音也没有完全分开,它的表示方法虽然符合一定的规律,但也有特例。日文汉字的含义与它的发音相关。部分特殊假名(如振假名)也会通过补充说明的方式表示其含义。26与此相反,假名有两种类型:平假名主要表示本族词汇以及日文汉字不能表达的语法成分;片假名主要表示外来语、科学术语以及其他专有名词。二者在写法上不同,与平假名相比,片假名更加棱角分明。所以假名一般都会暗示词语的含义。
日文汉字和假名均是日语的常用表达方式,二者在书写中的搭配使用可以提高日语的阅读效率。文本中可以只出现假名,但那样只会增加阅读难度,因为它破坏了二者之间的“和”(该词的日语读音为wa,意为和谐)。
使用字母的文字系统仅仅需要一套符号便可以同时表示语音与语义。希伯来语和阿拉伯语等闪族语系的语言都以辅音字母为基础,含有固定词根的词语不仅在发音上相似,其含义也是相关的。以词根ktb为例,它表示与书写有关的词语,如kātabti(?????)表示“我写”,kātab(???)表示“他写”,kattebet(????)表示“记者”等。希伯来语的词根gdl与“大”的概念相关,并出现在形容词“大的”,不同时态下的动词“长大”,以及名词“放大镜”“大小”“高塔”等词语当中。这种系统也是拟正则的,并不是所有的词根都像ktb一样与语义有如此紧密的联系,有些词根最多只能代表词语的部分含义。词语的完整含义脱离不了语音提示、语义提示以及它所在的上下文语境。27
最后,使用字母的文字系统,例如英语,使用元音和辅音共同表示发音。英文单词的语音与语义之间没有固定联系。英文中,代表小型家养猫科动物的单词可以是cat,也可以是dog或lump。发音相似的单词通常含义不同(如cat、cut、bat),而含义相似的单词通常又有不一样的发音(如cat、lion、panther)。字母似乎可以起到表示单词发音的作用,那由什么来代表单词的含义呢?28
答案就是形态学。单词由一个或多个语素组成。与音素和字素类似,语素是表示单词含义的最小单位。语素经过有序组合便构成了单词。下面就是一些例子:
“cat”的发音与它所对应的含义之间没有固定的联系(其拼写含义之间也没有固定联系)。然而,其他包含语素cat的单词,如cats、catty、catnip、bobcat等,却可以给我们带来一定的启示。许多包含语素cat的单词在语音及语义上都是相似的。英文拼写讲究字母顺序,所以“cat”在表示语音的同时,也表示语义。因此使用字母的文字系统也遵守“语音+语义”的原则,它们以一系列音素表示单词的发音,这些音素也与表示单词含义的语素相对应。