机器翻译之梦

2021年10月1日　　来源：表象与本质　作者：[美]侯世达；[法]桑德尔　提供人：zhaotou97......

机器翻译之梦

如果在翻译时涉及文化的转变，势必要引入大量的框架整合。试想，有人正在翻译一本中文小说，打算将其译成英文推广给美国读者。这不光得让故事里的人物都流利地说着他们根本不懂的语言，此外，故事里所有表示概念的字或词，在美国读者的心中都有不同的意义。考虑下面这些概念：城市、农村、自行车、电动车、房子、别墅、商店、米饭、山、河、诗词、字、词、眼睛、头发等。当它们通过字面翻译从中国文化转移到美国文化时会发生什么呢？每个范畴的核心成员，都有着属于自己的“老城区”。中美之间明显有着截然不同的成员。结果便是，当美国读者看到该小说的英文版时，他们自然而然便会引入某些美国的成见。他们想象中的故事和场景都会在不经意间把故事发生的地方和概念发展的地方整合在一起，也就是把中美整合在一起。同样的情况，对任意两种语言之间的翻译都适用。因为，原作中的有些部分可以保持不变，而另一些部分则难免有所改变。

尽管上文刚刚说到翻译如此复杂，但对有些人来说，翻译一事相当机械。事实上，机器翻译这个想法，从最早出现时算起，距今已有60余载。在那时，这个念头看起来合情合理，直截了当。比如说，这个领域的创始人之一，著名数学家沃伦·韦弗（Warren Weaver）曾经写道：“当我在读俄文写的文章时，我说：‘这就是用英文写的，不过是以某种奇怪的符号加密了。我要对此解密。’”⁶韦弗这段妙语道出了机器翻译的信条，翻译就是“解密”的过程。从本质上来说，这就像是替换式密码。也就是说，为了加密或是解密一条信息，需要做的不过是根据一个固定的对应关系表，把原有信息中的符号逐个替换成别的符号。具体来讲，以英文为例，把每一个字母换成它在字母表上的后继者，即可对原有信息加密。通常来说，加密后的结果都是一串毫无意义的乱码，比如说，“Gpvs tdpsf boe tfwfo zfbst bhp”。为了对这条加密过的信息进行解密，需要反向转换，把每一个字母换成它在字母表里的前续者。在这个例子里，得出的就是亚伯拉罕·林肯著名的开场白——“Four score and seven years ago”（八十有七载）。

在机器翻译早期，语言之间的翻译被视作上面的过程，只不过规模更大。在这个规模下，操作的单元不是字母，而是整个单词；对应关系表也不是仅仅长为26的字母表，而是巨大的双语词典，每一个给定的单词，都有着在另一种语言下对应的单词。后来有人指出，因为两种语言之间的语法存在差异，必然导致混乱的语序。为了克服这个尴尬的局面，需要一个把两种语法同时考虑在内的办法，机械地重新整理语序。这个过程虽然复杂，但十分直接。

直至今天，机器翻译的哲学背后还是这种替换-重排的过程。区别在于，今天的人们有语义对应关系表，其中的单元比通常比单词的层级要高。这可能包含成语，或是其他更大的结构，比如说，“Once bitten twice shy”翻译成中文可以是“一朝被蛇咬，十年怕井绳”。事实上，两种语言之间存在上百万对应的词组，计算机用极快的速度遍历全局选出某种“最佳”的对应关系，把语言A的词、句或是文章“解密”成语言B。

现在用当下使用最广泛的、也许还是最复杂的机器翻译“引擎”⁽¹⁶⁾来测试一下这个策略的功效。用谷歌翻译把前文林肯的那一句开场白“Four score and seven years ago”译成中文，眨眼的工夫，就得到了下面的结果：“四分七年前。”为了测试谷歌翻译对自己答案的理解，我们进行了反向的翻译——“Four quarters ago”，奇怪的是，关于“七年”的部分被忽略了。“score”一词在英文中有“得分”或是“分数”之意，但在林肯的开场白中，表达的意思是数量“20”这个概念。由此可见，这个例子里谷歌翻译得出的结果，不论是中文还是英文，都是一塌糊涂。让谷歌翻译把同样的话译成日文时，它给出的结果是“4得点と7年前”，即“四比分和七年前”。在此出现的问题，同中文翻译时的错误如出一辙。

翻译引擎对意义一无所知。它并不是在试着理解输入的内容，而是在摆弄那些符号。从这一点来看，谷歌翻译引擎确实像是用替换式密码来加密或解密，毫不涉及意义。这完全就是沃伦·韦弗在60年前提出的观点——一个没有思考、忽略意义、机械替换的过程，可以让人们在任意两种语言之间切换。

难以想象对翻译说出如此浅显见解的人，居然和写《多种语言下的爱丽丝》（Alice in Many Tongues）一书的是同一个人。这部简短的研究著作讨论了刘易斯·卡罗尔（Lewis Caroll）的《爱丽丝梦游仙境》（Alice in Wonderland），研究这本充满文字游戏的书里的巧妙段落是如何被富有创造力的译者翻译成不同语言的，包括法文、意大利文、德文、丹麦文、瑞典文、西班牙文、俄文、波兰文、匈牙利文、希伯来文、斯瓦西里文、洋泾浜英文、日文，以及中文。沃伦·韦弗书中的重点在于，卓越的译者们是如何应对那些复杂的翻译挑战的，比如说，滑稽模仿诗、文字游戏、荒谬话，以及其他内容与形式紧密交织在一起的方式。带着崇高的敬意，他描述了应对这些挑战的完美答案。他一次次地指出，高质量的翻译绝非机械的行为，它们和“机械的解密过程”毫无关系，而是需要不断发现绝妙的新类比。事实上，他的书告诉我们，要在语言B中找到语言A笔下人物的恰当对应，这样的翻译极大依赖于人生的经验和才智。

机器翻译的念头出现后不久就造成了重大问题。有一群质疑者提出了各种问题，其中质疑声最大的也许是逻辑学家约书亚·巴希勒尔（Yehoshua Bar-Hillel）了，他曾是这个领域最早，也是最热衷于此的研究者之一。到了20世纪50年代中期，翻译是“机械的”或是“算法的”过程这种说法，已经遭到了深深的质疑。正如我们所见，这种质疑至今仍在。

如涉及版权，请著作权人与本网站联系，删除或支付费用事宜。