20世纪70年代末,人工智能喧嚣一时,夸大了该领域的现状和前景:思考机器就在眼前!而约翰·塞尔却坚信自己看透了其中的破绽,还构筑了一个思想实验予以说明。1980年,在文章《思想、大脑和程序》(Minds, Brains and Programs)中,塞尔提出了“中文屋”这个著名的思想实验,试图证明“强人工智能”不可能出现。他这样界定“强人工智能”:“给计算机适当的编程让它拥有认知状态,只要运行程序就可以解释人类认知。”(Searle, 1980, p. 417)随后,又进一步阐明:“适当编程的计算机,如果输入输出均正确运行,那么它就能拥有完整意义的人类思想。”(Searle, 1988, p.136)
众所周知,1980年,在认知科学核心期刊《行为与大脑科学》(Behavioral and Brain Sciences)和它的网站论坛上发表的文章都有这样一种特殊形式:围绕一个问题会有多篇长篇的“专题文章”,之后还附有数条领域内专家们的评论及作者们的回应。网站论坛极力追求的是跨学科讨论,各个学科的代表专家纷纷发言,这就为读者们提供了及时且有用的反馈。一篇专题文章能否引起其他专家重视,他们是如何认真对待这篇文章的,这些可以帮助你预测一篇文章能否可以为己所用以及如何利用。另外,与自信的讨论者们发生激烈对峙,无视彼此,各说各话,或是参加到一个拥有最强实力的学术战斗团体中,这些体验也能让你了解到很多跨学科讨论上的困境。塞尔的那篇专题文章引来了一系列激烈的反驳,包括我自己在内(Dennett, 1980)。也正是那个时候我发明了“直觉泵”这个术语,协助我揭露出塞尔那个思想实验给大家带来的误导。
虽然“直觉泵”是我发明的术语,但也借助了侯世达的力量,我是在与他一起讨论塞尔文章的时候才萌生了有关“直觉泵”的想法,后来我们还将塞尔的文章连同评论一起放入了我们的文集《心我论》(Hofstadter & Dennett, 1981)。我对塞尔的这个思想实验感兴趣,出于两个原因:一方面,这个论证确实有误导性,它在欺骗读者;而另一方面,它又是那么有说服力,读起来实在让人感到愉悦。那么,这个思想实验是怎样进行的,为什么会如此运行?我们曾用逆向工程的方法探索过这些问题,候世达建议我们要“转动所有的旋钮”,去看看这个思想实验是如何运作的。这个故事可以经受住较大幅度的“变形”吗?还是它得严格取决于本应是随意设置的细节才能成立?(88)
我必须承认,在30年前,塞尔中文屋的思想实验确实有着非凡的感染力和影响力。它堪称经典,在成千上万的本科教材中出现过,至今被讨论过无数次。我在自己的课堂中也曾多次引用它,我想研究它是如何运作的,还想试着向人们展示出它的问题所在。(89)
为此,我要先展示这样一个直觉泵——吊杆托架,它存在一些问题,所以要小心使用,以免丧失想象力。对于我即将展开的这项细致的工作,我想你们听过后就会默默把眼睛瞥向别处,甚至向我“哼”一声,实在不想看我毁了“中文屋”这个设置,你们多么喜欢这个结论——吁,根本不可能有强人工智能存在!所以此时,你们目光呆滞地望着远方,盼着谁能再悉心研究出一个生动有趣的论证。我看不起你们,你们贪恋的只是好不容易有个著名的哲学家写了一篇文章,为你们的想法提供权威论证,为此你们高兴极了。你们真正关心的不是细节,只是结论,这是一种逃避,一种反理智的逃避行为!
但随后我也发现自己做了同样的事情,我必须重新考虑我的判定。我承认,我一直都觉得量子力学莫名让人讨厌,因为再怎么努力我都无法把它弄明白,有时候,我宁愿它是无中生有!我深知它对一些现象的预测和解释让人心服口服,其中包括很多日常现象。例如,光的反射和折射、我们用眼看事物时视网膜上蛋白质的运作等等。量子力学是一门核心科学,但即便是量子力学的专家们也未必能将它完全弄懂。我曾多次尝试想要掌握量子力学的数学运算,可最后都以失败告终,所以,面对围绕它展开的各种科学讨论,我只好充当无能为力的旁观者,尽管我也觉得有趣。但即使这样,对于博学多识的专家们所给出有关量子力学的诸多说法,我也仍持怀疑态度。
后来,我读了著名物理学家“夸克之父”默里·盖尔曼(Murray Gell-Man)的《夸克和美洲豹:在简单和复杂中冒险》(The Quark and the Jaguar: Adventures in the Simple and the Complex),这是一本专门为我们这些非专业人士撰写的科学读本。让我喜出望外的是,盖尔曼采用的是一种轻松的语调,字里行间透出启发性,他叩击混淆视听的歪门邪说,透见了久违的光明,一举取得了大家的好评。请参照他“量子力学与胡说八道”(Quantum Mechanics and Flapdoodle)一章来理解我要表达的意思。我心里默念:“再来一击,盖尔曼,揍扁他们!”这位世界闻名的物理学家正在用我能明白的论述支持我对量子力学的种种偏见,这不正是我所理解的量子力学吗?但紧接着我又心头一颤,我真正理解了他的论证了吗?还是说,我只是近似理解了这些论证?我敢保证我没有受到他某种“花言巧语”的诱惑吗?此时,我不希望再有其他的物理学家出现,向我表明自己只是受了盖尔曼权威言论的蛊惑。我太喜欢他的结论了,不想再去考察他论证的细节。这跟你们的状况真是如出一辙。
但也有些不一样。我是在参照了很多专家的相关著作之后才对盖尔曼的作品给出了那样的评价,我的态度始终认真谨慎,至少到目前为止是这样的。而且,我也时刻准备接受,在之后的某一天,盖尔曼的那些“共识”也变成了想象力失败的一个案例而不再是之前深刻的观点,尽管它们是那么有魅力。我恳请你们也能用这种开明的态度来看待我在分解销毁塞尔中文屋的过程中所付出的那些努力,我也尽量把这件事情做得更易于让你们接受。
再回到20世纪50年代的图灵测试。在这个测试中,“法官”会试探性地跟两个实体展开交谈,一个是人,另一个是计算机。它们与“法官”对话时都要隐藏身份,只能通过“电传打字机”(可以想成屏幕配上键盘)才能完成交流。那个人要竭力向“法官”证明自己的真实身份,而计算机的任务则是要让“法官”相信自己才是人类,如果“法官”没能切实说出两者的不同,就证明计算机(程序)通过了图灵测试。这时我们说,计算机已经不只是具有智能,它“已经在最根本的意义上像人类那样具有了思想”(1988年塞尔在书中这样说道)。
对于这个领域的大多数人来说,为什么图灵测试会是检验强人工智能的试金石?因为和图灵一样,大家都认为,没有理解能力就完成不了那种对话,如果哪台计算机能成功完成这样的对话,就说明它已然具有了理解能力。(90)但事实上,图灵测试根本区分不出或者说不能区分哪个是僵尸哪个是“真正有意识的”人,因为一个有意识的人可以做的事情僵尸也照样能做。正如很多人所认为的,“通过图灵测试的实体,不仅是智能的,而且是有意识的”这个说法与僵尸直觉背道而驰。所以图灵测试不能算是个好的心智测试,但在仔细考察相关细节之前,我们先暂且保留这种判断。在我们形成一串意识流的地方,那个通过了图灵测试的程序就能形成一股殭尸式的非意识流,这明显对僵尸直觉构成了挑战,因为僵尸直觉告诉我们这两者之间存在着实质性的差异。殭尸程序只拥有近似意识吗?让它功亏一篑的地方到底是哪儿?也许,塞尔的直觉泵就是想让所有贬低“强人工智能”的那些说法看起来都像是归谬论证。
塞尔请我们想象这样一幅场景:他被锁在一间屋子里,手动模拟一个巨大的人工智能程序,假设这个程序能理解中文。塞尔保证,这个程序能够从容应付图灵测试,能让自己经受住人类对话者企图将它从真正理解中文的人中区别出来的所有考验。而被锁在屋子里的那个人,塞尔,他不懂汉语,屋子里也没有其他理解中文的东西,塞尔能做的只是按照程序不停地操纵一些符号串,从中根本无法理解中文。屋里除了塞尔和“几张写着指令的纸条”,其他什么都没有。塞尔只靠精确地遵循这些指令手动模拟这个庞大的程序。如果塞尔不懂中文,那么当然(叮!),再加上几张纸他也照样不懂,所以,中文屋里没有可以对中文产生理解的东西,但它确实有强大的对话能力,足以在说中文的人中间以假乱真。塞尔和计算机一样,只会根据字符形状辨别出中文,对于他们来说,中文字符只是一些各不相同的无意义的“涂鸦”。所以,有塞尔在的中文屋只不过是计算机程序的一种实施方案而已,该程序所有的工作都无需对中文有任何理解,不管是在硅芯片上运行还是由塞尔操作。
真是个既简单又可靠的思想实验!还有哪里有错吗?哦,有。这个思想实验一在伯克利公开就引起了计算机专家们的反驳,塞尔将其称作“系统回应”理论,他们说道:
的确,锁在屋里的人类个体看不懂中文,但他只是整个系统的一部分,而整个系统是能形成理解能力的。个体面前摆着一本总账簿,上面写着各种规则,有大量的草稿纸和铅笔供他运算,他还有一整套中文字符的“数据库”。所以,形成理解绝不仅是一个个体的事情,它是隶属于系统的,个体只是其中的一部分。(Searle, 1980, p. 419)
塞尔随即形象有效地做出了下面的回应:
这让我觉得有些尴尬……,如此展开一个理论真的有些不可思议。你们想说的意思是,一个单独的人不能理解中文,但是以某种方式联合上几张纸条就能把中文弄明白?我真的不能想象,若没有某种意识形态的笼罩,一个人要怎样才能相信这个想法。(Searle, 1980, p. 419)
让塞尔觉得不可想象的其实是图灵的那些基本洞见,利用它们图灵想出了有关存储程序计算机的理念!所有的能力都在软件那儿。回想在24章中我们介绍的寄存器机,单独的寄存器机根本不理解什么是算术,但是与软件联合起来,它们就能将算术完美实现。笔记本电脑上的国际象棋程序其实对国际象棋一无所知,但只要程序开始执行,它就肯定能赢过你,其他对峙也是如此,这就是笔记本电脑的强大威力。被塞尔称作意识形态的东西也是计算机科学研究的核心,它发展的每一步都走得坚定稳固。要完全复制出人类的能力并最终完成理解,需要在虚拟机上叠加虚拟机,在其上再叠加虚拟机,能量和能力完全由系统承载,它们从来不是隐藏在硬件里。图灵完美地重复了达尔文“奇怪的推理倒置”,创造出了自己的“奇怪的推理倒置”(Dennett,未发表):在图灵之前,我们总以为人类所有的能力都来自于他们能理解,理解是所有智力的神秘源泉,现在我们才认识到,理解本身其实是一种效果,它从成堆的能力中冒出来,是各种能力层层叠加生成的。
细节是关键。塞尔从来没有告知他的读者,自己要在一个什么样的水平上手动模拟那个庞大的人工智能程序。他大概以为只要依照程序这样运行就可以:
现在,假设在接收到第一串中文字符(输入)之后我又接收到了第二串中文字符,与此同时还有关于怎样将两串文字联系起来的规则。规则是英文写成的,与英文母语的人们一样,我能够理解它们,能按照它的说明将一串规整的符号联结到另一串规整符号上。现在,还假设我又收到了第三串中文字符和一些提示,这些提示也是英文的,引导我将第三串字符中的某些因素与前两串字符联系起来,帮助我根据前面特定中文字符形状回应第三串中文字符中的某些相同形状的字符。(Searle, 1980, p. 418)
塞尔将如何联结这些“字符串”与“英文屋”做了对比:输入的不是中文而是英文句子或者故事,继而他直接用母语英文回应。
从屋外来看,即仅从某人阅读到我的“答案”这一层面来看,不管针对的那个问题是中文也好是英文也罢,我所给出的中文答案和英文答案都不错。只是,对于中文案例来说,我是通过不经理解地操纵形式符号得到的,这与在英文案例中截然不同。(Searle, 1980, p.418)
看起来挺规整的一个类比!但我们要看看塞尔漏掉了什么。我们知道,塞尔收到了英文的“一套规则说明”,也就是所谓的提示,它们与“将寄存器39021192中的内容添加到寄存器215845085的内容中(机器码)”或者“定义一个常量的列队大小并将它设置在100(源代码)”这样的指令不同。塞尔是把自己闷在地下室,以每秒数万亿计次惊人的速度在操作计算吗?或者他是顺着程序的源代码在其上又叠加了多层操作?在遵循着源代码行进时他是否也读到了注释?最好不要,因为这些注释并非程序的一部分,它们只是为了给塞尔提示一些程序走向的线索,比如,“这是为了分析句子,生成名词、代词、动词、修饰语,并确定它是疑问句、陈述句、祈使句或者感叹句”,然后,在几十亿次操作之后,还会有“发现双关语,切换到应答模式……”,之后又是一套更加详尽的数十亿次的操作,在这个过程中,引用得到了精炼,备选答案就像对棋步不同走法的预测分析那样得到了评估,最后生成一个输出句子。
如果塞尔要手动模拟一个程序去进行一套感染人的中文对话,那么需要查阅数量庞大的数据库,可不仅仅只是“一系列中文字符”;正如他自己所说,至少要参考到以中文为母语的人能共享的所有日常知识。在塞尔手动操作的时候,他是根据提示进行各个层次的认知活动,还是完全仅依靠大量运算呢?
任何能够通过图灵测试的程序都必须经过一番“理智”操作,它与我们在展开对话时自己要经历的理智活动极为相似。假设,图灵测试中的提问者开始用苏格拉底式的问答方式裁选量子力学学科的候选人,给出一些简单的问题让这些测试者们来作答。要通过这样的测试,引擎室里的塞尔不得不通过精心设计的智力练习来阻止对话的结束,但当他结束这残酷的测试时,仍和刚进来时一样对量子力学一窍不通。相反,系统在测试结束时对量子力学的理解却深厚多了,因为它已经完成了相关练习。这个有关图灵测试的特殊案例会在程序中安装一个新的虚拟机,即简单的量子力学虚拟机。
我提到的这些事实,几乎全被塞尔那“几片纸张”和“规则”可以助他“关联”起中文字符的设想所掩埋。这并不是说,塞尔有意隐瞒了他所想象的手动模拟程序的复杂程度,我想说明的是,他忽视了这种复杂性到底是一种怎样的复杂性。如果你所设想的程序只是相对简单的一系列规则,那么就像遗传学家贝特森思考“染色质颗粒”那样:“在任何已知的测试中都无法区分彼此,它们确实是同质的。”你当然会感叹,程序的理解力竟然那么“不可思议”,就像你同样也会感概DNA的力量不可思议一样。
现在看看,到目前为止我们都做了什么?我们已经转动了塞尔直觉泵上的旋钮,试图操控有关程序运行在不同层面上的描述。描述的层面当然有很多,在最高层次上,系统的理解力量没有超出我们的想象,我们甚至能洞察到系统如何理解了自己的所为。系统的回答不再令人感到尴尬,而令人感到很正常。但这并不表示,塞尔口中批判的人工智能已经达到能被称为有理解能力的那种水平,或者它们的运行方式在经由人工智能研究者想象延伸之后,就能够形成如此高超的能力。这仅表明,塞尔的思想实验并没有成功说明他想说明的那个问题:强人工智能不可能形成理解。
除此之外其实还有一些可以转动的旋钮,但我这个直觉泵已经在中文屋引出的庞大语境中得到了充分发挥。这里,我想集中讨论的并非中文屋所关注的理论和主张,而仅是“思考工具”本身,企图揭露出这件工具的缺陷,因为它在用晦暗不明的想象力而不是不断开拓出的正确想象力在说明问题。