• 精选
  • 会员

3.然后发生了什么

2025年1月24日  来源:意识的解释 作者:(美)丹尼尔·丹尼特 提供人:zhanbai93......

在第7章中,我们看到了冯·诺依曼架构如何提炼出有意计算的串行过程。图灵和冯·诺依曼分离出一种可以流经意识流的特殊的流,然后为了机械化而把它彻底观念化。这里存在众所周知的“冯·诺依曼瓶颈”,它由一个单独的结果寄存器和一个单独的指令寄存器组成。程序就是有序的指令列,这些指令取自机器硬连线地要执行的一个小的基元(primitive)集。一个固定的过程,即读取——执行指令循环,从存储器的数据队列取得指令;一次一个,而且始终从指令列中取得下一个指令,除非先行指令有分支被转移到指令列的另一部分。

当人工智能的模型建造者转而要在此基础上实施更现实的认知操作模型时,他们对这一切都做了修正。他们扩展了狭窄得难以容忍的冯·诺依曼瓶颈,把它转变成更加简明的“工作空间”或“工作内存”。同时他们还设计出更复杂的操作来充当心理基元,并以更灵活的下达和执行指令的方法,取代冯·诺依曼机器僵化的读取——执行指令循环。在一些情况下,工作空间变成一个“黑板”(Reddy et al., 1973;Hayes-Roth, 1985),各个小妖都能在上面写下供所有其他小妖阅读的信息,这些信息又会激起另一轮的写读。有着僵化指令循环的冯·诺依曼架构,仍旧在那里作为背景的一部分完成这种实施活动,但它在这个模型中并不发挥作用。在此模型中,下一步发生的事受制于“黑板”上相互竞争的、各种信息写读活动的结果。冯·诺依曼架构的派生物之一是各种互相关联的生产系统(Newell, 1973),它们构成了一些模型的基础,比如约翰·安德森(John Anderson, 1983)的ACT*(读作“ACT星”)模型和罗森布鲁姆、莱尔德和纽厄尔(Rosenbloom, Laird and Newell, 1987)的Soar模型(又见Newell, 1990)。

这个简单的ACT*模型图能帮助你了解一个生产系统的底层架构(见图9.1)。


图9.1

工作内存是所有行为发生的地方。所有的基本行为都被称为生产。从根本上来说,生产就是模式识别机制,一旦探测到它们的特殊模式,这些机制就会被激活。也就是说,它们是“IF-THEN”(如果?那么)运算符,待在附近看着工作内存中的当前内容,等到它们的如果(IF)子句得到满足,它们就依照那么(THEN)子句做出动作,不管它是什么(在经典的生产系统中,这个动作是在工作内存中存入新的数据要素,以进一步地细读生产)。

所有的计算机都有IF-THEN基元,它们是一些“感觉器官”,使计算机有可能针对进入内存的数据或从中检索的数据,做出差别化反应。这种条件分枝能力是计算机能力中一个必不可少的部分,无论计算机的架构是哪种。初始的IF-THEN是图灵式的清楚简单的机器状态指令:IF(如果)你看到0,THEN(那么)用1取代它,向左移动一个空间,转入状态n。你可以把这样的简单指令,同你可能发给一位训练有素、经验老到的哨兵的指令对比一下:IF(如果)你看到某个你不熟悉的事物,AND()深入研究也并不能解决这个问题, OR()你还留有怀疑,THEN(那么)就拉响警报。我们可以从简单的、机械化的IF-THEN中建造起这样的复杂监控吗?生产是中间层次的传感器,有人也许可以用它来建造更复杂的感觉器官,然后建立整个认知架构。生产可以采用复杂的、边界模糊的IF子句,它们所“识别”的模式,不必简单得就像收银机所识别的条码,而是应该更像哨兵区分指令的模式(有关讨论,可参见Anderson, 1983, pp. 35-44)。我们知道,图灵机在一个时刻总是只有一种机器状态(总是从IF-THEN集合中只取一个来检验,然后才转向下一个数据项),与图灵机中的IF-THEN不同,一个生产系统中的IF-THEN是一起等待,(模拟)并行运行,因此在每个时刻都有不止一个生产可以满足系统条件并准备行动。

事情在这里就变得有趣了:这样一种系统是如何解决冲突的?当不止一个生产得到满足时,总是可能有两个(或更多)生产导向互不相容的方向。各并行系统可以承载大尺度的交叉目标,但系统要在世界上取得成功,就不能所有事情都同时发生,有时必须放弃一些事情。如何解决冲突,是模型差异化的一个关键。事实上,由于绝大部分甚至所有在心理学和生物学上有趣的细节,都在于这个层次上的差别,因此最好把生产系统的架构看成用于建造模型的底层媒介。但是,所有的生产系统都有一些共同的基本假定,提供一条通向我们的理论概要的桥梁:它们都有一个行为发生的工作空间,许多生产(等同于小妖)都可以尝试在这里同时做它们自己的事情;它们同时都拥有一个多少有点儿惰性的内存,天生的和累积的信息就储存在这里。由于这样一个系统所“知道”的每件事在此空间中并非都可以同时得到,因此柏拉图的问题,即让正确的鸟在正确的时间飞进来,就成为需要面对的主要逻辑任务。而且,从我们现在的观察点来看,最重要的就是,理论家现实地找出候选的机制来回答那个困难的问题:然后发生了什么

例如,在ACT*模型中,有五条解决冲突的原则:

(1)匹配程度(Degree of match):如果一个生产的IF子句所得到的匹配比另一个的更好,它就有优先权。

(2)生产能力(Production strength):近期取得成功的生产有着与之相关的更高“能力”,这使它们优先于能力较低的生产。

(3)数据不应性(Data refractoriness):相同的生产最多只能与相同的数据匹配一次(这是为了防止无限循环和相对不太极端但也相似的惯例)。

(4)专属程度(Specif icity):当两个生产与相同的数据匹配时,专属程度更高的IF子句的生产胜出。

(5)目标优势度(Goal dominance):生产在工作内存中存入的项目里包含目标。在ACT*的工作内存中,一次只能有一个当前活动的目标,而任何其输出与活动目标相匹配的生产,都拥有优先权。

上面都是解决冲突的合理原则,在心理学和目的论上都很有意义(详细的讨论参见Anderson, 1983, ch. 4)。但是,也许它们所图过大。也就是说,安德森自己聪明地设计出ACT*模型的冲突解决系统,他利用自己的知识来探索在冲突解决环境中出现的种种特定的问题以及处理它们的有效办法。本质上他是把这种复杂的知识硬连线到演化天生馈赠的系统中。与此形成有趣对比的是罗森布鲁姆、莱尔德和纽厄尔(Rosenbloom, Laird and Newell, 1987)的Soar模型。与任何并行架构一样,它也会遇到僵局(impasse),所谓僵局就是需要解决冲突的情况,要么是因为相互矛盾的生产“激活”,要么是因为没有生产“激活”,但是,Soar模型把僵局看成天赐良机,而不是问题。僵局是系统中的基本建造机会。冲突不是通过一套预先固定的冲突解决原则来自动处理(一个发号施令充当交警的小人早已就位),而是非自动处理。一个僵局创造一个新的“问题空间”(一个话题工作空间),其中要解决的问题就是这个僵局。这可能生成另一个元——元交通问题空间,以此类推——甚至可能直到永远。但在实践中(至少在如今已经建模的领域中),在问题空间堆积数层之后,最顶端的问题找到了一种解决方法,它又会迅速向下解决下一个问题,以此类推,这样,在对可能性的逻辑空间做出一种琐碎的探索之后,空间增生这个不祥的问题被消除了。此外,上述实践对系统的效果就在于,把由此所得的来之不易的发现“集结”到新的生产中,这样,当类似问题将来再出现时,我们手上就有一个新创的生产来迅速解决它——解决这个在过去已经得到解决的琐碎问题。

我简要提到这些细节,不是要论证Soar模型胜过ACT*模型的最终优点,而是就一些问题提供一点看法,我们可以通过建立在这类部件上的模型对各种问题进行可靠的探索。我自己的预感是,出于各种我们在此无须关注的理由,生产系统的底层媒介在它的约束因素方面仍然太过观念化和简单化,但是,从冯·诺依曼机器到生产系统的这条轨迹,却指向更进一步的架构,它们在结构上会越来越有头脑,探索它们的能力和局限的最好办法就是建造它们并运行它们。这样的方法可以把在种种理论中(比如我的理论)仍然是印象式的和含糊的东西,转变为诚实可靠的模型,从而可以从经验上检验它们的细节。

当你接受我在上面4章就意识机制提出的各种主张,开始尝试在诸如此类的认知系统模型上把它们并列考察时,会出现许多问题,但我不打算在此做出解答。由于这些问题都没有得到解决,所以我的概要就只是概要而已——这份概要可以松散地适合整个理论家族,即使它们有着重要的不同之处。在这里我只需要做到这个程度,因为意识哲学关心的问题是任何这样的理论能否解释意识,所以,若是我们把希望钉死在一个过分具体的观点上,而它最终被证明有严重缺陷,那将会是草率的。(不过在附录B中,我将公开表达少数经验性意见,以满足一些人的要求,他们想要的是一开始就有可验证含义的理论。)

不只是哲学家需要这个层次的建模工作来确定自己的理论是否可靠,神经科学家的理论也应如此。例如,杰拉尔德·埃德尔曼(Gerald Edelman, 1989)关于大脑中“再入”回路(re-entrant circuit)的精致理论,提出了许多主张来说明这些再入部分如何可以完成区分、建造内存结构、协调问题解决的有序步骤,并大体执行一个人类心智的活动,但是,尽管这些理论包含丰富的神经解剖学细节,尽管埃德尔曼提出了一些充满热情同时也往往合理的主张,我们却不会知道他的再入部分可以做什么,以及这些再入部分是否就是构想功能神经解剖学的正确途径,除非它们在ACT*模型或Soar模型的精细层次上经过塑造,成为一个整体的认知架构,并显示自己的作用。[3]

在更精细的建模层次上还有一项未完成的任务:指明生产(或任何我们称为模式识别小妖的东西)本身在大脑中是如何得到实现的。巴尔斯(Baars, 1988)把他的特化回路称为用于建造的“砖块”,他决定把砖块制造的深入细节留到别的时间或别的领域去解决,但正如许多人所指出的那样,一个很有诱惑力的做法是,假设在集成的若干水平上,特化回路本身应当被建模,而模型是由某类联结主义的结构组成的。

联结主义(并行分布处理)是人工智能领域的一个相对近期的发展,它许诺把认知建模推进到神经建模,因为作为它们的砖块的要素是并行网络中的节点,所以这些网络的联结方式看起来就像大脑中的神经网络。把联结主义的人工智能与“老式的人工智能”(Haugeland, 1985),以及与神经科学中的各种建模计划进行比较,已经成为学术界的主要研究内容(例如,参见Graubard, 1988; Bechtel and Abrahamson, 1991; Ramsey, Stich and Rumelhart, 1991)。这并不令人惊讶,因为联结主义在心智科学和脑科学之间巨大的未知地带开辟出了一条最早的、不大可信的统一之路。但是,几乎没有哪项围绕着“正确对待联结主义”(Smolensky, 1988)的争论会影响我们这里的计划。当然还是得有一个理论层次(或多个层次)具有像联结主义模型那样的精细度,而且它要在更接近神经解剖学的理论层次与更接近心理学或认知理论层次之间充当中介。问题是,哪些具体的联结主义观点可以成为这种解决方案的一部分,哪些观点又会在此过程中被淘汰。除非解决了这个问题,否则思想家们往往会把联结主义的争论场当作宣传口号的扩音器,而虽然与其他人一样我也乐意在这些争论中采取一定的立场(Dennett, 1987b, 1988b, 1989, 1990c, 1991b, 1991c, 1991d),但在现在这个场合我要保持缄默,着力完成我的主要任务,这个任务就是要弄清楚,当尘埃落定时(无论以何种方式),一个意识理论如何可以从这里浮现出来。

请注意,从冯·诺依曼架构到生产系统和(更精细层次的)联结主义系统这样的虚拟架构,在这个不断进展的过程中发生了什么。这里有一种所谓的力量平衡转换。固定的、预先设计的程序,沿着一些路轨前行,路轨上有一些由数据决定的少数分站点;程序被灵活的——其实是变化多端的——系统取代,这些系统的后续行为更多是系统当前所遇的事情与过去遇到的事情之间复杂互动的一个函数。正如纽厄尔、罗森布鲁姆和莱尔德(Newell, Rosenbloom and Laird, 1989)指出的:“所以标准计算机的问题是如何中断运行,而Soar模型和ACT*模型(很可能也是人类认知)的问题则是如何保持聚焦。”(p.119)

在这个理论问题上花了这么多笔墨,我想强调一点:这是力量平衡的一种转换,而不是转向某种“性质不同的”操作模式。最易变的模式识别系统(无论是不是“联结主义的”系统)的核心在于冯·诺依曼引擎,这个引擎一路发出咔嚓咔嚓的声音,计算着可以计算的函数。从计算机诞生的那天起,人工智能的批评者就总在强调,计算机是僵化的、机械的,完全受程序规定,而它的维护者则反复主张,这只是一个复杂性程度的问题——人们在计算机上完全可以不受限地创造非僵化的、模糊的、整体的、有机的系统。随着人工智能的发展,这样一些系统出现了,于是批评者现在必须在鱼与熊掌之间做出选择。他们是应该宣称,(例如)联结主义系统就是他们一直认定的心智构成要件,还是应该提高价码,坚称在他们看来即便是联结主义系统也不够“整体”,或不够“直观”,或……(填上你喜欢的任何口号)?人工智能最著名的两位批评者,加利福尼亚大学伯克利分校的哲学教授休伯特·德赖弗斯(Hubert Dreyfus)和约翰·塞尔在此问题上意见不一;德赖弗斯坚决支持联结主义(Dreyfus and Dreyfus, 1988),而塞尔则冒了更大的风险,坚持认为联结主义的计算机不可能体现出真正的心智性(Searle, 1990a, 1990b)。

这些所谓“原则上的”怀疑论者也许正在撤退的路上,但是,统一论者仍旧面临巨大的问题。在我看来,最大的问题与我们这里所谈论的意识理论有直接关系。认知科学中的共识可以用许多类似图9.1的示意图来阐明,这个共识说:在这里我们有长期内存(柏拉图的鸟笼),在那里我们有工作空间或工作内存,它实际上是思考的发生地。[4]然而,大脑中并不存在收容这样两个分离装置的地方。大脑中唯一可以作为这两个分离功能的可靠家园的地方,就是整个大脑皮质,那不是两个紧邻的地方,而是一个大地方。正如巴尔斯在总结这种逐渐形成的共识时所说的,只存在一个全局工作空间。它是全局的,不仅是在功能的意义上(大致来说,它是任何事物能够与任何其他事物接触的一个“地方”),而且也是在解剖学的意义上(它分布在整个皮质中,无疑也涉及大脑的其他区域)。于是,这就意味着,工作空间必须利用同样的神经束和神经网络,后者貌似在长期内存中起主要作用,即“存储”因个体探索而带来的设计变化。

假设你学会了如何制作玉米饼,或了解到“表型的”这个词语的意思。大脑皮质必须以某种方式充当中介,稳定的联结模型可以在其中相当持久地把这些修正设计固定在你与生俱来的大脑中。假设你突然想起你预约了牙科医生,驱散了听音乐的闲情逸致。大脑皮质又必须以某种方式充当中介,稳定的联结模式能够在其中迅速地改变整个“空间”的这些暂时内容——在这个过程中当然不会抹去长期内存。这两种类型极为不同的“表征”,如何可以在相同的中介中共存?在纯认知模型中,这些工作可以被安置在一张图的不同方格中,但是,当我们必须把它们叠加到唯一的神经组织结构上时,我们根本就不需要担心这个简单的打包(packaging)问题。

两种功能不同的网络系统应该可以相互渗透(就如电话系统和公路系统横跨美洲大陆一样)——这不是问题所在。深层的问题潜藏在我们所做的一个假设的表层之下。我们已经假设,个别的特化小妖在某个更大规模的事业中以某种方式征召其他小妖。如果事情只是召集这些新成员,在共同事业中发挥它们的特化才能,那么我们也许已经有了这类过程的模型,比如ACT*模型、Soar模型和巴尔斯的全局工作空间,它们有程度不等的可信的细节。但是,如果那些特化回路(specialist)有时也被征召为通用回路(generalist)以实现一些功能,而它们的特化才能在这些方面的作用却微乎其微,那会怎样?这是一个诱人的想法,其理由各种各样(例如,参见Kinsbourne and Hicks, 1978),但据我所知,我们仍然没有任何用来说明这类具有双重功能的要素如何可以运行的计算模型。

困难就在这里:人们普遍认为,大脑中的特化回路必须以某种方式,从它们在有相对固定联结的网络中的实际位置,获得它们的功能身份。例如,一个特定的神经束只是“关心”颜色,唯一能够解释这个现象的事实似乎就是,它与视网膜中的视锥细胞形成了独特的联结(虽然是间接的),视锥细胞则对不同频率的光线最敏感。一旦这样的功能身份确立起来,联结就可以被切断(如在成年失明的人身上那样),而不会(完全)丧失特化回路表征(或以其他方式“关心”)颜色的能力。但是,如果首先没有这样的因果联结,那就很难看出,什么可以赋予特化回路一个具有特定内容的角色。[5]大脑皮质似乎(主要)是由一些要素组成的,这些要素多少有些固定的表征能力,而这是它们在整个网络中功能定位的结果。它们的表征方式就同众议院议员如何代表相应选区一样:携带来自与之有着特定联系的来源的信息(例如,通过他们在华盛顿的办公室里使用电话所做的绝大多数交流,我们能追溯到他们所代表的选区)。现在想象一下,众议院的议员们坐在体育场的一排椅子上,每个人高举一个代表重要信息的彩色大牌子,比如“Speed Kills !”,信息是根据牌子上的一些大型字母拼出来的,字母大到从对面的看台都可以看见。简而言之,这些议员是活生生的像素,他们与自己选区的关系没有在此反映到他们在群体代表方面的贡献上。一些皮质征召模型有力地表明,这种次级表征角色的东西必定是可能的。例如,我们可以假设:与某个特殊事务有关的信息内容可以在某个特化回路中产生,然后以某种方式沿着皮质区域传播,充分利用那些区域的变化状态,但不涉及“居住”在那里的单元的特化语义学。假设某人的视野左上四分之一的区域突然发生一个变化。正如预期的那样,我们可以看到,大脑的兴奋首先发生在视皮质的某些部分,这些部分表征(以众议院的方式)视野左上四分之一的区域中事件的各个特征,但这些热点马上变成传播兴奋的源头,把皮质行动者与其他选区卷到了一起。如果这种唤醒沿着皮质区域的传播不是泄漏或噪声,如果它也能发挥某种关键作用,细化或加速一个叙事片段的编辑活动,那么这些征召而来的行动者所扮演的角色,与它们作为来源(具有固定作用)时的角色,必定是完全不同的。[6]

不足为奇的是,关于这种多重功能性,我们迄今还没有好的模型(我所看到的唯一可信的推论是明斯基在《心智社会》中做出的一些推测)。正如我们在第7章所指出的,人类工程师的远见并不完美,于是他们就训练自己去设计一些系统,其中每个要素都扮演唯一的角色,与外部干扰谨慎隔离,以最大限度地降低无法预见的副作用。此外,大自然并不担心可预见的副作用,它们一旦出现,它就能利用这些偶然发现的副作用——次数少之又少。神经科学家至今都束手无策的皮质功能分解问题之所以如此难以捉摸,很可能源于下述事实:他们发现自己根本无法接受可利用的要素有多重角色这类假说。哲学家欧文·弗拉纳根(Owen Flanagan, 1991)将一些浪漫主义者称为新神秘论者,他们提出的主张说,大脑在理解它自己的组织结构方面存在一个不可克服的困难(Nagel, 1986; McGinn, 1990)。我不接受任何这样的主张,却会考虑如下看法:要弄清楚大脑如何工作,确实困难至极(但并不是不可能),这部分是因为它是由一个过程所设计的,该过程可以因多重的、叠加的功能性而壮大,但这一点很难从逆向工程学的视角看出来。

这些问题就算有人注意,也会激起一些随意而不尽严谨的论证。一些人不假思索地要摒弃这种特化回路/通用回路的两重性观念,不是因为能够证明它是错误的,而是因为无法想象如何对它进行建模,他们因此也就相当合理地希望,他们永远不必这样做。但是,一旦这个远景可期,它至少能为理论家提供一些新线索。神经生理学家已经(试探性地)辨别出神经元中的一些机制,比如NMDA受体(俗称“记忆闸门”)和冯·德·马尔斯伯格突触(von der Malsburg, 1985),它们是可信的候选者,可以充当细胞之间联结性的快速调节器。这样的闸门或许允许快速形成短暂的“集合体”,这些集合体可以叠加在网络上,不必要求长期突触强度(通常被认为是把长期内存的持久集合体连在一起的黏合剂)有任何改变。(沿着这些思路进行的一些新颖推论,可参见Flohr, 1990。)

在更大的范围内,神经科学家一直在填充大脑中的联结图,他们不仅指出哪些区域在哪些情况下处于活跃状态,而且开始指出它们做了什么样的贡献。研究人员猜测若干区域在意识中扮演了关键角色。人们早就知道,中脑网状结构的形成以及在它之上的丘脑,在唤醒大脑方面发挥着关键作用——比如将大脑从睡眠中唤醒,或者对新奇事物或突发事件做出反应,而现在研究者已经绘制出更好的路径图,更细致的假说就能够得到阐述和检验。例如,克里克(Crick, 1984)提出,从丘脑辐射到大脑皮质所有部分的分支,使丘脑适合扮演“探照灯”的角色,它们有差别地唤醒或加强特定特化区域,并利用这些区域实现当前目的。[7]巴尔斯(Baars, 1988)则详细阐述了一个与此类似的概念:延伸的网状丘脑激活系统(Extended Reticular Thalamic Activating System,ERTAS)。将这一假说吸收到我们在解剖学上尚不明确的、关于特化回路联盟之间竞争的论述很容易,但有个条件,即我们不要掉进一个诱人的意象陷阱,以为有一个丘脑老板理解当前的事件,这些事件实际上是受与丘脑处于“交流状态”的脑中各个部分管理的。

类似地,我们知道,大脑皮质的额叶——智人大脑最明显增大的部分——参与了长期控制以及行为的编制与序列安排。额叶各个区域的受损通常会产生一些相反的症状,例如,精神错乱与精神过于集中而无法摆脱常规束缚,以及容易冲动或没有能力按部就班地做出延迟满足的行为过程。于是,一种诱人的做法也许是,将老板设定在额叶中,有几个模型已经在这个方向上采取行动了。一个特别复杂的模型是诺曼和沙利斯(Norman and Shallice, 1985)的监督注意系统(Supervisory Attentional System),他们将这个系统定位在前额叶,并认为在辅助的官僚机构不能合作时,它要承担解决冲突的特殊责任。我们再次看到,为那些控制后续事件的关键过程找到一个解剖位置,这是一回事,而确定老板的位置,这又是另一回事;任何人要去搜寻前额显示屏——老板就是在这里追踪其控制的计划——都将是徒劳一场(Fuster, 1981; Calvin, 1989a)。

不过,一旦放弃这个诱人图景,我们就必须找到其他方式来思考这些区域所做的贡献,而在这方面近来虽然也有一些进展,但仍然存在观念短缺的问题。这不是说,我们不了解这个机制是什么,问题主要在于缺乏一个计算模型来说明这个机制在做什么以及它是如何做的。在此我们仍然处在隐喻和略而不证的阶段,但这不是一个要避开的阶段;它是我们在研究的路上需要跨越的一个阶段,我们可以从这里出发去寻找更明确的模型。

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000