Copycat模型

2024年12月25日　　来源：涌现　作者：约翰·霍兰德　提供人：It8933......

现在我必须开始论述另一个重要的基于计算机的建模，这个建模过程将更为直接地阐述涌现现象。这就是侯世达和梅拉妮·米歇尔（Melanie Mitchell）的Copycat(12)模型（Mitchell, 1993），它是由侯世达领导的流体仿真研究小组建立的几个模型之一。Copycat模型是一个复杂而精致的模型，值得我们用整整一个章节的篇幅来进行讨论。事实上，通过详细的阐述，我们将可以获得更深入的了解，但这样一来，对细节进行描述所占的篇幅将会较长。所以我只是重点强调一下在受限生成过程的框架下，Copycat模型在涌现方面所表现出来的一些特性。如果读者对这个课题有兴趣，可以参看《流体的概念和创意类比》（Fluid Concepts and Creative Analogies）一书（Hofstadter, 1995）。

这里设计的Copycat是用来反映流体重组的，该重组涉及类比的构造。这种类比利用字符串的转换方式来进行研究，和智力测验有点相似。“假设字符串abc被转换成abd，那么按照同样的规则，应该怎样对字符串ijk进行转换呢？”虽然这个问题很简单，但它还是巧妙地混合了分类和重组思想。Copycat中所有可能的指令系统，是由名为滑动网络（slipnet）的固定网络来确定的。滑动网络中的节点表示Copycat的基本概念（分类），而节点之间的连接则表示概念之间的联系。

在构造Copycat的过程中，当从出发点向目标前进的时候，我们可以考虑类比的方法。出发点如果已经给出了实例，以该实例为向导，就可以用类比方法来实现目标。比如，在上面给出的例子中，出发点是一对字符串abc和abd，目标则是字符串ijk和应当与之对应的另一个字符串。在后面的工作中，我们将会看到这种按照源／目标的阐释，即把探索规律看作一个逼近过程的类比方法，对于隐喻和创新的研究是十分有效的。

虽然滑动网络从形式上看是固定的，但它的每一个连接都有被称作“长度”的数值，用以表示联系的强度。当运行模型时，这些数值会发生变化。从名字上可以看出，长度反映了当前问题中相关概念之间的关联程度。当Copycat对该问题进行探究时，长度的变化体现了Copycat不断改变的评估，而这些评估则反映出问题各个部分中基本概念之间的相关性和交互度。

我们在这里通过一些被称作代码片段（codelets）的简单主体来继续对问题进行探索。主体在其内部创建了大量不同的字符串组，作为“源”（出发点）和“目标点”之间的桥梁。这些主体的活动是由滑动网络中被选取的节点指引的，即每当主体成功执行一项操作时，指引它的节点就接收到一个“激励”。这个“激励”将扩散到滑动网络中的邻节点，能扩散到多少个节点取决于节点间连接的长度。而新受到“激励”的节点将引入新的主体加入互动，同时扩散的“激励”也使得一些连接的长度数值发生变化。

实际的Copycat中的相互作用要比这里描述的更具多样性，也更为错综复杂。例如，概念之间的连接本身也是由概念进行标识的。这样一种对连接进行标识的概念，参与了目前描述的所有活动，包括“激励”。标识的“激励”水平决定着节点间的连接长度。Copycat中每一个新增加的机制和相互作用都是由深层次的考虑驱动的思考激发的，而非临时指定的。鉴于Copycat的深度，我相信它将会成为另一个经典杰作，可媲美塞缪尔经典的国际跳棋程序。

滑动网络和代码片段的根本作用在于：发现出发点和目标点部分的相似之处，如类似的分组，并同时尝试把它们调整成可比较的状态。在尝试扩大可比较范围时，局部匹配通过扩散激励使新的代码片段发生作用，从而实现探寻滑动网络中的相邻概念（节点）这一功能。当这种对比达到足够高的水平时，我们通过中间桥梁就可以将目标点中未完成的部分与出发点中可以进行比较的部分建立起对应关系，从而完成从出发点向目标点的逼近。

在对隐喻和创新的讨论中，Copycat展示了其重要特性：扩散的激励机制可以产生一种包围任意节点的关联环，侯世达称之为光环。这个关联环会随激励水平和连接长度的变化而变化，因此不能简单地用一个列表或者其他一些确定性的方法来表达它。实际上，这种变化着的关联环对Copycat涌现出的类比的流动特性起到了关键作用。在后面，不管是从含义上还是从技术的角度，我们都将会看到类似的关联环在科学建模、隐喻的构造和创新方面都将起着关键作用。

滑动网络和代码片段之间的相互作用所涉及的计算方法，非常类似通过内部反馈回路模拟神经网络的计算方法。滑动网络中节点的激励水平与神经网络中神经元的激发频率所起的作用相同，连接长度等同于神经网络中突触的权重，而激励的衰减则等同于疲劳，等等。这里的主体（代码片段）属于另一种情况，但它们仍可以由神经网络中对应的反馈回路来模拟。

这样一来，通过采取将中枢神经系统模型转换成受限生成过程类似的方法，我们就可以将Copycat转换成受限生成过程的框架形式。这里还有一个问题需要补充。Copycat利用一种随机（概率）的方式来激发它的主体：根据节点的激励水平来决定主体将被激发的概率。这样，某一激励水平较低的主体也有机会被节点激发。也就是说，如果主体只能由拥有最高激励水平的节点激发，那么上述那种偶尔出现“远距离激发”的情况将永远不会发生。这样引进随机因素的结果，就使得Copycat具有符合涌现特征的体系结构。用侯世达的话说就是，“高层次的行为是由大量小规模计算行为的统计结果涌现的”。

对于以上几点，我们并没有在受限生成过程中直接提供随机选择方法。我们可以在受限生成过程中引入生成伪随机数的程序，将受限生成过程的各个部分构造成一个通用计算机。然后，我们可以利用这些随机数来实现Copycat中的随机行为，就如同最早利用基于计算机的实现方式那样进行模拟。这将是一个迂回的方法，并不利于我们利用受限生成过程框架来加深理解。而且，Copycat中活跃的主体，即代码片段，都不是由受限生成过程中的原本机制直接获取的。这就意味着我们需要扩充受限生成过程的框架，引入更多可直接获取的可移动的随机主体。这就是第9章要论述的主题。

如涉及版权，请著作权人与本网站联系，删除或支付费用事宜。