盲目模仿的进化

2024年12月26日　　来源：人类的价值　作者：罗伯特·博伊德　提供人：It8933......

理论上，自然选择会青睐这种心理机制。这种心理机制会使大多数人将周围人的信仰当作自己的信仰。[28]我之所以强调“理论上”，是因为这个结论来自一套数学模型，而像我这样的研究者通常会利用它来研究进化过程。我们不妨先口头论证一下这个有趣过程的基本特性。在这里，先假设，最优行为会存在一些变化。比如，在某些环境中，孕妇不应该吃大鱼；而在其他环境中，吃大鱼可能会比较好。在某些环境中，人们注意到，那些在孕期吃了很多大鱼的妇女生出来的孩子有问题；于是，妇女们利用这一线索推断，怀孕时不应该吃大鱼。但是，还存在一种可能性：想要确定吃大鱼所带来的影响是很困难的，因为样本太小，而影响婴儿生长发育的因素又有很多。

看起来很有可能是这样：如果环境中所出现的线索是可信的，那么就使用这些线索进行推断；如果这些线索是不可信的，那么就依靠模仿。这种策略可能会受到自然选择的青睐，这样一来，个别情况下对可靠线索的使用，就会通过模仿而被传播开来，从而使最容易被观察到的行为成为最优行为。为了验证这一口头论证，需要建立一个模型，用数学形式来表示其基本假设；接着，要用数学工具来求证自然选择是否会青睐这一特性。如果最终结论与口头论证的结论一致，就说明这个论证很可能是有道理的。严谨一点的话，需要再建立一个不同的数学模型来表示这个基本假设。如果得到了相同的答案，那么就可以确定，口头论证是对的；如果得到的答案不一样，就需要找出哪里出了问题。

接下来将建立一个非常简单的模型，以证明口头论证是正确的。[29]本书的两位评论人建议我删除这一部分，因为数学会让许多人望而生畏。最终，我还是决定保留，因为让读者了解这种理论推导过程是十分重要的。大家尽力理解吧，如果觉得像是在读天书，可以直接跳到结论部分。

假设，有一大群人生活在同一环境中，而这个环境只有两种状态。为了简单起见，我把这两种环境分别称为“大鱼有益”和“大鱼有毒”。需要注意的是，这并非是指斐济的鱼类禁忌模式。[30]目的是检验口头论证的逻辑合理性。假设这些人生活在一个不断变化的环境中，若非如此，他们就没必要学习了。假设环境会在这两种状态之间不断地随机切换，在一段时间里，环境处在一种状态，而后又切换到另一种状态，且两种状态存在的时长比较平均；存在两种可能的行为——“吃大鱼”和“忌吃大鱼”。当环境处在“大鱼有益”状态时，“吃大鱼”就会给人们带来更大的好处；而当环境处在“大鱼有毒”状态时，“忌吃大鱼”就会带来更大的好处。由此带来的适应性问题就是，这些人需要确定自身处在哪种环境状态中，以便选择最优行为。

有两种信息可以帮助个体确定自身所处的环境状态。第一种信息是环境线索，个体可以通过环境线索来推断环境状态。可以将这种环境线索视为一种相关性，比如在学习者所知道的某个样本群中，一位妈妈吃的大鱼数量和她宝宝的健康状况之间的相关程度。因为是口头论证，所以这些线索难免会存在缺陷，而这些缺陷有时候会导致推断错误；不过，学习者可以通过其所含的相关信息来评定其质量。

正如图1-4所示，当处在“大鱼有益”状态时，通常为正相关；当处在“大鱼有毒”状态时，通常为负相关。因此，婴儿的健康状况和母亲所食用的大鱼数量之间的关系，如果呈正相关，也就是支持“大鱼有益”；如果呈负相关，则支持“大鱼有毒”。然而，现实世界充满了各种杂音，由此带来的一个结果是：当“大鱼有毒”时，有可能会观察到正相关关系；当“大鱼有益”时，有可能会观察到负相关关系。个体如果采纳了这些带有误导性的线索，就会做出错误的推断，以及不恰当的行为。

图1-4 不同的线索价值x在“大鱼有毒”和“大鱼有益”状态时的可能性。可以把这些线索价值看作所能观察到的母亲饮食和孩子健康之间的相关性。当“大鱼有益”时，正相关的可能性更高；当“大鱼有毒”时，负相关的可能性更高。这意味着，当观察结果为正值时，环境处于“大鱼有益”状态；结果为负值时，环境处于“大鱼有毒”状态。然而，这种推断有时候也会出错。不过，线索的绝对值越大，在依靠该线索进行推断时，出错的可能性就越低。

另外，大家要注意，图1-4中的函数分布是偏移的。上图表示，当环境处在“大鱼有益”状态时，个体不太可能会观察到一位母亲食用的大鱼数量与其后代健康状况之间的负相关关系。同样，下图表示，当环境处在“大鱼有毒”状态时，个体不太可能会观察到正相关关系。这意味着，当相关性足够显著，比如呈绝对值时，是不太可能推断失误的。

第二种信息是个体观察到的群体中一部分人的行为。这些人常被称为“榜样”。假设，以平均值为标准，好的行为更常见。因此，如果大部分人食用大鱼，那么这个线索即表明“大鱼是有益的”；如果大部分人不吃大鱼，那么则表明大鱼是有毒的。但是这种线索也有可能出错。比如，很有可能会出现这样的情况：一个群体中的大部分人都认为大鱼是有毒的，但一个学习者偶然遇到了另一群人，其中大部分人都认为大鱼是有益的。还可能会发生这样一种情况：环境已经改变了，大鱼现在变得有毒，但大部分人依然觉得大鱼无毒。

因此，个体不得不在无法准确推断出最优行为的情况下决定该如何行动，必须赌一把。贝叶斯决策理论（Bayesian Decision Theory）是代数的一个分支，主要用来进行风险决策，让自身的平均收益最大化。假设一个单独的环境线索价值x，表示母亲的饮食和其后代健康状况之间的相关性。个体观察到，在一个由n个个体组成的群体中，有j个榜样都在吃大鱼。因此，运用这个理论，如果j-n/2>-gx，那么选择吃大鱼就可以使预期收益最大化。在这个公式中，g是一个参数，表示个体对两种信息的权衡。虽然g值非常重要，但暂且把它放在一边，先来关注这个不等式的其他部分。

当大部分榜样都吃大鱼，即吃大鱼是最优行为时，这个不等式的左边将会是正值。因为g值总被认为是正值，因此，当吃大鱼和婴儿健康之间为正相关，即x值为正时，不等式的右边将会是负值。两种信息都指向同一方向，个体吃大鱼可以让个体预期收益最大化。如果大部分榜样都不吃大鱼，即j-n/2<0，吃大鱼和婴儿健康之间是负相关，即x<0，那么不等式会告诉你，以平均值为标准的话，吃大鱼将会降低收益。

当两种信息产生冲突时，会发生一些有趣的事。例如，当10个榜样中有7个吃大鱼，即n=10，j=7时，不等式的左边j-n/2等于2。大部分人都吃大鱼，这样的观察结果表示大鱼是无毒的。然而，在吃大鱼和婴儿健康之间又存在着负相关，相关值为-0.5，这意味着相反的推断。在这个数字样本中，如果2>0.5g，那么不等式表示的是大鱼无害。因此，你的决策取决于参数g，它表示个体对环境线索和社会线索的权衡。g值较小，意味着个体认为社会线索更重要；g值较大，意味着个体认为环境线索更重要。在这个例子中，如果g值小于4，那么个体会忽略环境线索，模仿大部分榜样的行为；如果g值大于4，那么个体会忽略周围人的行为，依靠环境线索行事。

在这个简单的模型中，参数g代表着个体如何通过学习心理机制在社会线索和环境线索之间做出选择。极小的g值意味着个体极度依赖模仿他人。为了确定自然选择是否会导致个体的“盲目模仿”，我们需要让参数g不断进化，看看到底是什么条件导致了g值变小。

因此，需要建立一个模型来研究影响学习心理机制的基因与行为的共同进化。假设g值是一种基因特性，每个个体都会从父母那里遗传到一个g值；可能会因为变异而发生一些改变，但g值与性别无关。个体通过学习获得环境线索，并观察到n个榜样的行为，然后按照上述规则选择其一。这个选择会决定个体的行为，从而影响个体的收益。如果所携带的g值能够增加个体正确识别环境线索的概率，那么这部分人将会拥有更多的后代；自然选择将会使人群中拥有这种心理机制的人越来越多。然而，最佳学习心理机制同时还取决于上一代人的行为。如果大部分榜样都拥有正确的行为，更依赖社会线索，即g值较小，这种行为将会受到自然选择的青睐；如果大部分榜样的行为都不正确，那么自然选择将会倾向于不太依赖社会线索，也就是g值较大时的行为。基因影响着人们的决策，决策又影响着下一代榜样的行为。因此，基因进化和文化进化是密不可分的，这一过程被称为“基因-文化的共同进化”。人类不断重复着这一过程，直到g值的平均值不再发生变化。[31]这个数值告诉我们，自然选择是如何在漫长的历史进程中造就人类的学习心理机制的。

图1-5展示了两组不同参数被代入模型后所得到的结果。由于g的原始数值解释起来比较麻烦，因此我假设g值为一个长期平均值，然后测算在当前环境中掌握的最优行为与榜样数量之间的关系，从而找出这种可能性：当最优行为比较容易学习时，社会线索在人们的决策过程中常常被忽略；当最优行为比较难学时，大部分个体会选择模仿榜样的行为。

图1-5 当环境线索质量比较高（左图）和质量比较低（右图），人类处于一种稳定的进化状态时，受自然选择青睐的基因特性的概率。其中，环境线索质量高低是指某种比较受青睐的基因特性在人群中的分布比例。在这里，个体会关注另外三个个体的行为；其他个体数量更多的话，个体则会依赖社会线索。受自然选择青睐的某种基因特性的分布比例指的是人群中采取最优行为，也就是“当大鱼无害时食用大鱼，当大鱼有毒时不吃大鱼”的人数比例。水平虚线表示的是只利用环境线索，也就是说，只利用个体学习所能获得的受自然选择青睐的基因特性的可能性。在左图中，个体通过个体学习来选择最优行为的概率为98%；在右图中，概率只有50%。45°斜虚线表示的是盲目模仿上一辈人以掌握最优行为的可能性。黑线表示的是在稳定的进化状态中，使用最优的g值以获得受自然选择青睐的基因特性的可能性。如果个体学习是准确的，那么社会学习对个体的收益几乎没有什么影响；如果个体学习不准确，那么大部分个体都会模仿榜样所表现出来的行为。在这两种情况下，平均每经历100代人，环境状态就会转换一次。

Redrawn from Perreault et al., 2012.

来看看这意味着什么吧。个体拥有一种学习心理机制，这种机制告诉他们最优行为取决于在所处环境中观察到了什么。当个体学习比较困难时，环境线索能够让50%以上的人做出正确的行为，让近一半的人做出错误的行为。几乎所有人都忽视了这一论断：自身经验才是最优的，他们只是在模仿周围人的行为。换句话说，在这个模型中，个体在本能上倾向于模仿他人行为，当然也会遵循自身经验所带来的启示，但这种动机必须足够强大，他们才能克制住模仿他人的倾向。如果像通常所假设的那样，与模仿相比，个体学习的成本更高，那么自然选择就会更青睐模仿。

运用这种决策规则的群体所获得的平均收益会比完全依赖个体学习的群体获得的更多，而且在个体学习比较困难的情况下，这种差距还会进一步扩大。在这个模型中有两种错误来源。首先，个体在学习时如果依据的是相关环境状态中的部分信息，那么就会很容易出错。社会学习使个体拥有一定的选择权，要么依赖高质量的环境线索，要么模仿他人；采取模仿行为的人越多，个体学习所创造的信息质量就越高。其次，社会学习存在的问题是，如果环境发生变化，那么个体所模仿的某个行为可能会不再适应环境。这意味着，个体的模仿行为越多，群体在追踪环境变化方面就越不准确。因此，在个体学习非常困难，环境变化比较缓慢时，模仿将会带来最大的收益。

这一结果表明：在人类适应环境的过程中，文化扮演着非常关键的角色。大家可以把“平均收益”看作“成功适应”的指标之一。这个模型说明了，当人们难以发现有益的创新时，文化在促进人类的环境适应性方面作用显著，然而人们一旦发现了有益的创新，这些创新便会长期有用。在我看来，在缓慢变化的环境中不断解决难题，正是人类进化的本质。个体很难弄明白大柄苹是有毒的，也很难搞清楚应该如何处理这种毒素。同时知晓这两方面知识的可能性极低，几乎可以忽略不计。然而，一旦发现了这些创新，它们便会长期有用。考古学研究表明，在澳大利亚，人们食用大柄苹的历史至少有3万年。[32]编织渔网、揉搓绳子、制作回力标和打火棒等行为，亦复如是。正是掌握了这些复杂的知识，扬德鲁万塔人才会认为库珀河流域是一片丰裕之地。就这些技能而言，掌握起来都很费力，而且其实用性也会随着人口迁移和气候变化而逐步降低。

通过其他模型所得出的结论也是如此。上文中的模型只包含了两种没有关联的特性，但实际上，很多特性都会不断变化。例如弓弩的长度、宽度、弓面、箭头、反曲度等都会发生变化，从而影响其实际效用。对于这种情况，需要假设特性的价值会不断变化，从而建立另一个模型。[33]在每一种环境中都有一个最优设计，也就是长度、宽度等的最优组合，但是在不同的环境中的最优设计各不相同。在北美东部的森林中，圆形弓面的长弓效果最好；在西部，扁平面的弓效果更胜一筹。同样，个体拥有两种不同来源的信息：来自环境中的带有杂音的信息所提示的最优特性值；从长辈等榜样身上所学到的特性值。学习就是把这两种信息融合起来。

据贝叶斯学习模型显示，最优标准即是两种信息的加权平均值，进化问题说到底就是这两种信息的权重问题。当环境信息中充满杂音，且环境变化速度较慢时，自然选择会赋予“他人行为”很高的权重，也就是说，进化的结果是，大部分个体的特性值与其模仿对象的平均值很接近。人们的学习主要以模仿为主，只有存在明确动机的情况下，才会做出实质性的改变。技术史专家已经清楚地证实了，逐步改进是如何变得多样化，如何改进工具和其他人工制品的。[34]新发现和新发明往往得自偶然，是不同技术传统要素的重新组合，而非天才的洞见，因为天才思考时能从问题一直想到答案。[35]

如涉及版权，请著作权人与本网站联系，删除或支付费用事宜。