• 精选
  • 会员

5万棋手对战卡斯帕罗夫

2020年7月21日  来源:多样性红利 作者:【美】斯科特·佩奇 提供人:chenpo21......

现在将给这些基于主体的模型加入更多的细节。这种详尽的分析有助于理解为什么这个定理能够成立以及它需要什么条件。首先,需要解释一下基于主体的模型的方法论背景。基于主体的模型由人工智能体(artificial agents)构成。人工智能体是一些基于计算机的对象,它们根据用计算机代码描述的规则在时间和空间上进行交互。2这些人工智能体几乎可以代表任何东西:病毒、国家、鸟类、鱼、青少年、企业或政治家。蚂蚁和青少年的行为模式当然不尽相同,青少年的行为模式显然更加复杂一些,不过并不像你想象的那么复杂,但这些都可以用基于主体的模型来建模。

在一个好的基于主体的模型中,人工智能体之间的互动,以及人工智能体与环境之间的相互作用可以告诉我们很多关于现实世界的事情。例如,价格如何在市场中出现?这个模型甚至可以告诉我们暴动是如何开始的。基于主体的模型可以使科学杂志生成各种漂亮的结构化模式,就像植绒鸟一样,但是这种模型有时也会导致无法理解的混乱。

在我的模型中,包括了试图解决难题的人工智能体。可以这样想象:它们在试图解决受控核聚变问题,或者找到使每一粒爆米花都受人欢迎的方法。同时,在模型中,人工智能体的目标是改进现有的方案,以解决一系列预先定义好的问题。人工智能体对现有解决方案改进越大,它们得到的回报(钱)越多。3在第一批模型中,我向人工智能体随机提供了一些视角和启发式。这些随机分配创造了多个认知能力有所不同的人工智能体。我没有通过身份来区分人工智能体,没有把它们染上不同的颜色,这就是我的智能设计理论。

本来打算让人工智能体相互学习,并尝试新的视角和启发式。我希望发现它们在复制和学习他人与寻找新的表示和搜索算法之间的权衡。这种张力在很多情况下都会存在。进化要面对它,组织要面对它,个人也要面对它。当然,探索可能是有风险的,想一想麦哲伦吧。可一旦成功,效益可能是非常巨大的,想一想西班牙征服者埃尔南·科尔特斯(Hernando Cortes)吧。但是,如果探索的问题太多,就不能很好地利用所学到的东西,带来有保证的效益,但是,如果每个人都只顾埋头利用,就将没有新的想法可以利用。

在编写基于主体的模型或者证明数学定理时,准确而及时地发现错误是至关重要的。计算机程序至少包含数百行,甚至包括数千、数万行代码。一个错位的分号或括号就可能会改变模型的性能。在编写好初始代码后,我进行了试运行,以检查有无错误。如果通过赋予更多的视角和启发式来给某个人工智能体分配比其他人工智能体更多的认知能力,那么这个人工智能体是否能赚到更多的钱?是的。如果给所有的人工智能体更多的视角和启发式,那么解决问题的平均表现是否会提高?是的。如果创造更多的人工智能体,平均表现是否会提高?答案再一次是肯定的。最后,我创造了两个经济体,其中一个经济体只由那些表现得最好的人工智能体组成,另一个经济体则随机由一些聪明的人工智能体组成。第一个经济体中的人工智能体是不是比第二个经济体中的人工智能体更能找到更好的问题解决办法呢?答案是否定的。

一杯完美的咖啡

最后一个发现在前言中也已经提到过了,与直觉完全背道而驰。一开始还以为是编程错误所导致的。经过再三检查后,没有发现编程错误。我用不同的计算机语言重写了同一个模型,结果还是没有改变:由个体能力更强的人工智能体组成的经济体表现更差。我决定对模型抽丝剥茧,直指它的核心。为此,我构造了一个只需要解决一个问题的经济体。我认为这个问题非常重要,就是为我的妻子做一杯完美的咖啡。我是一个不喝咖啡的人,因此向来对这个问题感到束手无策。当然,咖啡问题说到底只有两个维度,那些人工智能体所要做的,就是找到加入咖啡中理想的奶油量(第一个维度)和糖量(第二个维度)。

这种模型结构能够在一个平面上将可能的解决方案集合表示出来。在这个平面上,每一个点都有一个水平位移x,以及一个垂直位移yx的值代表咖啡中的奶油量,y的值代表糖量。这样,平面内的每个点都代表了奶油量和糖量的一个独特组合(见图6-1)。

图6-1 咖啡空间

对于咖啡空间上的每一点,还可以给它分配一个质量,代表我的妻子喜欢喝多少咖啡。在图6-1中,质量是第三个维度。假设,咖啡的品质在0~100之间变化:她越喜欢那杯咖啡,它的价值越高。人工智能体要解决的问题,是找到这个空间上的最高点。回想一下前面对视角的讨论,这里可以把平面上每个点的价值看作海拔。价值较高的咖啡具有较高的海拔,而价值较低的咖啡则具有较低的海拔。这种表示自然而然地就形成了一个崎岖景观。

人工智能体使用搜索算法“漫游”了这个二维景观。4无论一个人工智能体被放置在该景观的哪一个点上,它都会同时朝两个方向看。我随机分配了这两个方向。如果一个人工智能体看到了一个价值更高的点,它就会移动到这一点。人工智能体将遵循这个搜索规则四处漫游,直到它看不到任何价值更高的点。在这里可以把每一个点理解为一杯咖啡。由于这是一个崎岖景观,它们停留下来、不再走动的地方并不一定是最好的那杯咖啡所在的位置。但事实上,它们极少能做到这一点。

为了衡量某个人工智能体小组的表现,先让小组中的一个人工智能体出发搜索“一杯好咖啡”。该人工智能体会一直搜索下去,直到它无法再有任何改善为止。然后再让下一个人工智能体从那一点也就是从那杯咖啡开始继续搜索,努力找到一杯更好的咖啡。如果第二个人工智能体有了改进,那么第一个人工智能体就会试图在此基础上找到更进一步的改进。这个过程将继续下去,直到小组中的所有人工智能体都找不到一杯更好的咖啡为止。

这个模型很简单,可以使结果变得更加透明。以通过图形的方式表达人工智能体搜索的两个方向。当把表现最好的人工智能体的两个搜索方向绘成图后,我发现两个方向都指向了平面的右上角。我又绘制出了表现最好的10个人工智能体的搜索方向,并在它们的搜索方向中观察到了类似的方式:都在向平面的右上角搜索。这就是说,它们都去往同一个地方找好的咖啡。然而,当我把随机选择的人工智能体的搜索方向绘制出来时,却观察到了不同的模式。它们指向平面上的每一个方向,就像自行车车轮的车条一样。

由此,以前觉得违背直觉的结果现在有了一个合乎逻辑的解释:最好的问题解决者往往都是相似的,因此,最好问题解决者集合的表现比其中任何一个最好问题解决者个体都要好一点。而随机的、聪明的问题解决者的集合则会趋于多样性。正是这种多样性使它们组成的群体表现更好。或者,可以把这个结论表达为更肯定的形式:多样性优于能力。

绿鸡蛋与火腿

现在需要搞清楚的是,我是不是已经在无数可能的模型中成功地“大海捞针”?刚才描述的这个发现的一般性有多高?为此,我又构建了几个解决问题模型,把可能的解决方案空间从平面变为线段、树状、球体。而且我还改变了人工智能体的复杂程度。在绝大多数情况下,都得到了同样的结果:多样性优于能力。但是,这个结果的出现似乎必须满足某些必要条件。必须创造出足够多的人工智能体,必须设定适当的小组规模,必须使要解决的问题变得困难,而且必须将所有问题解决者设定为“聪明”的。但是,这些条件都是非常符合直觉的。把许多三年级的学生召集起来应该不能推进对全球变暖问题的研究吧?

当然,这些计算实验的结果有很强的启发性,但却并不是决定性的,仅仅凭借它们并不能确定多样性优于能力。我把这个结果称为“绿鸡蛋与火腿”。在著名教育学家、儿童文学家苏斯博士(Dr. Seuss)的《绿鸡蛋与火腿》(Green eggs and ham)一书中,萨姆试图说服他的朋友在各种各样的地方试试绿鸡蛋和火腿的味道,但是他的朋友不愿意在公共汽车上、箱子里、火车上或狐狸身上吃东西。我则照着萨姆的建议做了。在箱子里、树上或者图上都进行了计算实验,结果都是一样。多样性优于能力这个结论在所有这些地方都成立。

但还有一个问题,一个与我的专业有关的问题。尽管计算实验能够说服大多数物理学家、数学家和生物学家,但是这种方法在经济学家所在的领域并不通用,而我恰恰是以经济学家的身份领取薪水的。经济学家倾向于这样看:不错,计算实验结果没有问题,但还需要正式的定理和证明。规范的逻辑有助于准确理解什么时候以及为什么会得到这样的结果而不是那样的结果。为了构造一个正式的证明,我联系了卢红,请她助我一臂之力。卢红和我锤炼出了一个数学证明,给出了“绿鸡蛋与火腿”结果的充分条件。2004年,我们在《美国科学院刊》(Proceedings of the National Academy of Sciences)上发表了这些结果。5

5万棋手对战卡斯帕罗夫

还有一个问题:这种情况在现实世界中真的可能发生吗?多样性团队真的能够优于高能力团队吗?这里有一个来自国际象棋领域的著名例子。1999年6月21日,以国际象棋大师加里·卡斯帕罗夫(Garry Kasparov)为一方,以来自全球各地大约5万名国际象棋棋手为一方,进行了一场别开生面的国际象棋比赛。卡斯帕罗夫当时是卫冕世界冠军,与他对弈的另一方有很多人却只是国际象棋的业余爱好者。微软公司赞助了这场比赛,目的是展示互联网在群体解决问题方面的力量。卡斯帕罗夫先行,随后的每一步都在48小时后才下。为了决定下一步应该怎么走,与卡斯帕罗夫对弈的那些棋手在论坛上公开提出建议,并举行投票。

这些人确实得到一些帮助。在下每一步棋前,一个由多名20岁以下的年轻国际象棋大师组成的小组提出若干种可能的走法,经讨论后由棋手团投票决定。虽然作为年轻棋手,这些国际象棋大师已经相当不错了,但是他们作为个人,仍然远远没有达到卡斯帕罗夫的水平。无论如何,比赛开始了。在卡斯帕罗夫下了第一步的48小时后,棋手团举行了一次投票,然后走了获得票数最多的那种走法。卡斯帕罗夫也有48个小时的时间来走下一步……在62步之后,卡斯帕罗夫赢了。在国际象棋比赛中,一盘棋要下62步之多,就说明这是一场势均力敌的比赛。卡斯帕罗夫只是险胜。很显然,这个群体的表现比它任何一个成员个体可能达到的表现都要好得多。

多样性 / 解决问题

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000