• 精选
  • 会员

用道德来保证均衡

2017年3月14日  来源:博弈论的诡计:日常生活中的博弈策略 作者:王春永 提供人:我不存在吗

带剑的契约对于保证合作关系是有效的,但是在更多的情况下,我们根本找不到,或者不值得用“剑”也就是法律来保证合作。那么在这时,有没有其他办法来达到均衡呢?答案是肯定的。如果法律是保证人与人关系之间的唯一武器,那么博弈策略也就没有什么价值了。作家吴思在《潜规则》中曾经讲了这样一个故事,可以作为一个引子。这个故事来自《明史》,是一个监察官员的故事。

崇祯元年(1628),朱由检刚刚当上皇帝,发出了“文官不爱钱"的号召。户科给事中韩一良对这种号召颇不以为然,就写了份上疏,说道:如今何处不是用钱之地?哪位官员不是爱钱之人?本来就是靠钱弄到的官位,怎么能不花钱偿还呢?……我这两个月辞却了别人送我的出书费用五百两银子,我交往少尚且如此,其余的可以推想了。伏请陛下严加惩处,逮捕处治那些做得过分的家伙。崇祯读了韩一良的上疏,立刻召见群臣,让韩一良当众念他写的这篇东西。读罢,崇祯对大臣们说:“一良忠诚耿直,可以当佥都御史。”

这时,吏部尚书王永光请求皇帝,让韩一良点出具体人来,究竟谁做得过分,又是谁送他银子。韩一良吞吞吐吐,显出一副不愿意告发别人的样子。于是崇祯让他密奏。等了五天,韩一良谁也没有告发。崇祯再次把韩一良和一些大臣召来,当面追问。然而韩一良就是不肯点名。崇祯让韩一良点出人名,本来是想如他所请的那样严加惩处,而韩一良最后竟推说风闻有人要送。崇祯训斥韩一良前后矛盾,撤了他的职。

韩一良宁可叫皇帝撤掉自己的官职,断送了自己的前程,甚至顶着被治罪的风险,硬是不肯告发那些向他送礼行贿的人,他背后必定有强大的支撑力量。这是一种什么力量?难道只是怕得罪人?作为给事中,检举起诉和得罪人乃是他的分内事。因此,恐怕还是一种外在规则的压力,或者说外在规则在其内心中形成的“道德”在起作用,使其坚决不肯背叛向他行贿的人。

上面这个历史故事讽刺性地告诉我们:在现实环境中,确实存在着一些道德因素,可以化解个人理性与群体理性的矛盾,维系整个社会的稳定。

有一群猴子被关在笼子里,从笼子上方垂下一条绳子,绳子末端拴着一个香蕉,上端连着一个机关,机关可以开启水源。猴子们发现了香蕉,纷纷跳上去够这个香蕉,当猴子够到香蕉时,相连的绳子带动了机关,于是一盆水倒了下来,尽管够到香蕉的猴子吃到了香蕉,但大多数猴子被淋湿了。

这个过程重复着,猴子们发现,吃到香蕉的猴子是少数,而其余的大多数猴子都被淋湿。于是,每当有猴子去取香蕉,就有其他的猴子主动地去撕咬那个猴子。久而久之,猴子们产生了默契,再也没有猴子敢去取香蕉了。

在这个故事里,猴子间产生了“道德”。猴子们认为取香蕉的后果对其他猴子不利,因而取香蕉是“不道德的”,它们便会主动地惩罚“不道德的”猴子。

与法律一样,道德也是对某些不合作行动的惩罚机制。这种机制的出现使得人类从囚徒困境中走出来。道德感自然地使得人们对不道德的或不正义的行为谴责或者对不道德的人采取不合作,从而使得不道德的人遭受损失。这样,社会上不道德的行为就会受到抑制。因此只要社会形成了道德或不道德、正义或非正义的观念,就自动对行为产生了调节作用。

但是在日常生活的交际中,单纯依靠对手的道德自律来达成合作是不保险的。针对这个问题,我们可以通过对道德因素的考虑,对博弈策略进行相应的调整,把交际变成长期的、多边的,从而形成诚实守信的动力与压力。

假装不知道有尽头

《笑林广记》中记载这样一则笑话。

有一个人去理发铺剃头,剃头匠给他剃得很草率。剃完后,这人却付给剃头匠双倍的钱,什么也没说就走了。一个多月后的一天,这人又来理发铺剃头。剃头匠还记得他上次多付了钱,觉得此人阔绰大方,为讨其欢心,多赚点钱,便竭力上心,周到细致,多用了一倍的工夫。剃完后,这人便起身付钱,反而少给了许多钱。剃头匠不愿意,说:“上次我为您刺头,刹得很草率,您尚且给了我很多钱;今天我格外用心,为何反而少付钱呢?”这人不慌不忙地解释道:“今天的刺头钱,上次我已经付给你了;今天给你的钱,正是上次的剃头费。”说着大笑而去。

这个故事说明,有限次的囚徒困境,情况不同于无限次的囚徒困境的重复博弈。当临近博弈的终点时,采取不合作策略的可能性加大。即使参与人以前的所有策略均为合作策略,如果被告知下一次博弈是最后一次,那么肯定采取不合作的策略。

当合作关系存在某种自然而然的终点时,博弈反复进行的次数是一定的。运用向前展望、倒后推理的原则,我们可以看到,一旦再也没有机会可以进行惩罚,合作就会告终。但是,谁也不愿意落在后面,在别人作弊的时候继续合作。假如真的有人仍然保持合作,最后他就只能自认倒霉。

既然没人想倒霉,合作也就无从开始。实际上,无论一个博弈将会持续多长时间,只要大家知道终点在哪里,结果就一定是这样。因为从一开始,两位参与者就应该向前展望,预计最后一步会是什么。在这最后一步,再也没有什么“以后”需要考虑,优势策略就是作弊。这最后一步的结果是一个不可避免的结论:既然没有办法影响这个博弈的最后一步,那么,在考虑对策的时候,倒数第二步实际上就会成为最后一步。而在这一步,作弊再次成为优势策略。理由是,位于倒数第二的这一步对最后阶段的策略选择毫无影响。因此,倒数第二步可以视为孤立阶段,单独进行考虑。对于任何孤立阶段,作弊都是一种优势策略。

深谙策略思维者懂得瞻前顾后,避免失足于最后一步。假如他预计自己会在最后一轮遭到欺骗,他就会提前一轮中止这一关系。不过,这么一来,倒数第二轮就会变成最后一轮,还是没法摆脱上当受骗的问题。

现在,最后两个阶段的情形已经确定。早期进行合作根本无从实现,因为两个参与者已经决心在最后两个阶段作弊。这么一来,在考虑对策的时候,倒数第三步实际上就会成为最后一步。遵循同样的推理,作弊仍是一种优势策略。这一论证一路倒推回去,不难发现,从一开始就不存在什么合作了。

但是在上面的故事中,剃头匠为什么会上当呢?在现实世界里,所有真实的博弈只会反复进行有限次,但正如剃头匠不知道客人下一次是否还会光顾一样,没有人知道博弈的具体次数。既然不存在一个确定的结束时间,那么这种合作关系就有机会继续下去,实现阶段性的成功合作。要想避免信任瓦解,千万不能让任何确定无疑的最后一轮出现在视野所及的地方。只要仍然存在继续合作的机会,背叛就会被抑制。

不可否认,这个世界存在一些“善良的”人,不管作弊可能带来什么样的物质利益,他们仍然选择合作。但是多数人都没有那么善良,而是按照自己的理性行事,在一个反复进行有限次的囚徒困境博弈里,他们会从一开始就作弊。这会使其他参与者很快看清楚其本质,并对之加以提防。于是,为了掩盖真相,或者是至少掩盖一会儿真相,他们不得不装出“善良”的样子。剃头的客人一开始为质量低劣的服务付很多的钱,就出于这种考虑。

在博弈中,假设他一开始就按照善良人的方式行事,其他参与者就会认为他大约属于周围少有的几个善良人之一。合作一段时间将会带来实实在在的好处,而且其他参与者也会打算仿效他的善良做法,换取这些好处,从而带来合作的收益。当然,他和其他参与者一样,仍然打算在博弈接近尾声的时候偷偷作弊。但这并不妨碍在最初一个阶段进行互利互惠的合作。因此,在各人假装善良等待占别人便宜的时候,大家已经从这种共同欺骗中得到好处。

能在一个反复进行的囚徒困境中使信任出现的条件,就是作弊所得晚于合作破裂的代价之前出现。这么一来,作弊与合作相比哪一个更划算,就取决于现在与将来相比哪一个更重要。

在商界,比较现在与将来的利润的时候,会用一个合适的利率进行折算。而在政界,现在与将来的重要性的比较更加带有主观色彩。不过,一般而言,如果下一次竞选之后的时间看起来无关大局,政治人物间的合作更容易破裂。即便是在商界,若是遇到不景气的年份,整个产业处于崩溃边缘,管理层觉得已经走到山穷水尽,没有明天了,那么,竞争就有可能变得比正常年份更加激烈。同样地,由于战争迫在眉睫,伊朗和伊拉克会认为现在的利润比将来的利润更重要,由此加深了协调限制石油产量以保持长期稳定利润的难度。

但是隐瞒终点或者说假装没有终点的博弈策略,仍然是以背叛为基础的,其目的无非是在相互背叛之前得到更多的收益。当然也有例外,比如说在多数恋人之间的博弈,其目的并非是为了在分手时得到更多的“好处”,而是希望能更好地维持合作的稳定性,从而缔结连理,白首偕老。

道德 / 均衡

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000