我们都有改变主意的时候,但是一般来说,我们并不会采取非常手段去阻止自己偏离最初的计划。你想要坚持原计划的唯一原因在于,你有足够的理由认为如果你改变自己的偏好,将会是一个错误。
拿走腰果是很明智的行为,因为吃掉整碗腰果会破坏你的胃口,而且你也不愿意让自己的晚餐被腰果毁掉。同样,米歇尔的棉花糖实验中的孩子也可以聪明地告诉实验人员:“下次当你有奥利奥要发放的时候,请不要给我‘现在可以吃一块”的选项,甚至不要提到奥利奥这个词。只要在15分钟后把三块奥利奥拿给我就好了。”
在思考这些问题的过程中,我偶尔读到了社会科学家唐纳德·麦金托什(Donald McIntosh)的一句话,它对我影响很大。“如果我们不假设思想中含有一个以上的能量体系,并且这些体系从某种程度上说是彼此独立的,想要做到自我控制就是自相矛盾的。”这句话源自《人类社会的根基》(The Foundations of Human Society)这本鲜为人知的书。我不记得是怎么读到这句话的,但在我看来这句话显然很有道理。从本质上说,自我控制意味着冲突。就像探戈舞一样,(至少)要两个人才能跳。也许我需要建立一个包含两个自我的模型。
虽然这一想法很吸引我,但任何双重自我模型都有一个不利之处:经济学家认为它太激进了,心理学家则认为它太过时了——从没有绝妙的结合。几乎没有经济学家意识到亚当·斯密对“激情”和“公正的旁观者”的论述,我刚开始做这项研究时也是如此。对大多数经济学家而言,这种想法是怪异的,而当时的心理学家也不再追捧弗洛伊德(Freud)的本我、自我与超我。另外,现在流行的双系统模型当时尚未出现。[3]因为有所顾虑,我悄悄地在朋友圈中阐述我的想法。该理论的雏形出现在我的《消费者选择的实证理论》一文中,但我知道我需要一些更正式的方法,从经济学理论角度讲就是可信的数学方法。因此,我找到了当时也在罗切斯特大学任职的数理经济学家赫什·谢弗林,请他做我的合作伙伴。
多年来,我和很多人合作过,赫什是我的第一位合著者。他擅长数学,当我们开始讨论这些问题时,他不认为我的想法过于疯狂。其实赫什的想法更重要,因为很容易找到数学比我好的经济学家。我和赫什在很多方面截然不同,赫什严肃、严谨、勤奋,有宗教信仰,甚至学习过百科全书式的古老犹太法典《塔木德》。而赫什的这些优点我一个也没有,但我们仍相处得十分融洽。最重要的是,赫什会被我的笑话逗乐。我们在一起工作时,就像卡尼曼和特沃斯基一样,可以无休止地谈话。当我们开始起草第一篇论文时,对每句话都会充分讨论,这和我之前看到的卡尼曼和特沃斯基的工作状态一样。当我们同在罗切斯特大学期间我们开始了研究,但随后我去了康奈尔大学,赫什则去了阳光明媚的南加州的圣塔克拉拉大学,那里离斯坦福大学不远。虽然我们只合作了两篇论文,但赫什已经迷上了行为经济学,并且很快与他在圣塔克拉拉大学的同事、行为金融学家迈尔·斯塔特曼(Meir Statman)开启了极为成功的合作之旅。
我们的模型其实是建立在一个隐喻的基础上。我们提出,在任何时候一个人的内心之中都有两个自我:一个是具有前瞻性的“计划者”,他关心未来并且有很好的打算;另一个是不顾一切的“行动者”,他只活在当下。[4]这种行为模型的关键问题是,如何描述两个自我之间的关系。一种方法是利用数学和经济学的分支“博弈论”作为核心模型,让相互作用的计划者和行动者扮演博弈双方。但我们否决了该方法,因为我们认为行动者不会参与决策。他更像一个活在当下、具有激情的人,他会对摆在面前的事物做出反应,不断消费直到满足为止。相反,我们根据组织理论选择了委托–代理模型。我们之所以选择这个模型,毫无疑问是受到了代理理论的影响,我在罗切斯特大学商学院授课时该理论正是学者们讨论的热点。1976年,迈克尔·詹森和时任商学院院长的威廉·麦克林已经就此话题写了一篇很有名气的论文。我不知道他们会不会同意我们这样应用他们的理论,但这正是有趣的地方。
在委托–代理模型中,委托人是老板,通常是一家公司的所有者,代理人则是老板授权做事的人。在一家公司中,代理人知道的比委托人多,但委托人如果监视代理人的所有行为,代价就会很高,情势也会变得十分紧张。在这种模型中,代理人尽可能付出最小的努力去赚到最多的钱。相应地,公司会采取一系列规定和手段(比如激励方案和记账系统),尽可能降低因委托人和代理人之间的利益冲突而产生的成本。例如,销售人员的薪酬以佣金为主,他们必须上交记录出差费用的发票,并且不得乘坐飞机头等舱。
在我们注重个人内在特征的模型中,代理人是一组寿命很短的行动者。具体说来,我们假设每个时间段,比如每天,都会有一个新的行动者。该行动者想要享受生活,十分自私,根本不关心未来。相反,计划者是奉行利他主义的。她[5]所在意的是一系列可以从行动者那里获得的效用。(我们可以把她想象成仁慈的独裁者。)她希望所有行动者从整体上越快乐越好,但她也要对行动者的行为实施一定的控制,尤其是在行动者的欲望被激起时,比如食欲、性欲、喝酒的欲望,或者天气晴朗时突然想出去闲逛一天。
计划者有两套方法可以用来影响行动者的行为。她可以用(金钱或其他方面的)奖惩措施来影响行动者的决定,但同时将决定权留给行动者;她还可以实施强制性措施,比如承诺策略,来限制行动者的选择。
让我们举一个精心设计的简单案例。假设哈里独自在一个偏远的小木屋里野营,与外界断绝了一切联系。一架小型飞机送他到达那里,并将在10天后接走他。一开始他有很多食物(水也是充足的),但是一头饥饿的熊来到这里,几乎吃掉了所有食物,只留下10根能量棒,可能是它没有注意到能量棒,抑或是能量棒不合它的胃口。因为无法与外界联络,哈里又不擅长寻找食物,在飞机来接他之前,他只能依靠这10根能量棒过活。当然,哈里的头脑里也有一个计划者和一个行动者,计划者会如何处理这个问题呢?
假设计划者对待每个行动者的消费都是公平的(所以不会对未来行动者的消费进行贴现)。食物给行动者带来的边际效用是递减的,也就是说,第一根能量棒比第二根带来的快乐更多,以此类推,当他吃到的能量棒不能再带来任何快感时就会停下来。在这种情况下,计划者会认为最好的做法就是一天吃一根能量棒,这样10个行动者都会获得同样的效用。[6]换句话说,计划者会像理性经济人那样,如果按照生命周期假设,将会平均分配能量棒。从某种程度上说,计划者会尽量使行动者像经济人一样行事。如果技术上可行,计划者会采取承诺策略,不让行动者有自由选择的机会,从而消除异常行为的风险。如果小木屋里有10个可编程的保险箱,每个保险箱都会在特定的时刻打开,这种情况最理想。[7]从计划者的角度讲,这可能是最好的结果。
但是,这间小木屋不可能有这些保险箱,在这种情况下计划者会怎么做呢?如果把10根能量棒都放在橱柜里,可以随时拿来吃,那么会发生什么情况呢?如果计划者不干预,第一个行动者就根本不会关心未来行动者的福利,他会一直吃,直到吃饱为止;也就是说,直到再吃一口能量棒就会减少他的幸福感为止。我们假设这发生在他吃了三根能量棒之后。第二天,行动者又吃了三根能量棒,第三天的行动者也是一样。当第四天到来时,行动者早餐时吃了一根能量棒,也是最后的一根,他很快就饿了,剩余的时间再也没有任何快乐而言。
不管怎样,计划者都会防止行动者在最初几天狂吃能量棒。如果没有承诺策略可实施,在我们的模型中,计划者唯一可以使用的方法就是“内疚”。通过计划者或是父母、社会的教导,行动者会因为不给未来的行动者留些吃的而倍感内疚。不过,实施这一方法的代价很高。在能量棒这个例子中,计划者不可能在行动者吃掉第一个能量棒时就让他感到内疚。
在图6中,峰值最高的那条曲线代表吃能量棒没有任何内疚感的行动者所获得的效用,这时行动者会吃到效用最大时为止,即吃完第三根能量棒的时候。第二高的那条曲线表明,因为产生了一定的内疚感,行动者吃完第二根能量棒后就不再吃了,而峰值最低的那条曲线表明,行动者吃完第一根后就不再吃了。我们需要注意一点,当运用了“内疚”的方法时,生活的乐趣就减少了,因为让行动者少吃能量棒的唯一方法就是减少吃能量棒的快感。另外一种思考方式是“运用意志力是需要努力的”。
图6 吃能量棒的快感
以上分析说明,如果可以建立和推行完善的规则,生活会更加美好。使用可编程的保险箱,每个里面存放一根能量棒,这会比让人产生内疚感的吃法更令人满意。斯特罗茨也做到了这一点,他让雇主将年薪按12个月平均发放,即从当年9月到第二年8月,而不是从当年9月到第二年5月按9个月发放。如果按照后者支付,钱就会更早到账。但是,他必须在每个学年都存足够的钱,以备暑期之需,以及用于家庭度假。