1915年,爱因斯坦发表了广义相对论(generaltheory of relativity)与几个著名假设。他提及了水星近日点反常进动[1] 的“预测”,并首次对它做出解释。他还预测了光波受到太阳引力场会发生偏折。1919年,由亚瑟·艾丁顿(ArthurEddington)带领的团队用实验证实了光线偏折预测,令爱因斯坦一举成为国际名人。
解释水星近日点的反常进动及成功预测光线发生偏折,都完美印证了爱因斯坦的理论。然而只有光线偏折——由于它太过出人意料——才登上了各大媒体的头条。
试着假设,艾丁顿的实验完成于1900年而非1919年,光线偏折的事实依旧会得到证实,正如神秘莫测的水星进动,而且将在时间上早于爱因斯坦的成就。这么一来,爱因斯坦可能就会丧失因预测未知造成的心理冲击。他也许永远不可能在公众想象中树立起才能非凡的形象,而一代物理学家也将改变他们的研究习惯。但是,我们先将爱因斯坦的个人辉煌成就放在一边,广义相对论的命运又将如何呢?科学界需要花费更长时间才能接受这种思想吗?若是如此,这合理吗?
相反,我们可以想象水星进动现象一直无人知晓,直到爱因斯坦对它做出预测,而随后的实验又证实了他的预测。这种预测造成的心理冲击会令广义相对论的地位更加无法动摇吗?这合理吗?
当然,对已知事实做出新解释(如水星进动)与成功预测新事实(如光线偏折)都应该被视作一种理论成就。然而,成功预测新事实往往能够造成更加显著的心理冲击。有时,它被称作理论的创新证据(novelevidence)。问题是,创新证据在理论中的地位应该高于非创新证据(nonnovel evidence)吗?或者说得更直白:创新重要吗?
早在13世纪,罗杰·培根[2]提出了一种如今早已广为人知的科学研究方法的雏形:理论先行。它依据经验与现有证据提出假设,随后在实验与观察中检验假设的可行性。到16世纪,这种方法已经获得多位哲学家与科学家的推崇,其中最著名的有弗朗西斯·培根[3]与勒内·笛卡尔[4]。当今,科学研究领域的学生已经将此奉为真理。
上述科学研究方法——我们可以将它总结为“理论先行,另行检验”,将对创新证据的检验置于了核心的地位。其实还有另外一种研究方法:先观察、做实验,再根据结果提出理论——我们可以将它总结为“实验先行,另行论证”。第二种方法彻底“颠覆”了创新证据在研究中的地位。[5]
为什么呢?若是如此,我们应该推崇其中的一种方法而贬低另一种吗?多年前,我的同事詹姆斯·卡恩(JamesKahn)、阿兰·斯托克曼(Alan Stickman)与我十分沉迷这个问题。但是,我们发现所有的教科书均在没有做出任何明确解释的情况下,都大力推崇罗杰与弗朗西斯·培根的方法。于是,我们将目光转向了哲学学术期刊。期刊上,科学界正就创新证据的地位展开激烈辩论,但找到的论据都无法令我们信服。
因此,我们决定回到问题的起点。作为经济学家,我们也许可以为这场讨论做出一些独有的贡献。毕竟所谓科学,就是在信息不全面的情况下做出(暂时的)结论。单凭这一点,经济学家对它并不陌生。
最终,我们找到了解决这个问题的一些新方法,发表在《经济学理论杂志》(Journal of Economic Theory)以及《不列颠科学哲学杂志》(British Journal for the Philosophy of Science)。我们并不认为可以就此为相关讨论盖棺定论,但的确想指出,与过去400年来试图解释该问题的其他学者不同,我们提出了清晰的假设,并指出它们背后的逻辑。我们十分希望与期待其他人——在提出各种假设时——也能如此。
我将从一个高度概念化的案例入手。鲍里斯(Boris)与娜塔莎(Natasha)都是渥萨摩塔大学的松鼠研究专家。[6]一天,他们从新闻得知,寒冷潮湿的天气持续了一段时间后,附近莫西维纳岛上的松鼠正在成群死去。他们各自奔向自己的实验室,期待解开松鼠死亡的秘密。
鲍里斯的做法是着手进行了一系列验尸,结果表明松鼠死于心脏衰竭。但是,为什么呢?鲍里斯沉思了片刻,在他已有的松鼠生物学知识中上下翻寻。最终,他提出自己的理论,出于A、B和C理由,寒冷可能导致松鼠心脏衰竭。
相反,娜塔莎没有验尸,而是直接提出理论。通过对现象的思考和掌握的松鼠生物学知识,她认为出于D、E和F理由,冷雨可能造成心脏衰竭,继而导致松鼠死亡。接着,根据她在学校接受的科学研究训练,她着手验证自己的理论。她知道,如果她的理论正确,一系列验尸将证明松鼠死于心脏衰竭。她进行了验尸,并且证明了自己的预测。
罪魁祸首究竟是鲍里斯所说的寒冷,还是娜塔莎所说的冷雨呢?最终,通过一些不怎么善待动物的实验可能会找到问题的答案,但在此期间我们应该相信谁呢?如果我们想拯救剩下的松鼠,应该使它们保持温暖还是保持干燥呢?
只有娜塔莎采取了课本上的科学研究方法。她首先提出理论,继而用理论做出了创新预测(novelpredictions),认为验尸将证明死因是心脏衰竭。为了验证预测,她动手做了一些实验,但鲍里斯完全不是这么操作:提出理论前,他已经做了一些实验。综上所述,我们就应该将一种理论置于另一种理论之上吗?我们现在有两套理论,每一套都包含了实验,对理论的论证,无论支持还是反对都能够自圆其说。这么一来,如何获得理论真的重要吗?[7]
如果鲍里斯与娜塔莎的学术成就不相上下,如果你也清楚他们的学术能力旗鼓相当,我们(此处指卡恩、斯托克曼与我)想不到任何理由会令你更相信其中的一种。[8]换句话说,创新没有用。
我们对创新无关紧要的论证简单又无懈可击,但它并不被绝大多数科学家接受。他们辩称任何人都可以利用已知事实,捏造某种“解释”它们的理论,因此“创新预测”才是科学成就的真正标志。他们深信自己的直觉,认定创新十分重要。现在,我们面临的挑战就是对此做出全面解释。
回答开始:娜塔莎——不同于鲍里斯,证明她可以根据较少观察就构建出理论。(当然,娜塔莎与鲍里斯的观察均部分基于他们自身的经验与其他前辈的经验。尽管如此,娜塔莎还是比鲍里斯少观察一个案例——十分关键的一个。)也许这表明娜塔莎比鲍里斯更聪明,至少在处理这类问题时她更有办法。也许出于这个原因,我们应该更相信她而不是鲍里斯。
实际上,我们可以找到两个更相信她的理由:第一,在不清楚全体事实的情况下,她可以构建出一套适用于全体事实的理论;第二,她愿意为构建这套理论投入时间与精力,这在某种程度上显示了她的自信,从而加深了我们对她的信任。如果我们至少相信自信往往能够反映真实能力。
为了检验我们的假设——娜塔莎的研究策略是不是自信的真实反映——我们需要知道她为什么在一开始就选择了这种策略。我们需要知道她的更多诱因。
以下是众多可能性之一(也是高度概念化的):假设我们知道,在渥萨摩塔大学,使用理论先行的科学家在创新预测得到成功验证的情况下,可以获得10万美元年薪,在无法得到验证的情况下,可以获得2万美元年薪;假设先做实验,再根据结果得出理论的科学家——从不提出创新预测——可以获得5万美元年薪。那么作为创新预测家,娜塔莎就将收入置于风险之中。她乐意在自己的天赋上下赌注,因此对我们而言,最好跟着她一起下注,接受她的理论。相反,接受5万美元年薪的鲍里斯不禁令我们怀疑,我们难道应该比他自己更有信心吗?
通过不同薪酬体系,我们得到了不同结果。现在,我们才真正进入经济学讨论。我们不仅需要假设一种薪酬体系,还需要预测薪酬结构,以及科学家将如何对它做出反应,并且从反应中推导出我们的结论。
这绝不是一个简单的问题,所有现象都会相互作用、影响。薪酬结构将影响诱因;诱因将影响研究策略;研究策略将影响行政人员判断谁才是真正的聪明人,而那些判断将影响不同研究风格所代表的价值;而上述价值又会反过来影响到薪酬结构。以上均由科学家、科研机构间的竞争,以及科学研究的赞助者与受益人同时参与决定。我们需要全面理解这种连锁反应,以及它们将如何相互作用。
那时,斯托克曼、卡恩与我不知该怎么解决这个问题,于是我们回到了一个更加简单的问题。与其问已经发生了什么,不如问应该发生什么。换句话说,我们假设存在一位科学“沙皇”(czar),由他设计一套激发科学家最大工作效率的系统。我们的问题是,这是一套怎样的系统呢?
以上两个问题不能相提并论。我们知道在许多经济学案例中,真实市场反馈——真正发生的事,与有效市场反馈——应该发生的事,常常混为一谈。也许科学研究市场也可以成为此类案例中的一个。这么一来,解决简单问题的方法就可以自动应用到复杂问题上。至少我们希望找到一些类似的方式,即使最终我们的希望破灭,努力也不会白费。无论如何,我们总能给未来的科学“沙皇”继续出谋划策。
好吧,现在就让我们想象一位“沙皇”,他命令科学家要么像鲍里斯一样先做实验,要么像娜塔莎一样先提出理论。
理论先行的弊处在于所有努力都可能白费。科学家将大量时间与资源扔进了死胡同,正如娜塔莎的同事“眼镜狗”(Mr.Peabody)。“眼镜狗”也是理论先行的科学家。在辛勤工作了一周后,他提出一套理论,出于G、H和I原因,寒冷、潮湿的天气令松鼠死于动脉瘤。如果“眼镜狗”可以像鲍里斯一样先做几个实验,不费吹灰之力就会知道松鼠死于心脏衰竭,他就不用白费一周的力气了。
但是理论先行的好处在于,随着“眼镜狗”的理论被检验淘汰,有些理论——比如由娜塔莎提出的那套,能够通过检验幸存下来,这令人们相信后者也许比其他科学家更聪明。于是,“沙皇”可以做出调整,更加关注那些理论。相反,如果科学家选择先做实验,他们的理论就不可能被淘汰(至少在更多事实浮现出来前,他们的理论都能够幸存)。因此“沙皇”相当困扰,无法判断应该相信哪种理论。[9]
接下来,就是权衡取舍:如果理论先行,失败的可能性很高,但可以令我们具备更多信心;如果实验先行,所有理论都能够幸存,但我们无法判断该相信哪一种。
现在,我们再让问题变得复杂一些:假设科学家知道自己是否聪明[10],而“沙皇”想在不经意间套出这个信息。实际上,他有两个理由应该这么做:首先,这会帮助他判断谁的理论可信;其次,他知道该向哪些聪明的科学家支付高薪,而不是将钱浪费在愚蠢之辈上。甚至,他可以在一开始就鼓励聪明人做科学家,让资质平平的人趁早另谋高就。
区别聪明科学家与愚蠢科学家的最好方法是什么?直截了当询问最简单。不幸的是,科学家一般不愿表露出他们的愚蠢,尤其这将关系到他们的收入。因此,我们需要一种诱因迫使科学家说实话。
解决方式如下:“沙皇”建立两家不同的研究机构——实验先行研究所(Look-firstInstitute)与理论先行研究所(Theorize-First Institute)。在实验先行研究所,所有科学家都先做实验,所有人的年薪都为5万美元;在理论先行研究所,所有科学家都先构建理论,理论检验成功的科学家可以获得10万美元年薪,理论检验失败的科学家只有2万美元年薪。
如果科学家正确选择自己的年薪,聪明的科学家就会加入理论先行研究所——他们对自己很有信心,相信提出的创新预测能够通过检验,于是期待更高的回报;愚蠢的科学家——知道自己的预测经常失败的人,将会接受5万美元年薪加入实验先行研究所。[11]所有科学家都自愿向“沙皇”透露了有用信息,即使这可能违背了他们的初衷。
当然,一些聪明的科学家可能走了霉运,每年只挣到2万美元薪水。但平均而言,聪明的科学家比愚蠢的科学家挣得多,因此大部分聪明的科学家都选择了投身研究事业。不仅如此,“沙皇”在必要时还知道应该相信谁提出的理论——比如他要启动一个拯救松鼠项目。实验先行研究所的科学家做出的贡献将得到礼貌性的肯定,但永远不会发挥实际作用。
这种解决方式有几大显著特点。首先,聪明的科学家在构建理论时花费了大量时间与精力,但如果他们先做实验,就会避免走进死胡同。(因此,如果他们可以自由选择,一定会倾向于先做实验。)不幸的是,如果允许他们先做实验,虽然他们面临的风险降低了,但愚蠢的科学家可能会混入他们的队伍(毕竟,理论无法在实验中得到检验是阻止愚蠢的科学家选择理论先行研究所的唯一理由)。通过让聪明的科学家冒一些浪费时间的风险,“沙皇”可以得知谁聪明,谁愚蠢,而透露出的信息本身十分值得这种浪费。
其次,愚蠢的科学家可能事先就明白他们的研究一无是处[12],但还是选择加入实验先行研究所。向他们支付一定薪水同样十分重要,这可以防止他们混入聪明人的队伍。我在学术圈待了这么久,深知类似的预防措施绝对很必要。
每隔几年,我所在的院系就会在评估数百份简历上投入巨大资源。我们只需评估数百份简历而非数千份的原因之一,恰恰在于能力不济的应聘者已经接受了渥萨摩塔大学发出的年薪还算合理的工作邀约。[13](对哈佛大学而言,我的大学所扮演的角色也许正如渥萨摩塔大学。)
同样,质量最高的学术期刊编辑总被无数投稿淹没。将他们的工作量控制在合理范围的方式之一,就是只考虑来自理论先行研究所科学家的论文。如果“沙皇”设计的年薪制度合理,他们一定是比较聪明的一群人。
在这里十分有必要指出,如果科学研究完全私有化,没有公司会雇用只生产失败理论的愚蠢科学家。然而,存在这样的公司具有相当重要的社会价值,它们可以防止愚蠢的科学家混入聪明人的队伍。因此,理论告诉我们,政府应该承担起组织科学研究的职责——因为只有政府愿意资助完全没有社会价值的研究!
第三,“沙皇”获得的信息可能不全面,而且他的标准可能十分严格,因此世界上到处都是蠢货,聪明的科学家屈指可数,正如每个人的能力如果得到全面评估将出现的结果。事实真的如此吗?熟悉现代科学研究的读者可以给出自己的答案。
当然,在探讨创新预测价值的讨论中,聪明/愚蠢科学家模型并非唯一合理,甚至并非最佳方式,但我十分确信它是唯一利用翔实细节展开讨论的论证。如果其他人在提出他们的假设时也可以采用相同的方法,我们说不定就可以采取更严谨的态度来讨论他们方法的优点。关于创新预测的辩论持续了数个世纪,不知为什么从没有任何参与者认为应该提出一个包含科学行为的具体模型。我们应该对伟大的思想家未经论证的结论保持警惕。我更欣赏经济学,因为它总是秉持更高的标准与要求。
[1] 进动,物理学名词,指自转物体受外力作用导致其自转轴绕某一中心旋转的现象,也叫作“旋进”。——译者注
[2] 罗杰·培根(Roger Bacon),英国具有唯物主义倾向的哲学家和自然科学家,实验科学的先驱。——译者注
[3] 弗朗西斯·培根(Francis Bacon),英国唯物主义哲学家、散文家。——译者注
[4] 勒内·笛卡尔(René Descartes),法国著名哲学家。——译者注
[5] 当然,在这两种方法之间存在巨大空间。科学家在提出理论前后都会观察,但有些人在提出理论前会观察得更细致。我们假设有些科学家在提出理论前不进行观察,另一些科学家在提出理论前进行全面观察,就可以将讨论的主要问题十分鲜明地呈现出来。
[6] 该案例采用的角色与场景均来自美国20世纪60年代经典卡通片《波波鹿与飞天鼠》。——译者注
[7] 当然,我们的例子简化了科学验证的步骤,但已经足够抓住真实世界中一些重要的因素。科学家在构建理论时,有些人比其他人掌握更多相关事实。
[8] 假设松鼠死亡真相存在10个可能的理由,所有理由都很合理又不难发现——而且我们已经意识到其中过分简化了假设步骤。假设10个理由中只有一个正确,那么鲍里斯找到正确理论的概率为十分之一,娜塔莎也为十分之一。因此,没有理由将一套理论置于另一套理论之上。即使提出的假设存在微妙的差异,使一些理论看上去比另一些理论简单,上述说法同样成立,毕竟相同假设可以存在无数种表达方式。
[9] 当然,现实中的沙皇很可能会掌握许多判断谁是聪明科学家的外部证据。但是,额外的证据总要付出高昂的代价。此外,沙皇的信心只是暂时的,直到将来的研究者提出一套全新的见解。但有时,你的确需要知道现在更应该相信谁。如果你试图拯救松鼠,就需要相信什么是导致它们死亡的最可能原因。
[10] 我们在此处使用“聪明”一词是为了说明科学家比普通人有更多机会构想到既可以反映事实又真实有效的理论。我们使用“愚蠢”一词是为了表明相反意思。一位科学家只要具备解决特定问题的独特能力或者拥有解决问题的强大动力,都可以被视为“聪明”。基于以上定义,这位科学家在研究某问题时是“聪明”科学家,但在研究另外问题时也许就是“愚蠢”科学家。
[11] 这一段提及“年薪”仅用于说明问题。为了设定合理的薪水,“沙皇”需要考虑许多因素。首先,它必须对科学家起到区分作用,所以聪明的科学家才会去理论先行研究所,愚蠢的科学家才会去实验先行研究所;其次,它必须考虑每种类型科学家的大致人数。
[12] 记住,我们使用的案例是高度概念化的,因此模型中预测的实验先行理论才完全一无是处。但在现实世界中,出于研究之间的关联性,愚蠢的科学家做出的成果也许只是相对而言价值不那么大。
[13] 如果可以将更有用的任务分配给愚蠢的科学家,这个解决方法就更加完美了——比如去给本科生上课。