为什么我们不能仅通过观察来回答牙线的问题呢?为什么不直接进入存有历史购买信息的庞大数据库,看看在牙膏价格翻倍的情况下实际发生了什么呢?原因在于,在以往的情况中,涨价可能出于完全不同的原因,例如产品供不应求,其他商店也不得不涨价等。但现在,我们并不关注行情如何,只想通过刻意干预为牙膏设定新价格,因而其带来的结果就可能与此前顾客在别处买不到便宜牙膏时的购买行为大相径庭。如果你有历史行情数据,也许你可以做出更好的预测……但是,你知道你需要什么样的数据吗?你准备如何理清数据中的各种关系?这些正是因果推断科学能帮助我们回答的问题。
预测干预结果的一种非常直接的方法是在严格控制的条件下进行实验。像脸书这样的大数据公司深知实验的力量,它们在实践中不断地进行各种实验,比如考察页面上的商品排序不同或者给用户设置不同的付款期限(甚至不同的价格)会导致用户行为发生怎样的改变。
更为有趣并且即使在硅谷也鲜为人知的是,即便不进行实验,我们有时也能成功地预测干预的效果。例如,销售经理可以研发出一个包括市场条件在内的消费者行为模型。就算没能采集到所有因素的相关数据,他依然有可能利用充分的关键替代数据进行预测。一个足够强大的、准确的因果模型可以让我们利用第一层级(关联)的数据来回答第二层级(干预)的问题。没有因果模型,我们就不能从第一层级登上第二层级。这就是深度学习系统(只要它们只使用了第一层级的数据而没有利用因果模型)永远无法回答干预问题的原因,干预行动据其本意就是要打破机器训练的环境规则。
这些例子说明,因果关系之梯第二层级的典型问题就是:“如果我们实施……行动,将会怎样?”也即,如果我们改变环境会发生什么?我们把这样的问题记作P(牙线 |do(牙膏)),它所对应的问题是:如果对牙膏另行定价,那么在某一价位销售牙线的概率是多少?
第二层级中的另一个热门问题是:“怎么做?”它与“如果我们实施……行动,将会怎样”是同类问题。例如,销售经理可能会告诉我们,仓库里现在积压着太多的牙膏。他会问:“我们怎样才能卖掉它们?”也就是,我们应该给它们定个什么价?同样,这个问题也与干预行动有关,即在我们决定是否实际实施干预行动以及怎样实施干预行动之前,我们会尝试在心理层面演示这种干预行动。这就需要我们具备一个因果模型。
在日常生活中,我们一直都在实施干预,尽管我们通常不会使用这种一本正经的说法来称呼它。例如,当我们服用阿司匹林试图治疗头痛时,我们就是在干预一个变量(人体内阿司匹林的量),以影响另一个变量(头痛的状态)。如果我们关于阿司匹林治愈头痛的因果知识是正确的,那么我们的“结果”变量的值将会从“头痛”变为“头不痛”。
虽然关于干预的推理是因果关系之梯中的一个重要步骤,但它仍不能回答所有我们感兴趣的问题。我们可能想问,现在我的头已经不痛了,但这是为什么?是因为我吃了阿司匹林吗?是因为我吃的食物吗?是因为我听到的好消息吗?正是这些问题将我们带到因果关系之梯的最高层,即反事实层级。因为要回答这些问题,我们必须回到过去改变历史,问自己:“假如我没有服用过阿司匹林,会发生什么?”世界上没有哪个实验可以撤销对一个已接受过治疗的人所进行的治疗,进而比较治疗与未治疗两种条件下的结果,所以我们必须引入一种全新的知识。
反事实与数据之间存在着一种特别棘手的关系,因为数据顾名思义就是事实。数据无法告诉我们在反事实或虚构的世界里会发生什么,在反事实世界里,观察到的事实被直截了当地否定了。然而,人类的思维却能可靠地、重复地进行这种寻求背后解释的推断。当夏娃把“蛇欺骗了我”作为她的行动理由时,她就是这么做的。这种能力彻底地区分了人类智能与动物智能,以及人类与模型盲版本的人工智能和机器学习。
你可能会怀疑,对于“假如”(would haves)这种并不存在的世界和并未发生的事情,科学能否给出有效的陈述。科学确实能这么做,而且一直就是这么做的。举个例子,“在弹性限度内,假如加在这根弹簧上的砝码重量是原来的两倍,弹簧伸长的长度也会加倍”(胡克定律),像这样的物理定律就可以被看作反事实断言。当然,这一断言是从诸多研究者在数千个不同场合对数百根弹簧进行的实验中推导出来的,得到了大量试验性(第二层级)证据的支持。然而,一旦被奉为“定律”,物理学家就把它解释为一种函数关系,自此,这种函数关系就在假设中的砝码重量值下支配着某根特定的弹簧。所有这些不同的世界,其中砝码重量是x磅?[1]??,弹簧长度是Lx?英寸?[2]??,都被视为客观可知且同时有效的,哪怕它们之中只有一个是真实存在的世界。
回到牙膏的例子,针对这个例子,最高层级的问题是:“假如我们把牙膏的价格提高一倍,则之前买了牙膏的顾客仍然选择购买的概率是多少?”在这个问题中,我们所做的就是将真实的世界(在真实的世界,我们知道顾客以当前的价格购买了牙膏)和虚构的世界(在虚构的世界,牙膏价格是当前的2倍)进行对比。
因果模型可用于回答此类反事实问题,建构因果模型所带来的回报是巨大的:找出犯错的原因,我们之后就能采取正确的改进措施;找出一种疗法对某些人有效而对其他人无效的原因,我们就能据此开发出一种全新的疗法;“假如当时发生的事情与实际不同,那会怎样?”对这个问题的回答让我们得以从历史和他人的经验中获取经验教训,这是其他物种无法做到的。难怪古希腊哲学家德谟克利特(公元前460—前370)说:“宁揭一因,胜为波斯王。”
将反事实置于因果关系之梯的顶层,已经充分表明了我将其视为人类意识进化过程的关键时刻。我完全赞同尤瓦尔·赫拉利的观点,即对虚构创造物的描述是一种新能力的体现,他称这种新能力的出现为认知革命。他所举的代表性实例是狮人雕塑,这座雕塑是在德国西南部的施塔德尔洞穴里发现的,目前陈列于乌尔姆博物馆(见图1.3)。狮人雕塑的制造时间距今约4万年,它是用长毛象的象牙雕成的半人半狮的虚构怪兽。
图1.3 施塔德尔洞穴的狮人雕塑。已知的最古老的虚构生物(半人半狮)雕塑,其象征着一种人类新发展出来的认知能力,即反事实推理能力(资料来源:伊冯·米勒斯拍摄,由位于德国乌尔姆的国家文化遗产处巴登—符腾堡/乌尔姆博物馆提供)
我们不知道究竟是谁雕刻了狮人,也不知道他雕刻的目的是什么,但我们知道一点,是解剖学意义上的现代人类创造了它,它的出现标志着对先前所有的艺术或工艺品形式的突破。在此之前,人类已经发明了成型的工具和具象派艺术,从珠子到长笛到矛头再到马和其他动物的高雅雕刻都属此类。但狮人雕塑不同,它的本体是一个只存在于想象中的生物。
自此,人类发展出了一种想象从未存在之物的能力。作为这种能力的表现形式,狮人雕塑是所有哲学理论、科学探索和技术创新的雏形。从显微镜到飞机再到计算机,这些创造物真正出现在物理世界之前,都曾存在于某个人的想象之中。
与任何解剖学上的进化一样,这种认知能力的飞跃对我们人类这个物种来说意义深远且至关重要。在狮人雕塑制造完成之后的1万年间,其他所有的原始人种(除了地理上被隔绝的弗洛雷斯原始人)都灭绝了。人类继续以难以置信的速度改变着自然界,利用我们的想象力生存、适应并最终掌控了整个世界。从想象的反事实中,我们获得的独特优势是灵活性、反省能力和改善过去行为的能力,更重要的一点是对过去和现在的行为承担责任的意愿。古往今来,我们一直受益于反事实推理。
如图1.2所示,因果关系之梯第三层级的典型问题是:“假如我当时做了……会怎样?”和“为什么?”两者都涉及观察到的世界与反事实世界的比较。仅靠干预实验无法回答这样的问题。如果第一层级对应的是观察到的世界,第二层级对应的是一个可被观察的美好新世界,那么第三层级对应的就是一个无法被观察的世界(因为它与我们观察到的世界截然相反)。为了弥合第三层级与前两个层级之间的差距,我们需要构建一个基础性的解释因果过程的模型,这种模型有时被称为“理论”,甚至(在构建者极其自信的情况下)可以被称为“自然法则”。简言之,我们需要掌握一种理解力,建立一种理论,据此我们就可以预测在尚未经历甚至未曾设想过的情况下会发生什么——这显然是所有科学分支的圣杯。但因果推断的意义还要更为深远:在掌握了各种法则之后,我们就可以有选择地违背它们,以创造出与现实世界相对立的世界。我们将在下一节重点介绍这类违背法则的行为。