有多少人看完了这本书
签完图书出版合同后,我对本书的结构有了清晰的想法。你可能还记得,我在开头部分描述了我家感恩节餐桌上的场景。我的家人对我是否心智健全颇有争议,都在试图搞清楚为什么我都33岁了,却还找不到心仪的姑娘。
因此,本书的结论实际上会自己发展下去。我会遇到那个心仪的姑娘,并娶她为妻。如果能依靠大数据来遇见这个姑娘,那就更好了,或许我还可以在追求她的过程中加入一些珍闻趣事。那么,这个梦想一下子在本书的结论中实现了,结论可以描述我结婚当日的场景,也可以作为情书送给我的新婚妻子。
只可惜,生活总是事与愿违。将自己锁在公寓,与世隔绝,专心写书可能对我的感情生活毫无帮助。哎,可我还得找个老婆。更重要的是,我需要一个新的结论。
为了得出一个超级棒的结论,我仔细钻研了很多我钟爱的书籍。我断定,最好的结论会将一个始终存在,只是隐藏在事物表面之下的重要观点公之于众。对本书而言,这个观点就是:社会科学正在成为一门真正的科学,而且这一新的、真正的科学将会改善我们的生活。
在本书第二部分的开头,我讨论了卡尔·波普尔对西格蒙德·弗洛伊德的批判。我指出,波普尔认为弗洛伊德古怪的世界观不符合科学规律,但我没有提到波普尔的评论。实际上,这个观点并不只是对弗洛伊德的攻击。波普尔认为,任何社会科学家都是不够科学的。波普尔认为这些所谓的科学家的工作并不严谨。
是什么促使波普尔发起这番“讨伐”的呢?[1]在与当时最优秀的知识分子(包括最好的物理学家、历史学家和心理学家)交流时,他发现了一个惊人的差异。当物理学家讲话时,波普尔相信他们的工作。诚然,这些物理学家有时会犯错,有时会被自己的潜意识偏见欺骗,但他们参与了一个过程,这一过程很显然是在寻找有关世界的深奥真理,最终因爱因斯坦的相对论而达到顶峰。可当这些世界上最著名的社会科学家讲话时,波普尔却认为他在听废话。
波普尔并不是唯一一个发现这一差异的人,几乎每个将物理学家、生物学家和化学家视为真正的科学家的人都会发现这一差异。物理学家可以利用严谨的实验找出物理世界的运行方式,相反,许多人认为经济学家、社会学家和心理学家是“软科学家”,只需抛出一些毫无意义的术语便可获得终身职位。
过去,这话在很大程度上是真的,但是,大数据革命改变了这一点。如果今天卡尔·波普尔尚在人世,参加了一个报告会,出席人员还有拉杰·切蒂、杰西·夏皮罗、埃丝特·迪弗洛或我本人(让我幽自己一默),我强烈怀疑他就不会再有当时的反应了。说实话,他可能会更多地质疑当今伟大的弦理论家究竟是真正的科学家,还是仅仅在自我放纵。
如果一部暴力电影在某座城市上映,那么这座城市的犯罪率是会上升还是下降呢?如果更多的人看过某一广告,那么会有更多的人使用广告中的产品吗?如果一支棒球队在一个男孩20岁时夺冠,那么当他40岁时还会支持这支球队吗?这些都是明确的问题,也有明确的答案。在海量的真实数据里,我们能找到这些问题的答案。
这是科学事件,不是伪科学。
这并不意味着社会科学革命将以简单、永恒的定律形式出现。
麻省理工学院已故科学家马文·明斯基(Marvin Minsky)是最早研究人工智能可能性的科学家之一,他认为心理学是因试图模仿物理学而偏离轨道的。物理学成功找到了在任何时候、任何地方都适用的简单定律。
明斯基认为,人脑可能不受此类定律的约束。相反,人脑很可能是一套复杂的黑客系统——其中一部分可以纠正其他部分出现的错误。经济和政治系统可能同样复杂。
因此,社会科学革命不可能以简洁的公式形式出现,如E=MC2。如果有人说社会科学革命以一个简洁的公式为基础,对此你应该持怀疑态度。
相反,社会科学革命的进程是零敲碎打的,一项研究接着一项研究,一项发现接着一项发现。慢慢地,我们就可以更好地理解人类思想和社会的复杂系统。
我们得出了正确的结论,也指明了未来更多问题的研究方向。
对本书而言,其实很简单。我在本书中讨论过的数据集是革命性的,但几乎没有人研究过它们,我们还有很多东西需要学习。坦率地说,绝大多数学者忽略了数字时代造成的数据爆炸。世界上最著名的性研究者坚持用可靠、有效的方法。他们采访了数百个研究对象,调查了这些研究对象的愿望,他们不会从色情网站上搜寻数据。世界上最著名的语言学家分析个体文本,他们通常忽略数十亿本书中所揭示的模式。在心理学、政治科学和社会学研究生课程中,为师者所传授的大部分方法都没有受到数字革命的影响。因数据爆炸而开辟的广阔且仍有待完全开发的领域留给了少数有远见的教授、叛逆的研究生和业余爱好者。
这一点终将改变。
对于我在本书中谈到的每一个想法,都有100个同样重要的想法亟待处理。在这里讨论的研究只是冰山一角、沧海一粟。
那么,还有什么问题需要讨论呢?
其中之一是有史以来最成功的公共卫生研究中使用的方法迅速普及。19世纪中叶,英国物理学家约翰·斯诺(John Snow)对导致伦敦霍乱暴发的原因饶有兴趣。
他的绝妙想法是:把城里所有的霍乱病例都标记在地图上。[2]当他这样做时,发现这种疾病主要集中在一个特定的水泵周围。这说明霍乱是通过细菌滋生的水源传播的,据此他推翻了当时霍乱通过有害空气传播的传统观念。
大数据以及由此带来的方法功能使此类研究越来越容易。对于任何疾病,我们都可以研究谷歌搜索数据或其他数字卫生数据。我们可以发现这个世界上这种疾病是否在某些小片区域的发病率高或低得异乎寻常,然后就可以找出这些地方的共同点。是空气有问题吗,还是水源,抑或是社会规范?
我们可以用这种方法治疗偏头痛、肾结石、焦虑、抑郁、老年痴呆症、胰腺癌、高血压、背痛、便秘和流鼻血。我们可以用它做任何事。斯诺曾经做的分析研究,如今借助大数据我们可以做400次(写作本书的时候,我就已经着手这项研究了)。
我们可以称之为大规模科学,即采取一种简单的方法,利用大数据在短时间内进行数百次分析。毫无疑问,社会科学和行为科学的规模一定会扩大。还有一种手段也有助于这两门科学扩大规模:A/B测试。我们讨论了在企业让用户点击标题和广告的情况下进行的A/B测试,这一直是该方法的主要用途。相比让人们点击广告的箭头,A/B测试还可以用于发现更基本、更有社会价值的东西。
美国西北大学的经济学家本杰明·F.琼斯正试图运用A/B测试更好地帮助孩子们学习。他协助创建了一个名为EDU STAR的平台,可以让学校随机测试不同的课程计划。[3]
许多公司都从事教育软件业务。有了EDU STAR这一平台,学生只要在电脑上登录网页,就可以随机参与不同的课程计划,然后他们可以通过进行简短的测试检测自己的学习情况。换句话说,学校要了解哪个软件对帮助学生掌握知识的效果最好。
与所有强大的A/B测试平台一样,EDU STAR也在不断制造惊人的成绩。令许多教育工作者为之振奋的一项课程计划便包含一个利用游戏为学生讲授分数的软件。当然,如果把数学变成一个游戏,学生就会发现更多乐趣,学得更多了,得分也会更高,对吧?可这是错误的想法。与那些用更标准的方法学习分数的学生相比,通过游戏学习分数的学生考试的得分反而更低[此书分享V信wsyy 5437]。
硅谷曾经率先做过一项测试,即引导人们点击更多广告,而让孩子学习更多东西则是对这一测试进行的令人振奋且有社会价值的运用。让人们睡眠时间更长也一样,都是有效的运用和尝试。
美国人平均每晚睡眠时间为6.7个小时,不过大多数人想睡得更多一些,但是一到晚上11点左右,体育频道的节目就开始了,视频网站优兔也在频频召唤,因此睡觉的事就往后推。拥有数十万名用户的可穿戴设备公司Jawbone进行了数千次测试,试图找到干预措施,以此来帮助其用户做他们想做的事:早点儿睡觉。
Jawbone双管齐下,取得了巨大的成功。首先,公司要求用户确立一个不那么雄心勃勃的目标,给他们发一条这样的信息:“看起来你最近三天都没好好睡觉,为什么不试试今晚11点半前就上床睡觉呢?我们知道你通常早上8点就起床。”这样,用户就可以选择回复“好的,就这么着”。
其次,10点半一到,Jawbone公司再发一条信息:“我们一致决定让你在11点半睡觉,现在已经10点半了,为什么不现在就上床呢?”
Jawbone发现运用这个策略可以让用户额外多睡23分钟。其实他们并没有使用户在10点半就上床睡觉,但确实让其睡觉时间提前了。
当然,这个策略的每一部分都必须通过大量试验进行优化。将最初的睡觉时间目标定得过早(要求用户在晚上11点前就睡觉),可能就不会有人愿意参与这个活动了。若是要求用户在半夜12点前睡觉,那这一策略就不会取得任何效果了。
Jawbone运用A/B测试为顾客找到了更多睡眠时间,其功用与谷歌右指向箭头可谓异曲同工。虽然没有为谷歌的广告伙伴赢得更多点击量,但是该公司为疲惫的美国人带来了更多休息时间。
事实上,整个心理学领域都可以用硅谷的工具来显著改进他们的研究。我非常期待第一篇心理学论文的发表,这篇论文没有详细介绍与几个本科生做的试验,而是展示了1 000项快速A/B测试的结果。
以往很多学者会历时数月招募为数不多的本科生完成一项测试,而今这种日子终于要结束了。取而代之的是,在短短数秒之内,学者就可以运用数字数据测试数百乃至数千个想法。我们将可以在更短的时间内收获更多。
文本数据可以教给我们更多东西。想法如何传播?新词如何产生?单词如何消失?笑话如何形成?为何有些话很好笑,其他话则不好笑?方言如何发展?我敢打赌,20年内,我们一定会对这些问题有深刻见解。
我认为我们可以将孩子们的网上行为(恰当地匿名)作为传统测试的补充,以此来查看他们如何学习、如何成长。他们单词拼写得怎么样?有阅读障碍的迹象吗?他们在培养成熟、益智的兴趣吗?有朋友吗?每个孩子每天数千次敲击键盘的行为中隐藏着以上所有问题的线索。
还有在另一个不那么重要的领域,我们会发现更多的见解。
在歌曲《支离破碎》(Shattered)中,滚石乐队主唱米克·贾格尔描述了让大苹果城——纽约市如此神奇的东西:欢声笑语、孤独寂寞、老鼠臭虫、骄傲贪婪,以及人们身上穿着的纸袋。贾格尔用了最具代表性的词来形容这座城市真正的特色:“性,除了性还是性。”
与大苹果城一样,大数据也是如此。多亏了数字革命,我们才能在卫生领域获得真知灼见。睡眠,学习,心理学,语言,性,性,性,还是性!
目前我正在研究的一个问题是:性的维度有多少?我们通常认为一个人不是同性恋者就是异性恋者,但显然性要比那复杂得多。在同性恋者和异性恋者中,每个人喜欢的类型各不相同。例如,有人喜欢“金发女郎”,其他人喜欢“深发美女”。对头发颜色的偏好与对性的取向一样强烈吗?我研究的另一个问题是:性取向从哪儿来?正如我们能弄清楚决定棒球“粉丝圈”或政治观点的关键年份一样,我们现在照样可以找到决定成人性取向的关键年份。要想找到这些答案,你必须购买我的下一本书,书名暂定为《人人都(还在)说谎》[Every body (Still) Lies]。
色情片的存在以及随之而来的数据,是人类性科学领域的革命性发展。
自然科学需要花费时日方可改变我们的生活——研制青霉素、人造卫星和电脑,这些无一不耗时费力。大数据可能还需要一段时间才能引领社会科学和行为科学在人类的爱情、学习、生活等方面取得巨大进步,但我相信,这种进步即将到来。我希望你至少能在本书中看到这种发展进步的轮廓。事实上,我也希望各位读完本书后能帮助推动这种进步的产生。
要想写好结论,作者应该想想为何写这本书。他想要达成什么目标?
我想我写这本书最大的原因是我一生中最重要的一次经历。十多年前,《魔鬼经济学》一书出版。这本出人意料的畅销书介绍了芝加哥大学一流经济学家史蒂芬·列维特的研究,本书曾多次提及这个熠熠生辉的名字。列维特是一位“离经叛道的经济学家”,似乎能够运用数据回答他那古怪头脑想到的任何问题:相扑运动员会作弊吗?游戏节目中的参赛者会受到区别对待吗?房地产经纪人会照实给你报价吗?
那时我刚刚大学毕业,大学期间主修哲学,压根儿就不知道自己将来想做什么。读完《魔鬼经济学》后,我有了想法,我想和史蒂芬·列维特做同样的事。我想研究海量的数据,来了解世界到底是如何运作的。所以,我决定跟随他的脚步,如今也拿到了经济学博士学位。
在这12年里,发生了很多变化。列维特的几项研究被发现存在编码错误。关于全球变暖,他发表了一些不正当的政治言论。
但我认为,抛开少数错误不谈,这些年来,列维特一直在努力做出更大的贡献。他一直在告诉我们,将好奇心、创造力与数据结合起来,可以大大提高我们对世界的理解程度。数据中隐藏着一些有待讲述的故事,这一点的正确性早已得到了一再的验证。
《魔鬼经济学》对我影响很大,我希望这本书能对其他人产生相同的影响。我希望对自己生活有困惑的年轻人现在正在阅读这本书。如果你有一点统计技能、丰富的创造力和好奇心,那就从事数据分析行业吧。
事实上,如果恕我斗胆,我倒觉得本书可以看作更高层次的《魔鬼经济学》。《魔鬼经济学》中讨论的各项研究与本书讨论内容的一个主要区别就是雄心不同。20世纪90年代,当列维特成名时,没有那么多数据可供研究。列维特引以为豪的是他一直在寻找古怪的问题,而这些问题中也确实存在着数据。他基本上忽略了没有数据的大问题。然而,今天的每个话题都有很多可用数据,对触及“作为人类意味着什么”这一话题的一系列重大而深刻的问题做深入研究也就顺理成章了。
数据分析有着光明的未来。我有强烈的预感下一个金赛会是一名数据科学家,下一个福柯会是一名数据科学家,下一个弗洛伊德会是一名数据科学家,下一个马克思会是一名数据科学家,下一个索尔克很可能也是一名数据科学家。
不管怎样,所有这些事情都是我为得到一个恰当的结论而做出的努力。我越来越意识到,要得出伟大的结论,还要做得更多。一个伟大的结论必须是具有讽刺意味的,必须是触动人心的,必须是既深刻又有趣的,必须是深沉、幽默而又悲伤的。一个伟大的结论一定是能用一两句话就说明要点,能概括过去和即将到来的一切的。一个伟大的结论必须用一种独特而又新颖的视角做到这一点,实现一种扭转。一本伟大的书必须以一种聪明、有趣且颇具煽动性的方式结束。
现在可能是谈论我的写作过程的好时机。我不是一个特别啰唆的作者,本书不过20余万字,对这样一个丰富的话题来说实在有点儿短。
虽然本书篇幅不长,但我下了很大的功夫。我花了5个月的时间才完成了自己第一篇《纽约时报》性专栏的文章,一共2 000字,光草稿就写了47份。本书的一些章节有60份草稿。我可以花费数小时,只为脚注中的某句话找到一个合适的词。
过去的一年里,我几乎成了一个隐士。陪伴我的只有电脑。我住在纽约最繁华的地段,却几乎没出过门。在我看来,本书就是我的巨著,是我一生中最好的想法。我愿意牺牲一切,只为让其完美呈现。我想要捍卫本书中的每一个字。我的手机里满是我忘记回复的邮件、从未打开的网上请帖和忽略的无聊短信。[4]
经过13个月的艰苦努力,我终于能够完成一份近乎完整的草稿了。然而,还差一部分:结论。
我向我的编辑丹尼丝·奥斯瓦尔德(Denise Oswald)解释,可能还需要几个月的时间,最有可能是6个月。在我看来,结论是一本书最重要的部分,而我才刚刚开始了解一个好的结论是什么样的。不用说,丹尼丝很不高兴。
后来有一天,我的一个朋友给我发了一封有关乔丹·艾伦伯格(Jordan Ellenberg)研究的邮件。艾伦伯格是威斯康星大学的数学家,他很好奇到底有多少人真正读完了书。他想出了一个绝妙的想法,利用大数据来进行测试。亚马逊报告了在书中引用各种名言的人数,艾伦伯格意识到,他可以比较在书籍开头和结尾部分的引用频率,这个比率可能提供了人们有没有读完一本书的倾向。按照他的方法,90%以上的读者读完了唐娜·塔特(Donna Tartt)的小说《金翅雀》(The Goldfinch)。相反,仅有7%的人读完了诺贝尔经济学奖得主丹尼尔·卡尼曼的巨著《思考,快与慢》。这一粗略的方法估计,不到3%的人读完了经济学家托马斯·皮凯蒂(Thomas Piketty)受到广泛讨论与赞扬的《21世纪资本论》。换句话说,人们往往不会读完经济学家的专著。[5]
本书的观点之一是,我们要紧紧跟随大数据,无论它把我们带到哪儿去,我们都要采取相应的行动。我希望大多数读者能抓住我的每一个字,然后努力找出一个模式,将本书的最后几页与之前发生的事情联系起来,找出其中关联,但是,不管我多努力地润色书中的内容,大多数人还是会只阅读前几十页,了解一些要点,然后继续他们的生活。
因此,我用唯一恰当的方法总结这本书:通过跟踪数据,了解人们实际上做了什么,而不是说了什么。我打算和一些朋友喝喝酒,不再跟这麻烦的结论较劲儿了。大数据告诉我,几乎没有什么人还在读这本书。