费曼曾经写道:
假如由于某种大灾难,所有的科学知识都丢失了,只有一句话传给下一代,那么怎样才能用最少的词汇来表达最多的信息呢?我相信这句话是原子假设:
所有的物体都是用原子构成的——这些原子是一些小小的粒子,它们一直不停地运动着。当彼此略微离开地时互相吸引,当彼此过于挤紧时又相互排斥。
我用同样的方式来思考,假如我只能交给自己的孩子一种思维,或者能力,那是什么?
我的答案是:闭环认知。
姑且视之为我对“底层算法”的一种简单化探索。
先让我们找到基本单元。就像找到一只蚂蚁,或者一个神经元。
先建立一个模型:认知闭环的基本单元。
由人行为的原理可知,人的行为的过程主要由人对环境信息的获取 、感知 、处理和输出组成 ,即感知 、认知和决策以及行动的过程。
我们思考一个问题,做一件事情,开展一个项目,都需完成如上这个认知闭环。
我们的每天、每年、此生,都是有无数个或完整、或残缺的该基本单元链接构成。
该闭环由4个节点构成:
感知-认知-决策-行动。
这也是人工智能的运作模式。
四个节点
节点一:感知
知觉或感知(英语:Perception)是外界刺激作用于感官时,脑对外界的整体的看法和理解,它为我们对外界的感觉信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取感官信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。
节点二:认知
认知或认识(英语:cognition)在心理学中是指通过形成概念、知觉、判断或想象等心理活动来获取知识的过程,即个体思维进行信息处理(information processing)的心理功能。认知过程可以是自然的或人造的、有意识或无意识;因此,麻醉学、神经科学、心理学、哲学、系统学以及计算机科学在分析认知时,其分析的聚焦点以及脉络是不同的。
这里的认知,是指对不同方案与选择的量化评估过程。
节点三:决策
在心理学中,决策(英语:Decision-making),是一种认知过程,经过这个过程之后,个人可以在各种选择方案中,根据个人信念或是综合各项因素的推理,决定出行动,或是决定出个人要向外表达的意见。每个决策过程都会以产生最终决定、选取最终选择为目标。而这些选择的形式可以是一种行动或选取的意见。
决策者做决定之前,往往面临不同的方案和选择、以及有关其决定后果的某种程度上的不确定性;决策者需要对各种选择的利弊、风险做出权衡,以期达到最优的决策结果。
节点四:行动(行为)
行为是指有机体(包括人类与其他动物)的动作、行动方式,以及对所处环境与其他生物体或物体的一种反应。词性为中性。在生物适应环境上,行为有很重要的意义,有助于避免受到负面的环境因素所影响。
对动物而言,行为可以是有意识或无意识的,可以是自愿也可以是非自愿的。而且是受到内分泌系统与神经系统的控制。一般认为行为的复杂度和生物体神经系统的复杂度有关。若生物体的神经系统越复杂,越有可能学习新反应,调整其行为。
一个内核
当闭环能够完成,并且形成正反馈循环,便形成了某个“内核”。
成功的创业公司,都是因为其找到了一个可以复制的秘密。
这就是巴菲特所谓的滚雪球。所谓:人生就像滚雪球。最重要之事是发现足够湿的雪和长长的坡。
“坡”是核心算法,“湿雪”是大量可重复的动作,滚雪球,即有效的、可重复、可持续、自我强化的学习。即,重复是具有滚雪球效应的。
好的商业模式,就是找到可以笨办法重复的聪明事,或者是用聪明办法重复的笨事。
一个外环
作为被广泛认同和应用的成功学方法论,以“欲望、财富、智慧、时间”为元素,从山坡上自上而下滚动的雪球,是当下中国人至为追求的“既能自动发生、又可以无限大”的完美人生境界。
然而,真的有所谓滚雪球吗?墨菲定律总是会致力于拖一切愿望的后腿,宇宙间存在一种力量,处心积虑地打翻你的牛奶。哪里会有坐着滑梯就把钱赚了的好事呢?
本·霍洛维茨说:“在担任CEO的8年多时间里,只有3天是顺境,剩下的8年几乎全是举步维艰。”
他是硅谷顶级投资人,与网景之父马克·安德森联手合作18年。2009年创立风险投资公司A16Z,被外媒誉为“硅谷最牛的50个天使投资人”之一,先后在初期投资了Facebook、Twitter、Groupon、Skype,是诸多硅谷新贵的创业导师。
看似一直在滚雪球的硅谷超一流的大师,何以抒发西西弗斯般的感慨?
回到滚雪球的巴菲特,他一生如苦行憎般专注于投资,几乎没有任何个人爱好。他又何尝不是一个西西弗斯?
西西弗斯神话,象征永不停息而又毫无意义的劳作,如不断往山上推却又滚落下来的巨石。加缪用来比喻生命本身,借此他引入了荒诞主义哲学,认为生命没有意义,除了我们构建出的价值外没有价值。
试图取得世俗成功的人们,要克服:
1、将不断滚下的石头推上山之疲惫;
2、心底之虚无和厌倦。
滚雪球和推石头,也许是一件事情。
当你的能力,不是由两种或以上对立的能力组合而成,就不是一种真正的能力。
在这个模型里,雪球和石头,通过齿轮咬合在一起:
- 有时候石头靠雪球自上而下势能的转换,本身得以强化。
- 有时候雪球的斜坡突然变成了需要攀登的山峰,这时,西西弗斯的经验,以及对待苦难的心灵力量凸显出来,帮助雪球逆势而上,直到发现下一个巨大的斜坡。
西西弗斯的永无停息的劳作,构成了“操作性认知系统”的外环。
西西弗斯的力量,对企业而言,是:
- 价值观;
- 愿景;
- 使命。
这力量帮企业走出迷雾,在看不到方向时指引他们,在陷入泥潭的时候激励他们,在充满恐惧时拥抱他们。
对人而言,是:
- 强烈的动机;
- 一个人的目标和愿望;
- 一个人的心流。
这个模型的价值比看起来有趣、有意义的多。
我们由此可以解释很多让你困扰的问题。
例如,你会发现,要取得世俗的成功,关键在于让一个内核滚动起来。内核的大小并不重要。
这种成功常是突如其来、跌跌撞撞、不符常理的。
实现这一点,很多时候与智商无关,和勤奋也无关,那和什么有关呢?我在后面尝试着给出了一个内心诚恳、形式游戏的“九段体系”。
我们可以用这个闭环系统做什么呢?
一、解析问题
人生的主要问题,都能在这个4+2的模型中找到解释:
1、节点问题
即:在“感知、认知、决策、行动”这四个节点上出现了问题。例如缺乏感知力,不懂得概率思考的认知方法,决策困难,光想不行动。
2、链接问题
作为一个闭环系统,我们需要将四个节点串起来。问题往往出现在链接(红色箭头)部分,例如:习得性无助、认知失调、明知故犯、屡教不改。
在不同的节点之间,大脑要么做得太多,夹带了自己的私货,该理性时不理性;要么做得太少,不能够坚定发出明确的指令,或者被某些其它指令干扰、削弱。
例如:在感知环节,感觉敏锐经常是个优点。但是不能带到第二个环节。因为认知需要理性,需要第一个环节提供客观的数据,而非喧宾夺主的体验,否则会极大伤害认知过程。
3、核心算法问题
不能形成一个核心算法,不能找到自己的模式,本质上缺乏自我学习能力。
4、外环问题
没有外环,来对抗未知、不确定性、恐惧、疲惫。
二、发现症结
如果知道问题发生在哪里,以及为什么会发生,能帮我们在大脑深处找到问题的原点。
- 你的问题出在某个“节点”,那么你在另外一个节点无论多么用功,对于整个体系也无济于事。例如,有些人有决策障碍症,所以不管他如何勤奋阅读,提升自己的“感知”能力,也无济于事。
- 若你的问题出在“链接”部位,例如你是一个认知失调症患者,你有很好的感知,你还是一个认知高手,你能算出每一种选项的预期收益,知道最好的选项,但你就是无法正确地行动。那么,不管你在“节点”如何下功夫,也是白搭。
- 或者你就是没法形成自己的“内核”。你无法界定自己的能力半径,不知道该专注于何处。你广泛学习,无所不通。任何一个节点都无比强大,哪一个链条都不掉,但总是如猴子掰玉米般,落后在你的那些笨同学的后面。你不能找到自己的雪球,不能享有时间的复利、和地心引力的拥抱。
- 又或者你足够聪明,又足够理性,而且幸运地发现了自己的内核。然而你敏感的内心无法穿越黑夜,你在巨大的不确定性间窒息,每个逆向的人、事、话语,都如冰雹般砸向你。你像一个后悔的登山者,在暴风雪中懊恼:我干嘛要来受这个罪呢?--是的,这时你需要是西西弗斯。
经过上面这些繁琐的论述和推理,你会发现,日常你看到的大多数答案,通常都是错误的。一些漂亮理论或者观点的论述者,其实也不知道自己在说什么。但却能制造一种解决问题、完善自我的错觉。
这就是为什么你我总是原地打转,甚至开始被时光抛下。
三、修补大脑
例如:由于进化,我们的大脑已经变得适于产生连续不间断的故事。大脑喜欢虚构。把不相干的感知的东西和想法捆绑在一起。
对大脑的这种习惯,我们既要克服,又要利用:
在节点上,我们要学会stop,仔细想,客观思考;
在整体系统上,我们需要学会讲故事,一个足够宏大的故事,在5-10年内,引导自己,引导他人。
大脑是通过基本单元的网络化,来实现强大功能的。我们的“闭环认知”模型,正是试图构建一个思考与行动的基本单元,进而探寻其滚动、复制、关联后的力量与秘密。
四、强化作用
认知闭环,像是一个“操作性认知系统”。“操作性”这个词,来自斯金纳。某种意义上,也像一万小时理论里的“刻意训练”。
斯金纳认为,人类向来珍视的“自由意志”其实并不存在。他主张通过正强化作用来训练人类或动物完成指定的任务,即所谓的“操作性条件反射”。
作为一名有争议的科学家,斯金纳观点是:心理学应当着重于可计量的具体行为,至于虚幻的心智或难以捉摸的唯心论,根本无足轻重。
为什么我们做出许多蠢事,即使得不到回报,仍旧执迷不悟?为何女性总是爱过头?男性总喜欢玩儿股票?斯金纳让我们知道,都是因为:间歇强化。
曾经梦想当文学家的斯金纳,在大量的实验后,开始痛恨某些字眼,如:觉察,感受,恐惧。我们所谓的恐惧,不过是皮肤出现如触电般的反应及不由自主的肌肉颤动。
斯金纳的两个关键词:客观无情,强化作用。
客观无情:情绪都是假的,绝大多是时候会干扰认知,影响判断;
强化作用:以正强化原理,能够有效控制人的行为,强化人的某些能力。
五、学习系统
尽管大脑的总体线路图已被遗传密码所决定,但大脑的精细线路可被经验修改,这就允许突触强度和联系可由经验而改变,即所谓的突触可塑性。
人脑具有两大学习系统:
1、基底神经节。由绵密网状的神经突触构成,位于脑部深层,是脑部较早发育部分,掌管习惯的成形;
2、前额叶皮层。一大片布满皱褶的凸起部位。个体思考或产生情绪时,此区域会随之抬升。神经学家推断,前额皮质区主管人类独立撕开、相像、根据过往经验拟定计划的能力,创意及后续实际行动就源于此区。
部分认知是后者,多数则是习惯驱使。
本质上,并无“模式”这类雪球。滚雪球,其实是指一种学习系统。
3G资本的雷曼说:
“你必须不断地冒险。你唯一的办法就是不断地练习。早年,我在海浪中和网球场上练习。后来,我在生意场上练习。”
巴菲特自打耳光,买航空公司和苹果也是一次自我认知的刷新。如何解释这一点呢?一方面,你需要不断学习;另外一方面,你需要一个一以贯之的强大愿景,来支撑自己前后不一致的不要脸。
动机+专注+学习,几乎是所有强者的共同秘密。
回到我们的模型:
1、阿尔法狗的每一次自我对弈的数据,都能生成新的感知;
2、核心是其算法,该算法通过滚雪球式的强化学习,令AI越来越强大;
3、红字部分的人类弱点,阿尔法狗完全没有;
4、黄线部分的西西弗斯,阿尔法狗天生就是;
5、它正是斯金纳眼中“客观无情&强化作用”的完美造物。
如我所言,牛人牛企,大多是一个人肉阿尔法狗。有些人的天赋,例如超级理性,其实是人格缺陷。我们也没有必要苛求自己变成超人。
如这两年红火的巴西3G资本,其公司强调“找到差距”和“弥补差距”,这就是企业的强化学习。他们追求“永不知足”,Go extra mile,这就是AI的不断重复。