• 精选
  • 会员

股票机器人

2020年7月9日  来源:财富的起源 作者:埃里克-拜因霍克 提供人:kangtao76......

我们可以看到个人如何创建青蛙捕捉苍蝇的模型,那霍兰德及其同伴的归纳模型应该如何应用到人们的经济决策过程中呢?在1987年圣塔菲研究所的经济会议后不久,霍兰德开始与布莱恩·阿瑟合作。尽管阿瑟是一位学者,但他在职业生涯的早期就投入了商业领域,攻读硕士学位期间在麦肯锡公司待过一段时间。他亲身见识过现实世界里的决策过程,它与经济模型里冷冰冰、干巴巴的完全理性截然不同,因此他对于寻找一种更好的表达方式产生了持久的兴趣。霍兰德与阿瑟决定组成团队,将霍兰德的理念应用到股票市场行为的模型构建中去。他们同布莱克·勒巴伦(Blake LeBaron)、理查德·帕尔默(Richard Palmer)、保罗·泰勒(Paul Tayler)共同构建的“圣塔菲研究所人工股票市场”模型已经成为复杂经济学文献里的一个经典。41

跟通常的归纳模型一样,圣塔菲研究所模型里的行为主体被视作信息处理的实体,它们本质上是小型的电脑程序。这些行为主体会从周围的环境中收集信息、处理信息、产生决策,然后接受环境对这些决策的反馈。

与糖域中的行为主体一样,人工股票市场模型里的行为主体也会受到进化力量的影响。就像大多数取得经济成就的糖域行为主体能够生存和繁衍一样,在圣塔菲研究所的股票市场模型中,最成功的股票交易行为主体会得到回报,而最落魄的行为主体则会破产和出局。阿瑟、霍兰德及其同事在他们的模型中增加了第二层次的进化。在人工股票市场模型中,行为主体的大脑也在发生进化,使得它们能够学习。

为了弄清其中的过程,我们可以假设你买彩票中了一笔不大不小的奖金,然后希望将它用在投资上。你给股票经纪人打电话,寻求一些关于投资策略的一般性建议。经纪人为你提供了一些经验法则,例如“买入并持有是最佳的长期投资策略”,“永远要确保你的投资组合是多样化的”以及“注意市盈率远高于同领域其他股票的股票”。不过,你决定多找几位经纪人问问。你又给其他几位经纪人打了电话,还有你的叔叔以及几位你觉得应该问一问的朋友。很快,你得到了一堆关于投资的建议,其中有一些是相互矛盾的。你的下一步工作是要将浮在脑海中的这些潜在策略整理一下,看看下一步该如何行动。

在这个场景中,市场上存在两个级别的竞争。首先是投资策略的一般性竞争:成长型投资者和价值型投资者、牛市和熊市,究竟谁的表现更佳?其次是你脑海中相互矛盾的潜在投资策略对于你注意力的争夺:在经纪人和叔叔赫比之间,你应该听从谁的建议?阿瑟和霍兰德推测,这两种竞争将会遵循进化式的学习过程。

为了探究这一观点,阿瑟、霍兰德及其同事在电脑上搭建了一个模拟交易环境,里面只有一支股票,而且分红是随机的。随后,他们又创造了100位进行交易的行为主体,行为主体可以买进和抛售股票。股票的价格由市场上的行为主体的买卖决定。每一位行为主体都有一个简单的目标,那就是尽可能多地赚钱,为了实现这个目标,每一位行为主体都要决定何时买入以及何时抛售。行为主体们可以获得三类信息以便进行决策:股票的历史价格模型、股票的历史分红以及无风险利率。接下来,阿瑟、霍兰德及其同事就要决定如何让行为主体处理信息并作出决策。

跟青蛙的案例一样,研究者们使用条件-行为规则将市场中的模型映射到行为主体对股票价值的预期上。比如,有的规则可能是“如果价格在上一周期上升5%,那么预计下一周期的价格将在本周期的基础上再涨5%”。遵守这一规则的行为主体仅仅通过比较预测价格与当前价格就能决定是买还是卖;如果预测价格上涨,行为主体将买入;如果预测价格下跌,行为主体将抛售。这样结构的规则也有可能被设置得非常复杂:“如果价格在过去三个周期中都在上涨,并且价格不高于股息与无风险利率之商的16倍,那么预测下一周期的价格加上股息等于当前价格加上股息的106%。”行为主体所使用的经验法则可以基于基本原理(例如在某个市盈率范围内买入股票),或基于市场趋势(例如在价格上涨时买入股票),抑或是基于两者的综合。在模型中,规则的复杂程度不受限制。

就像我们假设中彩票的人要对相互矛盾的股票建议进行整理,模型中的每一位行为主体都不只拥有一条经验法则——阿瑟和霍兰德为每一位行为主体配备了100条经验法则。在对比哪条假设能够带来股市上的成功时,行为主体的软件“脑袋”里会出现100条规则。也就是说,每一条规则都是一种潜在的投资策略,而行为主体的工作是要厘清属于他的一套潜在策略,然后找到哪些策略能够帮助他赚钱。接下来的问题是,行为主体是如何对他的100条相互抵触的投资策略进行分类的呢?答案相当简单:跟青蛙克米特一样,行为主体利用的是在过去起作用的那些规则。

阿瑟和霍兰德设置了一套在行为主体大脑内发挥作用的进化流程。每一条条件-行为规则都被编码为一连串的1和0,我们可以把这些字符串当作电脑的DNA,它们代表着各不相同的投资策略。因此,011000100101有可能代表着“如果在过去5个周期中,股息平均下降了10%,那么预测价格将在下一周期下降2%”,而100011010101有可能代表着“如果无风险利息高于股息3倍,那么预测价格将在下一周期上涨5%”。如此一来,每一位行为主体在其软件大脑里都有一堆投资策略DNA。每一个策略DNA都被赋予了一个适合度评分。如果某个策略让行为主体赚到了钱,它的适合度评分就会增长;如果某个策略导致行为主体亏了钱,它的适合度评分就会降低。

在每个回合的游戏中,各个行为主体都会经历以下流程。行为主体被告知关于历史股价、股息和无风险利息的信息,随后,行为主体将这些信息与潜在策略和模型仓库进行对比,寻求匹配。如果可匹配的规则不止一条,行为主体将会查看分数并选择分数更高的那条。因此,在过去行之有效的规则的利用率往往更高。在应用规则后,行为主体将会观察它是如何发挥作用的——是赚钱还是赔钱?如果行为主体能够赚到钱,就会进一步强化规则;反之,规则将被削弱。

至此,我们就拥有了一个可以通过固定数量的规则进行学习的系统。假设每位行为主体起初都拥有100条随机构建的规则。行为主体使用上述系统,经过试验和犯错,最终会学习到哪些规则能帮他赚钱,哪些不能。但在现实的股票市场中,人们一直在不断创造新的投资策略,那么我们该如何让模型行为主体进行创新并创造新的规则呢?

阿瑟、霍兰德及其同事在模型中构建了以下流程。在并不一致的时间周期中,每位行为主体的100条规则将会经历一个进化流程:表现较差的20条规则会被消除,新的规则会被创造出来以填补空位。表现更好的另外80条规则的电脑DNA的单个元素会发生基因突变。比如,某个1会随机变成0,或者反过来。其余的某些策略则会以“电脑婚配”中进行重新组合。某个DNA字符串会在某个随机的时间点分裂成两份,并与其他分裂成两份的字符串结合,从而产生新的字符串。基因突变和重新组合的作用在于为行为主体的100条规则池创造出新的策略。许多新规则是无厘头的,甚至是有害的,有些则是成功的创新,甚至比其他在市场上发挥作用的策略还要成功。

随着归纳式股市准备就绪,阿瑟、霍兰德及其同事启动开关,进行了一系列实验。在运行完全模型(每位行为主体拥有100条规则)之前,他们进行了一次实验——每位行为主体都只有唯一一条相同的规则(即完全理性),并且学习能力为0。42这轮实验的结果与传统经济学的预测十分相似。模型很快就在一个接近于理论均衡价格的数值上稳定下来,这个价格与股票的基础价值相当。此时只有很少的交易量或波动,没有人能比其他人赚到更多的钱。这个实验表明,如果每个人都按照(或接近于)传统理性模型行事,结果就会与传统理论所预测的相差无几。

随后,他们又进行了第二轮实验——激活每位行为主体“脑中”的100条规则,在初始化时为这些规则赋予少量随机的策略,并且将学习能力提高到0以上。这些设置对模型的行为产生了巨大影响。随着时间的推进,交易量上升,波动幅度增大,股价的动态变得更加复杂,其中还包括泡沫和崩盘。市场状况也变成了一段时间静止与一段时间风雨满楼相交织的模式。此外,行为主体的相对表现也出现了巨大差异,部分沃伦·巴菲特式的、表现超级优异的行为主体开始展露光芒,而另一些则陷入了破产的泥潭。正如我们将在第17章看到的那样,真实的金融市场与这种景象更为接近,而不是像传统经济学所预测的那样静止。

结果变得更加动态、更加接近现实市场的原因如下。如果每一位行为主体在开始时拥有同样的完全理性,并且由于不会学习一直保持着这种状况,那么市场就会缓慢向前,价格大致维持在均衡状态。一旦引入了规则的多样性以及学习,情况就会变得更加复杂。假设因为某些原因,股票价格开始上涨。行为主体中的部分成员拥有积极的规则,他们寻求股票价格的上涨然后买入。当价格上涨,就会有越来越多这样的参与者涌入,造成价格越来越高。而另外一些参与者会关注基本价值,到某个点就会抛售,因为他们认为股票估值已经过高。如果有足够多这类行为主体瞬间涌入,就会导致股票价格低迷,从而激发那些遵循在股票价格下跌时抛售规则的参与者涌入。随着越来越多的参与者想逃离出场,股价就会快速下跌。新的规则甚至有可能进化到寻求这种起起伏伏的模型,以便从中获利。价格变动是由不同规则的动态互动而驱动的,与股票潜在经济价值的关系甚小,甚至毫无关系。复杂模型也不是仅仅由于随机噪音而导致的。行为主体的脑中时刻进行着一场关于信念的复杂斗争,这才是导致市场波动和复杂模型形成的根源。在第17章,我们将进一步探索不同类型的行为主体之间如何竞争,研究他们的策略或许会对市场行为的某些重要方面产生影响。

-----------

在经济的复杂适应系统中,理解个体的微观行为对于理解系统的整体行为非常关键。在过去100多年的时间里,经济学家都在用他们的人类行为模型勉强对付——这在今天的大多数经济学家看来都是过于简单、在根本上存在矛盾的,仅仅是为了在数学上容易处理。如今,物理学家、计算机科学家和认知科学家的合作产生了一种新的经济人模型。这种新模型将人类描绘成归纳式的理性模式识别者,他们能在模糊和快速变化的环境中作出决策,并且能够不断学习。同样,真实的人既不是纯粹的利己主义者,也不是纯粹的利他主义者。他们的行为是为了激发社交网络中的合作行为,奖励合作者并惩罚“搭便车”的人。我们当中没有人是完美的,任何人都有着缺点和偏差。

然而,还有人对完全理性进行着最后的辩护。有人或许会说,只有一条道路可以通往完全理性,至少经济学家有着一个标准的、广受认可的方法来为行为构建模型,哪怕它是有缺陷的、简化的。归纳式理性甚至还做不到这一点。认知科学仍然处于婴儿期,尚未找到一个广受认可的方法。尽管如此,我仍然认为,使用一个与我们所知的事实相符的模型胜过于使用已知是错误的模型。此外,世界上也许永远不会存在一个能够满足所有目的的经济人。股票市场所需的简化版行为假设也许同微观经济学模型所需的不一样。在这里,我想重申的一点是,如果有人认为理论好比地图,那么抵达经济人的不同道路至少应该是互不矛盾的,并且与我们所知的真实人类行为一致。与此同时,认知科学将会继续按照其自身的节奏快速发展,建模技术将继续提升,而经济学永远不会成为“心理历史学”,我们将对行为如何驱动经济这一问题获得比如今更深刻的理解。

归纳推理 / 行为主体 / 决策

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000