模拟分析:现实的实力—运气分布比例
评估实力和运气在一项活动中所占的比重,首先就要分析出当运气占100%时可能的结果,以及实力占100%时可能的结果。然后通过对收集的数据进行分析得出此项活动在实力—运气连续体上的位置。
这种方法的适用范围很广,在体育运动上更是简单明了。我们看下布莱恩·伯克对国家美式橄榄球联盟(NFL)球员成绩的一项统计。[10]国家美式橄榄球联盟有32个球队,每队要打16场常规赛。如果橄榄球是一项纯运气型运动,而且每队的表现类似,那么输赢的分布如下图4-2。横轴表示赢的
图4-2
运气因素100%情况下国家美式橄榄球联盟的统计分布
来源:作者分析场数,纵轴表示赢的概率,即赢相应场数的球队所占的比例。比如说,赢八场比赛的球队占总球队的20%,而一场没赢或场场都赢的球队几乎没有。
接下来,我们要考虑实力因素占100%时,输赢的分布情况。先给32个队从1到32编下号,号码越大代表实力越强。所以如果编号大的队和编号小的队比赛,前者会稳稳得胜。
之后,我们模拟一下国家美式橄榄球联盟的比赛日程,用调度演算法将联盟内的比赛和联盟外的比赛随机结合。我们统计了5000个赛季的比赛情况,模拟分析成绩的分布,见下图4-3。比赛成绩大致呈水平线分布,只在两段有略微下沉(即一场没赢或场场都赢的球队几乎没有)。
图4-3
实力因素100%情况下国家美式橄榄球联盟的统计分布
来源:作者分析
下面我们要看一下国家美式橄榄球联盟的实际成绩分布。我们收集了自2007年到2011年五个赛季的成绩,其分布情况如图4-4所示。目前,我们有三个分布图:运气因素100%分布;实力因素100%分布;实际比赛结果分布。
图4-4
国家美式橄榄球联盟的实际统计分布
来源:作者分析
现在我们可以比较下三个分布图。首先比较的是实际比赛成绩分布和运气因素100%分布(图4-4和图4-2)。我们可以清楚地看到分布图正中间也就是最高点,图4-4低于图4-2,说明16场比赛赢了8场的球队在实际比赛中比运气因素100%情况下的球队数量少。而分布图两端也就是最低点,图4-4高于图4-2,说明一场没赢或场场都赢的球队实际比赛中比运气因素100%情况下的球队数量多。接着我们比较一下实际比赛成绩分布和实力因素100%分布(图4-4和图4-3),可以清楚地看到分布图正中间也就是最高点,图4-4高于图4-3;而分布图两端也就是最低点,图4-4低于图4-3。
最后,我们要将实力因素100%和运气因素100%的分布按一定比例结合,模拟出实际情况下的分布。图4-2和图4-3,分布图正中间和两端可以互相补充,达到实际分布水平。
实力和运气各占多大比例呢?我们可以设运气占的比例为p。如果一个赛季的实力因素为0%,那么p=100%;如果一个赛季的实力因素为100%,那么p=0%。如果实际的比赛既有实力因素,也有运气因素,那么实力比例为1-p。找到符合实际比赛成绩的p值,就知道了此活动在实力—运气连续体中的位置。
经过模拟分析,符合实际比赛成绩的p值为48%(见下图4-5)。这说明橄榄球比赛中实力因素比运气因素仅仅高4%。当然,这种模拟分析并非尽善尽美,也会忽视一些情境因素如场地优势、特定球队比赛等的一些细节。但是电影《挑战星期天》[11]中的一句经典台词让我们明白,在国家美式橄榄球联盟,颠覆性的比赛结果早已司空见惯。
图4-5
实力、运气配比图
来源:作者分析
布莱恩·伯克说,如果在橄榄球中运气因素占48%,那么估分的模型对比赛结果预测的准确率会高达75%。这和电脑模型预测、赔率制定者的结论是一致的。
模型分析的方法很适合体育运动,因为体育运动的结果是二元的——输和赢,得出实力—运气连续体两个极端的分布情况图也很容易。但在商业和投资等领域,我们就无法确定实力—运气连续体两个极端是怎样的了。模型分析为我们提供了一个评估结果的好方法。许多情况下,我们要问问自己,除了运气因素外,还有其他因素足以解释实际的结果吗?