在终极的决赛中,萨拉赫罚入点球,替补奇兵奥里吉再进一球。
终极利物浦以2-0降服热刺,时隔14年再度登上冠军王座。
当地的利物浦球迷欢呼雀跃,马德里成了一片赤色的海洋。

而正如鲁迅师长西席所说,有比赛就有输赢,有输赢就有赌输赢的群众。

这些群众包括小智这样的普通球迷,还有足球博彩机构,乃至谷歌、微软等互联网巨子也曾来凑过热闹。

霍金的世界杯完美点球公式若何解读AI猜测球赛结果靠谱吗

而为了预测赛事的结果,大家又可谓是“各显神通”:有的追随专家剖析,有的靠自己做梦,还有的相信章鱼玄学······

章鱼保罗在2008欧洲杯和2010天下杯中,预测14次猜对13次,成功率达93%

作为一名精良的社会主义接班人,那些歪门邪道小智我当然是一个都不信的。
唯有科学的数据剖析和仿照,才算得上严谨的预测。

实在,早在前几届天下杯期间,各路Geeker就已经采取过各不相同的AI算法和特色数据,做过这样的预测考试测验。
乃至,著名物理学家霍金生前也曾研究过天下杯夺冠公式!
(公式将在文章后半段解读)

那么,各家预测的结果准确度如何呢?谁又是能够一措辞中的“神算子”?

AI预测输赢

我们先来看看一项在算法和数据方面都颇有代表性的实验,它是由来自德国和比利时的四位研究职员在2018年进行的。

实验中,他们利用自过去四届FIFA 天下杯(2002-2014)的所有比赛结果作为数据集,希望以此来预测2018年的冠军。

此外,他们还考虑了许多干系的特色,比如

经济成分(国家人均GDP、人口数量等)

运动成分(ODDSET 概率,FIFA 排名等)

主场上风(主理方、大陆、联邦等)

团队构造(军队中同一俱乐部队友的人数、队员均匀年事、参加冠军联赛的球员数量等)

教练成分(教练的年事、任期、国籍)等等。

研究职员认为,这些成分看似没有直接决定赛事的结果,但很随意马虎影响球员和军队的整体状态,因此很有必要纳入考虑。

在算法上,他们采取了随机森林算法(Random Forest)。
这一基于决策树的算法是机器学习的一个主要分支,并且具有很高的准确率,在许多数据分类任务中都曾表现出精良的性能。


末了,经由10万次赛事仿照,研究团队预测出了夺冠可能性最高的前三名,分别是西班牙队( 28.9%)、德国队(26.3%)和巴西队(21.9%)。

打脸来得太快就像龙卷风

万事俱备,就只等终极的结果验证了。

不久之后,激动民气的时候到了——2018年俄罗斯当地韶光7月15日,在终极的天下杯决赛中,法国队夺冠。

2018年俄罗斯天下杯法国队夺冠

而回过分来看研究职员先前的预测结果,可以说是错到离谱了——他们押宝的西班牙队和德国队在实际比赛中乃至都未能进入四分之一决赛,末了夺冠的法国队在他们之前的预测中也仅排名第4。

预测名次&实际名次

再看赛前积极预测的各家机构,终极结果也基本是不同程度的打脸,准确率稍高一些的,也并没有超过章鱼保罗的。

这样的结果让人倍感困惑:只管拥有适当的数据类型、数据体量,利用了参数精确的精良算法,那为何这些演习有素的模型终极仍会失落败呢?

为什么不灵?

实在,失落败的缘故原由就在于我们所预测的工具——足球比赛,在各要素的维度上都并不是一个有规律的事宜。

和其它以人为重点的事宜一样,足球比赛在赛前和赛中都有太多让人无法判断是否确实干系的影响成分,也便是所谓的稠浊变量。

而场上每分钟(乃至每秒钟)的状态,都取决前一分钟(前一秒钟)的状态。
这种马尔可夫链过程又意味着,要把数据集中每场比赛的每一分钟都仿照出来,才能得到相对准确的模型。

马尔科夫链的定义:事宜某一时候的状态只取决于它在上一时候的状态。
图为运用了马尔科夫链的景象预测过程。

除此之外,比赛结果还可能受到一些外部成分影响,例如景象、政治情形、地理成分,乃至某个球员前一晚没睡好都可能会影响整场比赛的结果走向。
而这些主要特色常日都很难被网络和衡量。

更何况,还存在意外发生的可能性,例如一个致命失落误或意外进球,都是无法预测的。

简而言之,像足球比赛这样以人为主的活动,是当下的AI技能还无法很好驾驭的领域。

这也是为什么小智说,足球比我女朋友都难猜——足球的结果跟一大票人有关,而我女朋友的心思只跟她一个人······咦,我女朋友呢?

霍金“完美点球公式”

对付足球比赛结果的不可预见性,著名物理学家霍金彷佛比我们更早地创造了。
不过,这并没有妨碍他对足球运动的热爱。

公式发布现场

这位著名的物理学家曾在公开场合多次参与天下杯冠军的预测,乃至还娱乐性地自创过一套“完美点球公式”。

个中,X0是一个已知变量

罚球队员是前锋,则α1=1;是后卫,则α2=1

罚球队员瞄准球门左边,则β1=1;瞄准右边,则β2=1

罚球队员的头发颜色为淡黄色,则δ=1

罚球队员瞄准球门上1/3,则θ1=1;瞄准球门下1/3,则θ2=1

罚球队员用脚的侧面踢球,则ε=1

罚球队员不助跑就直接踢球,则η=1

除此之外,霍金还合营着这个公式做了一些数据解读:

“我研究了1978年天下杯以来的所有点球,得出了‘完美点球公式’。
紧张是由于英格兰球员准头太差了,他们用铲子都打不到牛屁股······(这也便是他搞出这个公式的缘故原由:被英格兰历史上的那些失落败点球蠢哭)

首先,速率是关键,必须跑三步以上,把速率提起来。
只跑三步或者更少步数的球员,他们的点球命中率只有58%,远低于均匀水平的87%。

利用脚侧比正脚背能赶过10%的命中率。

把球踢向旁边两个上角更随意马虎罚进点球,成功率高达84%。

用左脚还是右脚对结果没有什么影响。

前锋比后卫和中场球员更随意马虎进球。

金发球员和秃顶球员的命中率更高,金发球员的命中率高达84%,秃顶球员71%的命中率也高于深色头发球员的69%,但我不清楚缘故原由是什么。

对付守门员,跳来跳去分散主罚者的把稳力,将会提高18%的扑救成功率。

看完以上信息,你是不是和小智一样以为一脸懵逼?这个公式连带公式的阐明,无论怎么看都让人以为槽点满满。

不过,这本来也不是真正的科学研究,霍金曾表示“和足球比较,我认为量子物理相对而言更直接一些。

而所谓的“完美点球公式”,也只是老顽童跟大家开的一个玩笑,顺便怒其不争地调戏一下自己祖国的英格兰队,毕竟“爱到深处自然黑”。

思念这位可爱的伟人

当然,在足球赛结果预测中的失落败并不虞味着AI在“预测”这件事上毫无用途。
例如对单个球员的跑步间隔、速率、加速度、减速率、负荷和心率等等数据来进行研究,以预测运动员在某场比赛中的场上表现,这样得出的结果就比较具有参考代价。

毕竟AI只是一种工具,我们如何利用、在若何的条件条件下利用的这种工具,才是决定其代价的关键所在。

皮一下

实在我挺信“霍金点球公式”的,它的大概含义便是:英格兰靠点球夺冠的概率约即是0·······