从陪练到寻衅星际争霸里的人工智能正在崛起｜AI简史

量子位出品 | 公众年夜众号 QbitAI

2009年8月，美国加州。

阿纳海姆会议中央的暴雪嘉年华上，尚未正式发布的RTS游戏大作《星际争霸II》举行了试玩活动。

在活动2区，一位战网ID为Xyrin的玩家分别用三种不同的种族与电脑进行了对战。
而在游戏行将结束时，他惊奇地创造，电脑一方竟然打出了GG。

从陪练到寻衅星际争霸里的人工智能正在崛起｜AI简史

那或许便是它第一次给人类留下印象。

但事实上，彼时的它，只是暴雪为提升游戏体验所制造出来的一个附赠品。
在玩家眼中，它是陪练，是作弊者，是冷漠无情的行尸，是注定被消灭的猖獗。

它是为《星际争霸》而设计的AI。
后来，它有了些不一样的故事。

初生

1998年3月31日，《星际争霸》正式发布。
此后不久，这款游戏有如狂风一样平常席卷了全体电竞圈。

如果说《沙丘2》是RTS游戏的鼻祖，那么《星际争霸》便是将RTS带向顶峰的神作。
在这款当年销量最高的RTS游戏中，无数玩家从芬尼克斯在艾尔行星地平线上的身影中遇见了自己，在冲向母巢的战舰中找到了家园。

只管线上的PVP对战足够激烈，又或许正是由于这种激烈，有相称一部分玩家彷佛更乐意选择在游戏中添加“电脑”，作为自己的对手。
而那也是它最初的样子。

当时，星际AI的形态更靠近一个在本日看来有些粗糙的有限状态机。
它会利用游戏内部的底层数据，在提前编写完成的规则下进行有限的动作。

虽然对付新手而言，这种“洞悉全图”的AI仍旧具有不小的寻衅性，但固定的行为模式一旦被玩家摸透并加以克制，便再无翻身可能；有时，它还会自己涌现令人啼笑皆非的bug。

事实上，在这类RTS游戏中，“电脑”不单单是玩家用来演习操作技能的工具，在某种程度上，它也是一种衡量实力的指标。

一段韶光里，顶尖的业余玩家会以能够单挑7个“电脑”对手取胜为荣，而别的的玩家则会想尽办法为达成这样的目标而努力。

只管会随着新游戏版本的不断推出而同步更新，但自始至终，AI的存在都只是为了“让大家玩得高兴”这一个目的。
它并不须要试图在游戏中做得比人类玩家更好，创造它的公司对付游戏体验和开拓效率方面的考量也不许可它这么做。

游戏进行到某一特定阶段时，它一定会输。
此类结局早已提前写进了它的代码中。

它会被击败，被摧毁，被屠戮；

随着游戏环境的更新而进化，然后再次被击败，被摧毁，被屠戮。

周而复始。

分身

△ ORTS游戏引擎

新世纪之初，从研究角度利用RTS游戏来开拓AI的项目实在寥寥无几。
2003年，阿尔伯塔大学打算机科学系的Michael Buro和Timothy Furtak提出该当将RTS游戏作为通用AI的试验田，前者在一年之后发布了第一个版本的开源RTS游戏引擎ORTS，该引擎能够在图形和非图形两种模式下运行，使得机器人能够在数千种游戏场景下迅速演习。

同年，《魔兽争霸II》克隆游戏《Freecraft》的重制版本《Wargus》面世，该游戏采取了开源的Stratagus引擎；2005年，加州大学伯克利分校的几位研究者曾经考试测验利用Stratagus平台开拓强化学习算法。

但不久后，由于不同的研究者无法对彼此的事情进行比较和评估，这一平台上的事情终极陷入结束。

直到2008年，终于，越来越多的研究者开始将目光投向了《星际争霸》。
当年，通过对数千场游戏重放的挖掘，两位台湾学者Hsieh和Sun构建了一个能够预估玩家正在建造哪些建筑或单元的模型。

△ Hsieh和Sun的建造顺序估计

一年后，Adam Heinemann等几位开拓者发布了开源C++框架BWAPI（Brood War API）——这是最早，也是迄今为止最主要的《星际争霸》API。

Heinemann等人黑掉了游戏之后整合出的这一API，为研究者供应了接入《星际争霸：母巢之战》的通道，也便是《星际争霸I》。
BWAPI属于“纯竞赛”API，也便是说，API中只曝光了玩家可不雅观测到的内容，支配个中的AI将不能像游戏内的“电脑”一样触及到游戏的底层数据，最大程度地担保了公正性。

BWAPI：https://github.com/bwapi/bwapi

JAVA版BWAPI：

https://github.com/JNIBWAPI/JNIBWAPI

此后绝大多数《星际争霸I》干系的AI开拓均依赖于BWAPI。
后来，利用该API乃至得到了暴雪的默许：当时，暴雪在终极用户容许协议中明令禁止对《星际争霸II》的任何破解行为，却许可各种《星际争霸I》干系开拓行为的存在，乃至为各种基于BWAPI等接口的星际AI竞赛供应奖金。

只管后来又涌现过TorchCraft这样的深度学习框架，但直至今日，在BWAPI上进行的星际AI研究依然保持着活力。

由此，一部分的它跳出了游戏内部规则的桎梏，开始以另一种形态在世界的各个角落重生。
它成为了军团，以UAlbertaBot、Skynet、Aiur、Overmind等名字涌如今AIIDE、CIG、SSCAIT一类的星际AI比赛中。
它的分身彼此研究、克制，然后相互厮杀，不知疲倦地决出新的最强者，然后开诚布公地向人类玩家发起寻衅。

但命运彷佛没有发生什么太大的变革。

作为AIIDE（Artificial Intelligence and Interactive Digital Entertainment）大会的组成部分，第一届AIIDE星际AI比赛于2010年在加州大学圣克鲁斯分校举办。
由此之后，AIIDE逐步发展成为最主要的星际AI赛事。

△ 首届AIIDE得胜团队：伯克利Overmind

作为保留节目，主理方常日会在主赛事结束后，安排当年的冠军AI同一位富于履历的人类玩家进行一场演出赛。
每年都是如此。

而直到AIIDE 2017，它一次都没赢过，且险些次次都被碾压。

还是太难了。
蜕下了外壳的星际AI依然无法摆脱僵化、呆板的行为办法，打法被人轻易摸透之后，更不具备变通的能力。

比如2012年的一场比赛里，Bakuryu险些只用几只小狗就戏耍了AI的全体主力部队。

尤其是在“X局X胜”的比赛中，这样的弱点暴露得更为明显。
在某一场比赛中，它可能能够击败D级乃至C级的人类选手，但一两场比赛过后，它的特点就会被对方创造，然后输掉剩下的比赛。

AIIDE比赛的发起人David Churchill也强调，这样的比赛实在有些不公正。
不过他也承认，要达到人类职业星际选手的水平，星际AI还有很长一段路要走。

AlphaGo效应

没人能否认AlphaGo对付如今AI研究浪潮的助推浸染。

2016年3月，由DeepMind团队开拓的“最强围棋AI”AlphaGo横空出世，在首尔举行的五番棋比赛中4:1大败李世乭。
自此，新王初起，旧人哀号。

远有“深蓝“，近有”沃森“，这不是AI第一次震荡众人，却或许是AI让众人最为震荡的一次。
在空前发达的媒体网络能够在分秒之间将送及天下的每个角落之前，恐怕很少有人会相信，在集聚了千年历史的棋盘上，人类聪慧霸权的崩塌会来得如此惊惶失措。

只管李世乭在比赛中下出了“神之一手”，只管此时柯洁还未出战，人们已经在急着探求下一块可能守卫的阵地。

DeepMind亦是如此。
2016年3月尾，暴雪娱乐制作总监 Tim Morten 就在 WCS 中国站总决赛上确认，AlphaGo将会寻衅《星际争霸II》。
同年11月，DeepMind正式宣告与暴雪达成协议。

但这次，他们的目标变成了联手开拓一个针对《星际争霸II》的AI研究平台，也便是API。

DeepMind团队表示，他们这次研究《星际争霸》AI不再以击败人类选手为目的，而是要探索AI如何在更繁芜的环境下进行决策，并终极将技能运用到现实天下。

纵然17年5月的乌镇围棋峰会后，合营着深度学习、强化学习等技能的研究浪潮，对付AlphaGo寻衅《星际争霸》的呼声再度水涨船高，Byun等职业选手也纷纭向AI宣战。

人们像是怀着某些期待，希望它能以某种洗手不干的姿态涌现，再度刷新人们对付这一领域的认知。

但终极，人们也只是在8月等来了DeepMind和暴雪互助开拓的《星际争霸II》开源API SC2LE，以及DeepMind在自己官方博客上的坦诚：“在完全的游戏流程下，目前我们的agent无法赢下任何一场哪怕是与最大略游戏内置‘电脑‘之间的比赛。
我们希望能有更多人参与到这个领域中来。
”

将近一年过去，根据2018年6月刚刚出炉的DeepMind最新研究成果，SC2LE环境中的6个小游戏里，AI玩4个的成绩超过了大师级人类玩家。
但这间隔完全的《星际争霸II》，不知还有多少步之遥。

沙场终于搭建了起来，强大的战士还没降临。

曙光

AlphaGo淡出人们的视野之后，几大星际AI比赛的热度彷佛并未低落，但同时，人们仍旧没能在它的身上看到足够可不雅观的进步。

比如2017年底，CIG的星际AI比赛在韩国世宗大学连续举办。

个中就包括人机大战的环节。
人类阵营先由两个普通学生星际玩家出场，分别寻衅上个月星际争霸AI大赛的冠军：ZZZK、来自挪威的TSCMO、主理方韩国世宗大学研发的MJ。

结果AI阵营分别以3:0、2:1击败了普通人类星际玩家，唯一的败仗由韩国星际AI贡献。
总比分算是5:1。
普通人在AI面前败下阵来。

只可AI们接下后来遇上了“星际四皇”之一、“总司令”stor（宋炳具）。

之前大杀四方的AI被stork轻松零封，但他也承认AI们的防守打法“有时候让人震荡”。

AI还不足强大，这在猜想之中。
比如个中最厉害的ZZZK，实在是一个程序员独自创建的AI，只有一些大略的学习能力，背后更多是各种预先编辑好的策略。

总而言之，即便走到本日，星际AI还处在发展的低级阶段。

新的研究仍在不断涌现，不久前有称，Siri的创造者之一斯坦福国际研究所已经加入了DARPA的一个研究项目，操持通过《星际争霸》来演习AI在意外环境下的临场反应。

当年十几岁就拿下西班牙《星际争霸》全国冠军的Oriol Vinyals，现在已经成了一位AI大牛，正带领DeepMind团队，占领这一领域。
而AlphaGo的核心人物黄士杰，现在也已经参与到这个项目之中。
一旦有所打破，必定又是一个惊天的造诣。

但与此同时，某美国国防智库发布的一份报告指出，与《星际争霸》干系的AI研究项目可能使AI在军事方面得到超越人类级别的推演能力，从而加剧核战役爆发的风险……

当然，更多时候，我猜，人们依然会更乐于见到那些心无他念、执意冲进战役迷雾的唐吉诃德。

It is said that ignorance is bliss. Tell me, is that true?

— 完 —

诚挚招聘

量子位正在招募编辑/，事情地点在北京中关村落。
期待有才华、有激情亲切的同学加入我们！
干系细节，请在量子位"大众年夜众号(QbitAI)对话界面，回答“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技能和产品新动态

每期AI知识网

从陪练到寻衅星际争霸里的人工智能正在崛起｜AI简史

AI改编周杰伦金曲引争议音乐人担忧我们会被淘汰吗

运用AI技能打1700万个电话筛选受害者18名嫌犯落网