AlphaGo背后的DeepMind团队最近又鼓捣出来一个新玩意儿:一个放飞自我学跑酷的AI。由Goolge的DeepMind团队所开拓的人工聪慧围棋程式AlphaGo。
人工聪慧自学走路的影片,展示了电脑的自学习过程......
虽然动作看起来有些笨拙,但是火柴棍所做的每个动作都是自学的。
虚拟探测装置会见告它周围的环境以及障碍物还有接下来改做些什么,通报给它从A点到B点的指令,仿照了走路、躲避障碍物的画面,这是人工智能从来没有看过的“走路的画面”。
Deepmind为他们的AI设计了一套包括墙壁、峭壁等多个障碍在内的跑酷课程,并且没有教AI如何利用“腿”,想看看这种大略的褒奖办法能否勾引AI学会在繁芜环境下的运动办法。根据这套设计,AI通过的速率越快,褒奖越好,更繁芜的情形则会有额外的褒奖和惩罚方法。