我们构建了这样一个神经网络,作为汽车的大脑,激光雷达得到前方5个方向的间隔信息,2个当前车速信息,实时获取的这七个数据。作为神经网络的输入层,全连接进入隐蔽层,输出层4个数据,去驱动汽车,分别对应的便是玩赛车游戏的时候的四个键:左拐、右拐、油门和刹车。
通过仿照生物进化的遗传算法来进化汽车脑,依然是撞墙就销毁,重置"大脑",提高就给予褒奖。每代500条"命"一分别对应500个神经网络模型,花费完选拔50个大脑进入下一世代。
选拔标准是什么?从花费的500条"命"中拿出15个得到褒奖最高的,直接进入下一代。这仿照的便是自然选择适者生存,然后拿出排名前425个大脑,随机出45个大脑,进行随机突变,也便是神经网络对应参数组合的随机微调。然后将这45个突变大脑与15个精英大脑组合为新的一个世代,开始下一轮的进化与突变。
如此循环,仅仅15代的进化,7500次的"去世亡",就进化出了能通关的神经网络模型,数字矩阵。以下记录的是第一次跑完备赛道的过程,虽然颤颤巍巍,虽然操作路线不是最优的,但是随着演习的去世去,会越来越稳健,并开始追求最快速率完成。
以下是全体神经进化的全程,请欣赏"上帝视角",感想熏染下进化的力量。