能够学习被认为是智能生物的一大标志。
机器学习现在有能力从数据集中学习和推断,从而完成繁芜的任务,比如对以前从未见过的物体进行分类。

机器学习与人类学习有着惊人的相似和主要的差异。
通过比较和比拟生物与人工智能如何学习,我们可以建立一个更完善的架构。

神经元提及

在生物神经网络中,学习源自于大脑中无数神经元之间的连接。
大脑打仗到新的刺激后,这些神经元之间的连接改变了配置。
这些变动包括涌现新的连接,加强现有连接和删除那些没有利用的连接。
例如,重复给界说务的次数越多,与这个任务干系的神经连接就越强,终极我们会认为这个任务被学会了。

AI距离匹仇敌类大年夜脑还有多远人工神经收集和生物神经收集最具体比拟

神经元利用影象和感知里预先建立(pre-established)的表征来处理新的刺激。
每个刺激都能让一组神经元在认知过程中会被激活,而这样的神经元有很多很多。

这种生物学上的奇妙设计也启示了人工智能研究者,人工神经网络(ANN)旨在抽象地仿照这种行为,但规模和形式都要小并且大略得多。

什么是人工神经网络(ANN)?

ANN由相互连接的神经元组成,这些神经会吸收一组输入,以及一组连接权重的设置,然后进行一些数学运算,并将结果作为一组与生物神经元中的突触相似的“激活”作为输出。
ANN常日由几百到上千个神经元组成,但人脑的生物神经网络有数十亿神经元。

从比较高的层次看,人工神经网络由四个部分组成:

神经元

拓扑构造,也即神经元之间的连接路径

权重

一种学习算法

在人脑生物神经网络和用软件表达的人工神经网络之间,这四大部分有着显著的不同。

不才图中,我们看到一个生物神经元。
轴突(Axon)卖力输出从神经核到其他神经元的信息,树突(Dendrite)则卖力从其他神经元吸收信息,来自神经元(突触)的电化学旗子暗记聚拢在细胞核中。
如果电旗子暗记聚合超过突触阈值,就会形成电化学脉冲,沿轴突向下贱传到其他神经元的树突。

下图展示了一个人脑中神经元拓扑构造的合理假设。
可以看出,这个构造蕴含了让信息循环和传播的巨大潜力。

生物神经网络中的学习:对现有表征进行微调,初始状态由遗传衍生而来

在像人脑这样的生物神经网络中,学习是通过对现有表征进行眇小调度实现的,其配置(configuration)在任何学习开始前就已经包含了主要的信息。
神经元或权重之间的连接的强度不以随机的办法开始,连接的构造,即网络拓扑也并非随机。
这种初始状态是由遗传衍生而来的,是进化的副产物。

随着韶光的推移,网络通过调度拓扑和权重来学习如何实行新的功能。
实际上,拥有一个起始表征(initial representation)对完成任务来说都很有用,这一点有证据支撑。
研究表明,一个月大的新生儿可以通过学习识别陌生人和父母的脸之间的差异。
换句话说,人类对“人脸”的观点在很大程度上是从父母那里传承的。

随着婴儿逐渐发育发展,走过童年、青春期、成年,乃至到退休,他们每天都会看到和认识新的朋友,并且要学习他们的样子。
而这是通过对大脑中神经网络进行眇小的改变来实现的。

同样的征象也适用于其他任务,包括被动感知任务,从识别通用工具到将声音作为一种语音模式来处理,以及主动进行的任务,比如运动和说话。
这些技能逐渐被学习,那些用于改进它们的调度幅度也不断缩小。
对应这种征象的精确的拓扑构造,是演习这些生物神经网络刺激类型的函数。
一个著名的例子是由诺贝尔奖得主David Hubel和Torsten Wiesel领导的单眼剥夺研究。
该研究涉及在发育过程中强制动物的眼睛闭合两个月,不雅观察其紧张视觉皮层的变革。

结果表明,常日对双眼输入有反应的细胞变得完备不再对旗子暗记产生反应。
因此,动物大脑和眼睛中的细胞都发生了改变。
这种征象也延伸到人类身上。
例如,对视觉感知的生理测验表明,比较居住在屯子的人,生活在城市中的人每每对平行线条和锐角更敏感(居住在屯子的人则对光滑的纹理渐变更敏感),很可能是城市半途径、摩天算夜楼和窗户的平行构造过多造成的。

人工神经网络中的学习:从头开始,初始状态随机

与生物神经网络不同,人工神经网络(ANN)常日从头开始演习,利用的素材是现有的针对某个问题的拓扑构造。
目前,这些网络的拓扑不会随韶光发生变革,而网络的权重也是通过优化算法随机初始化和进行调度,尽可能将输入刺激映射到期望的输出函数。

不过,ANN也可以基于先前存在的表征来进行学习,这一过程被称为微调。
微调也包括利用相对较慢的学习速率调度预演习网络拓扑的权重,从而让网络在新的演习数据上表现良好。

我们也可以绝不费力地复制ANN,但是要做出一个人类大脑还须要一定的韶光。

无论是从头开始还是微调演习,权重更新过程都是通过在神经网络中通报数据

丈量结果,并相应地修正权重开始的。
这便是人工神经网络如何进行“学习”的全体过程。
权重会按照能在最大程度长进步所需任务性能的方向被逐渐改变,例如最大限度准确识别输入样本的方向。
人工神经网络这种学习过程,可以比作一个试图学习识别日常物品的孩子。
在考试测验失落败后,对答案的准确性进行反馈,孩子再次考试测验不同的方向,为了得到精确的反应。

ANN在学习时实行的都是相同的任务。
一旦这个学习过程完成,ANN就可以利用以前的问题表征来对学习过程中以前没有打仗过的新刺激做出反应。
跟人类的孩子一样,ANN通过打仗尽可能多的类似问题,让自己学得更好。
对付人类儿童,练习的次数越多,就能越快处理新的问题,由于孩子大脑中的干系神经元连接变得更加明确。
而ANN则类似于更广泛地分配有关任务的可能刺激的广泛分布,从而在以前没有打仗过的相同分布中学习,应对新的刺激。

越多打仗越好:白天鹅 vs 黑天鹅

我们人类在长久的发展中学习到,对付儿童来说,暴露在现实天下中的机会越多,他们就能够学得越好,纵然这种学习有时候是痛楚的。
事实上,当学习是痛楚的时候,痛楚本身便是一个很大的反馈机制。
类似地,要演习或微调任何类型的神经网络,将ANN暴露于特定领域中的各种刺激是非常主要的,并且这可以确保你的模型不会对某一种刺引发生过拟合。

通过对特定类别的刺激进行额外的表示,网络可以更好地分类新的刺激或天生观点。
这适用于生物神经网络和人工神经网络,虽然生物神经网络在泛化上做得更好。
这是真的,部分是由于它们暴露于更多的数据类型和模式,部分缘故原由是由于更前辈的生物拓扑和学习算法,并且在很大程度上是由于达尔文主义。

这一说法的一个例子,来源于Nassim Taleb开拓的“黑天鹅理论”。
这个术语来自于16世纪伦敦的一个“知识”,有人认为所有天鹅都是白色的,由于没有任何其他颜色的天鹅的记录。
因此,对他们来说,天鹅必须是白色的,才能被分类为天鹅。
荷兰探险家威尔明·德·弗莱明(Willem de Vlamingh)后来见到了西澳的黑天鹅,改变了这种固有的分类。

这里的观点是,如果一个人从小到大到只能看到白天鹅,也便是说,一个人的神经网络只能在“所有的天鹅都是白色的”这一分布上进行演习,这个时候给他呈现一个“黑天鹅”,他就不能将它分类为天鹅, 由于这是一个从未见过的天鹅。
如果一个人从小到大看到天鹅有两种颜色,那么他更适宜对所有的天鹅类型进行分类,由于这个生物神经网络是在更大的天鹅类型分布上进行演习的,这些分布中包括了更多的知识,让人可以更多地理解天鹅可能包含的属性。

泛化,或者说从以前学到的知识进行抽象的能力,是一种非常有用的功能,可以通过轻微地权重调度,快速地办理跨不同领域的问题。
这是一个神经网络针对迁移学习和解决适应性问题的方案。

事实上,不用重新连接很多的神经元这一点,也是均匀而言常常滑雪的人要比第一次滑雪的人滑得快的一个缘故原由。
被演习用于物体检测的人工神经网络在通过微调后,也能很好用于面部识别,其性能每每比从头开始在相同的面部识别数据集上严格演习的办理方案要更好。

人 vs 机器

该当清楚的是,本日的人工神经网络还处于起步阶段。
虽然在构造上类似,对付权重观点,神经元(功能单位),拓扑学习和学习算法,它们还不能模拟人类对付许多繁芜类型任务的处理能力。
它们的拓扑构造要大略得多,它们的数量级要小一些,学习算法比较稚子。
此外,他们还不能同时接管许多异构任务的演习。

随着我们连续构建ANN来办理诸如检测以前未知类型的恶意软件的难题,我们还将连续理解人类大脑如何完成任务。
或者某些类别的任务,ANN实际上可以赛过人类剖析职员的准确性和速率。
大脑中的动作电位以千秒数传播,而ANN可以更快地对数据量进行分类。

对付其他任务,ANN的上风补充和增强了纵然是最强大的人类思维的能力,使大型事情流程自动化。
在不久的将来,ANN将开始在近人乃至超人的层面上实行额外的任务,它们可能在数学和构造上更类似于生物神经网络。

原文链接:https://news.sophos.com/en-us/2017/09/21/man-vs-machine-comparing-artificial-and-biological-neural-networks/

【扫一扫或点击阅读原文抢购“早鸟票”】