生活中,AI图像识别无处不在。
图像搜索、自动驾驶汽车、人脸识别技能……这统统,都离不开一项技能——卷积神经网络,这项技能就像AI的眼睛。

什么是卷积神经网络?

20世纪50至60年代,大卫·休伯尔和托斯坦·威泽尔对猫的视觉进行了研究,他们创造在一幅画面进入猫的视野之后,猫大脑中卖力视觉的神经元被不同的东西激活了,有的神经元对线条比较敏感,有的神经元对大块颜色比较敏感,这些神经细胞一起事情,帮助生物识别各种繁芜的图像,这项研究让大卫和托斯坦得到了1981年诺贝尔生理学或医学奖,也启示了人工智能领域一个非常主要的算法——卷积神经网络。

卷积神经网络在识别图片时有两个主要过程——卷积和汇聚。

山东科协每日科普人脸识别图像搜索自动驾驶你理解AI图像识别是若何工作的吗

卷积的过程是由卷积核来完成的,一张图片在打算机眼里实在是一个个像素点组成的矩阵,卷积核不是单独去考虑每一个像素点上的信息,而是同时对某个区域的像素点信息进行处理,这样可以综合考虑相邻像素点的信息,更好地提取出更高等的特色,以帮助神经网络做出更好的判断。

汇聚又称直化。
图片每每是一个较大的矩阵,汇聚能够把一块区域里的信息压缩成一个信息。
例如对一个16×16的矩阵,可以通过汇聚的方法提取2×2格子里颜色最深一格的信息,就能将其变成8×8的矩阵;如果再进行一次相同的汇聚,可以把8×8的矩阵变成4×4的矩阵。
虽然图像汇聚后会有一些变革,但是依然保留了全体图像的基本特色。

AI的眼睛是如何事情的?

卷积和汇聚让卷积神经网络能够非常好地对图片信息进行提取,对付图像的学习处理效率有了非常大的提升。
当然,卷积神经网络也会利用与神经网络相同的反向传播算法,不断根据已知结果逆向调度神经网络中的参数,以做出越来越准确的判断。

卷积神经网络是在20世纪80年代末涌现的,直到2000年往后,人们创造卷积神经网络和GPU的合营,能够让卷积神经网络的学习演习速率大大加快,因此,卷积神经网络迅速被运用到了生活的各个方面。
在购物软件中识别商品种类,在旅途中识别花花草草,在线办理业务时识别面部都要依赖卷积神经网络。
并且,卷积神经网络最初仅是用于处理视觉图像信息,经由迭代和发展,AI能够更好地瞥见、理解我们的天下,在音频识别自然措辞处理等方面有着光明的前景。

来源:科普中国

编辑:白欣雨

审校:高淑青