AI自画像背后的功臣详解GAN

揭开迷雾——理解GAN

GAN是Generative Adversarial Networks的缩写，译为天生式对抗网络，它是一种深度学习模型。
大家知道要让机器拥有人工智能，大量的学习是必不可少的，现在AI大多利用的是大数据+深度学习的模式，而要让机器深度学习，模型是必不可少的要素。
GAN紧张由N、A、G组成（图1）。

图1 GAN图解

N即Networks，深度神经网络，AI通过神经网络可以学习和自我学习，从而节制很多博识的技能。

AI自画像背后的功臣详解GAN

A即Adversarial：对抗，AI通过深度学习后成为“高手”，在模型系统中这个“高手”会和自己对弈，从而在相互对弈中提高技能。

G即Generative（Model）：天生模型，通过神经网络学习以及自我对弈，这样即可天生模型，终极通过不断完善模型和算法，让AI拥有超凡的人工智能。

艺惊四座——GAN事情事理揭秘

通过上面的描述我们大略理解了GAN的组成，那么在AI得实际运行中，GAN又是若何实现深度学习，让AI拥有高超的人工智能得呢？

如上所述，GAN是由神经网络、对抗和模型组成的，个中核心则是对抗。
对抗模型也称之为GAN框架，这个框架紧张由天生模型G和判别模型D组成。
在开始演习的时候，系统会把真实样本数据（X）随机传送一份给判别模型D，D的目标是尽可能精确识别出真实样本（如果精确则输出为“真”或者“1”）。
同时用于识别得噪声数据样本（Z）也会随机传输一份给天生模型G，G会将处理的数据也传输给D进行判别。
这样D既要判断真实的数据（并尽可能识别为真），也要对噪声数据进行识别（尽可能精确地揪出生成的样本，也便是假样本输出为“假”，或者0）。
在演习过程中双方都不断优化自己，直到达到平衡，即假样本与真样本完备不可区分（图2）。

图2 GAN框架图解

当然技能术语的阐明总是很晦涩，我们可以用足球运动来进行比喻。
在GAN框架中，这里我们将天生模型G比喻球员的“假摔”，他们的目标是利用各种手段迷惑裁判，使得自己进攻或者防守战术动作是合规的。
比如球门前的假摔看上去像真的对方犯规一样，判别模型则相称于裁判，他们目标是将球员各种殽杂在合规战术里的违规动作找出来。
在球员和裁判的不断对抗中，球员的“假摔”水平越来越高，裁判识别“假摔”水平也越来越高。
随着两方水平的不断提高，终极谁都无法区分出哪个动作是真正的“假摔”，也便是AI的水平已经实现以假乱真（图3）。

图3 比喻图解

当然在实际的运用中，AI不是用来制作愉快剂，而是指其强大的自我纠错和学习能力。
借助GAN框架，AI可以拥有人类无法想象的超级能力。
比如上一期先容的自画像，AI可以描述出人类无法表达的画面。
在类似的场景中还有很多有趣运用，比如在很多广告创意中，艺术家会投入很多韶光设计在视觉上与其他元素的形状和纹理相兼容的字形，但是这样手工设计的字形是和当前场景紧密集成在一起的的，纵然是同一幅画面，如果要制作出同样效果的字形，艺术家也不得不要重复劳动，由于根据目前的技能很难将它迁移到其他类似的项目中。

现在借助GAN的学习，AI可以很轻松学会并领会艺术家的意图，它会先对画面环境、光芒、场景等进行学习，然后对字体在这画面的各种环境进行读取，并将字体的每个元素拆分学习，如字体的形态、颜色、手腕等进行精密学习，从而精准复制出和海报场景非常契合的字形，并将这些原来很难迁移的字形进行任意的移植（图4）。

图4 字形在不同海报之间的迁移

打破限定——GAN给我们带来更多

通过上述先容可以看到，借助GAN框架学习，AI可以节制乃至超过很多人类节制的技能。
AI的这些技能可以给我们生活带来很多的便利。

比如GAN对字体超高的学习能力，它可以被用来学习天生各种各样的字体，同样可以用它来进行个人字体、字迹的辨别。
这样往后如果哪个老赖具名却否认是他署名的笔墨，我们可能不要借助专业的鉴别机构就可以轻松进行鉴别了（图5）。

图5 GAN识别并天生各种字体

当然GAN还有很多运用，比如基于Age-cGAN开拓的运用OLDIFY，可以合成你任意年事之后或者之前的形态，只要有一张年轻时候的照片，你就可以提前知道自己几十年之后，或者回顾十几年之前的样子，这是不是很有趣（图6）。

图6 OLDIFY的年事合成

当然GAN框架在很多领域还有非常实用的运用，比如在医学领域，GAN可以通过对繁芜疾病的诊断学习，帮助年夜夫在往后的病例中快速对病人做出全面、科学的诊断。
警察可以借助GAN从监控视频中对分割图还原成真实照片，将黑白图变成彩色图，对犯罪嫌疑人进行精准的识别，让犯罪嫌疑人无处遁形，我们期待GAN给我们带来更多的运用！

每期AI知识网

AI自画像背后的功臣详解GAN

人工智能从趣闻轶事到无处不在

全球视角亚马逊秘密研发新型AI聊天机械人Metis