刚刚上课:同学们现在我们来解一下“1+1=?”这道题。
我的内心活动:这么大略闭着眼睛都会了,先捡一下地上的橡皮再说。
捡完举头看黑板:好的同学们关于哥德巴赫猜想的证明我们讲完了,课后可以自己去证明一遍
我:......这是在逗我玩吗??
大家准备好不要去捡橡皮了,我要开始带你进行项目实战了!
这是第一步:我们先画一个轮廓
好了项目已经完成了
你现在是不是在想:我觉得摧残浪费蹂躏了一次捡橡皮的机会!
这完备是“神笔马良”的效果。虽然是调侃,但是目前人工智能已经能按照物体的轮廓和环境自动天生实物了。
现在要先容的这款 AI 软件 ,能让你真的见识一下 “X 步画出任何你想要的写实风景画”,它叫 GauGan 系统。
在 今年3 月 19 日的 GTC 2019 上,Nvidia 推出了这款 AI 绘画系统,该软件利用天生对抗性网络,只要你给出大略的草图,再点击几下,几秒钟就可绘制逼真的风景图像,下面是实打实演出了一个《如何三步画一副写实风景图》,AI 诚不我欺。
GauGan 目前有三种工具:油漆桶、钢笔和铅笔。屏幕底部是天空、树木、云等一系列选定工具,选择任一工具在左侧大略描述,就会自动天生相应的逼真物体。
要做到这种效果,当然离不开弘大的数据来演习模型。目前,Nvidia 已为 GauGAN 深度学习模型供应了 100 万张从 Flickr 网络的数据。须要指出,GauGAN 并不但是对已有的照片进行拼接,实际上最终生成的图像都是独特的合成图像。以是即便不同的用户做出相同的设置并画出相似的草图,系统中也会通过内置的参数给出生身分歧的图像。
大概会有人问,GauGan 往后能不能画人物肖像?只管目前 Nvidia 没有明确给出可能性,但一个合理的推测是,如果给 GauGan 系统演习足够多的人物肖像数据,画一幅你想要的肖像画该当不成问题。如果你还记得最近那个很火的“这个人不存在”网站,它就利用 Nvidia 开源的 StyleGan 算法随机天生了人脸图像。
GauGAN 系统的创建在一篇名为《空间自适应归一化的语义图像合成》(或称 SPADE 项目)的论文中有详细先容,这篇论文由 UC Berkeley, NVIDIA, MIT CSAIL 实验室的 4 名研究职员共同写就,已公开拓布在 Arxiv 上。值得一提的是,该论文将在 6 月的 CVPR 2019 大会上做口头报告。
方法简述
在许多诸如批量标准化(Batch Normalization)这样的常见的标准化技能中,在实际标准化步骤之后运用了学习的仿射层(如在 PyTorch 和 TensorFlow 中)。而在 SPADE 项目中,仿射层是从语义分割映射来学习的。这类似于条件归一化,只是学习仿射参数现在须要空间自适应,这意味着我们将对每个语义标签利用不同程度的缩放和倾向。
利用这种大略的方法,语义旗子暗记可以浸染于所有层的输出,不受可能丢失此类信息的规范化进程的影响。此外,由于语义信息是通过 SPADE 中的层供应,以是随机潜在向量可以作为网络的输入,其可以用于操纵所天生图像的样式。
Flickr 图像中的运用
如前所述,GauGAN 的神经网络是通过 100 伸开源的 Flickr 图像进行演习,它还能够理解如雪、树木、水等超 180 个物体之间的关系。对物体之间如何相互关联的理解意味着河水旁的树会有倒影,或者当时令变革时并且地面上有雪时,就会绘成没有叶子的树。也便是说,神经网络能够根据它对真实图像的理解对最终生成图像的干系细节进行合理添补。
由于 SPADE 适用于不同的标签,因此可以利用现有的语义分割网络对其进行演习,以学习从语义映射到照片的反向映射。这些图片是由 SPADE 从 Flickr 上抓取的 4 万张图片进行演习天生的。