如今,微软在AI图片研究方面更近一步,带来了AI绘图功能:你只需给出解释(比如笔墨描述),AI就可以自动天生图片。据悉,与之前考虑过的顶级技能比较,drawing bot带来了三重改进。比如上图便是AI根据“一只拥有黄色身躯、玄色翅膀和短喙的小鸟(a bird with a yellow body, black wings and a short beak)”这一解释,绘制出来的小鸟。
AI绘图背后的技能事理
据先容,drawing bot基于天生对抗网络(GANs)技能,而且微软研究职员更进一步,利用被称为AttnGAN(Attentional Generative Adversarial Network)的技能,能将输入的句子分成独立的单词,并与图像的特定区域匹配起来。研究职员提到AttnGAN时表示,这是用算术替代了专注这一观点,“专注是人类的观点;我们通过数学让专注可打算了!”
据悉,研究职员以数学算法,为AI供应了把稳力模型(The attention model)和DAMSM模型(Deep Attentional Multimodal Similarity Model)。个中,把稳力模型拥有笔墨特色和图片特色两种输入数据(input)。DAMSM则包括了text encoder、image encoder和基于attention model的attention-driven image-text matching score模块,能学习映射图像和单词分区两个神经网络的公共语义空间,以及以单词层级丈量图像文本相似度,从而打算包括周详纹理的图像天生。
想理解更多技能细节,请查看研究职员发布的论文:https://arxiv.org/abs/1711.10485v1
AI绘图未来大有可为
据悉,该研究团队最初借助名为CaptionBot的AI系统来深入研究打算机视觉和自然措辞处理问题(该系统可以自动为照片添加字幕);此后,研究团队又创建了名为SeeingAI的AI系统,它的浸染是帮助盲人群体认识天下(通过识别图像给出地点、物体属性等回答);然后,研究团队想通过笔墨来天生图像,“这意味着你须要AI的机器学习算法能想象图片中丢失的部分。”
有趣的是,得益于研究职员供应的演习数据,drawing bot也拥有了一点基本知识和想象力,能补充图像的一些细节。以小鸟为例,纵然文本中并没提到树枝,drawing bot也常常会画出一只站在树枝上的鸟,那是由于最初给它输入的图像大部分都是这样的。
微软研究员强调,该AI系统不是根据描述去探求网络中对应的图片,而是完备靠自己创作出来的,“AI画出来的鸟可能并不存在于真实天下——这些鸟只不过是打算机想象力的结果而已!”据悉,该技能未来可扮演画家设计师等的草图助理,或是用于声控照片细化工具。
随着技能的进步,这项技能乃至还能在天生基于剧本的动画电影,为动画电影制作人供应助力。当然,目前该技能还存在瑕疵,不过微软已经迈出了非常主要的一步。如果未来真的有根据文本描述绘画的AI投入实用,你会有什么感想呢?