量子位 出品 | 公众年夜众号 QbitAI
半个世纪前拍摄的黑白老旧电影,现在迎来了人生的“第二春”。
在AI的帮助下,这些只有黑白灰三色的视频片段,已经变成了彩色的。
在Facebook的F8大会上,国外技能小哥Jason Antic展示了一种叫DeOldify的AI模型,这种技能为老电影上色效果堪称惊艳。
不信?直接看效果:
比如,1960年的美国惊悚胆怯电影《惊魂记》:
用AI上色后的绝不违和,人脸部分的妆容也不别扭:
黑白电影时期的诙谐大师卓别林,第一次在镜头下有了颜色:
89年前的美国电影Reefer Madness,就这样被轻松还原了:
输入黑白灰,输出红绿蓝,这个AI模型开始大火。Jason Antic小哥的推特收成了近800赞,推特网友直呼“Amazing!
!
!
”、“very cool”、“wow”。
不过,这还不是DeOldify模型的全部实力。
在线试玩除了视频,DeOldify还能处理老旧的黑白照片和图像。
比如1936年Dorothea Lange的拍照作品《移民母亲》:
1920年在寝室放松的瑞典妇女:
1911年的Thanksgiving Maskers:
1941年在农场的Lemuel Smith师长西席及其夫人以及他们年幼的孩子们:
1890年代末的挪威新娘:
1880年吸食鸦片的中国人:
以上这些画作的上色,均由DeOldify完成。无论是人像还是场景,或是绿油油的田园景象,这只AI上色画师的处理都自然完美。
好是,这个为图像上色的模型现在还有了demo,你也能在线试玩了。
试玩地址:
https://colorize.cc/
操作也非常大略,传入一张黑白图像,输入自己的邮箱地址,不一会儿就能收到上了色的版本。
高效的NoGAN上色大师DeOldify是怎么做出来的?
作者小哥表示,这背后是一套名为NoGAN的架构。他自称这是一种奇怪,但是非常高效的图像到图像的演习方法。
这种深度学习模型借鉴了当前多种主流技能方法,包括:
自把稳天生对抗网络(Self-Attention Generative Adversarial Network)
天生器是一个预演习的Unet,小哥进行了一个非常大略的转换过程,将其修正成了具有谱归一化和自把稳力。
干系研究:
https://arxiv.org/abs/1805.08318
两个韶光尺度更新规则
也便是说这是一个一对一的天生/辨别迭代,并且具有更高的辨别器学习率。这种修正能够确保辨别器在天生器演习前被“捕获”。
干系研究:
https://arxiv.org/abs/1706.08500
天生器的丢失分为两部分
一是基于VGG16的基本感知丢失(或特色丢失),这让天生模型更倾向于输入天生图像。二是来自辨别器的丢失,由于仅单一模拟输入并不能带来很好的天生结果,可能会涌现一些棕色/绿色/蓝色的大略堆叠来欺骗检测。
以是须要意识到,天生对抗网络的实质便是学习丢失函数。
NoGAN
重头戏来了,NoGAN是一种新型的GAN演习方法,能用来办理此前GAN演习过程中的关键问题。
NoGAN的干系论文虽然还没有放出,但小哥在Github中大致先容了NoGAN的特点。
此前,演习模型的大部分韶光都用在了预演习天生器和critic这一部分,但NoGAN可以花费最少的韶光直接进行演习。
这种方法的演习流程为:
先用常规方法演习具有特色丢失的天生器,接下来从中天生图像,并把辨别器当成一个二元分类器,区分输出图像和真实图像之间的差距。对付辨别器来说有一个拐点,在拐点附近天生图像质量最佳。为了找到这个拐点,小哥也只能通过数次考试测验,没有巧方法。
NoGAN演习还有一个关键问题,可以在最初GAN演习后,用相同的办法对天生的图像重复进行预演习。
传送门Github地址:
https://github.com/jantic/DeOldify/blob/master/README.md
— 完 —
诚挚招聘
量子位正在招募编辑/,事情地点在北京中关村落。期待有才华、有激情亲切的同学加入我们!
干系细节,请在量子位"大众年夜众号(QbitAI)对话界面,回答“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技能和产品新动态