用AI技能“假造”视频内容正变得越来越常见。一方面,技能的进步是一定趋势;另一方面,人性在这个过程中也备受磨练。探求得当的运用处景并找到对付技能的反制方法,已经成了当下寻衅。
/王梓辉
英剧《原形捕捉》剧照
“深伪”技能的运用难题
视频=真实?
在过去的很多年,这彷佛不是问题。比较存在脑海中的影象、落条记下的笔墨,我们彷佛更相信视频里的内容,相信它不像上述两者那样会被遗忘、被涂改。乃至,我们要大量依赖视频内容去决策、断案、判死活。但如果视频里的内容也可以被修正呢?
这也是BBC今年刚刚推出的剧集《原形捕捉》(The Capture)想要磋商的话题。男主人公肖恩卷入了一场行刺案,路边的视频监控拍下了统统,但视频被人为修正了;虽然肖恩知道自己并没有做这些,但当他看到被修正过的视频监控的内容时,他也被那看上去“真实”的场景所震荡,不得不开始一遍各处回顾,疑惑自己当时是否真的做了这统统。
现实中,技能与人性的摩擦也已经开始了。今年9月,一款名为“ZAO”的APP风靡一时,它能很快将一段影视剧中人物的脸换成利用它的用户。一开始,人们被这种奇妙的视觉效果所吸引,但大家很快意识到,如果连视频中的人脸都可以这么轻易被换掉,往后我们还能从视频内容中得到安全感吗?
ZAO引发的争议开始发酵,“换脸”在商业领域成了一个敏感词汇,许多公司对此唯恐避之不及。美国布鲁金斯学会技能创新中央的高等研究员约翰·维拉森诺(John Villasenor)就说,这样被人为修正的视频正“变得越来越风雅和易于利用”。他同时表示,“Deepfake正在提出一系列具有寻衅性的政策、技能和法律问题”。
“Deepfake”中文意为“深伪”,从字面意思就可大致理解:通过深度学习技能(deep learning)假造(fake)视频内容。而其最紧张的运用处景便是“AI换脸”,你乃至可以将二者等同起来。2017年12月,一个名为“deepfakes”的账号在美国Reddit论坛上发布了自己制作的换脸视频,这是“Deepfake”这个词和AI换脸技能第一次以公众可感知的办法进入"大众视野。但可惜的是,这位仁兄选择的换脸内容颇为令人不齿,他把色情电影里女主角的脸换成了盖尔·加朵等好莱坞明星。
某种程度上,这彷佛是这项技能从出身之初就具有的原罪。由于大量受害者的投诉,Reddit论坛迫于压力封杀了“deepfakes”的账号,不过这次封杀却让“deepfakes”直接开源了其AI换脸项目的代码。随着代码的开源,越来越多的程序员加入了“优化Deepfake”的军队中,技能向前的脚步并没有由于运用的不当而受到阻碍。
北京零零发科技的创始人蒋坚在当时看到了Deepfake的涌现后,他深觉这是一个大有可为的方向,就拉着曾在IBM事情的饶玲等朋友开始了AI换脸方向的创业。然而,他们现在也受困于技能与运用上的冲突。作为一家少有的公开以“AI换脸”为业务宣扬方向的企业,饶玲说,他们团队在创业之初想了不少可能赢利的方向,结果创造,“很多条路都走不明晰”。
今年年初的时候,他们设想的最主要的一条路是直播,当时以李佳琦为代表的电商直播开始兴起,各大平台都在推广直播的渠道。饶玲他们以为,电商直播里的主播们虽然各有特色,有的身材好,有的会推销,但这些都是充分条件,唯一一个必要条件是人长得不能丑。“你长得好看不一定能做好电商直播,但是你长得不好就一定做不好。”饶玲说。再者,换脸技能也能帮直播公司肃清真人主播走红后跳槽的风险,以是他们天经地义地构想了一个场景,便是和直播公司互助,帮主播们换脸。
在北京东四环外的一间咖啡厅里,饶玲安排一位女同事在几公里外的办公室内为我做演示。她先用一只手机打开了他们在快手上的账号,又用另一只手机打开了和那位女同事的微信视频电话。只见在微信视频电话中,那位年轻的女同事脸庞虽然姣美但并不出众,没给我留下什么印象;但在快手直播中,我看到的却是一张酷似女明星迪丽热巴的脸。两张脸神态表情一模一样,你笑她也笑,一个人说话另一个人嘴也一起动。我对着“迪丽热巴”仔细端详了半天,以为有点不自然,但若是不知道这张脸是换上去的,恐怕也很难创造个中的蹊跷。
“那张脸实在是我们用迪丽热巴和我们那位员工的脸领悟起来的,很俊秀,很像热巴,但不是热巴。”饶玲关上直播后赶紧跟我阐明,恐怕这里面又会产生肖像权上的问题。男生的脸他们也做了,用的是周润发和他们公司创始人的脸合成的。
对付自己的技能能力,这家公司非常自傲,他们自称自己的实时换脸直播技能“在业界是绝对领先的”。今年年中的时候,他们正式上线了自己的“换脸直播机”,实在便是在驱动层进行了改动的电脑,除了一个好一点的摄像头,紧张是搭配一套人脸模型,直播时可以自动更换,对外售价是1万多元一台。
对外发布后,确实有不少直播MCN公司来找他们咨询,但仔细一问,他们却傻了。“我们创造实在真正对直播换脸产品有野心的,都是那些不断在打擦边球的那些人。”饶玲对本刊说。没有人会直接说自己要用这项技能搞色情,但太多的细节让饶玲和她的合资人不敢赚这个钱。比如办公地点便是个疑问,“我们就问他们平常在什么地方播,能不能去你们公司看一下。很多人就支支吾吾的,只会说:‘我有钱,你们放心,我可以先给钱。’彷佛就没有真的让我们去看的。”更有甚者还说他们在柬埔寨,自己把机器买来扛回去。饶玲他们怎么想怎么以为风险大,不仅怕机器被买去做色情直播,更怕万一对方也懂技能,买回去自己再演习别的模型,搞出什么更严重的事情,就主动叫停了这项业务。
随着Deepfake 干系的技能变得更易于利用和更强大,我们每个人都有必要更负责地考虑如何保护自己的隐私
潘多拉的盒子?
由于运用层面处处掣肘,饶玲说,公司现在还处于“维系很困难”的状态。事实上,若不是亲眼看到负面运用涌现,技能研发职员很难提早发觉这项技能在运用层面的可能涌现的伦理与法律困境。在打算机图形学和打算机视觉方向上得到了博士学位的邢骏见告本刊,他们当初在做科研时,根本就没往色情运用方面想过。
早在2014年初的时候,就有美国的技能爱好者利用微软公司推出的体感外接设备Kinect v2传感器,做出了大略的视频换脸考试测验。但这种办法与人工智能没什么关系,它须要换脸的双方同处在一个空间内,然后利用硬件的能力捕捉并交流双方的人脸图像,以是换脸的效果在视频中极为粗糙,便是两张中年男性的人脸图片在随着他们的身体晃动。直到当年6月,当时即将从蒙特利尔大学毕业的博士生伊恩·古德费洛(Ian Goodfellow)发明了一项名为“天生对抗网络”(Generative Adversarial Network,后简称“GAN”)的技能,这项技能后来深刻地改变了人工智能领域的发展。
在那之前,AI研究职员已经在利用神经网络作为“天生模型”来创造新的图像内容。但是结果常日不是很好:打算机天生的脸部图像每每模糊不清或涌现缺点,比如会没有耳朵。古德费洛的朋友们提出的操持是对构成照片的各个元素进行繁芜的统计剖析,但那须要大量的数字运算,难以实现。而古德费洛想出的办法绝妙至极:他将两种不同的神经网络组合在一起,一种AI可以创建真实的图像,而另一种AI可以剖析结果并判断图像是真实的还是假造的。“你们可以把两种神经网络想象成是艺术家和艺术批评家。”古德费洛后来自己也举了很妙的例子,“天生模型希望能骗过艺术批评家,使批评家认为其天生的图像是真实的。”在这种“对抗”的过程中,它们相互督匆匆、相互进步,终极会创造出越来越真实的“虚拟内容”。
“只要你的目标是通过神经网络天生一些东西,基本上你是离不开GAN的。”邢骏对本刊说,“由于它的效果特殊明显,它能够天生非常高保真、高精度的图像内容。”邢骏现在是一家游戏公司的高等研究科学家,在此之前,他在喷鼻香港大学拿到了打算机科学的博士学位,又到南加大做了一年半的博士后事情。他将自己研究的重心称为“数字人体”,而脸部作为人体的一部分,自然也是他的研究工具。
邢骏说,自GAN涌现之后,一大波图像天生的运用研究如雨后春笋般冒出来。他当时也在南加大创新研究中央(Institute for Creative Technologies)做基于GAN的干系研究,详细来说,便是如何通过一个人的一张照片来天生这个人的视频。严格说来,这个研究方向并不属于“换脸”。但由于大家的技能根本都是GAN,以是当2017年年底Deepfake涌如今美国的论坛上时,邢骏及他的同学们都以为很惊异,他们惊异的不是Deepfake在技能上有多大的打破,在他们看来,Deepfake在技能上乃至谈不上“创新”。
邢骏阐明说,实在Deepfake不限于换人脸,用它这个框架可以换任何东西,换成猫的脸、狗的脸都是可以的,只要给天命据都没问题。他们惊异的是,原来把干系技能运用到“换人脸”这个场景中,可以引起这么广泛的兴趣和谈论。
长久以来,“换脸”基本是一项做事于高端影视行业的事情。在Deepfake涌现之前,换掉图片中的人脸一贯不算是难事,用PS软件就能完成;但将视频中的人脸换掉基本是一项等闲难以完成的任务,除了须要先利用传统打算机图形学构建一个3D的人脸模型外,还需一帧一帧地对影视画面进行人工调试,很费工夫,基本只有好莱坞才能完成这种“几千万换一张人脸”的事情。
而Deepfake的涌现像是打开了一个潘多拉的盒子,它将这项事情的门槛降到了险些每个普通人都可以的程度。全体流程基本可分为三步:一是提取数据,二是演习,三是转换。很快,利用者乃至都不用自己演习模型,2018年1月,有人推出了Windows程序FakeApp,许可用户很轻松地低廉甜头换脸视频,纵然他没有任何AI方面的知识。FakeApp只须要一个包含Nvidia GPU的个人电脑、3~4GB的存储空间,就能天生换脸视频,用户只须要自己找到演习神经网络所需的材料即可。FakeApp之外,DeepFaceLab等打着相似旗号的运用也相继出身。但这些运用的官网现在基本都无法打开,缘故原由都是被一些人滥用到了色情等造孽用场上。
作为互助伙伴,蒋坚和饶玲正带领公司在AI换脸的路上困难向前(宝丁 摄)
依赖影视剧是出路吗?
饶玲的公司今年还是活了下来,当初设想好的直播业务没敢拿去卖钱,是影视行业救了他们。今年上半年的时候,有一个电视剧的制片方找到他们,电影已经拍好了,希望他们能换掉剧中一个配角的脸。新的演员已经找好,若按之前传统“抠图”的办法,这位新演员须要在绿幕前把原演员剧中的戏自己临摹式地重演一遍,然后用电脑手动“抠图”更换掉之前的画面。但这种办法一来极难做到完美更换,再加上那位新演员已经接了一档戏,没有太多韶光合营他们换脸。片方于是抱着试一试的态度找到了他们。
饶玲说,他们当时带着摄像机上门给那位新演员拍了三四个小时旁边的视频素材。详细来说,便是他们在那位演员周围支配了一个三角形的轨道,机器在上面绕着演员拍。“由于我们希望能只管即便拍得全一点,须要他做很多种表情。”饶玲说,“我们有一个技能细节表,比如以笑为例,从微笑到露齿笑,这些表情都是须要做的。”
这样做的目的是希望让机器得到足够多的学习资料。饶玲他们得到新演员的数据后回到公司,开始往自己的换脸系统里灌数据,数据越多,机器学习的效果越好。通过对一张人脸多种微表情的采集,机器能学习到演员全体脸部运动的过程。学完新演员后,他们再把片方供应的原有演员的片源灌到系统中,二者相互对应,如此一周之后,出来的新片源中那位配角的形象就完备换了样子容貌。当然,这时还不是终极的结果,他们还须要请片方的实行导演过来审片,就对方提出的见地再进行调度。这个过程终极花了20余天,对方以为挺满意,付给了他们几十万元的酬劳。
我提出说想看看换完的效果,饶玲十分难堪地谢绝了,说由于电影还没上映,他们也签了保密协议,没办法让我看。在其公众年夜众号上,他们倒是宣扬了自己另一个互助项目,是一部由中国电影株式会社出品、名叫《影象切割》的电影,导演是果靖霖,演员有郭采洁和刘雪华等。据其自己透露,他们也是用自己的AI换脸技能换掉了个中一位配角的脸,换脸时长为2分48秒,共有15个镜头。查找干系资料,原来这部电影年初就已经拍摄完毕,最初宣扬中包括了演员赵立新,但今年4月,赵立新由于个人辞吐不当的问题引发巨大舆论争议;到了6月,《影象切割》到上海电影节宣扬时就已不见了赵立新的名字。
在零零发科技的办公室,我考试测验求证被换脸的演员是否便是赵立新,饶玲笑而不语。但他们还是给我展示了一些视频画面,画面中的演员乍一看很像赵立新,仔细一看却又不是他。盯着将近20寸的显示器屏幕看了半天,我以为自己找不到马脚。蒋坚略显得意地说:“你放心吧,你肯定找不到马脚,我们这都是在电影专业级的监视器上反复考验过的。”今年,他们已经完成了两部电视剧和一部电影的换脸事情。饶玲说,他们真的很感激影视行业,由于是这个行业把他们公司给救了。蒋坚也说,他们现在就只做影视行业的买卖。
这并不是他们一家的想法。另一位来自北京的创业者孙博某种程度上也是这么想的。在转行进入AI换脸行业之前,其公司在考试测验开拓所谓的“直播机器人”,便是那种可以实时和人对话谈天的AI程序。那大概是2017年旁边,他们也把稳到了GAN干系的技能,就考试测验为机器人开拓实时视频图像。
孙博说,他第一次觉得到“换脸”这个事儿能单独拿出去做是在今年2月份。在那之前,他们公司实在也接过一些小的换脸事情。最早是在2018年年初,从小在铁道部大院里终年夜的孙博去一个故宫老专家的家里玩,那位老专家抱怨说,自己由于嗓子被雾霾搞坏了,没法给一个南京的博物院录讲解视频。孙博一听,以为自己能帮上忙,由于用到的技能和他们给机器人“做脸”差不多,就让老专家搭了个线,他们给老专家拍了20分钟的素材,回去找了一个配音演员坐在镜头前照着老专家写好的稿子念,他们再把配音演员的脸换成老专家的。“那时我们并不以为这是一个业务,便是顺带手做着玩的。”孙博说。
直到2019年2月,有网友在视频网站Bilibili上传了一段视频,在那段94版《射雕英雄传》电视剧的一个片段中,本来由演员朱茵扮演的“黄蓉”被更换成了杨幂的脸。由于换脸后的效果看上去惟妙惟肖,微博阅读量迅速打破了一亿。虽然视频作者很快因肖像权等问题将视频撤下,但也让很多普通人第一次意识到,“AI换脸”技能竟已发展到了如此成熟的地步。孙博这时也创造,原来换脸可真是一个又大略又赢利的买卖。
孙博回去急速组织公司的技能职员研究干系的算法,据其自己说,他们找了5000部电影的素材演习机器,很快得到了自己的换脸模型。今年,他们也接了几部电视剧的换脸事情,大部分都是由于“限韩令”要换掉个中某个韩国演员的脸。他说,由于换脸的本钱紧张是演习模型,以是一部影视级的剧集换脸本钱大概在50万元旁边,“你换两秒也是50万元,你换100集也多不了多少,由于后面我们交的都是电费了”。
换一张人脸当然只是开始,孙博乃至对我说,影视行业未来的趋势一定是整部剧都是AI天生的。到了那时,作甚真?作甚假?这些问题都不主要,也都说不清了。
“造假”与“反造假”
看样子,这样的技能在影视行业彷佛有广阔天地,但目前从事干系事情的大部分还是饶玲及孙博这样的创业者,大型科技公司对此要么视而不见,要么三缄其口。一家海内顶尖的AI视觉公司对本刊说:“我们暂时没有关于这方面的内容可以讲,也不太方便做过多的评论。未来如果这样的技能更规范、有更可行的运用处景,我们可以再对外分享。”
孙博自己虽然还在做这方面的业务,但他说,“换脸”这项业务一个最大的问题是,你没有办法让别人知道你换了脸。“由于一旦你让别人知道你换了谁,比如你在电影里换了某个明星的脸,或者哪个博物馆的专家是换脸上去的,不雅观众就不愿意看了。”孙博阐明说,“人本能就会以为我不想看,由于会以为我被骗了。”因此,险些所有和他们互助的影视公司及直播公司都签了保密协议,没人乐意承认用了这项技能。
这个问题困扰着环球想要把这项技能利用到实际生活中的人。邢骏今年年初才从南加大返国,他说,他认为这项技能最有发展前景的运用还是文化娱乐方向。在美国,他的很多同学也是去了工业光魔之类的影视殊效公司事情,他现在做的事情也是考试测验用AI干系的自动化技能制作游戏里的人物形象。他阐明说,换脸技能在其他运用层面或多或少都会涉及隐私的问题,由于这项技能必须经由本人的赞许往后才能利用,这会大大限定它的一些运用处景。“以是我认为它可能会运用在一些比较窄的领域,比如影视,比如虚拟现实,就像我们现在打电话最多可以看到对方的视频,往后戴上头盔,你就能看到一个3D的真人形象展示在你面前,这可能便是换脸技能的一种运用。”
今年,孙博的公司拿到了天使轮的投资。投资他们的不是一家投资机构,而是一家从事“全息3D视觉技能”的公司。其投资人在采访中不愿透露公司名称,缘故原由是“公司即将上市,很多信息不便透露”。但他说,他们投资孙博的缘故原由因此为“这一块的市场运用还是挺多的”,而且年初他们让孙博给他们换了一下全息3D视觉的脸,创造效果还不错,就投了。
但这些构想中的运用处景还远未到落地运用的时候,短期内,除了影视行业之外,各种游走在法律边缘的换脸运用仍会层出不穷。微软亚洲研究院11月的最新数据就透露,大约30%经由AI换脸的合成照片、合成视频是人类仅凭肉眼无法识别的,很随意马虎被当作真实信息进行再次传播。因此,学界与业界已经开始研究如何利用AI技能去反向鉴别图像、视频的真伪。在美国,南加大作为环球干系技能的领先研究者,已经开始了研发“检测换脸视频”的技能。在今年6月,其检测系统的成功率可达到92%。
但“造假”与“反造假”永久都处在竞争状态中。邢骏在南加大的导师黎灏是干系技能研发的主要参与者,他说,那些换脸视频的造假者要适应新的检测技能会“特殊困难”,但他仍旧承认,造假者们终极还是能适应这种检测,由于技能本身的发展不会停步。邢骏就坦言,他们当初虽然也看到了Deepfake的色情视频,但他们的把稳力不会在这上面,这种运用乃至会鼓励他们连续去研究这方面的技能,“只不过它在运用处景上会受限,比如它对用户隐私保护性哀求会涌现,但是不妨碍技能本身的发展”。
黎灏末了则提醒说:“随着Deepfake干系的技能变得更易于利用和更强大,我们每个人都有必要更负责地考虑如何保护自己的隐私。
更多精彩宣布详见本期新刊《过去的远见:2020,我们的想象与现实》,点击下方商品卡即可购买