不管是ChatGPT,还是海内各种新生大模型,在日常问答、结合高下文理解等场景,都已做得相称成熟。
就连,集人类聪慧措辞大成的艺术——拍马屁。
AI都能出口成章,讲实话(吹牛)不带一点酡颜的。
你说好玩么,固然是好玩的。
但笔墨的表现力,也终归是不如图片和视频的。
不管是普通网友,还是在捣鼓AIGC的工程师,都渴望能用上更前辈成熟的AI生图、扩图等功能。
此前呢,也确实有好几个AI扩图的运用,陆续面世。
比如PhotoShop的【创成式添补】,能直接扩展出海边全景图。
又比如,机哥之前给大伙详细盘过的,美图秀秀【AI扩图】功能。
它们都很好,但唯独利用门槛上,有亿点点高。
要么是要用到电脑,要么是免费次数有限。
用到一半收费,带来的痛楚不亚于,沐浴溘然断水...
So,或许是意识到,网友们对付AI整活的强烈需求。
浓眉大眼的抖音,最近也搞起了【AI扩图】,还直接登上抖音热榜第一。
愿景十分美好:
“AI扩图,一秒拯救废片。”
但大伙都懂的。
那稍显稚嫩、练习时长还不敷两年半的【AI扩图】。
纵然再怎么稳健,也难免会有翻车的时候。
在抖音的【AI扩图】板块里。
总是能涌现一些,令人始料未及的扩图元素。
比如,这个“一人一狗”躺在床上的场景,满满的温馨。
那经由【AI扩图】处理后,画风一定也很温暖吧?
只见画面中,多出一个年轻貌美的欧美女生。
看来AI还是懂人类最朴实的需求——渴望陪伴。
而男主也确实,在这场景下华美转身,成为了霸道总裁。
填补遗憾、玉成人类,无疑是AI造福人类的一大表示。
但有一个问题,机哥不知当讲不当讲。
咱便是说,这哥们儿的手,咋就剩下半截了?
如果说残酷“截肢”,还能说是【AI扩图】对场景识别出错所致。
辣么,把人下半身补全为“人马”,阁下又该如何阐明呢?
这可不是,AI把人类“动归天”的孤例啊。
还有一位网友,特意选了一张打脸局部图,来磨练AI的扩图准确度。
至于AI扩图的结果嘛。
机哥劝大伙做好生理准备,看了多少有点胆怯谷效应的...
原来好端真个一位帅哥,被AI直接扩成狗子了。
说它瞎搞吧,它精准保留了左上角的灯源。
说它正经吧,又给人类硬生生切换了物种。
反正,这种对着大脸自拍的,就特殊随意马虎翻车。
人类可能不会在同一个地方跌倒两次。
但依赖海量素材演习的AI,显然是会的。
这么看下来。
抖音的【AI扩图】,对人物肢体部位的还原,还是很抠脚。
运气好的话,确实能还原出正常的四肢。
但假如AI玩得旷达点,它绝对能给你整出一些,令人面前一黑的狠活...
各种离谱的翻车,让机哥更加好奇。
处理韶光短一些的【AI扩图】,效果就如此不堪么?
正所谓实践见真章。
我还是没忍住下了个剪映,试试这【限免】的扩图,到底是怎么个事儿。
像这类,直接面向广大用户开放的AI功能,利用起来都很大略。
在App里随便导入一张图片,点击【抖音玩法】,就能找到扩图功能。
初来乍到,机哥还是先挑了一张,难度没那么高的风景图。
而这,是经由抖音AI扩图后的效果。
我是主不雅观以为,效果一样平常般。
首先是整张照片的色调,在经由AI优化后,暗沉了许多。
而且这明明是个电线杆,被AI扩充后,反而成了...椰子树?
如果是食品图,会不会涌现些离谱要素捏?
你别说,扩充得还行。
桌上多了一盆花,右边的食品多出的部分,也毫无违和感。
如此看来,这AI处理一些风景和事物,还是游刃有余滴~
可问题的关键还是在于,它到底能不能人给扩充好。
毕竟钢筋水泥和绿树青山啥的,咱们每天都能拍上。
但好的人像照片,却常常稀缺。
老规矩,咱们难度循规蹈矩,先用国外很火的“老外转头”梗图试水。
扩图后的效果实在还行,AI显然是识别到了图片有街道。
于是就顺着原有场景,补全了行人和店铺。
乃至连背景的景深虚化,都考虑进去了。
但机哥还是想说,这【AI扩图】只能看个整体氛围感。
假如像列文虎克那般细看,那基本没有一种图,是能经得起磨练的。
比如这张图里的牛仔裤,就莫名其妙被缝合了赤色布料,脚的形状也很奇怪。
接着再来一个,很经典的“思考的黑人”图。
该说不说,这次的【AI扩图】效果就很棒。
整体看下来没啥违和感,翻车的地方也有,但比前面的效果都好上不少。
测到这里,机哥算是摸清了抖音这个【AI扩图】的特性。
画面元素越大略,扩图效果就越好。
毕竟天生式AI嘛,最善于的便是“无中生有”了。
但如果画面要素太杂,AI就会追求“啥都要”,导致照片涌现与现实场景不符合的东西...
比方说,这张图里面的轮椅...
还有一个要点,千万不要只留半边脸给AI。
机哥亲测,半脸图基本试一次,翻车一次。
机友们也不想,自己的肤色被切换,脸部表情被扭曲吧?
不过话说回来。
AI扩图翻车的例子虽多,但不虞味着,AI做不好这事儿。
机哥体验过很多“天生式AI”。
包括纯文本的、文生图的、图片扩展的和图片转视频的...
可以说,“天生式AI”都有一个很明显的特点:
你给它打算的韶光越多,它反馈给你的成品,质量就越好。
但市情上的【AI扩图】功能,基本都面向大众用户的,对出图的速率追求,优于质量追求。
毕竟假如大伙等得太久,谁还乐意用啊。
而追求快呢,就难免会涌现翻车,二者不可兼得。
但我以为,现阶段的痛点,很快就要被更新的技能给办理掉。
更别说,现在的天生式AI,已经进入了——
动动鼠标,就能让静态图动起来的船新阶段。