谁还记得,一年前AI天生的视频是这样的:

天生式AI将互联网带入到了一个真假难辨的深伪时期。

“有图有原形”在过去是网友求证笔墨信息真实性时常引用的一句话,如今即便是图片和视频也完备有可能是AI天生的“假象”。

环绕如何分辨AI,近期社交媒体上掀起了一股AIGC内容打假热。

用AI打假AI这些倒反天罡的AI应用正在静静走红AI新榜

实战派通过小游戏练就识别AI的火眼金睛。
8月5日微软总裁Brad Smith在X平台上发布了一个名叫“Real or Not?”的测试小游戏。
玩法很大略,每一轮游戏有15张图片,玩家来判断哪张是AI天生的,哪张是真实的。

游戏地址:

https://www.realornotquiz.com/

辨别难度之高,只错一道题的游戏表现可以超过92%的玩家。

在实战派还勾留在用肉眼“鉴AI”时,技能派寄希望于用AI打败AI。
X博主“Deedy”近期利用Claude的新功能Artifacts开拓了一个大略单纯工具,通过调度图像饱和度来识别AI天生的图片,仅在X平台上就得到了超140万的浏览量。

工具地址:

https://claude.site/artifacts/6890e3d7-e65e-41ff-a7d4-3ccb38040b46

虽然这种检测方法很快被网友实测打假:仅凭图片的压缩迹象和色彩偏差来推断图片是否出自AI之手,这种鉴别方法存在误导性。
由于类似的视觉特色可能仅仅是环境成分导致的,如光照变革或物体表面的反射效果。

但也从侧面表示出,随着AI天生的内容愈发逼真,越来越多真假难辨的图片和视频正在迅速盘踞社交媒体,“鉴AI”也因此从创作者维权、约稿插画师等小众圈层需求走向大众视野。

实际上,这种需求早已推动AI技能在识别AI天生内容方面的运用。

从笔墨到图片再到视频,都有相应的AI检测工具陆续问世。
个中一款AI检测工具乃至在过去6个月里,用户规模从100万增长到400万,实现了盈利。
这些AI检测工具靠谱吗?我们进行了一番探究。

用AI打假AI,GPTZero半年增长300万用户

天生式AI对不同内容形式的影响程度,常日与技能成熟度、市场需求和用户接管度有关。

在ChatGPT引领的这波天生式AI浪潮中,文本内容是首先取得打破的领域,也是目前AI检测工具运用较为成熟的领域。

赛道上的佼佼者——GPTZero,仅成立一年半就实现了数百万美元的收入。
在过去6个月里,其用户规模从100万增长到400万,AAR(年度常常性收入)增长了500%。
用户群体也从最初以西席为主,扩展到了政府采购机构、慈善机构以及招聘经理和AI演习数据标注员等。

GPTZero由普林斯顿大学生Edward Tian于2022年底创建,最初只有一个大略的功能,即根据用户输入的内容,返回该内容由AI天生的概率有多大。

GPTZero基本文本检测的早期UI界面

如今GPTZero的网页端已经相称完善且易用,用户直接在交互框中复制黏贴文本或上传文件,即可对文本进行AI检测。

GPTZero目前供应免费试用,但每次检测字符不能超过5000字。
如需进行更长的本文检测,可以选择最低每月10美元的付费订阅做事,以得到更多的字符检测额度和功能。
(体验地址:https://gptzero.me/)

在不超过免费试用字符的情形下,我们分别节选美国宪法、ChatGPT-4o天生的《黑神话:悟空》大闹天宫版游戏结局和《西游记》三打白骨精原文对GPTZero进行了实测。

个中,GPTZero在识别美国宪法和ChatGPT-4o天生的文本方面表现出较高的精准度。
它成功识别出美国宪法为人类撰写的概率高达99%,而ChatGPT-4o天生的文本中只有几个句子有“人类影响”的痕迹。

美国宪法节选

得到全文检测结果后,用户还可以利用“Deep Scan(深度扫描)”功能进一步识别剖析每个单句的AI含量如何。
目前免费账号每天仅支持3次深度扫描。

ChatGPT-4o天生的《黑神话:悟空》大闹天宫版游戏结局节选

在识别中文文本上,GPTZero给出的结果相称离谱:它认为《西游记》中三打白骨精原文有75%的概率是AI天生的,但众所周知《西游记》作者吴承恩可是生活在电脑都还没有涌现的明代。

《西游记》三打白骨精原文节选

在我们考试测验进一步查看该判断的数据依据时,GPTZero直接报错,显示它不支持对该措辞进行数据溯源。
可见,GPTZero不得当用来检测中文文本,可能是其没有进行过干系数据演习。

此外,干系的AI数据集和抄袭匹配功能也都仅付费会员才能利用。

AI文本检测工具频繁翻车,赛道依旧火热

GPTZero自2023年1月正式推出以来迅速走红,主要缘故原由在于它知足了教诲界对付检测AI作弊的需求。
去年10月,GPTZero还和美国西席联合会达成了一项协议,帮助西席检测由ChatGPT等大措辞模型天生的学生作业。

但与此同时,GPTZero的走红也伴随着一定争议。

例如,曾有网友实测创造,GPTZero会把美国宪法误判为AI天生的文本。

在实际运用中,GPTZero一类的AI检测工具的准确性也备受质疑。
如果西席仅依据这类工具的结果来判断学生是否利用AI进行学术造假和写作,可能会导致无辜的学生受到不公道的对待。

这种情形不是个例。

在AI检测工具的“猎巫”下,即便是那些写作过程中没有用到AI的学生,为了确保自己的论文能通过AI检测,也不得不开始氪金利用这类工具,识别那些可能被AI标记为“AI天生”的文本段落。

就像大模型对话类产品一样,GPTZero也在用户交互框下加了一行免责声明的小字:“This result should not be used to directly punish students.(不能依据这个结果来惩罚学生)”。

也便是说,GPTZero的检测结果仅供参考,并不能作为判断学生是否利用AI进行学术写作的终极依据。

而在国外科技媒体TechCrunch实测中,其他同类型工具AI Writing Check、Copyleaks、GPTRadar、CatchGPT和Originality.ai,准确率表现都不如GPTZero。

包括OpenAI也曾在2023年初推出了一款AI检测工具,但因检测成功率仅有 26%,七个月后OpenAI就关闭了该工具。
近期,《华尔街日报》宣布称OpenAI已经开拓出一款能够高精度识别ChatGPT天生文本的工具,但出于各类利益干系缘故原由迟迟没有发布。

还有业内人士认为AI检测器的反向运用思路是,其难以给出高准确度判断的内容天生领域,恰好证明是更适宜AI产品运用的领域,例如营销文案和广告语,包括GPTZero在内的主流识别AI检测器都涌现了误判。

TechCrunch实测:营销类文案所有检测器都涌现误判

GPTZero的检测事理中有两个主要指标:困惑度和突发性。
困惑度和突发性越高,文本的“人味”就越高;与之相反,AI天生的文本每每具有较低的困惑度,可预测性更高。

此外,GPTZero的CTO Alex Cui曾透露,GPTZero之以是更准确是由于它拥有更多的数据,检测利用的大措辞模型是基于开源工具构建的。

换言之,GPTZero也只是一个“套壳”产品,但它的上风在于数据。

不止文本,多模态AI检测产品正在呈现

文本检测领域已经跑出了一个GPTZero,而多模态AI内容检测的赛道才刚刚朝阳东升。

针对图片、视频和音频等内容的AI检测工具,外洋已经呈现出了Hive AI、AI or Not、Nuanced等产品。

海内近期官宣内测或上线的多模态AI内容检测工具也不少。
例如,创始团队有清华大学背景的瑞莱聪慧(RealAI)推出了一个面向个人的产品级检测工具“尊嘟假嘟”,英文名为RealBelieve,可以让AI假造的图像、音频和视频现出原形。

尊嘟假嘟视频通话实时检测内测界面,来源:36氪

无论是外洋还是海内,虽然大部分AI检测产品紧张做事政府机构和企业级用户,但随着大众“鉴AI”的需求日益兴旺,一些产品也开始向C端用户开放。

像AI or Not就支持个人用户检测图片和音频,界面交互利用起来也相称方便。

数字内容假造检测企业“中科睿鉴”近期完成新一轮融资,目的也是将业务线从ToG拓展成ToG、B和C三条产品线,实现AI鉴伪产品的规模化。

目前,中科睿鉴已面向大众开放了文本、图像和视频检测做事。
在微信小程序搜索“睿鉴AI”即可体验。

与文本检测一样,多模态AI内容检测工具也存在准确率不高的问题。

我们用AI假造的TED演讲美女照片,测了测AI or Not,它认为图片“Likely Human(大概率是真人)”,如果想进一步查看更多检测信息,则须要付费开通会员。

最近X上也有网友考试测验利用市情上的AI图像检测工具,来鉴别美国大选哈里斯的集会场面是否是AI天生的。
但被人回嘴说并不存在“所谓的精确的人工智能图像检测器”,由于很多用户上传检测的图片是失落真的,尤其是来自压缩视频的截图。

天生式AI制造的深度假造风险,仅凭AI检测工具是不敷以办理的,还须要从法律和平台监管层面共同努力。

而GPTZero创始人Tian提出的AI检测愿景,也不仅仅只是供应单点的检测功能,而是通过创建一个独立的互联网检测平台,确保人类和AI天生的内容都能得到精确的归属。