事宜起因是5月29 日,一个由斯坦福学生组成的AI团队发布了一篇名为《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的文章,称演习出了一个开源多模态模型Llama 3-V。这一模型比 GPT-4、Gemini Ultra、Claude Opus 等模型能力更强,而且演习本钱只须要500美元。
Llama 3-V模型的团队成员 Aksh Garg 在社交平台X上发帖先容了这一模型。该帖很快阅读量便超过30万,Llama 3-V 也很快冲上了环球有名开源社区HuggingFace的趋势榜首页。
随后,有热心网友创造,Llama 3-V与清华系大模型创业公司面壁智能的MiniCPM-Llama3-V 2.5在模型构造、代码、配置文件等方面险些千篇一律,只是斯坦福AI团队将个中的变量名称做了变动。该网友更是直接将干系的关键证据逐一截图,进行列举证明。
简言之,Llama3-V疑似套壳抄袭了面壁智能的MiniCPM-Llama3-V 2.5。创造了这一问题的网友在Llama3-V页面上提出了质疑,但Llama3-V页面很快就被作者删除了。目前,Llama3-V 的GitHub项目主页已显示为“404”,HuggingFace上的Llama3-V项目已不可见。作者社交媒体账号上,此前宣扬Llama3-V的内容页已经遭到删除。
6月3日,Aksh Garg在其社交平台上发文回应了质疑,他艾分外的两名成员Siddharth Sharma和Mustafa Aljadery,并表示:“我和Siddharth都忙于自己的全职事情,以是Mustafa为该项目编写了所有代码。我俩都对多模态模型感到非常愉快,并且喜好他向我们描述的架构扩展,以是我们帮助他推广该产品。”他还进一步表示:“在看到这些(抄袭)指控后,我们与Mustafa谈论了Llama3-V的原创性证明,并哀求供应演习代码,但到目前为止还没有看到任何证据。我们向原作者道歉,也对自己没有尽职尽责地验证其作品的原创性感到非常失落望。”
公开资料显示,Siddharth Sharma与Aksh Garg都是斯坦福大学打算机系的本科生,揭橥过数篇机器学习干系的论文。Siddharth Sharma曾在亚马逊演习过一段韶光,目前紧张从事与AI和数据干系事情。Aksh Garg 则在SpaceX、斯坦福大学和加州理工学校等有名企业机构都演习过。Aksh Garg 所说的“编写了所有代码”的Mustafa Aljadery则就读于南加州大学,目前其社交平台X 账号已被设为隐私状态。
值得把稳的是,斯坦福 AI 实验室主任 Christopher David Manning 在社交平台发帖训斥了抄袭行为,同时还对清华的开源模型表达了讴歌。
这一事宜中的其余一个主角面壁智能也进行了公开回应。面壁智能CEO李大海在其朋友圈中发文表示:“技能创新不易,每一项事情都是团队夜以继日的奋斗结果,也因此有限算力对全天下技能进步与创新发展作出的诚挚奉献。我们希望团队的好事情被更多人关注与认可,但不因此这种办法。我们对这件事深表遗憾!
一方面感慨这也是一种受到国际团队认可的办法,另一方面也呼吁大家共建开放、互助、有信赖的社区环境。一起加油互助,让天下因AGI的到来变得更好。”
公开资料显示,面壁智能成立于2022年8月,专注于大模型技能创新与运用转化。创始团队紧张来自于清华大学自然措辞处理实验室(THUNLP),公司CEO李大海是知乎首席技能官(CTO),联合创始人刘知远是清华大学打算机系副教授、博士生导师。
天眼查显示,面壁智能目前已完成两轮融资。去年4月,公司完成由知乎、智谱AI投资的数千万公民币天使轮融资;今年4月,公司宣告完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能家当投资基金等跟投,知乎作为计策股东持续跟投支持。
值得把稳的是,李大海曾表示面壁智能是他作为知乎CTO发起的唯一一个项目。作为中等梯队的互联网上市企业,知乎面对全新的技能浪潮,想要激情亲切拥抱,又无法如创业公司一样全情投入个中,于是选中面壁智能,作为AI大模型浪潮中对知乎技能力量的补充。而知乎所节制大量中文互联网优质语料,也为面壁智能开展大模型演习供应了丰富的数据。
去年4月,知乎与面壁智能宣告联合研发的首个中文大模型“知海图AI”和运用“热榜择要”正式面世。除此以外,双方在面壁智能研发的中文基座大模型CPM-Bee10b、对话类模型产品“面壁露卡”,以及内测第二款知乎场景下的模型运用“搜索聚合”等方面,也开展了广泛深入的互助。
责编:万健祎
校正:李凌锋
版权声明
证券时报各平台所有原创内容,未经书面授权,任何单位及个人不得转载。我社保留深究干系行为主体法律任务的权利。
转载与互助可联系证券时报小助理,微信ID:SecuritiesTimes
END