文 | 趣解商业,作者 | 张凯旌
岁末年终,大模型厂商们又秀了一波“肌肉”。
2月1日,此前在大模型领域一贯保持“静默”状态的字节跳动终于有了新动作,其上线了“Coze扣子”AI Bot开拓平台;与过往谈天机器人的形式不同,“扣子”更像是2023年11月Open AI发布的GPTs,可以让用户通过谈天、调用插件等办法,创建个人定制版Bot,实现“0代码”开拓。
图片来源:微博截图
除了字节了局外,猎豹移动CEO傅盛创立的猎户星空也在1月21日发布了自己的大模型Orion-14B;傅盛强调,在企业运用处景中,猎户星空大模型在结合企业私有数据和运用时,即可实现千亿参数级别的模型效果。
而诸如科大讯飞、三六零等在2023年就第一韶光抢滩大模型的厂商,如今则正迅速迭代;前者在近日发布了星火大模型V3.5,后者则上线了大模型搜索App“360 AI搜索”。
就在不久之前,手机厂商也纷纭涌入了大模型赛道。1月10日,光彩发布了自研的70亿参数端侧AI大模型“邪术大模型”,自此,华为、小米、OPPO、vivo、光彩五家国产主流手机厂商在大模型领域齐聚。同时,大洋彼岸的苹果据传也正在测试在iOS 18中引入天生式AI功能。
图片来源:微博截图
“百模大战”彷佛并没有随着韶光的流逝而消声匿迹,反而是愈演愈烈。厂商们如今都打着若何的算盘?2024年的大模型赛道会迎来新的重大变革吗?
01 大厂涌入,赛道拥挤
ChatGPT的涌现并非毫无征兆。
创造它的OpenAI早在2015年便已成立,并在2018年就推出了初代天生式预演习模型GPT-1,这也是ChatGPT最初的原型。
在此之前,业内的NLP模型(自然措辞处理)紧张是基于针对特界说务的大量标注数据进行演习,能力有限。
GPT在自然措辞推理、问答任务和知识推理等方面取得了打破,为此它也得到了微软10亿美元投资。随后,从GPT-1到GPT-2,到GPT-3,短短2年韶光里GPT的能力不断提高。
图片来源:OpenAI官网截图
2022年11月27日,随着由GPT-3.5修正而来的人工智能对话谈天机器人ChatGPT的推出,这个一贯在小圈子走红的研究成果,才第一次为大众所认识。能谈天、画画、写文案、编代码,强大的功能,使得ChatGPT一经发布迅速走红,5天韶光注册用户数超过百万,两个月韶光月活打破1亿,成为史上增长最快的消费者运用。
传至海内,一石激起千层浪。人工智能竟然已经发展到如此地步了?震荡之下,淘宝上售卖ChatGPT账号乃至都成了一学买卖。与此同时,看到巨大商机的各界大佬们,也纷纭了局,表态要尽快推出自己的大模型。
从2023年的3月到9月,各个互联网大厂在该赛道争先卡位。从百度的大措辞模型“文心一言”、360的智脑大模型,到阿里巴巴的“通义千问”大模型、科大讯飞的星火大模型,再到腾讯的混元大模型,海内传统的三大互联网巨子“BAT”悉数了局。
此外,华为、京东、商汤科技、网易有道、昆仑万维(300418.SZ)等等都陆续推出了大模型产品,乃至连移动、联通、电信三大运营商,长虹等家电生产企业,清华、复旦、中科院等科研院所和高校,都发布了各自的大模型。
图片来源:华为云AI"大众年夜众号
2023年5月的中关村落论坛上,专家口中中国“10亿级参数规模以上”大模型的发布数量尚为79个;而据GitHub的统计数据,到2023年底海内已经发布的大措辞模型靠近300个。“百模大战”早已不是虚言。
不过比较当初外卖界的“百团大战”,“百模大战”对资金的需求更为苛刻。
根据NVIDIA官方信息,在演习底层模型阶段,演习一次1750亿参数的GPT-3须要34天、利用1024张A100 GPU芯片,而为了坚持日常推理,OpenAI至少须要3.24万张A100;以此推算,ChatGPT仅硬件本钱就超过了8亿美元。
昆仑万维集团CEO方汉更是公开表示,“没有2000张A100的卡,实验都做不了”。为此,海天瑞声、因赛集团等“AI观点股”乃至接连发布定增预案,召募资金用于演习大模型。
图片来源:罐头图库
此时,如何在缩小与ChatGPT差距的同时,尽快找到运用落地的方向,并实现自我造血,成为了“百模大战”中,每一位参与者都要面对的问题。
02 大模型,有何运用处景?
从商业角度剖析,大模型带来的机遇,可以概括为本钱减少效率提升、原有市场需求再扩大、创造新的市场需求三大类。
大模型超强的人机对话、图文及音视频天生能力,不但让其在传统客服场景中得到了广泛运用,对付游戏、影视制作等也产生了深远影响。
阿里、美团的在线智能客服算法,以及中国移动的“九天算夜模型”、中国电信的TeleChat大模型等,都属于此类产品,将运用处景直接锁定在了智能客服、聪慧政务等方面。在2023年的亚运会上,科大讯飞与中国移动联合推出了基于星火大模型的5G新通话,接完电话之后,申请做事,会即刻转成笔墨、天生纪要、天生待办事项。
游戏、影视制作方面,导演陆川曾在采访时表示,“用AI画电影海报,15秒出来的效果比专业海报公司做一个月的还要好。”
图片来源:微博截图
原有市场需求再扩大,则表示在对付传统业务的升级上,这也是大模型运用最广泛的领域。
以传统的搜索引擎为例,接入文心一言后,在百度搜索框里输入问题,给出的可以不再是链接,而是一个更确定的答案。以此为根本,百度舆图、网盘、文库等运用都能通过接入大模型进行重构。
旗下业务浩瀚的腾讯,对腾讯云、腾讯广告、腾讯游戏、腾讯会议等多个业务和产品,也已完成了接入腾讯混元大模型的测试,并取得了初步效果。
图片来源:腾讯混元官网截图
此外,在传统的教诲、医疗、汽车等领域,大模型也得到了广泛的运用。
接入讯飞星火大模型后,科大讯飞的学习机实现了AI一对一赞助传授教化、中英文作文批改、口语陪练等功能;百度推出了家当级的医疗行业大模型“灵医”;华为云盘古大模型的赋能,则让问界新M7在智能驾驶领域“遥遥领先”,两个月大定打破10万台。
在创造新的市场需求方面,AI超级助理、AI机器人等需求也被不断创造出来。前者,包括文心一言、讯飞星火、通义千问等在内的各家通用大模型都有相应产品,它们大都能理解用户的措辞语义,并具备图像理解能力,可以通过调用软件API,利用各种各样的工具来帮助用户完成任务;而后者则已有包括优必选、追觅、宇树在内的不少于 10 家机器人企业,展出过干系产品。
图片来源:通义官网截图
不过,在一片欣欣向荣背后,也存在隐忧。比照各家大模型的运用不难创造,不管是提高效率还是扩大需求,市场上绝大多数的运用,实现的功能都较为雷同。
以AI学习机为例,除了科大讯飞有干系产品外,接入子曰大模型的网易有道、接入MathGPT的好未来、接入银河大模型的作业帮,以及接入文心一言的百度、接入360智脑的360,都有类似的产品在售。功能方面,各自宣扬的也都大同小异,AI一对一辅导、全科AI作业助手、虚拟人口语教练等,站在消费者的角度,险些很难体会到个中的差别。
图片来源:罐头图库
只管各家都能拿出一堆的排名榜单来论证,自己的大模型得分更高、能力更强;但表示在实际运用中时,那百分之几乃至是千分之几的差别,还是让人不得不产生迷惑:我们真的须要这么多大模型吗?
03 2024会涌现“杀手级运用”吗?
只管市场中的大模型让人眼花缭乱,但行业对大模型发展的趋势还是形成了一定的共识。
百度创始人李彦宏就曾表示:“人类进入AI时期的标志,不是产生很多的大模型,而是产生很多的AI原生运用。”360创始人周鸿祎也在今年年初谈及大模型发展趋势时称,2024年将成为大模型运用处景之年,会涌现“杀手级运用”。
这也意味着,大模型与C端用户的间隔会越来越近。
字节的“扣子”平台便是一个例子。据“趣解商业”理解,其有着无限拓展的能力集,用户可以通过添加插件的办法,来不断强化自定义Bot的能力;此外,用户还能将本地文件上传到Bot的知识库中,供其学习;创建出来的机器人,还能支配在不同的社交平台和运用程序上。
图片来源:扣子官网截图
这即是是给用户供应了自己开拓谈天机器人的机会,让更多人能参与到AI生态的培植中。
与此同时,大模型也正在经历软件、硬件一体化协同的过程。
在这方面,智好手机厂商无疑是业界的代表。据“趣解商业”不完备统计,在国产智好手机中,目前华为Mate60 Pro、小米14 Pro、vivo X100系列、OPPO Find X7系列、光彩Magic6系列等手机都已搭载大模型。
这些大模型除了能让AI助手变得更为智能外,还有一个重点的运用领域是手机相册。原来想肃清照片中的其他游客,只能用PS,且磨练手腕和技能;现在直接应用AI抹除功能,就能一步到位且险些没有马脚。
类似的还有美图公司(1357.HK)自研的AI视觉大模型“奇想智能”。其已与三星达成互助,用户可以在Galaxy S24系列手机上体验AI图像编辑功能;不仅可以“智能p图”,还能通过用户给出的图片进一步天生“AI画风”。
图片来源:微博截图
与手机对标的场景是PC(电脑)。1月,遐想已经发布了AIPC产品,其在内嵌大模型后,有更强的算力支撑能力、人机交互更为智能、运用生态也更加开放。
而金山办公(688111.SH)推出的WPS AI便是可以在PC平台上运用的软件产品。其将重点放在了智能文档上,可以帮用户轻松创作办公所需的文本、PPT,还能自主消化PDF等文件资料,并解答有关这些资料的问题。
此外,教诲也是一个主要的运用处景。科大讯飞、好未来、作业帮、网易有道等厂商都将大模型融入AI学习机中,教诲类学习平板电脑的销量更是在2023年直线上升。而且基于产品的迭代,学习平板的价格还在不断走高。
图片来源:罐头图库
深度科技研究院院长张孝荣认为,大模型未来可能会朝专业化与个性化、低门槛化的方向发展。模型的功能会更加细分,针对特定领域或特定需求进行优化;同时通过供应更友好的界面和更便捷的接口,降落利用难度,让更多的人参与到基于大模型的开拓和研究中。
而且由于算力所限,大模型可能更多地支配在云端和边缘端;这样可以降落打算资源和存储资源的花费,提高模型的相应速率和可用性。
但无论是哪种趋势,都要与实际成本相结合;否则只是一味投入,显然难以为继。
三六零(601360.SH)在2023年上半年,只管新兴业务“360智脑”创造了近2000万元营收,但在9.1亿元的总收入中,占比不过2.1%。
图片来源:罐头图库
科大讯飞(002230.SZ)2023年估量扣非净利润同比低落71%-81%,紧张缘故原由就与公司在自主可控平台上加大认知大模型研发投入有关。
除此之外,如何让用户更好地理解大模型的决策过程和结果,提高其信赖度,也是一个关键的问题。
04 中外大模型差距在哪?
海内大模型家当风起云涌,美国则愈甚。根据《中国人工智能大模型舆图研究报告》,环球累计发布的大模型中,中美两国大模型数量占近80%。早在2023年5月,美国10亿级参数规模以上的根本大模型就已打破100个。
除了广为人知的ChatGPT外,美国具有代表性的通用大模型公司还包括Anthropic、Cohere以及Google等。
个中,Anthropic被称为“OpenAI劲敌”。其研发的谈天机器人Claude能一次性总结约7.5万个单词,比ChatGPT更适宜处理长对话和内容、对大量文档进行深入剖析,而且具备更快的均匀相应韶光。
图片来源:微博截图
Cohere的特点则是其差异化的定位。不同于OpenAI,其武断选择了toB路线,供应灵巧性存储和资料隐私保护路径,强调安全性、隐私及定制化做事。
至于Google,最新的情形是推出了AI模型Gemini,特点是多模态处理和对繁芜逻辑的理解能力。在行业标准MMLU(多任务措辞理解)基准测试中,Gemini是唯一一个成绩超越人类专家测试结果的AI模型。
图片来源:微博截图
北京市社会科学院研究员王鹏认为,中美大模型的差别紧张表示在融资水平、根本大模型发展水平和运用层发展水平三个方面。
据不完备统计,2023年上半年,美国AIGC一级市场中,硅谷在人工智能领域融资总金额约140亿美元,占天下总融资金额的55%,均匀轮次融资金额为3.3亿美元。同期海内子工智能领域则要谨慎得多,投资事宜数量同比低落49%,涉及总金额61.74亿元,同比低落62%。
而在根本大模型发展水平方面,海内大模型还存在数据总量缺少、算力资源缺少、场景渗透率有限等问题。毕竟从公开数据量上看,英文数据本身占主导上风,美国还在采纳多种办法限定中国获取算力的核心资源。
至于运用层方面,中国同样处于跟随状态;个中在办公、金融及医疗领域掉队美国较为明显。
针对浩瀚海内厂商都有流传宣传自家大模型已经超越GPT-4的情形,张孝荣认为:“从理论上说,某些厂商有可能在局部领先于GPT4,但考虑到双方在算法、算力和数据资源等方面的投入,海内模型全面超越GPT4的可能性比较小。”
在他看来,须要正视国内外大模型的差距,这涉及到技能、人才、资金等各方面的成分。
好是,中国有着超大的市场规模以及丰富的运用处景,为大模型的落地运用供应了广阔的空间和条件。而且越多的数据、场景,越能让大模型更实用。这让中国在底层研发技能上略逊于美国的情形下,依然具备赶超美国的机会。
但无论中国还是美国,在大模型这条赛道上都还有很多难题待解。最范例的便是输出结果可信性不敷、稳定性不强、以及安全性等问题。
对付人和AI来说,这都将是一个长期的学习过程。