解释:统计韶光截至 2023 年 12 月 20 日;如模型等信息有更新或变革,请读者自行关注。如您希望得到中国大模型全部统计列表,请在文末联系我们。
灵魂力量与统治地位
2023 年,人工智能领域的尖峰造诣、热点、热钱与热潮,可以说离不开这五个核心关键词:AIGC、Transformer、ChatGPT/GPT-4、Prompt和 OpenAI。
在 AIGC 领域,Transformer 框架已成为所有追逐目标和实现方法的根本。这个框架的贡献意义重大,一起催生了浩瀚强大的模型,如 Bert、Bart、T5、GLM、Bard、GPT-4、LLaMA 和 Claude 等。它引领了一次真正的人工智能革命,并带来一系列造诣与打破。
图丨大模型进化树(来源:公开资料)
这张图展示了 Transformer 在大措辞模型领域的“灵魂力量”,以及 Google、OpenAI 和 Meta 等少数公司的环球研发领导地位。OpenAI 等新锐组织能靠很小规模取得如此巨大造诣的部分缘故原由,正是其核心成员曾参与并一起引领 Transformer 研究的创始与发展。
此外,对付大模型在中国的发展,图中作为唯二代表的百度和清华显然透露出一些独特的意义,我们将在后续文章中深入磋商。
ChatGPT 是改变统统的出发点,已经多次当选中成为 2023 年的年度关键词。GPT-4 则成为了行业的关键指标,是环球同行追逐的能力标杆和发展目标,尤其是其最近发布的多模态能力版本,以及广被揣测、乃至引发了公司内部动荡的某个更高阶版本。
只管一些专家仍持有不同的不雅观点,或推崇其他技能流派,但截至目前,Transformer 仍旧霸占着该研究的主导地位。此框架具有广泛的适用性,最初仅被设计用于办理措辞问题,但后来又被证明还可以运用于图像、视频、音频和其他多种模态。
在浩瀚的实践中,Transformer 不仅实现了其原始目标,还为其他技能路线供应了启迪或利用代价。但随着 Gemini 等诸多新架构的模型在年终出身,2024 年纯挚的 Transformer 方案是否还能持续其场上灵魂核心的效用,非常值得不雅观察。
新颖观点与新型运用
关于人工智能技能的现实发展方向,在今年的企业级市场和运用研究领域达成了一些崭新的共识。这些共识大体环绕三个关键观点展开:AI 助理(Co-Pilot)、智能体(Agent)以及多模态(Multimodal)。
AI 助理:事情的新颖帮手
微软等公司推广的“AI 助理”观点,即所谓的“Co-Pilot”,已经逐渐在国际上得到追捧。虽然海内对此观点的统一定义尚未形成,但其本色内涵已经在各种项目行动上不断显现影响。如百度、科大讯飞等企业的商业化产品动向便印证了这一趋势——尽可能让 AI 成为一线事情者的随身助手,以提高各种效率和个体能力。
智能体:深化、立体化与系统化
智能体技能是 AI 发展运用的另一个主要方向,它涵盖了一系列的架构和技能办理方案。这些方法旨在将大略的问答交互发展为更加立体和丰满的系统和产品,与更多功能、业务和流程深度领悟。这不仅在技能层面会产生许多打破,更有助于生产力工具更新乃至对当代核心商业模式的创新。
多模态技能:跨数据领悟的必经之路
多模态技能的主要意义正在日益表示,尤其是在考虑到国内外在该领域的巨大差距时。目前多数海内模型仍局限在措辞或其他某一单一模态的运行状态,而实际运用需求则急迫须要更为繁芜的多模态数据能力,以让模型能够理解和处理多种类型的数据和信息表示,接入更多的系统和场景。
例如,视觉、听觉、触觉等任何感官类的数字输入与输出都可以被视为某种模态。只管现有模型能较好地处理文本数据,并理解图像与文本之间的关系,但这只是一个出发点。美国在多模态领域的领先地位显著,无论是在图像处理、视觉干系技能、3D 构建、具身智能,还是在工业产品首创等方面都遥遥领先。多模态技能的发展差距正在影响国行家业运用的履行。
生态发展与滋长乱象
在当前的技能生态中,开源模式的主要性愈加凸显。开源不再是学术界和小范围开拓者社区的专利,而是成为了 AIGC 环球性发展的核心动力。国际开源大模型的释出,显著加速了海内 AI 模型的开拓、追随与创新步伐。
与开源生态的发展遍及相伴随的,是行业对模型能力评估标准的渴求。基准测评(Benchmark)作为一种评估 AI 模型性能的方法手段被广泛推崇。行业企图通过创立各种新的、制订易于实现的题库去快速量化模型的能力分,以此推动模型的定型和排名,并让客户和用户更加方便理解个中的利害、比较和代价。
只管基准测评在行业中高度遍及,但其标准化程度却并不尽人意。目前的评测体系、标准、题库以及评分方法,虽然多数源自第三方机构,但其专业度、独立性和公允性却饱受质疑。这一局势导致了行业中的一系列乱象,例如对榜单的针对性刷分、刷榜等滥用行为,评价体系的公道、公正性和可依赖性开始成为各界关注的焦点。
其余,伴随着自媒体行业的发达发达,以及许多利益攸关方面的搅动,过度的宣扬和吹捧成为了行业的另一大“特色”。这种不加节制的推广办法每每歪曲或浮夸了技能模型的实际能力,对付意图选用干系模型的个人和企业来说,可能会造成误解和误导。这样的自证、证明或传播策略不仅未能客不雅观反响技能的真实水平,还正在带来负面影响。
华人聪慧与趋势机遇
2023 年,全天下见证了多个科技领域的深度思辨、激烈竞争和人才争夺。在科研、成本和企业界的创新热度空前,显示出各界对各种新科技的高度重视,尤其在人工智能领域,对顶尖人才的争夺愈演愈烈。
过去一年,华人及华裔研究者在 AI 领域取得显著造诣,他们主导的高影响力学术论文层出不穷。他们的才华和成果频频摘桂,让媒体和行业领袖们多次感慨中国人在人工智能领域的关键影响力。但是,他们中的大多数却不在中国本土学习或事情,这开始凸显出中国在培养和留住关键人才方面的深层次隐忧。
在中国,仅少数如清华大学等组织在大模型研发方面扮演着关键角色,其毕业生和关联企业在海内 AI 研发领域霸占主要地位。今年得到融资的海内 AI 企业,许多与清华有着一定的联系。
在已投身该奇迹的人才和已成功成立的智能技能组织中,有两个干系趋势有望引发产生更大的时期机遇:
首先是 AI 领域新兴公司形态、创业模式、资源互助办法以及商业模式的变革。例如,Midjourney 以极其精简的团队规模实现了亿级美元的付费收入,成为行业征象级案例。其余,Pika 等新晋热门创业公司也展示了独特的创业节奏和产品上线策略,许多类似履历还尚未在中国市场呈现。
其次,是从“高精尖研究寻衅”转向“运用机会寻衅”的行业热点变革。今年在技能领域已经迎来了多重、重大的技能性改造,但个中许多仍处于研究和积累量变的阶段。影视或游戏行业便是一例,它们在生产力提升方面已经悄然进行了几个月的考试测验,AI 技能正在提高这些行业一部分生产管线的效率,乃至在某些局部实现了对人类员工的替代。明年中国公司们在这类行业实战方面的机遇和寻衅将会是关键性、决定性,乃至决斗性的。
管控风险与人类对齐
在今年,人们磋商人工智能的未来时常常遭遇两极化的辩论:一边是对技能潜力的高度乐不雅观,另一边则是对潜在威胁的深度忧虑。在国际政治舞台与舆论台上,今年的辩论特殊集中在 AI 的风险和威胁,一系列媒体宣布、社会事宜、提案、政策乃至立法,以及见地领袖如埃隆·马斯克等的警示性辞吐,都反响出对 AI 安全的极度关注。
相较之下,海内对付这一议题的敏感程度相对较低。这并非表明海内对 AI 的风险不敏感,而是可能缘于手头技能尚未到达一个显著的担忧阈值。但随着技能的不断进步,一旦海内模型也涌现新的打破性发展或智能呈现,海内的思想碰撞和争议声音也可能随之增强。一些企业和干系部门正在未雨绸缪。
AI 的风险问题可以从很多维度展开。比如内容的安全性和利用安全性;偏见和隐私陵犯问题;缺点运用带来的衍生风险,如恶搞、虚假信息、诱骗、网络骚扰和仇恨辞吐;任务归属问题;以及所谓“文明风险”,包括了机器意识的考虑。此外还有对社会经济造成的冲击风险,例如劳动力市场的替代问题、工人的焦虑、就业市场的混乱,以及监管层面的应对策略。目前,经由人工智能峰会等诸多努力与考试测验,各国政府在监管层面已有所行动,并且在一定程度上达成了初步的共识。
那么,面对智能的风险,技能层面的应对办理议方案略是什么呢?此时必须提到的便是“对齐”这一观点。在人工智能领域,“对齐”技能是指勾引人工智能系统的行为,使其符合设计者的利益和预期目标。人工智能对齐的紧张研究内容包括向人工智能贯注灌注繁芜的代价不雅观念、发展老实的人工智能、监管办法的扩展、对人工智能模型的审核与阐释,以及对人工智能系统有害方向的戒备,例如防止其发展出对掌握权的渴求。
在技能方面,对齐技能的研究包括人工智能的可阐明性、稳健性、非常检测、不愿定性量化、形式验证、偏好学习、安全攸关系统工程、博弈论、公正性等。这些研究旨在帮助人类检测规则博弈,并勾引人工智能系统朝向安全合理的目标运行。
在行业行动方面,人工智能对齐已成为当代人工智能系统的一个开放性问题。人工智能研究学界和联合国呼吁加强干系的技能研究和政策制订,以担保人工智能系统符合人类代价。我们须要建立健全人工智能安全管理体系,对人工智能技能本身所致的内平生安、人工智能运用中的衍平生安以及影响和决定人工智能前景的发展安全问题进行系统性管理,确保人工智能安全、可靠、可控。
“对齐”原来指的是如何将 AI 天生的结果优化至人类可接管或喜好的状态。但与时俱进地,该术语的含义已经拓展,它现在涉及的是如何确保 AI 的发展方向与人类代价不雅观、安全性和掌握性等方面的同等性。
值得关注的是,在 OpenAI 近期的“哗变”事宜及其结论中,公司承诺将在技能“对齐”上进行更大的投入,努力将其打造成一个环球性的专门体系。明年海内的模型们也该当、且必须在干系方面做出本色性的共同努力。
天生难题与重重寻衅
在人工智能的发展潮流中,特殊因此 Transformer、Diffusion 等为根本的天生类模型展现出巨大的潜力的同时,即将面临更严苛的难题与寻衅。
严明正视大模型的幻觉问题
在人工智能的语境中,“幻觉”一词被核心技能成员首次创意提出,用以表示模型可能涌现的非预期输出问题。这种精心选择的用词考试测验去缓解对人们和行业可能产生的负面影响,表明纵然是最前辈的机器学习模型,也难免会涌现“类似人类”、“可以理解的”、“认知偏差”等征象。
然而幻觉问题远非小事,它凸显了当前模型在发散性与准确性之间的弹性。业界正致力于通过各种技能路径应对,包括但不限于创造事后补丁或预防机制,挂载额外的模块或系统,以及在模型涌现偏差时及时参与的掌握策略等等。这些考试测验只管很有代价,但至今尚未找到彻底办理问题的答案。
算力需求及其带来的寻衅
今年,算力需求的连忙增长牵动了全体行业,从国家层面到企业,都在算力的漩涡中经历波折。循环神经网络、Transformer 模型等对算力的饥渴程度呈指数级增长。以 OpenAI 的新操持为例,行业内有企业高管曾表示 OpenAI 的需求量级可能达到令人胆怯的“千万级”GPU 算力集群——这个数字乃至远远超出了英伟达的年产量。中国海内的算力卡存货、技能水平、产能等各方面问题更是尤其突出,乃至可能导致明年大模型的开拓步伐不得不被迫放缓。
能源花费与环境影响
能源花费与环境影响是另一前沿议题。例如,GPT-3 模型演习耗电量达 1.28 吉瓦时,相称于 120 个美国家庭年用电总和,伴随而来的是 550 吨二氧化碳的排放量。
根据《麻省理工科技评论》内容,Hugging Face 和卡内基梅隆大学的研究职员的一项最新研究创造,利用人工智能模型天生的图像,所花费的能量与给一部智好手机充满电所需的能量差不多;图像天生,是能源花费和碳密集度最高的人工智能任务。利用强大的人工智能模型(如 Stable Diffusion XL)天生 1000 张图像,所产生的二氧化碳大约相称于一辆燃油汽车行驶 4.1 英里。
这样的操作若无法有效管控,势必引发环境问题的关注。
本钱问题的现实掣肘
从创立角度看,组织和演习一个大模型所需的投入早已达到了数百万美元为出发点的水平,这对付多数企业来说是难以承受的。纵然技能上有所打破,如算法压缩、分流、模型拆分等手段能够降落一些演习或推理本钱,但持续的本钱问题依然如泰山压顶。
海内参赛方的应对努力已有不少,除了广开财路吸引更多成本外,如智谱 AI、百度、华为等海内软硬件厂商的深度互助,培植了绕开算力“卡脖子“的一些崭新思路,值得关注。
从运用角度看,模型运用改造的经济本钱也不可忽略。行业客户对 AI 的兴趣虽然飞腾,但学习、实验、数据整理与支配等环节所需本钱,以及培养新人才的用度,使得投入产出比常常不尽人意。市场上资金紧张,企业在创新步伐上不得不谨慎。
科研创造与不懈努力
在这一波技能改造浪潮中,新型研究机构而非巨子企业成为了驱动力量的主体。
在美国的大模型生态系统中,OpenAI 无疑是一个创新性实体的代表,它以一种新型组织的形态存在,对全体领域的进步起到了不可或缺的推动浸染。而微软研究院与谷歌 DeepMind 等巨子企业的研究机构,作为以科研为导向的组织,也处于核心驱动位置。
在中国,科研驱动的特点更为显著。清华大学及其他领先的高档教诲机构和新兴的人工智能研究机构是科研的先锋力量。只管拥有算力资源的互联网巨子在技能研发方面投入巨大,但它们在科研创新能力上尚未形成主导地位。
在技能方面,模型的泛化能力是当前研究的关键词。技能目标在于不断提升模型在不同任务下的泛化能力。而运用层面的泛化,则是另一回事。将某些人工智能运用,如文本天生技能,拓展到更广泛的生产流程和环节,是运用泛化的表示。
与此同时,业界还在探索如何将经典 AI 技能(如强化学习)与新兴技能(AIGC)相结合。例如谷歌近日推出的 Gemini,便是一次大的改变考试测验,虽然详细成效仍有待不雅观察。
“工程化”是推动技能成功落地的又一关键,在中国这一领域彷佛尚未得到足够的重视。工程化不仅仅是算法和模型的开拓,还包括将模型支配到适当的网络环境、供应良好的架构,并构建支持未来发展的框架和体系。在环球范围内,OpenAI 在工程化方面表现卓越,这一点从 GPT 模型的性能和其运用生态中可见一斑。
OpenAI 以其算法研究能力而有名,但同样不可忽略的是其工程团队的贡献。CEO 和 CTO 等高层领导在产品开拓与算法工程协同事情中起到了主要浸染,担保了模型能被广泛运用,并提升了用户体验。
智谱 AI 或许它在工程能力上不如对手,但从最初智谱 AI(GLM)就没有选择和 OpenAI 走完备相同的技能路线,到现在,它仍是一个相对独立的旗帜,算是中国的一股中坚力量。
目前很多 AI 创业公司的分工可能并不合理,在融资往后他们接管了一些任务,以是他们有很多做商业化设计、有很多做客户做事、市场开拓、或设计行业产品,导致他们的精力不足聚焦。以是到目前为止,用户很难像用 OpenAI 一样去惊喜地利用它们的 C 端产品。
还能看到一些努力,比如 Plugin、GPTs 等,也是 OpenAI 提出的一些创举。即便大家也都不清楚这些东西的结局,但是不可忽略的,他们指明的是有可能会带来用户交互的革命,便是所谓的超级 APP,或消灭老产品。
永续微调与 MaaS 当立
在中国市场,对付大型人工智能模型的运用,业界持有乐不雅观的信心。
这得益于三大支柱:无比广大的市场与行业、强大的定制化做事能力、以及充足的运用型人才储备。在这样的背景下,国产大模型在 2024 年估量将迎来关键的运用支配战役。
在技能层面,微调(Fine-tuning)会是运用发展的关键。它是从传统的人工智能迈向新时期的一个标志性进步。微调的代价在于,它能够将一个通用模型转变为针对特界说务高效的专用模型。这种方法在行业运用、企业运用以及垂直领域均显示出巨大的潜力。值得把稳的是,自 2023 年下半年以来,微调的本钱已大幅降落,为其广泛运用铺平了道路。
模型即做事(MaaS)的观点在行业内得到迅速发展,许多大型企业已在其发布会上提及这一观点。它涉及将云资源与 AI 支配相结合,使模型能够直接供应做事,这被认为是具有颠覆性的,有望重构浩瀚运用领域。
在未来,稠浊支配和端侧运用估量将受到更多的关注。手机制造商、半导体公司如高通、英特尔,以及遐想、汽车制造商等都将开始探索在端侧的运用。
Google 从夏季开始便与 OpenAI 区分开来,推出了不同规模的模型,以适应从小型设备到云打算的不同需求。这种多层次、可伸缩、适应性强的办理方案与将所有打算任务集中到 OpenAI 的做法形成了光鲜的比拟。
这一趋势背后,揭示了一个行业共识:开源的下一步不仅仅是追求“更大”,企业的支配也不一定走向“更大”。谷歌们的方案开始得到广泛支持,由于它为大模型在端侧的利用供应了可能性,而这不会毁坏现有的商业构造。
在各个垂直行业中,金融、电力、工业和医疗等领域已经涌现了一些范例的运用案例。教诲、汽车、生活做事和直播等领域虽在中国市场有打破,针对人工智能大模型的运用,业界的信心源自于其弘大的用户根本、市场潜力以及日益增强的定制化做事能力。随着技能的持续进步,这一领域的发展前景备受看好。然而,真正的寻衅在于如何将模型的能力转化为实际运用,这是当前面临的现实问题。
结语
2023 年,人工智能领域经历了极其生动和充足的一年。在模型技能不断打破的同时,运用创新也不断呈现,既重塑了各行各业,也极大拓宽了人工智能的影响范围。
从模型研发来看,Transformer 框架在过去一年进一步巩固了其在人工智能领域的主导地位。新的模型不断呈现,如 GPT-4、Claude 等,极大推动了 AI 能力的发展。与此同时,打算能力的增长也为 AI 技能供应了更强大的驱动装置。
在运用创新方面,助理式 AI、智能体以及多模态技能等新观点在企业界得到广泛探索,预示着 AI 即将切实感知和助力日常生产与事情。此外,垂直行业中的浩瀚案例也显示 AI 正在加快渗透各个领域。
只管 AI 技能已经取得长足进步,但安全与对齐问题依然无法忽略。通向可信赖的 AI 道路还很长。各方面须要为此付出更大努力,例如强化安全机制、规范评测标准以及加强对人工智能的监管。
展望 2024 年,随着模型技能的不断成熟,AI 运用将迎来高潮。同时,打算资源不敷、本钱问题以及业界影响力分割等寻衅也将随之浮出水面。如何推动 AI 能力的持续创新,且使其成果惠及各行各业,仍将是 AI 发展的重中之重。新一年,人工智能研究领域必将迎来更多的新创造与造诣。
我们相信,只有通过国际互助与共同努力,人类才能把握人工智能给天下带来的机遇,同时化解可能带来的隐忧与风险。
我们将持续关注中国的干系发展,连续梳理完善国际与中国的大模型生态图谱,我们认为,中国须要加强原始创新能力,造就更多天下一流的人才和学术团队。同时应看重 AI 在关键根本举动步伐和核心家当的运用,以实现可持续发展。只有通过不断学习塑造自身上风,中国 AI 奇迹才能在国际舞台上展露风采。
如您希望与我们互换或有任何问题,以及获取中国 AI 大模型企业统计列表,请与我们联系:research@deeptechchina.com;+86 18813083977。