IDG 创始董事长熊晓鸽,刚刚盘点完 IDG 深耕中国企业做事多年的成果,台下,GE 中国公司 CEO 便发出了不合时宜的灵魂一问:

「中国有很多伟大的公司,也有很多超级大的国企,但是为什么便是没有软件做事的 to B 巨子?」

热闹的会场,顿时一片沉默。

那时,将缘故原由归咎于「投资人不给力」的熊晓鸽大概也不会意识到,他反思自谦的 2016 年,已经是国产 SaaS 行业在一级市场最热闹的日子。
在此之后,中国企服领域的投融资市场,便涌现了连续近十年的漫长冬天:

为什么说国产大年夜模型的野心都藏在 MaaS 的生态中

本该主打标准化做小客买卖的 SaaS 公司,在融资文件里信誓旦旦表示,要像 Salesforce 一样,做到 SMB(小客)收入占频年夜于 80%;转头中国银行却直接甩出数据,中国中小企业均匀寿命只有 3 年,不到美国一半,只有日本的四分之一。

转头做 KA(大客户)买卖,却创造大客户全都有自己的想法,这家重发卖,那家重报销,一个又一个定制化案例做下来,SaaS 变成了堆人头的苦买卖。

参差不齐的数字化培植与各式各样的需求共振,于是,范例的中国式 SaaS 出身了:

和大客要收入,标准化就会消逝;向小客要增长,小客原地破产。

那到底有没有一种 to B 的商业模式,能同时做到标准化与赢利两不误?

模型时期的到来,一个新的答案模糊浮现出来。

01 大模型的「拼多多时候」

即便「是兄弟就来砍我」的拼多多,大概也预见不到国产大模型的猖獗。

「到本日为止一年多的韶光,我们完成了 1 万倍的贬价。

这句话省略的主语是大模型,来自智谱 AI Open Day。

智谱是谁不必多说,公司身上的标签包括但不限于:海内最早研究大模型的团队、清华系背景、最早进行大模型商业化的团队、模型社区 Hugging face 中无数开拓者打仗措辞模型的第一站。

只是,大模型、贬价、明星独角兽、一万倍,几个关键词叠加,并没能引起太多反应。

所有人都已经见怪不怪:

过去不到一个月韶光里,某金融私募背景的大模型公司打响贬价第一枪后,智谱、字节、阿里、百度、讯飞、腾讯,乃至外洋的 OpenAI 全数了局。

笔墨游戏与价格炒作齐发,大模型贬价背后到底多少虚实,业内人都心知肚明。

在明处,输入价与输出价的模糊表达,轻量模型与核心产品的混为一谈,让所谓贬价犹如电商 618 期间的眼花缭乱的优惠券叠加,没有十年功底,根本看不出所谓贬价的真实幅度。

而在暗处,当所有对手都举起贬价的宣战大旗,大模型家当也随之被快进到淘汰赛的环节。
敢贬价只代表拿到了入场的门票,模型能力是否领先,是否敢拿出最重磅的模型参赛,以及是否敢于开源接管开拓者的评判,才是关键得分赛点。

也因此,在智谱 AI Open Day 接下来的环节中,回答了是否拿出看家模型贬价?贬价后模型性能究竟如何?市场到底是不是买账?回答好这些详细的疑问,才是评判大模型淘汰赛的关键指标。

1、最受欢迎的产品迭代升级:推出四代 GLM 开源模型 GLM-4-9B

这里须要做一个大略翻译:GLM-4-9B 升级的前身是 2023 年智谱开源的 3 代的 6B 模型,过去一共收成了 6 万 的 GitHub 星标,并在最大的模型社区 Hugging Face 上得到了超过 1300 万次的下载,这是不少开拓者打仗措辞模型的第一站。

而四代 GLM 开源模型 GLM-4-9B,比较前一代,首次拥有多模态能力,并拥有更强的根本能力,更精准的函数调用和 All Tools 能力,以及更长的高下文。
比如,GLM-4-9B 模型的高下文从 128K 扩展到了 1M,换算成中文,能同时处理 200 万字的输入,约即是 2 本红楼梦或者 125 篇论文的长度。
而在长度为 128K 的 LongBench-Chat 上,GLM-4-9B-Chat 模型比较上一代提升了 20%。
在长度为 1M 的大海捞针测试中,GLM-4-9B-Chat-1M 得到了全绿(无损)的好成绩。

此外,基于强大的预演习基座,GLM-4-9B 的模型中英文综合性能比较 ChatGLM3-6B 提升了 40%,比拟演习量更多的 Llama-3-8B 模型,不仅英文方面有小幅领先,中文学科方面更是有着高达 50% 的提升。

价格上,该模型已经被纳入智谱开放平台上的 API 的家族中,以 GLM-4-flash 版本对外做事,价格相对付之前的 GLM-3 Turbo 连续贬价 10 倍,仅须要 1 毛钱就可以拥有 100 万 token。

2、拿出看家产品:GLM-4 模型升级,小尺寸版本贬价 99%

GLM-4 是目前智谱所有大模型产品线中最重磅的模型,多家威信英文测试榜单中,其整体效果已经逼近 GPT-4,在海内企业最须要的中文任务上,则全面超过 GPT-4。

其小尺寸 Air 版本,在性能非常靠近 GLM-4 的背景下,价格直接降落至此前的 1%,达到一元/100 万 token。

GLM-4 模型本身,则进一步升级为 GLM-4-0520 版本,综合能力提升 11.9%,指令屈服能力提升了 18.6%。

3、针对企业需求:定向贬价

实际支配中,大部分企业除了须要更高的性能,更快的相应速率同样主要。
针对这一需求,智谱推出 GLM-4-Air 极速版,可以在效果不变的情形推理速率增加 162%,做到 71 个 token/秒,换算成中文约即是每秒展示汉字数量 100+,价格仅需 10 元/M Tokens。

除此之外,针对更多的定向需求,智谱还推出了全模型矩阵,除以上提到的明星产品外,主打图生文的 GLM-4V,主打均衡的 GLM-3-Turbo,主打文生图的 CogView-3 同样参与这次贬价。

智谱 AI 公布紧张模型产品价格|图片来源:智谱 AI

比较于市情上各种眼花缭乱,却只拿出「非主流」模型贬价的做法,智谱险些搬出了大模型百口桶「参战」。

只是,随之而来,一个新的问题产生了:

贬价是门艺术活,如何降得多让用户得到实惠,只是第一层;如何降得巧,不搞亏钱换市场的流血仗,还须要更多的实力。

02 从大模型「砍一刀」,到 MaaS 的规模效应

「能短韶光成为独角兽,天时地利人和缺一不可。

这是险些业内所有投资人提到智谱时的第一反应。

如果对 2016 年 AlphaGo 大战李世石,点燃环球 AI 创业激情亲切后的故事略有理解,就不难明得现当下投资人们的犹豫。

在那之后的 5 年的故事,注定成为中国 AI 家当史上浓墨重彩的一笔:

2017 狂欢,投资人排队拿着钱将教授们请出象牙塔投身商业的大潮;2018 高光,AI 被写入国家方案,百亿独角兽比比皆是;2019 转型,纯挚的打榜与论文不再能吸引更多的目光,商业化阴云悬浮在每个从业者的头顶;2020 逃杀,随着科创板开板一年,一级市场激情亲切消减,项目退出、弱肉强食成为新的关键词。

——二级市场公开透明的财报已经清清楚楚的显示,算法秘籍傍身的小巨子们,一如曾经的 SaaS,已经被层出不穷的定制化需求,搞到焦头烂额。

而这种 CV 与 SaaS 跨时期的遥相呼应,表面客群选择问题,实际是商业模式问题,根子上则是技能天花板问题。
传统 CV、NLP 的算法通用性不敷,从开始就注定了这将是一条荆棘密布的道路。

但历史的前行,正是在无数个似曾相识的片段重复中,不断呈现新的让人面前一亮的新质变。

MaaS,正是这一波大模型企业交出的答案。

所谓 MaaS,Model as a Service,模型即做事。
参考过去 SaaS、PaaS、IaaS 的定义,根本大模型本身,就可以成为一个独立的产品,进行标准化盈利。

大模型的通用性、扩展性,使得其比较过往所有 AI 算法,都具备更强的操作系统属性。
一个足够精良的大模型本身,就足以交付用户,成为一种新的商业模式。

与此同时,MaaS 从其取名来看,就不难创造,其核心商业逻辑与各种 XaaS 相同,具有极强的规模效应与贬价潜力。

对其进行拆解,MaaS 统共包括两层:

最核心的是大模型层,这一层具备范例的互联网属性。
前期研发本钱极高,但后期的复制本钱险些为零,具备极强规模效应。
而这也是大模型家当能不断贬价的核心驱动力。

这须要企业拥有极强的技能研发能力以及持续不断地更新迭代能力。
智谱团队脱胎于清华学术搜索与挖掘平台 Aminer,险些可以算是全国范围内对付最新科技进展最敏感的团队。

而技能上,自 2020 年开始,智谱便开始了对付大措辞模型的研究,2023 年 3 月 14 号,GPT-4 发布的同一天,公司开源了一代 ChatGLM-6B 的模型,其核心产品 GLM-4 是海内最靠近 GPT-4 水平的大模型之一。
这次 openday 上,最新发布的 GLM-4-9B 开源模型综合能力,全面超过 Llama-3-8B-Instruct;首次开源基于 GLM 基座的视觉模型 GLM-4V-9B,多模态能力比肩 GPT-4V;GLM-4 新 API 模型 GLM-4-Air 的天生速率,更是提升 300% 达到 71 token/s。

算法层之外,MaaS 的第二层是最根本的打算资源。
算力的发展,整体遵照摩尔定律的设定,空想的情形下,晶体管密度 18 个月增加一倍,相应的用户利用相同算力的本钱则每 18 个月降落一倍。

也是因此,无数云做事大厂前赴后继将 MaaS 作为新的增长点,从培植智算中央到启动开拓者操持,从自研到投资,全方位火力覆盖。

但这些还不是 MaaS 的全部潜力。

一个直不雅观数据是,迄今为止,智谱 MaaS 大模型开放平台 bigmodel.cn 的日均调用量已经超过了 400 亿 tokens,过去 6 个月 API 逐日消费量增长了 50 倍以上,企业客户超过 30 万,并实现了汽车、金融、营销、制造等多个行业覆盖,并拿下了 2000+生态互助伙伴、1000+大模型规模化运用、200 多家企业共创,个中包括金山、蒙牛、分众、智己等多个大客户。

至于关于如何避免将大模型做成一个定制化堆人头的苦买卖,大模型极强的通用性特点,决定了其可以通过少数基模培植,就足以覆盖绝大多数的核心用户场景。
而到了详细的家当化环节,则可以通过 MaaS 与行业互助伙伴乃至第三方互助伙伴共建,完成末了一步辇儿业的运用落地。

这方面最范例的运用是大模型在客服对话领域对传统 NLP 的替代。
OpenDay 现场,小米集团小爱团队总经理王刚讲到小米智能语音助手与智谱的互助案例:

过去在小爱同学团队内部,会将各种 NLP 任务细分出包括景象、打算器、音乐、视频、知识问答等近百个垂直领域。
个中,每个垂域背后都是一些特界说务的 NLP 任务,须要专门的算法工程师去完成 NLP 的优化。
这个优化过程,首先要构建专有的任务式问题,然后搜集足够多的演习数据,然后再进一步演习调优。

而随着大模型涌现,小爱团队全面升级背后的架构,将近百个分任务通过大模型总结成一个通用的任务。
两者之间,不仅是纯挚的替代,大模型还同时将小爱的功能进一步拓展至诸如音乐、视频、商品助手、汽车助手、互联网信息汇总等更多高等形态。

图片来源:智谱 AI

其余,结合智谱全系列大模型贬价的动作,也就有了将大模型从只能覆盖高端机,进一步下探运用到入门机型覆盖到全终真个可能——大模型以价换量的逻辑跑通。

与此同时,建立在通用性根本上,规模效应也来的顺其自然。
以智谱与金山办公的互助为例,智谱紧张供应基模,已经拥有大量行业知识库的金山办通则完成更善于的场景化模型微调,两方分工协作,避免了传统 SaaS 做 KA 案例常日会陷入的过分定制化困境。

再进一步,不是所有用户都如小米与金山具备健全的数字化能力。

比较大厂做 MaaS,大模型只是引子,售卖底层的 PaaS 与 IaaS 资源才是终极目的,智谱选择将大模型本身与硬件解耦,为客户供应四种办理方案:

第一种,最轻量级的 API 调用模式,将模型封装成开放平台,企业按照 API 调用量进行付费。

第二种,基于云真个私有化方案。
紧张针对对付部分业务数据敏感,但又不肯望自建算力举动步伐的企业,通过云端算力私有化,为其开辟专门的模型的专区。

第三种,完备私有化方案,对付拥有成熟算力举动步伐的企业,直策应用企业自身的硬件和算力的资源,为其供应大模型支持。

第四种,软硬件结合一体机方案,紧张针对信创场景,通过更高的适配性免去在客户环境中支配与调试过程。

MaaS 加持下,智谱成为了中国大模型家当最独特,也最具商业化潜力的一家。

03 SaaS 的过去,不会是 MaaS 的未来

只管残酷,但一个不得不承认的现实是:虽然热潮才开始一年多,但大模型已经进入淘汰赛。

比较传统 CV、NLP,大模型背后的大数据、大算力、大成本投入,大模型行业从一开始就决定了只有得到更多资源加持的头部玩家,才能笑到末了。
而同样也是这「三大」,导致了从公司成立伊始做出的商业模式选择,就已经为结局埋下伏笔。

而在这个过程中,MaaS 的主要性或许被大大低估了:

如果说,过去是单一算法找场景,拿着锤子找钉子,算法无法办理整体问题,导致除了人脸识别、自动驾驶外,明星场景寥寥。

MaaS 则意味着,在承认企业的需求不同、数字化能力不同的根本上,通过大模型的通用性以及生态上风,来办理这千变万化需求。

一定程度上,这是场技能你追我赶的轰隆战,更是场生态与商业的持久战。

头图来源:智谱 AI

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO