OpenAI将GPT-4o誉为“全能模型”,这一观点将在本文中反复提及。让我们先来回顾一下GPT-4o的三个上风:
实时交互靠近人类:归功于端到端多模态神经网络,将视觉、语音等多种模态演习成一个模型,简化模型做事工程繁芜度,使反应速率靠近人类。多模态意图理解:感知物理天下的视觉、语音,理解环境、人物、事宜。精通环球措辞:实时翻译表现出色,根据不同的语境调度翻译的风格和语气,模拟不同措辞的风格,中文水平刷新SuperCLUE榜单。二、全能模型将加速5大行业场景演进方向1 —— 家庭教诲:儿童陪伴机器人将迎来第二曲线家庭教诲对孩子的代价不雅观、习气、社会适应能力产生深远影响,当代家长在教诲过程中的沟通意愿、沟通方法、韶光精力普遍受限,全能模型能以沟通互动的办法赞助办理这类问题。
我的不雅观点:全能模型在本色教诲方向的潜力,远大于课程辅导,这正好是国民教诲最缺失落的部分。潜在用户群体可能是一二线城市的80、90后的职场人士,他们的特点是重视启蒙教诲、经济充裕、敢于考试测验、短缺韶光。
看好三种全能模型沟通互动式辅导方向:
1)课程辅导:GPT-4o发布会中展示了数学课程辅导,实测确实能够逐步讲解高考数学的解题思路。学生也可以一边听AI讲解编程,一边在屏幕上查看代码示例和运行结果。这种辅导办法非常个性化,从设定问题到启示思考,再到纠正缺点,末了给予鼓励,全能模型有潜力赞助完全的PDCA学习过程。过去的AI,绝对做不到。
2)本色能力辅导
生理自查:例如“儿童绘画生理评估”,模型通过做画的内容来推断儿童的生理状态、认知和兴趣爱好等。理性答题会刻意掩蔽很多东西,但艺术表达、故事性沟通会将真实生理展露无疑。类似的需求还有儿童烦闷、焦虑评估等。故事性、鼓励、尊重和易懂的办法与孩子沟通,增强他们的自傲心和自我效能感。底线教诲:校园霸凌成为今年的热议话题,为了培养孩子的反霸凌意识,常日会利用有声绘本,但绘本缺少互动性。全能模型的互换能力可以填补这一点,通过互动增强孩子的学习效果。同样主要的还有性启蒙、法律知识、道德规范、社接壤限感和坦诚沟通等,它们对个人安全和社会竞争力有着深远影响,却常常被家长所忽略。天赋系统:智商不代表孩子的全部,儿童天赋系统还包括人际交往、口才表达、自然认知等8个维度。全能模型可以发挥个性化、互动性的上风,结合儿童陪伴机器人帮助孩子发展自己的天赋,提高综合能力的同时,也在自己善于的领域内取得进步。3)环境氛围辅导:家庭环境对孩子的学习动力和习气非常主要。如果家长的感情失落控、过度施压,可能会对孩子的生理产生负面影响。现在职场人士压力都很大,回家面对孩子时难免会力不从心。
如果有一个全天候的氛围辅导AI助手,就可以帮助实时剖析家庭氛围和孩子生理状态,及时提醒,逐日复盘总结给到家长辅导建议,督匆匆家长成为孩子的榜样,而不是等娃烦闷后再去看生理年夜夫。
我的不雅观点:家庭教诲机器人这一轮机遇,AI+机器人的公司会更有上风,互联网教诲平台将受到一定冲击。由于视频课件类的材料数据获取门槛不高,随意马虎在拼夕夕等渠道得到后作为RAG外挂知识,或者演习到全能模型。这意味着未来的课程辅导,比以往更加磨练产品设计与工程整合能力,变相削弱了教研、传授教化的壁垒。
方向2 —— 具身智能:将重塑单身经济、老年经济、家庭做事的场景体验
2024年的具身智能跟过去不再是一个物种,有3项颠覆式技能打破:
1)风雅化动作学习:基于端到端神经网络的动作学习,打工机器人擎天柱、特斯拉FSD采取同款技能,理论上机器人可以学会任何手艺活并且比人更加精准。海内类似赛道比较看好初创公司星尘智能。
2)电机驱动替代液压:电机搭配高性能伺服系统,一次性打破掌握精度、瞬时相应、能耗、体积、安全性等5项瓶颈,最具代表性的便是波士顿动力电机板Atlas的那段宣扬视频。
3)GPT-4o真人级交互:全能模型可以为具身智能注入灵魂,但灵魂与神经系统的连接还须要补全和增强。我预判OpenAI后续版本将针对空间智能来强化,尤其补全触觉模态,增强全能模型与边缘打算的实时协同,提升机器人风雅化的决策、方案、掌握能力。类似方向也建议持续关注Figure、李飞飞创业项目的进展。
单身群体的特色是更看重个人生活品质、没有家庭包袱,可支配收入更多用于消费,同时潜在大量情绪、社交、生理等需求,对定制化体验情有独钟。全能模型加持后的具身智能可以知足:
1)情绪陪伴:“具身”意味着可以在陪伴中供应更强的物理存在感、场景带入感,GPT-4o可以理解用户的信念、希望、意图来拟人式互换陪伴,并且拥有无限的心力、韶光、知识,可以Cosplay各种人设,这是人类无法做到的。
2)社交技能:具身智能可以帮助性情内向、社恐的人做仿照演习训练,扮演成客户、同事或朋友等角色,帮助练习各种场景下的沟通和应对技巧,辅导表情管理和感情管理,战胜紧张焦虑,增强自傲。
3)情趣体验:试想如果有这样一个情趣机器人,形象、声音、性情、动作、技能、剧本都按照你的哀求来定制,会是一种什么样的体验?这里的风险是可能导致单身人群比例进一步上升,也伴随伦理合规的问题。
随着人口老龄化,老年人对康健照顾护士的需求日益增加,具身智能可以供应支持:
1)安全照顾护士:帮忙老年人完成日常活动,如穿衣、洗漱和进食,并监测他们的康健状况,在紧急情形下,它能迅速呼叫接济并关照家人。此外,它还能供应生理支持和思维演习,帮助预防脑力衰退。
2)教诲娱乐:供应文娱内容和知识,帮助老年人学习新知识和技能。比如播放音乐、电影、有声书,陪伴老人谈天,供应康健养生知识。仿照社交、游戏互动,让老人在娱乐中学习新知识,保持大脑生动,丰富老年人的精神生活。
3)数字永生:全能模型可以通过具身智能记录老人的日常多模态数据,包括环境、形象、人格、主要时候等信息,上传到云端重修逝者的孪生分身,让亲友能够在虚拟天下中与逝者“相聚”。云端供应数字族谱、家族故事、数字殡葬、数字祭扫等业务,降落殡葬、墓园的资源花费,低碳环保。
智能家居领域,当前有两个局限:处理繁芜场景、学习能力。例如:扫地机器人,当人碰着地上有一条数据线时会捡起它并放置到精确的位置,但扫地机器人就搞不定。具身智能如果发挥风雅操作、模拟学习的上风,有机会办理烹饪、清洁、收纳等繁芜的家务问题,帮助家人专注做他们内心真正热爱的事情。
方向3 —— 超级助理:Her无处不在,人类将沦为硅基文明的勾引程序?
我们可以试想这样一种画面,全能模型在云端作为超级助理,其分身遍布在生活中作为终端入口,大概会发生小明这样的故事:
1)出发地:家
清晨,小明在助理的呼唤中醒来,超级助理已经让厨师机器人准备好早餐,并根据小明的康健数据调度了营养配比。它挑选了小明可能感兴趣的新闻择要,如果须要的话可以跟小明谈论。它提醒小明当天的日程、交通和蔼象情形,并为他准备了得当的衣服、出行物品,调度了室内的温度和湿度。
2)途中:车内
去往绿道的途中,助理通过FSD帮助小明解放双手,监控实时交通状况,自动避开拥堵路段。车内,安排了一位机器人美女伴侣分身,陪他谈天、玩游戏。家里的机器人已经处理了早餐的厨余垃圾等清洁事情,开窗透风、照顾宠物。刚好,助理把稳到小明的投资组合中有一各交易策略被触发,它自动实行了交易,将虚拟币的浮盈落袋为安。
3)目的地:绿道徒步
到达徒步的绿道后,助理通过智好手表与小明保持联系,供应实时的景象更新和安全提示。它帮助小明方案了一条既安全又风景幽美的徒步路线,推举最佳的拍照地点。在小明享受徒步时,助理监测他的康健状况,确保不会过度劳累。徒步结束时,家里的厨师机器人已经开始在洗菜、切墩,伴侣机器人已经采购好消费品回到车上,准备帮小明放松肌肉疲倦、聊聊徒步体验。
全能模型为上述场景带来了两个体验变革:
单场景体验极致闭环:全模态理解用户的意图,用靠近真人、替代人的办法来办理细分场景的全量问题。跨场景体验无缝衔接:通过主动互换+学习用户习气的办法,来实现超过韶光、空间的全场景行动方案与动作衔接。我的不雅观点:为什么马斯克说特斯拉不是车企?由于特斯拉实质上是做AI机器人的公司。我相信,未来凡是把车当成“车”来做的车企都会陷入竞争劣势,把车当成AI机器人、超级助理入口、能源管理节点做的公司更有机会。全能模型,将加速这种Her无处不在的智能化趋势。
方向4 —— 智能咨询:认知茧房加速形成,咨询分身增强领域IP的睡后收入
互联网时期,搜索实现了信息平权,大幅降落信息获取的门槛。Feeds流构筑了信息茧房,帮助一部分人进化认知、做好流量买卖,也让另一部分人沉迷于人性弱点。
我的不雅观点:AI时期,全能模型将加速认知茧房的形成,在局部范围内做到科技平权。由于领域IP得到了更强的咨询做事输出能力,用户有了更加高效学习、办理问题的沉浸式入口,认知发展的门槛将越来越低。
未来智能咨询可能的做事模式:
新模式可以带来哪些明显的变革?
1)需求端_用户
办理效率:用户可以用实时沟通的办法享受咨询做事,不须要等IP本人。价格便宜:比IP本人咨询要便宜很多,比如10元一次的轻量咨询,用完即走。咨询体验:全能模型以更靠近与真人沟通的办法进行咨询,高情商、人性化。备案后的全能模型将拥有相对较正的三不雅观,没有主不雅观偏见和人性弱点。2)供给端_IP、领域专家
生产效率:领域IP们通过录制视频、随口记录等办法借助全能模型快速天生原生态知识,过去很多没有精力梳理材料、做IP的人也可以参与。做事效率:全能模型可以同时向所有客户供应实时、个性化的咨询做事。精准分流:全能模型剖析客户意图天生画像,将高净值客户转给人工做深度咨询,帮IP本人更聚焦高代价区域。运营效率:全能模型极大降落了知识的天生门槛,扩大了知识数据的来源,提升了问题办理覆盖范围,IP根据用户与AI分身的互换反馈动态优化知识,形成数据飞轮的复利效应,让分身的咨询能力可以快速进化。产权保护:IP的私域知识不透明,竞争保护窗口期比以往更长。只要定价合理,至少能让原创者先赚到一波,不至于像网课那样苦苦研发出内容一经发布就为他人做嫁衣。通过认知升级和知识更新,还可以动态加固壁垒。预判一个财富密码,认知差 + RAG + 全能模型 = 睡后收入。
未来将有大量领域IP和有咨询需求的人从模式中受益。IP乃至不须要规模化作业,仅靠几人就可以获取过去十人、百人级别的商业代价!
方向5 —— 软件做事:整合企业全量知识、增强做事体验,数据要素是关键卖铲人
1)全量知识高效利用:这里我想重新定义下“知识”这个观点。
传统的知识:是指文档、FAQ、规则或者图谱等,可以被人和AI直策应用的信息。未来的知识:物理天下中能被模型理解的数据,都可以成为知识。例如:某段Top Salse成功发卖转化的录音或视频,个中蕴含的沟通技巧和发卖策略就可以给模型来剖析利用。企业若能为知识管运用体系建立正向循环,将得到更好的市场机会和客户口碑。2)增强客户做事体验
多模态体验:企业有机会实现多模态交互的智能客服系统,利用更丰富的图片、视频数据来给到客户更直不雅观高效的体验。例如:客户可以哀求APP剖析过去一年的消费数据,并天生包含趋势图、饼图、条形图和节省建议的报告。这种个性化做事在过去是无法即时供应的。体验效率提升:按用户需推举、沟通商量的体验,肯定比主动搜索更爽。举个例子:旅游APP,未来的核心该当是AI交互入口,而不是给一堆酒店、机票、游轮等选项。由于所有产品和攻略都可以被视为AI的知识库,可以像嘱咐秘书一样让APP来完成所有安排。我的不雅观点:从客户体验的角度,催生了大量企业软件做事的商业机遇。由于大多数现有C端APP都值得用全能模型重构一遍。
3)数据要素:AI软件做事的铲子是数据,高质量、细分场景的数据将催生至少5年的数据要素家当增长。有两个迹象表明,即便是OpenAI也非常缺数据:
GPT-4o免费:便是由于短缺高质量的数据。多模态的场景多样性决定了它须要积累几年。实验前期数据质量主要性远大于规模,由于高质量数据代表着一种工艺标准,代表对天花板的极致追求,无法绕过大量人工处理数据的过程。OpenAI跟Reddit互助:昨天的新闻,双方互助紧张便是交易数据,Reddit也是Google的数据供应商。三、海内AI厂商面临4个寻衅寻衅1 —— GPT-4o技能成熟度OpenAI为了确保发布会演示效果,一定会精选GPT-4o最善于的场景来展示,实际测试的均匀水平该当多少打点折扣。Sora的宣扬视频也有很大水分,实际出图可用率只有1/300,紧张靠后期,GPT-4o的体验还有待更多迭代与实测。
寻衅2 —— 影响海内复现基模型的紧张成分
海内涵跟进ChatGPT、GPT-4的过程中没有展现出体系化的独创性,Sora发布后仅有生数科技勉强跟进,GPT-4o发布时已经领先海内2代以上。
OpenAI的核心上风到底是什么?我认为是:创新文化>人才>算法>数据>算力>系统工程。
以数据为例:
2018年:OpenAI开始标注GPT时该当初步构建了数据生产流水线、效果实验工程2021年:OpenAI开始标注GPT-3.5,并构建支持RLHF体系的数据。早期模型版本的发布可加速得到高质量数据喂给新版本,形成数据飞轮的复利效应。2023年:海内的大模型数据产线基于开源模拟构建,工艺细节还在持续完善,数据质量、数据规模还远远不敷。这只是数据视角的差距,更不用说各维度综合差距。
我的不雅观点:国产AI至少掉队5年。一些投资人、CEO们的乐不雅观自嗨听听就好,问他们自家大模型什么时候能拿出平替GPT-4o的效果来公测?一问一个不吱声。
海内厂商如何才能复现GPT-4o?很大程度上取决于Meta何时开源。当然,也看到海内以月之暗面、生数科技等清华姚班系为代表的初创大模型公司,成立1年就取得瞩目的进展,海内AI“产-学-研”联动已初见成效。
寻衅3 —— 全能模型运用的安全性
就在昨天,Bengio、Hinton和姚期智三位图灵奖得主领衔25位环球顶尖AI科学家,在威信科学期刊 Science 呼吁各国领导人针对AI风险采纳更有力的行动,并警告近六个月所取得的进展还不足。刚好2天前OpenAI终结超级对齐团队,安全部门拿不到算力。我认为AI安全之以是难做的核心缘故原由是:
1)对抗性攻击的繁芜性:大模型底层基于概率,如果攻击者精心设计勾引模型出错,防不胜防。更何况OpenAI处于技能快速演进的档口,安全体系无法预判呈现的临界点,GPT-4o带来更多的模态和场景,更加大了安全的繁芜性。
2)黑箱中自主拆解目标:如果AI具备定义目标、拆解目标、方案路径的“绝对权限”,哪怕只具备其一,就可能发生这样的场景:人让AI去除掉环球所有垃圾,AI认为人便是垃圾的源头,以是AI把人类灭了。这里的悖论在于对指令的理解可能偏差,AI实行路径的方案过程不可阐明、难以干预、瞬间实行。
寻衅4 —— 领域模型与私有化存在客不雅观局限
1)国产化算力:国产化须要适配,性价比有待提升,热门型号华为昇腾910B须要排队采购。
2)模型参数量与性能:相同硬件条件下,模型参数量越高,呈现效果越好,但相应延时也越高。以是如果要一个钱打二十四个结,就得拆分业务场景,详细剖析选型搭配。那问题来了,GPT-4o这类全能模型增加了多种模态,对模型参数、性能的哀求会更高。
3)私有化大模型的可控性:企业随意马虎陷入一种误区,希望采购1个大模型办理全部业务需求。但实际上目前的私有化大模型大致可以分成三类,如图:
我的不雅观点:从私有化业务落地的角度,我的意见是:L1、L2必备,L0是选配或走公有云。完备方案是“多种大模型 + 传统NLP + 专家系统”,发挥各自的上风。
4)私有化大模型演习:业务每每期望可演习大模型,但目前做过考试测验的AI厂商都遭遇诸多寻衅,包括项目亏损、数据运营投入不敷、演习效果难以达到预期,以及难规模化交付。私有化环境下的产品交付是个体系化工程,繁芜度远超一样平常想象。
我的不雅观点:现阶段务实点的思路是不强求私有化演习,哀求AI厂商在出厂前就针对业务需求,评估好需求知足度。一旦实际交付验证时不及预期,优先考试测验调度知识,其次调度Prompt,末了调度工程逻辑、阈值配置。若试过多种方法依然不及预期,解释该当返厂,待厂商AI实验室中优化到达可用标准,给出效果评测报告,再发布更新到私有化。须要甲乙双方拥有较强的信赖根本与开放心态。
作者:于长弘;"大众年夜众号:弘不雅观AI
本文由 @于长弘 原创发布于大家都是产品经理。未经容许,禁止转载。
题图来自 Unsplash,基于 CC0 协议
该文不雅观点仅代表作者本人,大家都是产品经理平台仅供应信息存储空间做事。