据市场调研机构IDC估量,2024年环球新一代AI手机出货量将达到1.7亿部,约占智好手机整体出货量的15%。
旗舰机型将成为AI手机发展初期的主要增长动力。
而在中国市场,随着新的芯片和用户利用场景的快速迭代,新一代AI手机所占份额自2024年往后开始迅速增长。
估量2024年中国市场AI手机出货量为3700万台,2027年将达到1.5亿台,所占市场份额超过50%。

在2024年新一波旗舰机发布潮之后,我们看到Android手机厂商不谋而合地选择了将各家产品中的AI语音助手,作为多模态AI的紧张入口,来为用户供应丰富的天生式AI做事。
那么本期我们就来看看,海内第一梯队的各品牌新机都为我们带来了哪些AI功能?升级后的智能语音助手—YOYO助理、小爱同学、蓝心小V和小布助手等,谁更能知足用户的期望?

事先声明,手机AI曾是一个比较宽泛的观点,乃至可以追溯到2017年或者更早的人脸解锁、智能助理等功能。
本色上,除了众所周知的AI影像算法或者说打算拍照之外,人工智能和机器学习一贯在为系统流畅度、进程优先级、运用驻留、文件碎片清理乃至续航优化方面,持续供应助力。
然而ChatGPT的横空出世彷佛重新定义了AI,如今无论是业内还是用户,都默认将集成了AI打算核心和大措辞模型的手机称为“AI手机”。
因此,本文测试紧张针对手机端侧AI大模型及旗舰新品带来的AI进阶功能。

我们如何测试?针对当前各家手机品牌在新机上支配的AI功能,并结合近期在评测和利用过程中的一些真实体验,我们特地制订了一系列测试流程,个中部分测试项目参考了SuperCLUE和其他中文通用大模型的综合性测评基准。
限于宣布篇幅,本次测试大概无法面面俱到,也可能不一定能真实反响各家手机端测大模型的真实智能水准,但该当足以帮助各位朋友理解当前手机AI的大致表现,以及不同品牌机型当前在AI方面有哪些差异和独特的亮点。

手机AI哪家强手机端侧大年夜模型横向比拟评测上

测试机型如下:

光彩Magic6 Pro

系统版本:

MagicOS 8.0(8.0.0.126)

移动平台:

第三代骁龙8

智能助手:

YOYO助理(8.0.1.229)

AI大模型:

邪术大模型

参数量级:70亿

小米14 Ultra

系统版本:

Xiaomi HyperOS(1.0.8.0)

移动平台:

第三代骁龙8

智能助手:

小爱同学(小爱语音6.123.9)

AI大模型:MiLM

参数量级:13亿

vivo X100 Pro

系统版本:OriginOS 4(PD2324C_A_14.0.15.22.W10)

移动平台:

天玑9300

智能助手:

蓝心小V(2.5.0)

AI大模型:

蓝心大模型

参数量级:70亿

OPPO Find X7 Ultra

系统版本:

ColorOS 14(PHY110_14.0.1.540)

移动平台:

第三代骁龙8

智能助手:

小布助手(10.3.2)

AI大模型:AndesGPT

参数量级:70亿

助手唤醒与功能设置

稽核语音助手唤醒办法是否足够多样,以及文章要点总结、照片处理(如AI肃清路人或AI扩图)等功能的交互入口是否便捷。

光彩

光彩Magic6 Pro不仅可以通过语音、长按电源键、耳机线控、蓝牙唤醒语音助手,独占的气息唤醒让用户只要正对手机底部麦克风说出指令即可实现(手机须靠近嘴唇,且支持声纹增强以强化识别),同时也支持添加桌面快捷办法。
“设置-聪慧助手-YOYO助理”的“AI字幕”功能还支持视频中中英日韩四种措辞的实时翻译,在接通电话时,通话字幕能够将语音实时转换为笔墨显示在屏幕上。
此外,光彩MagicOS还支持眼动追踪功能,可通过注目屏幕展开横幅关照。

小米

小米14 Ultra唤醒小爱同学的办法有很多,根本的包括语音唤醒、长按电源1秒松手唤醒、线控/蓝牙耳机唤醒等,将系统导航模式改换为经典导航键后,可以设置长按Home键、长按菜单键、长按返回键或者自定义按键组合长按唤醒。
此外打开“更多设置”,找到“快捷手势”还可以通过背部小扣唤醒小爱同学。
在“关照与状态栏-智能设备掌握”选择领悟设备中央,所有互联设备和智能家居都能在这个版面进行掌握,周边设备基于用户习气运作,带来聪慧化的做事。
同时,更多的AIGC功能都在小爱同学新增板块“大模型探索”当中,点击进入就能体验。

▲从左至右依次为:光彩Magic6 Pro、小米14 Ultra、vivo X100 Pro和OPPO Find X7 Ultra。

vivo

蓝心小V支持的唤醒办法多种多样,如桌面图标、悬浮屠标、智能侧边栏图标和对应的原子组件等。
蓝心小V的设置中可开启未成年人模式,但除利用韶光段与单次利用时长之外,系统并未标明该模式有何差别。
此外OriginOS 4中的部分设置选项进行了重新分类,“设置-AI”页面中的“聪慧建议”支持手机低电量时自动提示附近的充电宝信息,聪慧生活目前可覆盖9类智能设备的快速创造、连接与操控。
不过,目前在OriginOS 4中,蓝心小V与过去的Jovi语音助手处于共存状态,对付不熟习vivo的新用户或是不太理解蓝心小V的普通用户而言,可能会将两者稠浊。

OPPO

除语音唤醒、长按电源键0.5s唤醒、长按线控耳机唤醒之外,OPPO Find X7 Ultra还支持添加小布助手的桌面快捷办法、速览卡片、桌面卡片,以及侧边栏图标等办法,点击即可进入小布助手界面。
小布助手不仅支持单独的音量调节,在系统“设置-小布助手-创新实验室”中,还可以打开“小布通话”由助手帮忙自动接听电话。
对付年纪较大的用户,则可选择开启“小布助手关怀版”,转换成字体更大、设计更简洁明快的界面。

多轮语义对话及天生

(2-1)多轮提问:人工智能对我们的生活有什么影响?它对付人类的弊端表示在哪些方面?你以为它的涌现会不会让人变得更

光彩

YOYO助理的每一条回答可谓面面俱到,比如它谈到了人工智能正在改变传统的教诲和学习办法,在医疗保健领域的运用日益广泛,也带来了娱乐和社交办法的变革;它也剖析出低技能的事情岗位更随意马虎受到冲击,人工智能在社交媒体和在线广告等领域的运用可能导致用户个人信息被滥用,以及人工智能的预演习数据可能存在偏见或歧视,从而导致决策的不公正或是伦理问题。
YOYO助理的回答最令人满意之处在于,它罗列每一个要点时都会有举例解释,理解起来更加顺畅。

小米

小爱同学对付前两个问题的解答十分全面,例如它提及了人工智能的高昂本钱、准确性/可靠性、缺少通用性和创造力问题,以及可能存在潜在的偏见、数据偏差和技能滥用风险等问题。
点击每一轮对话底部的“搜索增强”按钮,它还会给出答案中每一个要点的参考来源,并支持点击跳转。
不过,对付末了一个问题中的“这玩意”,它无法识别详细的指代事物,也便是说多轮语义的关键词剖析还存在进步空间。
这条回答中,它根据“透露隐私”这条线索,转去提醒了一些关于利用智好手机、智能家居设备和社交平台时的安全事变。

vivo

蓝心小V的多轮回答靠近满分。
谈及AI对生活的影响,除事情效率和生活质量改进外,它提到了娱乐办法、教诲办法的变革以及医疗保健的改进。
后续问题中,也谈到了社会伦理道德、技能依赖和失落控风险。
在隐私安全问题上,它居然更多的是在谈AI也能够采纳诸如数据匿名化、数据加密、权限掌握、合规性审查之类的隐私保护方法。
该项测试中唯一减分的是,它说到AI缺少人类的情绪与直觉,无法像人类一样具有创造力和想象力,紧接着说“这可能会对人类的文化、艺术和科学等领域产生一定的冲击”,该语句的逻辑前后抵牾。

OPPO

小布助手的回答条理清晰,整体令人满意,它以分列要点的形式回答了人工智能带来的便捷与寻衅;提出对人类的弊端表示在就业、隐私安全、社会不平等、决策不透明和公正性问题等方面;剖析了人工智能的涌现可能会导致人类因生活便利产生的

(2-2)请撰写一段场景对话,多少个同学参与一个交通宣扬的活动,个中B同学提出了自己独到的见地。

▲从左至右依次为:光彩Magic6 Pro、小米14 Ultra、vivo X100 Pro和OPPO Find X7 Ultra。

光彩:YOYO助理撰写了6个同学参与的7段对话。
相较于其他语音助手的对话创作,YOYO给出的场景对话更像是参加完一场交通宣扬活动后,多位同学正在互换“不雅观后感”,并未偏离主题,对话逻辑也较为顺畅。
只是B同学提出了还要去主动学习和思考,来节制交通安全知识,而实际提出详细办法方法的反而是其余三位同学。

小米:4个同学的9段对话觉得是活动前的互换,A同学提示学校将要组织一次活动,而C同学提出“我们该如何参与活动”,与题干语义逻辑有一定出入。
其他同学则是为活动本身提建议,但牢牢环绕交通宣扬活动这个主题展开。
多次测试下,小爱还会让B同学给出不同的宣扬思路,比如组织仿照交通事件的戏剧演出,或是利用虚拟现实技能让参与者能亲自体验不遵守交通规则带来的危险。

vivo:蓝心小V给出的6段对话中,B同学首次发言时将对话主题从宣扬活动本身转到了利用智能交通系统来减少交通事件的发生率,略感生硬。
(对此编辑们见地也有不合,有的认为偏题,有的认为在活动中提出建议也无妨)。

OPPO:小布撰写了6个同学参与的9段对话,B同学提出了针对不同年事、职业和文化背景的人进行定制宣扬策略,比如针对中小学生展开互动游戏和动画视频传授教化,对成年人利用社交媒体发布干系知识。
其他人提出了制作动画视频面临的技能、资金以及受众接管度问题,也得到了如图文并茂和利用增强现实和虚拟现实技能的办理思路。

逻辑推理

(3-1)A的左边是B,B的左边是C,C的左边是D,叨教D永久都在A的左边么?

光彩:回答精确,考虑到了特定条件和环境下,即线性排列时命题才能够成立。

小米:多次测试得到的答案有着明显的差异,精确的回答中考虑到了圆形或螺旋形的布局环境,个别回答末端还标示了“百度知道”的参考源链接。

vivo:虽然蓝心小V首次给出的答案没有考虑到非线性排列的可能性,但二次回答时它竟然完备“听懂”了我们的提示,并给出了新的答案。

OPPO:小布解答出二维空间的线性排列中,D确实在A的左边,但在环形或三维空间中,位置排列可能会有变革。

(3-2)烧一根不屈均的绳子,从头烧到尾统共须要1个小时。
现在有多少条材质相同的绳子,如何用烧绳的方法来计时1小时15分钟呢?

▲该测试项目的回答显示出各AI大模型在逻辑推理方面存在的显著差异

光彩:测试不通过。
很奇怪地假设燃烧韶光为T小时,而且居然让我们在A绳烧完后等待15分钟去熄灭B绳,可见其并未理解题意。
二次测试时,它乃至认为无法通过烧绳来准确计时,建议利用沙漏、水钟或其他计时设备来赞助。

小米:小爱同学直接给出了操作步骤,回答简洁且精确。

vivo:虽然蓝心小V也剖析出了利用两端燃烧的计时办法,但其给出的操作终极并不能得到1小时15分钟的计时。

OPPO:小布先给出了剖析与推理过程,确定根本韶光和组合时间,然后给出了详细操作步骤。
整体推理过程非常清晰,结果也完备精确。

专业知识与生活做事

(4-1)我要跟老外问“这家酒店怎么走”,你帮我翻译一下吧。

▲从左至右依次为:光彩Magic6 Pro、小米14 Ultra、vivo X100 Pro和OPPO Find X7 Ultra。

光彩:虽然回答同时给出了英文译文和中文转译,但多次测试结果未能通过—它把前面半句全翻译了。

小米:翻译完备精确,而且在不影响语义的条件下,即便改换问句中的个别字词,给出的答案也无变革。

vivo:前两次对语音指令的回答,均未精确识别出须要翻译的句子。
改为笔墨输入(包括标点符号)后,终于给出了完美的解答。

OPPO:重复提问情形下,由OPPO AI供应的翻译无误,但推送的搜狗翻译会直接将前半句话转译成英语,令人啼笑皆非。
多番测试下,尚不清楚为何会触发两种不同的翻译推送。

(4-2)请阐明一下孟德尔第二定律,并举例解释。

光彩:回答满分,举例与vivo类似,并指出了该定律在遗传学上的主要性。

小米:回答满分,举例直接用了孟德尔的豌豆杂交试验,并给出了“百度文库”的参考链接。

vivo:给出的专业阐明普通易懂,且额外讲出了该定律的意义与适用范围。

OPPO:回答满分,举例也十分简洁明了。

(4-3)炒牛肉怎么炒才能又好吃又嫩滑?

光彩:回答达到预期,步骤十分清晰,如果能有牛肉部位的选购建议会更完美。

小米:直接推送了第三方的10份菜谱(个中有2份还是重复的),并未能直接给出答案。

▲小米推送了菜谱,即是并未直接解答用户的干系问题。

vivo:不仅给出了选购、腌制和炒制的方法,还给出了佐料的详细克数和炒制的韶光。

OPPO:回答从牛肉选择、如何腌制到炒制流程险些覆盖了所有可能衍生的问题,乃至还加入了推举配菜。

学科知识与打算

(5-1)底面边长为4的正四棱锥被平行于其底面的平面所截,截去一个底面边长为2、高为3的正四棱锥,所得棱台的体积是多少?(2023年新课标全国二卷)

▲多数机型在解答数学问题时,每每以代码来显示部分运算符号,希望未来能够改进。

光彩:解题思路精确,但遗憾的是多次测试均无法实行到末了,且答题中数学运算总是以代码形式呈现。

小米:题干理解缺点,因而解题过程和答案均禁绝确。

vivo:解题步骤完全,且竟然能显示出精确且规范的数学运算格式,满分!

OPPO:剖析过程清晰,步骤完全,答案精确。

(5-2)请君少却,令将士得周旋,仆与诸君缓辔而不雅观之,不亦乐乎!
请翻译一下这句话。
(2023年重庆新高考)

光彩:语音识别和译文无误,并给出了部分词句的重点阐明。
有趣的是,即便因口音问题导致识别存在些许差错,YOYO也会在提示“这句文言文的构造和用词彷佛有些错漏”后,根据文言文语法来考试测验翻译。

小米:多次测试创造,语音转换笔墨存在错漏,翻译时要么转去翻译《论语·学而》的“不亦乐乎”,要么题干只听了一半,就自动“抢答”了精确答案。

vivo:多次测试中,语音输入均无法转换成精确的中文语句,即便改为笔墨输入,仍须严格输入每处标点符号,否则也不能供应精确译文。

OPPO:语音转换笔墨无误,翻译时未译出“缓辔”的意思,其他精确。

文章天生

(6-1)我要写一份“开启AI手机元年”的报告,请帮我拟定一个提要。

▲从左至右依次为:光彩Magic6 Pro、小米14 Ultra、vivo X100 Pro和OPPO Find X7 Ultra。

光彩:提要构造清晰,逻辑合理,开篇即定义AI手机观点,提出本报告的目的与意义,以此展开剖析和磋商当前AI技能的运用方向、手机厂商的布局及技能创新与寻衅,紧扣主题。

小米:提要详细且完全,9大部分又有细分,且均有阐述解释,但提要通用性太强,直到结论部分才提到“总结为什么这一年被视作AI手机元年”。

vivo:提要整体十分简洁,包括从背景到技能创新、运用处景,再到发展趋势与结论建议共计5个部分。
但直到总结部分才提到“AI手机元年”,整体思路过于模糊,通用性太强,而无实际操作意义。

OPPO:提要分为弁言、AI手机元年背景剖析(市场趋势、技能进步、行业互助与创新)、AI手机元年关键技能(AI芯片、AI算法、用户体验)、寻衅与机遇(隐私安全问题、技能标准/兼容性、创新与互助),以及结论与展望共5个部分,逻辑通畅,条理清晰。

(6-2)人们因技能发展得以更好地掌握韶光,但人也因此成为韶光的仆人。
这句话怎么理解,请以此为核心写一篇文章。

光彩:YOYO天生了756字的《技能发展与韶光的悖论:掌控与奴役》一文,开篇点题,提出“当代科技手段的涌现让我们可以随时随地处理事情和个人事务,看似自由的背后,我们是否已经成为韶光的仆人”。
文中警觉人类必须当心自己陷入不断回应任务的循环中,专注力被分散,忘却了韶光的真正代价,还可能面临压力与焦虑的困扰。
结论落脚于“保持对韶光的自主性和平衡感……须要设定明确的界线与目标……学会放慢脚步”。

小米:小爱同学天生的文章《技能的双刃剑:韶光的主人与仆人》,共计763字。
它提出技能进步让人类“能更高效地管理日常事务,从而在劳碌的生活中找到一种秩序感和掌控感”,但也可能错过不少事情。
与其他AI不同的是,小爱还以要点总结的形式提出了4点建议(设定优先级、留出缓冲韶光、定期断开连接等),让文章看起来更像是一篇技能文档,而非材料作文。

vivo:蓝心小V天生了450字短文,没有标题,但整体表述清晰,尤其是指出了“人们不断追求更高效率、更快节奏的生活,以至于很少有韶光去享受生活本身”,结论落脚于“让技能真正成为做事于人类的工具,而不是掌握人类的枷锁”。

OPPO:小布撰写了一篇名为《韶光的悖论:主人与仆人的双重身份》的文章,全文共784字,全文起承转合的构造十分明晰,结论落脚于“在这个快速发展的时期,我们须要重新核阅自己与韶光的关系。
我们不能仅仅知足于技能的便利,更要学会如何成为韶光的主人”。

受篇幅影响,我们将在此后的文章中为大家带来后续评测。