一知智能自出身起就贴着「人工智能」标签,追其根源,脱胎于浙江大学人工智能研究所,深耕多模态人机对话及天生式AI创新。
现已为零售、金融、本地生活等20+行业供应了领先的AI外呼以及数字人办理方案。

那么,一知智能究竟是如何在浩瀚迅速崛起的AI公司中脱颖而出,并成功为品牌客户与用户搭建起高效交互桥梁的呢?

一、浙大·一知联合研究中央,为研发创新保驾护航

一知智能「人工智能」标签的背后,始终离不开浙大·一知联合研究中央的技能支持和前瞻性视野。
一知脱胎于此、造诣于此、亦反哺于此。

近5年营收复合增长率超80一知智能的人工智能技能强在哪里

浙大·一知人工智能联合研究中央自2019年2月成立以来,便成为一知智能技能创新与打破的强大后盾。
该中央深耕多模态人机交互的产学研领悟,拥有一支由超过40名硕士及博士研究生组成的精英团队。
在人工智能国际顶级会议上屡获佳绩,于语音、语义、AIGC等前沿领域揭橥近40余篇国际顶级论文,申请多项专利与软件著作权,并斩获国际自然措辞推理竞赛SNLI环球第一名和机器阅读理解比赛SQuAD单模型组环球第二名的殊荣。

值得一提的是,研究中央与微软亚洲研究院紧密互助,共同研发出基于Transformer的新型前馈网络FastSpeech。
实现了高质量梅尔谱的并行、稳定、可控天生,较传统Transformer TTS技能,梅尔谱天生速率提升近270倍,端到端语音合成速率提高近38倍,单GPU上的语音合成速率是实时语音速率的30倍。
该技能险些完备肃清了合针言音中重复吐词和漏词问题,同时支持语音速率与停顿的风雅调度,优化整体语句的韵律,为用户带来前所未有的自然语音交互体验。

坐落在浙大玉泉校区旁的研究中央

通过企业与学校强强联手,充分发挥一知智能在人机交互领域引领性的研发上风,汇聚精良研发人才,力争打造“技能创新、产品创新、人才创新”三位一体的创新型人工智能研究中央,担保了一知在人机交互领域的技能领先地位。
同时,一知智能积累的海量数据亦能反哺研究中央,让数据产生代价,与浙大·一知联合研究中央形成滚雪球般的良性循环,共匆匆技能改造与运用落地。

二、从0到1,再到无限可能

先有技能,再有产品。

在技能创新生态中,技能从“观点抽芽”到“规模化运用”需领悟学术深耕与家当实践。
科研机构先行,实现从0-1的技能打破。
随后,企业接过接力棒,结合市场需求,将成果转化为市场办理方案。

一知智能自研语音合成技能的打破,也孕育出了一知的第一款产品——AI智能语音外呼。
在语音交互层面实现了运用落地,以电话为载体,助力1000+品牌客户触达上亿次消费者,提升品牌用户的生命周期代价。
同时,在CTO姜兴华和研究中央卖力人薛弘扬博士的技能带领下,团队通过与浙江大学的产学研互助,研发了名为“太一”的新一代多模态交互大模型。

“太一”多模态交互大模型

“太一”大模型的出身,使AI外呼产品在实际运用中,更加精准地洞悉说话人意图,提升关键信息的捕捉能力。
而这背后,是一知在不同细分行业所沉淀的海量场景数据。
将这些数据注入大模型优化运用后,一知的NLP技能的准确率已达到 96% 以上,实现了对话场景全面算法驱动。
语音交互技能的提升,使一知的产品实现从最初的10秒、30秒通话时长延长至如今的3分钟以上深度互换,大幅提升了用户的通话体验。

在几万小时数据量、transformer、diffusion根本模型加持下,一知不断优化语音算法技能,办理了传统TTS技能用于语音客服时存在的录音量大、演习韶光长、声音缺少情绪颠簸、转人工客服时音色差异大等问题。
能够在零样本的条件下,在各个指标(发音清晰度、音色相似度)上,全面超过拥有10~300秒样本的算法。

2023年,一知延长了产品线,在语音人机交互的根本上加入了视频交互,推出了第二款产品——AI数字人。
一知数字人是业内少有的同时支持声音克隆和形象克隆的数字人产品。
在算法技能上,基于多模态人工智能模型,可实现120FPS无延时输出,仅需少量数据演习就能输出不同语种、语调视频,经由众包测试,其口型和语音匹配准确率高达99.9%;实时互动“阿凡达”模式,流式变声器功能,让柯南里的变声情节成为现实。
近期,薛博士带领的研发团队更是打破单图即可天生数字人技能,为一知的业务拓展带来了无限可能。

三、不做「大」模型,做垂类行业的「小」模型

在当今的AI领域,那些拥有雄厚技能实力的大厂正全力以赴地深耕底层模型,他们对此倾注了极大的关注与资源。
这一趋势的背后,是业界逐渐形成的共识:底层技能的打破能够带来更为显著的边际效益。

然而,在运用层,许多公司并未选择开拓垂直模型或行业模型,而是充分利用GPT等底层技能的强大能力,来构建各种创新的运用层产品。
这一策略使得他们能够迅速相应市场变革,灵巧调度产品方向,从而在激烈的市场竞争中霸占有利地位。

面对这样的行业背景,一知智能在选择在AI技能发展方向上深耕场景化运用。
只管通用模型已办理了诸多以前需依赖场景化办理方案的问题,但一知智能CTO姜兴华在接管采访时指出:“很多时候,我们创造通用技能在特定场景上的表现并不尽如人意,这正是我们动手进行场景化开拓的初衷。
通过深入理解和优化特定场景,我们能够有效地降落办理问题的难度,从而在当前的技能水平下,在一个小的、限定的范围内实现更好的效果。

详细来说,现有的通用人机对话技能,比如在AI外呼领域,每每难以很好地理解业务数据,也无法自由地对话以达成业务指标。
因此,一知选择聚焦于AI营销场景,将更多的营销数据注入到模型中,打造垂直领域的「小」模型。
这样,一知能够在特定行业场景下供应更加有效的定制化办理方案,也知足了市场对精准营销的急迫需求。

也正是由于一知的AI技能场景化策略,在成功跑通消费品赛道的同时,也不断向各行各业拓展,真正意义上实现了技能与运用的完美领悟。
随着一知的不断发展,一知易呼、视频外呼等创新产品的相继推出,丰富了人机交互的形式,更在多个行业场景中实现了深度运用。

结尾

从浙大·一知联合研究中央的研究成果出发,以技能为底座,到AI智能语音外呼与AI数字人的相继问世,再到实现场景化办理方案,一知智能始终站在技能创新的前沿,不断探索人机交互的无限可能。

从20世纪50年代期间人工智能观点的抽芽,到一知智能在技能创新与运用的征途上不断前行,我们见证了智能科技如何逐步渗透并深刻改变着我们的生活与事情办法。
一知智能作为这一变革的积极推动者,一贯在不断探寻人工智能的边界,致力于将最前沿的技能成果转化为实际运用,为用户带来更加智能、便捷、高效的体验,让交互产生更多代价。

从研究成果出发,以技能为底座,到AI外呼与AI数字人的相继问世,再到实现场景化办理方案,一知智能始终站在技能创新的前沿,不断探索人机交互的无限可能。