威信详解一站到底里的AI汪仔到底靠什么技能碾压人类

七年前的仲春，IBM人工智能打算机Watson在答题节目《Jeopardy!(危险边缘)》中称王，击败了这个节目历史上最强大的两位人类高手。
这个仲春，搜狗人工智能机器人汪仔在答题节目《一站到底》中登场，击败了站到末了的人类选手。

在《jeopardy!》里，最强的人类选手末了不得不写下名句，俯首称臣；而在《一站到底》的赛场上，汪仔也表现出碾压般的上风。
同样是答题节目，同样是人工智能，七年韶光过去，现在的汪仔和当年的Watson，到底有何不同？

而号称历时9个月，耗资4000万打造的汪仔，背后到底是哪些核心技能，研发过程又有哪些寻衅？未来人工智能技能又会若何发展？

△图左为许静芳，图右为刘明荣

搜狗搜索技能卖力人许静芳，以及搜狗搜索总监刘明荣，把上述各类问题的答案抽丝剥茧见告量子位。
下面是他们的威信详解：

威信详解一站到底里的AI汪仔到底靠什么技能碾压人类

汪仔和当年的Watson有什么不同？

1、输入办法不同

Watson是分外接口文本输入，输入内容准确无误。

而《一站到底》是主持人念题加题板展示题目（两种来源都是逐字出题），汪仔通过搜狗的语音识别和图像识别技能，利用语音和图像两种办法获取，再转换成笔墨。
语音识别、图像识别都是AI的关键技能，同时识别的缺点会进一步提升答题的难度。

2、题目设置不同

《jeopardy!》的题目有显示种别和相应的奖金数，种别对付答题有帮助，能够将答案限定在特定例模内。
而《一站到底》中的题目没有给出种别，须要汪仔通过算法识别问题的种别，增大了答题的难度。

当然《jeopardy!》中题目的奖金不同，末了以得到的奖金数定输赢也带来了新的问题，这点是一站到底所没有的特性。

3、赛制不同

《jeopardy!》必须主持人把题目完全念出后选手才能抢答，而《一站到底》是在开始念题后任意韶光都可以抢答，答对自己得分，答错对方加分。

因此在高水平的选手有大量的题目都是在题目尚未完全时就作答，汪仔同样有很强的抢答，即根据题干片段去预测问题并作答的能力，这是Watson所不具备的能力。

4、知识获取办法不同

Watson是一个封闭系统，不联网，利用其离线的知识库答题。
而汪仔通过联网，对全网信息及搜狗知识图谱进行在线答题，在利用更大范围信息的同时也对答题速率提出寻衅。

5、其他

汪仔除了能回答知识问题，还有谈天功能，可以和主持人进行自然措辞互换。

汪仔紧张基于哪些技能？

汪仔背后核心技能紧张包括：语音识别、OCR、自然措辞理解、数据挖掘、信息检索、知识图谱和文本打算等，这些技能是当今人工智能领域最新发展的集中表示。

个中语音识别、OCR技能代表了机器学习和深度学习的最高水平，自然措辞理解是未来人工智能发展须要进一步办理的主要核心问题，代表了未来发展的主要趋势。

关于这套系统的架构，量子位还得到了一组图形化的解释。
就列不才面（点击看大图）👇

有多少软件工程师支持汪仔？

长期投入的核心开拓职员在十人旁边，此外还有支持项目的各种工程师约十人。

量子位补充一点干系信息：搜狗CEO王小川此前透露，汪仔由搜狗和清华天工研究院联合开拓，耗时9个月，耗资4000万。

研发过程中，最大的困难是什么？

《一站到底》有个非常分外的规则：开始读题后，任何韶光都可以作答。

答对得分，答错对方加分。
以是答题速率非常关键，这里不仅仅是听到完全题目后能够在极短韶光内答题，更主要的问题是能够根据部分题目就预测问题并作答，实际上顶尖的人类选手也很大比例在题目不完全情形下答题。

答题速率上我们做了两大类事情：第一是从吸收到语音、图像开始，语音识别、图像识别、搜索、答案抽取这全体系统都在速率上追求极致。
在过去几个月里后台的处理速率较刚开始提升了10倍，无论是识别还是转换成笔墨后的问答，在速率上都做到极致。

第二类问题是推理，即根据部分信息预测问题并作答。
我们根据学习历史上的题目，建立一套推理机制，使得机器人能够根据部分信息推理，例如当前问题是“位于XXX的”，我们通过“位于”这个词就可以推导出问题答案是一个“地理位置”。

又例如问题中提到了“千湖之国”，则很有可能答案是“芬兰”（芬兰的别称是千湖之国），问题中提到了“穆斯林的葬礼”，则很有可能是问其作者“霍达”，这些信息是我们基于海量知识文本分析挖掘、学习得到的。

目前汪仔回答题目的80%都能在题目不完全时通过推理回答，较最初的版本有了质的飞跃。

汪仔和其他人工智能产品有何不同？

汪仔是一款自然措辞问答类产品，产品功能定位决定它必须具备感知语音旗子暗记输入，并可进行认知推理的能力。

目前市情上的人工智能产品大多数仅具备感知能力，这些产品在特定领域能够赞助我们高效完成任务，比如语音识别类产品，可以帮助我们快速方便地输入笔墨，人脸识别类产品可以供应便捷准确的安防做事。
具备认知能力的人工智能产品目前还比较少。

在自然措辞理解领域，汪仔代表的智能问答就属于认知类产品，它除了具备识别人类措辞笔墨这样的感知能力，还能够理解笔墨背后的含义，也便是理解人的需求，在理解需求的根本上，进一步通过推理打算得到知足用户需求的精准答案。
也便是说，汪仔拥有认知推理能力。

从问答和对话领域的人工智能产品来看，和汪仔产品形态相比拟较靠近的包括谈天机器人和智能客服两类当前比较热门的产品。
个中谈天机器人紧张向用户供应生活做事、娱乐资讯等，常日以逗乐用户、丁宁空隙韶光为主，并不能为用户办理实际问题。

和汪仔类似，目前有些公司供应的智能客服类产品，也属于智能问答产品，同时具备感知和认知能力，但是这些产品能够回答的问题领域非常有限，基本局限在与公司产品做事密切干系的问题，而汪仔是一款通用问答类产品，它可以回答各种知识问题，不受领域限定，因此它的受众面更加广泛，能力更强。

一句话来说，汪仔是具备感知和认知推理能力的通用型知识问答类产品。

汪仔对搜狗AI未来发展有何影响？

人工智能未来的发展方向是认知智能，包括推理和决策能力，而智能问答是认知智能水平的主要表示，本身具有主要的家当代价和社会意义。

汪仔的成功表明搜狗在这方面具有较强的研发能力，具有里程碑意义。
未来搜狗将会在智能问答领域加大投入，逐步提升自动回答各种自然措辞问题的能力，成为代表智能问答领先水平的国内外有名人工智能公司。

“搜索的未来将走向问答机器人。
用户的搜索行为会从输入一个关键词，变成表达一个完全的句子，让机器找出个中的含义，同时，搜索引擎返回的内容，也将从大略的10条链接转向直接给出答案或者是建议”，王小川曾多次在公开场合这样表示。

搜狗汪仔无疑是“问答机器人”这一理念的具象形态。
其背后的核心技能立知便是搜狗在智能问答领域的一项主要创举。
王小川曾表示，搜索未来向问答这一演进形式将对大众的习气形成新的寻衅，乃至引发重大的变革。

未来，人们不用再为了适应机器而刻意改变自己的沟通办法，人们可以用更自然流畅的问答、交谈与机器进行互动，技能与人文关怀可以通过搜狗人工智能技能实现完美的均衡。

回看当年Watson

△Watson在《jeopardy!》里得胜

Watson背后是一套深度问答(DeepQA)系统。
问答系统一样平常包括三个紧张组成部分：问题剖析、信息检索和答案抽取。

此前的媒体宣布中，有过类似的示例：

面对问题：谁导演了《星球大战》？人类选手会根据知识积累，给出“卢卡斯”这个答案，但对付Watson，这个过程要繁芜得多。

它会通过摄像头把这个问题“扫描”进大脑里。
先剖析这个问的是人，然后再细化到是一位导演。
接着剖析《星球大战》，会找到很多文章。
它要定位某篇文章，个中把星球大战的导演那一段找出来，然后对这一段做深度剖析。

比如找到一句话，这句话里说到这是某人在哪一年执导（direct）的，但没有提导演(director)这个词。
实际上还可以找到很多类似的词，它就须要过滤，它先会找人名，比如斯皮尔伯格、卢卡斯等，这些都是潜在答案。

针对这些答案它要找干系的证据去支持。
它会再把“星球大战”和“斯皮尔伯格”一起搜索，或者是和“卢卡斯”搜索，结果创造“星球大战”和“斯皮尔伯格”共同涌如今同一篇文章中比较少，而“卢卡斯”比较多。

这只是Watson事情过程中的一部分。
据先容这套系统综合了100多种算法。
在参与答题节目的过程中，当时的Watson会在3秒内完成打算并给出答案。

关于Watson和汪仔，我们此前还有一篇文章，点击左下角的“阅读原文”即可查看。

△ 扫码强行关注『量子位』

追踪人工智能领域最劲内容

每期AI知识网

威信详解一站到底里的AI汪仔到底靠什么技能碾压人类

短视频分娩进入智能时代新华社推首个MAGIC短视频智能分娩平台

阿里研究院刘明生成式AI未来需要更精细化的治理