演讲者:徐飞玉
参与:微胖、黄小天
面向开拓者的天下上最大的人工智能主题在线演讲与对话大会 AI WITH THE BEST(AIWTB)于 2017 年 4 月 29-30 日在 AIWTB 官网上通过在线直播的办法举办。昨日,机器之心宣布了 Ian Goodfellow 线上分享的有关对抗样本与安全隐私的精彩内容。
在本文中,机器之心对这次大会上 AI 专家徐飞玉的演讲进行了梳理,并附有大会演讲视频和 PPT。今年 3 月 23 日,遐想宣乐成立人工智能实验室,同时宣告徐飞玉博士加盟遐想,作为副总裁卖力遐想研究院人工智能实验室的研发事情。
据悉,1998 年以来,徐飞玉博士一贯在德国人工智能研究中央事情。加入遐想之前,她是该研究中央措辞技能实验室文本分析研究组卖力人以及首席研究员。
徐飞玉博士在多措辞信息系统、信息抽取、文本挖掘、大数据剖析、商务智能、问答系统以及 NLP 技能移动运用等领域拥有丰富的履历,领导过 30 多个国内外研发项目,研发以及管理履历涵盖了创新的完全周期,包括根本研究、运用与研发以及产品商业化。
2016 年 11 月,前微软亚洲研究院常务副院长芮勇博士加入遐想,成为遐想新的 CTO;数月间,遐想新的技能计策——「智能驱动的设备+云」计策——已然成形。人工智能正在成为遐想着力加强和投入的计策领域。
演讲主题
人工智能的变迁:从实验室走入日常生活(The Migration of AI from Laboratories into Everyday Life)
本日,人工智能已不仅仅存在于科幻小说之中。大数据及其剖析平台、前辈的机器学习方法、高速互联网、环球性开源研发社区等大量呈现,这统统催生出了强大的人工智能运用,比如网页智能搜索、机器翻译、智能交互式助手和商业智能软件。
在本次演讲中,我将会概述德国人工智能研究中央的跨学科运用型研究,以表明人工智能未来运用的广大前景。我也会先容人工智能从实验室走进日常生活的变迁,及其已被证明有效的商业化。正是这种商业化的驱动方法缩短了人工智能从研发走向产品的周期。本次演讲将会先容一些核心方法,包括设计思维的整合,结合研究与产品利用的全体研发过程的最初步骤等。接着我会着重先容措辞技能的两个运用领域并阐明其详细运用:1) 文今年夜数据剖析,2) 智能会话智能体。
徐飞玉博士首先先容了什么是人工智能:能让机器向人类一样行动。
人工智能热的缘故原由,很有用。提升人类感知和认知,比如搜索引擎。其余,人工智能还可以帮助人与机器交互。
为什么现在会涌现人工智能热呢?缘故原由有以下几个方面。比如数据、技能、硬件等等。
人工智能之以是很热,还由于在某些方面乃至可以超过人类(超人智能,比如 AlphaGo)。那么,比拟之下,人工智能与人类智能有哪些相似与不同呢?
因此,人工智能可以做一些人类无法做到的事情。
人工智能的发展让很多新的产品、做事和商业模式成为可能,也大大提升了现有产品、做事和商业模式。以下是一些主要技能领域。
人工智能已经被许多领域运用。如下表所示,金融做事、制造业、农业、教诲等,一共 216 个领域。
接下来,就看几个利用最新技能的例子。比如,对话用户界面和对话系统。
接着,徐飞玉博士讲了当前的会话式助手的三个参数:1. 能动性(用户、系统、两者稠浊);2. 中值/办法(声音、文本、图片、触控);3. 会话深度(征采、问题回答、命令导向、真实会话)。
当你对语音助手说,给我看看 Peter 在北京的照片时,它首先会剖析人物是 Peter,位置为北京;接着它会在图片库中进行检索,并终极给出 Peter 在北京的末了照片。
以是,语音助手图片检索的全体过程可以描述为:输入、剖析、理解、行动选择、整合、输出。
接下来,徐飞玉博士重点先容了文今年夜数据剖析处理这一详细运用。
首先,她先阐明了大数据,认为其有如下三个特点:大容量(数据大小)、高速率(变革的速率)、多种类(数据资源)。
在大数据中,文本是最大的也是最常见的大数据来源之一。
但文本数据却是非构造化的。
非构造化也就意味着须要对其进行剖析处理。以是接下里要讲的什么是文本信息剖析处理。
文本信息剖析处理是指在给定一个非构造化文本的情形下,文本分析系统能够自动识别并提取干系实体或观点之间的关系,这种关系对付知足用户需求很主要。
随后,徐飞玉博士讲了文本分析处理技能的 3 个常日性运用任务:
常日性运用任务 1:用于信息查找者的信息访问。
在搜索引擎中,文本分析处理技能可以将用户非构造化的文本性提问映射到更构造化的标准提问,从而帮助信息查找者完成信息访问。
常日性运用任务 2:用于信息供应者的信息获取。
在网络中,信息供应者可从海量免费文本中提取构造化信息,从而可构建知识库以达到信息储备的目的。
接着,演讲中给出一个有关盛行歌星的实例:如何从网络中获取盛行歌星的完全社交网,并将其分为 4 类:盛行歌星、艺术家、个人、团体。
常日性运用任务 3:大数据剖析
大数据剖析可在构造化数据和非构造化数据之间建立连接:
大规模信息监控
剖析:领域、市场、趋势等剖析
不雅观察:浏览干系最新进展
演讲给出了文本分析处理技能的架构流程图。
末了,这次演讲对人工智能的贡献作了以下总结:
感知:为视觉、听觉和觉得阐明传感器输入
不雅观察我们的天下:监控数据和网页
知识:使全天下的知识触手可得
理解:实时剖析海量数据
从履历中学习:机器学习
智能化:机器人、自动化流程