一、什么是文本智能

文本智能普通来讲,是打算机像人类一样理解自然措辞。

“冬天,能穿多少穿多少。
夏天,能穿多少穿多少。

“中国足球队,谁都打不过。
中国乒乓球队,谁都打不过”。

基于文本智能技能的AI产品设计实践

人类看一眼就知道什么意思,对打算机来说则困难重重。
由于人的表达办法千变万化,短词汇可以传达非常宽泛的语义信息。

现在的文本智能处在什么层面?

人工智能的分类层次,第一层“运算智能”。
打算是打算机的强项,通过分布式系统及高性能的CPU、GPU可以很好办理。
第二层“感知智能”。
感知是在更多听觉、视觉、触觉等方面的创新。
文本智能处于第三层:认知智能。
研究如何进行自然措辞理解、知识的构建和逻辑推理。
第四层“创建智能”,是人工智能行业终极目标。

文本也可以分成两种类型:一种是书面文本,承载的形式为网页、word、txt或pdf; 其余一种则这天常互换的口语形式。
达不雅观专注于第一种。

一份简历、一份条约、一份上市公司的债券召募解释书、一条评论都可以算书面文本。

面对一篇文本,我们能做什么呢?

(1)拆解

像伙头解牛一样把文档构造化。

简历的姓名、照片、事情经历、教诲背景;条约中交易的甲乙方、条约标的物、付款办法、条款;新闻的标题、择要、来源、正文、关键人物、事宜,组织机构名称,都是对文本拆解后抽取到的信息。

抽取是文本处理中最主要和实用的技能。
抽取出条约中的“付款办法”之后,业务方才能够去进一步审核“付款办法”是否符合法律法规。

(2)联接

对多个文本进行伙头解牛式的拆解,干系知识就能联接形成一个巨大的知识网。

对标到知识图谱,新闻中的人、事、物、关系,公司年报中的涌现的公司名称及关系,都可以作为文本智能处理的大脑和背景知识,在知识网络上进行逻辑推理和判断。

(3)天生

天生是学术界研究的热点,在当前阶段是非常困难的事情。
腾讯的Dreamwriter,今日头条的xiaomingbot都在考试测验用机器创作短新闻。

接下来我们详细看一些文本智能的例子。

根据一篇新闻资讯,天生不同长度的择要,紧张有两种技能手段:抽取式和天生式。

给定一个用户评论,提取出标签信息和不雅观点,属于一个短文本处理。

文本分类和情绪识别,在文实质量管控和舆情剖析方面利用较多。

文本审核也是分类的一种,涉黄涉政及判断是否是广告,是每一个做互联网产品的公司比较头疼的事。

下面是金融行业的债券召募解释书。

这样一个文档中,行业研究职员比较关注公司高管信息,比如:姓名、公司职位。
在债券召募解释书中收购标的是哪些,包括资产、标的业务、标的所在行业是否涉外、交易对手是否涉外、各种财务指标等。

一样平常债券召募解释书从100到500页不等,让人从这么长的文档中找到这些关键信息,非常随意马虎出错。

在公开的金融资讯网站上,债券召募解释书非常多,一个金融从业职员不可能在短韶光内把每篇文章内的信息都抽取出来。
以是在全体领域来说,文本智能处理涌现了非常大的机会。
这也受益于算法的进步,特殊是深度神经网络从图片识别领域到文本处理的迁移。

匆匆成文本智能处理飞速发展的缘故原由很多。

最近Google 的bert模型刷遍AI界朋友圈:NLP历史打破,谷歌BERT模型狂破11项记录,全面超越人类。

第一成分是算法成分,算法层面一贯在不断取得很大的创新和进步是紧张成分。
第二成分是打算能力,如:分布式系统、GPU等运用。
第三成分是语料库的积累,互联网行业,可以通过多种手段迅速积累语料库,传统企业也有资料积累,但量级无法与互联网比。

文本智能处理的需求遍及各行各业。
只要存在笔墨处理事情的行业,都有文本智能处理的需求,金融、法律、政府行业,媒体、互联网,大型企业等。

二、设计思维和机器学习

节制AI算法和基于AI算法设计产品之间的间隔是非常大的,犹如从炸药到炸药枪、从铀到核炸弹、从硝化甘油到C4的差异。

若何才能基于这个AI算法设计产品呢?

产品经理的思维是从用户、场景和需求三要素出发。

要给客户办理什么问题?目标客户如何刻画?客户在什么样的场景下会利用我们的产品?怎么用一系列问题,须要产品系统的思考。

设计思维的六个步骤重点包括:启示、构思和履行。

机器学习的流程,是对要办理的问题定义好后,对数据加工处理,提取特色,进行算法选择,从而确定可利用的模型。

当这些模型知足上线哀求或业务哀求往后,我们把模型放到线上系统中。
当新接管到的数据进行同样的处理后,用演习出来的模型来判断是否属于垃圾邮件。

算法接管不同的数据可以演习出不同的模型。
全体过程是迭代优化,由于数据的分布和蕴含的特色可能随着业务的不断发展在产生改变。

设计思维因此用户为中央,强调敏捷开拓、快速迭代。
机器学习因此数据为中央,强调数据+模型闭环驱动。

两者怎么样进行深度的领悟,是在人工智能时期下对产品经理能力模型的哀求。

这两年AI的宣扬,特殊是AlphaGO的遍及浸染,我们感想熏染到每一个行业都会被人工智能技能所影响,任何职业都会受到影响。

但AI到了无所不能的地步吗?

显然不是。

AI对行业或职业影响的有多大,很大程度上,是取决于这个领域技能的成熟度和边界在哪。

比如文本处理领域,针对文本处理技能评估可以分为3类:可用 、基本可用、难以运用。

达到人类水准的有垃圾内容的检测、主题分类、文本相似度剖析、对词性进行标注。
基本可用但仍存在毛病的,比如关键短语天生、实体链接、机器翻译、语义消歧。
难以运用,包括多轮对话、QA问答、内容改写等。

当产品经理在设计一个基于文本智能的产品时,要考虑这项技能处于什么种别。
种别决定技能用到最真实场景时、场景对准确度的哀求。
例如:自动驾驶或无人驾驶,场景容错率是零,由于轻则车毁,重则人亡。

守旧一点讲,我们还处于AI的低级阶段,AI的知识逻辑和逻辑推理能力都还很弱,但在日常生活中人类已经享受到了AI带来的代价。

三、如何找到AI赋能的场景

那么,该如何找到AI赋能的场景,让算法专家、行业专家和运用开拓专家三种角色的互助使人工智能落地呢?

找到这个场景的条件是须要思考,利用AI产品和解决方案的实质什么。

首先,运用可以分为两类:互联网行业运用和企业级运用。

在互联网行业运用,无论是搜索、推举系统、广告,提升的是过程中信息通报的效率。
在企业级运用上,紧张是提升生产效率和创造新代价。

提到AI产品和解决方案,当我们将它们做事于我们企业级场景的时候,它的核心是在提升生产效率。

产品须要找到在当前的业务流程中,生产效率到底涌现什么问题,或哪个环节希望借助AI技能进行生产效率的提升、节省人力。

这些可以分四个步骤做,算法开拓职员也是站在这四步实当代码:

1)流程拆解

对当前的事情流程或业务场景进行详细拆解,诊断阻碍生产效率的最大问题,对核心问题进行拆解。

2)数据评估

如果想办理问题,公司的哪些数据是跟这个问题干系的?

有没有数据?如果有数据,这些数据的质量若何;缺不缺数据?如果缺数据,这部分数据可不可以通过外部采购,或跟其他的运用、产品进行连接后得到。
这些都是在数据评估阶段要考虑的问题。

3)方案设计

方案设计是针对当前的数据现状去完善根本数据,选择可能存在的AI算法是什么。
比如进行垃圾分类,有很多分类算法可以采纳:贝叶斯模型、SVM逻辑回归。

第三点比较主要,很多时候人不知道算法的效果若何,如果工具能够帮助我们进行快速的测试,会很快的验证和优化方案。

4)有机整合

当设计好办理方案往后,准确率是可接管的,这时考虑这项做事或运用怎么跟现有的系统进行结合。

大体来看有两种办法:

一种办法基于AI,做独立的产品,在这个产品中有这项功能;第二种是一种以API接口的办法和业务进行打通。

系统上线往后,怎么做模型升级、怎么做掩护,也是我们面临的寻衅的问题。
概括来讲,想找到AI能够赋能或落地的场景,须要对流程进行拆解,然后评估数据,进行AI方案的设计,末了和系统进行有机整合。

如果对差旅的报销流程进行梳理,共有五个环节:

第一,整理出差待报销的发票;第二,填写报销申请表;第三,上通报交的票据 ;第四,财务部门进行审核;第五,终极审核通过。

对流程进行拆解,第一步,整理出差待报销的发票。
要先根据票据的类型进行分类,分好类分别打算各个票据的金额,交通、住宿,进行汇总。
第四个环节,财务部门须要核对申请表上的金额与提交的纸质票据的原件是否同等。

当对流程进行拆分往后,就可以进行AI技能的评估。
比如:票据类型分类,能不能通过OCR技能。

当对进行各项金额打算时,能否通过文本关键信息提取技能把金额自动提取出来,进行汇总打算。
填写报销申请表时,能否根据数据接口的办法自动传达财务部门的审核系统中。
同样,通过文本内容关键信息提取技能,把提取出来的数字和用户上传过来的数字进行复核,来判断是否通过。

这几项AI技能帮助赋能,在这个环节中,我们须要哪些数据?

第一环节须要报销的原件,第四个环节既须要原件,又须要申请表。
通过这样的办法,我们找到了AI落地的场景点,并明白了技能在里面可以做到什么程度,同时让业务方也理解到了这项技能确实是可以落地的。

通过拆解可以创造三个场景充分利用文本智能技能:

第一,条约的差异比对。
条约有不同的版本,且不同的版本是内部门歧的人合营协作的,有时还涉及到外部的咨询公司。
第二,条约条款的读取。
当我们进行审核时,须要公司的法务职员对条约进行阅读,找出须要审核的条款进行法律法规的剖断。
第三,条约审核。

找到这三个点往后,明确了供应AI产品代价是提升效率,帮助法务部门掌握风险。

当我们找到可以AI赋能的场景后,我们须要遵照什么样的原则去设计产品和解决方案呢?

四、AI产品设计原则

我们先来看下传统软件设计和AI驱动软件的差别。

传统软件设计,设计过程看重的因果、逻辑。
设计一个OA系统,要考虑员工办公流程、每个流程要达到的目标是什么、功能实现最短路径。
如果有输入不符合预期时,传统软件产品时,开拓工程师比较随意马虎重现BUG和解决问题。
而AI驱动的软件,重点须要考虑的是结果不愿定性、逼近优化目标。

比如条约条款读取,通过历史的条约数据,已经能够演习出文本智能模型,可以对某些字段进行抽取。
假对某个字段的抽取准确率是98%,在历史条约数据中这个非常高的准确率了,站在业务方来评估,也基本能够知足上线哀求。
但当系统上线往后,对新的一份条约,大概没有抽取出来。
又来一份新的条约,大概就抽取精确了。

对AI算法来说,准确率98%是站在数据集的角度考虑的,但真正把模型或产品运用到业务系统中,业务职员面对的是一份一份的数据。

其余,优化目标是个逼近的过程,过程是高下起伏的,总效果是逼近目标的。
就像人喝醉酒后回家一样,摇扭捏晃,有时多走了几步,但是还是往家的方向走。

可这种情形,对产品的利用者怎么办?

利用者知道产品在优化,但利用过程中还是会涌现缺点。
优化的过程有起伏,利用者被奉告针对目前的问题,上了一个新的版本,新版本的准确率由98%提升到99%,可在真正利用时,可能创造连续3份条约抽取缺点了。
这种情形下业务方很难接管,由于他们对AI算法本身不是太理解。
作为产品经理,这是一个须要办理的问题。

对AI产品,大家总是期望主动表现出智能型,对付这种需求,UI设计和功能设计都是可以起到浸染的。

对付功能性,有4点比较主要:

第一,怎么设计“肃清不愿定性”。
AI算法的流程和处理办法就决定了它存在的不愿定性。
产品要通过各种办法来摊销或肃清不愿定性,或存在不愿定性时有得当的处理办法。
第二,“看重学习反馈”。
算法的智能很大一部分来自数据,也来自用户的反馈。
当新的数据源源不断进来后,通过我们产品的界面设计纠正缺点后,产品怎么接管这种反馈,实现自我蜕变。
第三,“利用人机交互”。
用户的反馈通过怎么样的交互办法来表示?可以让用户先试用一段韶光,基于这段韶光出一个报表,在报表把系统处理的各项缺点罗列出来,用户通过离线办法进行批量的修正确认,把修正的结果导入到系统中重新演习模型,这是一种人机交互。
能否在线实时处理掉,也是一个非常主要的问题。
有时产品认为用户通过人机交互办法进行了反馈,大概由于产品功能设计得不足友好,用户误点了。
要区分哪些真正有代价的反馈,哪些是须要肃清的噪音。
第四,“看重检测缺点”。
准确率不是100%的情形下,线上系统的缺点处理和运维是非常具有寻衅的。
尤其是当线上数据具备高度机密性的情形下,线上系统处理的数据不可能导出到测试环境中让AI职员去研究复现时,怎么办?

空想的结果是交付一个AI产品,可以不断的优化、迭代,越来越聪明,成为一个动态的AI系统,而不是静态的。

AI也重新定义了产品设计和开拓流程。

图的上面跟机器学习算法干系,识别问题、获取数据,进行模型演习、模型管理。
模型之间有不断的版本迭代,我们要进行模型的支配,上线往后模型要去适应新数据的变革。

下面是站在开拓角度,若何去进行需求建模、架构设计、软件设计、若何对AI产品进行开拓测试、上线往后的掩护。

当系统上线后,用户便是用来处理数据的,新的数据源源不断,可能会出错,系统会产生行为的非常,用户看到缺点时会跟系统进行人机交互,把自己的反馈提出来。

有时用户有自己的专业知识、行业知识,把自己的行业知识传授给AI系统,让它更加聪明。
除了自我蜕变外,也通过吸收外部信息的办法增强自己的智能。
如果把这种视角加进来,可以让AI产品站在宏不雅观角度把握各环节,从而辅导我们设计出更好的产品。

举两个例子展示,若何通过产品进行条约条款的抽取和进行规则审核。

场景一:条约关键信息的抽取

共分为5步,前2步是预先做好的。
根据客户已有的历史条约数据去演习AI模型,让AI模型识别不同类型的条约,就不同类型条约中的关键要素进行自动抽取,做好这2步后预置到产品平台中去。

对利用者来说,是三步完成:上传到条约文档、机器进行自动关键词提取、提取结果呈现。
形成这样一个关键信息抽取的报告,法务职员可以对报告一览无余。

场景二:条约风险进行审核

前两步也是预置到产品中,针对各个不同的条约类型,根据业务方设计条约审核项,对每个条约类型的风险点都配置好,机器模型可以自主的进行学习和演习。

业务方上传条约文档,机器可以进行自动处理,并给出些建议。

审核结果中包含针对这个条约,有哪些是必改问题、有哪些是缺失落条款、有哪些是建议优化的,都可以知足。

这是我们产品的全景图,展示了AI的几个不可缺失落的关键要素,只有担保这几个要素后,供应的产品时才能够肃清由AI算法带来的不愿定性。

客户是不可能为不愿定性买单的。
如果交付了一个产品,客户问准确率是多少,答“看数据情形吧”,客户又问系统上线利用时撞户率有多高,答“这个我也不清楚,须要新的线上数据判断”,任何一个客户都不会为不愿定性的回答买单。

末了一部分,如何进行产品代价的评估。

五、如何进行产品代价评估?

针对上面的条约智能处理,我们理解到:

对不同的条约,原来通过人工阅读的办法进行审核,处理韶光基本是在小时级。
引入智能条约审阅平台往后,全体过程从待审阅条约、智能条约审阅到人工复查,从小时级变成分钟级。

从代价来说:

提升效率、降落本钱。
降落风险。
把长期非构造化文档的管理问题很好的管理起来。

条约评估对付AI产品有两个层面:

算法层面的评估,更多的是面向AI算法和研发职员,比如:准确率、召回率、F1值。

机器翻译、智能客服、多轮对话、搜索、推举、文本抽取等在算法层面都有不同的指标,对业务方很难讲明白准确率是多少,用户很难把准确率和它的业务代价映射起来。

评价的维度也非常多,取决于业务方怎么看待这个产品以及通过这个产品达到什么目标。
有时客户的期望是通过AI的产品提升职员的事情效率、降落出错。
有的客户利用AI的产品专注在创新。

不管做to C还是to B都是环绕用户进行做事的,有一个经典的模型叫“AARRR”:怎么获取用户、激活、留存、商业变现、用户帮助评估。

在这个场景实现AI落地,针对这几个不同的环节,到底带来哪些业务代价上的提升:是新的获客数量增加了、转化率提升了,还是某项产品的业务额收入增加了。

节省人力;创造新代价,这是我们希望AI产品能够达到的空想目标。

以上是我想给大家分享的多年做AI产品设计和项目交付的履历,感激大家!

作者:贾学锋,达不雅观数据副总裁,卖力AI办理方案及产品设计。

本文由 @贾学锋 原创发布于大家都是产品经理。
未经容许,禁止转载

题图来自Unsplash,基于CC0协议