0x00 弁言

想象你是花木兰。
你现在要替父从军。
你东市买骏马,西市买鞍鞯,南市买辔头,北市买长鞭。
然而,还没等到你买完,deadline已经到了,你的父亲已经被官兵拖走了。

上面这一幕这便是目前浩瀚AI开拓者所面临的困境:与AI展现的美好前景比较,开拓、支配、演习一个AI实在太麻烦了。

0x01 AI开拓乱局

是时刻给AI建个通天塔迈向普惠AI了

现在,想象你是替父编程的花木兰,须要转投AI开拓。
你会创造,你所面临的是一个令人头晕眼花的,不亚于电脑小白走进电脑城的,一副无比弘大而又混乱的局势。

#1

框架选择

开拓AI的第一步,是选择得当的开拓框架。
所谓框架(Framework),是指全体或部分系统的可重用设计。
好比别人搭好了舞台,而我们只用关注节目本身。
有无框架,做起事情来完备是两个观点。

在编程领域,有一句广为流传的名言:“不要重复发明轮子(Reinventing the wheel)”。
这句话的意思是,如果某个领域已经有成熟的办理方案了,那么除非分外情形(知识产权、KPI、学习研究等等),我们不妨在别人已经搭好的框架上创作内容。
众所周知,编程领域是一个节奏极快,竞争极其激烈的领域。
当你在重新发明轮子的时候,别人可能已经用现有的轮子造出跑车了。

对付AI开拓而言,现在也有了一系列开拓框架可供选择,它们来自学者、巨子厂商和开源社区。
比方说最著名的几种:Google的TensorFlow、微软的CNTK、加州大学伯克利分校研发的Caffe,Facebook的PyTorch和Caffe2、Skymind公司掩护的Deeplearning4j等等。

有成熟的框架是一件造福大众的好事儿,但问题来了:浩瀚框架纷繁繁芜,你该如何选择?

这些框架支持的措辞不同,它们的速率也不同,可拓展性和易用性也不同。
目前,关于各种框架的比拟在维基百科上居然有了专属的页面,与之干系的文章更是可以搜出一大筐。
如此琳琅满目的轮子,你选哪一家?

几大主流AI开源框架比拟(数据来自维基百科)

#2

环境支配

经由了困难困苦的框架选择,现在我们须要选择得当的支配环境。
你的AI是运行在CPU上还是GPU上?乃至,对付某些工业运用而言,CPU和GPU也未必能够知足需求。
要知道,Google可是为“阿尔法狗”专门研发了自己的TPU(张量处理器)芯片。
此外,对付个体开拓者而言,还要靠考虑一下价格问题,毕竟由于数字货币挖矿家当的带动,显卡可是涨了不少。

同时,你还要考虑你的AI是支配在本地还是支配在远程做事器上,“单机版”还是“联机版”;是在移动端还是PC端,PC端也分windows和Linux,移动端包括iOS,Android,树莓派(Raspberry Pi)等等。
这各类选择,可以说又会劝退一个选择困难症患者了。

#3

演习园地

选好了得当的开拓框架,完成了环境支配,还剩下最主要的一环便是AI的演习。
无论是微软的小冰,还是苹果的Siri,程序员每每喜好给AI起一个名字。
这种明显的拟人化特色并不完备是一种商业须要,还由于AI的开拓过程和演习一个人类的过程极其相似。
你须要供应得当的园地(打算平台)、充足的食品(数据),在亿万次的试错、改动之后,才会有真正有代价的AI。

而这个过程中,最显著的特色便是:“打算密集型”。
这种密集包括数据和算力两个层面。

首先是数据。
AI须要弘大的数据作为支撑,特殊是自然措辞处理、图像识别等领域,一个拥有充足数据量的资料库是AI演习的根本。
然而这样的数据库可能未必有现成的,纵然有,也须要根据自己的需求对数据进行整理,俗称“数据洗濯”。
例如微软的小冰,其研发团队大概花了三个月旁边韶光来补充小冰的全体语料库——差不多几亿条。
早在十几年前,Google为了提升自己的验证码识别技能,就从环球各地截取了无数的街道路牌和门牌号码,用于建立自己的演习库。
而DeepMind在演习初代“AlphaGo”的时候,也用了几千盘人类棋手的对局棋谱。
数据好比AI的食品,在某种层面上,“You are what you eat”这句话对AI来说同样成立。

其次要考虑算力。
算法决定了AI的上限,但算力决定了AI能不能达到上限。
AI对付算力的需求不仅巨大,而且增速极猛。
OpenAI 今年5月揭橥的文章表明,自2012年以来,AI演习任务中利用的算力以指数形式增长,其目前速率为每3.5个月翻一番(比较之下,摩尔定律都还要18个月才翻一番)。
并且自2012年以来,这一需求增长了超过300,000倍。

对付AI开拓者而言,数据和算力,则是两件不仅头痛(麻烦)、而且心痛(昂贵)的事情。

综上所述,假设我们都是替父编程的花木兰,那么,在框架选择时,我们就会被劝退一批(以是什么是最好的措辞?手动doge);到了环境支配,又会难倒一批(我曾经以为游戏开拓是一件很爽的事情,直到我创造测试小姐姐要买多少台手机,你们可以理解一下);等到末了的演习园地,基本上对付我这种穷汉来说,就只能打出GG了。

0x02 办理方法

目前,无论是对付个人还是企业,想进入AI开拓领域所要付出的学习本钱都极其高昂。
更令人沮丧的是,这种本钱很大一部分是资源缺少整合、干系标准缺失落所带来的后果。

在日益讲究效率的本日,“东市买骏马,西市买鞍鞯,南市买辔头,北市买长鞭”这样的购物体验是极其糟糕的。
如果在AI领域能够涌现类似“淘宝”、“亚马逊”这样的一站式综合购物平台,将会极大的降落AI准入的门槛,让更多人投身到AI浪潮中来。
在此可以套用杜甫的那句诗:安得完美平台一间,大辟天下AI程序猿。

这样一个一站式平台,将会极大地提升AI开拓效率。
用户无需关注底层架构,只需关注运用处景,专注于办理核心问题。
同时,它也会使AI开拓更加遍及。
犹如微信"大众号降落了写作的门槛,这样一个平台也将降落AI开拓的门槛,使个体的创造力能够得到充分的展现。
通过工具解放并且放大个人的生产力,让AI在未来成一种基本生产力,这或许是我们这个时期最伟大的事情。
末了,纵然对付非开拓者来说,也是一个好。
由于AI的运用将会更加丰富。
这方面可以类比Steam,虽然每年都有无数的玩家高呼“G胖还钱”,但不可否认的是,Steam的涌现促进了游戏行业的整体繁荣,游戏开拓者专注做好游戏(AI)即可,打杂的事交给平台去做;而用户也可以享受更为舒适的游戏体验。
可以说,这样一个平台,对付从开拓到运用的整条家当链,都有巨大的代价。

这样的设想不是空谈,已经有巨子意识到这一点,比如Amazon就基于自家的AWS推出了类似的做事。
但目前市情上的产品,离那个空想的平台都还相去甚远。
并且对付海内的开拓者,特殊是企业而言,选择国外巨子的产品也或多或少存在一些额外的本钱和隐患。

同时,海内巨子也开始发力,试图改变行业目前的混乱现状。
华为将于10月份在上海召开华为全联接大会(Huawei Connect)。
在这次的大会上,华为将首次发布其AI计策和全栈全场景的办理方案,促进AI从开拓到运用全体家当链的整合。
在华为云的加持之下, AI技能门槛不断降落,让企业和机构在AI运用中都可以用的起(本钱低)、用的好(上手随意马虎,一站式办理)、用的放心(数据安全,利用稳定),从而大幅提升效率,实现覆盖各行业的“普惠AI”。

0x03 结语

耶和华瞥见了众人所编的程序,说:“看哪,他们都是一样的人,说着同一种措辞,如今他们既然能做起这事,往后他们想要做的事就没有不堪利的了。

于是耶和华打乱了天下人的编程,于是有的人用python,有的人用Java,有的人用C++。

由于耶和华在那里打乱了天下人的言语,使众人分散到了天下各地,以是那座城名叫巴别。
巴别来自希伯来语balal,意思是“混乱”。

目前的AI开拓,无疑则是另一座巴别城。

然而,回忆人类历史上那些高光时候,无一不是从“肃清混乱”开始的。

在无数的混乱中,自会有秩序出身。

这也是任何一个领域连续向前发展的刚性需求。

书同文、车同轨、手机充电器同接口,这些都是人类历史上极其主要的“通天塔”工程。

现在,到AI了。

文章转载自果壳