我有一个小习气,每次参加完活动,总会加一些新朋友,或被人加,为防止加完后忘却这人长啥样;我会习气性翻看一下对方朋友圈,找到一张照片,保存到备注里,下次见面,以防止认不出来的尴尬。
前两天,活动结束,我加一位技能领域的专家,他在网上还算有名;当时,我从百度百科上保存一张他的照片,想着忙完再备注。
可回到家,怎么也想不起这人是谁,鉴于强制症人格,我总想弄清楚。很头疼,怎么办?于是,我把照片发给海内的几个AI搜索软件,结果都没找到我想要的答案。
末了,把它发给了GPT-4,也没有识别出来,在快要放弃时我寻思给Perplexity试试吧,没想到,不到5秒韶光,它帮我识别出了对方是谁。
我按照线索,在通讯录里找到他的微信,赶紧把备注加上;真惊异,没想到Perplexity进步这么快,虽然Perplexity PRO版用Claude3.5、GPT4-4o和sonar三个模型,但不得不说,某些方面,它已经超过了GPT-4。
于是我在想,各家AI搜索都在对Perplexity贴脸开大,到底谁能做出Perplexity内核部分?Perplexity仅是问答产品吗?创始人怎么看的?这些问题,有必要挖一挖。
01
每次要说这个名字,对不太善于英语的人来说,都有点儿难为情。是的,Perplexity,听起来挺拗口,用中文念出来要五个字,你可以这么读:“佩尔-普莱克-斯提”。
什么意思呢?
大略讲,困惑的。创始人大概在想,如果你有什么困惑,就来问问我们的产品,它能为你解答。
产品是国外的,从生态位上看,介于Google搜索和ChatGPT谈天机器人之间,它不仅有提问窗口还有干系问题,还有创造功能,目前里面网络大量当日的新闻择要,你可以浏览,还是随时连续追问。
创造的好处在于,它能让你知道环球正在发生什么。
把稳,是环球。我以为比起ChatGPT或Gemini更便捷一些,更像海内AI版知乎,这么说,你也不用感到奇怪,由于它的创始团队中,有不少人以前在Quora事情过,而知乎当年的创业灵感,就来自于Quora。
比如:
技能总监Denis Yarats,以前是Quora的机器学习工程师,创始设计师Henry Modisett在Quora事情超过了8年,做过很多产品设计。
Perplexity的创始人Aravind Srinivas,以前在OpenAI事情,紧张研究措辞和扩散天生模型,以是,通过几个人的组合,不丢脸出,这家公司的基因深受其创始团队的经历影响。
知道初心就知道义务,那么,这个产品的设计初心是什么呢?Aravind Srinivas说过,决定做AI问答社区,首先第一点启示来自于谷歌。
Aravind从谷歌两位联合创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)身上学到一件事,即:
早些年,谷歌没有通过模拟其他搜索引擎来竞争,而是选择一种颠覆式创新的模式。
如何颠覆?他们把稳到,答案引擎观点好比今用的搜索引擎历史还要悠久,早在1970年代,信息检索领域研究职员就开始用自然措辞处理(NLP)来帮助人们从文本中获取信息。
1990年代中期的Ask Jeeves(现在的Ask.com)也供应过类似的问答做事,但是,当时搜索引擎靠文本检索信息效果不理想,后来没办法,谷歌才改变技能构造。
进而,采取了用网页链接构造来提取信息,这种办法后来被称为“页面排名”,非常奥妙的创新。
详细来说,两位联合创始人将搜索过程简化成了幂次迭代,他们聘请大量工程师,来开拓关于更多基于传统信息提取技能的排名信息,谷歌与其他搜索引擎的根本差异在于独特的排名旗子暗记。
Aravind还把稳到,Google的创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)都有深厚的学术背景,并且他们努力将学术研究与产品开拓相结合。
这里有一个小事宜:
Google在创业阶段时,试图将自己的搜索引擎根本卖给Excite公司,拉里·佩奇做过一个展示,把Excite的搜索结果和Google的搜索结果进行比拟。
这个过程中,Excite的首席实行官批评Google的搜索结果,但拉里·佩奇坚持认为,一个精良的搜索引擎该当能够在用户输入任何内容时都供应高质量的答案。
以是,拉里·佩奇认为,搜索软件应在任何输入下,都得给用户供应高质量答案;但是,很不巧,后来谷歌走了一条与初心违背却很赢利的事情,即:卖广告,广告赢利效率在当年要比文本天生赢利。
因此,Aravind在谷歌学到两点,一,要颠覆式创新,做文本搜索的事情,而非网页检索;二,最好文本和学术挂钩,用户想要一个实际答案,不是一堆有答案的网页列表。
02
第二点来自于谁呢?投资人Marc Andresson。
Aravind在困惑要不要做垂直领域的搜索软件时,Marc Andresson给他过两个建议:
一,不管如何,都不要做搜索,是把业务拓展到像Quora社区这样的有社交特性的领域。
为什么呢?
很多只做垂直领域搜索的公司末了都失落败了,相反,那些在特定领域供应全面做事的公司却得到了成功。
比如,Booking.com不但搜索酒店,还可以直接预订;Airbnb也不仅仅是预订住宿,而是供应了全套的旅行做事了;如果Perplexity只做得足够深,竞争上风不会只勾留在技能和积累用户上。
二,一个结合社交、AI问答的社区,比纯挚的搜索引擎更有代价。
传统的搜索引擎在回答问题时每每反应慢,不能有效地获取知识。如果Perplexity能提升回答的效率,并连接社区成员,那么,这件事会格外的性感。
以是,后来Aravind被说服了,他以为Perplexity该当做这件事,面前不止于有网页产品,还有社区,未来还要与统统可穿着设备连接。
比如,与Brilliant Labs互助(注:Brilliant Labs,是一家总部位在新加坡的科技公司,紧张开拓具有人工智能功能的开源眼镜),让人们通过AR眼睛进行搜索和查询。
现在来看,Brilliant Labs的确在今年2月9日与Perplexity达成了互助,并且推出Frame眼镜。因此,Perplexity超越了传统搜索引擎的范畴。
第三个启示来自于GitHub Copilot,这当中有个故事。
Aravind说过,像GitHub Copilot这样的工具,很多人都在用,而且还有人为此付费,我自己也在用。(注:GitHub Copilot是由GitHub和OpenAI共同开拓的AI编码助手工具,他能赞助开拓者更智能的写代码)。
拥有人工智能的公司,网络大量数据,但这些数据只是更大事物的一部分;我要找到一个问题,努力办理它,就能从人工智能的进步中受益。
也便是说:
通过人工智能技能,让人利用技能办理详细问题,不仅能改进产品,吸引用户,还能用用户天生的数据持续迭代人工智能的能力,形成一个正向循环。
但是,大多数公司都没有这种特性,这便是为什么他们都在努力找在哪里可以利用人工智能,并让人用起来的缘故原由。
Aravind以为,有两款产品做到了这一点。一个是谷歌搜索,任何人工智能、语义理解、自然措辞处理的改进都会提升产品的质量,更多的数据会让嵌入变得更好。
另一个是自动驾驶汽车,越来越多的人利用它,它为你供应了更多的数据。这使得模型更好,视觉系统更好,行为克隆也更好。
以是,我一贯希望我做的产品有这种特定,它本身不是为消费者搜索行为所设计的,而是,从搜索的那一刻开始,产品才刚刚开始。
03 第四个启示在数据库上。
Aravind说,从技能层面,在如何改变用户搜索体验过程中,我意识到传统的关系数据库面临很多限定,特殊在处理繁芜的自然措辞查询时。
比如:
如果你问数据库,“埃隆·马斯克关注了谁?”或者“莱克斯·弗里德曼关注的是谁?”这种问题,传统数据库是搞不定的。这样的限定,让查询不足灵巧,用户和数据的互动也就受限了。
怎么办呢?随着人工智能技能的进步,我们以为可以破这个局。由于现在有些很棒的编程模型,能懂你说的话,我们就想用这些模型来帮忙。
我们的方法是这样的:
先搜集一些数据,然后把数据放进表里,再根据须要天生SQL查询。我们选择用SQL,是由于它大略明了,选择的东西不多,不像Python那样繁芜。
你可以把这个过程想象成在一个大图书馆里找书。
比如:你想找所有关于“太空旅行”的书,但图书馆的索引系统只按作者名、出版年份排序,没按主题来排。这就麻烦了,由于你知道这些书肯定在,但找起来就没那么直接了。
以是,我们用了一种类似的外部助手(便是大模型),让它从内部开始整理和处理信息,然后,把信息整理成表格,天生须要的SQL查询。
虽然这方法听起来很不错,但其实在把自然措辞转换成SQL的过程中,我们碰着了很多问题,比如缺点处理和系统稳定性问题。
怎么办呢?
我们决定用一种更灵巧、能自我调度的办法,来应对寻衅。如此一来,一方面,我们提升了自然措辞处理系统的能力,让它能更准确地理解和剖析用户的意图。
另一方面,引进更高等的机器学习模型和算法,特殊是能从大量凌乱无章的数据中,学习和提取有用信息的模型,就形成了技能迭代。
问题是,如何改进呢?我们认为关键点在RAG部分。
04
什么是RAG?为什么是RAG呢?
RAG,全称Retrieval-Augmented Generation,中文叫检索增强天生技能。
观点是帕特里克·刘易斯(Patrick Lewis)在2020年的一篇文章《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》中首次提出,现在,他是Cohere RAG团队的卖力人。
Aravind认为,RAG技能能够连接到任何外部数据源,让用户险些可以和任何数据存储库进行对话。
例如:在医疗领域,一个谈天机器人可以通过查询医院的数据来帮助年夜夫;在金融领域,剖析师利用的机器人也可以通过访问市场数据库来供应更可靠的剖析。
以OpenAI为代表的公司采取“微调”办法做事于特定行业客户,即:利用企业自己的数据,来连续演习供应的根本模型,从而开拓出更懂该企业的专有模型。
比如:GPT-4在被演习了更多关于法律和财务的知识后,相较于学得较少的GPT-3.5,更随意马虎通过法律和财务方面的考试。
而利用RAG方法不同。
虽然Perplexity也利用了一些大型模型,但并没有连续让这些模型深入学习特定领域的知识,而是,将数据作为随时可查询的资源供模型参考。
什么意思呢?
当OpenAI通过不断喂养数据,让大模型变得更聪明,使其能直接回答用户问题时,这种做法像是在进行闭卷考试,须要凭借已有的影象来回答问题。
而Perplexity利用RAG技能,则相称于开卷考试,你可以随时查阅资料来找到答案。
也便是说,RAG技能让Perplexity能够利用即时的、广泛的外部数据,为人们供应更精确、更干系的答案,这不仅提高了答案的质量,也极大地增强了系统的运用灵巧性和实用性。
以是,让Perplexity与Google不同的是其答案引擎,而与ChatGPT的差异则在于利用了RAG(Retrieval-Augmented Generation)技能。这种技能连接到外部知识库,使得AI天生的内容更加准确和可靠。
虽然,最近Perplexity面临一些技能伦理、版权争议的问题,但我认为,这并没有影响其在供应高质量搜索上的核心能力。
除了从谷歌、投资人、GitHub Copilot、数据库以及RAG这六个方面得到启示之外,海内的创业者可能更关注如何赢利。
Perplexity并没有像其他公司那样,先做大规模再开始收费,而是一开始就推出了订阅制付费模式,每月20美刀,的确不便宜。但它的模型能力确实很强。
我用它来搜索海内的信息,然后,和利用海内AI软件搜索的结果,以及信息来源的抓取能力进行综合比较,结果毋庸置疑,海内技能还有很长的路要走。
RAG已经成了开卷考试,到底谁更胜一筹呢?
大概用户体验是最好的评判标准,试一试就知道了;此外,海内AI搜索产品中,很多还不支持图片搜索功能、视频搜索功能,并且也面临着如何商业化的寻衅。
只管这个领域,一些企业不差钱,不急于赢利,但,坚持AI技能的开拓和运营烧钱迅速,也不小。
我认为,用户诉求会越来越多,先收费再迭代产品,并非是一件坏事。反之,钱都赚不到,额外需求又进一步增加,就会陷入一种怪圈,大概到时候,用户的衡量标准会变得越来越琢磨不透。
05 总结
AI搜索,到了内卷时候。
当产品、资源都在同质化时还能拼什么?答案可能只有两个字:速率。谁能赚到钱,更快地迭代技能、谁就更有可能领先。
速率的硝烟,等不到明年,大概下半年,就见分晓。祝你,卷出成绩。
本文由大家都是产品经理作者【王智远】,微信公众号:【王智远】,原创/授权 发布于大家都是产品经理,未经容许,禁止转载。
题图来自Pixabay,基于 CC0 协议。