昨天看到一个论文,叫"Language Models are Few-Shot Learners",说的是要提高大模型,你得给他供应多样性。啥叫多样性?说白了便是供应全天下所有的措辞,所有的领域的笔墨给这个大模型,Ai才能通过大数据学习理解这个天下。这实在涉及到了迁移学习(Transfer Learning)与元学习(Meta Learning),让模型能在不同的任务和领域之间灵巧切换。但是纵然理解了又能怎么样呢?这些大模型能说会道,但便是能力有限。它们看不着、摸不着、闻不着、听不着。只是一个脑筋长着一个嘴巴。缸中的脑筋还缺少了眼晴,耳朵……。
大措辞模型没有五官五感,这才是制约大模型发展的关键。只是发展单一的五官是没有出息的,就算有人现在说多模态,只是说让这些大措辞模型天生视频,天生图片,这种天生能力就算开拓的再好也是有限的。
前一段韶光有人给大措辞模型装上了眼晴。可是这是一个普通的B站博主做的,还涉及了打算机视觉(Computer Vision)技能,也不繁芜。能够用眼睛看到物体并回答问题的大措辞模型该当是聪明的。接下来的寻衅是,能否进一步装上"耳朵",乃至"嗅觉",让大模型更加像人类一样能感知和理解这个天下。
这个博主也是很普通的博主也不是什么天下顶级人工智能大牛,他的技能也不高等,也不没那么精湛,他能有这样的思路,难道是我们的那些大牛,我们那些所谓的遥遥领先的专家们都在干嘛呢?
那些大厂的大牛们是在睡大觉吗?该当也没有。只不过这些技能不被重视,是有这个技能也用不上,也用不着也不能用,也没法用。而且,各个大公司都想着如何去赢利了,轻微有点功能,赶紧就吹个大牛,去让大模型赶紧给自己创造经济效益,至于说技能创新吗?至于说技能改造嘛,靠边站,这些实在都是短视的。
大模型大力失事业是有限度的。仿照人类的五官六感才是变聪明的打破。等这些功能完备了,强人工智能就立韶光降了。有些人也不要怕。蒸汽机涌现的时候,有人说毁坏风水。织布机涌现的时候有人拿工具去打砸。有很多人哭着喊着,对人工智能各种的限定打压,包括最近海内的AI绘画都不能用了,各个绘画厂家各个AiGC的绘画网站,好多都已经到了盈利和收费的边缘了,直接覆灭了,政策的缘故原由我们大概知道一点点,但是巨大的市场需求如何知足呢?那些大厂是否供应了必要的技能和必要的能力知足中国这个巨大的市场呢?
对付AI绘画天生式人工智能AI视频之类的,难道只能一禁了之吗?
你们在打压人工智能技能的时候,大概别的国家已经把这些技能运用在了军事上,那到时候可怎么办呢?人家的机器人越来越聪明,难道说,等别人的强人工智能涌现了,我们就派出华强北?马家军?然后遥遥领先?问题是有的时候,华强北和马家军也无可奈何。以前有用,往后未必有用。
现在的大措辞模型已经开始考试测验多模态(Multimodal)结合,能对话了,过两天就能听到声音了,过两天也都有视觉了。这实在涉及到告终合模型(Joint Models)和跨模态学习(Cross-Modal Learning)等领域的研究。我们的大模型还都在给各个厂家卖做事,啥做事呢?便是把你企业的文档把你企业的数据全做成本地数据库,然后谈天玩儿。然后客户讯问问题的时候,各种打太极,各种推举商品的购买,各个企业都玩的好溜呀。各种的插件平台一窝蜂的上,实在都是一个套路,便是谈天。
还有一个著名平台做平台起身,现在直接把他们的模型开源,意思是让大家开源的用,连续做平台梦,但是天下已经发生很大的变革了,做平台发达了,不能永久做平台发达,我的小学老师就曾见告我,不能一条道走到黑,难道这个平台的老总不知道吗?成功是没法复制的,曾经做平台起身,就1万年的做平台吗?资源都摧残浪费蹂躏了,实在也没见有多大的水花。
重申一下,大模型大力失事业是有限度的。真正的打破点在于模拟人类五官六感,让模型能够感知环境并实际行动。只有这样,强人工智能才能真正走向我们的生活,开启全新的科技革命!