“机器人都去写诗了,人类还在洗碗”

更新时间:2024-04-08 19:57:12作者:橙橘网

“机器人都去写诗了,人类还在洗碗”

*本文为《半月谈内部版》2024年第4期内容

“我们希望机器人帮助人类扫地、洗碗,是因为人类要去写诗、画画。现在机器人都去写诗、画画了,人类却还在扫地、洗碗。”

网上的这个段子听上去搞笑,却暗含对人工智能的深层追问:生成式人工智能飞驰,带来的推背感固然令人兴奋,但人类究竟需要怎样的智能?“规模化”的大模型之路能否带我们去往那个理想之境?

一年多来,看涨大模型的声浪已经很高。这一次看看热闹之外的另一面,看看里面隐藏几多陷阱几多“坑”。

后发者陷阱

春天是人工智能故事密集的季节。GPT4发布一周年之季,Figure01成为第一个“拿起苹果”的人形机器人。这一天距离被视作“世界模拟器”的Sora诞生还未满月,OpenAI和Figure官宣合作仅过去13天。

国内,“百模大战”依旧激战正酣。大模型卷出了新高度,一边“卷参数”、一边“拼落地”,消费电子厂商竞相把大模型装进手机,技术与产品加速迭代。多方红利释放下,产业似乎一片向好。但模型与模型之间,更多的是趋同。模型林立、参数浩瀚,但剥开外壳,想要找到够用的、扛打的、鹤立鸡群的,其实不太容易。

从GPT到Sora,同样的问题又一次摆到国内厂商面前:如何追赶、如何复现。每一次现象级“王炸”问世后,扎堆跟随成为不少从业者的路径依赖。

这种习惯由来已久。过去很长一段时间,是后发优势让我们尝到了甜头。后发者引进先发者的技术和经验,能避免大量试错纠偏成本以获得更快发展。毕竟自己搭梯子去摘高处的果实费时费力,还是“低垂的果实”捡起来多快好省。

然而,成长期的大模型,像鱼需要水一样等待算力、数据、资本、人力、能耗的投喂。这些因素过半受制于人或滞后于人时,后发劣势就会逐步显现。此时,先发者兴许早已坐收渔翁之利。


2023年7月6日,在2023世界人工智能大会展会现场拍摄的特斯拉机器人。方喆 摄

1848年,美国加利福尼亚发现了金矿,无数淘金客从世界各地涌向西海岸。10年过去后,大部分淘金者不仅没有发财,反而流离失所,而金矿旁边卖铲子的人最终得到了暴利和财富。

如今,大模型这波热潮,还没真正让多少人尝到实惠,但“卖铲子”的英伟达如同大象坐上火箭,率先成为赢家。出门走一走,几个创业者中总有一个在做大模型。有句话说,大模型创业者睁开眼就能看到对手。但今天,特别是在越发细分的AI级别芯片市场中,英伟达已经没了对手。

路线陷阱

站上风口的大模型光芒有多耀眼,其他技术路线的背影就有多落寞。这几年,大模型忙着刷参数、搞“军备竞赛”,但打败它的往往不是大模型。

时下最热的是自回归生成式路线,即大数据、大模型、大算力的“暴力美学”。从GPT到Sora,都是这一路线的代表产物。它的最大信仰是“规模”(scaling law)——“有疑问时,那就扩大规模”“如果还不够好,那就扩大规模”。

过去一年,“暴力美学”连赢两次,但这条路值得我们集体梭哈吗?

回溯技术发展史,路线之争一直伴随着人工智能的发展。没有一种路线始终独占上风,而是螺旋式推动技术向上走。另一方面,选择“暴力美学”需要算力的优势。而我们,算力遭到掣肘;投资,不比3年前充裕;数据,质量和数量是否够用有待时间检验。200多个(可能更多)大模型在嗷嗷待哺,等待无止境的算力投喂。与能够把一万张GPU连起来用的公司相比,时间窗口正不断错过。

大模型的尽头是AGI(通用人工智能)吗?至今,大数据、大算力炼出的大模型,实现的仍是小任务:回复一段话、做一段视频。这些任务如果交给人类大脑,也许只消耗25瓦的功率,但交给大模型之后,这个计算量就需要把一万张GPU连成串……这是“大数据、小任务”与“小数据、大任务”的不同。当我们琢磨起自己的每一个闪念、每一个行为是如何产生,其实不难发现,一些重要的任务、重要的功能根本无法在规模上无限扩展。

前者好比“鹦鹉学舌”,模仿人说话,既无法解释也不能理解。后者好比“鹦鹉喝水”,复杂架构,无需很多数据,却能实现感知、认知、推理、学习、执行等行为。

事实上,先发者已在看不见的地方,分散布局多点开花。后发者却信了风口造神的神话。

眼下,大模型建设如火如荼,越做越大,也越来越“贵”。最新的AI芯片一颗已经超过3万美元,还不是想买就能买得到。一个百亿级参数的大模型每天的用电量相当于1.7万个家庭的日用电量总和。“暴力美学”不烧脑,但真烧钱啊。

哪怕这条路追得起,跟随的人也总在雾里看花,风口来了一哄而上、泡沫破了一哄而散。因为不知其所以然,所以既不懂得什么应当舍弃,也不知道什么时候应当停下。

认知陷阱

向前看,人类依然期望在硅基上创造一个“人类镜像”。AGI的终极目的依然是让计算机像人类一样智能。AI也依然是那个改变“我们是谁、我们能做什么、我们成为什么”的技术。但仍有相当多的问题没有形成共识。

什么是智能?是数据海洋里的涌现吗?相比于有问才有答的聊天界面,人类是实境生物。人的生命力源自改造世界的实践,AGI的实现终将建立在与真实世界的互动之中。

而今天,等待人类投喂的大模型,还是一个被动接收的信息压缩器,不依赖内部意图驱动,也尚未形成感知世界、收集信息、归纳整合、提出理论、应用实践、修正理论的闭环。因此,自回归生成的语言、内容仅与人类的语言、创造有表面的相似,却没有内在机制的因果关联。


2023年10月17日,工作人员介绍应用大模型的智能驾驶舱。张漫子 摄

沿大模型的路走下去,如果新生的万物皆由过去的数据生成,那么世界如何朝前走——亚里士多德提出的“重的物体落地快,轻的物体落地慢”理论但凡被机器学习之后,伽利略的比萨斜塔实验就不会再有了,更不会出现推翻亚里士多德的“自由落体理论”了。

人类的重大发现,最初往往是基于一种实境中的违反逻辑的直觉,一种基于对现实和已有理论批判的顿悟,而不是对既有理论、历史结论的归纳、推演。

AI的进阶,既是一道工程问题,也是一道科学问题。不能仅运行在虚拟世界的语言、图像的生成之上,而应真正与现实交互、关联。

或许,在物理世界与数字世界中学习进化,以在理解世界、与世界交互的基础上完成复杂任务为目标的具身智能,将为AGI补全最后一块拼图。

下一波智能的竞争中,在算法、工程、数据、场景、软件、硬件交织杂糅的,从基础电机到减速器、控制器再到机械臂、灵巧手都需要持续技术突破的竞技场上,我们能否摆脱后发者的追逐、形成独特的核心优势?

通用人工智能这张“饼”够大。但要避得开陷阱,才能接得住富贵。

半月谈记者:张漫子 / 编辑:张曦

原标题:《跨越人工智能三大“坑”》

责编:褚孝鹏 / 校对:张子晴