常德国潮故事会活动报名入口
2023-12-21
更新时间:2023-12-21 22:05:26作者:橙橘网
“技术成熟不是大力出奇迹就可以,类似怀胎十月能生下孩子,不等于十个人一起努力,一个月就能生下来”
文 | 顾翎羽
编辑 | 刘以秦
2023年,大模型是反差最大的赛道之一。国内“百模大战”热闹了一整年,一款生命力长久的爆款AI应用都还未出现。
“爆款应用迟迟未出现,总是说基础模型,故事渐渐就少有人愿意买单了。”一位资深AI领域投资人向《财经十一人》 表示,尽管大模型是他坚定看好的长期投资方向,但是他认为,有影响力的应用没有出现,行业就始终称不上来到了质变的时刻。
头部公司在微妙转向。12月16日,百度CEO李彦宏在一场活动中表示,“中国现在有好几百个基础模型,这是对社会资源巨大的浪费,尤其在我们算力还受限制的情况下,更多的资源应该放在去探索跟各行各业的结合,探索有没有全新的超级 App的可能性。”
12月20日,百度在北京发布了包括百度百舸计算平台在内的20多个大模型相关的云计算产品进展,涵盖从底层基础设施,到大模型开发与应用,再到AI原生应用开发端到端。
百度在试图降低使用者基于大模型设计应用架构的门槛,帮助开发者更容易用AI能力打造自己的应用。这是其“文心一言”大模型商业化落地的重要动作。
应用能够撬动更大的商业价值。业内普遍认为,大模型只是基础能力,原生应用才是人类进入AI时代的标志,也是技术真正的价值所在。
在经历拥抱大模型、评测大模型、研究如何使用大模型的三轮热潮后,产业进入了加速大模型落地的竞争阶段。如何在有限的算力下,更高效和低成本地进行大模型及生成式AI的应用和落地,是摆在企业面前的现实问题。
为何应用难?
基于大模型打造AI原生应用,并不是在现有应用主页放一个大模型接口就可以。
简单来说,除了大模型底座,至少还需要两个维度的能力:智能算力和AI原生应用研发新范式。如果说大模型是AI原生应用的“大脑”,智能计算便是为原生应用运行提供支撑,新研发范式助力开发者高效基于大模型能力开发应用。
据国际数据公司IDC的测算,2023年,中国通用算力规模预计达到59.3EFLOPS,同比增长8.8%;智能算力预计达到414.1EFLOPS,同比增长59.3%,6.7倍于通用算力增速。
智能算力目前在国内是紧缺资源,不仅仅因为国内高性能计算卡的需求激增。“有再多张GPU,也不一定能够搭建超大规模的训练集群。”一位国内头部制造业企业大模型研发负责人告诉《财经十一人》,超大规模的训练集群,牵涉到对并行效率的高要求,同时还要保障系统的稳定性,“拥有这种运维超大规模计算集群能力的厂商在国内屈指可数,这也是我们一定要和头部云厂商合作开发大模型的前提。”
这提出了对厂商能力的全新要求。IDC认为,国内有关智能算力供给能力的衡量标准也在加速演变。用户在获得算力服务的过程中,硬件性能不再是唯一考虑指标,而是会增加对于诸如单位时间可处理Token数量、可靠性、训练时间和资金成本、数据集质量等指标的关注,也就以应用为导向进行综合考量,。
市场的竞争重心也因此改变。在大模型时代,包括云厂商在内的算力供应商需要以应用为导向、系统为核心来构建算力基础设施平台。IDC中国副总裁周震刚向《财经十一人》表示,几乎所有的头部云厂商,都已经意识到这种变化,正在加速重构自己的计算能力。
同时,以生成式AI为代表的大模型,也让AI技术的落地产生了新的范式。百度集团副总裁侯震宇告诉《财经十一人》,以前的辨别式AI技术往往针对每个细分场景都要独立地准备数据,训练模型,开发AI应用,这就导致了模型碎片化,落地效率低的问题。
而在生成式AI大模型阶段,公司可以基于基础大模型,直接通过Prompt (提示词) 的方式适配场景,也可以按需准备少量的场景数据,精调模型即可取得很好的效果,这样能降低AI技术落地的门槛。
不过,这也意味着企业和人员将应对全新的变化。侯震宇认为,以生成式AI为代表的,大模型驱动的AI原生应用的研发新范式,有三个新变化:首先是新场景。生成式大语言模型,在生成,理解,推理,记忆等多个维度具有超出预期的能力,出现了智能涌现,基于此也催生了很多新的可落地业务场景应用,例如个人助理,智能文案创作,生成式BI-GBI (商业智能产品) ,编码助手等。其次在这些新的场景大模型具体落地过程中,产生了很多新的系统架构。最后是新的开发生态。以大模型为核心,开发者工具层也有一些新的工具。
换言之,这些领域的技术在发生日新月异的变化,因此想要开发一款AI原生应用其实非常复杂,开发者需要做很多工作,来快速学习和理解相关新技术,才能在自己的业务场景落地。
英伟达CEO黄仁勋今年一次演讲时也表示,“AI是对计算方式的重新发明。”“我们从头开始构建一切。”
从头开始需要时间。当下,大模型技术的成熟度并未完全得到行业认可。一位云计算领域资深数字化专家向《财经十一人》 表示,以云计算发展历程来类比,上个世纪云计算概念已有,但真正规模化发展是2000年前后;2008年,容器技术出现,2013年达到了应用水平,直到2017年左右,云原生才走到相对成熟稳定的阶段。前后经历了超过20年的时间。他认为,大模型的发展也许不需要那么久,但是技术从出现到稳定,再到商业化普及,原生应用大量出现,同样需要时间。“如果技术不稳定下来,就难以投入足够多的技术人才去做应用层面的开发。技术成熟不是大力出奇迹就可以,类似怀胎十月能生下孩子,不等于十个人一起努力,一个月就能生下来。”
业内的解法
尽管应用落地需要时间,但对于参与者们来说,这是全新的增量市场。
根据工业和信息化部赛迪研究院的测算,今年中国生成式AI市场规模有望突破10万亿元。生成式AI正在加速渗透制造业、零售业、电信行业和医疗健康等四大行业。据其预测,2035年生成式AI有望为全球贡献近90万亿元的经济价值,其中中国将突破30万亿元,占比超过四成。
除了百度之外,腾讯将大模型嵌入了小程序,阿里也要用大模型将所有应用重新做一遍,华为盘古大模型3.0的定位就是“为行业而生”;这几家云厂商的一个共同动作,是从底层算力到AI平台再到模型服务,端到端升级云计算体系。
可以说,大模型重构了云计算。侯震宇的观点是,在基础设施层,AI应用对GPU或异构计算的需求大幅增加,云市场的底层算力需求将由CPU逐渐转向以GPU为主。在模型层,大模型正成为通用的服务能力,MaaS (模型即服务,Model as a Service) 成为新趋势。在应用层,大模型理解、生成、逻辑、记忆的独特能力会催生原生应用研发新范式,整个应用技术栈、数据流和业务流都将被改变。
一位金融大模型公司高管告诉《财经十一人》,行业目前普遍做法是基于一个通用大模型,去训练自己的垂直模型。根据他调研过市场上几家主流云厂商得出的结论,模型最后效果的差异主要取决于三个因素:领域的专属数据、业务知识和经验、训练精调经验,这三个维度的能力不一样,会导致模型表现不一样。在他看来,一些公司会考虑直接采购云厂商相关的产品,一是因为投入太大,二也是因为缺乏这方面的资深人才,自己从头训练不切实际。
一位大模型从业者表示,比起市场上让人眼花缭乱的大模型,他认为现在更需要的是中间层的服务商,向下为创业者对接资源、兼容多个大模型,向上又能够与企业共创、配合搭建开发环境,打造一个正循环的生态。因此,这个“中间人”至少要具备三方面的能力,一是了解各家大模型的特点和应用场景,同时了解行业;二是具备为应用层对接大模型厂商的能力;最后还要懂技术。
百度目前在做的事,实质就是除了算力基础设施和大模型之外,还提供这种“中间人”的能力。12月20日,百度开放了AI原生应用开发工作台,百度智能云千帆AppBuilder。简单理解,AppBuilder是将基于大模型开发各种应用的常见模式、工具、流程,沉淀成一个工作台,降低应用开发门槛。
对云厂商来说,只有建立繁荣的应用生态,才能形成“模型越强、应用越多、用户越广、算力越大”正向循环。
而对百度这家公司来说,生态的繁荣甚至不是一个可选项,而是公司战略押注AI下,关系到未来发展的必答题。
前述AI领域投资人告诉《财经十一人》,AI原生应用爆发还需要时间,但是,这不意味着没有机会。“现阶段大模型本身还要较多问题需要解决,比如幻觉问题,以及模型使用成本还比较高”。据他观察,目前应用主要还在生产侧,例如文生图等,而消费侧的创新较少。他认为,这是因为在应用创业赛道,人才供给和资本供给均不足,这些限制了爆款应用出现的概率,而爆款应用出现本来也是比较难,“今天回顾移动互联网时代DAU (日活) 超过1亿的产品也寥寥。大模型赛道可能现在就相当于移动互联网的2009年—2010年,而大量移动原生要到数年后才刚刚冒头。”
百度智能云技术委员会主席孙珂向《财经十一人》表示,现在和移动时代的感觉非常类似。2007年,第一款iPhone发布,整体和大模型的出现一样,就像发布了无所不能的一台机器,但是,这个机器的普及还缺一个爆款应用。“我当时买iPhone第一个动力是我想玩爆款游戏‘愤怒的小鸟’,大模型什么时候能做出第一款‘愤怒的小鸟’,中间还需要一系列AI原生应用的开发套件,帮助所有开发者能够更快速知道大模型最深层次能做到什么程度的事情,再往下才能真正搭建出来。”