最强开源大模型亮相:开发2个月,花费约1000万美元

更新时间:2024-03-28 17:57:00作者:橙橘网

最强开源大模型亮相:开发2个月,花费约1000万美元

3月28日消息,美国当地时间周三,企业软件公司Databricks宣布推出了新的开源人工智能模型DBRX,声称这一模型在开源人工智能领域的效率和性能上树立了新的行业标准。

Databricks宣称,DBRX模型拥有1320亿个参数,在语言理解、编程和数学技能等关键领域的基准测试中,其性能超过了其他领先的开源人工智能模型,包括Meta的Llama 2-70B和法国初创企业Mixtral AI的模型。


虽然DBRX在某些原始功能上还无法与OpenAI的GPT-4相比,但Databricks高管表示,DBRX无疑是一个功能远超GPT-3.5的替代产品,并且成本只是GPT-3.5的一小部分。

Databricks的首席执行官阿里·戈德西(Ali Ghodsi)在新闻发布会上表示:“我们非常高兴能向全世界展示DBRX,并带动整个行业向更强大、更高效的开源人工智能方向前进。虽然GPT-4这类基础模型无疑是极其优秀的通用工具,但Databricks专注于为客户量身打造模型,这些模型能深入解析他们的专有数据。DBRX的发布正体现了我们实现该目标的决心。”

创新的“专家混合”架构

Databricks的研究团队揭示了DBRX模型的关键创新之处——“专家混合”架构。这一架构使DBRX与其他竞争模型显著不同,后者往往利用所有参数生成每个单词。相较而言,DBRX巧妙地整合了16个专家子模型,并在实时处理中为每个token准确挑选最相关的四个子模型。

这种设计的巧妙之处在于,它使DBRX在任何时刻只需激活360亿个参数,因而实现了更高的性能输出。这不仅显著提高了模型的处理速度,还大幅降低了运行成本,使其更为高效和经济。

这一创新策略是基于Mosaic团队在早期Mega-MoE项目上的进一步研究而开发的。Mosaic团队是去年被Databricks收购的一个研究部门。

戈德西高度评价了Mosaic团队的贡献,他表示:“多年来,Mosaic团队在更高效训练基础人工智能模型方面取得了显著进步。正是他们的努力让我们能够迅速开发出如DBRX这般卓越的人工智能模型。实际上,开发DBRX只用了约两个月时间,成本大概在1000万美元左右。”

推进Databricks的企业AI战略

通过将DBRX开源,Databricks的目标不仅是在前沿人工智能研究领域确立其领导者地位,而且还希望促进其创新架构在整个行业中的更广泛采用。此外,DBRX也致力于支持Databricks的核心业务——为客户定制和托管基于其专有数据集的人工智能模型。

在如今的市场环境中,很多Databricks的客户都依赖于OpenAI及其他供应商提供的GPT-3.5等模型来支撑其业务运作。然而,将敏感的企业数据托管给第三方,常常会激起关于安全性和合规性的一系列担忧。

针对这一点,戈德西表示:“我们的客户相信,Databricks能够妥善处理跨国界数据监管的问题。他们已在Databricks平台上存储并管理了庞大数据量。现在,有了DBRX以及Mosaic的定制模型功能,客户们能够在保障数据安全的同时,充分利用先进人工智能技术带来的诸多益处。”

在日益激烈的竞争中占据一席之地

随着DBRX的推出,Databricks在核心数据和人工智能平台业务领域面临着激烈的竞争。竞争对手诸如数据仓库巨头Snowflake已通过推出自有的人工智能服务Cortex,复制了Databricks的部分功能。同时,亚马逊、微软和谷歌等领先的云计算服务供应商也正纷纷在其技术堆栈中集成生成式人工智能功能。

Databricks借助其开创性的开源项目DBRX,自诩具备最前沿的人工智能研究能力,旨在确立自身作为该领域领导者的地位,并吸引顶尖的数据科学人才。这一策略也反映了人们对大型科技公司将人工智能模型商业化的越来越多的抵制,许多人批评这些商业模型像“黑盒子”,缺乏透明度和可解释性。

DBRX面临的真正挑战在于市场的接受程度以及它为Databricks客户所创造的具体价值。在企业越来越多寻求利用人工智能推动业务增长和创新的同时,还要保持对自有数据的控制,Databricks赌注于其尖端研究与企业级平台的完美融合能够让它在竞争中脱颖而出。

Databricks已经向大型科技公司及开源社区的竞争对手抛出了挑战,要求他们在创新上与其一较高下。人工智能领域的竞争日趋激烈,而Databricks已明确宣布其志在成为这场竞争的关键力量。(小小)

本文标签: 人工智能  数据仓库  databricks