碾压ChatGPT,地表最强AI大模型来了!一口气读15万英文单词,谷歌和亚马逊投资

更新时间:2024-03-07 05:55:36作者:橙橘网

碾压ChatGPT,地表最强AI大模型来了!一口气读15万英文单词,谷歌和亚马逊投资

最近,人工智能大模型初创公司Anthropic发布了Claude 3系列AI模型。根据基准测试结果,Claude 3在各项指标上全面超越了ChatGPT-4。圈内不少人士评价,Claude 3再一次刷新了会话式人工智能的新高度。

Anthropic是OpenAI的强劲对手,其创始团队成员就是从OpenAI出走的技术人员。而这家大模型初创公司的背后,站着的是谷歌和亚马逊这两大科技巨头。风起云涌的大模型世界中,受微软支持的OpenAI目前在商业化探索中遥遥领先,但在捍卫技术先进性方面压力并不小。

地表最强AI大模型易主

Claude 3 AI系列模型有三个,按能力由弱到强排列分别是Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。其中,性能最强的Opus在基准测试的多个核心指标上都全面超越了ChatGPT-4和谷歌的Gemini 1.0 Ultra,荣登目前的AI大模型榜单榜首。

根据Anthropic的介绍,Opus拥有人类本科生水平的知识,在复杂任务上表现出接近人类水平的理解力和流利性。同时,所有Claude 3模型在分析预测、内容创建、代码生成以及西班牙语、日语和法语等非英语语言的对话方面都显示出更强的能力。

综合来看,Claude 3具有以下几个亮点:

一是“记忆力”超群,支持超长文本。Claude 3系列模型在发布时最初将提供200K上下文窗口,并且能够准确回忆大量数据中的信息。200K上下文对话长度,相当于15万英文单词,而此前OpenAI发布的GPT-4 Turbo,可支持的上下文窗口为128K。业内人士分析,长文本的优势让Claude可以在读论文、写小说等涉及字数更多的任务上,更擅长理解和回答用户的问题。

二是多模态能力强,视觉能力突出。据介绍,Claude 3具有与其他领先模型相媲美的复杂视觉能力,可以处理各种视觉格式,包括照片、图表、图形和技术图解。根据网友测评,Claude 3允许用户上传图像和其他文档,能够“认”出和描述图里的内容,回答用户的问题。

三是兼顾安全性与易用性。Claude模型一直被视为“最安全”的模型,致力于降低虚假信息、隐私泄露等方面的风险。不过,此前的Claude 2.1和Claude 2.0曾因为过于“道德”和“守法”,受到了用户的质疑和吐槽。不少人抱怨,Claude像一个难以沟通的“老顽固”,无论是请求帮忙起草文件、完成翻译任务,Claude总是能找到各种理由拒绝执行。

在一些用户看来,Anthropic为了追求安全而牺牲了模型的性能,带来诸多不便,导致使用体验不佳,不少人就表示将取消订阅Claude 2.1或Claude 2.0,转而使用ChatGPT或其他竞品。

更新的Claude 3依然十分重视安全性,但也在易用好用方面进行了优化,拒绝回答无害问题的频率要低得多。据Anthropic介绍,与前几代模型相比,Opus、Sonnet和Haiku拒绝回答的可能性要小得多,显示出对用户请求更细致的理解,能够识别出真正的危害。

国海证券研报表示,“我们认为Claude 3对幻觉问题的处理方式可能成为或已成为行业共识,即如何平衡模型过度保守(拒绝回答某些问题)和正确回答问题而非“不懂装懂”的两种倾向。

在Anthropic发布Claude 3以后,许多科技圈人士都在喊话OpenAI,在线“催更”,表示期待GPT-4.5或者GPT-5的问世。不过,去年6月,OpenAI CEO山姆·奥特曼就曾公开表示,“我们可能会尝试按顺序推出GPT-5模型,但不会很快”。目前,OpenAI更受到外界关注的产品是其2月发布的文生视频模型Sora。

目前Claude 3成功登顶AI大模型榜单的榜首,但在飞速进化的大模型技术浪潮下,地表最强AI大模型的桂冠在未来恐怕也将频繁易主。

硅谷大模型之争的两大阵营

Anthropic是什么来头?

事实上,这是一家成立时间只有3年左右的年轻公司,其两位创始人Dario Amodei和Daniela Amodei都是OpenAI的前员工,离职前分别担任OpenAI的研究部门副总裁和安全与策略部门副总监。据外媒报道,Dario Amodei离职创业时,还挖走了十几名OpenAI的员工,其中就包括GPT-3首席工程师Tom Brown。

值得注意的是,Dario Amodei和Daniela Amodei之所以选择自己出来做大模型,正是因为对OpenAI在技术还不够安全的情况下就快速商业化感到不满,其愿景是构建可靠的、可解释的、可操控的AI系统,首要目标就是AI安全。这便也能够理解,为什么Claude系列模型如此重视安全性。

与OpenAI主要依赖微软为其提供资金支持不同,Anthropic背后站着谷歌、亚马逊、Salesforce、高通、韩国电信等多个投资方。亚马逊在投资的同时,还成为了Anthropic主要的云计算提供商。Anthropic也成为了全球最“吸金”的大模型创业公司之一,仅在2023年,Anthropic就完成了5轮融资,获得了共计73亿美元的融资。

OpenAI由于背靠金主微软,与其他的硅谷科技巨头及它们所支持的大模型初创公司形成了明显的两大阵营。Anthropic无疑是其中最能够与OpenAI叫板和分庭抗礼的一家公司。一名业内人士分析,Anthropic的核心成员正是最初做出了GPT-2、GPT-3的人,团队的研究能力很强。在OpenAI发布ChatGPT以前,Anthropic其实就已经做出了Claude产品,“两个团队的技术能力不相上下”。

不过虽然OpenAI和Anthropic在技术的较量上十分焦灼,但是在商业化能力方面,OpenAI则要明显领先于Anthropic。据The Information报道,截至去年年底,OpenAI的年化收入已经达到16亿美元,管理层预计到2024年底年化收入可达50亿美元。但是,Anthropic预计到2024年底的年化收入仅仅为8.5亿美元。

不过值得注意的是,OpenAI和Anthropic在商业化路线上有比较明显的差异。与OpenAI面向C端用户推出产品相比,Anthropic对B端客户似乎更感兴趣。Anthropic联合创始人此前在接受福布斯采访时表示,Anthropic更像是一家企业公司,而非消费者公司。

目前,已有多家知名企业基于Anthropic模型开发了产品,例如,著名资产管理公司Bridgewater Associates基于Anthropic模型,开发了一款用于自动生成图表、财务数据、总结财务摘要的AI助手。而Anthropic其他的B端客户,还包括Gitlab、Notion、Salesforce等公司。

责编:岳亚楠

校对:王朝全

为您推荐