本周AI界发生了什么 | GPT-5拟年中推出；谷歌Gemini或进驻iPhone；微软“雇佣式”收购Inflection AI

更新时间：2024-03-27 17:57:02作者：橙橘网

文｜陈斯达

编辑｜邓咏仪

一周纵览

本周大事件不断。最大热点当属英伟达GTC大会。英伟达正式发布新一代AI芯片”Blackwell B200”，创始人黄仁勋称其为史上最成功的产品。

其他玩家也没有闲着。马斯克旗下AI初创公司xAI就开源了大模型Grok-1，其参数量高达3410亿。另一边，OpenAI终于有了新消息，据传将在年中推出 GPT-5。更为重磅的消息来自硬件玩家——苹果公司正积极与谷歌和OpenAI展开洽谈，希望将大模型引入iPhone。

硅谷的AI独角兽们就颇为动荡。Inflection AI创始人、谷歌 DeepMind 联合创始人即将加入微软的AI阵营。Stability AI依旧在风雨飘摇之中，继此前核心技术团队集体离职后，本周CEO也宣布跑路了。

国内本周舞台属于“长文本”（Long Context）。月之暗面正式宣布旗下Kimi智能助手已支持200万字超长无损上下文，在市场引起广泛关注；随后，阿里通义千问更新，免费开放1000万字长文档处理功能，百度、360智脑也相继宣布即将上线200万-500万字的长文本处理能力。在周末，通用大模型创业公司阶跃星辰正式对外亮相，发布Step-2万亿参数MoE语言大模型预览版。

Key Points大模型第一线OpenAI有望年中推出GPT-5

据 The Business Insider 援引匿名知情人士消息，OpenAI 公司正计划筹备在今年年中推出 GPT-5，预计时间是夏季。此外，知情人士透露，一些企业客户已经提前体验了最新模型的演示以及与之相配套的 ChatGPT 增强功能。一位体验过 GPT-5 版本的 CEO 对其表现给出了高度评价：“它的表现非常出色，带来了明显的改进。”

苹果与谷歌、OpenAI谈合作，大模型或进iPhone

据彭博社最新报道，苹果公司正积极与谷歌和OpenAI展开深度谈判，旨在将这两家公司的生成式大型语言模型整合进iPhone的全新人工智能功能中，为未来的iOS 18系统奠定强大的底层框架。正式官宣预计要等到今年夏季之后。同时，3月23日消息，据《华尔街日报》报道，苹果与百度就在其中国设备中使用百度生成式AI技术进行了初步谈判。目前还无法确定苹果是否与其他中国生成式AI公司合作。

马斯克Grok-1开源，参数量3410亿

3月18日，马斯克旗下AI初创公司xAI宣布，其研发的大模型Grok-1正式对外开源开放，用户可直接通过磁链下载基本模型权重和网络架构信息。Grok-1是一个由xAI 2023年10月使用基于JAX和Rust的自定义训练堆栈、从头开始训练的3140亿参数的混合专家（MOE）模型，远超OpenAI的GPT模型。不过，此次开源的版本，是Grok-1预训练阶段的原始基础模型，没有针对任何特定应用（例如对话）进行微调。

复现Sora，Colossal-AI发布开源项目Open-Sora

继推出成本直降 46% 的 Sora 训练推理复现流程后，Colossal-AI团队全面开源全球首个类 Sora 架构视频生成模型 “Open-Sora 1.0”，涵盖了整个训练流程，包括数据处理、所有训练细节和模型权重，携手全球 AI 热爱者共同推进视频创作的新纪元。

Open-Sora 1.0 生成的都市繁华掠影

Stability.ai 发布 Stable Video 3D

Stability.ai发布Stable Video 3D，利用其多视图一致性来优化 3D 神经辐射场(NeRF)和网格表示，以提高直接从新颖视图生成的 3D 网格的质量，能够从任何给定角度提供连贯的视图，并具有熟练的概括能力。Stable Video 3D质量和多视图显著提高，性能优于之前发布的Zero 123XL等其他开源替代品。

Stable Video 3D生成效果

「Kimi智能助手」支持200万字上下文，出圈爆火

3月18日，大模型厂商“月之暗面”正式宣布，旗下Kimi智能助手已支持200万字超长无损上下文，并于即日起开启产品内测。21日下午，月之暗面旗下大模型应用Kimi的APP和小程序均无法正常使用。月之暗面表示，观测到Kimi的系统流量持续异常增高，远超对资源的预期规划。受到Kimi热度的催化，华策影视、掌阅科技、中广天择、福昕软件相关概念股股价持续攀升。

大模型厂商「阶跃星辰」首亮相，已训万亿参数大模型

3月23日，2024全球开发者先锋大会上，通用大模型创业公司阶跃星辰正式对外亮相。阶跃星辰研发的Step-1V 千亿参数多模态大模型，在中国权威的大型模型评估平台“司南”（OpenCompass）多模态模型评测榜单中位列第一。阶跃星辰创始人、CEO姜大昕博士在大会上正式对外发布了Step-2万亿参数大语言模型预览版，模型采用 MoE架构，聚焦深度智能的探索，并提供API接口给部分合作伙伴试用。

大事件英伟达发布新一代AI芯片

3月18日-21日期间，英伟达在美国圣何塞召开GTC大会，发布下一代芯片架构Blackwell，这一GPU平台也是黄仁勋口中，英伟达史上最成功的产品。据介绍，Blackwell GPU以数学家David Harold Blackwell的名字命名，同样沿用了英伟达此前推出的Hopper架构。Blackwell GPU中包含2080亿个晶体管，可支持多达10万亿个参数的AI模型。

微软“雇佣式”收购Inflection AI，创始人加入微软

3月19日，微软正式宣布，人工智能初创公司Inflection AI 的 Mustafa Suleyman 和 Karén Simonyan 及其他大部分员工将加入Microsoft AI，专注于面向消费者的 AI 产品和研究。3月22日，据知情人士透露，微软已同意向Inflection AI支付约6.5亿美元，主要以许可协议的形式，使Inflection AI的模型可以在Azure 云服务上销售。这意味着，以雇用核心团队成员加上“模型授权费”之名，微软只实质上完成了对Inflection这家估值一度在AI排行榜上名列第三（仅次于OpenAI和Anthropic）的公司的收购。

Stability AI核心团队闪崩，CEO辞职

当地时间3月23日，独角兽AI公司Stability AI称，宣布公司 CEO Emad Mostaque 辞职。Emad Mostaque 在社媒平台 X 上宣布，自己离职后将致力于去中心化人工智能（Decentralized AI）。本周早些时候，核心研发团队已集体辞职。Stability AI因开发了文生图大模型Stable Diffusion而知名，创立于2020年底，2022年估值一度高达10亿美元。

苹果遭美国司法部反垄断诉讼，市值蒸发1100亿美元

路透社消息，当地时间3月21日，美国司法部长梅里克·加兰在当天的新闻发布会上表示，美国司法部和十几个州的总检察长对苹果公司提起反垄断诉讼，指控苹果公司利用其对苹果产品硬件和软件的控制垄断手机市场，损害了消费者、开发商和竞争对手公司的利益。受此消息影响，苹果当天股价大跌4.09%，市值蒸发超过1100亿美元（约8000亿元人民币），总市值回落至2.65万亿美元。

联合国通过首个全球AI决议

当地时间3月21日，联合国大会投票通过了第一个有关人工智能（AI）的决议草案，以确保这项新技术能够惠及所有国家、尊重人权并且是“安全、可靠和值得信赖的”技术。据悉，美国为这项决议草案的发起国，中国参与了共同提案。

融资动态英伟达考虑收购以色列AI创企Run:ai

以色列经济学家报消息，3月17日，英伟达被曝正洽谈收购以色列人工智能基础设施平台Run:ai，交易价值可能达到10亿美元。Run:ai 由首席执行官 Omri Geller 和首席技术官 Ronen Dar 博士于 2018 年成立。2022 年 3 月，Run:ai 在 C 轮中筹集 7500 万美元，由老虎环球基金（Tiger Global Management）和洞见创投（Insight Partners）领投。

沙特计划设立400亿美元基金投资AI

据纽约时报，三位了解计划的人士透露，沙特阿拉伯政府计划创建一支约400亿美元的基金，用于投资人工智能（AI）技术。若顺利成立，这支基金将使沙特成为全球最大的AI投资者。知情人士表示，最近几周，沙特公共投资基金（PIF）的代表已经与硅谷最成功的风投公司Andreessen Horowitz（a16z）等金融机构讨论了潜在合作伙伴关系，议题包括基金如何运作及a16z可发挥的作用。

「小英伟达」Astera Labs上市，募集6亿美金

3月20日，芯片制造商Astera Labs在美国纳斯达克上市，募资6亿美元。借AI的东风，投行将Astera Labs包装成“小英伟达”的概念，这使Astera Labs深受市场追捧。Astera Labs核心产品之一是数据和内存连接半导体，可有效提升软硬件之间的连接效率和速度，客户包括行业巨头如亚马逊和微软。其上市首日收盘价为62.03美元，较发行价上涨72.31%，以收盘价计算，公司市值约94.59亿美元。

新玩意Suno正式发布V3音乐生成模型

AI音乐生成创企Suno正式发布文生音乐模型v3，该模型可在几秒钟内创建完整的两分钟歌曲。该工具可以通过其免费的独立网站访问，也可以通过启用Suno的第三方插件Microsoft Copilot访问。用户只需要简单的文字描述，就能创作出具备专业水准的音乐。

Suno界面

体验地址：https://app.suno.ai

前沿研究Adobe新研究：0.11秒从草图生成图像

3月19日，来自CMU、Adobe的团队在arXiv上发表论文，提出一种图像推理方法。据介绍，该方法解决了现有条件扩散模型的两个限制：由于迭代去噪过程导致的推断速度较慢、对配对数据进行模型微调的依赖。为了解决这些问题，作者引入了一种通用方法，通过对抗学习目标将单步扩散模型适应于新的任务和领域，既能利用预训练扩散模型的内部知识，同时还能实现高效的推理。对于512*512的图像，在A6000上生成时间为0.29秒，在A100上为0.11秒。

论文截图

论文地址：

https://arxiv.org/pdf/2403.12036.pdf

试玩地址：

https://huggingface.co/spaces/gparmar/img2img-turbo-sketch

本文标签：微软谷歌英伟达 apple iphone 埃隆_马斯克

上一篇：本周AI界发生了什么 | GPT-5拟年中推出；谷歌Gemini或进驻iPhone；微软“雇佣式”收购Inflection AI

下一篇：原腾讯云VP创办「矩阵起源」，打造超融合异构数据库｜早期项目

本周AI界发生了什么 | GPT-5拟年中推出；谷歌Gemini或进驻iPhone；微软“雇佣式”收购Inflection AI

相关文章

为您推荐

本周AI界发生了什么 | GPT-5拟年中推出；谷歌Gemini或进驻iPhone；微软“雇佣式”收购Inflection AI

原腾讯云VP创办「矩阵起源」，打造超融合异构数据库｜早期项目

长六甲运载火箭成功发射云海三号02星，星箭均由上海航天抓总研制

长电科技高开10% 公司实控人将变更为中国华润

【开盘】A股三大股指集体小幅低开，小米汽车概念走弱

绿地集团张玉良呼吁：全力以赴稳定不动产和股权资产价格

热门文章

热门推荐

最新文章