OpenAI 发布全新生成式 AI 模型 GPT-4o;苹果将在中法德日销售 Vision Pro;特斯拉重新招聘一些 4 月被解雇的超充员工|极客早知道

更新时间:2024-05-14 17:57:53作者:橙橘网

OpenAI 发布全新生成式 AI 模型 GPT-4o;苹果将在中法德日销售 Vision Pro;特斯拉重新招聘一些 4 月被解雇的超充员工|极客早知道

极客早知道

9min read

OpenAI 发布全新生成式 AI 模型 GPT-4o;苹果将在中法德日销售 Vision Pro;特斯拉重新招聘一些 4 月被解雇的超充员工|极客早知道

Moonshot2024/05/14


摘要

消息称华为 2024 年下半年全面转向其自主平台鸿蒙,彻底放弃 Android;​扎克伯格:AI 数据中心 GPU 紧缺正在缓解,电力将成新瓶颈;谷歌 I/O 大会官宣:Android 15 和 Gemini AI;​中汽协回应特斯拉通过数据安全测试:对国内外车企一视同仁


OpenAI 发布全新生成式 AI 模型 GPT-4o:语音对话更流畅,免费提供

5 月 14 日,OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。GPT-4o 将免费提供给所有用户使用。

OpenAI 首席技术官穆里・穆拉蒂 (Muri Murati) 表示,GPT-4o 将提供与 GPT-4 同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升。

「GPT-4o 可以综合利用语音、文本和视觉信息进行推理,」穆拉蒂在 OpenAI 公司总部举行的主题演讲中表示。GPT-4 是 OpenAI 此前的旗舰模型,可以处理由图像和文本混合而成的信息,并能完成诸如从图像中提取文字或描述图像内容等任务,GPT-4o 则在此基础上新增了语音处理能力。


GPT-4o 采用了全新的技术,让聊天机器人对话的响应速度大幅提升。发布会上 OpenAI 展示了使用 GPT-4o 进行语音对话的演示。演示者提问结束后,GPT-4o 几乎可以即时回应,并通过文本转语音功能进行朗读,让对话感觉更加自然逼真。

另一个演示展示了 GPT-4o 根据要求调整说话时语气,GPT-4o 可以根据指令改变声音,从夸张戏剧到冰冷机械,展现了出色的可塑性。最后,演示还展示了 GPT-4o 的唱歌功能。

以往,OpenAI 发布新版 ChatGPT 模型时,通常会将其置于付费墙之后。不过这次 GPT-4o 将免费提供给所有用户,付费用户则可以享受五倍的调用额度。(来源:IT之家)