OpenAI 推出最新人工智能模型 GPT-4o,可免费使用

OpenAI 正在发布一种名为 GPT-4o 的新旗舰生成式人工智能模型,该模型将在未来几周内在公司的开发人员和面向消费者的产品中“迭代”推出。

OpenAI 首席技术官 Muri Murati 表示,GPT-4o 提供“GPT-4 级别”的智能,但改进了 GPT-4 在文本、视觉以及音频方面的能力。

“GPT-4o 通过语音、文本和视觉进行推理,”Murati 在 OpenAI 办公室的主题演讲中说道。“这非常重要,因为我们正在研究我们自己与机器之间交互的未来。”

OpenAI 之前的领先模型 GPT-4 接受了图像和文本组合的训练,可以分析图像和文本以完成从图像中提取文本甚至描述这些图像内容等任务。但 GPT-4o 添加了语音功能。
具体来说,这能实现什么?各种各样的事情。

GPT-4o 极大地改善了 ChatGPT 体验 - ChatGPT 是 OpenAI 的病毒式人工智能聊天机器人。ChatGPT 长期以来一直提供一种语音模式,使用文本转语音模型从 ChatGPT 转录文本。但 GPT-4o 增强了这一点,让用户更像助手一样与 ChatGPT 进行交互。

例如,用户可以向 ChatGPT(由 GPT-4o 提供支持)提出问题,并在 ChatGPT 回答时打断它。OpenAI 表示,该模型提供“实时”响应能力,甚至可以识别用户声音中的情感,并生成“一系列不同情感风格”的声音。

GPT-4o 还提高了 ChatGPT 的视觉能力。给定一张照片或桌面屏幕,ChatGPT 现在可以快速回答相关问题,从“这个软件代码中发生了什么”到“这个人穿的是什么牌子的衬衫?”之类的问题。

“我们知道这些模型[变得]越来越复杂,但我们希望交互体验实际上变得更加自然、轻松,并且让您根本不关注用户界面,而是专注于与[ GPT],”穆拉蒂说。

OpenAI 声称,GPT-4o 的多语言能力也更强,在 50 种不同语言中的性能得到了提高。在OpenAI的API中,GPT-4o的速度是GPT-4(特别是GPT-4 Turbo)的两倍,价格只有一半,并且具有更高的速率限制。

在其他消息中,OpenAI 正在发布 ChatGPT 的桌面版本和更新的 UI。