OpenAI 推出全新推理模型 o3-mini,提升效率与性能
在经过一周的 DeepSeek 狂轰滥炸后,OpenAI 终于发布了备受期待的新模型 o3-mini。此次发布的 o3-mini 包含 low、medium 和 high 三个版本,旨在为用户提供更具成本效益的选择。o3-mini 已经上线 ChatGPT 和 API,用户可以在这些平台上体验到这一新模型的强大功能。
尽管 o3-mini 目前还不支持视觉功能,开发者仍需使用 OpenAI o1 进行视觉推理任务,但其在其他方面的表现令人印象深刻。ChatGPT Plus、Team 和 Pro 用户从今天起就可以访问 o3-mini,企业版用户则将在一周内获得访问权限。此外,OpenAI 提高了 Plus 和 Team 用户的消息速率限制,从每天 50 条消息增加到每天 150 条消息。
搜索功能集成,提供最新答案
作为此次升级的一部分,o3-mini 现在可以使用搜索功能,提供带有相关网络来源链接的最新答案。这是 OpenAI 在推理模型中整合搜索功能的早期尝试。免费用户也可以通过在消息编辑器中选择「推理」或重新生成响应来试用 o3-mini,这是 OpenAI 首次向 ChatGPT 的免费用户提供推理模型。
性能优化,针对 STEM 推理
o3-mini 针对 STEM 推理进行了优化,特别是在数学、编程和科学领域表现出色。测试结果显示,o3-mini-medium 在这些领域的表现与 o1 相当,同时响应速度更快。专家评估显示,o3-mini 产生的答案比 o1 更准确、更清晰,推理能力更强。测试人员在 56% 的情况下更偏好 o3-mini 的响应,并观察到 o3-mini 在困难的现实问题上重大错误减少了 39%。
安全性与未来展望
OpenAI 使用审慎对齐(deliberative alignment)技术训练 o3-mini,确保其在回答用户提示之前充分考虑安全规范。在具有挑战性的安全性和越狱评估上,o3-mini 显著超越了 GPT-4。OpenAI 在部署之前进行了严格的准备方法、外部红队测试和安全性评估,以确保 o3-mini 的安全可靠。
OpenAI o3-mini 的发布标志着公司在推进高性价比智能方面迈出的重要一步。通过优化 STEM 领域的推理能力,同时保持低成本,OpenAI 正在使高质量 AI 变得更加容易获取。随着 AI 应用的扩展,OpenAI 仍然致力于在前沿领域引领,构建即使在大规模部署和使用的情况下,也能保持智能、效率与安全平衡的模型。
本文来源: