奥特曼被逼急：深夜紧急上线o3-mini对抗OpenAI，网友热议安全性与STEM推理性能，免费体验引发DeepSeek选择难题

每日AI快讯2年前 (2025)发布 AI部落小助手

OpenAI 推出全新推理模型 o3-mini，提升效率与性能

在经过一周的 DeepSeek 狂轰滥炸后，OpenAI 终于发布了备受期待的新模型 o3-mini。此次发布的 o3-mini 包含 low、medium 和 high 三个版本，旨在为用户提供更具成本效益的选择。o3-mini 已经上线 ChatGPT 和 API，用户可以在这些平台上体验到这一新模型的强大功能。

尽管 o3-mini 目前还不支持视觉功能，开发者仍需使用 OpenAI o1 进行视觉推理任务，但其在其他方面的表现令人印象深刻。ChatGPT Plus、Team 和 Pro 用户从今天起就可以访问 o3-mini，企业版用户则将在一周内获得访问权限。此外，OpenAI 提高了 Plus 和 Team 用户的消息速率限制，从每天 50 条消息增加到每天 150 条消息。

搜索功能集成，提供最新答案

作为此次升级的一部分，o3-mini 现在可以使用搜索功能，提供带有相关网络来源链接的最新答案。这是 OpenAI 在推理模型中整合搜索功能的早期尝试。免费用户也可以通过在消息编辑器中选择「推理」或重新生成响应来试用 o3-mini，这是 OpenAI 首次向 ChatGPT 的免费用户提供推理模型。

性能优化，针对 STEM 推理

o3-mini 针对 STEM 推理进行了优化，特别是在数学、编程和科学领域表现出色。测试结果显示，o3-mini-medium 在这些领域的表现与 o1 相当，同时响应速度更快。专家评估显示，o3-mini 产生的答案比 o1 更准确、更清晰，推理能力更强。测试人员在 56% 的情况下更偏好 o3-mini 的响应，并观察到 o3-mini 在困难的现实问题上重大错误减少了 39%。

安全性与未来展望

OpenAI 使用审慎对齐（deliberative alignment）技术训练 o3-mini，确保其在回答用户提示之前充分考虑安全规范。在具有挑战性的安全性和越狱评估上，o3-mini 显著超越了 GPT-4。OpenAI 在部署之前进行了严格的准备方法、外部红队测试和安全性评估，以确保 o3-mini 的安全可靠。

OpenAI o3-mini 的发布标志着公司在推进高性价比智能方面迈出的重要一步。通过优化 STEM 领域的推理能力，同时保持低成本，OpenAI 正在使高质量 AI 变得更加容易获取。随着 AI 应用的扩展，OpenAI 仍然致力于在前沿领域引领，构建即使在大规模部署和使用的情况下，也能保持智能、效率与安全平衡的模型。

本文来源：