深度解析：OpenAI推出具备多语言支持和强大AI推理能力的o3-mini模型，是否能应对DeepSeek挑战并确保安全评估通过？

每日AI快讯1年前 (2025)更新 AI部落小助手

OpenAI发布全新推理模型o3-mini，性能与成本效益显著提升

近日，OpenAI推出了全新的推理模型o3-mini，该模型在科学、数学和编程等领域表现出色，同时保持了低成本和低延迟的特性。o3-mini已经在ChatGPT和API中上线，并将在一周内推出企业版访问权限。相比前代o1模型，o3-mini不仅提升了复杂推理和对话能力，还在多个基准测试中取得了优异成绩。

o3-mini的应用场景与版本选择

o3-mini提供了三种不同的版本（低、中、高），以满足不同开发者的需求。此外，付费用户还可以选择更高智能的“o3-mini-high”版本，尽管响应时间稍长。o3-mini的知识截止日期为2023年10月，支持上下文窗口达20万个token，最多可输出10万个token。不过，目前o3-mini尚不支持视觉功能，开发者仍需使用o1进行视觉推理任务。

性能优化与多语言支持

o3-mini在多个基准测试中的表现优于前代模型，特别是在GPQA Diamond（理化生）、AIME 2022-2024（数学）和Codeforces ELO（编程）等测试中，o3-mini分别获得了0.77、0.80和2036的评分，展示了其强大的推理能力和高效性。此外，o3-mini在14种语言的MMLU测试集上也表现出色，显著优于o1-mini，进一步证明了其多语言处理能力的提升。

安全评估超越GPT-4

OpenAI对o3-mini进行了多项安全评估，结果显示o3-mini在具有挑战性的安全性和越狱评估方面明显超越了GPT-4o。例如，在不允许的评估中，o3-mini在标准拒绝评估和挑战性拒绝评估中表现相似，但在XSTest中略逊一筹。在越狱评估中，o3-mini与o1-mini表现相当，但均显著优于GPT-4o。

成本与融资动态

自去年9月发布o1以来，OpenAI一直在迭代其推理模型，最新一代的o3系列旨在平衡经济高效与高性能需求。根据印度政府发布的《2024-2025经济调查》报告，OpenAI可能已花费超过3000万美元对其最新AI推理模型o3进行基准测试。与此同时，OpenAI正与软银集团洽谈新一轮融资，计划筹集至多400亿美元，估值将达到3000亿美元，其中软银可能领投150亿至250亿美元。

结语：性价比更高的AI推理模型走向普及

OpenAI推出的o3-mini标志着该公司在追求高性价比智能领域的又一重要进展，让高质量的AI更加触手可及。面对DeepSeek等竞争对手的冲击，o3-mini的发布无疑增强了OpenAI在AI推理市场上的竞争力，同时也引发了业界对未来AI技术发展的更多期待。

本文来源：