标签：中杯o3

性价比之王，中杯o3模型在OpenAI的性价比方面表现突出

在ARC-AGI测试中的表现令人印象深刻。根据官方数据，中杯o3在ARC-AGI-1上的得分为57%，成本仅为1.5美元/任务，远超其他已知COT推理模型。而更小规模的o4-mini（Medium）虽然准确率稍低，但其成本仅为0.23美元/任务，显示出显著的成本优势。然而，在升级难度的ARC-AGI-2上，两款模型的准确率均未超过3%。这表明尽管中杯o3在基础推理任务中表现出色，但在面对更高层次的抽象问题时仍需进一步优化。值得注意的是，当前版本的o3模型与去年底发布的版本有所不同。最新版本经过微调，更适合聊天和产品应用，而非专门针对ARC-AG...

来源：

量子位【阅读原文】
Tags：ARC-AGI测试 OpenAI 中杯o3 大模型推理性价比之王

1年前 (2025)