标签:中杯o3
性价比之王,中杯o3模型在OpenAI的性价比方面表现突出
在ARC-AGI测试中的表现令人印象深刻。根据官方数据,中杯o3在ARC-AGI-1上的得分为57%,成本仅为1.5美元/任务,远超其他已知COT推理模型。而更小规模的o4-mini(Medium)虽然准确率稍低,但其成本仅为0.23美元/任务,显示出显著的成本优势。 然而,在升级难度的ARC-AGI-2上,两款模型的准确率均未超过3%。这表明尽管中杯o3在基础推理任务中表现出色,但在面对更高层次的抽象问题时仍需进一步优化。 值得注意的是,当前版本的o3模型与去年底发布的版本有所不同。最新版本经过微调,更适合聊天和产品应用,而非专门针对ARC-AG...