标签:OpenAI通过对比自家模型GPT-5与o4-mini的测试表现发现