标签:编程能力

GPT-4.1与Gemini系列人工智能模型编程能力对比:非推理模型领域谁主沉浮?

(由多段落组成): 随着人工智能技术的快速发展,各大科技公司不断推出更强大的模型。近日,OpenAI 发布了全新的 GPT-4.1 系列模型,包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。尽管这些新模型在性能上较之前的 GPT-4o 系列有了显著提升,但与谷歌的 Gemini 系列相比,仍存在一定差距。 根据官方提供的数据,在编程能力方面,GPT-4.1 表现出色。例如,在 SWE-bench Verified 测试中,GPT-4.1 的得分达到了 54.6%,远超 GPT-4o 的 21.4% 和 GPT-4.5 的 26.6%。然而,多位专家测试后指出,GPT-4.1 在某些关键指标上仍落...

Optimus Alpha与Quasar Alpha:探索大模型编程能力,揭秘GPT-4.1上线3天被玩疯的OpenAI神秘痕迹

整理后的 #(由多段落组成) 最近,一款神秘的大语言模型在上线仅三天的时间内就引发了广泛关注。这款名为Optimus Alpha的模型由大模型聚合平台OpenRouter推出,其强大的性能令人印象深刻。据数据显示,Optimus Alpha已经处理了772亿个Token,平均每天超过200亿。目前,它的日Token处理量已突破340亿,在所有模型中排名第二,并稳居Trending榜单首位。 网友们纷纷对Optimus Alpha进行了测试。有人用它挑战了MC-Bench生成《我的世界》风格场景的任务,结果发现其表现远超4o-mini。此外,还有人对其编程能力进行了系统评估...