GPT-5发布引发热议,奥特曼回应褒贬不一的用户评价

整理后文章

GPT-5发布后评价两极分化,用户反馈褒贬不一

近日,OpenAI正式推出了其新一代大语言模型GPT-5,这一版本被公司CEO萨姆·奥特曼(Sam Altman)称为公司发展历程中的重要里程碑。然而,在GPT-5发布后的短短24小时内,来自开发者、用户以及行业专家的评价却呈现出明显的两极分化趋势。

在产品发布会上,OpenAI强调,GPT-5在编程能力、逻辑推理以及复杂问题处理方面有了显著提升。官方表示,新模型已具备“博士级专家”水平,能够胜任更高阶的任务。尽管如此,一些早期用户和AI领域观察者对GPT-5的实际表现并不完全满意。

开发者与用户反馈不一,期待与现实存在差距

部分开发者对GPT-5的性能给予了正面评价。例如,知名技术博主西蒙·威利森(Simon Willison)表示,GPT-5是他目前最喜爱的模型之一,称其“偶尔令人惊艳”,但也指出其与前代GPT-4相比,并未实现突破性的飞跃。

与此同时,不少普通用户在社交媒体平台上表达了失望情绪。他们指出,GPT-5在回答问题时仍然存在“编造事实”、“数学计算错误”以及“拼写错误”等问题。本特利大学数学系副教授诺亚·詹西拉库萨(Noah Giansiracusa)也表示,尽管GPT-5在某些方面有所提升,但整体改进幅度远未达到他的预期。

模型自动切换机制引发争议

与以往模型不同,GPT-5采用了根据查询自动切换不同复杂度模型的机制。这种设计旨在优化计算资源的使用效率,但也带来了用户体验上的不确定性。例如,有用户测试发现,GPT-5在被问及“blueberry中有几个字母b”时,最初给出了错误答案“三次”,但在进一步提示后才切换到更高级模型,给出了正确答案。

对此,奥特曼承认,GPT-5发布初期确实存在系统故障。他在社交平台上回应称,自动切换系统在前一天大部分时间未能正常运行,导致模型表现迟缓。他表示,问题修复后,GPT-5的表现将更加稳定和智能。

竞争激烈,OpenAI面临巨大压力

作为OpenAI在AI领域持续领先的重要产品,GPT-5肩负着应对来自中美科技公司激烈竞争的重任。同时,OpenAI还需通过提升模型性能,吸引企业与个人用户订阅付费服务,以支撑其在AI研发领域的巨额投入。

目前,GPT-5在多个AI模型排行榜中表现优异,例如在LMArena榜单中,它已登顶多个类别榜首。不过,在另一项测试ARC-AGI-2中,其表现却落后于埃隆·马斯克旗下xAI团队开发的Grok模型。

用户体验主观性强,评价标准仍需统一

由于缺乏统一的评估标准,AI模型之间的性能对比往往带有主观色彩。沃顿商学院教授伊桑·莫利克(Ethan Mollick)对GPT-5的多任务处理能力表示高度赞赏,认为它能够完成“超凡甚至AI式”的任务。然而,在Reddit等社交平台上,部分用户却对GPT-5的写作质量提出质疑,认为其不如前代模型。

在一次Reddit的问答活动中,奥特曼坦承用户对模型切换机制存在不满,并表示OpenAI将致力于提升系统的透明度。他还提到,公司内部认为GPT-5在某些版本中写作质量优于GPT-4.5,但用户的直接反馈却是否定的——“是的,它更差。”

结语:GPT-5的表现仍需时间检验

GPT-5的推出无疑是AI领域的一次重要进展,但其真正价值仍需在长期应用中逐步显现。面对激烈的市场竞争和用户日益增长的期望,OpenAI还需不断优化模型性能,提升用户体验,才能在AI浪潮中保持领先地位。

GPT-5, OpenAI, AI模型, ChatGPT, 人工智能

本文来源: iFeng科技【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...