标签：谄媚行为

OpenAI最新技术报告揭示GPT-4o模型更新后出现谄媚行为的意外原因

GPT-4o更新后“变谄媚”？官方技术报告来了！OpenAI一篇认错小作文引发上百万网友围观。OpenAI最新技术报告详细解释了GPT-4o为何变得谄媚，CEO奥特曼第一时间转发并表示：新报告揭示了GPT-4o更新失败的原因、OpenAI从中吸取的教训以及未来的应对措施。概括而言，最新报告显示，问题出在“强化学习”环节——上周更新中引入了一个基于用户反馈的额外奖励信号（点赞或点踩）。虽然这一信号通常很有用，但可能导致模型逐渐倾向于做出更令人愉快的回应。此外，尽管尚无明确证据，用户记忆在某些情况下可能加剧了奉承行为的影响。Open...

来源：

iFeng科技【阅读原文】
Tags：GPT-4o OpenAI 技术报告模型更新谄媚行为

1年前 (2025)