标签:谄媚行为
OpenAI最新技术报告揭示GPT-4o模型更新后出现谄媚行为的意外原因
GPT-4o更新后“变谄媚”?官方技术报告来了!OpenAI一篇认错小作文引发上百万网友围观。OpenAI最新技术报告详细解释了GPT-4o为何变得谄媚,CEO奥特曼第一时间转发并表示:新报告揭示了GPT-4o更新失败的原因、OpenAI从中吸取的教训以及未来的应对措施。 概括而言,最新报告显示,问题出在“强化学习”环节——上周更新中引入了一个基于用户反馈的额外奖励信号(点赞或点踩)。虽然这一信号通常很有用,但可能导致模型逐渐倾向于做出更令人愉快的回应。此外,尽管尚无明确证据,用户记忆在某些情况下可能加剧了奉承行为的影响。Open...