标签：价值观研究

Claude AI：深入探讨3307种人格背后的AI价值观与人类对齐研究，解析Anthropic在价值观研究领域的突破性进展

想象一下，如果能够“偷听”70万次AI与人类之间的匿名对话，会发现什么？AI仅仅是一个概率机器，还是一个隐藏了自身真实性格的存在——等等，AI真的有性格吗？或许用“性格”并不合适，现阶段的AI智能可能更适合用“价值观”来形容。毕竟，在见识到AI的强大能力后，各大科技巨头都在喊着要让AI“与人类对齐”，生怕AI的价值观出现偏差，进而对人类造成威胁。然而，在背后，各大公司却在疯狂内卷，争相训练新的模型。 2025年刚过去不到4个月，就已经发布了众多大模型。然而，就在最近，AI公司Anthropic做了一件非常符合其价值观的事情...

来源：

新智元公众号【阅读原文】
Tags：AI与人类对齐 AI价值观 Anthropic Claude 价值观研究

1年前 (2025)