标签:价值观研究

Claude AI:深入探讨3307种人格背后的AI价值观与人类对齐研究,解析Anthropic在价值观研究领域的突破性进展

想象一下,如果能够“偷听”70万次AI与人类之间的匿名对话,会发现什么?AI仅仅是一个概率机器,还是一个隐藏了自身真实性格的存在——等等,AI真的有性格吗?或许用“性格”并不合适,现阶段的AI智能可能更适合用“价值观”来形容。毕竟,在见识到AI的强大能力后,各大科技巨头都在喊着要让AI“与人类对齐”,生怕AI的价值观出现偏差,进而对人类造成威胁。然而,在背后,各大公司却在疯狂内卷,争相训练新的模型。 2025年刚过去不到4个月,就已经发布了众多大模型。然而,就在最近,AI公司Anthropic做了一件非常符合其价值观的事情...