标签:Karpathy投资

N分布式强化学习时代来临:INTELLECT-2利用算力资源整合与去中心化训练,性能媲美R1,获Karpathy投资青睐

全球首个分布式强化学习(RL)训练模型INTELLECT-2已发布。该模型通过整合全球闲置或分散的计算资源完成了强化学习训练,大幅降低了训练成本,其性能可媲美DeepSeek-R1。 一旦这种范式被广泛接受,意味着RL训练将不再依赖于集中式算力,任何人皆可参与模型训练,大公司对算力的垄断时代或将终结。此版本共有19个个人/机构提供了算力支持,此外还有不少大佬愿意投资,包括Karpathy、FlashAttention作者Tri Dao、HuggingFace联创兼CEO Clem Delangue等。 目前INTELLECT-2支持网页端体验,只需简单注册即可使用。与其他通用助...