清华系细胞大模型登Nature子刊!能对人类2万基因同时建模,代码已开源

内容

清华大学与百图生科的科研团队近期在Nature Methods期刊上发表了一项重要成果——scFoundation,这是一个创新的单细胞基础大模型。该模型利用超过5000万人类单细胞测序数据进行训练,拥有1亿参数,能够同时处理约2万个基因。scFoundation在细胞测序、药物响应预测和细胞扰动预测等领域展现出优越性能,为基因网络推断和转录因子识别开辟新路径。面对大规模单细胞数据训练的挑战,团队设计了非对称编码模块和RDA预训练任务,有效降低了计算需求。scFoundation提供了开箱即用和微调两种应用方式,适用于多种生物医学任务。目前,模型权重和代码已开源,团队还提供了API以方便用户轻量级使用。

本文来源: 量子位【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...