标签:Granite 4.0 Tiny

NIBM预览Granite 4.0 Tiny模型:12GB显存实现128K上下文5并发会话,提升计算效率与内存需求优化的Transformer架构

随着科技的快速发展,各大企业纷纷推出自己的创新技术。在本月 2 日,IBM 正式介绍了其 Granite 4.0 系列模型中的一个轻量级版本——Granite 4.0 Tiny 的预览版。这款模型以其卓越的计算效率和极低的内存需求而备受关注。 具体来看,Granite 4.0 Tiny Preview 在 FP8 精度下运行时,能够支持多达 5 个并发对话,每个对话的上下文窗口为 128KB,仅需 12GB 显存即可完成任务。这意味着,一张建议零售价为 329 美元(约合人民币 2383 元)的英伟达 GeForce RTX 3060 12GB 消费级显卡就能够满足其硬件需求。 此外,Granite 4.0 T...