标签:阿里云推出全新AI计算解决方案:大模型所需GPU狂降82%!

阿里云推出全新AI计算解决方案:大模型所需GPU狂降82%!

(由多段落组成): 在2025年于韩国首尔举行的全球顶级系统领域学术盛会SOSP上,阿里云重磅推出了一项名为“Aegaeon”的创新性计算资源池化架构。这一技术突破旨在应对当前人工智能大模型服务中普遍存在的GPU利用率低下问题,特别是在面对流量波动剧烈、请求不可预测的大型语言模型应用场景时,展现出极强的适应能力与优化潜力。 传统的AI推理服务通常采用“一模型一GPU”的固定分配模式,导致大量显卡资源在空闲或低负载状态下被闲置,造成严重的硬件浪费。Aegaeon通过引入Token级别的细粒度调度机制,彻底颠覆了这种低效架构...