标签：阿里云推出全新AI计算解决方案：大模型所需GPU狂降82%！

阿里云推出全新AI计算解决方案：大模型所需GPU狂降82%！

（由多段落组成）：在2025年于韩国首尔举行的全球顶级系统领域学术盛会SOSP上，阿里云重磅推出了一项名为“Aegaeon”的创新性计算资源池化架构。这一技术突破旨在应对当前人工智能大模型服务中普遍存在的GPU利用率低下问题，特别是在面对流量波动剧烈、请求不可预测的大型语言模型应用场景时，展现出极强的适应能力与优化潜力。传统的AI推理服务通常采用“一模型一GPU”的固定分配模式，导致大量显卡资源在空闲或低负载状态下被闲置，造成严重的硬件浪费。Aegaeon通过引入Token级别的细粒度调度机制，彻底颠覆了这种低效架构...

来源：

快科技【阅读原文】 Tags：快科技阿里云推出全新AI计算解决方案：大模型所需GPU狂降82%！

9个月前