亚马逊在AWS re:Invent大会连发六款大模型,推出基于3nm工艺的Trainium2 AI训练芯片与Bedrock、S3 Tables,打造最强AI服务器算力新高度
全球最大云计算巨头发布多项重磅技术
12月3日,拉斯维加斯报道 —— 在年度云计算产业盛会AWS re:Invent大会上,亚马逊云科技(AWS)发布了多项重磅技术和产品,涵盖大模型、AI芯片、生成式AI平台等多个领域。
一、全新自研大模型Amazon Nova系列亮相
亚马逊总裁兼CEO安迪·贾西在现场介绍了生成式AI如何在亚马逊的不同业务中发挥作用,包括电商客服、卖家详情页创建、库存管理、机器人、Alexa、Amazon Lens、线上购物衣服尺码匹配、Prime Video等。随后,他公布了全新大模型系列——Amazon Nova。
– Micro:纯文本模型,128k上下文窗口,延迟最低,响应速度最快。
– Lite:低成本多模态模型,300k上下文窗口,可快速处理图像、视频和文本输入。
– Pro:多模态模型,300k上下文窗口,兼顾准确度、速度和成本,能进行视频理解、生成创意素材。
– Premier:亚马逊功能最强的多模态模型,可用于执行复杂的推理任务,并可用作蒸馏自定义模型的最佳老师(将于2025年第一季度推出)。
此外,AWS还发布了图像生成模型Canvas和视频生成模型Reel。Reel现支持生成6秒视频,很快将会延长到2分钟。这些模型支持自定义微调和蒸馏。
二、AWS Trainium2实例全面推出,发布第三代AI训练芯片、最强AI服务器
AWS全面推出了由Trainium2芯片驱动的Amazon EC2 Trn2实例,相比当前基于GPU的EC2实例,性价比高出30%~40%。全新Amazon EC2 Trn2实例专为生成式AI高性能深度学习训练而构建。
– 第三代自研AI训练芯片:AWS发布了新一代AI训练芯片Trainium3,采用3nm工艺节点制造,能效提高40%、性能翻倍提升。搭载Trainium3的UltraServer性能预计将比Trn2 UltraServer高出4倍。
– 最强AI服务器:AWS发布其史上最强AI服务器AWS Trn2 UltraServer,使用超高速NeuronLink互连,将4台Trn2服务器连接在一起,形成1台巨型服务器,实现更快的大模型训练和推理。
三、生成式AI平台Bedrock服务三大更新
AWS Bedrock服务可帮助企业构建和扩展生成式AI应用程序,今天公布了关于自动推理检查、多Agent协作、模型蒸馏的新功能。
– 自动推理检查:AWS推出了AWS Automated Reasoning checks,可验证事实响应的准确性、生成可审计的输出,并向客户展示模型得出结果的确切原因。
– 多Agent协作:Bedrock的新功能帮助企业轻松构建、部署、编排Agent团队,加速复杂多步骤任务的完成。
– 模型蒸馏:借助Amazon Bedrock Model Distillation,客户可以以合适的成本提供其应用程序所需的延迟,蒸馏模型速度最高可提高500%,运行成本降低75%。
四、Amazon Q Developer超越代码,覆盖更广泛开发任务
Amazon Q Developer辅助编程平台此次升级的重点是超越代码完成,帮助开发人员完成端到端软件生命周期中涉及的更广泛日常任务。
– 将Windows .NET应用程序现代化为Linux:速度提高4倍,并将许可成本降低多达40%。
– 将VMware工作负载转变为云原生架构:自动规划、鉴别、决定和转换网络配置,在数小时内将本地网络配置转换为AWS等效配置。
– 自动生成单元测试和代码文档:Q Developer现可自动生成单元测试,并帮助开发人员编写和维护代码文档。
五、与英伟达合作14年,明年初发布Blackwell架构P6实例
AWS和英伟达合作已经14年,加曼宣布其合作升级,发布P6实例。P6系列将采用新Blackwell芯片,明年初发布,P6实例将提供最多2个,计算速度比当前一代GPU快5倍。
六、Amazon S3存储功能扩展,更快数据湖分析、自动元数据生成
AWS推出Amazon S3 Tables功能,使S3成为首个完全托管支持Apache Iceberg的云对象存储,可实现更快分析,并以最简单的方式存储和管理任何规模的表(Table)数据。
– S3 Tables:与通用S3存储桶相比,S3 Tables可提供3倍的查询性能、10倍的每秒事务数(TPS),并会自动管理表维护任务。
– S3 Metadata:可以近乎实时地自动生成可查询的目标元数据,并使其可通过新S3 Tables进行查询,让发现和管理S3中的海量数据变得更简单快捷。
七、两大数据库上新:能跨区域运行,具备强一致性
AWS宣布推出Amazon Aurora DSQL和Amazon DynamoDB global tables新功能,以支持一些工作负载对跨区域运行、强一致性、低延迟、高可用性的严苛需求。
– Amazon Aurora DSQL:一种新型无服务器分布式SQL数据库,既可以提供高端商用数据库的所有性能和功能,又具有开源数据库的灵活性和成本效益。
– Amazon DynamoDB global tables:支持多区域强一致性,确保客户的多区域应用程序始终读取最新数据,而无需更改任何应用程序代码。
八、面向高密度AI工作负载,推出全新灵活数据中心组件
AWS宣布推出全新数据中心组件(电源、冷却、硬件设计),旨在支持高密度AI工作负载。
– 简化电气和机械设计:使基础设施可用性达到99.9999%,还将可能受电气问题影响的机架数量减少了89%。
– 冷却、机架设计和控制系统的创新:开发全新可配置液冷解决方案,通过优化数据中心机架的定位方式来最大限度利用电力,更新了标准化监控、报警和操作顺序的控制系统。
– 提高能源效率和可持续性:与之前的设计相比,预计在峰值冷却条件下机械能消耗可降低多达46%;与行业平均水平相比,数据中心建筑外壳混凝土中的隐含碳减少35%;备用发电机将能够使用可生物降解且无毒的可再生柴油燃料。