标签：AI模型

微软Muse AI模型助力视频游戏生成，开启游戏开发新篇章，可持续性创新引领未来

微软Muse模型登上Nature，开启游戏生成新时代 2月20日，微软的首个世界和人类行动模型（WHAM）Muse在国际顶级学术期刊《自然》上发表。Muse是一款基于视频游戏生成的AI模型，拥有高达16亿参数，经过接近7年的人类游戏数据训练。该模型能够理解游戏中的物理环境和3D场景，并生成玩家的动作及视觉效果。尽管目前仅能以300×180像素的分辨率生成游戏画面，但其生成的游戏视频效果已具备一致性、多样性和持久性。 Muse由微软研究员游戏智能团队、可教的AI体验（Teachable AI Experiences）团队与Xbox Games Studios旗下的Ninja ...

来源：

智东西【阅读原文】
Tags：AI模型可持续性微软Muse 游戏开发视频游戏生成

1年前 (2025)

马斯克斥资20万块GPU打造Grok-3 AI模型，凭借强大推理能力在数学领域暴击DeepSeek R1，深度搜索性能远超OpenAI，彰显大规模GPU训练优势

马斯克口中最强AI模型Grok-3震撼登场近日，马斯克带领xAI团队正式发布了全球最强大的大模型Grok-3。这款模型使用了20万块GPU进行训练，是人类历史上首次在如此大规模的硬件集群上完成的训练任务。Grok-3一经发布便迅速席卷多个排行榜，击败了o3-mini（high）和DeepSeek-R1等强劲对手。 Grok-3的技术亮点 Grok-3的训练计算量达到了惊人的10倍于Grok-2，其背后支撑的是世界最大的超算集群Colossus，该集群拥有20万块GPU。第一阶段用时122天搭建了10万块GPU，第二阶段再用92天完成了全部20万块GPU的配置。在多项基准测试中...

来源：

新智元公众号【阅读原文】
Tags：AI模型 Grok 3 大规模GPU训练推理能力

1年前 (2025)

中外大模型加速开源，AI模型成本下降与多模态能力提升！文心一言和GPT-5在算力优化上紧追不舍，免费资源助力创新

国内外大模型厂商掀起开源和免费浪潮，AI技术平民化加速近期，国内外主流大模型厂商如百度、DeepSeek、OpenAI、谷歌等纷纷宣布旗下高端AI模型将转向开源，并计划免费向用户开放。这一趋势不仅标志着大模型竞赛进入白热化阶段，也预示着AI技术正在逐步走进普通百姓的生活。百度与OpenAI的激烈竞争百度和OpenAI作为两大巨头，在短时间内相继发布了多项重要更新。百度宣布将在未来几个月内推出文心大模型4.5系列，并计划于6月30日开始开源。此外，百度还表示今年下半年将发布文心大模型5.0系列。与此同时，OpenAI CEO奥...

来源：

智东西【阅读原文】
Tags：AI模型多模态能力开源成本下降算力优化

1年前 (2025)

AI颠覆者：DeepSeek在中美科技竞争中的开源AI模型与技术创新之路

2025年AI行业迎来重大变革：DeepSeek震撼全球 2025年初，国内AI公司DeepSeek以颠覆性的姿态迅速崛起，登顶全球应用下载榜榜首，日活跃用户突破1500万。中美科技界对DeepSeek展开了激烈的讨论，观点交锋不断，有人高度认可，有人冷嘲热讽，甚至有人陷入恐慌。Anthropic CEO达里奥·阿莫迪发表长文呼吁加强对华芯片封锁；OpenAI CEO山姆·奥特曼罕见认错，承认OpenAI的领先性被削弱。美国总统特朗普也指出DeepSeek给美国敲响了警钟。 DeepSeek的成功秘诀 DeepSeek的成功基于三个关键因素： 1. 模型能力追平行业领先水平： ...

来源：

窄播公众号【阅读原文】
Tags：AI模型 DeepSeek 中美科技竞争开源技术创新

1年前 (2025)

Tomshardware探讨：DeepSeek基于NVIDIA GPU的AI模型并未带来预期的人工智能奇迹，技术创新仍有待观察

中国AI初创公司DeepSeek引发全球关注近日，快科技报道了中国AI初创公司DeepSeek的崛起，不仅在美国硅谷引起了广泛关注，也让许多原本对AI不感兴趣的人开始关注中国的AI技术发展。尽管如此，国外知名硬件网站Tomshardware发表文章指出，DeepSeek的实际表现可能并没有宣传得那么具有颠覆性，AI领域不存在奇迹。 DeepSeek的资源投入与成本分析 DeepSeek最近因其先进的AI模型R1而成为科技界的焦点，该模型的计算资源使用量令人印象深刻。根据DeepSeek的官方声明，其训练成本仅为600万美元，并使用了2048个GPU。然而，行业分...

来源：

快科技【阅读原文】
Tags：AI模型 DeepSeek NVIDIA GPU 人工智能技术创新

1年前 (2025)

华为与DeepSeek强强联手，硅基流动携手推出全国产API，AI模型部署迎来白菜价零门槛新时代

华为与DeepSeek强强联手，硅基流动全国产API震撼发布近日，华为与DeepSeek携手推出了一款全新的国产大模型云服务平台——SiliconCloud（硅基流动）。该平台首发上线了基于华为云昇腾云服务的DeepSeek-V3和DeepSeek-R1两个版本，旨在为用户提供高性能、低成本的AI模型服务。此次合作不仅标志着国内AI技术的重大突破，也意味着用户可以享受到前所未有的零门槛部署体验。价格实惠，春节期间限时优惠为了让更多开发者和用户受益，SiliconCloud在春节期间推出了大幅度的价格优惠活动。具体收费标准如下： - DeepSeek-V3：输...

来源：

量子位【阅读原文】
Tags：AI模型 DeepSeek SiliconCloud 华为国产API

1年前 (2025)

首个OpenAI免费推理模型o3-mini震撼发布！DeepSeek引领AI模型开源新潮流，奥特曼也来反思：不开源我们错了

OpenAI发布首个免费推理模型o3-mini，DeepSeek引发行业反思近日，OpenAI深夜紧急发布了最新的推理模型系列——o3-mini，其中包括low、medium和high三个版本。这一举措不仅标志着OpenAI首次向用户免费推出推理模型，也引发了业内对开源AI模型的广泛讨论。一、o3-mini系列的亮点 o3-mini系列旨在推动低成本推理的边界，特别针对STEM（科学、技术、工程、数学）领域进行了优化。从正式版发布来看，它在多个方面表现出色： - 性能提升：相比前一代o1-mini，o3-mini在数学编码上的表现更为出色，响应速度更快，平均响应时间缩...

来源：

量子位【阅读原文】
Tags：AI模型 DeepSeek o3-mini OpenAI 开源

1年前 (2025)

DeepSeek利用AI模型R1独立发现成本控制核心思路，OpenAI首席研究官亲自证实，引发业内广泛关注，连奥特曼都不得不发声评论这一突破性进展！

DeeSeek掀起全球AI革命，改变科技格局短短几天内，DeeSeek凭借其R1模型在Hugging Face中的like数飙升，迅速登顶美国App Store榜首，引发了全球科技股的集体重挫。这股来自东方的力量展示了其强大的影响力。甚至连OpenAI首席研究官Mark Chen也不得不承认，DeepSeek确实独立发现了一些关键的AI核心理念，并且未来将发布更多模型。 OpenAI的回应与技术突破面对外界的各种分析，Mark Chen表示现代AI系统采用了「预训练」和「推理」两大范式，提供了更灵活的优化空间，在降低成本的同时提升模型性能。Noam Brown也强调，算...

来源：

新智元公众号【阅读原文】
Tags：AI模型 DeepSeek R1 强化学习成本控制

1年前 (2025)

阿里除夕新春发布Qwen2.5-Max，通义千问AI模型全面升级，轻松超越DeepSeek V3，助力开发者快速打造创意小游戏

阿里发布Qwen2.5-Max，性能超越DeepSeek V3及多个大模型农历除夕夜，阿里云旗下的通义千问（Qwen）团队发布了最新的Qwen2.5-Max模型，为新春佳节献上了一份特别的礼物。这款新模型在多个基准测试中表现优异，超越了当红炸子鸡DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o和Claude-3.5-Sonnet。多个基准测试中的卓越表现 Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等多个基准测试中均表现出色，尤其在MMLU-Pro等针对模型知识理解和推理能力的基准测试中，其表现尤为突出。该模型经过超过20万...

来源：

量子位【阅读原文】
Tags：AI模型 Deepseek-v3 Qwen2.5-Max 新春发布通义千问

1年前 (2025)

DeepSeek引发科技股震荡，砍掉英伟达台积电5万亿市值！Janus-Pro与AI模型助力多模态理解，登五大外媒头版，OpenAI紧急发布预告

智东西报道：国产AI新星DeepSeek掀起全球科技股震荡近日，一家来自中国的AI公司——DeepSeek，在硅谷和华尔街掀起了巨大波澜。1月28日，这家公司发布了全新的开源多模态AI模型Janus-Pro，进一步巩固了其在全球AI领域的地位。 DeepSeek的崛起引发美股科技股震荡自DeepSeek发布高性能、低成本的新模型R1以来，这家中国AI公司迅速成为全球关注的焦点。新模型不仅在性能上超越了OpenAI的DALL-E 3和Stable Diffusion，还在成本效益方面表现出色，被誉为“国产AI价格屠夫”。这一事件导致美股科技股大幅下跌，特别是英伟达、台积...

来源：

智东西【阅读原文】
Tags：AI模型 DeepSeek Janus-Pro 多模态理解科技股震荡

1年前 (2025)

1 234 5 6