标签:AI模型
AI模型公司Anthropic完成35亿美元E轮融资,估值飙升至615亿美元,加速下一代大模型编程与国际市场拓展
感谢IT之家网友华南吴彦祖和石原里美幸福提供的线索! 3月4日,据IT之家报道,被誉为OpenAI最强竞争对手之一的AI模型公司Anthropic宣布完成了一轮高达35亿美元(约合255.11亿元人民币)的E轮融资。此次融资使公司的估值升至615亿美元(约合4482.57亿元人民币)。本轮投资由Lightspeed Venture Partners领投,参与者包括思科和Salesforce的投资部门。 Anthropic表示,通过此轮融资,公司将加速推进下一代AI系统的开发,扩大计算能力,并深入研究机制可解释性和对齐问题。此外,公司还将加快国际业务扩张的步伐。未来几个月...
Anthropic 推出最智能AI模型——Claude 3.7 Sonnet
近日,人工智能公司Anthropic正式推出了其最新的“混合推理模型”——Claude 3.7 Sonnet。这款新模型不仅能够处理更复杂的问题,在数学和编程等领域的表现也超越了以往的版本。Anthropic表示,这是他们迄今为止最智能的AI模型,具备独特的“推理模式”与传统模式相结合的能力,使其成为市场上唯一的“混合型”AI模型。 自主性编程工具——Claude Code 除了推出Claude 3.7 Sonnet,Anthropic还发布了自主性编程工具Claude Code的“有限研究预览版”。这款工具可以作为开发者的“积极合作伙伴”,帮助搜索和阅读代码、编辑文件、编写和运行...
微软Muse AI模型助力视频游戏生成,开启游戏开发新篇章,可持续性创新引领未来
微软Muse模型登上Nature,开启游戏生成新时代 2月20日,微软的首个世界和人类行动模型(WHAM)Muse在国际顶级学术期刊《自然》上发表。Muse是一款基于视频游戏生成的AI模型,拥有高达16亿参数,经过接近7年的人类游戏数据训练。该模型能够理解游戏中的物理环境和3D场景,并生成玩家的动作及视觉效果。尽管目前仅能以300×180像素的分辨率生成游戏画面,但其生成的游戏视频效果已具备一致性、多样性和持久性。 Muse由微软研究员游戏智能团队、可教的AI体验(Teachable AI Experiences)团队与Xbox Games Studios旗下的Ninja ...
马斯克斥资20万块GPU打造Grok-3 AI模型,凭借强大推理能力在数学领域暴击DeepSeek R1,深度搜索性能远超OpenAI,彰显大规模GPU训练优势
马斯克口中最强AI模型Grok-3震撼登场 近日,马斯克带领xAI团队正式发布了全球最强大的大模型Grok-3。这款模型使用了20万块GPU进行训练,是人类历史上首次在如此大规模的硬件集群上完成的训练任务。Grok-3一经发布便迅速席卷多个排行榜,击败了o3-mini(high)和DeepSeek-R1等强劲对手。 Grok-3的技术亮点 Grok-3的训练计算量达到了惊人的10倍于Grok-2,其背后支撑的是世界最大的超算集群Colossus,该集群拥有20万块GPU。第一阶段用时122天搭建了10万块GPU,第二阶段再用92天完成了全部20万块GPU的配置。在多项基准测试中...
中外大模型加速开源,AI模型成本下降与多模态能力提升!文心一言和GPT-5在算力优化上紧追不舍,免费资源助力创新
国内外大模型厂商掀起开源和免费浪潮,AI技术平民化加速 近期,国内外主流大模型厂商如百度、DeepSeek、OpenAI、谷歌等纷纷宣布旗下高端AI模型将转向开源,并计划免费向用户开放。这一趋势不仅标志着大模型竞赛进入白热化阶段,也预示着AI技术正在逐步走进普通百姓的生活。 百度与OpenAI的激烈竞争 百度和OpenAI作为两大巨头,在短时间内相继发布了多项重要更新。百度宣布将在未来几个月内推出文心大模型4.5系列,并计划于6月30日开始开源。此外,百度还表示今年下半年将发布文心大模型5.0系列。与此同时,OpenAI CEO奥...
AI颠覆者:DeepSeek在中美科技竞争中的开源AI模型与技术创新之路
2025年AI行业迎来重大变革:DeepSeek震撼全球 2025年初,国内AI公司DeepSeek以颠覆性的姿态迅速崛起,登顶全球应用下载榜榜首,日活跃用户突破1500万。中美科技界对DeepSeek展开了激烈的讨论,观点交锋不断,有人高度认可,有人冷嘲热讽,甚至有人陷入恐慌。Anthropic CEO达里奥·阿莫迪发表长文呼吁加强对华芯片封锁;OpenAI CEO山姆·奥特曼罕见认错,承认OpenAI的领先性被削弱。美国总统特朗普也指出DeepSeek给美国敲响了警钟。 DeepSeek的成功秘诀 DeepSeek的成功基于三个关键因素: 1. 模型能力追平行业领先水平: ...
Tomshardware探讨:DeepSeek基于NVIDIA GPU的AI模型并未带来预期的人工智能奇迹,技术创新仍有待观察
中国AI初创公司DeepSeek引发全球关注 近日,快科技报道了中国AI初创公司DeepSeek的崛起,不仅在美国硅谷引起了广泛关注,也让许多原本对AI不感兴趣的人开始关注中国的AI技术发展。尽管如此,国外知名硬件网站Tomshardware发表文章指出,DeepSeek的实际表现可能并没有宣传得那么具有颠覆性,AI领域不存在奇迹。 DeepSeek的资源投入与成本分析 DeepSeek最近因其先进的AI模型R1而成为科技界的焦点,该模型的计算资源使用量令人印象深刻。根据DeepSeek的官方声明,其训练成本仅为600万美元,并使用了2048个GPU。然而,行业分...
华为与DeepSeek强强联手,硅基流动携手推出全国产API,AI模型部署迎来白菜价零门槛新时代
华为与DeepSeek强强联手,硅基流动全国产API震撼发布 近日,华为与DeepSeek携手推出了一款全新的国产大模型云服务平台——SiliconCloud(硅基流动)。该平台首发上线了基于华为云昇腾云服务的DeepSeek-V3和DeepSeek-R1两个版本,旨在为用户提供高性能、低成本的AI模型服务。此次合作不仅标志着国内AI技术的重大突破,也意味着用户可以享受到前所未有的零门槛部署体验。 价格实惠,春节期间限时优惠 为了让更多开发者和用户受益,SiliconCloud在春节期间推出了大幅度的价格优惠活动。具体收费标准如下: - DeepSeek-V3:输...
首个OpenAI免费推理模型o3-mini震撼发布!DeepSeek引领AI模型开源新潮流,奥特曼也来反思:不开源我们错了
OpenAI发布首个免费推理模型o3-mini,DeepSeek引发行业反思 近日,OpenAI深夜紧急发布了最新的推理模型系列——o3-mini,其中包括low、medium和high三个版本。这一举措不仅标志着OpenAI首次向用户免费推出推理模型,也引发了业内对开源AI模型的广泛讨论。 一、o3-mini系列的亮点 o3-mini系列旨在推动低成本推理的边界,特别针对STEM(科学、技术、工程、数学)领域进行了优化。从正式版发布来看,它在多个方面表现出色: - 性能提升:相比前一代o1-mini,o3-mini在数学编码上的表现更为出色,响应速度更快,平均响应时间缩...
DeepSeek利用AI模型R1独立发现成本控制核心思路,OpenAI首席研究官亲自证实,引发业内广泛关注,连奥特曼都不得不发声评论这一突破性进展!
DeeSeek掀起全球AI革命,改变科技格局 短短几天内,DeeSeek凭借其R1模型在Hugging Face中的like数飙升,迅速登顶美国App Store榜首,引发了全球科技股的集体重挫。这股来自东方的力量展示了其强大的影响力。甚至连OpenAI首席研究官Mark Chen也不得不承认,DeepSeek确实独立发现了一些关键的AI核心理念,并且未来将发布更多模型。 OpenAI的回应与技术突破 面对外界的各种分析,Mark Chen表示现代AI系统采用了「预训练」和「推理」两大范式,提供了更灵活的优化空间,在降低成本的同时提升模型性能。Noam Brown也强调,算...