标签:AI模型
马斯克斥资20万块GPU打造Grok-3 AI模型,凭借强大推理能力在数学领域暴击DeepSeek R1,深度搜索性能远超OpenAI,彰显大规模GPU训练优势
马斯克口中最强AI模型Grok-3震撼登场 近日,马斯克带领xAI团队正式发布了全球最强大的大模型Grok-3。这款模型使用了20万块GPU进行训练,是人类历史上首次在如此大规模的硬件集群上完成的训练任务。Grok-3一经发布便迅速席卷多个排行榜,击败了o3-mini(high)和DeepSeek-R1等强劲对手。 Grok-3的技术亮点 Grok-3的训练计算量达到了惊人的10倍于Grok-2,其背后支撑的是世界最大的超算集群Colossus,该集群拥有20万块GPU。第一阶段用时122天搭建了10万块GPU,第二阶段再用92天完成了全部20万块GPU的配置。在多项基准测试中...
中外大模型加速开源,AI模型成本下降与多模态能力提升!文心一言和GPT-5在算力优化上紧追不舍,免费资源助力创新
国内外大模型厂商掀起开源和免费浪潮,AI技术平民化加速 近期,国内外主流大模型厂商如百度、DeepSeek、OpenAI、谷歌等纷纷宣布旗下高端AI模型将转向开源,并计划免费向用户开放。这一趋势不仅标志着大模型竞赛进入白热化阶段,也预示着AI技术正在逐步走进普通百姓的生活。 百度与OpenAI的激烈竞争 百度和OpenAI作为两大巨头,在短时间内相继发布了多项重要更新。百度宣布将在未来几个月内推出文心大模型4.5系列,并计划于6月30日开始开源。此外,百度还表示今年下半年将发布文心大模型5.0系列。与此同时,OpenAI CEO奥...
AI颠覆者:DeepSeek在中美科技竞争中的开源AI模型与技术创新之路
2025年AI行业迎来重大变革:DeepSeek震撼全球 2025年初,国内AI公司DeepSeek以颠覆性的姿态迅速崛起,登顶全球应用下载榜榜首,日活跃用户突破1500万。中美科技界对DeepSeek展开了激烈的讨论,观点交锋不断,有人高度认可,有人冷嘲热讽,甚至有人陷入恐慌。Anthropic CEO达里奥·阿莫迪发表长文呼吁加强对华芯片封锁;OpenAI CEO山姆·奥特曼罕见认错,承认OpenAI的领先性被削弱。美国总统特朗普也指出DeepSeek给美国敲响了警钟。 DeepSeek的成功秘诀 DeepSeek的成功基于三个关键因素: 1. 模型能力追平行业领先水平: ...
Tomshardware探讨:DeepSeek基于NVIDIA GPU的AI模型并未带来预期的人工智能奇迹,技术创新仍有待观察
中国AI初创公司DeepSeek引发全球关注 近日,快科技报道了中国AI初创公司DeepSeek的崛起,不仅在美国硅谷引起了广泛关注,也让许多原本对AI不感兴趣的人开始关注中国的AI技术发展。尽管如此,国外知名硬件网站Tomshardware发表文章指出,DeepSeek的实际表现可能并没有宣传得那么具有颠覆性,AI领域不存在奇迹。 DeepSeek的资源投入与成本分析 DeepSeek最近因其先进的AI模型R1而成为科技界的焦点,该模型的计算资源使用量令人印象深刻。根据DeepSeek的官方声明,其训练成本仅为600万美元,并使用了2048个GPU。然而,行业分...
华为与DeepSeek强强联手,硅基流动携手推出全国产API,AI模型部署迎来白菜价零门槛新时代
华为与DeepSeek强强联手,硅基流动全国产API震撼发布 近日,华为与DeepSeek携手推出了一款全新的国产大模型云服务平台——SiliconCloud(硅基流动)。该平台首发上线了基于华为云昇腾云服务的DeepSeek-V3和DeepSeek-R1两个版本,旨在为用户提供高性能、低成本的AI模型服务。此次合作不仅标志着国内AI技术的重大突破,也意味着用户可以享受到前所未有的零门槛部署体验。 价格实惠,春节期间限时优惠 为了让更多开发者和用户受益,SiliconCloud在春节期间推出了大幅度的价格优惠活动。具体收费标准如下: - DeepSeek-V3:输...
首个OpenAI免费推理模型o3-mini震撼发布!DeepSeek引领AI模型开源新潮流,奥特曼也来反思:不开源我们错了
OpenAI发布首个免费推理模型o3-mini,DeepSeek引发行业反思 近日,OpenAI深夜紧急发布了最新的推理模型系列——o3-mini,其中包括low、medium和high三个版本。这一举措不仅标志着OpenAI首次向用户免费推出推理模型,也引发了业内对开源AI模型的广泛讨论。 一、o3-mini系列的亮点 o3-mini系列旨在推动低成本推理的边界,特别针对STEM(科学、技术、工程、数学)领域进行了优化。从正式版发布来看,它在多个方面表现出色: - 性能提升:相比前一代o1-mini,o3-mini在数学编码上的表现更为出色,响应速度更快,平均响应时间缩...
DeepSeek利用AI模型R1独立发现成本控制核心思路,OpenAI首席研究官亲自证实,引发业内广泛关注,连奥特曼都不得不发声评论这一突破性进展!
DeeSeek掀起全球AI革命,改变科技格局 短短几天内,DeeSeek凭借其R1模型在Hugging Face中的like数飙升,迅速登顶美国App Store榜首,引发了全球科技股的集体重挫。这股来自东方的力量展示了其强大的影响力。甚至连OpenAI首席研究官Mark Chen也不得不承认,DeepSeek确实独立发现了一些关键的AI核心理念,并且未来将发布更多模型。 OpenAI的回应与技术突破 面对外界的各种分析,Mark Chen表示现代AI系统采用了「预训练」和「推理」两大范式,提供了更灵活的优化空间,在降低成本的同时提升模型性能。Noam Brown也强调,算...
阿里除夕新春发布Qwen2.5-Max,通义千问AI模型全面升级,轻松超越DeepSeek V3,助力开发者快速打造创意小游戏
阿里发布Qwen2.5-Max,性能超越DeepSeek V3及多个大模型 农历除夕夜,阿里云旗下的通义千问(Qwen)团队发布了最新的Qwen2.5-Max模型,为新春佳节献上了一份特别的礼物。这款新模型在多个基准测试中表现优异,超越了当红炸子鸡DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o和Claude-3.5-Sonnet。 多个基准测试中的卓越表现 Qwen2.5-Max在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等多个基准测试中均表现出色,尤其在MMLU-Pro等针对模型知识理解和推理能力的基准测试中,其表现尤为突出。该模型经过超过20万...
DeepSeek引发科技股震荡,砍掉英伟达台积电5万亿市值!Janus-Pro与AI模型助力多模态理解,登五大外媒头版,OpenAI紧急发布预告
智东西报道:国产AI新星DeepSeek掀起全球科技股震荡 近日,一家来自中国的AI公司——DeepSeek,在硅谷和华尔街掀起了巨大波澜。1月28日,这家公司发布了全新的开源多模态AI模型Janus-Pro,进一步巩固了其在全球AI领域的地位。 DeepSeek的崛起引发美股科技股震荡 自DeepSeek发布高性能、低成本的新模型R1以来,这家中国AI公司迅速成为全球关注的焦点。新模型不仅在性能上超越了OpenAI的DALL-E 3和Stable Diffusion,还在成本效益方面表现出色,被誉为“国产AI价格屠夫”。这一事件导致美股科技股大幅下跌,特别是英伟达、台积...
苹果AI团队2025年重点:重建Siri底层技术,提升用户体验
根据彭博社记者马克·古尔曼的报道,苹果公司的一份内部备忘录泄露,揭示了这家科技巨头在人工智能领域的未来规划。据备忘录显示,苹果AI负责人John Giannandrea强调,2025年AI团队的工作重点将放在改进Siri的底层基础设施上。这意味着苹果正在着手重建其语音助手Siri的核心技术,为未来的更强大功能和更流畅的用户体验打下坚实基础。 改进现有AI模型,确保稳定性和准确性 备忘录中还提到,另一个工作重点是改进现有的AI模型。这一举措与苹果一贯坚持的渐进式迭代和改进风格相吻合。例如,最近通知摘要功能出现的问题,凸显...