GPT-4.5训练揭秘:OpenAI利用10万块GPU提升数据效率,探索Scaling Law与无监督学习解决灾难性问题

整理后的文章() 智东西(公众号:zhidxcom) 编译 | 陈骏达、陈家阳 编辑 | Panken 4月13日,智东西消息——近日,在OpenAI发布史上最昂贵的模型GPT-4.5一个多月后,OpenAI联合创始人兼CEO萨姆·阿尔特曼(Sam Altman)与三位核心开发人员展开了一场长达45分钟的技术对...

大模型参数效率提升秘籍:稀疏激活与Transformer架构助力超长文本推理,手机也能实现GPT级智能效果不减省内存比MoE更极致

在当今大模型竞争的时代,算力与效率的平衡成为关键。端侧部署一直是大模型落地的难点,主要受限于算力瓶颈。面壁智能和清华大学提出了一种不同于MoE的技术路径——神经元级稀疏激活,使得模型在保持性能的同时显著减少资源消耗。 这项技术背后融合了脑科学灵感与工程创新。《Co...

谷歌 Gemini AI 强势加持 Circle Screen,安卓旗舰实现圈选截屏特定区域精准搜索新体验

随着科技的不断发展,谷歌再次引发了全球用户的关注。根据IT之家4月12日的消息,知名科技媒体Android Authority于4月11日发布了一篇博文,报道了谷歌即将推出的一项新功能——Circle Screen。这项功能将支持用户通过圈选屏幕上的特定来实现更精准的搜索。 在近期的一次意外中,...

大模型发展与AI学习:探究推理模型的功能定位及提示词优化在思维链中的作用

随着人工智能技术的快速发展,许多朋友可能已经上过AI课程,甚至购买了网上提示词合集。然而,你是否还在用那些传统的提示词写作方式?比如在提示词中一步步拆解思维链,帮助模型学会分步思考;提供几个例题以加深模型对问题的理解;或者引导模型扮演特定角色,从而给出更专业...

昇腾AI云服务助力,华为云超节点结合GaussDB数据库、CodeArts、MetaStudio及云原生安全体系引领全栈AI产品智能升级

4月10日至11日,华为云生态大会2025在安徽芜湖圆满落幕。在第二天的华为云产品技术发布会上,华为云向合作伙伴及客户展示了全新升级的昇腾AI云服务、软件开发生产线CodeArts、数字生产线MetaStudio、云原生安全体系、数据治理生产线DataArts以及GaussDB数据库等多款产品和解决...

人工智能发展受阻:吴恩达批评美国关税政策影响开源软件与数据中心国际合作进展

随着全球化的深入发展,国际贸易政策对科技行业的影响愈发显著。近日,美国知名AI学者吴恩达在个人社交媒体上发表了一封公开信,批评了美国最新关税政策,并详细分析了其对人工智能(AI)行业的潜在影响。 关税政策对AI硬件的冲击 吴恩达指出,针对电力设备、服务器、冷却系...

字节跳动推出200B参数Seed-Thinking-v1.5推理模型,基于强化学习与MoE技术超越满血DeepSeek-R1

字节跳动旗下的豆包团队最近发布了一篇关于其新型推理模型 Seed-Thinking-v1.5 的技术报告。根据报告,这款模型采用 MoE 架构设计,总参数量高达 200B,但在运行时仅激活其中的 20B 参数。尽管规模相对紧凑,但其性能表现却极为出色,在多个领域基准测试中超越了拥有 671B 参数...

ChatGPT引入长期记忆功能,OpenAI在AI技术上的新突破是否威胁用户隐私?探讨对话记录的利与弊

随着科技的飞速发展,AI技术不断取得突破。近日,知名科技媒体站长之家(ChinaZ.com)在4月11日发布了一则重要消息:OpenAI公司正式宣布将在其明星产品ChatGPT中引入一项全新的“长期记忆”功能。这项功能旨在让人工智能系统能够更好地记住与用户的对话历史,从而提供更加自然和个...

亚马逊CEO Andy Jassy透露自研芯片助力AI技术与生成式AI成本优化,计划今年投入千亿美元推动发展

(由多段落组成): 亚马逊在AI领域的布局持续加码,据快科技4月11日消息报道,亚马逊首席执行官Andy Jassy在年度致股东信中强调,公司正大力投资人工智能技术。他指出,尽管当前AI研发和部署成本较高,但随着技术的逐步成熟,未来AI的单位使用成本将显著下降。 根据Jassy的...

医疗大模型助力数智化医院建设,智能体推动影像诊断与临床治疗革新进展

医疗领域迎来重磅大模型革新,覆盖多场景智能体助力未来医疗发展 近年来,随着人工智能技术的迅猛发展,全球各行业正经历前所未有的变革。在医疗健康领域,这种变革尤为显著。2025年4月9日,在中国国际医疗器械展览会(CMEF)期间,联影举办了名为“uAInnovation2025”的创新大...
16061626364349