标签:大模型
字节跳动AI Lab全面整合入Seed团队,吴永辉领衔大模型研发新阶段
字节跳动整合AI研发团队,Seed内部组织架构再迎调整。作者梁丙鉴,编辑马晓宁。据AI科技评论独家消息,字节AI Lab即将全面纳入Seed团队管理。在此之前,字节AI Lab是Seed成立前字节的主要AI研发部门,目前由李航负责,并自2024年起向当时的Seed负责人朱文佳汇报工作。今年2月下旬,原Google DeepMind副总裁吴永辉加入字节,担任Seed基础研究负责人。自此,李航的汇报对象改为吴永辉。 字节AI Lab成立于2016年,最初由微软亚洲研究院前常务副院长马维英领导,直接向张一鸣汇报。AI Lab目前涵盖多个子团队,包括机器人、AI4S...
国产AI六小虎在To B市场中的挑战与机遇:大模型、医疗AI及DeepSeek的技术突破与发展前景分析
昨天,国产AI六小龙之一的百川智能迎来了两周年纪念日。CEO王小川在全员信中明确指出公司未来方向:“减少多余动作,专注于医学领域。” 回顾两年前,百川智能成立时的目标是“打造中国版OpenAI基础大模型及颠覆性上层应用”,目标宏伟。 与此同时,零一万物创始人李开复在今年1月接受媒体采访时也表示:“零一万物将全面转向‘小而美’的发展模式。” 这与当初提出“打造AI 2.0全新平台,加速AGI到来”的愿景形成了鲜明对比。 曾经的雄心壮志逐渐被战略收缩所取代,外界因此调侃这些“小虎”已经变成了“小猫”。那么,在AI大模型市场风...
美团AI招聘加码,大模型光年之外打造全能个人助手,不睡觉也要搞AI,未来可期!
(由多段落组成): 近年来,大厂在AI领域的动作愈发引人注目。最近,阿里巴巴国际站传出加码AI人才布局的消息,而在此之前,美团的AI招聘也在社交网络上引发了广泛讨论。尤其是对于美团而言,尽管创始人王兴早已看到了AI领域的潜力,但该公司此前在AI方面的动作并不明显。然而自今年3月以来,美团开始展现出“主动进攻”的AI战略,并计划在今年晚些时候推出一款全新的AI原生产品,这款产品将作为覆盖所有服务的“私人助手”亮相。 为了实现这一目标,美团首先需要解决的是人才问题。不同于以往低调的招聘方式,美团核心本地商...
Optimus Alpha与Quasar Alpha:探索大模型编程能力,揭秘GPT-4.1上线3天被玩疯的OpenAI神秘痕迹
整理后的 #(由多段落组成) 最近,一款神秘的大语言模型在上线仅三天的时间内就引发了广泛关注。这款名为Optimus Alpha的模型由大模型聚合平台OpenRouter推出,其强大的性能令人印象深刻。据数据显示,Optimus Alpha已经处理了772亿个Token,平均每天超过200亿。目前,它的日Token处理量已突破340亿,在所有模型中排名第二,并稳居Trending榜单首位。 网友们纷纷对Optimus Alpha进行了测试。有人用它挑战了MC-Bench生成《我的世界》风格场景的任务,结果发现其表现远超4o-mini。此外,还有人对其编程能力进行了系统评估...
大模型参数效率提升秘籍:稀疏激活与Transformer架构助力超长文本推理,手机也能实现GPT级智能效果不减省内存比MoE更极致
在当今大模型竞争的时代,算力与效率的平衡成为关键。端侧部署一直是大模型落地的难点,主要受限于算力瓶颈。面壁智能和清华大学提出了一种不同于MoE的技术路径——神经元级稀疏激活,使得模型在保持性能的同时显著减少资源消耗。 这项技术背后融合了脑科学灵感与工程创新。《Configurable Foundation Models: Building LLMs from a Modular Perspective》论文详细描述了这一探索。量子位邀请到面壁智能与清华CFM论文作者肖朝军,深入探讨了算力与效率之间的博弈以及大模型架构创新的未来。 探索原生稀疏 CFM(Configurabl...
快手AI:商业化引擎助力AIGC与大模型发展,打造高效数字员工解决方案
在过去三年中,中国科技公司如快手,通过持续的AI研发和应用创新,注入了新的增长动力,并逐步提升了行业的天花板。自2023年全面启动AI战略以来,AI技术已渗透到快手的各项业务环节,并开始显现实际成果。磁力引擎正朝着“下一代AI智能商业引擎”的方向发展,推出了包括磁力开创、女娲数字人、数字员工T、UAX全自动投放等在内的多种AI工具,助力商家提升运营效率。 随着大模型能力在具体场景中的不断融合,快手AI的能力提升已经开始影响业务数据的变化。最新的财报显示,可灵AI累计营收超过1亿元人民币;2024年第四季度,快手...
大模型游戏评测:17款大模型与八款棋牌游戏对决,o3-mini凭借出色推理能力胜出,DeepSeek R1因中间步骤失误落败,GameBoT见证谁是真正的棋艺王者?
第一段 在AI社区中,大模型玩棋牌游戏的风潮愈演愈烈。例如,国外知名博主让DeepSeek和ChatGPT下国际象棋的视频在YouTube上获得了百万播放量。此外,ARC Prize组织最近发布了一个贪吃蛇LLM评测基准SnakeBench。针对这一场景,来自香港大学、剑桥大学和北京大学的研究人员推出了一种更全面、客观可信的LLM评测基准:GameBoT。通过让大模型在8个游戏中相互竞争,GameBoT能够评估各主流大模型的推理能力。 第二段 传统的LLM基准测试面临两个主要挑战:性能饱和与数据污染。性能饱和指的是榜单分数已经被刷得很高,几乎没有进...
探索3D世界的革命性突破:Uni-3DAR自回归模型助力AI for Science,统一微观与宏观的3D结构,性能超越扩散模型256%,推理速度提升21.8倍,大模型时代的新里程碑
从微观分子与材料结构到宏观几何与空间智能,构建和解析 3D 结构是推动科学研究的重要基础。3D 结构不仅蕴含丰富的物理和化学信息,还为科学家提供了拆解复杂系统、进行模拟预测以及跨学科创新的关键工具。如何高效且精准地生成和理解 3D 模型正成为 AGI、AI for Science 和具身智能三大热门领域共同关注的焦点。随着 AI 技术的发展,大型语言模型(LLM)和多模态模型(LMM)的自回归 token 预测能力也开始被应用于创建和解析 3D 结构,这为 AI for Science 带来了新的可能性。 近日,一款开创性的大模型诞生了!它名为 Uni...
周鸿祎谈AI技术:用三个月时间深耕大模型,技术进步让快科技成为可能,值得深入研究学习
随着科技的快速发展,AI技术已经成为当今社会的重要趋势。近日,360创始人周鸿祎在快科技平台上发布了一段视频,分享了他对AI技术的独特见解。他表示,只要强迫自己连续使用AI技术三个月,就能迅速成为该领域的专家。 周鸿祎指出,尽管AI技术发展迅猛,但许多人由于时间有限、缺乏动力或对技术理解不足而选择观望。他鼓励大家克服这些心理障碍,积极接触和学习AI技术。通过不断的实践和应用,不仅可以积累丰富的经验和知识,还能有效推动个人技术水平的提升。 此外,周鸿祎还强调了时间投入和坚持的重要性。他认为,技术的...
零一万物携手DeepSeek推出万智企业大模型平台支持私有化部署
(由多段落组成) 智东西(公众号:zhidxcom) 作者 | 程茜 编辑 | 心缘 智东西3月17日报道,零一万物今日正式推出面向企业的“万智企业大模型一站式平台”。这一平台专为满足企业级需求而设计,提供DeepSeek模型的部署、应用实践及模型微调工具等全面解决方案。同时,该平台还兼容阿里巴巴通义千问(Qwen)、零一万物Yi等国产主流大模型。 零一万物创始人兼CEO李开复透露,公司2024年第一季度To B业务收入已接近去年全年水平。此前在接受《智能涌现》采访时,他提到2024年零一万物确认收入超亿元,其中七成来自B端客...