每日AI快讯

华为盘古Ultra大模型:基于昇腾NPU原生开发,135B参数引领大规模语言模型深度学习与自然语言处理新纪元

终于,华为盘古大模型系列推出了全新的昇腾原生通用千亿级语言大模型。当前,各大科技公司纷纷发布百亿、千亿级模型,但大部分模型的训练依赖于英伟达的 GPU。在这种情况下,国内研究团队难以获得足够的计算资源,这限制了国内大模型技术的快速发展。然而,华为盘古发布的这项新研究表明,基于全国产的昇腾平台,同样可以实现领先的大规模语言模型的研究与开发。 技术报告Pangu Ultra: 推动 Ascend NPUs 上密集大型语言模型的极限 技术报告地址:[https://github.com/pangu-tech/pangu-ultra/blob/main/pangu-ultra-rep...

米拉·穆拉蒂领衔,OpenAI与Thinking Machines Labs在AI协作领域迅速崛起,种子轮融资助力估值7个月突破100亿美元大关,奥特曼面临真正挑战

米拉·穆拉蒂(Mira Murati)自去年9月离开OpenAI后,一直备受关注。她的创业之路可谓一波三折,却又充满惊喜。从尚未成立公司就吸引投资者排队,到Thinking Machines Labs(TML)的组建,这家初创企业已经吸引了大量目光。值得注意的是,TML的团队中三分之二成员来自OpenAI,而其融资目标也从最初的10亿美元提升至20亿美元,估值接近100亿美元。这是一家没有任何产品的初创企业,如果成功融资,将刷新AI公司种子轮融资的纪录。 年仅37岁的穆拉蒂正在成为硅谷的一股新兴力量。她与OpenAI前首席科学家伊利亚·苏茨克维(Ilya S...

AI短剧引领潮流:科幻玄幻奇幻内容在抖音快手上的商业模式与技术创新

(由多段落组成): AI短剧在科幻、玄幻和奇幻题材以及动画领域带来了显著的变革,制作成本可大幅降低数百倍。然而,这一细分市场的商业模式仍处于探索阶段。近期,AI短剧逐渐成为热门话题,抖音和快手上的创作者们通过AI技术重新演绎经典故事,如《白蛇传》《鬼吹灯》,赋予这些作品全新的生命力。同时,一些猎奇也吸引了大量关注,例如“男鲛人被囚禁生子”的情节引发了网友热议。 抖音等平台积极推动AI短剧的发展,3月19日推出的“AIGC短剧联合招募计划”迅速吸引了大批创作者加入。评论区中,许多人表示愿意组队合作,共同...

AI教育下学生学习的新挑战:家长监督不可或缺,教育资源助力培养独立思考能力,避免过度依赖AI让孩子的脑子更灵活

随着人工智能技术的快速发展,AI在教育领域的应用越来越广泛。家长、老师和学生对AI的态度各不相同。邵女士因三年级的儿子照抄AI作文答案而生气,并意识到孩子使用AI的“度”和家长监督的重要性。她认为过度依赖AI会让孩子失去独立思考能力。 苏州一位小学二年级班主任石老师表示,她在备课时偶尔会用AI查找资料、制作趣味视频等,但觉得AI对教学效率的帮助有限。相比之下,浙江某大学的英语老师Michael和重庆某高中的物理老师夏老师对AI评价较高。他们鼓励学生利用AI学习,提高学习效率和深度。 家长对AI的态度也存在差异。...

人工智能初创公司Nate被曝欺诈指控,人工承包商冒充AI技术导致投资者损失5000万美元

感谢IT之家网友 往事2016 提供的线索! 4月13日消息,美国司法部宣布,人工智能购物应用Nate的创始人兼前CEO Albert Saniger因涉嫌欺诈投资者被起诉。这款号称提供“通用”结账体验的应用,在宣传中声称通过AI技术让用户能够一键完成任何电商网站的商品购买。然而,事实却与宣传大相径庭。 Nate成立于2018年,从Coatue、Forerunner Ventures等投资机构筹集了超过5000万美元(约合人民币3.65亿元)的资金。2021年,公司完成了由Renegade Partners领投的3800万美元A轮融资。尽管如此,美国司法部纽约南区检察院指出,Nate的实...

GPT-4.5训练揭秘:OpenAI利用10万块GPU提升数据效率,探索Scaling Law与无监督学习解决灾难性问题

整理后的文章() 智东西(公众号:zhidxcom) 编译 | 陈骏达、陈家阳 编辑 | Panken 4月13日,智东西消息——近日,在OpenAI发布史上最昂贵的模型GPT-4.5一个多月后,OpenAI联合创始人兼CEO萨姆·阿尔特曼(Sam Altman)与三位核心开发人员展开了一场长达45分钟的技术对谈。这场对话首次揭示了GPT-4.5研发过程中遇到的诸多挑战,包括项目周期严重超预期、计算集群频繁故障以及性能提升路径难以预测等细节。 GPT-4.5的研发始于两年前,是OpenAI有史以来最为周密的一项计划,涉及数百人的团队协作。据阿尔特曼透露,为...

大模型参数效率提升秘籍:稀疏激活与Transformer架构助力超长文本推理,手机也能实现GPT级智能效果不减省内存比MoE更极致

在当今大模型竞争的时代,算力与效率的平衡成为关键。端侧部署一直是大模型落地的难点,主要受限于算力瓶颈。面壁智能和清华大学提出了一种不同于MoE的技术路径——神经元级稀疏激活,使得模型在保持性能的同时显著减少资源消耗。 这项技术背后融合了脑科学灵感与工程创新。《Configurable Foundation Models: Building LLMs from a Modular Perspective》论文详细描述了这一探索。量子位邀请到面壁智能与清华CFM论文作者肖朝军,深入探讨了算力与效率之间的博弈以及大模型架构创新的未来。 探索原生稀疏 CFM(Configurabl...

谷歌 Gemini AI 强势加持 Circle Screen,安卓旗舰实现圈选截屏特定区域精准搜索新体验

随着科技的不断发展,谷歌再次引发了全球用户的关注。根据IT之家4月12日的消息,知名科技媒体Android Authority于4月11日发布了一篇博文,报道了谷歌即将推出的一项新功能——Circle Screen。这项功能将支持用户通过圈选屏幕上的特定来实现更精准的搜索。 在近期的一次意外中,谷歌在Instagram上发布了一段展示Gemini屏幕共享功能的视频,却无意间透露了一个尚未公开的选项——“Circle Screen (DF)”。据业内人士推测,“DF”可能代表“DogFood”,这是谷歌内部员工用来测试未发布功能的一种版本标识。 从目前的信息来看,“Circle S...

大模型发展与AI学习:探究推理模型的功能定位及提示词优化在思维链中的作用

随着人工智能技术的快速发展,许多朋友可能已经上过AI课程,甚至购买了网上提示词合集。然而,你是否还在用那些传统的提示词写作方式?比如在提示词中一步步拆解思维链,帮助模型学会分步思考;提供几个例题以加深模型对问题的理解;或者引导模型扮演特定角色,从而给出更专业的答案。这些技巧虽然在过去非常有效,但如今可能已经不再适用。 实际上,在不知不觉中,大模型已经逐渐分化为两大类:传统通用大模型和推理大模型。例如,GPT-o1并不是GPT-4o的直接升级版本。GPT-4o属于通用大模型,而GPT-o1则是一款推理模型。类...

昇腾AI云服务助力,华为云超节点结合GaussDB数据库、CodeArts、MetaStudio及云原生安全体系引领全栈AI产品智能升级

4月10日至11日,华为云生态大会2025在安徽芜湖圆满落幕。在第二天的华为云产品技术发布会上,华为云向合作伙伴及客户展示了全新升级的昇腾AI云服务、软件开发生产线CodeArts、数字生产线MetaStudio、云原生安全体系、数据治理生产线DataArts以及GaussDB数据库等多款产品和解决方案。 华为公司副总裁、中国云业务部部长张修征强调,华为云将聚焦四大方向持续加大投入:构建对等多元算力基础设施、优化昇腾AI云服务以支持百模千态、重塑核心软件与工具链的应用价值、做好智能世界的“黑土地”。通过这些努力,华为云致力于解决A...
19899100101102388