每日AI快讯

Cloudflare助力防范AI爬虫:通过robots.txt优化阻止数据抓取,保障网络安全与健康发展

随着科技的快速发展,AI爬虫技术也逐渐成为全球关注的焦点。近日,Cloudflare作为全球最大的网络基础设施公司之一,首次推出了基于AI对抗AI爬虫的新策略,这一举措可谓开创了AI领域全面战争的先河,并且具有深远的历史意义。 让我们从一个发生在年初的故事说起。一家位于乌克兰的小型公司Triplegangers,专注于销售高精度3D数字人体模型。这家公司虽然只有7名员工,但其庞大的数据库吸引了无数客户的目光。然而,在一个平凡的周六早晨,Triplegangers遭遇了一场突如其来的DDoS攻击。创始人Tomchuk很快发现,这次攻击并非来...

苹果AI发展滞后,iPhone与折叠屏创新不足,Vision Pro能否扭转局势?探索科技巨头的未来方向

(由多段落组成): 苹果公司,这家曾经以创新和领导力定义科技行业的巨头,近年来似乎正在逐渐失去昔日的辉煌。根据彭博社在2025年3月21日的报道,苹果CEO蒂姆·库克对当前AI团队的表现失去了信心,并对公司高层进行了调整。负责Siri和AI战略的约翰·詹德雷被从Siri的直接管理中移除,取而代之的是迈克·洛克威尔,他曾领导Apple Vision Pro的开发工作。这一调整发生在苹果高层管理团队年度峰会之后,会上AI战略成为了讨论的核心议题。 调整的背后,反映了Siri功能更新和Apple Intelligence推出进度的严重滞后。一些海外媒体...

奥特曼与AGI:人工智能引领工业革命,激发创造力,OpenAI或率先实现通用人工智能

在最新一期TED采访中,奥特曼再次重申了OpenAI将成为首个发布AGI(通用人工智能)的公司,并表示对此并不感到意外。他指出,当AI发展到能够自主完成以往需要整个团队才能完成的任务时,人类可能需要重新构建一个全新的模型来适应这一变化。 在这场长达45分钟的对话中,奥特曼与主持人Adam Grant深入探讨了AI在创造力和同理心方面的进步,同时也谈到了随之而来的伦理挑战以及人类监督的重要性。他认为,AI带来的变革更像是一场工业革命,而非简单的互联网革新。 奥特曼还提到,随着AI技术的发展,社会可能会逐渐淡化对具体...

震裕科技进军人形机器人领域,聚焦锂电池结构件、丝杠与无框力矩电机的创新应用

在中国,人形机器人市场逐渐崭露头角,主要围绕北京、上海、浙江、广东等发达省市展开。其中,小米、智元、宇树、华为成为国内产业链的领头企业,而海外市场则以特斯拉Optimus为代表。作为配套零部件供应商,谁能绑定更多下游核心企业,谁就将在行业中占据更大话语权。 震裕科技(SZ:300953),一家原本并不起眼的汽车配件制造商,却在资本市场多次传出已进入小米和特斯拉供应链的消息,并有望成为继拓普集团、三花智控之后的第三家总成供应商。那么,震裕科技究竟具备怎样的实力? 01 基本面:困境中的反转 震裕科技最...

谷歌Gemini实时人工智能视频功能结合Project Astra与多模态AI技术,提升智能手机摄像头的拍摄体验

随着科技的快速发展,人工智能技术正在不断革新我们的日常生活。近日,谷歌公司宣布了一项全新的功能升级,引发了广泛关注。根据IT之家3月24日的报道,谷歌发言人亚历克斯・约瑟夫在一封发给The Verge的邮件中确认,谷歌已经开始为Gemini Live引入新一代的人工智能技术。这项技术的核心亮点在于,它能够通过用户的智能手机摄像头实时捕捉屏幕,并提供与画面相关的即时解答。 这一新功能的推出距离谷歌首次展示“阿斯特拉项目”(Project Astra)已经接近一年。回顾去年5月举行的2024年I/O开发者大会,谷歌展示了基于Gemini模...

苹果AI视觉革新:Apple Watch搭载2nm芯片与卫星短信功能,引领未来科技潮流

(由多段落组成): 苹果再次成为科技圈的焦点!据智东西3月24日消息,继上周五苹果AI团队高层换岗后,彭博社再次爆料称,苹果正计划推出搭载摄像头和视觉智能功能的智能手表。这一消息引发了广泛关注。 根据爆料,苹果将在Apple Watch上引入摄像头技术,具体有两种方案:一种是将摄像头直接嵌入Ultra版手表侧面,位于表冠与按钮之间;另一种则是为标准版手表设计“打孔屏”,将摄像头置于屏幕中。虽然这些产品目前仍处于规划阶段,但彭博社预计,搭载摄像头的Apple Watch可能会在2027年前后面世。 苹果所提到的“视觉智能”...

Transformer注意力机制新发现:从work-depth模型角度看并行计算与深度复杂度优化

整理后文章: 重新审视注意力机制:对数级别的复杂度? 近年来,注意力机制在人工智能领域大放异彩,尤其是在 Transformer 模型中。然而,一篇最新的博客引发了 AI 社区的热烈讨论,提出了一个全新的视角:Transformers 中实现的注意力机制,在计算复杂度上应该被视为对数级别(logarithmic)。这篇博客不仅得到了 Karpathy 的高度评价,还为理解注意力机制提供了一个全新的框架。 Karpathy 曾经这样描述神经网络的计算图:“广度是免费的,深度是昂贵的”。这一观点正是 Transformer 的核心灵感来源。作者提到,早在 Neura...

多模态LLM对齐算法全面解析:幻觉减少、安全性提升与推理能力增强的院士领衔万字长文总结

随着多模态大语言模型(MLLMs)的迅速发展,对齐算法的研究变得尤为重要。本文通过万字长文系统性回顾了多模态LLM中的对齐算法,从应用场景、数据集构建、评估方法到未来发展方向进行了全面梳理。 应用场景与代表性方法 文章介绍了多模态大语言模型的应用场景,分为三大层次:通用图像理解、多图像、视频和音频处理以及扩展应用。在通用图像理解方面,主要集中在减少幻觉并提升对话和推理能力;多图像和视频任务则通过不同的架构和训练方法来处理复杂数据,减少幻觉并提高模型能力;扩展应用包括医学、数学推理和安全系统...

雅虎携手吉姆·兰佐内布局人工智能,Artifact与ChatGPT助力全新发展

整理后的 #(由多段落组成) 2021年9月,吉姆·兰佐内接手了一家曾经象征互联网进取精神的公司——雅虎。然而,多年来,这家公司逐渐沦为业界的笑柄。许多人认为兰佐内接任雅虎CEO一职的成功几率几乎为零。福布斯撰稿人乔治·布拉特甚至直言:“很难想象还有谁会愿意接手这个职位。”然而,兰佐内却看到了不同的前景。在他眼中,雅虎是一颗被低估的宝石。 兰佐内指出,如果忽略“雅虎”这个名字,仅看其2021年的业务状况,就会发现这是一家拥有数十亿美元收入的企业。他并没有沉溺于过去搜索领域的辉煌,而是专注于改进现有的业务...

强化学习与视觉语言模型结合:西北大学推出三维布局空间推理框架MetaSpatial,解锁50条数据驱动的空间智能新纪元

(由多段落组成) 在三维空间理解任务中,让视觉语言模型生成合理且符合物理规则的场景布局仍是一项挑战。例如,“请将这些家具合理摆放在房间中”,尽管现有模型可以识别图像中的物体并给出语义连贯的描述,但通常缺乏对三维空间结构的真实建模,难以满足基本的物理约束与功能合理性。 为解决这一问题,研究者尝试采用多智能体交互方法优化布局结果。然而,这类方法不仅计算成本高,而且容易陷入死锁。另一类方法通过构建大规模真实房间布局的描述语料,结合监督微调(Supervised Fine-Tuning, SFT)训练模型。虽然这种方式...