每日AI快讯
Apple Intelligence 预览版逐次发布:Gurman 独家爆料,重大功能静待WWDC24与Siri的人工智能
在刚结束的苹果WWDC24开发者大会上,苹果推出了创新的人工智能服务——“Apple Intelligence”,作为对微软Copilot等竞争对手的回应。虽然在发布会上展示了令人惊叹的新功能,但据知名记者Mark Gurman透露,部分功能需等到2025年才能正式启用。Gurman以其可靠的爆料历史为背景,指出“Apple Intelligence”的发布可能会比预期晚,原因在于苹果希望有足够的时间来完善产品,特别是非英语语言的支持。 尽管如此,“Apple Intelligence”仍计划在2024年秋季推出,但会带有“预览版”标签,表明其仍在发展阶段。一些重要的功能,如Siri理...
杨笛一团队的DITTO:大语言模型高效对齐新突破,模仿学习与在线比较数据强化技术仅需少量示例
在培养大语言模型(LLM)的过程中,模仿学习的概念可以被巧妙地应用。斯坦福大学的研究团队提出了名为DITTO的新框架,它利用少量的用户示范来引导LLM与特定用户偏好对齐,从而减少了大量比较数据的需求。DITTO通过默认用户更偏爱示范而非原始模型的输出,构建增强数据集,并使用对齐算法如DPO来更新模型。此外,DITTO还可视为一种在线模仿学习算法,能够超越专家表现。实验表明,DITTO在与传统方法如SFT相比时,表现出更高的效率和性能。DITTO的关键在于利用模型自身的输出和专家示范生成比较数据,通过迭代和重放比较数据的...
电影行业穿越周期的秘密:AI应用驱动国际化,聚焦创意核心与观众需求的国际大循环探讨
中国电影行业在后疫情时代面临着观众需求快速变化的挑战,需要适应6至12个月的审美趋势周期。电影制作的长周期与观众需求的短周期不匹配,使得行业寻求有电影感、高品质、工业化大制作以及具有家国情怀的电影来吸引观众。AI在电影行业的应用逐渐降温,被视作工具而非替代创作者,其在提高效率和创新方面发挥作用。中国电影需要“走出去”,采用“中国主控+国际资源”的模式,提升国际影响力。电影公司正探索如何平衡商业价值与艺术价值,同时利用AI增强制作效率,但强调创意仍是核心。在国际化道路上,中国电影人积极参与全球电...
37项SOTA!全模态预训练范式MiCo:理解任何模态并学习通用表示
港中文和中科院的研究团队推出了全新的全模态预训练模型——MiCo,旨在理解和学习通用表示,支持10种模态及25种跨模态任务。MiCo克服了传统模型在多模态理解上的局限,如图文预训练导致的错位和偏见问题。研究者受到多媒体学习理论的启发,将模态分为“知识模态”和“接口模态”,设计了双分支架构,通过创新的生成推理方法对齐不同模态。 MiCo采用多模态上下文强化不同模态间的关联,构建跨越模态的上下文关系,实现更全面的理解。实验结果显示,MiCo在多个单模态感知、跨模态检索、问答和多模态大模型基准上取得37项SOTA性能。
马斯克的特斯拉领先发布:Optimus人形机器人租赁服务,预览明年销售热潮
特斯拉正在积极推进其人形机器人Optimus的研发,并计划不仅售卖,还将提供租赁服务。特斯拉CEO埃隆·马斯克宣布,公司将为客户提供Optimus的购买和租赁两种选择,租赁服务预计先于销售启动。虽然具体承租方信息尚未公布,马斯克透露,Optimus已开始在加州弗里蒙特工厂协助电池单元的处理和运输工作,未来一年内,工厂预计将部署超过1000台Optimus机器人。此外,Optimus的手部自由度将从11个增加到22个,增强其精细操作能力,接近人类水平。最新的视频显示,Optimus已能自主执行任务,行走速度也有显著提升。
科技巨头引领人工智能革命,全要素生产率提升背后的社会不平等隐忧:生成式AI与财富权力集中问题
人工智能:科技进步的双刃剑,社会不平等的潜在推手? 在人工智能(AI)领域,科技巨头间的竞争日益激烈。苹果凭借在年度全球开发者大会上的生成式AI功能,一度跃居美国市值最高公司,超越了微软。然而,AI的未来发展并非一片光明。根据美国国家经济研究局的论文,麻省理工学院的达龙·阿西莫格鲁教授表达了对AI技术可能加剧社会不平等的担忧。他指出,AI的进步可能成为财富和权力向少数科技巨头集中的催化剂。 阿西莫格鲁教授还批评了AI领域的某些追求,如通用人工智能的梦想,他认为这可能导致人类地位下降。他预计AI对...
深入解析iOS 18创新功能:Genmoji AI文本转换表情符号技术揭秘
在即将推出的iOS 18操作系统中,Apple引入了一项创新功能——Genmoji,这是一个利用AI技术根据用户输入的文字生成个性化表情符号的角色。在WWDC会议上展示的Genmoji,虽然外观类似传统表情符号,但每个都是依据用户的特定输入定制的。值得注意的是,表情符号本身是基于Unicode标准的象形文字,由不同平台进行渲染,而Unicode联盟负责其新增和管理。 为了实现Genmoji的功能,Apple开发了NSAdaptiveImageGlyph API,这个接口使得Genmoji和Memoji、贴纸等图像能够像标准表情符号一样工作。API支持方形图像格式和多种分辨率,并具...
Arm Cortex-X925: 探索14核CPU与GPU的革命,Kleidi驱动的AI游戏新体验
在深入解析了Arm新一代CPU和GPU架构后,我们了解到更多有关Arm消费级计算终端平台的细节。此次,Arm改变了其产品线的命名规则,从Cortex-X1至X4的传统,转为Cortex-X925,旨在强调与前代相比的巨大性能提升。尽管新命名可能削弱超大核的独特性,但Arm确认X925仍定位为旗舰级别,且不会应用于非旗舰平台。此外,Cortex-X925与Immortalis-G925 GPU的名称匹配,暗示着CPU和GPU的打包销售策略。 Arm挑战传统观念,指出智能手机不再局限于8核CPU设计,新一代产品组合提供更具创新性的核心配置,如14核CPU设计,鼓励SoC厂商增加大...
OpenAI强化AI安全:前陆军上将保罗·纳卡松加入董事会,打造专业安全团队
【新智元报道】OpenAI近期正积极招募高级管理层,以增强组织结构。继新CFO上任后,美国退役陆军上将Paul M. Nakasone成为OpenAI董事会的最新成员,尤其在安全和保障领域发挥作用。Nakasone将在安全和保障委员会任职,为OpenAI的关键安全决策提供咨询,助力公司履行对AI安全的承诺。 OpenAI的董事会阵容日益壮大,包括初始成员和新近加入的业界领袖,如前比尔和梅琳达·盖茨基金会CEO Dr. Sue Desmond-Hellmann、前索尼高管Nicole Seligman,以及Instacart的Fidji Simo等。微软的Dee Templeton则以无投票权观察员身份参与。尽...
AutoStudio与中山大学&联想联合研发:多智能体协同优化扩散模型,打造连环画角色一致性新高度!
中山大学与联想团队合作开发的AutoStudio是一个创新的多智能体协同框架,无需训练即可处理复杂的连环画角色一致性问题。AutoStudio利用三个基于大语言模型的智能体进行交互,并采用扩散模型的Drawer生成高质图像。这款工具在处理多轮交互式图像生成时,能有效地维持角色一致性,即使在频繁切换主体和复杂人物互动的场景下。 AutoStudio设计有四个定制智能体,包括主题管理器、布局生成器、监督员和绘制器。主题管理器识别和分配主题,布局生成器控制主题位置,监督员提供布局修正,而绘制器负责最终的图像生成。研究者引入...