每日AI快讯

OpenAI Sora 2重磅登场！首个APP上线，或将成为AI时代新TikTok

（由多段落组成）：在AI视频生成领域掀起新一轮风暴的，正是OpenAI于深夜突然发布的Sora 2。这款被业内称为“AI视频界的GPT-3.5时刻”的全新模型，不仅在技术上实现了质的飞跃，更通过同步音画、增强物理逻辑与角色一致性，将AI生成推向了前所未有的真实感与可用性高度。相比早期版本中常见的穿帮镜头——如人物瞬移、物体违反重力等现象，Sora 2展现出对现实世界运行规律的深刻理解，真正让AI开始“尊重常识”。此次升级最引人注目的突破之一，是首次实现音画完全同步。无论是人物对话口型匹配，还是环境音效随动作自然变化，...

来源：

iFeng科技【阅读原文】 Tags：sora2 ai sora 视频 prompt 模型 openai 镜头音频官宣

9个月前

刚刚，Sora 2来了！OpenAI还发了“AI抖音”，阿尔特曼被“玩坏”

（由多段落组成）： 2024年10月1日凌晨，OpenAI重磅发布新一代视频与音频生成模型——Sora 2，并同步推出名为“Sora”的社交应用程序，被外界戏称为“AI版抖音”。此次更新标志着AI在模拟真实世界方面迈出了关键一步。OpenAI官方称，Sora 2正朝着“视频领域的GPT-3.5时刻”快速迈进，不仅在物理模拟精度上大幅提升，还增强了对复杂指令的响应能力，支持音效、语音和环境声的同步生成。从官方发布的Demo来看，Sora 2已能实现此前难以完成的高难度动作模拟，例如奥运会级别的体操动作、桨板上的后空翻，甚至花滑运动员头顶猫咪完成...

来源：

智东西【阅读原文】
Tags：OpenAI Sora 抖音阿尔特曼

9个月前

豆包大模型1.6-vision正式发布：首次具备工具调用能力

（由多段落组成）：近日，火山引擎官方通过其微信公众号宣布，豆包大模型家族迎来全新升级——豆包大模型1.6-vision正式上线。作为该系列首款具备工具调用能力的视觉深度思考模型，此次发布标志着豆包在多模态AI领域迈出了关键一步。新模型不仅强化了图像理解与逻辑推理的融合能力，还首次实现将视觉信息深度融入“思维链”中，使AI在处理复杂图像任务时更加智能、精准。相较于以往版本，豆包大模型1.6-vision展现出更强的通用多模态理解能力。它能够像人类一样模拟“先整体观察、再局部聚焦”的视觉认知过程，在分析图像时具...

来源：

iFeng科技【阅读原文】 Tags：模型豆包 vision 图像视觉代码量

9个月前

事关下一代大模型！斯坦福顶尖1%科学家许主洪加盟阿里通义

（由多段落组成）：近日，人工智能领域再迎重磅人事变动。据权威媒体报道，全球知名AI科学家、IEEE Fellow许主洪正式加入阿里巴巴通义实验室，将专注于多模态交互模型的前沿研发工作。此次调动虽为集团内部岗位调整，但其背后折射出阿里在大模型与多模态技术布局上的持续加码。许主洪在人工智能领域深耕超过二十年，兼具深厚的学术背景与丰富的产业实践经验。他不仅是新加坡管理大学的终身教授，还曾担任南洋理工大学终身副教授，学术影响力广泛。截至目前，他已在国际顶级期刊和会议发表论文逾300篇，总引用量突破5万次...

来源：

快科技【阅读原文】 Tags：事关下一代大模型！斯坦福顶尖1%科学家许主洪加盟阿里通义快科技

9个月前

GEO优化与AI搜索引擎时代：生成式引擎优化实战及内容创作者SEO策略全解析

（由多段落组成）：随着人工智能技术的迅猛发展，以ChatGPT、Claude、Perplexity和Google Gemini为代表的AI搜索引擎正逐步改变用户获取信息的方式。传统SEO依赖关键词排名和反向链接的逻辑正在被颠覆，一种全新的优化方式——GEO（Generative Engine Optimization，生成式引擎优化）应运而生。与传统搜索引擎仅展示网页链接不同，AI搜索会直接生成答案并引用来源，这意味着创作者必须重新思考如何让自己的文章被AI“看见”并采纳。在AI驱动的搜索环境中，曝光机制发生了根本性变化：只有被AI模型引用的才能获得流量。这不仅...

来源：

站长之家【阅读原文】
Tags：AI搜索引擎 GEO优化 GEO排名查询工具内容创作者SEO 生成式引擎优化

9个月前

AI赋能电商新生态：淘天助力商家降本增效实现经营升级

（由多段落组成）：随着2025年天猫双11大促将于10月15日正式拉开帷幕，广大电商从业者即将迎来一年一度的运营挑战。然而，在这场流量与转化的激烈角逐背后，商家们长期面临高人力成本、重复性工作繁重、营销流程复杂等痛点。据淘天集团年初的一项深度调研显示，商家平均每天需投入近5小时处理客服事务，2小时用于素材制作，而参与一次平台营销活动的报名流程耗时超过1小时。在双11这样的关键节点，运营压力更是成倍增长。面对这一现状，淘天集团开始推动一场深层次的“效率革命”。商家工具与开放平台负责人晓穆指出：“当...

9个月前

DeepSeek突然拥抱国产GPU语言!对标CUDA替代Triton,华为Day0适配

（由多段落组成）： 2025年9月，人工智能领域迎来一项引人瞩目的技术动向：国产大模型厂商DeepSeek在发布其最新版本DeepSeek v3.2时，悄然引入了一项未在论文中详细披露的关键技术——全面采用国产GPU编程语言TileLang。这一举动虽仅在官方公告中轻描淡写地提及一次，却迅速在开发者社区掀起热议，转发与讨论热度甚至超过了其新推出的稀疏注意力机制DSA。 TileLang并非普通编程工具，而是一种专为高性能计算设计的领域专用语言（DSL），定位直指英伟达CUDA生态，目标是成为国产AI芯片底层开发的核心支撑。令人意外的是，Deep...

来源：

量子位【阅读原文】 Tags：DeepSeek

9个月前

微软力推“氛围工作”：Office 将推智能体模式，几句话就能帮你制表、做 PPT

（由多段落组成）： 9月30日，据科技媒体Engadget最新报道，微软正将“氛围编程”（vibe coding）的理念延伸至办公场景，推动“氛围工作”（vibe working）的落地实践。通过其Office套件中的智能助手功能，用户只需在Word、Excel或PowerPoint中输入简单提示，即可借助AI力量快速生成文档初稿，并与Copilot协同优化。这一创新模式标志着人机协作进入新阶段，被微软称为“人类与智能体共同工作的未来方式”。目前，该功能主要依托两大技术模块：Agent Mode 和 Office Agent。其中，Agent Mode已率先在Excel和Word中上线，支持自动...

来源：

IT之家【阅读原文】 Tags：Office 微软智能体

9个月前

OpenAI密集落子算力帝国，千亿大单绑定英伟达甲骨文

（由多段落组成）：近期，全球人工智能领域的焦点再度聚焦于OpenAI。这家估值高达5000亿美元的AI独角兽正以前所未有的速度扩张其算力基础设施，接连与科技巨头签署巨额合作协议，掀起新一轮资本浪潮。仅在9月下旬，OpenAI的合作动态便密集爆发：9月25日，英伟达支持的云服务新锐CoreWeave宣布追加最高达224亿美元（约1593亿元人民币）的算力供应，较今年3月最初承诺的119亿美元实现翻倍增长，显示出对OpenAI长期需求的高度信心。更引人注目的是，英伟达自身也深度绑定OpenAI生态。9月23日，这家GPU巨头宣布将向OpenAI提...

来源：

智东西【阅读原文】 Tags：OpenAI 甲骨文英伟达

9个月前

商汤Seko上线一个月，超10万创作者选择它

（由多段落组成）：自2025年8月上线以来，商汤科技推出的AI视频创作智能体Seko迅速走红，仅一个月时间便吸引了超过10万名创作者注册使用。这款被业内称为“AI短剧神器”的工具，正以革命性的方式重塑短视频与短剧的生产流程，让创意从构想到成片的转化变得前所未有的高效与流畅。与传统AI视频生成工具不同，Seko并非单一功能的文生视频模型，而是国内首个实现“创编一体”的AI短片创作Agent。它深度融合了文本生成、图像生成、视频合成、语音合成及剪辑编排等多项能力，用户只需通过自然语言对话，就能完成从剧本构思到完整...

来源：

量子位【阅读原文】
Tags：AI视频 seko 商汤科技智能体

9个月前

1…77 787980 81…443