每日AI快讯
OpenAI Sora 2重磅登场!首个APP上线,或将成为AI时代新TikTok
(由多段落组成): 在AI视频生成领域掀起新一轮风暴的,正是OpenAI于深夜突然发布的Sora 2。这款被业内称为“AI视频界的GPT-3.5时刻”的全新模型,不仅在技术上实现了质的飞跃,更通过同步音画、增强物理逻辑与角色一致性,将AI生成推向了前所未有的真实感与可用性高度。相比早期版本中常见的穿帮镜头——如人物瞬移、物体违反重力等现象,Sora 2展现出对现实世界运行规律的深刻理解,真正让AI开始“尊重常识”。 此次升级最引人注目的突破之一,是首次实现音画完全同步。无论是人物对话口型匹配,还是环境音效随动作自然变化,...
刚刚,Sora 2来了!OpenAI还发了“AI抖音”,阿尔特曼被“玩坏”
(由多段落组成): 2024年10月1日凌晨,OpenAI重磅发布新一代视频与音频生成模型——Sora 2,并同步推出名为“Sora”的社交应用程序,被外界戏称为“AI版抖音”。此次更新标志着AI在模拟真实世界方面迈出了关键一步。OpenAI官方称,Sora 2正朝着“视频领域的GPT-3.5时刻”快速迈进,不仅在物理模拟精度上大幅提升,还增强了对复杂指令的响应能力,支持音效、语音和环境声的同步生成。 从官方发布的Demo来看,Sora 2已能实现此前难以完成的高难度动作模拟,例如奥运会级别的体操动作、桨板上的后空翻,甚至花滑运动员头顶猫咪完成...
豆包大模型1.6-vision正式发布:首次具备工具调用能力
(由多段落组成): 近日,火山引擎官方通过其微信公众号宣布,豆包大模型家族迎来全新升级——豆包大模型1.6-vision正式上线。作为该系列首款具备工具调用能力的视觉深度思考模型,此次发布标志着豆包在多模态AI领域迈出了关键一步。新模型不仅强化了图像理解与逻辑推理的融合能力,还首次实现将视觉信息深度融入“思维链”中,使AI在处理复杂图像任务时更加智能、精准。 相较于以往版本,豆包大模型1.6-vision展现出更强的通用多模态理解能力。它能够像人类一样模拟“先整体观察、再局部聚焦”的视觉认知过程,在分析图像时具...
事关下一代大模型!斯坦福顶尖1%科学家许主洪加盟阿里通义
(由多段落组成): 近日,人工智能领域再迎重磅人事变动。据权威媒体报道,全球知名AI科学家、IEEE Fellow许主洪正式加入阿里巴巴通义实验室,将专注于多模态交互模型的前沿研发工作。此次调动虽为集团内部岗位调整,但其背后折射出阿里在大模型与多模态技术布局上的持续加码。 许主洪在人工智能领域深耕超过二十年,兼具深厚的学术背景与丰富的产业实践经验。他不仅是新加坡管理大学的终身教授,还曾担任南洋理工大学终身副教授,学术影响力广泛。截至目前,他已在国际顶级期刊和会议发表论文逾300篇,总引用量突破5万次...
GEO优化与AI搜索引擎时代:生成式引擎优化实战及内容创作者SEO策略全解析
(由多段落组成): 随着人工智能技术的迅猛发展,以ChatGPT、Claude、Perplexity和Google Gemini为代表的AI搜索引擎正逐步改变用户获取信息的方式。传统SEO依赖关键词排名和反向链接的逻辑正在被颠覆,一种全新的优化方式——GEO(Generative Engine Optimization,生成式引擎优化)应运而生。与传统搜索引擎仅展示网页链接不同,AI搜索会直接生成答案并引用来源,这意味着创作者必须重新思考如何让自己的文章被AI“看见”并采纳。 在AI驱动的搜索环境中,曝光机制发生了根本性变化:只有被AI模型引用的才能获得流量。这不仅...
AI赋能电商新生态:淘天助力商家降本增效实现经营升级
(由多段落组成): 随着2025年天猫双11大促将于10月15日正式拉开帷幕,广大电商从业者即将迎来一年一度的运营挑战。然而,在这场流量与转化的激烈角逐背后,商家们长期面临高人力成本、重复性工作繁重、营销流程复杂等痛点。据淘天集团年初的一项深度调研显示,商家平均每天需投入近5小时处理客服事务,2小时用于素材制作,而参与一次平台营销活动的报名流程耗时超过1小时。在双11这样的关键节点,运营压力更是成倍增长。 面对这一现状,淘天集团开始推动一场深层次的“效率革命”。商家工具与开放平台负责人晓穆指出:“当...
DeepSeek突然拥抱国产GPU语言!对标CUDA替代Triton,华为Day0适配
(由多段落组成): 2025年9月,人工智能领域迎来一项引人瞩目的技术动向:国产大模型厂商DeepSeek在发布其最新版本DeepSeek v3.2时,悄然引入了一项未在论文中详细披露的关键技术——全面采用国产GPU编程语言TileLang。这一举动虽仅在官方公告中轻描淡写地提及一次,却迅速在开发者社区掀起热议,转发与讨论热度甚至超过了其新推出的稀疏注意力机制DSA。 TileLang并非普通编程工具,而是一种专为高性能计算设计的领域专用语言(DSL),定位直指英伟达CUDA生态,目标是成为国产AI芯片底层开发的核心支撑。令人意外的是,Deep...
微软力推“氛围工作”:Office 将推智能体模式,几句话就能帮你制表、做 PPT
(由多段落组成): 9月30日,据科技媒体Engadget最新报道,微软正将“氛围编程”(vibe coding)的理念延伸至办公场景,推动“氛围工作”(vibe working)的落地实践。通过其Office套件中的智能助手功能,用户只需在Word、Excel或PowerPoint中输入简单提示,即可借助AI力量快速生成文档初稿,并与Copilot协同优化。这一创新模式标志着人机协作进入新阶段,被微软称为“人类与智能体共同工作的未来方式”。 目前,该功能主要依托两大技术模块:Agent Mode 和 Office Agent。其中,Agent Mode已率先在Excel和Word中上线,支持自动...
OpenAI密集落子算力帝国,千亿大单绑定英伟达甲骨文
(由多段落组成): 近期,全球人工智能领域的焦点再度聚焦于OpenAI。这家估值高达5000亿美元的AI独角兽正以前所未有的速度扩张其算力基础设施,接连与科技巨头签署巨额合作协议,掀起新一轮资本浪潮。仅在9月下旬,OpenAI的合作动态便密集爆发:9月25日,英伟达支持的云服务新锐CoreWeave宣布追加最高达224亿美元(约1593亿元人民币)的算力供应,较今年3月最初承诺的119亿美元实现翻倍增长,显示出对OpenAI长期需求的高度信心。 更引人注目的是,英伟达自身也深度绑定OpenAI生态。9月23日,这家GPU巨头宣布将向OpenAI提...
商汤Seko上线一个月,超10万创作者选择它
(由多段落组成): 自2025年8月上线以来,商汤科技推出的AI视频创作智能体Seko迅速走红,仅一个月时间便吸引了超过10万名创作者注册使用。这款被业内称为“AI短剧神器”的工具,正以革命性的方式重塑短视频与短剧的生产流程,让创意从构想到成片的转化变得前所未有的高效与流畅。 与传统AI视频生成工具不同,Seko并非单一功能的文生视频模型,而是国内首个实现“创编一体”的AI短片创作Agent。它深度融合了文本生成、图像生成、视频合成、语音合成及剪辑编排等多项能力,用户只需通过自然语言对话,就能完成从剧本构思到完整...