刚刚,Sora 2来了!OpenAI还发了“AI抖音”,阿尔特曼被“玩坏”

(由多段落组成):

2024年10月1日凌晨,OpenAI重磅发布新一代视频与音频生成模型——Sora 2,并同步推出名为“Sora”的社交应用程序,被外界戏称为“AI版抖音”。此次更新标志着AI在模拟真实世界方面迈出了关键一步。OpenAI官方称,Sora 2正朝着“视频领域的GPT-3.5时刻”快速迈进,不仅在物理模拟精度上大幅提升,还增强了对复杂指令的响应能力,支持音效、语音和环境声的同步生成。

从官方发布的Demo来看,Sora 2已能实现此前难以完成的高难度动作模拟,例如奥运会级别的体操动作、桨板上的后空翻,甚至花滑运动员头顶猫咪完成三周半跳等极具挑战性的场景。这些画面不仅细节逼真,连人物落地时的微小踉跄和表情变化都栩栩如生,展现出更强的物理逻辑理解力。相比早期版本中常见的“篮球自动进筐”这类违反现实规律的现象,Sora 2更注重真实反馈——投篮不中时,球会自然反弹,失败也被精准还原。

除了视觉表现力的飞跃,Sora 2在可控性方面也实现了质的提升。它能够处理跨镜头的复杂提示,保持场景状态的一致性,适用于写实、电影级乃至动漫风格的创作。更令人惊叹的是,用户可将现实中的音视频素材注入模型,让自己的形象或声音无缝融入AI生成的世界中。比如,只需录制一段简短视频,系统就能将其主人准确复刻到维京战场、雪山探险或未来都市等各种虚构场景中,保真度极高。

与此同时,OpenAI推出了全新的iOS社交应用Sora,旨在打造一个以AI创作为核心的互动社区。该平台允许用户上传由Sora 2生成的视频,并通过“客串(Cameos)”功能邀请好友“出镜”。这一设计打破了传统短视频平台的边界,让用户真正成为AI的一部分。据内部测试反馈,许多员工已通过此功能结识新同事,体验到了一种前所未有的社交连接方式。

目前,Sora App以邀请制形式率先在美国和加拿大上线,iOS用户可通过获取邀请码下载使用。普通用户可在sora.com免费体验Sora 2的基础功能,而ChatGPT Pro订阅者则可解锁更高画质的Sora 2 Pro模型。未来,OpenAI计划开放Sora 2的API接口,便于开发者集成应用。同时,Sora 1 Turbo将继续保留服务,所有用户创作也将长期保存于平台。

为应对潜在风险,OpenAI在隐私与安全层面做了多项创新设计。例如,“客串”功能采用端到端权限控制,用户可随时撤销他人对自己形象的使用权,查看并管理所有包含自己出镜的视频(包括未发布的草稿)。平台还引入基于大语言模型的推荐系统,支持用自然语言调节信息流,并内置心理健康提醒机制,避免沉迷。不同于主流社交平台追求停留时长,Sora明确以“激发创作”为核心目标,优先展示具有启发性的作品。

青少年保护方面,OpenAI将通过ChatGPT提供家长控制选项,允许监护人设置浏览限制、关闭个性化推荐及管理私信权限。此外,平台强调不会因商业利益牺牲用户体验,现阶段暂无广告计划,仅考虑在未来计算资源紧张时,开放付费生成通道以满足高需求用户。

总体来看,距离初代Sora发布已逾一年半,Sora 2的到来不仅是技术迭代,更是AI视频生成走向成熟的重要里程碑。其在真实性、交互性和社交化方面的突破,或将引发整个视频产业的格局重塑。随着通用世界模拟器逐步成型,我们或许正站在一个全新沟通时代的起点——从文字、图片、短视频,迈向由AI驱动的沉浸式共创时代。

Sora 2, AI视频生成, OpenAI, AI社交应用, 视频大模型

本文来源: 智东西【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...