Sora2来了

Sora 2 来了 - OpenAI

Sora 2 来了

2025 年 9 月 30 日 | 研究、发布、产品

我们最新的视频生成模型比以前的系统在物理上更准确、更逼真,也更具可控性。它还具有同步的对话和音效。在全新的 Sora 应用中进行创作。

今天我们发布了 Sora 2,这是我们旗舰级的视频和音频生成模型。

最初的 Sora 模型(2024年2月)在许多方面是视频领域的“GPT-1时刻”——视频生成第一次看起来像是在运作,简单的行为(如物体永存性)通过扩大预训练计算规模而出现。从那时起,Sora 团队一直专注于训练具有更高级世界模拟能力的模型。

迈向视频领域的“GPT-3.5时刻”

借助 Sora 2,我们正直接迈向视频领域的“GPT-3.5时刻”。Sora 2 可以做到以前的视频生成模型极难,甚至完全不可能完成的事情:奥林匹克体操动作、在桨板上准确模拟浮力和刚度动态的后空翻,以及猫咪紧抓不放的三周半跳。

提示:花样滑冰运动员头顶着一只猫表演三周半跳

物理准确性与可控性

以前的视频模型过于乐观——它们会变形物体或扭曲现实以成功执行文本提示。例如,如果篮球运动员投篮不中,篮球可能会凭空传送到篮筐。在 Sora 2 中,如果篮球运动员投篮不中,它会从篮板上反弹。尽管仍不完美,但它比以前的系统更遵守物理定律。

该模型在可控性方面也取得了巨大飞跃,能够遵循跨等多镜头的复杂指令,同时准确地保持世界状态。它擅长逼真、电影和动漫风格。

提示:维京人出征北海 — 北海发射(10.0秒,冬季寒冷的日光/中世纪早期)...

通用的视频-音频生成系统

作为通用的视频-音频生成系统,它能够高度逼真地创建复杂的背景音景、语音和音效。

提示:两名穿着鲜艳技术外壳、面部结冰、眼神紧迫的山地探险家在雪中轮流大喊。

“客串”(Cameos)功能:将自己带入 Sora 2

您还可以将真实世界的元素直接注入 Sora 2。例如,通过观察我们一位队友的视频,模型可以将其以准确的形象和声音插入任何 Sora 生成的环境中。这种能力非常通用,适用于任何人、动物或物体。

提示:大脚怪对他非常好,好得有点过头了,有点奇怪的好。大脚怪想和他一起玩,但他想玩得太多了。

该模型远非完美,但它证明了进一步扩大神经网络在视频数据上的规模,将使我们更接近模拟现实。

Sora 2 的部署

今天,我们正在推出一款名为“Sora”的全新社交 iOS 应用,它由 Sora 2 提供支持。在应用内,您可以创建、混音彼此的生成内容、在可定制的 Sora 动态中发现新视频,并通过“客串”(Cameos)功能将您自己或您的朋友带入其中。通过“客串”,您可以在应用中进行简短的一次性视频和音频录制来验证身份并捕捉形象,然后以惊人的逼真度将自己直接放入任何 Sora 场景中。

负责任的发布

我们非常关注对“沉迷刷屏”、“上瘾”、“孤立”和“优化推送”的担忧——以下是我们正在采取的措施:

  • 我们利用 OpenAI 现有的语言模型,开发了一类新的推荐算法,它们可以通过自然语言进行指令控制。
  • 我们没有针对用户在动态中花费的时间进行优化,而是明确设计该应用以最大化创作,而非消费
  • 我们正在推出基于邀请制的应用,确保您与您的朋友一起加入。在所有主流平台都正在远离社交图谱的时候,我们认为“客串”功能将增强社区。
  • 我们对青少年每天可以在动态中看到的生成内容数量设置了默认限制,并对该群体的“客串”权限设置了更严格的限制。
  • 通过“客串”功能,您可以对自己在 Sora 中的形象拥有端到端控制权。只有您自己决定谁可以使用您的“客串”形象。
  • 我们目前唯一的计划是:如果需求相对于可用计算资源而言过大,最终会给用户提供付费生成额外视频的选项。

Sora 2 的可用性与下一步计划

Sora iOS 应用现已可供下载。我们今天开始在美国和加拿大进行初始推广,并计划迅速扩展到更多国家/地区。收到邀请后,您也可以通过 sora.com 访问 Sora 2。

Sora 2 最初将免费提供,并有充足的初始限制。ChatGPT Pro 用户将能够在 sora.com 上(很快也会在 Sora 应用中)使用我们实验性的、更高质量的 Sora 2 Pro 模型

我们还计划在 API 中发布 Sora 2。Sora 1 Turbo 将保持可用。

视频模型正在非常迅速地变得越来越好。通用世界模拟器和机器人智能体将从根本上重塑社会,并加速人类进步的进程。Sora 2 代表着朝着这个目标迈出的重大进展。

— Sora 团队撰写

OpenAI © 2015–2025

OpenAI 推出ChatGPT Edu团购版价格更划算

X