关闭广告

Sora 2深夜来袭,OpenAI直接推出App,视频ChatGPT时刻到了

机器之心Pro2025-10-02 00:00:0214人阅读


机器之心报道

机器之心编辑部

没想到吧,在别家节前卷大模型时,OpenAI 悄悄发布了 Sora2。



而且,这次是直接产品化,推出了 App,甚至还有配套的视频推送算法,声称可以防成瘾。这是要做自己的 TikTok?



据介绍,Sora 在物理准确性、真实感和可控性方面都优于以往的系统。

另外,就是它还具备同步的对话和音效能力。

Altman 称之为 ChatGPT for creativity 时刻。



在介绍文章中,OpenAI 更是直言 Sora2 直接进入了视频领域的 GPT 3.5 时刻,也就是当时的 ChatGPT 时刻。



如此看来,OpenAI对Sora2的技术能力与产品体验都极为满意。

我们也搞到了邀请码,在后续文章中将体验一波。海外已经体验上的网友称,这就是媒体、电影和娱乐的新时代。



接下来就让我们先看下Sora2的官方效果吧。



Sora来了

2024 年 2 月发布的初代 Sora 模型,在很多方面都堪称视频领域的 GPT-1 时刻 —— 这是视频生成首次让人觉得开始行得通,像物体恒存性这样的简单行为,也随着预训练计算量的提升而出现。从那以后,Sora 团队一直专注于训练具备更先进世界模拟能力的模型。OpenAI 认为,此类系统对于训练能深度理解物理世界的 AI 模型至关重要。实现这一目标的一个重要里程碑,是掌握大规模视频数据的预训练和后训练技术,与语言领域相比,这些技术在视频领域尚处于起步阶段。



OpenAI 表示,有了 Sora 2,他们直接进入可能是视频领域的 GPT-3.5 时刻。Sora 2 能做到一些对于之前的视频生成模型来说极其困难,甚至在某些情况下完全不可能做到的事情:比如呈现奥运体操动作、在桨板上完成后空翻,精确模拟浮力和刚性的动态变化,以及在小猫紧紧抓着的情况下完成三周半跳。



此前的视频模型过于乐观 —— 它们会扭曲物体并改变现实,以成功满足文本提示。例如,如果一名篮球运动员投篮未中,球可能会自发地瞬移到篮筐处。在 Sora 2 中,如果一名篮球运动员投篮未中,球会从篮板上反弹回来。有趣的是,该模型所犯的「错误」往往似乎是 Sora 2 隐含模拟的内部主体所犯的错误;尽管仍不完美,但与之前的系统相比,它在遵守物理定律方面表现得更好。对于任何有用的世界模拟器来说,这都是一项极其重要的能力 —— 你必须能够模拟失败,而不仅仅是成功。

该模型在可控性方面也取得了重大飞跃,能够遵循复杂的多镜头指令,同时准确保持世界状态。它擅长写实、电影和动漫风格。



作为一个通用的视频音频生成系统,它能够以高度的真实感创建复杂的背景音、语音和音效。



你也可以直接将现实世界的元素注入到 Sora 2 中。例如,通过观看 OpenAI 一些员工的视频,该模型可以将他们插入到 Sora 生成的任何环境中,并准确呈现其外貌和声音。这种能力非常通用,适用于任何人、动物或物体。



该模型远非完美,会犯很多错误,但它证明了在视频数据上进一步 scale 神经网络规模将使我们更接近模拟现实。

Sora APP已上线

OpenAI 表示,几个月前,Sora 团队首次尝试了「上传你自己」的功能,大家都玩得很开心。这感觉就像是一种自然而然的交流演变 —— 从短信到表情符号,再到语音消息,直至发展到如今这个样子。

所以今天,他们推出了一款全新的 iOS 社交应用,名为「Sora」,由 Sora 2 提供支持。在这款应用中,你可以创作作品、基于他人作品进行二创,在可定制的 Sora 信息流中发现新视频,还可以通过「客串(cameos)」功能让自己或朋友出镜。通过「客串」功能,在应用中进行一次简短的视频和音频录制以验证身份并捕捉外貌后,你就能以极高的逼真度直接融入任何 Sora 场景。

在「客串」功能中,你可以完全掌控自己的形象使用权:只有你能决定谁可使用你的 cameo,你可随时撤销权限或删除含有你 cameo 的视频,且无论视频是否被他人保存为草稿,你都能随时查看。

上周,OpenAI 在内部向全体员工推出了这款应用程序。有些人表示,因为这个功能,他们在公司结识了新朋友。OpenAI 认为,围绕这个「客串」功能打造的社交应用程序,是体验 Sora 2 魅力的最佳方式。

除了视频生成,OpenAI 还做了推荐算法

对刷视频停不下来、成瘾、孤立以及强化学习优化的推送内容的担忧是 OpenAI 首要关注点。以下是他们针对这些问题正在采取的措施。

他们为用户提供工具和选择,让他们能够掌控在动态消息中看到的内容。利用 OpenAI 现有的大语言模型,他们开发了一类新的推荐算法,这些算法可以通过自然语言进行指令设定。他们还内置了相关机制,定期向用户询问他们的身心健康状况,并主动为他们提供调整动态消息的选项。

默认情况下,OpenAI 向你展示的内容会严重偏向于你关注或互动的人,并优先展示模型认为你最有可能用作自己创作灵感的视频。OpenAI 表示,他们并非针对用户在视频中花费的时间进行优化,而且他们明确将应用程序设计为最大限度地促进创作,而非消费。详情参见:https://openai.com/index/sora-feed-philosophy/

OpenAI 表示,他们通过这款应用解决了许多安全问题,包括使用肖像的许可、来源出处、防止生成有害内容等等。更多详情,可以参见《Sora 2 安全文档》:https://openai.com/index/launching-sora-responsibly/。

OpenAI 认为,与现有的平台相比,Sora 将是一个更有利于娱乐与创意发展的平台,是更有利于娱乐与创意发展的平台。

可用性以及接下来的安排

Sora iOS APP 现已可供下载(美国和加拿大用户),最初免费,初始算力限制较为宽松。ChatGPT Pro 用户还可以在 sora.com 中使用实验性的、更高质量的 Sora 2 Pro 模型。OpenAI 还计划在 API 中发布 Sora 2。



参考链接:https://openai.com/index/sora-2/

文中视频链接:https://mp.weixin.qq.com/s/G0lWqH0PC_CRyc5Dn91MQg

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女子乘春秋航空托运行李后1.2万金手链被盗 箱子却完好

极目新闻 浏览 6718 07-30

凌晨家长不在家孩子被抽血 家长:几日后孩子仍头晕

极目新闻 浏览 5906 08-08

现在又流行穿黑丝了?纯欲又撩人,绝美!

Yuki女人故事 浏览 8302 07-21

龙鑫智能一家三口持股六成,高管学历偏低, 2024年增收反降利

权衡财经 浏览 4635 08-18

"吉林一号"拍台湾影像 岛内:影像越清晰"斩首"越精准

澎湃新闻 浏览 100 11-09

女子孕检低风险却生下唐氏儿 险企拒赔:只赔"标准型"

鲁中晨报 浏览 12 10-28

博卡青年69岁老帅鲁索病逝

体坛周报 浏览 11 10-09

赵薇传来1个好消息1个坏消息

喜欢历史的阿繁 浏览 1009 07-27

增程动力有智驾 别克5米长大轿车命名"至境L7"

网易汽车 浏览 6976 07-18

全球最大、国内首制万吨级纯电动智能海船“宁远电鲲”号开启海试

IT之家 浏览 8 02-04

这些才是夏天最流行的打扮!适当露肤,多穿印花裙,大方优雅

静儿时尚达人 浏览 3932 06-17

买手机前必看!安兔兔1月性能排行更新:第一名甩开垫底近40万分

快科技 浏览 3 02-03

不会演别尬演!《沉默的荣耀》女三一出手,把视帝于和伟都演懵了

娱乐圈笔娱君 浏览 14 10-09

大众、宝马、奔驰等共研汽车软件平台

盖世汽车 浏览 3078 06-30

抱歉,内娱一姐也救不了这「坏东西」

独立鱼 浏览 15 09-18

大牛扎堆进入具身智能,智驾不香了吗?丨智驾雷达 Vol.2

虎嗅APP 浏览 7173 07-22

外媒:特朗普告诉内塔尼亚胡 以色列突袭卡塔尔“不明智”

环球网资讯 浏览 12 09-11

秋季穿衣别太老气横秋,看看这27套造型,时尚舒适又显高

静儿时尚达人 浏览 13 11-02

夏天的帽子,来点不一样的

Yuki女人故事 浏览 288 05-19

离婚后陈赫前妻秀恩爱,老公和陈赫截然相反

林轻吟 浏览 5863 07-31

售14.98万起 2026款海豹07DM-i正式上市

网易汽车 浏览 13 09-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备2023013132号-2