OpenAI Sora 最全学习手册

一、基本介绍​

在 2024 年 2 月 16 日(当地时间2月15日),Open AI 宣布推出全新的生成式人工智能模型“Sora”。据了解,通过文本指令,Sora 可以直接输出长达 60 秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。​

这意味着,继文本、图像之后,OpenAI 将其先进的 AI 技术拓展到了视频领域。OpenAI 亦表示,Sora 是能够理解和模拟现实世界的模型的基础,这一能力将是实现 AGI(通用人工智能)的重要里程碑。​

对于 OpenAI 视频生成模型的出现,业内其实早有预期,但仍有人评价称“比想象中来得更快”,亦有人振奋地表示“我们真的看到新工业革命来临”。​

Sora 官方网址:https://openai.com/sora

Sora官网

Sora论文网址:https://openai.com/research/video-generation-models-as-world-simulators

友情提示:目前 sora 没有对外开放,也没有内测申请,请不要相信任何账号买卖,课程培训!!!

正式发布时间预测

Sora发布时间预测

Sora 怎么申请使用

渠道一(非官方)

截止至 2024 年 2 月 18 日,Sora 目前没有公开测试,也没有内测申请渠道,国内是没有渠道可以去尝试的,下面这个信息源不一定真实,大家仅供参考。

Sora账号申请信息参考

渠道二(官方):https://forum.openai.com

OpenAl 的官方论坛,据消息透露加入论坛有机会获得内测资格

Sora官方论坛

渠道三(官方):https://openai.com/form/red-teaming-network

Red Team 开始公开招募了,要求比较高。Sam 之前说过,如果进入到红队,可以有 Sora 的内测机会

OpenAI 红队网络

模型效果对比

Sora和其他模型对比

AI 视频玩家盘点

据不完全统计,过去一年来全球 AI 生成视频类赛道的融资已经超过数 10 亿美元,其中大部分的公司都以种子轮、A 轮为主。就在今年 1 月底,A16Z 还专门针对 AI 视频生成领域做了一个全面的回顾和展望,并盘点了市场上超过 20 个明星产品。​

AI视频发展时间线

大厂文生视频布局动态

大厂在视频领域的动作不断,基本上在推进语言模型业务的同时也布局了视频业务:​

  • 字节旗下剪映最近动作频频,目前,剪映已经在邀请一些博主内测旗下AI创作平台Dreamina的视频生成功能。​
  • 阿里通义实验室目前开发了开源视频生成模型和代码系列VGen。去年年底,阿里发布了最新AI应用:Animate Anyone,可以根据一张人物照片,生成人体动画视频。​
  • 百度在年初推出了一款视频生成模型UniVG,能够处理各种文本和图像的组合输入。​
  • 腾讯在2023年12月与北大和香港科技大学联合发布了视频生成模型AnimateZero,并在今年发布了一个可以提升视频质量的视频处理工具VideoCrafter2

Sora 的 6 大优势

《每日经济新闻》记者经过对官方技术报告的梳理,总结出了 Sora 的 6 大优势:​

(1)准确性和多样性:Sora 的显著特征之一是能够准确解释长达 135 个单词的长提示。它可以准确地解释用户提供的文本输入,并生成具有各种场景和人物的高质量视频剪辑。这一新工具可将简短的文本描述转化成长达 1 分钟的高清视频。它涵盖了广泛的主题,从人物和动物到郁郁葱葱的风景、城市场景、花园,甚至是水下的纽约市,可根据用户的要求提供多样化的内容。​

(2)强大的语言理解:OpenAI 利用 Dall-E 模型的 re-captioning(重述要点)技术,生成视觉训练数据的描述性字幕,不仅能提高文本的准确性,还能提升视频的整体质量。此外,与 DALL·E 3 类似,OpenAI 还利用 GPT 技术将简短的用户提示转换为更长的详细转译,并将其发送到视频模型。这使 Sora 能够精确地按照用户提示生成高质量的视频。​

(3)以图/视频生成视频:Sora 除了可以将文本转化为视频,还能接受其他类型的输入提示,如已经存在的图像或视频。这使 Sora 能够执行广泛的图像和视频编辑任务,如创建完美的循环视频、将静态图像转化为动画、向前或向后扩展视频等。OpenAI 在报告中展示了基于 DALL·E 2 和 DALL·E 3 的图像生成的 demo 视频。这不仅证明了 Sora 的强大功能,还展示了它在图像和视频编辑领域的无限潜力。​

(4)视频扩展功能:由于可接受多样化的输入提示,用户可以根据图像创建视频或补充现有视频。作为基于 Transformer 的扩散模型,Sora 还能沿时间线向前或向后扩展视频。从 OpenAI 提供的 4 个 demo 视频看,都从同一个视频片段开始,向时间线的过去进行延伸。因此,尽管开头不同,但视频结局都是相同的。​

(5)优异的设备适配性:Sora 具备出色的采样能力,从宽屏的 1920x1080p 到竖屏的 1080×1920,两者之间的任何视频尺寸都能轻松应对。这意味着 Sora 能够为各种设备生成与其原始纵横比完美匹配的内容。而在生成高分辨率内容之前,Sora 还能以小尺寸迅速创建内容原型。​

(6)场景和物体的一致性和连续性:Sora 可以生成带有动态视角变化的视频,人物和场景元素在三维空间中的移动会显得更加自然。Sora 能够很好地处理遮挡问题。现有模型的一个问题是,当物体离开视野时,它们可能无法对其进行追踪。而通过一次性提供多帧预测,Sora 可确保画面主体即使暂时离开视野也能保持不变。

Sora 可能带来的影响​

如果 Sora 能够真正意义上实现文生视频,可能会带来哪些影响呢?​

1、没有演员的影视作品出现,对演员来说是个小挑战,将出现真正的“虚拟偶像”,此前的二次元人物并没有真正达到“偶像”的级别。​

2、利好编剧行业,剧本、文本创作力成为核心竞争力。​

3、Sora 可能才是真正的文生视频,此前的文生视频大多只有 2 秒,仅仅是对象的小幅度移动。​

4、OpenAI 继续拉大领先程度,对众多还在进行大模型测试打分 pk 的厂商,构成压力。​

5、直接的影响是影视行业,特别是特效行业。使用 AI 来制作一些特效和高风险的镜头,可以大幅降低拍摄成本,也可以避免很多危险。​

6、摄影师行业也会受到影响,用文本来生成一些视频,可以省去很多拍摄工作。​

7、短视频流行开以后,视频剪辑师也随之成为一个热门职业。如果视频剪辑的工作可以用 AI 来代替,可能会有很多视频剪辑师失业。​

8、对于很多短视频创作者来说,用 AI 来替代繁琐的剪辑工作,可以大幅提高工作效率。​

9、很多歌手拍摄 MV 都是大成本制作,如果可以用 AI 来生成所需要的 MV 画面,也可以省去很大一部分制作成本。

10、另外,如果真正意义上的文生视频得以实现,可能会有不法份子利用这项技术实施新手段的违法犯罪。​

不过,从 Sora 官网目前展示的视频画面效果来看,效果还没那么逼近真实,短期内不会产生让行业失业,但会有辅助作用,做个动画片应该问题不大。​

在 Sora 官网,OpenAI 表示,Sora 是能够理解和模拟现实世界的模型的基础,OpenAI 相信这一能力将是实现 AGI 的重要里程碑。​

至于 Sora 文生视频到底能带来多大影响,会不会翻车,还需要“让子弹飞一会儿”。

二、演示案例

视频案例合集:

传送门1:http://mianfei.chat/sora

传送门2:https://www.aisora.org/

传送门3:https://sorahub.video/zh

三、赚钱方法

1、搞流量​

流量=钱,AI 领域新产品的出现总会伴随着所有人的关注,Sora 在视频生成领域的出现不亚于大语言模型的 GPT-4.0,此时的流量生意总是能最先拿到结果的生意,现在大把的 Sora 公众号爆文,爆款短视频,用来获取流量非常可观,咱们先不管是捧还是骂,话题度在。​

2、卖账号

目前的 Sora 模型还没有对普通用户开放,不过大家都已经迫不及待了。就像当年的 ChatGPT 一样,OpenAI 的账号销售一定能继续大卖。只是国内的大语言模型和国外的相比,许多普通人并不能进行完整地分辨,等到文生图的时候,差距逐渐显现,等到真正 Sora 对普通用户开放的时候,国内外的差距就比较明显了。这个时候,会有更多的人想用上 Sora。​

3、卖课程

课程永远是 AI 行业不缺的赚钱渠道,目前 AI 行业做课程赚的最多的当属李一舟,据说年入 1 个亿,而 Sora 还没开放账号,已经有课程上线了,这就是“搞钱”的原动力!AI 工具使用的课程会长期成为 AI 行业的赚钱赛道,也算是先行者的付费布道,课程要在有产品以后发布。

4、套壳

众所周知的原因,国内乃至全国的套壳网站和应用众多,只要你有一定的流量或者推广渠道,套壳网站会为你持续带来收益。目前 Sora 的推出,已经有人开始通过套壳网站赚到第一笔年费了。

5、提示词交易

去年的 AI 绘画提示词交易很火,今年 AI 文生视频的提示词一定也会有市场,从提示词打包交易到提示词交易平台。​

日光之下并不新事。​

6 、剧本创作

文生视频提示词的升级是视频的剧本创作,无论是长视频还是短视频,更依赖剧本的创作,这更依赖于创作者。​

从这个角度来看,Sora 的发布是非常利好内容创作者。如果把未来的视频创作比如电影创作的话,那么编剧的权重在进一步强化,或者是编剧、导演和制片在进一步融合。大团队面临挑战,而小团队的机会在进一步上升。​

7、视频制作

视频生成这个业务勿庸多言,Sora 就是干这个的,大家只要充分地学习和试错,做出更好的视频(质量和数量),赚钱的机会一定有。在 AI 绘画时代已经切入的团队和个体会更有机会,毕竟前期的铺垫已经足够了,学习成本很低。​

8、 原业务优化

AI 工具对生产力的提升是毋庸置疑的,如何直接用 AI 工具进行商业变现,不如考虑在原有的业务上进行 AI 化。​

商业的竞争说到底还是生产率的竞争,成本打下来了,自然就有价格调整的空间了,也就有更大的获客和竞争优势了。只要是涉及视频类的公司(我说的是“涉及”,这与 08 部分并不一致),都应该重视 Sora 的使用,考虑如何将其融入进原业务。​

9、 企业服务

部分做传统行业的公司并没有自我 AI 化的能力,那么就可以有相关的 AI 团队来进行咨询服务,从做事的本质上来讲有点像以前的咨询公司,只是这样的咨询公司对 AI 理解和使用更深入,同时这样的咨询公司一定是高度关注和践行 RPA(机器人流程自动化)。​

除此以外,企业服务的另一种商业化形式就是商业化的软件工具,在行业领域内融合专业知识和生产流程,再利用像 Sora 这样的 API 实现相应的生产功能,最终商业变现。​

10.Sora+电商​

用 Sora 生成各类电商产品宣传视频投流,或者制作各类短视频,嵌入产品进行推广,参考 AI 模特变装、虚拟试衣等。​

11.开发与 Sora 相关的网站或工具​

针对具备技术背景的人士,开发与 Sora 相关的网站或工具,如导航网站或 AI 写真工具,以此获取收益。

四、个人思考

  • AI 不是短暂的潮流,而是未来生活、工作乃至思维领域不可或缺的核心工具。
  • AI 技术日新月异,尽管当前可能存在缺陷,但其持续智能化的趋势不容置疑。
  • 面对飞速演进的 AI,其中不乏人为调控因素,社会对如此迅猛变革可能尚未充分适应,政府所承受的压力可想而知。
  • 普通人应积极关注并研究 AI 应用,将 AI 融入个人思考体系,从而确保自身不被时代淘汰。
  • 对 AI 引发的变革无需过度恐慌,但也应对容易被替代的职业保持审慎乐观态度。
  • 即使不具备技术背景,普通人也能抓住 AI 带来的机遇红利,通过深入研究应用场景、甚至发掘新的应用场景,为大众提供示范案例。
  • 关注全球范围内的 AI 技术革新至关重要,虽然我国一直在追赶国外先进技术,但实际差距仍较明显,历次颠覆性的 AI 突破多由海外驱动。
  • 在 AI 创业领域,越来越多的企业选择出海发展,海外市场广阔,这是一场国内外同步推进的技术革命中难得的机遇。
  • 国内各大内容平台正顺应趋势,接纳甚至主动应用 AI 生产内容,这是大势所趋。
  • 掌握先进的生产工具,尤其是 AI 技术,就意味着站在了时代的金字塔尖,这就是 AI 所赋予的前所未有的机遇。

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注