OpenAI Sora 最全学习手册

一、基本介绍

在 2024 年 2 月 16 日（当地时间2月15日），Open AI 宣布推出全新的生成式人工智能模型“Sora”。据了解，通过文本指令，Sora 可以直接输出长达 60 秒的视频，并且包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。

这意味着，继文本、图像之后，OpenAI 将其先进的 AI 技术拓展到了视频领域。OpenAI 亦表示，Sora 是能够理解和模拟现实世界的模型的基础，这一能力将是实现 AGI（通用人工智能）的重要里程碑。

对于 OpenAI 视频生成模型的出现，业内其实早有预期，但仍有人评价称“比想象中来得更快”，亦有人振奋地表示“我们真的看到新工业革命来临”。

Sora 官方网址：https://openai.com/sora

Sora论文网址：https://openai.com/research/video-generation-models-as-world-simulators

友情提示：目前 sora 没有对外开放，也没有内测申请，请不要相信任何账号买卖，课程培训！！！

正式发布时间预测

Sora 怎么申请使用

渠道一（非官方）

截止至 2024 年 2 月 18 日，Sora 目前没有公开测试，也没有内测申请渠道，国内是没有渠道可以去尝试的，下面这个信息源不一定真实，大家仅供参考。

渠道二（官方）：https://forum.openai.com

OpenAl 的官方论坛，据消息透露加入论坛有机会获得内测资格

渠道三（官方）：https://openai.com/form/red-teaming-network

Red Team 开始公开招募了，要求比较高。Sam 之前说过，如果进入到红队，可以有 Sora 的内测机会

模型效果对比

AI 视频玩家盘点

据不完全统计，过去一年来全球 AI 生成视频类赛道的融资已经超过数 10 亿美元，其中大部分的公司都以种子轮、A 轮为主。就在今年 1 月底，A16Z 还专门针对 AI 视频生成领域做了一个全面的回顾和展望，并盘点了市场上超过 20 个明星产品。

大厂文生视频布局动态

大厂在视频领域的动作不断，基本上在推进语言模型业务的同时也布局了视频业务：

字节旗下剪映最近动作频频，目前，剪映已经在邀请一些博主内测旗下AI创作平台Dreamina的视频生成功能。
阿里通义实验室目前开发了开源视频生成模型和代码系列VGen。去年年底，阿里发布了最新AI应用：Animate Anyone，可以根据一张人物照片，生成人体动画视频。
百度在年初推出了一款视频生成模型UniVG，能够处理各种文本和图像的组合输入。
腾讯在2023年12月与北大和香港科技大学联合发布了视频生成模型AnimateZero，并在今年发布了一个可以提升视频质量的视频处理工具VideoCrafter2

Sora 的 6 大优势

《每日经济新闻》记者经过对官方技术报告的梳理，总结出了 Sora 的 6 大优势：

（1）准确性和多样性：Sora 的显著特征之一是能够准确解释长达 135 个单词的长提示。它可以准确地解释用户提供的文本输入，并生成具有各种场景和人物的高质量视频剪辑。这一新工具可将简短的文本描述转化成长达 1 分钟的高清视频。它涵盖了广泛的主题，从人物和动物到郁郁葱葱的风景、城市场景、花园，甚至是水下的纽约市，可根据用户的要求提供多样化的内容。

（2）强大的语言理解：OpenAI 利用 Dall-E 模型的 re-captioning（重述要点）技术，生成视觉训练数据的描述性字幕，不仅能提高文本的准确性，还能提升视频的整体质量。此外，与 DALL·E 3 类似，OpenAI 还利用 GPT 技术将简短的用户提示转换为更长的详细转译，并将其发送到视频模型。这使 Sora 能够精确地按照用户提示生成高质量的视频。

（3）以图/视频生成视频：Sora 除了可以将文本转化为视频，还能接受其他类型的输入提示，如已经存在的图像或视频。这使 Sora 能够执行广泛的图像和视频编辑任务，如创建完美的循环视频、将静态图像转化为动画、向前或向后扩展视频等。OpenAI 在报告中展示了基于 DALL·E 2 和 DALL·E 3 的图像生成的 demo 视频。这不仅证明了 Sora 的强大功能，还展示了它在图像和视频编辑领域的无限潜力。

（4）视频扩展功能：由于可接受多样化的输入提示，用户可以根据图像创建视频或补充现有视频。作为基于 Transformer 的扩散模型，Sora 还能沿时间线向前或向后扩展视频。从 OpenAI 提供的 4 个 demo 视频看，都从同一个视频片段开始，向时间线的过去进行延伸。因此，尽管开头不同，但视频结局都是相同的。

（5）优异的设备适配性：Sora 具备出色的采样能力，从宽屏的 1920x1080p 到竖屏的 1080×1920，两者之间的任何视频尺寸都能轻松应对。这意味着 Sora 能够为各种设备生成与其原始纵横比完美匹配的内容。而在生成高分辨率内容之前，Sora 还能以小尺寸迅速创建内容原型。

（6）场景和物体的一致性和连续性：Sora 可以生成带有动态视角变化的视频，人物和场景元素在三维空间中的移动会显得更加自然。Sora 能够很好地处理遮挡问题。现有模型的一个问题是，当物体离开视野时，它们可能无法对其进行追踪。而通过一次性提供多帧预测，Sora 可确保画面主体即使暂时离开视野也能保持不变。

Sora 可能带来的影响

如果 Sora 能够真正意义上实现文生视频，可能会带来哪些影响呢？

1、没有演员的影视作品出现，对演员来说是个小挑战，将出现真正的“虚拟偶像”，此前的二次元人物并没有真正达到“偶像”的级别。

2、利好编剧行业，剧本、文本创作力成为核心竞争力。

3、Sora 可能才是真正的文生视频，此前的文生视频大多只有 2 秒，仅仅是对象的小幅度移动。

4、OpenAI 继续拉大领先程度，对众多还在进行大模型测试打分 pk 的厂商，构成压力。

5、直接的影响是影视行业，特别是特效行业。使用 AI 来制作一些特效和高风险的镜头，可以大幅降低拍摄成本，也可以避免很多危险。

6、摄影师行业也会受到影响，用文本来生成一些视频，可以省去很多拍摄工作。

7、短视频流行开以后，视频剪辑师也随之成为一个热门职业。如果视频剪辑的工作可以用 AI 来代替，可能会有很多视频剪辑师失业。

8、对于很多短视频创作者来说，用 AI 来替代繁琐的剪辑工作，可以大幅提高工作效率。

9、很多歌手拍摄 MV 都是大成本制作，如果可以用 AI 来生成所需要的 MV 画面，也可以省去很大一部分制作成本。

10、另外，如果真正意义上的文生视频得以实现，可能会有不法份子利用这项技术实施新手段的违法犯罪。

不过，从 Sora 官网目前展示的视频画面效果来看，效果还没那么逼近真实，短期内不会产生让行业失业，但会有辅助作用，做个动画片应该问题不大。

在 Sora 官网，OpenAI 表示，Sora 是能够理解和模拟现实世界的模型的基础，OpenAI 相信这一能力将是实现 AGI 的重要里程碑。

至于 Sora 文生视频到底能带来多大影响，会不会翻车，还需要“让子弹飞一会儿”。

二、演示案例

视频案例合集：

传送门1：http://mianfei.chat/sora

传送门2：https://www.aisora.org/

传送门3：https://sorahub.video/zh

三、赚钱方法

1、搞流量

流量=钱，AI 领域新产品的出现总会伴随着所有人的关注，Sora 在视频生成领域的出现不亚于大语言模型的 GPT-4.0，此时的流量生意总是能最先拿到结果的生意，现在大把的 Sora 公众号爆文，爆款短视频，用来获取流量非常可观，咱们先不管是捧还是骂，话题度在。

2、卖账号

目前的 Sora 模型还没有对普通用户开放，不过大家都已经迫不及待了。就像当年的 ChatGPT 一样，OpenAI 的账号销售一定能继续大卖。只是国内的大语言模型和国外的相比，许多普通人并不能进行完整地分辨，等到文生图的时候，差距逐渐显现，等到真正 Sora 对普通用户开放的时候，国内外的差距就比较明显了。这个时候，会有更多的人想用上 Sora。

3、卖课程

课程永远是 AI 行业不缺的赚钱渠道，目前 AI 行业做课程赚的最多的当属李一舟，据说年入 1 个亿，而 Sora 还没开放账号，已经有课程上线了，这就是“搞钱”的原动力！AI 工具使用的课程会长期成为 AI 行业的赚钱赛道，也算是先行者的付费布道，课程要在有产品以后发布。

4、套壳

众所周知的原因，国内乃至全国的套壳网站和应用众多，只要你有一定的流量或者推广渠道，套壳网站会为你持续带来收益。目前 Sora 的推出，已经有人开始通过套壳网站赚到第一笔年费了。

5、提示词交易

去年的 AI 绘画提示词交易很火，今年 AI 文生视频的提示词一定也会有市场，从提示词打包交易到提示词交易平台。

日光之下并不新事。

6 、剧本创作

文生视频提示词的升级是视频的剧本创作，无论是长视频还是短视频，更依赖剧本的创作，这更依赖于创作者。

从这个角度来看，Sora 的发布是非常利好内容创作者。如果把未来的视频创作比如电影创作的话，那么编剧的权重在进一步强化，或者是编剧、导演和制片在进一步融合。大团队面临挑战，而小团队的机会在进一步上升。

7、视频制作

视频生成这个业务勿庸多言，Sora 就是干这个的，大家只要充分地学习和试错，做出更好的视频（质量和数量），赚钱的机会一定有。在 AI 绘画时代已经切入的团队和个体会更有机会，毕竟前期的铺垫已经足够了，学习成本很低。

8、原业务优化

AI 工具对生产力的提升是毋庸置疑的，如何直接用 AI 工具进行商业变现，不如考虑在原有的业务上进行 AI 化。

商业的竞争说到底还是生产率的竞争，成本打下来了，自然就有价格调整的空间了，也就有更大的获客和竞争优势了。只要是涉及视频类的公司（我说的是“涉及”，这与 08 部分并不一致），都应该重视 Sora 的使用，考虑如何将其融入进原业务。

9、企业服务

部分做传统行业的公司并没有自我 AI 化的能力，那么就可以有相关的 AI 团队来进行咨询服务，从做事的本质上来讲有点像以前的咨询公司，只是这样的咨询公司对 AI 理解和使用更深入，同时这样的咨询公司一定是高度关注和践行 RPA（机器人流程自动化）。

除此以外，企业服务的另一种商业化形式就是商业化的软件工具，在行业领域内融合专业知识和生产流程，再利用像 Sora 这样的 API 实现相应的生产功能，最终商业变现。

10.Sora+电商

用 Sora 生成各类电商产品宣传视频投流，或者制作各类短视频，嵌入产品进行推广，参考 AI 模特变装、虚拟试衣等。

11.开发与 Sora 相关的网站或工具

针对具备技术背景的人士，开发与 Sora 相关的网站或工具，如导航网站或 AI 写真工具，以此获取收益。

四、个人思考

AI 不是短暂的潮流，而是未来生活、工作乃至思维领域不可或缺的核心工具。
AI 技术日新月异，尽管当前可能存在缺陷，但其持续智能化的趋势不容置疑。
面对飞速演进的 AI，其中不乏人为调控因素，社会对如此迅猛变革可能尚未充分适应，政府所承受的压力可想而知。
普通人应积极关注并研究 AI 应用，将 AI 融入个人思考体系，从而确保自身不被时代淘汰。
对 AI 引发的变革无需过度恐慌，但也应对容易被替代的职业保持审慎乐观态度。
即使不具备技术背景，普通人也能抓住 AI 带来的机遇红利，通过深入研究应用场景、甚至发掘新的应用场景，为大众提供示范案例。
关注全球范围内的 AI 技术革新至关重要，虽然我国一直在追赶国外先进技术，但实际差距仍较明显，历次颠覆性的 AI 突破多由海外驱动。
在 AI 创业领域，越来越多的企业选择出海发展，海外市场广阔，这是一场国内外同步推进的技术革命中难得的机遇。
国内各大内容平台正顺应趋势，接纳甚至主动应用 AI 生产内容，这是大势所趋。
掌握先进的生产工具，尤其是 AI 技术，就意味着站在了时代的金字塔尖，这就是 AI 所赋予的前所未有的机遇。

一、基本介绍​