OpenAI推出首个文生视频大模型Sora，引领AI文生视频行业跨越式发展

30654 次浏览

详情

Sora是一个扩散transformer，具有强大的语言理解能力，通过在潜在空间训练patches生成视频。对标tokens，OpenAI将视觉数据转换为patches，有效用于Sora大模型训练。Sora是一种扩散模型，通过给出输入的静态噪声以及相关的文本提示（prompt）等调节信息，训练生成原始的“干净”patches。在推理时，OpenAI还可以通过在适当大小的网格中排列随机初始化的patches来控制生成视频的大小。与GPT模型类似，Sora使用transformer架构，释放出卓越的扩展性能。立足DALL·E3和GPT模型，Sora具有强大的语言理解能力，能够生成更加准确遵循用户提示的高质量视频。此外，在固定种子和输入的情况下，可以看到训练计算的增加能显著提升样本视频的质量。

预览

免费阅读6页，下载阅读完整文档

OpenAI推出首个文生视频大模型Sora，引领AI文生视频行业跨越式发展

#免责声明#

来源：万联证券，版权归原作者所有。仅供参考学习，禁止用户商业通途。如涉及作品版权问题，请联系我们删除！

推荐报告

全球AI工具趋势洞察（2026年5月）

详细内容请点击查阅...

上传时间：2026-06-23 17:39:32.0
工作场所中的人工智能

详细内容请点击查阅...

上传时间：2026-06-23 17:36:00.0
2026企业AI转型的前置诊断与准备指南

详细内容请点击查阅...

上传时间：2026-06-22 09:42:44.0
企业AI实施手册-斯坦福大学

详细内容请点击查阅...

上传时间：2026-06-22 09:41:02.0
腾讯云AI产业应用大会-互联网AI应用专场

详细内容请点击查阅...

上传时间：2026-06-22 09:36:40.0
2026年电信行业AI发展现状及趋势报告

详细内容请点击查阅...

上传时间：2026-06-22 09:35:01.0