效果炸裂！openai发布首个视频生成模型sora：输文字出视频-k8凯发真人

智通财经获悉，openai将把人工智能技术带到视频领域。该公司周四推出了新的生成式人工智能模型sora。sora的工作原理类似于openai的图像生成人工智能工具dall-e。用户输入想要的场景，sora就会返回一个高清视频剪辑。sora还可以生成受静态图像启发的视频剪辑，并扩展现有视频或填充缺失的帧。

随着聊天机器人和图像生成器进入消费者和商业世界，视频可能成为生成式人工智能的下一个前沿领域。虽然创造性的机会将激发人工智能爱好者，但随着全球重大政治选举的临近，新技术带来了严重的错误信息担忧。

openai希望通过sora与meta和谷歌(googl.us)等公司的视频生成人工智能工具竞争。谷歌今年1月宣布推出ai视频大模型lumiere。其他初创公司也有类似的人工智能工具，比如stability ai，该公司有一款名为stable video diffusion的产品。亚马逊(amzn.us)还发布了“create with alexa”，这是一个专门生成基于提示的儿童动画短片的模型。

sora目前仅限于生成一分钟或更短的视频。在提供更广泛的人工智能模型套件的努力中，由微软支持的openai将多模态(结合文本、图像和视频生成)作为目标。

到目前为止，sora仅供一小部分安全测试人员或“红队”使用，他们测试该模型在错误信息和偏见等方面的漏洞。除了在其网站上可以找到的10个样本片段外，该公司还没有发布任何公开演示，并表示将在周四晚些时候发布随附的技术论文。

openai还表示，它正在构建一个“检测分类器”，可以识别sora生成的视频片段，并计划在其输出中包含某些元数据，以帮助识别ai生成的内容。这是meta在今年大选年用来识别人工智能生成的图像的同一类型的元数据。

sora是一种扩散人工智能模型，与chatgpt一样，它使用了谷歌研究人员在2017年的一篇论文中介绍的transformer架构。openai在声明中写道:“sora是能够理解和模拟现实世界的模型的基础。”

免责声明：该文章系本站转载，旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议，仅供读者参考。

猜您喜欢