智通财经获悉,openai将把人工智能技术带到视频领域。该公司周四推出了新的生成式人工智能模型sora。sora的工作原理类似于openai的图像生成人工智能工具dall-e。用户输入想要的场景,sora就会返回一个高清视频剪辑。sora还可以生成受静态图像启发的视频剪辑,并扩展现有视频或填充缺失的帧。
随着聊天机器人和图像生成器进入消费者和商业世界,视频可能成为生成式人工智能的下一个前沿领域。虽然创造性的机会将激发人工智能爱好者,但随着全球重大政治选举的临近,新技术带来了严重的错误信息担忧。
openai希望通过sora与meta和谷歌(googl.us)等公司的视频生成人工智能工具竞争。谷歌今年1月宣布推出ai视频大模型lumiere。其他初创公司也有类似的人工智能工具,比如stability ai,该公司有一款名为stable video diffusion的产品。亚马逊(amzn.us)还发布了“create with alexa”,这是一个专门生成基于提示的儿童动画短片的模型。
sora目前仅限于生成一分钟或更短的视频。在提供更广泛的人工智能模型套件的努力中,由微软支持的openai将多模态(结合文本、图像和视频生成)作为目标。
到目前为止,sora仅供一小部分安全测试人员或“红队”使用,他们测试该模型在错误信息和偏见等方面的漏洞。除了在其网站上可以找到的10个样本片段外,该公司还没有发布任何公开演示,并表示将在周四晚些时候发布随附的技术论文。
openai还表示,它正在构建一个“检测分类器”,可以识别sora生成的视频片段,并计划在其输出中包含某些元数据,以帮助识别ai生成的内容。这是meta在今年大选年用来识别人工智能生成的图像的同一类型的元数据。
sora是一种扩散人工智能模型,与chatgpt一样,它使用了谷歌研究人员在2017年的一篇论文中介绍的transformer架构。openai在声明中写道:“sora是能够理解和模拟现实世界的模型的基础。”
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。