简介:

大规模视频生成的自回归扩散模型

功能:

- 视频插值:在给定首尾帧的情况下,生成中间帧,实现视频插值。

- 图像到视频生成:从第二帧开始掩码,实现图像到视频的生成。

- 视频扩展:在给定视频基础上,通过掩码扩展视频,增加新帧。

- 长时视频生成:通过递归插值,从少量图像生成长时间视频。

- 3D视图合成:尽管仅在视频数据上训练,MarDini展现出初步的空间理解能力,为3D应用提供可能。

- 灵活性:通过灵活的掩码策略,支持多种视频生成任务。

- 可扩展性:MarDini能够从零开始大规模训练,无需依赖基于图像的预训练。

- 高效率:在推理期间内存效率高且速度快,允许大规模部署计算密集型的空间-时间注意力机制。

需求人群:

"MarDini的目标受众是视频制作者、动画师、游戏开发者以及任何需要视频内容生成的专业人士。它适合他们,因为它提供了一种高效、灵活且可扩展的方式来生成视频内容,无需复杂的预处理或后期编辑。"

浏览量:14

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图