简介:

开源视频生成模型

功能:

使用 Asymmetric Diffusion Transformer (AsymmDiT) 架构,具有10亿参数的扩散模型。

通过 AsymmVAE 模型实现视频的高效压缩,压缩比达到128倍。

支持从命令行直接生成视频或通过 Gradio 用户界面操作。

模型对用户提示的处理仅使用单个 T5-XXL 语言模型进行编码。

模型需要至少4个 H100 GPU 才能运行,社区正在努力降低这一要求。

在研究预览阶段,生成的视频分辨率为480p,可能在极端运动情况下出现轻微形变。

模型优化为照片般真实风格,不适合动画内容的生成。

需求人群:

"目标受众为视频制作者、游戏开发者、动画师以及任何对视频生成技术感兴趣的研究人员和开发者。这款模型因其开源特性,特别适合那些希望在视频生成领域进行创新和实验的用户。"

浏览量:20

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图