Open-Sora Plan v1.2

简介:

文本到视频生成领域的先进模型架构

功能:

采用2+1D模型架构快速进行文本到视频的生成任务

优化CausalVideoVAE结构,提供更好的压缩视觉表示和推理效率

使用3D全注意力架构,增强对世界的理解

开源发布,包括代码、数据和模型,促进社区发展

在Kinetic400视频数据集上进行训练,并使用EMA权重进行微调

使用PSNR、SSIM和LPIPS等指标进行评估,确保视频质量

需求人群:

"目标受众是视频生成领域的研究人员和开发者,他们需要先进的技术来提升视频内容的自动生成能力。Open-Sora-Plan提供了一个强大的工具,可以帮助他们探索和实现更高质量的视频生成。"

浏览量:184

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图