FLATTEN

FLATTEN是一种用于文本到视频编辑的光流引导注意力插件。它通过在扩散模型的U-Net中引入光流来解决文本到视频编辑中的一致性问题。FLATTEN通过强制在不同帧上的相同光流路径上的补丁在注意模块中相互关注,从而提高了编辑视频的视觉一致性。此外,FLATTEN是无需训练的,可以无缝集成到任何基于扩散的文本到视频编辑方法中,并提高其视觉一致性。实验结果表明,我们提出的方法在现有的文本到视频编辑基准上取得了最新的性能。特别是,我们的方法在保持编辑视频的视觉一致性方面表现出色。

需求人群:

"用于文本到视频编辑的光流引导注意力插件"

使用场景示例:

通过FLATTEN插件编辑视频

将FLATTEN插件与其他文本到视频编辑方法进行比较

使用FLATTEN插件进行Plug-and-Play编辑

产品特色:

通过引入光流来提高文本到视频编辑的视觉一致性

无需训练,可以无缝集成到其他文本到视频编辑方法中

在现有的文本到视频编辑基准上取得了最新的性能

浏览量:9

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备2023012347号-1

隐私政策

用户协议

意见反馈 网站地图