简介:

一种基于扩散变换器网络的高动态、逼真肖像图像动画技术。

功能:

采用预训练的变换器基础视频生成模型,生成高动态、逼真的肖像动画视频。

设计了身份参考网络,包括因果3D VAE和变换器层堆叠,确保视频序列中面部身份的一致性。

研究了不同的语音音频条件和运动帧机制,实现由语音音频驱动的连续视频生成。

通过在基准和新提出的野外数据集上的实验验证,证明了该方法在生成具有多种方向的逼真肖像方面的显著改进。

提供了代码和模型,方便研究人员和开发者进行进一步的研究和应用。

需求人群:

"目标受众包括研究人员、开发者以及对肖像动画技术感兴趣的个人和企业。该技术适合那些需要在虚拟现实、增强现实、游戏开发、视频制作等领域中创建逼真、动态肖像动画的用户。"

浏览量:35

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2025     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图