Ruyi

Ruyi是图森未来发布的图生视频大模型,专为在消费级显卡上运行而设计,并提供详尽的部署说明和ComfyUI工作流,以便用户能够快速上手。Ruyi凭借在帧间一致性、动作流畅性方面的卓越表现,以及和谐自然的色彩呈现和构图,将为视觉叙事提供全新的可能性。同时,该模型还针对动漫和游戏场景进行深度学习,将成为ACG爱好者理想的创意伙伴。

需求人群:

"目标受众为AIGC爱好者和社区成员,特别是动漫和游戏内容的开发者。Ruyi能够降低动漫和游戏内容的开发周期和开发成本,提供快速上手的解决方案,适合需要快速生成视频内容的创意工作者。"

使用场景示例:

1. 使用Ruyi生成动漫角色的动态视频,用于社交媒体宣传。

2. 利用Ruyi创建游戏内角色的预告片,提高游戏的吸引力。

3. 通过Ruyi生成教育视频中的动态图表,使教学内容更加生动。

产品特色:

- 多分辨率、多时长生成:支持最小384*384,最大1024*1024分辨率,最长120帧/5秒的视频生成。

- 首帧、首尾帧控制生成:支持最多5个起始帧、最多5个结束帧基础上的视频生成。

- 运动幅度控制:提供4档运动幅度控制,方便用户对整体画面的变化程度进行控制。

- 镜头控制:提供上、下、左、右、静止共5种镜头控制。

- 模型架构:基于DiT架构,由Casual VAE模块和Diffusion Transformer构成,总参数量约为7.1B。

- 训练数据和方式:分为4个阶段,使用约200M视频片段进行训练。

- 输入格式和生成长度/模式:需要用户提供一张图片作为输入,并可以选择输出时长、输出分辨率等选项。

使用教程:

1. 访问Ruyi的Hugging Face页面,下载Ruyi-Mini-7B版本。

2. 阅读并理解提供的部署说明和ComfyUI工作流。

3. 准备一张图片作为输入,确定所需的输出时长、分辨率等参数。

4. 根据Ruyi的使用指南,设置首帧和首尾帧,以及运动幅度和镜头控制。

5. 运行Ruyi模型,生成视频内容。

6. 检查生成的视频内容,根据需要进行调整和优化。

7. 将生成的视频用于所需的场景,如社交媒体、游戏预告等。

浏览量:11

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图