简介:

开源自回归视觉生成模型项目

功能:

提供从300M到1.5B不同规模的自回归图像生成模型。

实现了与Google的MAGVIT-v2分词器相匹配的开源复现。

在ImageNet 256×256数据集上达到1.17 rFID的先进重建性能。

采用不对称分词技术,优化了大词汇表的预测性能。

引入'下一个子标记预测'机制,增强生成图像的质量。

支持在不同的硬件平台上进行模型训练和测试。

提供详细的安装和使用文档,方便开发者快速上手。

需求人群:

"目标受众为图像生成领域的研究人员、开发者以及对深度学习图像处理技术感兴趣的学生。Open-MAGVIT2提供了一套完整的自回归视觉生成解决方案,适合需要进行图像重建、风格迁移、图像生成等研究和应用的专业人士。"

浏览量:9

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图