训练无关的区域提示扩散变换器模型
Regional-Prompting-FLUX是一种训练无关的区域提示扩散变换器模型,它能够在无需训练的情况下,为扩散变换器(如FLUX)提供细粒度的组合文本到图像生成能力。该模型不仅效果显著,而且与LoRA和ControlNet高度兼容,能够在保持高速度的同时减少GPU内存的使用。
动漫风格图像生成模型
Momo XL是一个基于SDXL的动漫风格模型,经过微调,能够生成高质量、细节丰富、色彩鲜艳的动漫风格图像。它特别适合艺术家和动漫爱好者使用,并且支持基于标签的提示,确保输出结果的准确性和相关性。此外,Momo XL还兼容大多数LoRA模型,允许用户进行多样化的定制和风格转换。
视频到声音的同步生成系统
Video-Foley是一个创新的视频到声音生成系统,它通过使用均方根(RMS)作为时间事件条件,结合语义音色提示(音频或文本),实现高控制性和同步性的视频声音合成。该系统采用无需标注的自监督学习框架,包括Video2RMS和RMS2Sound两个阶段,结合了RMS离散化和RMS-ControlNet等新颖概念,与预训练的文本到音频模型相结合。Video-Foley在声音时间、强度、音色和细节的音视频对齐和控制性方面达到了最先进的性能。
深度学习模型训练脚本集
x-flux是由XLabs AI团队发布的深度学习模型训练脚本集,包括LoRA和ControlNet模型。这些模型使用DeepSpeed进行训练,支持512x512和1024x1024图片尺寸,并且提供了相应的训练配置文件和示例。x-flux模型训练旨在提高图像生成的质量和效率,对于AI图像生成领域具有重要意义。
精确提取图像中的线条,用于生成高质量图像。
Anyline是一个ControlNet线条预处理器,能够从大多数图像中准确提取对象边缘、图像细节和文本内容。它基于“Tiny and Efficient Model for the Edge Detection Generalization (TEED)”论文的创新努力,是当前最先进的视觉算法之一。Anyline与Mistoline ControlNet模型结合,形成完整的SDXL工作流程,最大化精确控制并发挥SDXL模型的生成能力。
基于SDXL的ControlNet Tile模型,适用于Stable Diffusion SDXL ControlNet的高分辨率图像修复。
这是一个基于SDXL的ControlNet Tile模型,使用Hugging Face Diffusers训练集,适用于Stable Diffusion SDXL ControlNet。它最初是为我自己的逼真模型训练,用于终极放大过程以提高图像细节。使用合适的工作流程,它可以为高细节、高分辨率的图像修复提供良好的结果。由于大多数开源没有SDXL Tile模型,我决定分享这个模型。该模型支持高分辨率修复、风格迁移和图像修复等功能,可以为你提供高质量的图像处理体验。
快速可控的图像生成与潜在一致性模型
PIXART LCM是一个文本到图像合成框架,将潜在一致性模型(LCM)和ControlNet集成到先进的PIXART-α模型中。PIXART LCM以其能够通过高效的训练过程生成1024px分辨率的高质量图像而闻名。在PIXART-δ中集成LCM显著加快了推理速度,使得仅需2-4步即可生成高质量图像。特别值得注意的是,PIXART-δ实现了在0.5秒内生成1024x1024像素图像的突破,比PIXART-α改进了7倍。此外,PIXART-δ经过精心设计,可在单日内在32GB V100GPU上进行高效训练。具有8位推理能力的PIXART-δ可以在8GB GPU内存约束下合成1024px图像,极大地增强了其可用性和可访问性。此外,引入类似于ControlNet的模块可以对文本到图像扩散模型进行精细控制。我们引入了一种新颖的ControlNet-Transformer架构,专门为Transformers量身定制,实现了显式可控性和高质量图像生成。作为一种最先进的开源图像生成模型,PIXART-δ为稳定扩散模型家族提供了一个有前途的选择,为文本到图像合成做出了重大贡献。
免费的QR码艺术生成器
QR Diffusion是一个免费的QR码艺术生成器,使用稳定扩散和ControlNet技术,在几秒钟内生成令人惊叹的艺术品般的QR码。它超越了传统QR码的像素化网格,使用强大的生成式AI模型Stable Diffusion创建类似艺术品的复杂图像,而ControlNet模型确保最终的QR码保留您所需的所有重要细节。
AI文本转GIF模型,与Stable Diffusion XL配套使用
Hotshot-XL是一个AI文本转GIF模型,训练用于与Stable Diffusion XL配套使用。Hotshot-XL可以使用任何经过微调的SDXL模型生成GIF。这意味着您可以使用任何现有或新经过微调的SDXL模型制作GIF。如果您想制作个性化主题的GIF,您可以加载自己的基于SDXL的LORAs,而无需担心对Hotshot-XL进行微调。这非常棒,因为通常很容易找到适合训练数据的图像,而找到视频则更困难。它还希望适用于每个人现有的LORA使用/工作流程。Hotshot-XL与SDXL ControlNet兼容,可以按照您想要的组合/布局制作GIF。Hotshot-XL经过训练,可以以8FPS生成1秒的GIF。Hotshot-XL经过训练,适用于各种宽高比。对于基本的Hotshot-XL模型,我们建议您使用与512x512图像进行微调的SDXL模型以获得最佳效果。您可以在此处找到我们为512x512分辨率进行微调的SDXL模型。
© 2025 AIbase 备案号:闽ICP备08105208号-14