浏览量:187
最新流量情况
月访问量
56.00k
平均访问时长
00:00:30
每次访问页数
2.21
跳出率
45.80%
流量来源
直接访问
28.65%
自然搜索
53.27%
邮件
0.09%
外链引荐
13.72%
社交媒体
3.70%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
4.74%
法国
5.40%
俄罗斯
3.83%
美国
23.97%
越南
5.47%
开源自回归视觉生成模型项目
Open-MAGVIT2是由腾讯ARC实验室开源的一个自回归图像生成模型系列,包含从300M到1.5B不同规模的模型。该项目复现了Google的MAGVIT-v2分词器,实现了在ImageNet 256×256数据集上达到1.17 rFID的先进重建性能。通过引入不对称分词技术,将大词汇表分解为不同大小的子词汇表,并引入'下一个子标记预测'来增强子标记间的交互,以提高生成质量。所有模型和代码均已开源,旨在推动自回归视觉生成领域的创新和创造力。
实时一步潜在扩散模型,可用图像条件控制生成
SDXS是一种新的扩散模型,通过模型微型化和减少采样步骤,大幅降低了模型延迟。它利用知识蒸馏来简化U-Net和图像解码器架构,并引入了一种创新的单步DM训练技术,使用特征匹配和分数蒸馆。SDXS-512和SDXS-1024模型可在单个GPU上分别实现约100 FPS和30 FPS的推理速度,比之前模型快30至60倍。此外,该训练方法在图像条件控制方面也有潜在应用,可实现高效的图像到图像翻译。
免费AI生成的库存照片和免版税图像
Lummi提供由AI生成的高质量库存照片和免版税图像,旨在为用户提供独特且多样化的图片资源。这些图片覆盖了多种类别,如动物、艺术、残疾、花卉、风景、街头摄影、旅行和健康等。
用于视觉合成的统一3D Transformer流水线
NUWA是由微软开发的一系列研究项目,包括NUWA、NUWA-Infinity、NUWA-LIP、Learning 3D Photography Videos和NUWA-XL。这些项目涉及视觉合成的预训练模型,能够生成或操纵视觉数据,如图像和视频,以执行多种视觉合成任务。
使用Latent Transparency的透明图像层扩散工具
sd-forge-layerdiffuse是一个用于生成透明图像和图层的工作在进行中的扩展,它利用了潜在透明度技术。该工具目前支持图像生成和基本图层功能,但透明图像到图像的转换尚未完成。代码库高度动态,未来一个月可能会有大量变化。
一种用于迷彩目标分割的通用文本提示方法。
GenSAM是一种针对迷彩对象检测(COD)的方法,它使用Cross-modal Chains of Thought Prompting (CCTP)技术来理解视觉提示,并利用通用文本提示来获取可靠的视觉提示。该方法通过渐进式掩膜生成(PMG)在测试时自动生成并优化视觉提示,无需额外训练,实现高效准确的迷彩目标分割。
将文字转化为AI艺术,选择20+艺术风格,高分辨率图片秒生成。
Nero Muse是一款AI艺术生成器,通过Nero AI品牌的Nero Lens进行放大,能够在几秒钟内将文字转化为20+种艺术风格的高分辨率图片。它能够让用户随心所欲地设计定制的CD封面,让创作艺术变得更加简单和快捷。
AI照片增强和编辑工具提供商
VanceAI提供AI增强、放大、锐化、去噪、去背景等多种功能,只需一键即可轻松处理照片。所有AI工具都可在线或通过“免费下载”软件使用。VanceAI旨在通过有效的AI解决方案提高照片处理效率。与传统的基于数学运算的工具不同,VanceAI擅长处理真实细节。它的AI工具基于数百万张图像训练的深度卷积神经网络(DCNN),能够进行智能分析和快速处理。
一体化编辑器,AI 助力设计
Adobe Express 是一款一体化编辑器,集成了 AI 功能,可用于制作海报、TikTok 视频、简历、Reels 等。它提供了数千个专业设计模板,支持 PDF 编辑、视频编辑、图片编辑等功能。用户可以通过 Adobe Express 快速生成具有创意的社交媒体内容,无需任何设计经验。Adobe Express 分为免费版和高级版,高级版提供了更多的设计资源和功能。
用AI的力量在几秒钟内创建惊人的原创艺术品。
Makeayo是一款功能强大的桌面客户端,使用最先进的人工智能技术,让用户轻松创建惊人的艺术品。它提供了易于使用的工具,使任何人都能够轻松创建独特的艺术品。用户可以使用最佳的AI工具来创建迷人的生成艺术,无需额外费用即可无限生成,让用户不断完善和发展他们的生成艺术创作,以无与伦比的艺术自由解锁它们最真实和最迷人的形式。此外,Makeayo还提供了创新的图像转换功能,使用户可以将图像转换为迷人的新风格,开启无尽的艺术可能性。它还具有高清升级功能,可以将生成的艺术提升到令人惊叹的细节水平,并具有控制网络的姿势匹配功能,可以无缝地匹配输入图像的姿势,创建引人入胜和动态的艺术输出。用户可以探索由充满活力的生成艺术爱好者社区精心制作的各种各样的模型,以满足其独特的创意需求。加入我们充满激情的创作者社区,那里充满了艺术灵感和合作。
让你的想象力奔放,创造出美丽的艺术作品。
Generai是一款基于生成式人工智能的艺术创作平台,旨在让每个人都能够将自己的想象力转化为现实。用户只需简单描述自己的创意,Generai的AI艺术家就会根据用户提供的文本创作出精美的艺术作品。Generai的智能提示系统会帮助用户找到完美的描述,以及提供适合的关键词。所有的图像都是在市场上最快的GPU上生成的,并且经过多次运行以确保最高的细节水平。Generai的目标是降低生成式AI艺术的门槛,让更多的人能够参与到这个领域中来。
任意格式照片无需裁剪
UNCROP是一款能够轻松生成和扩展您珍贵照片中的人物或背景的工具,让您的肖像照片焕发新生。它可以让您轻松地点击、粘贴或拖放文件来开始使用。UNCROP还支持多种功能,如图像生成、高分辨率图像生成、自动清除图片中的对象、人物、文本和缺陷、提取图片中的主体、重新照明、图像放大、背景替换和文本去除等。
你值得信赖的 Photoshop 副驾驶
ImageCreator 是一款专业的生成式人工智能插件,支持 SDXL 1.0。它能够帮助用户快速创建美丽的艺术作品,提供了多种有效的功能,包括 TXT2IMG、IMG2IMG、FILL 等多种生成方法。用户可以通过选择模型和输入参数来生成图片,同时支持多种控制模型和处理设置。ImageCreator 还提供了丰富的模型库,用户可以应用这些模型来创作独特的艺术项目。通过 ImageCreator,用户可以探索无限的可能性,创建各种生产就绪的艺术资产。
放大图片而不失去质量
图片放大器是一个使用人工智能技术,能够放大图片而不失去质量的在线工具。它能够帮助用户放大照片并保持像素完美的清晰度,告别模糊的困扰。通过图片放大器,用户可以轻松地将图片放大到所需尺寸,而无需担心质量损失。该工具还提供其他功能,如快速移除图片背景、去除不需要的物体等。
AI艺术生成器,创造令人惊叹的艺术作品
Pica AI艺术生成器是一款能够利用人工智能在几秒钟内生成令人惊叹的艺术作品、插图、图片和头像的工具。通过免费使用Pica,您可以发现AI艺术的魔力并释放您的创造力。
AI图像生成器
Deep Dream Generator是一款AI图像生成器,利用深度学习技术生成艺术风格的图像。用户可以通过输入提示文字或选择基础图像,应用不同的艺术风格和参数来生成独特的艺术作品。Deep Dream Generator提供多种艺术风格和效果选择,并支持高质量输出。用户可以在平台上浏览和分享其他用户生成的作品。
强大的AI工具套件
getimg.ai是一个强大的AI工具套件,可以生成大量原创图片,修改照片,将图片扩展到超出其边界,或创建定制的AI模型。它提供了多种功能,包括文本生成图片、超出边界绘画、修复图片等。getimg.ai速度快,支持60多个AI模型,并且无需下载安装,直接在浏览器中使用。它适用于艺术创作、照片编辑、设计灵感等各种用途。
AI 辅助创作工具
Artbreeder 是一个协作式的 AI 辅助创作工具,可用于创建角色、艺术品等。它拥有多种功能,由人工智能驱动,用户可通过混合、拼贴、编辑基因等方式进行创作。Artbreeder 已拥有 1000 万用户和 2.5 亿张图像,并提供免费试用和付费服务。
提升户外虚拟试穿效果的模型训练代码库
BooW-VTON是一个专注于提升户外虚拟试穿效果的研究项目,通过无需掩码的伪数据训练来增强虚拟试穿技术。该技术的重要性在于它能够改善在自然环境下服装试穿的真实感和准确性,对于时尚电商和虚拟现实领域具有重要意义。产品背景信息显示,该项目是基于深度学习技术的图像生成模型,旨在解决传统虚拟试穿中服装与人体融合不自然的问题。目前该项目是免费开源的,定位于研究和开发阶段。
Stable Diffusion 3.5 Large的三款ControlNets模型
ControlNets for Stable Diffusion 3.5 Large是Stability AI推出的三款图像控制模型,包括Blur、Canny和Depth。这些模型能够提供精确和便捷的图像生成控制,适用于从室内设计到角色创建等多种应用场景。它们在用户偏好的ELO比较研究中排名第一,显示出其在同类模型中的优越性。这些模型在Stability AI社区许可下免费提供给商业和非商业用途,对于年收入不超过100万美元的组织和个人,使用完全免费,并且产出的媒体所有权归用户所有。
FLUX.1的最小且通用的控制器
OminiControl是一个为Diffusion Transformer模型如FLUX设计的最小但功能强大的通用控制框架。它支持主题驱动控制和空间控制(如边缘引导和图像修复生成)。OminiControl的设计非常精简,仅引入了基础模型0.1%的额外参数,同时保持了原始模型结构。这个项目由新加坡国立大学的学习与视觉实验室开发,代表了人工智能领域中图像生成和控制技术的最新进展。
先进的多模态图像生成模型,结合文本提示和视觉参考生成高质量图像。
Qwen2vl-Flux是一个结合了Qwen2VL视觉语言理解能力的FLUX框架的先进多模态图像生成模型。该模型擅长基于文本提示和视觉参考生成高质量图像,提供卓越的多模态理解和控制。产品背景信息显示,Qwen2vl-Flux集成了Qwen2VL的视觉语言能力,增强了FLUX的图像生成精度和上下文感知能力。其主要优点包括增强的视觉语言理解、多种生成模式、结构控制、灵活的注意力机制和高分辨率输出。
先进的文本到图像模型工具套件
FLUX.1 Tools是Black Forest Labs推出的一套模型工具,旨在为基于文本的图像生成模型FLUX.1增加控制和可操作性,使得对真实和生成的图像进行修改和再创造成为可能。该工具套件包含四个不同的特性,以开放访问模型的形式在FLUX.1 [dev]模型系列中提供,并作为BFL API的补充,支持FLUX.1 [pro]。FLUX.1 Tools的主要优点包括先进的图像修复和扩展能力、结构化引导、图像变化和重构等,这些功能对于图像编辑和创作领域具有重要意义。
人脸匿名化技术,保留关键细节同时有效保护隐私。
face_anon_simple是一个人脸匿名化技术,旨在通过先进的算法在保护个人隐私的同时保留原始照片中的面部表情、头部姿势、眼神方向和背景元素。这项技术对于需要发布包含人脸的图片但又希望保护个人隐私的场合非常有用,比如在新闻报道、社交媒体和安全监控等领域。产品基于开源代码,允许用户自行部署和使用,具有很高的灵活性和应用价值。
图像水印技术,可在图片中嵌入局部化水印信息
Watermark Anything是一个由Facebook Research开发的图像水印技术,它允许在图片中嵌入一个或多个局部化水印信息。这项技术的重要性在于它能够在保证图像质量的同时,实现对图像内容的版权保护和追踪。该技术背景是基于深度学习和图像处理的研究,主要优点包括高鲁棒性、隐蔽性和灵活性。产品定位为研究和开发用途,目前是免费提供给学术界和开发者使用。
基于文本提示修订图像的大型扩散模型
SeedEdit是Doubao Team推出的大型扩散模型,用于根据任何文本提示修订图像。它通过逐步将图像生成器与强大的图像编辑器对齐,实现了图像重建和图像再生之间的最佳平衡。SeedEdit能够实现高审美/分辨率图像的零样本稳定编辑,并支持图像的连续修订。该技术的重要性在于其能够解决图像编辑问题中成对图像数据稀缺的核心难题,通过将文本到图像(T2I)生成模型视为弱编辑模型,并通过生成带有新提示的新图像来实现“编辑”,然后将其蒸馏并与之对齐到图像条件编辑模型中。
© 2024 AIbase 备案号:闽ICP备08105208号-14