浏览量:1140
最新流量情况
月访问量
3009
平均访问时长
00:00:47
每次访问页数
1.73
跳出率
57.49%
流量来源
直接访问
49.83%
自然搜索
31.52%
邮件
0.08%
外链引荐
9.57%
社交媒体
8.31%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
德国
4.50%
法国
13.05%
美国
82.45%
W.A.L.T是一个基于变分扩散模型的实景视频生成方法
W.A.L.T是一个基于transformer的实景视频生成方法,通过联合压缩图像和视频到一个统一的潜在空间,实现跨模态的训练和生成。它使用了窗注意力机制来提高内存和训练效率。该方法在多个视频和图像生成基准测试上取得了最先进的性能。
下一代多模态智能模型
Emu3是一套最新的多模态模型,仅通过下一个token预测进行训练,能够处理图像、文本和视频。它在生成和感知任务上超越了多个特定任务的旗舰模型,并且不需要扩散或组合架构。Emu3通过将多模态序列统一到一个单一的transformer模型中,简化了复杂的多模态模型设计,展示了在训练和推理过程中扩展的巨大潜力。
集成空间编织注意力,提升扩散模型的高保真条件
HelloMeme是一个集成了空间编织注意力的扩散模型,旨在将高保真和丰富的条件嵌入到图像生成过程中。该技术通过提取驱动视频中的每一帧特征,并将其作为输入到HMControlModule,从而生成视频。通过进一步优化Animatediff模块,提高了生成视频的连续性和保真度。此外,HelloMeme还支持通过ARKit面部混合形状控制生成的面部表情,以及基于SD1.5的Lora或Checkpoint,实现了框架的热插拔适配器,不会影响T2I模型的泛化能力。
谷歌旗下领先的人工智能研究公司
Google DeepMind 是谷歌旗下的一家领先的人工智能公司,专注于开发先进的机器学习算法和系统。DeepMind 以其在深度学习和强化学习领域的开创性工作而闻名,其研究涵盖了从游戏到医疗保健等多个领域。DeepMind 的目标是通过构建智能系统来解决复杂的问题,推动科学和医学的进步。
通过生成式AI激活人类潜能
Stability AI是一个专注于生成式人工智能技术的公司,提供多种AI模型,包括文本到图像、视频、音频、3D和语言模型。这些模型能够处理复杂提示,生成逼真的图像和视频,以及高质量的音乐和音效。公司提供灵活的许可选项,包括自托管许可和平台API,以满足不同用户的需求。Stability AI致力于通过开放模型,为全球每个人提供高质量的AI服务。
可控视频和图像生成技术
ControlNeXt是一个开源的图像和视频生成模型,它通过减少高达90%的可训练参数,实现了更快的收敛速度和卓越的效率。该项目支持多种控制信息形式,并且可以与LoRA技术结合使用,以改变风格并确保更稳定的生成效果。
一种新的文本条件高分辨率生成模型
Phased Consistency Model(PCM)是一种新型的生成模型,旨在解决Latent Consistency Model(LCM)在文本条件高分辨率生成中的局限性。PCM通过创新的策略在训练和推理阶段提高了生成质量,并通过广泛的实验验证了其在不同步骤(1步、2步、4步、8步、16步)下与Stable Diffusion和Stable Diffusion XL基础模型的结合效果。
10秒搞定电商出图设计
美间AI创意商拍是一个专注于电商领域的在线设计平台,它通过人工智能技术,帮助用户快速生成电商所需的各种设计图,如主图、头图等。该平台的核心优势在于其高效的设计生成速度和丰富的模板资源,能够满足不同品类商品的设计需求,从而提升电商运营的效率和效果。
AI图像、视频和广告生成器
Darwin Studio是一款AI图像、视频和广告生成器,通过使用AI技术和算法,帮助用户快速生成高质量的图像、视频和广告。它具有高效、智能、创新的特点,可以大大提升创意工作效率。
StoryDiffusion 能够通过生成一致的图像和视频来创造魔法故事。
StoryDiffusion 是一个开源的图像和视频生成模型,它通过一致自注意力机制和运动预测器,能够生成连贯的长序列图像和视频。这个模型的主要优点在于它能够生成具有角色一致性的图像,并且可以扩展到视频生成,为用户提供了一个创造长视频的新方法。该模型对AI驱动的图像和视频生成领域有积极的影响,并且鼓励用户负责任地使用该工具。
智能工具,激发创意无限
DeepAI是一个提供多种人工智能工具的网站,包括AI视频生成器、AI图像生成器、AI图像编辑器和AI角色聊天等。用户可以利用这些工具将静态图片和文本提示转换成简短的视频动画,或者通过输入提示来生成图像。DeepAI的AI图像编辑器允许用户快速编辑图片,而AI角色聊天则可以与各种角色进行互动。此外,还有去除背景和给黑白照片上色的功能。DeepAI提供PRO会员服务,享受无广告体验、私有图片存储和API访问等特权。
AI学习平台
Generative AI Courses是一家提供AI学习课程的在线平台。通过课程学习,用户可以掌握GenAI、AI、机器学习、深度学习、chatGPT、DALLE、图像生成、视频生成、文本生成等技术,并了解2024年AI领域的最新发展。
一站式AI助手,为您提供生成文本、图像、代码、视频、音频等的解决方案
Ultimate AI Assistant是一款综合AI助手,可帮助您简化任务,提高工作效率。它提供了生成文本、图像、代码、视频、音频等多种功能,具有高度定制化的AI解决方案。无论您是需要生成创意文案、设计图像、编写代码、制作视频还是创作音乐,Ultimate AI Assistant都能满足您的需求。该产品定价根据功能和使用量而定,详情请访问官方网站。
AI图像、视频、音乐生成工具
ApolloAI是一款人工智能平台,提供AI图像、视频、音乐、语音合成等功能。用户可以通过文本或图片输入生成多种类型的内容,具备商业使用权。定价灵活,提供订阅和一次性购买两种模式。
用于视觉合成的统一3D Transformer流水线
NUWA是由微软开发的一系列研究项目,包括NUWA、NUWA-Infinity、NUWA-LIP、Learning 3D Photography Videos和NUWA-XL。这些项目涉及视觉合成的预训练模型,能够生成或操纵视觉数据,如图像和视频,以执行多种视觉合成任务。
使用Latent Transparency的透明图像层扩散工具
sd-forge-layerdiffuse是一个用于生成透明图像和图层的工作在进行中的扩展,它利用了潜在透明度技术。该工具目前支持图像生成和基本图层功能,但透明图像到图像的转换尚未完成。代码库高度动态,未来一个月可能会有大量变化。
一种可控的图像到视频生成框架
Motion-I2V是一种全新的框架,用于实现一致且可控的图像到视频生成(I2V)。与以往直接学习复杂图像到视频映射的方法不同,Motion-I2V将I2V分解为两个阶段,并采用显式运动建模。在第一阶段,我们提出了基于扩散的运动场预测器,专注于推断参考图像像素的轨迹。在第二阶段,我们提出了增强的运动增强时间注意力,以增强视频潜在扩散模型中有限的一维时间注意力。该模块可以在第一阶段预测的轨迹的指导下,有效地将参考图像特征传播到合成帧。与现有方法相比,Motion-I2V即使在存在大运动和视角变化的情况下,也能生成更一致的视频。通过为第一阶段训练稀疏轨迹控制网络,Motion-I2V可以支持用户精确控制运动轨迹和运动区域,具有稀疏轨迹和区域注释的控制能力。这比仅依赖文本说明更可控。此外,Motion-I2V的第二阶段自然地支持零样本视频到视频转换。定性和定量比较表明,Motion-I2V在一致且可控的图像到视频生成方面优于先前的方法。
iPad实时AI绘图应用,快速、安全、创新
Drawww app是一款专为iPad设计的实时AI绘图应用,提供快速、安全且创新的绘图体验。应用通过AI技术加速绘图过程,支持离线使用,确保数据隐私安全。功能包括无限图层、精密工具(如画笔、铅笔、橡皮擦等),以及可定制的大小和透明度。Drawww还引入了新一代的AI就绪文件格式.drawww,支持快速打开和跨设备无缝分享。
AI云平台,为Comfy UI提供强大支持
Drip Art AI是一个基于云的强大的Comfy UI后端,为开发者和专业用户提供最新的生成AI技术来生成令人惊叹的图像和视频。只需将您的工作流程和模型拖放到Drip中,我们将解决其他所有问题。
一键生成高质量的跳舞视频
DreaMoving是一个基于扩散模型的可控制视频生成框架,用于生成高质量的定制人类舞蹈视频。通过给定目标身份和姿势序列,DreaMoving可以生成一个目标身份的视频,驱动姿势序列在任何地方跳舞。为此,我们提出了一个视频控制网络来进行运动控制,以及一个内容导引器来保留身份信息。该模型易于使用,并可适应大多数风格化扩散模型以生成多样化的结果。
人工智能视频生成APP,支持上传单张图片生成说话视频
D-ID APP利用人工智能技术,可以通过上传单张图片生成说话的视频。支持上传自己的语音,对上传图片中的人物进行 Lip Sync。视频效果逼真,提供了三种版本:Lite 免费版本,Pro 每月$29,Advanced 每月$195.99。APP 在图像处理和视频生成方面做得很出色。
用 AI 创造专业品质的商品图
灵动 AI 是超级好用的在线设计工具,商家或者设计小白都能轻松上手快速出图。提供海量精美模板和素材,适用于美妆、快消、3C、家电、家装等产品品类。可以输出电商主图、电商海报、商品视频等营销物料,拥有横版、竖版和方形尺寸,适配各种用途。
用文字创建、定制、吸引,Snowpixel 让您轻松生成美丽的图片、视频、音乐等作品。
Snowpixel 是一个能够通过文字生成美丽图片、视频、音乐等作品的平台。用户可以使用自己的数据训练定制模型,为作品增添个性化的风格。Snowpixel 提供了视频生成、音乐生成、图片生成、音频生成、3D 对象生成和像素艺术模型等功能。用户可以在不同的场景下使用 Snowpixel,比如创作个性化作品、定制模型、生成音乐、生成视频等。Snowpixel 的定价灵活,用户可以按需选择付费。
阿里国际AI团队打造 电商做图神器
Pic Copilot是一个利用图像生成模型为电商提供的AI驱动图片优化工具。它能够通过对大量图片点击量数据的训练,有效提高图片的点击转化率,从而优化电商的营销效果。其关键优势是提高图片的点击转化率,从而提升电商营销效果。它是阿里巴巴团队训练的数据结果,能够显著优化图片的点击转化表现。
盖蒂图片代理商经过严格筛选,提供安全合法的图片生成工具
盖蒂图片与英伟达合作,利用人工智能技术,为用户提供安全、合法、免责的图片生成服务。系统通过专业训练,生成高质量、商用许可的创意视觉内容,帮助用户提升创造力,节省时间和资金。
PixWeaver是一款AI辅助创作平台
PixWeaver是一个基于人工智能的图像创作平台。它能帮助用户无需学习复杂的设计软件,通过语音或文字描述就可以生成理想中的图像。用户只需输入几句话语言描述,PixWeaver的强大AI模型就可以自动生成高质量图片。平台还提供了图片处理、修图等后期处理功能。PixWeaver使创作变得简单有趣,用户可以随心所欲地发挥无限创意,实现图像创作的完全解放。
DALL·E 3可以将文本准确转换为图像
DALL·E 3代表了我们在生成完全遵循您提供的文本的图像方面的能力飞跃。DALL·E 3直接内置在ChatGPT中,这样就可以将ChatGPT用作头脑风暴伙伴和提示细化器。只需向ChatGPT询问您希望在任何从简单的句子到详细的段落中看到的内容。当提示一个想法时,ChatGPT将自动为DALL·E 3生成定制的、详细的提示来将您的想法变为现实。如果您喜欢特定的图像但它不太对,您可以要求ChatGPT用几句话进行调整。DALL·E 3将于10月初对ChatGPT Plus和企业客户可用。
AI人像生成插件,结合控制网络,可生成逼真的个性人像
EasyPhoto是一个Stable Diffusion的可视化界面插件,可用于训练出与用户有关的数字双胞胎。训练时建议使用5到20张半身照图像,最好不要戴眼镜。训练完成后,可在推理模块中生成图片。我们支持使用预设的模板图像或上传自己的图像进行推理。我们目前支持多人同时生成。我们的生成效果逼真,可用于各类商业和个人应用。
© 2024 AIbase 备案号:闽ICP备08105208号-14