Fogsight 是一款由大型语言模型驱动的动画引擎。
Fogsight 是一款创新的动画引擎,利用大型语言模型生成生动的动画。它不仅支持多种语言,还能根据用户的输入生成高水平的叙事动画,适用于教育、娱乐和创意领域。Fogsight 注重用户体验,允许通过简单的界面与 AI 进行交互,快速生成所需的动画内容。
专注于 GPU 算力云服务,提供高效算力解决方案。
蓝耘元生代 AIDC OS 是一款专注于 GPU 算力云服务的产品,旨在为企业和开发者提供强大的计算能力和灵活的资源配置。该产品支持多种 GPU 型号,按需计费,适用于深度学习、图形渲染等领域。其主要优点在于高性能的计算资源、可扩展的存储解决方案以及合规的云服务环境,满足不同规模企业的需求。价格为每小时 1.50 元到 1.60 元不等,依据所选 GPU 型号而定。
基于扩散变换器的多角色肖像动画生成框架。
FantasyPortrait 是一种高保真、多情感的肖像动画生成框架,使用表达增强学习策略来捕捉细腻的面部动态,适合单角色和多角色场景。该技术的优势在于其独特的掩蔽交叉注意机制,有效防止了特征干扰,提升了动画的质量与表现力。该产品背景源于对现有面部动画方法的不足的反思,尤其是在处理多角色互动时的挑战。未来将以开源形式提供代码与模型,鼓励研究与开发。
您的本地超级智能体,构建自主思考的 AI 助手,兼顾隐私与效率。
ARGO 是一个多平台 AI 客户端,旨在为用户提供强大的人工智能助手,具备自主思考、任务规划和复杂任务处理的能力。其主要优势在于在用户设备上本地运行,确保数据隐私与安全。适合需要高效管理和处理任务的用户群体,支持多种操作系统。永久开源免费。
上下文驱动的图像生成工具,保持前景保真度。
ZenCtrl 是一个综合工具包,旨在解决图像生成中的核心挑战。无需微调,可从单个主体图像生成多视角、高分辨率的图像。它能够控制形状、姿势、相机角度和上下文,非常适合进行产品摄影、时尚试穿等场景。该工具包还将发布 API,便于集成与使用。
高效的音频驱动 Avatar 视频生成与自适应身体动画。
OmniAvatar 是一种先进的音频驱动视频生成模型,能够生成高质量的虚拟形象动画。其重要性在于结合了音频和视觉内容,实现高效的身体动画,适用于各种应用场景。该技术利用深度学习算法,实现高保真的动画生成,支持多种输入形式,定位于影视、游戏和社交领域。该模型是开源的,促进了技术的共享与应用。
提供AI边缘处理器,专为实现高性能深度学习应用而设计。
Hailo AI on the Edge Processors提供AI加速器和视觉处理器,支持边缘设备解决方案,旨在实现新时代的AI边缘处理和视频增强。产品定位于提供高性能深度学习应用,同时支持感知和视频增强。
将静态图像转换为令人惊叹的AI视频生成器。
Midjourney Video是一款革命性的AI视频生成器,利用先进的图像到视频技术,将静态图像转换为令人惊叹的视频。其主要优点在于成本低廉、灵活的动作设置、通用图像支持、专业视频输出等。
AI 驱动的智能搜索工具,助您深入研究。
Firesearch 是一款利用先进的人工智能技术,帮助用户进行深度研究的搜索工具。它结合了 Firecrawl 和 LangGraph 的强大能力,可以提供更为精准和高效的搜索体验,特别适合需要大量信息和数据分析的用户。该工具以其高效的智能搜索引擎、简洁的界面和强大的数据处理能力,帮助用户更快地找到所需的信息。
将简单输入转化为多模态内容 - 文档、幻灯片、表格和深度研究、播客及网页。
Skywork是一款先驱的AI办公智能体,可以将简单的输入转化为多模态内容,包括文档、幻灯片、表格、深度研究、播客和网页。它通过深度研究和多种工具提供高效的办公体验。
BAGEL是一款开源的统一多模态模型,您可以在任何地方进行微调、精简和部署。
BAGEL是一款可扩展的统一多模态模型,它正在革新AI与复杂系统的交互方式。该模型具有对话推理、图像生成、编辑、风格转移、导航、构图、思考等功能,通过深度学习视频和网络数据进行预训练,为生成高保真度、逼真图像提供了基础。
先进的视频生成模型,具备更高的真实性和创造力。
Veo 3 是最新的视频生成模型,旨在通过更高的现实主义和音频效果,提供 4K 输出,能更准确地遵循用户的提示。这一技术代表了视频生成领域的重大进步,具有更强的创造控制能力。Veo 3 的推出是对 Veo 2 的一次重要升级,旨在帮助创作者实现他们的创意愿景。该产品适合需要高质量视频生成的创意行业,从广告到游戏开发等多个领域。无具体价格信息披露。
此应用可根据文本描述生成图像,或提供现有图像的描述和答案。
Blip 3o 是一个基于 Hugging Face 平台的应用程序,利用先进的生成模型从文本生成图像,或对现有图像进行分析和回答。该产品为用户提供了强大的图像生成和理解能力,非常适合设计师、艺术家和开发者。此技术的主要优点是其高效的图像生成速度和优质的生成效果,同时还支持多种输入形式,增强了用户体验。该产品是免费的,定位于开放给广大用户使用。
B站开源的SOTA动画视频生成模型,支持多种二次元风格视频一键生成。
Index-AniSora是由B站开源的顶尖动画视频生成模型,基于AniSora技术实现,支持多种二次元风格视频镜头的一键生成,如番剧、国创、漫改动画、VTuber、动画PV和鬼畜动画等。该模型通过强化学习技术框架全面提升动画内容的生产效率与质量,其技术原理已被IJCAI2025接收。Index-AniSora的开源为动画视频生成领域带来了新的技术突破,为开发者和创作者提供了强大的工具,推动二次元内容创作的进一步发展。
一个简单的代理框架,支持浏览器使用、深度研究等功能。
Minion Agent 是一个简单而强大的代理框架,能够与浏览器交互,支持深度研究、自动规划等功能,适用于需要进行复杂任务和研究的用户。它提供了一种灵活的工具集,使开发者能够轻松集成不同的模型和工具。该框架不仅提高了工作的效率,还为用户提供了便捷的使用体验,适合各类科研和商业应用。该产品是开源的,用户可以自由使用和修改。
DICE-Talk 是一种基于扩散的情感谈话肖像生成方法。
DICE-Talk 是一个先进的情感谈话肖像生成技术,能够生成生动多样的情感表达。这项技术使用扩散模型来解耦身份和情感,提供真实感和多样性的输出。其重要性在于为虚拟角色、动画、游戏和社交媒体等领域带来了更高的交互性和表现力,适合研究和开发的需要。
一款轻量级的多模态语言模型安卓应用。
MNN-LLM 是一款高效的推理框架,旨在优化和加速大语言模型在移动设备和本地 PC 上的部署。它通过模型量化、混合存储和硬件特定优化,解决高内存消耗和计算成本的问题。MNN-LLM 在 CPU 基准测试中表现卓越,速度显著提升,适合需要隐私保护和高效推理的用户。
DreamO 是一个统一的图像定制框架。
DreamO 是一种先进的图像定制模型,旨在提高图像生成的保真度和灵活性。该框架结合了 VAE 特征编码,适用于各种输入,特别是在角色身份的保留方面表现出色。支持消费级 GPU,具有 8 位量化和 CPU 卸载功能,适应不同硬件环境。该模型的不断更新使其在解决过度饱和和面部塑料感问题上取得了一定进展,旨在为用户提供更优质的图像生成体验。
© 2025 AIbase 备案号:闽ICP备08105208号-14