统一的多模态AI,支持基于指令的图像编辑与生成,超越商业模型。
DreamOmni2是一个统一的开源多模态基于指令的图像编辑和生成模型。它建立在Flux Kontext和Qwen2.5 VL之上,支持文本和图像指令,能处理抽象属性和具体对象。该模型在基准测试中优于商业模型,具有出色的身份一致性和编辑精度。其开源特性使得模型权重、训练代码和数据集都可在GitHub和Hugging Face上免费获取,价格从4.90美元至960.00美元不等,适合用于研究和商业应用。
Claude Skills Hub是第三方Claude技能市场,收集整理各类优质技能。
Claude Skills Hub是一个第三方Claude技能市场,它收集并整理来自官方Anthropic仓库、社区贡献平台等多渠道的Claude技能。这些技能是模块化扩展,能增强Claude的能力,涵盖从文档处理到创意设计等多种特定任务。其重要性在于为用户提供了一个集中、便捷的平台来发现和使用各类扩展Claude功能的技能。主要优点包括:收集了来自不同渠道的高质量技能,方便用户浏览和发现新功能;技能安装简单,多数可通过Claude Code或Claude ai安装;大部分技能是开源免费的。该平台定位为用户提供一个综合性的Claude技能获取平台,方便各种需求的用户扩展Claude的功能。价格方面,大多数技能是开源免费的,官方Anthropic的技能使用Apache 2.0或专有许可证,社区贡献的技能可能有不同的许可证,需在生产环境使用前检查许可证信息。
最便宜的 ChatGPT 实现,售价仅 $100。
nanochat 是一个全栈实现的类似 ChatGPT 的大型语言模型,旨在以低成本为用户提供可定制的聊天体验。该项目旨在运行在单个 8XH100 节点上,支持从头到尾的训练和推理,且总成本仅需约 $100。它不仅便于部署,而且旨在降低人工智能模型的复杂性,使之易于使用和理解。
专业开发者 AI 编程助手,提升编程效率。
DeepV Code 是一个为开发者设计的 AI 编程助手,集成 Claude 智能,旨在提高编程效率。支持代码分析、版本回滚和多设备同步,适合各种规模的开发项目。基础版仅需 $9.9,专业版 $599,满足不同用户的需求。
Kat Dev是专为软件工程和编码任务打造的大语言模型,助力AI编码。
Kat Dev是快手Kwaipilot团队开发的AI代码智能解决方案,是专注于软件工程和编码任务的大语言模型家族。其重要性在于为开发者提供强大的代码生成、优化等能力,提升开发效率。主要优点包括高性能,如KAT Dev 72B Exp在SWE Bench基准测试中达到74.6分排名第一;采用先进的多阶段代理训练;支持多语言代码;模型开源,采用Apache 2.0许可证,方便社区使用和研究,开发者可免费访问。该产品定位为服务现代开发者和团队,推动AI驱动的软件开发。
Sora 2 视频去水印工具,免费使用。
Sora 2 视频去水印工具是一个开源项目,旨在为用户提供高效去除视频水印的解决方案。它使用了先进的算法,能够在保留视频质量的情况下,去除不需要的水印。该工具免费提供,适合各种视频编辑需求,尤其是希望去除版权水印的用户。
开源免费的 Wispr Flow 替代方案,为中文用户打造的桌面端语音输入与文本处理工具。
蛐蛐 (QuQu) 是一款开源免费的桌面端语音输入与文本处理工具,专为中文用户设计。它提供了隐私保护和本地处理功能,与 Wispr Flow 相比,无需支付订阅费用。通过集成 FunASR 本地模型,蛐蛐 能够精准识别中文,优化语音输入体验,适合开发者和普通用户使用。
使用Wan AI技术和Wan 2.2动画模型,将静态图像无缝转化为动态视频。
Wan Animate AI是一款一体化的AI视频生成器,运用Wan 2.2动画模型,可将静态图像转化为动态视频。其重要性在于为视频创作提供了高效、专业的解决方案。主要优点包括采用先进的动画AI技术,实现高精度的面部表情捕捉、精准的动作迁移、环境光照融合等,能生成高分辨率视频,且支持开源。产品背景方面,其致力于满足娱乐、营销和教育等多领域的商业视频应用需求。价格方面,提供试用包(7.9美元,500积分)和基础包(21.9美元,1500积分)等不同套餐。产品定位为专业的AI视频生成工具,适用于有视频创作需求的个人和企业。
一款专注于 AI 翻译的工具,支持多种文本格式的翻译。
AiNiee 是一款高效的 AI 翻译工具,专为游戏、书籍、字幕和文档等复杂长文本设计。它提供了一键自动翻译功能,支持多种格式,并能通过轻松的界面配置不同的翻译接口。该工具旨在节省时间和精力,让用户在短时间内获取高质量的译文。AiNiee 的市场定位是为开发者、翻译者和需要翻译长文本的用户提供一个快速、便捷的解决方案。该工具基于开源协议,使用上具有一定的灵活性与可扩展性。
通过ChatIn的AI多代理系统,转变您的客户支持体验。
ChatIn是一款AI客服解决方案,通过智能对话转变客户支持体验。它能自动化回复、降低支持成本,并为客户提供全天候的支持。ChatIn可处理常见问题,提供24/7的帮助,让您专注于业务增长。
Compozy是一个下一代的智能编排平台,用于协调多智能代理系统。
Compozy是一个企业级平台,使用声明性YAML提供可扩展、可靠且成本高效的分布式工作流,简化复杂的扇出、调试和监控,以实现生产就绪的自动化。
What to Build是一个AI驱动的项目想法生成工具,可帮助您发现并分析相关的开源项目。
What to Build是一个强大的工具,可以帮助开发者在GitHub上找到项目灵感、查看类似的代码库,并提供构建计划。它利用人工智能技术,将创意想法转化为结构化的GitHub存储库,并为开发人员解锁开发潜力。
MemU是一款AI记忆的智能层,为LLM应用设计,提供更高的准确性、更快的检索速度和更低的成本。
MemU是一款为AI伴侣设计的智能记忆层,提供更高的准确性、更快的检索速度和更低的成本。它是一个开源的AI记忆框架,适用于机器学习、神经网络、对话AI、聊天机器人记忆、AI代理和自主记忆。
开放AI的GPT-OSS-120B和GPT-OSS-20B提供强大的推理能力,开发人员友好的功能,并采用Apache 2.0许可证,实现人工智能的民主化访问。
GPT OSS是OpenAI推出的开源语言模型,具有强大的推理能力和Apache 2.0许可。该模型具有高效性、安全性、API兼容性等特点,是未来开源语言模型的先驱。
一款支持中英文的对话语音合成模型。
MOSS-TTSD 是一个开源的双语对话合成模型,支持自然、富有表现力的语音生成。它能将对话脚本转换为高质量的语音,适用于播客制作和 AI 对话应用。该模型的特点包括零 - shot 语音克隆和长时间语音生成,具有高度的表达力和真实感。MOSS-TTSD 的训练基础包括大规模的语言数据和语音数据,确保了生成语音的自然性与准确性。该技术适合商业化使用,并且完全开源。
将您的语音立即转换为文本。完全私密,开源,由AI技术驱动。
OpenWispr是一款由AI技术驱动的语音转文本工具,注重隐私保护,完全开源。其主要优点在于处理速度快、隐私保护严格,适用于写作、编程等领域。
Eigent 是首个多代理工作团队,助力提高生产力。
Eigent 是世界上第一个多代理工作团队桌面应用程序,旨在通过并行执行、自定义和隐私保护,帮助用户高效管理复杂工作流。该产品以 CAMEL-AI 的开源项目为基础,支持本地部署与企业级特性,适合对数据隐私和定制化有高要求的用户,提供了全面的功能与支持,使用灵活且易于上手。
© 2025 AIbase 备案号:闽ICP备08105208号-14