一款支持中英文的对话语音合成模型。
MOSS-TTSD 是一个开源的双语对话合成模型,支持自然、富有表现力的语音生成。它能将对话脚本转换为高质量的语音,适用于播客制作和 AI 对话应用。该模型的特点包括零 - shot 语音克隆和长时间语音生成,具有高度的表达力和真实感。MOSS-TTSD 的训练基础包括大规模的语言数据和语音数据,确保了生成语音的自然性与准确性。该技术适合商业化使用,并且完全开源。
将您的语音立即转换为文本。完全私密,开源,由AI技术驱动。
OpenWispr是一款由AI技术驱动的语音转文本工具,注重隐私保护,完全开源。其主要优点在于处理速度快、隐私保护严格,适用于写作、编程等领域。
Eigent 是首个多代理工作团队,助力提高生产力。
Eigent 是世界上第一个多代理工作团队桌面应用程序,旨在通过并行执行、自定义和隐私保护,帮助用户高效管理复杂工作流。该产品以 CAMEL-AI 的开源项目为基础,支持本地部署与企业级特性,适合对数据隐私和定制化有高要求的用户,提供了全面的功能与支持,使用灵活且易于上手。
跨平台桌面应用,轻松设置 Open WebUI。
Open WebUI Desktop 是一款跨平台的桌面应用,旨在简化 Open WebUI 的安装和使用。该应用程序允许用户将其设备转变为一个强大的服务器,免去复杂的手动设置。此项目当前处于 alpha 阶段,仍在积极开发中,提供一键安装和离线使用的能力,是寻求高效和便捷的开发者和用户的理想选择。
一个兼容多种大语言模型的开源 AI Agent CLI 工具。
Daili Code 是一个开源的命令行 AI 工具,兼容多种大语言模型,能够连接到您的工具、理解代码并加速工作流程。它支持多种 LLM 提供商,提供强大的自动化和多模态能力,适合开发者和技术人员使用。
开源的 MidJourney 界面克隆,提供 AI 图像和视频生成。
Openjourney 是一个高保真的开源项目,旨在模拟 MidJourney 的界面,利用 Google 的 Gemini SDK 进行 AI 图像和视频生成。该项目支持使用 Imagen 4 生成高质量图像,以及使用 Veo 2 和 Veo 3 进行文本到视频和图像到视频的转换。它适合需要进行图像生成和视频制作的开发者和创作者,提供了用户友好的界面和实时生成体验,能够助力创意工作与项目开发。
AI DevOps代理,帮助您在终端中安全、部署和维护生产就绪基础设施。
Stakpak是一个开源的AI DevOps代理,可帮助您快速识别根本原因、优化云成本、加强IAM安全性、自动容器化应用程序,提供强大的生产就绪基础设施。它设计用于简化操作和开发工作流程,支持CI/CD流水线和云环境,并提供高安全性和智能化的自适应推荐。
您的本地超级智能体,构建自主思考的 AI 助手,兼顾隐私与效率。
ARGO 是一个多平台 AI 客户端,旨在为用户提供强大的人工智能助手,具备自主思考、任务规划和复杂任务处理的能力。其主要优势在于在用户设备上本地运行,确保数据隐私与安全。适合需要高效管理和处理任务的用户群体,支持多种操作系统。永久开源免费。
一个简单但强大的在线视频编辑器,适用于任何平台。
OpenCut 是一款开源在线视频编辑器,专注于简洁和强大功能,能够在任何平台上流畅运行。其目标是为用户提供一个易于使用且功能齐全的视频编辑工具,适合视频创作者、内容制作者和教育工作者。作为一款免费工具,OpenCut 使用户能够高效地完成视频编辑工作。
一个用于探索和分享开源项目的平台。
Zread 是一个开源项目探索平台,用户可以在此平台上发现、分享和管理各种开源仓库,帮助开发者和爱好者更好地了解和利用开源资源。它支持多种语言和技术栈,适合各种技术背景的用户使用。
开源的端到端产品级通用智能体
JoyAgent-JDGenie 是一个通用的多智能体框架,能够快速构建智能体产品,用户只需输入任务或查询,即可获得直接的解决方案。该产品强调高完成度和轻量化设计,具有较强的通用性,并在 GAIA 榜单上表现出色,适合于需要快速响应和高效执行的企业或开发者。该产品免费开源,定位于提供便捷的智能体开发解决方案。
上下文驱动的图像生成工具,保持前景保真度。
ZenCtrl 是一个综合工具包,旨在解决图像生成中的核心挑战。无需微调,可从单个主体图像生成多视角、高分辨率的图像。它能够控制形状、姿势、相机角度和上下文,非常适合进行产品摄影、时尚试穿等场景。该工具包还将发布 API,便于集成与使用。
高性能火车票查询后端系统,支持官方实时数据服务。
12306 MCP Server 是一个基于 Model Context Protocol (MCP) 的高性能火车票查询后端系统,提供实时余票查询、车站信息和换乘方案等功能,适合与 AI / 自动化助手集成。该系统的主要优点在于其快速响应和易于集成,支持的标准化接口使其成为一个强大的数据聚合工具,适用于需要高效查询火车票的场景。该产品免费开源,适合开发者和企业使用。
GEO 驱动的 SaaS 启动器,内置品牌监控、身份验证和计费功能。
FireGEO 是一个开源的 SaaS 启动器,旨在快速构建具有身份验证、计费、AI 聊天和品牌监控功能的应用。它基于 Next.js 15、TypeScript 和 PostgreSQL,适合需要快速部署 SaaS 服务的开发者。该产品强调零配置设置和自动化安装过程,帮助开发者节省时间和精力。产品可通过 GitHub 获取,适合个人开发者及初创公司使用,具有很高的灵活性和扩展性。
强大的开源Kimi K2聊天平台,通过Kimi AI在编程和数学基准测试中超越GPT-4。企业级Kimi AI,成本降低95%。
Kimi K2 AI是一款功能强大的开源聊天平台,具有自主AI代理。它在编程和数学基准测试中优于GPT-4,提供企业级AI解决方案,成本降低95%。Kimi K2 AI致力于提供高效、智能的聊天体验,可广泛应用于各种场景。
Gitcord是一个为开发者提供连接和分享代码的平台。
Gitcord是一个专注于开发者社区的平台,致力于提供一个互相连接和分享代码的环境。其主要优点包括用户友好的界面、快速的代码交流和大量优质的开源资源。Gitcord定位于帮助开发者更好地互动和合作,提升编程效率。
高效的音频驱动 Avatar 视频生成与自适应身体动画。
OmniAvatar 是一种先进的音频驱动视频生成模型,能够生成高质量的虚拟形象动画。其重要性在于结合了音频和视觉内容,实现高效的身体动画,适用于各种应用场景。该技术利用深度学习算法,实现高保真的动画生成,支持多种输入形式,定位于影视、游戏和社交领域。该模型是开源的,促进了技术的共享与应用。
© 2025 AIbase 备案号:闽ICP备08105208号-14