一个简单的代理框架,支持浏览器使用、深度研究等功能。
Minion Agent 是一个简单而强大的代理框架,能够与浏览器交互,支持深度研究、自动规划等功能,适用于需要进行复杂任务和研究的用户。它提供了一种灵活的工具集,使开发者能够轻松集成不同的模型和工具。该框架不仅提高了工作的效率,还为用户提供了便捷的使用体验,适合各类科研和商业应用。该产品是开源的,用户可以自由使用和修改。
轻松将现有代理框架中的工具、代理和调度器转换为 MCP 服务器。
automcp 是一个开源工具,旨在简化将各种现有代理框架(如 CrewAI、LangGraph 等)转换为 MCP 服务器的过程。这使得开发者可以通过标准化接口更容易地访问这些服务器。该工具支持多种代理框架的部署,并且通过易于使用的 CLI 界面进行操作。适合需要快速集成和部署 AI 代理的开发者,价格免费,适合个人和团队使用。
基于仓颉编程语言构建的 LLM Agent 开发框架。
CangjieMagic 是一个基于仓颉编程语言构建的 LLM Agent 开发框架,支持多种功能,包括任务智能规划和模块化调用。该框架旨在提升应用程序的智能和创造力,适合开发者使用。
主流对话式 Voice Agent开源框架,让 AI 能听能说
TEN Agent 是基于 TEN 框架构建的实时对话 AI引擎,为开发者提供快速、高效的工具来构建实时对话式 AI Agent,如AI虚拟客服、AI 口语陪练、AI 情感陪伴、AI 个人助理等。 TEN Agent 目前已集成 DeepSeek、Gemini 2.0、OpenAI Realtime、Qwen、RTC 等多种模型及组件,同时适配 Dify、Coze 主流编排工具,并且支持 ESP 32,快速让你的 AI bot 能听能说。
Atom of Thoughts (AoT) 是一种用于提升大语言模型推理性能的框架。
Atom of Thoughts (AoT) 是一种新型推理框架,通过将解决方案表示为原子问题的组合,将推理过程转化为马尔可夫过程。该框架通过分解和收缩机制,显著提升了大语言模型在推理任务上的性能,同时减少了计算资源的浪费。AoT 不仅可以作为独立的推理方法,还可以作为现有测试时扩展方法的插件,灵活结合不同方法的优势。该框架开源且基于 Python 实现,适合研究人员和开发者在自然语言处理和大语言模型领域进行实验和应用。
Manus 是一款由 Monica.im 研发的全球首款 AI Agent 产品,能够自主解决复杂任务。
Manus 是由 Monica.im 研发的全球首款真正自主的 AI 代理产品,能够直接交付完整的任务成果,而不仅仅是提供建议或答案。它采用 Multiple Agent 架构,运行在独立虚拟机中,能够通过编写和执行代码、浏览网页、操作应用等方式直接完成任务。Manus 在 GAIA 基准测试中取得了 SOTA 表现,展现了强大的任务执行能力。其目标是成为用户在数字世界的‘代理人’,帮助用户高效完成各种复杂任务。
为AI驱动的应用程序提供细粒度权限管理,确保安全性和合规性。
Permit.io AI Access Control 是一款专注于AI应用安全与权限管理的解决方案。它通过细粒度的权限控制,确保AI交互的每个阶段(从输入到输出)都符合安全策略,防止未经授权的输入、数据泄露和有害输出。该产品采用框架无关的技术,支持多种AI框架,并提供灵活的集成方式,可逐步扩展到任何AI技术栈中。Permit.io 的定位是为企业提供AI驱动应用的安全保障,帮助企业在享受AI带来的便利的同时,满足合规性要求。
QwQ-Max-Preview 是 Qwen 系列的最新成果,基于 Qwen2.5-Max 构建,具备强大的推理和多领域应用能力。
QwQ-Max-Preview 是 Qwen 系列的最新成果,基于 Qwen2.5-Max 构建。它在数学、编程以及通用任务中展现了更强的能力,同时在与 Agent 相关的工作流中也有不错的表现。作为即将发布的 QwQ-Max 的预览版,这个版本还在持续优化中。其主要优点包括深度推理、数学、编程和 Agent 任务的强大能力。未来计划以 Apache 2.0 许可协议开源发布 QwQ-Max 以及 Qwen2.5-Max,旨在推动跨领域应用的创新。
使用We0,可快速生成并部署基于Vue、React、Next.js、Python、Java等框架的AI应用。
We0是一款强大的桌面客户端工具,专注于帮助开发者快速生成和部署AI驱动的应用程序。它支持多种现代开发框架,如Vue、React、Next.js、Python、Java以及微信小程序。通过We0,开发者可以显著提高开发效率,减少从概念到部署的时间。该工具的主要优点是其强大的代码生成能力和对多种框架的支持,使其成为全栈开发者的理想选择。目前,We0提供Windows和Mac版本的下载,具体价格和定位尚未明确,但从其功能来看,它主要面向专业开发者和企业用户。
GitHub Copilot Agent模式是GitHub Copilot的最新功能,支持自动迭代代码、修复错误和执行任务。
GitHub Copilot Agent模式是GitHub Copilot的一项重大升级,它通过引入自主智能体(Agent)技术,使开发者能够更高效地完成复杂的编程任务。Agent模式能够自动迭代代码、识别并修复错误,甚至可以推断出完成任务所需的额外步骤。其主要优点包括减少重复性工作、提高代码质量以及增强开发效率。Agent模式支持多种语言模型,如Google的Gemini 2.0 Flash,并通过安全沙箱技术确保代码的安全性。它适用于需要快速开发和优化代码的开发者,尤其是那些处理复杂项目的团队。
rene.css 是一个为干净轻量界面设计的系统,也是首个 AI 就绪的 CSS 框架。
rene.css 是一个专注于简洁、轻量级界面设计的系统,同时也是首个为 AI 设计到代码工作流准备好的 CSS 框架。它为设计师、开发者和 AI 工具提供了一个理想的共同基础,支持实用主义的类和内联样式,提供可定制的结构和现成的元素。其主要优点是简洁性、易用性和对 AI 的支持,适合快速开发和设计流程。
开源的深度研究工具,旨在通过开源框架复现类似Deep Research的功能
Open-source DeepResearch 是一个开源项目,旨在通过开源的框架和工具复现类似 OpenAI Deep Research 的功能。该项目基于 Hugging Face 平台,利用开源的大型语言模型(LLM)和代理框架,通过代码代理和工具调用实现复杂的多步推理和信息检索。其主要优点是开源、可定制性强,并且能够利用社区的力量不断改进。该项目的目标是让每个人都能在本地运行类似 DeepResearch 的智能代理,使用自己喜爱的模型,并且完全本地化和定制化。
加速数字团队的AI驱动设计转代码、可视化编辑和企业级CMS的视觉开发平台。
Builder.io 是一个强大的视觉开发平台,通过AI技术将设计快速转化为代码,提供可视化编辑和企业级CMS功能。其主要优点包括高效的设计到代码转换、灵活的可视化编辑能力以及强大的内容管理功能。该平台适用于需要快速开发和迭代数字产品的团队,无论是营销网站、落地页还是多品牌管理,都能提供强大的支持。其定价灵活,有免费试用选项,适合不同规模的企业使用。
一个为开发者提供的生产级智能代理框架,可使用自然语言构建生产级代理工作流。
Eko 是一个面向开发者的生产级智能代理框架。它允许开发者通过自然语言和代码逻辑轻松构建基于代理的工作流。Eko 的主要优点包括高效的任务分解能力、强大的工具支持以及灵活的定制化选项。它旨在帮助开发者快速实现复杂的自动化任务,提高开发效率。Eko 由 FellouAI 团队开发,目前处于开源状态,支持多种平台,包括浏览器和桌面环境。具体价格未明确公开,但从其开源特性来看,可能对开发者免费开放,但部分高级功能或定制化服务可能需要付费。
HuggingFace的全新AI代理框架,助力开发者轻松创建强大AI代理。
Smolagents是Hugging Face团队开发的极简AI代理框架,旨在让开发者仅用少量代码就能部署强大的代理。它专注于代码代理,即代理通过编写和执行Python代码片段来执行任务,而非生成JSON或文本块。这种模式利用了大型语言模型(LLMs)生成和理解代码的能力,提供了更好的组合性、灵活性以及丰富的训练数据利用,能高效处理复杂逻辑和对象管理。Smolagents与Hugging Face Hub深度集成,便于工具的分享和加载,促进社区协作。此外,它还支持传统工具调用代理,兼容多种LLMs,包括Hugging Face Hub上的模型以及OpenAI、Anthropic等通过LiteLLM集成的模型。Smolagents的出现,降低了AI代理开发的门槛,使开发者能够更便捷地构建和部署AI驱动的应用程序。
一个仅100行代码的极简LLM框架,使LLM能够自主编程。
PocketFlow是一个极简的LLM框架,仅用100行代码实现,旨在让LLM能够自主编程。它强调高级编程范式,去除低级实现细节,使LLM能专注于重要部分。该框架可作为LLM的学习资源,因其简洁性,易于理解和上手。它采用嵌套有向图的核心抽象,将任务分解为多个LLM步骤,支持分支和递归决策。PocketFlow是开源项目,采用MIT许可证,具有高度的灵活性和可扩展性。
基于深度推理的神经机器翻译模型
DRT-o1-14B是一个神经机器翻译模型,旨在通过长链推理来提升翻译的深度和准确性。该模型通过挖掘含有比喻或隐喻的英文句子,并采用多代理框架(包括翻译者、顾问和评估者)来合成长思考的机器翻译样本。DRT-o1-14B基于Qwen2.5-14B-Instruct作为主干进行训练,具有14.8B的参数量,支持BF16张量类型。该模型的重要性在于其能够处理复杂的翻译任务,尤其是在需要深入理解和推理的情况下,提供了一种新的解决方案。
基于深度推理的神经机器翻译模型
DRT-o1-7B是一个致力于将长思考推理成功应用于神经机器翻译(MT)的模型。该模型通过挖掘适合长思考翻译的英文句子,并提出了一个包含翻译者、顾问和评估者三个角色的多代理框架来合成MT样本。DRT-o1-7B和DRT-o1-14B使用Qwen2.5-7B-Instruct和Qwen2.5-14B-Instruct作为骨干网络进行训练。该模型的主要优点在于其能够处理复杂的语言结构和深层次的语义理解,这对于提高机器翻译的准确性和自然性至关重要。
深度推理翻译模型,通过长思考链优化神经机器翻译。
DRT-o1是一个神经机器翻译模型,它通过长思考链的方式优化翻译过程。该模型通过挖掘含有比喻或隐喻的英文句子,并采用多代理框架(包括翻译者、顾问和评估者)来合成长思考的机器翻译样本。DRT-o1-7B和DRT-o1-14B是基于Qwen2.5-7B-Instruct和Qwen2.5-14B-Instruct训练的大型语言模型。DRT-o1的主要优点在于其能够处理复杂的语言结构和深层次的语义理解,这对于提高机器翻译的准确性和自然性至关重要。
开源框架,加速大型视频扩散模型
FastVideo是一个开源框架,旨在加速大型视频扩散模型。它提供了FastHunyuan和FastMochi两种一致性蒸馏视频扩散模型,实现了8倍推理速度提升。FastVideo基于PCM(Phased-Consistency-Model)提供了首个开放的视频DiT蒸馏配方,支持对最先进的开放视频DiT模型进行蒸馏、微调和推理,包括Mochi和Hunyuan。此外,FastVideo还支持使用FSDP、序列并行和选择性激活检查点进行可扩展训练,以及使用LoRA、预计算潜在和预计算文本嵌入进行内存高效微调。FastVideo的开发正在进行中,技术高度实验性,未来计划包括增加更多蒸馏方法、支持更多模型以及代码更新。
© 2025 AIbase 备案号:闽ICP备08105208号-14