开源编码 LLM,专为软件工程任务设计。
Kimi-Dev 是一款强大的开源编码 LLM,旨在解决软件工程中的问题。它通过大规模强化学习优化,确保在真实开发环境中的正确性和稳健性。Kimi-Dev-72B 在 SWE-bench 验证中实现了 60.4% 的性能,超越其他开源模型,是目前最先进的编码 LLM 之一。该模型可在 Hugging Face 和 GitHub 上下载和部署,适合开发者和研究人员使用。
windsurf_ai推出首个针对软件工程流程优化的模型家族 SWE-1。
SWE-1 是windsurf_ai首个为整个软件工程流程优化的模型家族,旨在加速软件开发 99%。与传统的仅能编写代码的模型相比,SWE-1 不仅能编写代码,还能处理终端操作、访问其他知识和互联网、测试产品和理解用户反馈。SWE-1 系列包括 SWE-1、SWE-1-lite 和 SWE-1-mini 三种模型,旨在满足不同用户的需求。
AI驱动的测试代理工具,帮助开发人员更快地发布无bug软件。
Bugster是一款AI驱动的测试解决方案,能够将用户流程转化为自动化测试,帮助开发人员快速发布无bug的软件。其主要优点在于自动化测试流程、智能测试适应性和减少测试维护工作。Bugster定位于提高开发速度并保证软件质量。
创建产品预售等候名单,构建炒作,收集电子邮件。
Waitlister是一个帮助您创建产品预售等候名单的工具,以验证想法并建立炒作。它提供可定制的着陆页和表单。Waitlister价格适中,定位于为创业者和企业家提供预售市场营销解决方案。
mrge 帮助现代软件团队以 4 倍的速度交付更高质量的代码。
mrge 是一个专为现代软件团队设计的代码审查平台,能够加速代码合并流程并提高代码质量。其采用 AI 技术实时评估代码,确保团队能够快速、有效地处理 PR,减少开发周期。产品每位活跃开发者月收费 30 美元,提供无限的 AI 审查和自定义规则,适合需要高效协作的开发团队。
GPT-4.1 是一款在编程、指令跟随和长文本理解方面有显著提升的模型。
GPT-4.1 是一系列新模型,提供了显著的性能提升,特别是在编码、指令跟随和处理长文本上下文方面。它的上下文窗口扩大到 100 万标记,并且在真实世界的应用中表现出色,适合开发者创建更高效的应用程序。此模型的价格相对较低,且具有快速响应能力,使其在开发和执行复杂任务时更加高效。
Exponent 是一个高效的 AI 编程助手,协作完成软件工程任务。
Exponent 是一款协作式 AI 编程代理,旨在提升软件开发的效率与体验。它能够在多种环境中工作,从代码的探索到部署,能够帮助开发者自动化复杂的编程任务,极大地减少重复性工作,提升团队生产力。Exponent 的优点包括跨平台操作、便捷的用户界面和强大的功能集,适合各种规模的开发团队使用。
Factory 是一个为软件开发带来自主性的平台,助力团队高效协作和开发未来软件。
Factory 是一个面向软件开发的自主性平台,旨在通过连接工程系统中的上下文和工具,提升团队协作效率和开发体验。它支持从代码生成、代码审查到文档生成的全流程开发任务,同时提供企业级安全性和标准化工作流,帮助团队更好地管理复杂项目。Factory 的目标是将开发团队转变为自主化的高效组织,适应现代软件开发的需求。
通过强化学习提升大型语言模型在开源软件演变中的推理能力
SWE-RL 是由 Facebook Research 提出的一种基于强化学习的大型语言模型推理技术,旨在利用开源软件演变数据提升模型在软件工程任务中的表现。该技术通过规则驱动的奖励机制,优化模型的推理能力,使其能够更好地理解和生成高质量的代码。SWE-RL 的主要优点在于其创新性的强化学习方法和对开源数据的有效利用,为软件工程领域带来了新的可能性。该技术目前处于研究阶段,尚未明确商业化定价,但其在提升开发效率和代码质量方面具有显著潜力。
SWE-Lancer 是一个包含 1400 多个自由软件工程任务的基准测试,总价值 100 万美元。
SWE-Lancer 是由 OpenAI 推出的一个基准测试,旨在评估前沿语言模型在真实世界中的自由软件工程任务中的表现。该基准测试涵盖了从 50 美元的漏洞修复到 32000 美元的功能实现等多种独立工程任务,以及模型在技术实现方案之间的选择等管理任务。通过模型将性能映射到货币价值,SWE-Lancer 为研究 AI 模型开发的经济影响提供了新的视角,并推动了相关研究的发展。
AI驱动的战略情报平台,帮助企业发现、跟踪和预测趋势。
Trendtracker是一个基于AI的战略情报平台,旨在帮助企业快速发现、跟踪和预测行业趋势。它通过分析海量在线数据,提供实时、精准的趋势洞察,帮助企业制定前瞻性战略。该平台适用于多种行业,能够显著节省传统趋势研究的时间和成本,同时通过AI技术消除人为偏见,提供客观的趋势分析。Trendtracker的定位是为战略团队提供决策支持,助力企业在快速变化的市场中保持竞争力。
现代硬件设计的CAD软件
Zoo提供了一个现代的硬件设计工具包,包括GPU驱动引擎、按需付费、远程流媒体和开放API兼容等特点,旨在提高硬件设计效率和降低成本。它允许用户创建前所未有的新设计工具,无论是个人爱好者、初创企业还是大型企业,Zoo的安全基础设施都能加速项目和工具的发展。
AI驱动的软件工程师,快速创建生产级应用
Websparks是一个AI驱动的软件开发平台,它通过人工智能技术将用户的想法快速转化为完整的全栈应用程序,包括响应式前端、强大的后端和优化的数据库。用户只需通过简单的提示即可构建、部署和扩展应用程序,支持实时预览和一键部署。Websparks通过AI技术提高了软件开发的效率,降低了开发成本,使得开发者、设计师或有远见者能够将想法快速转化为现实。
自动解决软件开发问题的无代理方法
Agentless是一种无需代理的自动解决软件开发问题的方法。它通过定位、修复和补丁验证三个阶段来解决每个问题。Agentless利用分层过程定位故障到特定文件、相关类或函数,以及细粒度的编辑位置。然后,Agentless根据编辑位置采样多个候选补丁,并选择回归测试来运行,生成额外的复现测试以复现原始错误,并使用测试结果重新排名所有剩余补丁,以选择一个提交。Agentless是目前在SWE-bench lite上表现最佳的开源方法,具有82个修复(27.3%的解决率),平均每问题成本0.34美元。
为数据中心打造的高效AI推理平台
d-Matrix是一家专注于AI推理技术的公司,其旗舰产品Corsair™是为数据中心设计的AI推理平台,能够提供极高的推理速度和极低的延迟。d-Matrix通过硬件软件协同设计,优化了Generative AI推理性能,推动了AI技术在数据中心的应用,使得大规模AI推理变得更加高效和可持续。
专为软件改进设计的开源大型语言模型。
Lingma SWE-GPT是一个开源的大型语言模型,专注于软件工程领域的任务,旨在提供智能化的开发支持。该模型基于Qwen系列基础模型,经过额外训练以增强其在复杂软件工程任务中的能力。它在软件工程智能代理的权威排行榜上表现出色,适合需要自动化软件改进的开发团队和研究人员。
百度推出的零代码AI开发平台,一句话生成应用
秒哒是百度推出的零代码AI开发平台,它基于大模型和智能体技术,允许用户无需编写代码即可构建软件的能力。用户可以通过无代码编程、多智能体协作和规模化工具调用,轻松实现各种创意和想法。秒哒的主要优点包括0代码编程、多智能体协作、规模化工具调用、直观操作、创意实现、自动化流程和模块化构建。它适合需要快速开发和部署软件应用的企业、教育机构和个人开发者,无需具备编程知识即可使用。
© 2025 AIbase 备案号:闽ICP备08105208号-14