需求人群:
"目标受众为软件开发者、编程爱好者以及需要自动化解决软件问题的团队。Agentless通过自动化的方式减少手动调试和修复软件问题的工作量,提高开发效率,降低成本,特别适合需要快速迭代和维护大型代码库的团队。"
使用场景示例:
案例一:在SWE-bench lite上,Agentless实现了82个修复,解决率达27.3%。
案例二:与Claude 3.5 Sonnet集成后,Agentless在SWE-bench lite和verified上的解决率分别达到40.7%和50.8%。
案例三:Agentless 1.5版本发布,提供了更高效的软件问题自动解决能力。
产品特色:
• 定位(Localization):Agentless采用分层方法定位故障到特定文件、类或函数和细粒度编辑位置。
• 修复(Repair):Agentless根据编辑位置采样多个候选补丁,以简单的diff格式呈现。
• 补丁验证(Patch Validation):Agentless选择回归测试并生成复现测试以复现原始错误,使用测试结果重新排名所有补丁,选择最佳补丁提交。
• 集成Claude 3.5 Sonnet:Agentless与Claude 3.5 Sonnet集成,提高了解决率。
• 支持多文件编辑:Agentless支持对多个文件进行编辑,增强了其修复能力。
• 预提交钩子(Pre-commit hooks):为了代码风格的标准化,Agentless支持预提交钩子。
• 环境设置简单:通过简单的命令行操作即可创建环境并安装所需依赖。
使用教程:
1. 克隆Agentless仓库到本地:使用`git clone https://github.com/OpenAutoCoder/Agentless.git`命令。
2. 进入Agentless目录:使用`cd Agentless`命令。
3. 创建并激活Python虚拟环境:执行`conda create -n agentless python=3.11`和`conda activate agentless`命令。
4. 安装依赖:运行`pip install -r requirements.txt`安装所需依赖。
5. 配置环境变量:执行`export PYTHONPATH=$PYTHONPATH:$(pwd)`命令。
6. 安装预提交钩子(如需贡献代码):运行`pre-commit install`命令。
7. 导出OpenAI API密钥:设置环境变量`export OPENAI_API_KEY={key_here}`。
8. 运行Agentless:根据具体问题运行Agentless的相应命令。
浏览量:43
最新流量情况
月访问量
4.92m
平均访问时长
00:06:33
每次访问页数
6.11
跳出率
36.20%
流量来源
直接访问
51.61%
自然搜索
33.46%
邮件
0.04%
外链引荐
12.58%
社交媒体
2.19%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
12.55%
德国
3.84%
印度
9.38%
俄罗斯
4.61%
美国
18.64%
开源编码 LLM,专为软件工程任务设计。
Kimi-Dev 是一款强大的开源编码 LLM,旨在解决软件工程中的问题。它通过大规模强化学习优化,确保在真实开发环境中的正确性和稳健性。Kimi-Dev-72B 在 SWE-bench 验证中实现了 60.4% 的性能,超越其他开源模型,是目前最先进的编码 LLM 之一。该模型可在 Hugging Face 和 GitHub 上下载和部署,适合开发者和研究人员使用。
开源AI软件工程师
Devika AI是一个开源的AI软件工程师,可以理解高级人类指令,将其分解为步骤,研究相关信息并生成相应代码。它使用Claude 3、GPT 4、GPT 3.5和Local LLMs via Ollama。
自动解决软件开发问题的无代理方法
Agentless是一种无需代理的自动解决软件开发问题的方法。它通过定位、修复和补丁验证三个阶段来解决每个问题。Agentless利用分层过程定位故障到特定文件、相关类或函数,以及细粒度的编辑位置。然后,Agentless根据编辑位置采样多个候选补丁,并选择回归测试来运行,生成额外的复现测试以复现原始错误,并使用测试结果重新排名所有剩余补丁,以选择一个提交。Agentless是目前在SWE-bench lite上表现最佳的开源方法,具有82个修复(27.3%的解决率),平均每问题成本0.34美元。
AI模型软件工程能力评估工具
SWE-bench Verified是OpenAI发布的一个经过人工验证的SWE-bench子集,旨在更可靠地评估AI模型解决现实世界软件问题的能力。它通过提供代码库和问题描述,挑战AI生成解决所描述问题的补丁。这个工具的开发是为了提高模型自主完成软件工程任务的能力评估的准确性,是OpenAI准备框架中中等风险级别的关键组成部分。
世界领先的AI软件工程师
Genie是一款AI软件工程模型,它在SWE-Bench行业标准基准测试中取得了30%的评估分数,远超其他同类产品。Genie能够独立或与用户协作解决bug、构建功能、重构代码,就像与同事合作一样。它通过与GitHub问题跟踪器的直接集成,简化了工作流程,确保完全理解特定任务和目标。
世界首款AI软件工程师,自主完成复杂工程任务
Devin是世界上第一款完全自主的AI软件工程师。具有长期推理和规划能力,可执行复杂工程任务,并与用户进行实时协作。帮助工程师专注于更有趣的问题,推动工程团队实现更宏伟的目标。
为软件工程挑战打造的先进基础AI模型
poolside是一个为软件工程挑战而构建的先进基础AI模型,它通过在用户代码上进行微调,学习项目的独特之处,以理解通用模型无法理解的复杂性。它建立在poolside基础之上,每天都能变得更好。除了先进的代码编写模型,poolside还构建了一个直观的编辑器助手,并提供了一个开发者可以构建的API。poolside由Jason Warner和Eiso Kant于2023年4月创立,他们之前在AI和软件工程领域有着丰富的经验。
使用AI改善软件工程师的职业发展
AI职业发展助手致力于利用最新的人工智能技术来帮助软件工程师建立更好的职业生涯。我们提供100%免费的AI工具,包括AI职业教练和技能挑战者。AI职业教练是一个基于ChatGPT的教练,可以充当工程经理,为开发人员提供快速、相关且具体的建议,帮助他们实现特定的职业目标。技能挑战者通过全自动生成的多项选择题来评估您的核心开发技能,快速完成挑战并与全球同行进行排名。
构建、管理、扩展和支付来自拉美的顶级远程软件工程团队
TeamStation是一款通过Framework Science独有的远程软件工程团队增员SaaS平台,快速构建拉美近海软件开发团队,集成AI和Fintech技术,提供人性化的AI和Fintech服务,2022年获得了美国专利注册。用户可以通过简单的操作,一键雇佣顶级的近海软件工程师人才。
AI创建软件工程师任务,一致、可读和详细。
Cubed是一个AI创建任务的平台,通过与GitHub代码库连接,使用人工智能生成具体可操作、描述性强的卡片。设置同步后,Cubed会智能地利用代码库的上下文,改进每个新的工单,为开发人员提供更多指导、加速和专注时间。
自主程序改进的人工智能软件工程师
auto-code-rover是一种全自动的解决GitHub问题(Bug修复和功能添加)的方法,结合了语言模型与分析和调试功能,确定修复位置,生成补丁程序。目前可解决16%的SWE-bench问题和22%的SWE-bench lite问题,超越了现有的人工智能软件工程师的效果。它分两个阶段工作:首先通过代码搜索API获取相关上下文信息,然后基于获取的上下文信息尝试编写补丁程序。它具有两个独特的特点:一是代码搜索API具有项目结构感知能力,不是简单的字符串匹配,而是在抽象语法树中搜索相关的代码上下文;二是如果有测试套件可用,它还可以利用统计故障定位来提高修复率。
windsurf_ai推出首个针对软件工程流程优化的模型家族 SWE-1。
SWE-1 是windsurf_ai首个为整个软件工程流程优化的模型家族,旨在加速软件开发 99%。与传统的仅能编写代码的模型相比,SWE-1 不仅能编写代码,还能处理终端操作、访问其他知识和互联网、测试产品和理解用户反馈。SWE-1 系列包括 SWE-1、SWE-1-lite 和 SWE-1-mini 三种模型,旨在满足不同用户的需求。
Cognition Labs是Devin的制造商,Devin是第一个AI软件工程师
Cognition Labs是一个应用AI实验室,专注于推理能力,他们开发的代码只是开始。该公司旨在通过AI技术提升软件工程的效率,并且已经推出了Devin的AI软件工程师。
面向软件工程师的创建文档和架构的代码平台,支持 AI、Git、测试和监控
CRUDERRA 是一个面向软件工程师的平台,提供创建文档和架构的代码功能。它支持使用流行的 Python/PlantUML 创建交互式架构文档,让您的代码更新速度提升 5 倍。您可以与团队一起协作讨论架构,并使用 Git 来批准团队成员的更改。实时追踪架构,并生成快速的测试用例,比较实际和目标架构之间的差异。CRUDERRA 能加速团队的开发过程。
HackerPulse是一个展示软件工程师技能的ML驱动个人简历平台。
HackerPulse是一个免费的在线平台,使用机器学习算法和ChatGPT帮助软件工程师制作个性化的在线简历。它提供自定义的简历模板,使用ChatGPT自动生成个人描述,以及成功简历案例供参考。主要功能包括:简历生成器,使用ChatGPT智能编写个人描述;在线简历平台,创建个性化展示网页;求职指导,提供成功简历模板和案例。关键优势是简化简历制作流程,使用AI提高简历质量,在线可分享,方便被HR和招聘者发现。
SWE-Lancer 是一个包含 1400 多个自由软件工程任务的基准测试,总价值 100 万美元。
SWE-Lancer 是由 OpenAI 推出的一个基准测试,旨在评估前沿语言模型在真实世界中的自由软件工程任务中的表现。该基准测试涵盖了从 50 美元的漏洞修复到 32000 美元的功能实现等多种独立工程任务,以及模型在技术实现方案之间的选择等管理任务。通过模型将性能映射到货币价值,SWE-Lancer 为研究 AI 模型开发的经济影响提供了新的视角,并推动了相关研究的发展。
一个能理解高级人类指令、进行研究和编写代码以实现给定目标的AI软件工程师
Devika是一个先进的AI软件工程师,可以理解高级人类指令、将其分解为步骤、研究相关信息并编写代码以实现给定目标。该项目旨在提供一个能够与人类协作完成复杂编程任务的AI伙伴。
Google Cloud机器学习工程师学习路径
Google Cloud的机器学习工程师学习路径是一套精选的在线课程和实验,旨在帮助学习者获得Google Cloud技术实操经验,掌握机器学习系统的设计、构建、投产、优化、运转和维护等关键技能。完成此学习路径后,学习者可以进一步考取Google Cloud机器学习工程师认证,为职业发展打下坚实基础。
大语言模型的提示工程指南
提示工程指南是一份全面介绍提示工程的指南,包括基本概念、设计提示的通用技巧、提示技术、提示应用等内容。它帮助用户更好地了解大型语言模型的能力和局限性,并掌握与大语言模型交互和研发的各种技能和技术。
通过强化学习提升大型语言模型在开源软件演变中的推理能力
SWE-RL 是由 Facebook Research 提出的一种基于强化学习的大型语言模型推理技术,旨在利用开源软件演变数据提升模型在软件工程任务中的表现。该技术通过规则驱动的奖励机制,优化模型的推理能力,使其能够更好地理解和生成高质量的代码。SWE-RL 的主要优点在于其创新性的强化学习方法和对开源数据的有效利用,为软件工程领域带来了新的可能性。该技术目前处于研究阶段,尚未明确商业化定价,但其在提升开发效率和代码质量方面具有显著潜力。
AI驱动的软件工程师,快速创建生产级应用
Websparks是一个AI驱动的软件开发平台,它通过人工智能技术将用户的想法快速转化为完整的全栈应用程序,包括响应式前端、强大的后端和优化的数据库。用户只需通过简单的提示即可构建、部署和扩展应用程序,支持实时预览和一键部署。Websparks通过AI技术提高了软件开发的效率,降低了开发成本,使得开发者、设计师或有远见者能够将想法快速转化为现实。
专为软件改进设计的开源大型语言模型。
Lingma SWE-GPT是一个开源的大型语言模型,专注于软件工程领域的任务,旨在提供智能化的开发支持。该模型基于Qwen系列基础模型,经过额外训练以增强其在复杂软件工程任务中的能力。它在软件工程智能代理的权威排行榜上表现出色,适合需要自动化软件改进的开发团队和研究人员。
AI工程和研究的智能伴侣
MLE-Agent 是为机器学习工程师和研究人员设计的智能伴侣,具备自主创建基线、集成Arxiv和Papers with Code、智能调试、文件系统整合、综合工具集成以及交互式命令行聊天等功能。它支持OpenAI、Ollama等AI/ML功能和MLOps工具,为无缝工作流程提供支持。
Exponent 是一个高效的 AI 编程助手,协作完成软件工程任务。
Exponent 是一款协作式 AI 编程代理,旨在提升软件开发的效率与体验。它能够在多种环境中工作,从代码的探索到部署,能够帮助开发者自动化复杂的编程任务,极大地减少重复性工作,提升团队生产力。Exponent 的优点包括跨平台操作、便捷的用户界面和强大的功能集,适合各种规模的开发团队使用。
无代码,自动化机器学习
Qlik AutoML是一款为分析团队提供无代码、自动化机器学习的工具。它能够快速生成模型、进行预测和决策规划。用户可以轻松创建机器学习实验,识别数据中的关键因素并训练模型。同时,它还支持完全可解释的AI,可以展示预测的原因和影响。用户可以将数据发布或直接集成到Qlik Sense应用中进行全交互式分析和模拟。
机器学习工程能力的AI代理评估基准
MLE-bench是由OpenAI推出的一个基准测试,旨在衡量AI代理在机器学习工程方面的表现。该基准测试汇集了75个来自Kaggle的机器学习工程相关竞赛,形成了一套多样化的挑战性任务,测试了训练模型、准备数据集和运行实验等现实世界中的机器学习工程技能。通过Kaggle公开的排行榜数据,为每项竞赛建立了人类基准。使用开源代理框架评估了多个前沿语言模型在该基准上的表现,发现表现最佳的设置——OpenAI的o1-preview配合AIDE框架——在16.9%的竞赛中至少达到了Kaggle铜牌的水平。此外,还研究了AI代理的各种资源扩展形式以及预训练污染的影响。MLE-bench的基准代码已经开源,以促进未来对AI代理机器学习工程能力的理解。
使用 AI 修复受损视频
ONERECOVERY 是一款 AI 驱动的视频修复工具,可以修复由于不正确的文件传输、拍摄 / 录制 / 编辑 / 转换 / 处理错误、操作系统崩溃、病毒、恶意软件攻击等引起的任何损坏的视频文件,包括 MP4、MOV、MKV、M2TS、AVI、3GP、M4V、MXF 等。它具有高成功率、支持免费预览修复的视频、修复高清、4K 和 8K 视频等功能。ONERECOVERY 可以修复来自计算机、手机、SD 卡、USB 闪存驱动器、硬盘驱动器、CF 卡、佳能、尼康、索尼、GoPro、大疆无人机、松下等设备的受损、破损或无法播放的视频。它适用于 Windows 和 Mac 设备。
© 2025 AIbase 备案号:闽ICP备08105208号-14