开源编码 LLM,专为软件工程任务设计。
Kimi-Dev 是一款强大的开源编码 LLM,旨在解决软件工程中的问题。它通过大规模强化学习优化,确保在真实开发环境中的正确性和稳健性。Kimi-Dev-72B 在 SWE-bench 验证中实现了 60.4% 的性能,超越其他开源模型,是目前最先进的编码 LLM 之一。该模型可在 Hugging Face 和 GitHub 上下载和部署,适合开发者和研究人员使用。
面向大模型的智能解决方案平台,自动优化多任务。
PromptPilot 是一个智能解决方案平台,专注于大模型的优化和用户任务意图的实现。通过交互反馈,该平台能够自动优化多步骤、多模态和多场景的任务,为用户提供高效的智能解决方案,适合企业和个人用户提升工作效率和任务完成质量。
帮助开发者提升技能水平的日志记录应用。
Jotskey是一个日志记录应用,旨在帮助开发者通过记录日常工作和学习进步,提升他们的工程技能。其主要优点在于结合AI功能,支持开发者进行思维整理、问题解决、成就追踪等,以便更快速地成长和提升。
AI Agents帮助公司更快地关闭客户的Proof-of-Concept应用和集成。
Proofs.io是一个AI Agents平台,通过构建Proof-of-Concept应用和集成来帮助公司更快地关闭客户。它的主要优点在于快速、定制化的PoC构建,降低成本并提供更好的客户体验。
ModAstera提供用于医疗AI开发的平台,让您比竞争对手更快地进行创新。
ModAstera提供一站式的医疗AI开发平台,利用AI辅助数据标注和医疗AI工程代理加速研发进程,降低开发成本,并比竞争对手更快地推向市场。产品符合医疗健康行业的数字化转型需求。
Opusense是一个基于AI的工地检查和报告平台。
Opusense是一款AI驱动的工地检查和报告工具,通过自动化报告生成和照片记录,帮助建筑和工程团队提高效率和准确性。Opusense的主要优点在于节省时间、提高准确性和降低成本。
windsurf_ai推出首个针对软件工程流程优化的模型家族 SWE-1。
SWE-1 是windsurf_ai首个为整个软件工程流程优化的模型家族,旨在加速软件开发 99%。与传统的仅能编写代码的模型相比,SWE-1 不仅能编写代码,还能处理终端操作、访问其他知识和互联网、测试产品和理解用户反馈。SWE-1 系列包括 SWE-1、SWE-1-lite 和 SWE-1-mini 三种模型,旨在满足不同用户的需求。
Mendel是一个利用智能AI工作流来自动化代码审查、展示工程指标并提供团队见解的产品,加快、更安全的交付。
Mendel利用AI优化工作流程,自动化代码审查,跟踪团队绩效,提高部署效率。它为开发人员提供了更快速、更安全的代码交付方式。
智能AI代码审查,可消除高达95%的错误、安全问题和漏洞。
Matter AI 是一款工程智能平台,可加速代码审查,帮助团队在Pull Requests中消除高达95%的错误、安全问题和漏洞。该产品的主要优点包括快速发现漏洞、提高代码质量、减少审查周期等。Matter AI的背景信息包括被工程团队信任,广泛应用于提高代码质量。
AI驱动的技术面试平台,帮助公司找到最优秀的工程师。
Candora是一个AI领导的面试平台,涵盖编码、系统设计、行为和项目构建等面试环节。它通过评估技术深度、系统思维、解决问题能力、沟通技巧等方面,帮助公司找到最强大的工程师。
Promptaa是一个AI提示库,可帮助您创建、管理和共享AI提示。
Promptaa是一个用于创建、管理和共享AI提示的平台。它利用AI增强功能改进提示,提供了创建有效提示的指南,以及社区功能让用户分享和发现最佳提示。
帮助创始人以更少的努力更快地启动项目,清晰精准地管理工程团队。
Tometo 是一款面向创始人的工程团队管理工具,通过 AI 技术帮助团队成员明确目标、协调工作,提升项目推进效率。它能够整合多平台开发工具,实时跟踪项目进展,自动检测潜在阻碍,确保项目按时交付。Tometo 由顶尖机构的工程师打造,致力于为创业团队提供高效、精准的管理支持,目前提供免费试用服务,未来可能会推出付费版本,以满足不同规模团队的多样化需求。
Evo 2 是一个强大的 AI 基础模型,用于解析 DNA、RNA 和蛋白质的遗传密码。
Evo 2 是由 NVIDIA 推出的 AI 基础模型,旨在通过深度学习技术解析生物分子的遗传密码。该模型基于 NVIDIA DGX Cloud 平台开发,能够处理大规模的基因组数据,为生物医学研究提供强大的工具。Evo 2 的主要优点在于其能够处理长达 100 万个 token 的基因序列,从而更全面地理解基因组的复杂性。该模型在生物医学领域的应用前景广阔,包括疾病诊断、药物开发和基因编辑等。Evo 2 的开发得到了 Arc 研究所和斯坦福大学的支持,目标是推动生物医学研究的创新和突破。
通过强化学习提升大型语言模型在开源软件演变中的推理能力
SWE-RL 是由 Facebook Research 提出的一种基于强化学习的大型语言模型推理技术,旨在利用开源软件演变数据提升模型在软件工程任务中的表现。该技术通过规则驱动的奖励机制,优化模型的推理能力,使其能够更好地理解和生成高质量的代码。SWE-RL 的主要优点在于其创新性的强化学习方法和对开源数据的有效利用,为软件工程领域带来了新的可能性。该技术目前处于研究阶段,尚未明确商业化定价,但其在提升开发效率和代码质量方面具有显著潜力。
SWE-Lancer 是一个包含 1400 多个自由软件工程任务的基准测试,总价值 100 万美元。
SWE-Lancer 是由 OpenAI 推出的一个基准测试,旨在评估前沿语言模型在真实世界中的自由软件工程任务中的表现。该基准测试涵盖了从 50 美元的漏洞修复到 32000 美元的功能实现等多种独立工程任务,以及模型在技术实现方案之间的选择等管理任务。通过模型将性能映射到货币价值,SWE-Lancer 为研究 AI 模型开发的经济影响提供了新的视角,并推动了相关研究的发展。
一个针对AI工程师的趣味游戏,通过提示挑战激发创造力。
Secret Prompter 是一款专为AI工程师设计的趣味游戏,灵感来源于Wordle。玩家需要通过有限的尝试次数,提交最佳的提示(prompt),以获得最高的准确率。游戏每天更新,玩家的排名会根据准确率和提交时间进行排序。该产品不仅具有娱乐性,还能锻炼AI工程师的提示工程能力,帮助他们更好地理解和优化AI模型的输入。产品目前免费开放,适合对AI感兴趣的技术人员和爱好者。
Doctor Droid 是一个 AI 故障排除代理,通过与工具栈交互和理解公司上下文来解决生产问题。
Doctor Droid 是一款面向工程师团队的 AI 故障排除工具,它能够通过与现有工具栈的交互以及对公司特定上下文的理解,快速定位生产环境中的问题根源,并提供解决方案。其主要优点在于利用 AI 技术加速故障排查过程,提高团队工作效率,减少手动协调工作量。产品定位为帮助企业更智能、更快速地解决技术问题,提升工程团队的生产力。具体价格信息未在页面中明确显示,需进一步咨询了解。
免费的提示工程在线课程,包含ChatGPT和Midjourney教程。
Learning Prompt是一个专注于提示工程的在线教育平台,旨在帮助用户更好地使用ChatGPT和Midjourney等AI工具。该平台通过提供系统的课程和教程,帮助用户掌握如何构建有效的提示,从而提高与AI的交互效率。其主要优点在于免费提供高质量的学习资源,适合初学者和有一定基础的用户。该平台由Jimmy创建,旨在通过输出驱动输入,帮助用户在学习过程中掌握提示工程的知识。
© 2025 AIbase 备案号:闽ICP备08105208号-14