开源编码 LLM,专为软件工程任务设计。
Kimi-Dev 是一款强大的开源编码 LLM,旨在解决软件工程中的问题。它通过大规模强化学习优化,确保在真实开发环境中的正确性和稳健性。Kimi-Dev-72B 在 SWE-bench 验证中实现了 60.4% 的性能,超越其他开源模型,是目前最先进的编码 LLM 之一。该模型可在 Hugging Face 和 GitHub 上下载和部署,适合开发者和研究人员使用。
帮助开发者提升技能水平的日志记录应用。
Jotskey是一个日志记录应用,旨在帮助开发者通过记录日常工作和学习进步,提升他们的工程技能。其主要优点在于结合AI功能,支持开发者进行思维整理、问题解决、成就追踪等,以便更快速地成长和提升。
AI Agents帮助公司更快地关闭客户的Proof-of-Concept应用和集成。
Proofs.io是一个AI Agents平台,通过构建Proof-of-Concept应用和集成来帮助公司更快地关闭客户。它的主要优点在于快速、定制化的PoC构建,降低成本并提供更好的客户体验。
ModAstera提供用于医疗AI开发的平台,让您比竞争对手更快地进行创新。
ModAstera提供一站式的医疗AI开发平台,利用AI辅助数据标注和医疗AI工程代理加速研发进程,降低开发成本,并比竞争对手更快地推向市场。产品符合医疗健康行业的数字化转型需求。
Opusense是一个基于AI的工地检查和报告平台。
Opusense是一款AI驱动的工地检查和报告工具,通过自动化报告生成和照片记录,帮助建筑和工程团队提高效率和准确性。Opusense的主要优点在于节省时间、提高准确性和降低成本。
windsurf_ai推出首个针对软件工程流程优化的模型家族 SWE-1。
SWE-1 是windsurf_ai首个为整个软件工程流程优化的模型家族,旨在加速软件开发 99%。与传统的仅能编写代码的模型相比,SWE-1 不仅能编写代码,还能处理终端操作、访问其他知识和互联网、测试产品和理解用户反馈。SWE-1 系列包括 SWE-1、SWE-1-lite 和 SWE-1-mini 三种模型,旨在满足不同用户的需求。
Mendel是一个利用智能AI工作流来自动化代码审查、展示工程指标并提供团队见解的产品,加快、更安全的交付。
Mendel利用AI优化工作流程,自动化代码审查,跟踪团队绩效,提高部署效率。它为开发人员提供了更快速、更安全的代码交付方式。
智能AI代码审查,可消除高达95%的错误、安全问题和漏洞。
Matter AI 是一款工程智能平台,可加速代码审查,帮助团队在Pull Requests中消除高达95%的错误、安全问题和漏洞。该产品的主要优点包括快速发现漏洞、提高代码质量、减少审查周期等。Matter AI的背景信息包括被工程团队信任,广泛应用于提高代码质量。
AI驱动的技术面试平台,帮助公司找到最优秀的工程师。
Candora是一个AI领导的面试平台,涵盖编码、系统设计、行为和项目构建等面试环节。它通过评估技术深度、系统思维、解决问题能力、沟通技巧等方面,帮助公司找到最强大的工程师。
Promptaa是一个AI提示库,可帮助您创建、管理和共享AI提示。
Promptaa是一个用于创建、管理和共享AI提示的平台。它利用AI增强功能改进提示,提供了创建有效提示的指南,以及社区功能让用户分享和发现最佳提示。
通过自然对话实时生成功能美观的UI/UX设计。
AI UI/UX设计助手是一款利用人工智能技术,将需求即时转化为现代前端代码的工具。它能快速生成美观的UI设计,支持HTML、Tailwind CSS和React组件。
助力UI/UX专业人士提升排版设计技能的排版工作坊。
Simply Typography是一项为UI/UX专业人士设计的排版工作坊,旨在加深对排版的理解并提升设计技能。该产品强调人类设计师的独特视角和能力,在AI时代仍然保持重要性。
Maqnet AI是一款AI辅助设计工具,可以在几秒钟内生成超级碗级别的视觉效果和5秒视频片段。
Maqnet AI是一款基于人工智能的设计工具,提供超过12,000个灵感和每天新增400个新创意,可帮助用户轻松创作高质量视觉内容。该工具由600多名专业训练师团队开发,拥有内置编辑工具,适用于无设计经验的用户。Maqnet AI致力于转化内容为独特的体验,提供不同订阅方案以满足用户需求。
帮助创始人以更少的努力更快地启动项目,清晰精准地管理工程团队。
Tometo 是一款面向创始人的工程团队管理工具,通过 AI 技术帮助团队成员明确目标、协调工作,提升项目推进效率。它能够整合多平台开发工具,实时跟踪项目进展,自动检测潜在阻碍,确保项目按时交付。Tometo 由顶尖机构的工程师打造,致力于为创业团队提供高效、精准的管理支持,目前提供免费试用服务,未来可能会推出付费版本,以满足不同规模团队的多样化需求。
Evo 2 是一个强大的 AI 基础模型,用于解析 DNA、RNA 和蛋白质的遗传密码。
Evo 2 是由 NVIDIA 推出的 AI 基础模型,旨在通过深度学习技术解析生物分子的遗传密码。该模型基于 NVIDIA DGX Cloud 平台开发,能够处理大规模的基因组数据,为生物医学研究提供强大的工具。Evo 2 的主要优点在于其能够处理长达 100 万个 token 的基因序列,从而更全面地理解基因组的复杂性。该模型在生物医学领域的应用前景广阔,包括疾病诊断、药物开发和基因编辑等。Evo 2 的开发得到了 Arc 研究所和斯坦福大学的支持,目标是推动生物医学研究的创新和突破。
通过强化学习提升大型语言模型在开源软件演变中的推理能力
SWE-RL 是由 Facebook Research 提出的一种基于强化学习的大型语言模型推理技术,旨在利用开源软件演变数据提升模型在软件工程任务中的表现。该技术通过规则驱动的奖励机制,优化模型的推理能力,使其能够更好地理解和生成高质量的代码。SWE-RL 的主要优点在于其创新性的强化学习方法和对开源数据的有效利用,为软件工程领域带来了新的可能性。该技术目前处于研究阶段,尚未明确商业化定价,但其在提升开发效率和代码质量方面具有显著潜力。
SWE-Lancer 是一个包含 1400 多个自由软件工程任务的基准测试,总价值 100 万美元。
SWE-Lancer 是由 OpenAI 推出的一个基准测试,旨在评估前沿语言模型在真实世界中的自由软件工程任务中的表现。该基准测试涵盖了从 50 美元的漏洞修复到 32000 美元的功能实现等多种独立工程任务,以及模型在技术实现方案之间的选择等管理任务。通过模型将性能映射到货币价值,SWE-Lancer 为研究 AI 模型开发的经济影响提供了新的视角,并推动了相关研究的发展。
© 2025 AIbase 备案号:闽ICP备08105208号-14