浏览量:109
最新流量情况
月访问量
4.93m
平均访问时长
00:06:29
每次访问页数
6.10
跳出率
36.08%
流量来源
直接访问
54.82%
自然搜索
31.76%
邮件
0.04%
外链引荐
11.31%
社交媒体
1.86%
展示广告
0
截止目前所有流量趋势图
地理流量分布情况
中国
12.56%
德国
3.93%
印度
9.82%
俄罗斯
5.43%
美国
18.51%
AgentVerse 是一个用于构建自定义多智能体环境的框架
AgentVerse 是一个提供灵活框架的多智能体环境模拟工具,简化了构建大型语言模型(LLMs)的自定义多智能体环境的过程。它提供了高效的环境构建、可定制的组件、工具插件支持等功能。AgentVerse 旨在帮助研究人员更轻松地进行多智能体环境的开发和定制,以便集中精力进行研究。
基于环境反馈的视觉语言编程工具
Octopus是一款基于环境反馈的视觉语言编程工具,能够高效地解析代理的视觉和文本任务目标,制定复杂的动作序列,并生成可执行代码。Octopus的设计允许代理处理广泛的任务,从模拟器中的日常琐事到复杂视频游戏中的复杂交互。Octopus通过利用GPT-4来控制探索代理生成训练数据,即动作蓝图和相应的可执行代码,在我们的实验环境OctoVerse中进行训练。我们还收集反馈,以允许强化学习与环境反馈(RLEF)的增强训练方案。通过一系列实验,我们阐明了Octopus的功能并呈现了令人信服的结果,提出的RLEF证明了提高代理决策的效果。通过开源我们的模型架构、模拟器和数据集,我们希望激发更多的创新并促进更广泛的体验AI社区中的协作应用。
轻量级多语言跨平台集成开发环境
deepin-IDE是一款专为开发者设计的轻量级多语言跨平台集成开发环境,支持C/C++、JAVA、Python、JS等多种编程语言。它具备版本管理、智能编辑器、工具链管理等基础能力,并支持代码迁移、反向调试等特色功能。deepin-IDE还融入了AI智能编程技术,如代码生成、代码翻译和注释生成,大幅提升开发效率。此外,它支持国产硬件平台如龙芯、飞腾等,致力于构建操作系统新生态。
基于《Factorio》游戏的大语言模型测试与学习环境
Factorio Learning Environment(FLE)是基于《Factorio》游戏构建的新型框架,用于评估大型语言模型(LLMs)在长期规划、程序合成和资源优化方面的能力。随着LLMs逐渐饱和现有基准测试,FLE提供了新的开放式评估方式。它的重要性在于能让研究人员更全面、深入地了解LLMs的优势与不足。主要优点是提供了开放式且难度呈指数级增长的挑战,拥有结构化任务和开放式任务两种评估协议。该项目由Jack Hopkins等人开发,以开源形式发布,免费使用,定位是推动AI研究人员对复杂、开放式领域中智能体能力的研究。
先进的大型语言模型,用于编程
Code Llama 是一款先进的大型语言模型,可以通过文本提示生成代码。它是当前公开可用的语言模型中在编程任务上达到最佳性能的模型之一。Code Llama 可以帮助开发人员提高工作效率,降低编码门槛,并作为一个教育工具帮助编程学习者编写更健壮、更好文档化的软件。Code Llama 提供了多个版本,包括基础版、针对 Python 的专用版和针对自然语言指令的定制版。它支持多种流行的编程语言,如 Python、C++、Java 等。Code Llama 免费供研究和商业使用。
模拟不同投资策略的表现,辅助投资决策。
投资策略模拟器是一个在线工具,它通过模拟不同的股价模型和投资策略,帮助用户理解各种投资策略在不同市场条件下的表现。该产品使用几何布朗运动模型来模拟股价的连续随机波动,适合相对稳定的大盘股。用户可以设置不同的投资周期和策略,比如买入持有、定投等,来观察投资收益的变化。这个工具的主要优点是简单易懂,能够帮助投资者在不承担实际风险的情况下,学习和比较不同的投资策略。它适合心态平和、不为短期波动所动的长线投资者。目前,该产品是免费的,主要面向教育和娱乐目的,不构成实际的投资建议。
智能编程助手,助力高效编程。
JoyCoder 是京东自主研发的智能编程助手,基于大语言模型,适配多种 IDE,提供代码预测、智能问答等功能。它能够提升开发人员的编程效率和代码质量,减少编程错误,降低修复问题的频率。该产品适合各种开发者使用,特别是在快速开发和测试需求中。随着智能编程的兴起,JoyCoder 为开发者提供了一个高效、流畅的编程环境,满足其多样化需求。产品定价方面,具体信息请联系售前顾问。
提供多种预训练模型,支持多维度筛选,助力AI模型应用与开发。
该平台是一个专注于AI预训练模型的资源平台,整合了大量不同类型、规模和应用场景的预训练模型。其重要性在于为AI开发者和研究人员提供了便捷的模型获取渠道,降低了模型开发的门槛。主要优点包括模型分类细致、多维度筛选功能强大、信息展示详细且提供智能推荐。产品背景是随着AI技术的发展,对预训练模型的需求日益增长,平台应运而生。平台主要定位为AI模型资源平台,部分模型免费商用,部分可能需要付费,具体价格因模型而异。
WeLM Playground是一款开源的大型中文语言模型聊天工具
WeLM Playground是基于开源中文语言模型WeLM的在线聊天 Demo,用户可以通过网页与 AI 对话、获取写作帮助。它提供稳定流畅的语言生成,支持自由聊天、话题控制、长篇闲聊、文本续写等功能。作为 Anthropic 公司开源的大模型之一,WeLM Playground 完全免费,代码开源,用户无需注册即可使用。它旨在让普通用户也能安全便捷地体验 LLM 对话带来的便利。
易用、灵活、高效的开源大模型应用开发框架。
Agently是一个开源的大模型应用开发框架,旨在帮助开发者快速构建基于大语言模型的AI agent原生应用。它通过提供一系列工具和接口,简化了与大型语言模型的交互过程,使得开发者可以更专注于业务逻辑的实现。Agently框架支持多种模型,易于安装和配置,具有高度的灵活性和扩展性。
先进的大型语言模型,具备推理和编程能力。
Mistral-Large-Instruct-2407是一个拥有123B参数的先进大型语言模型(LLM),具备最新的推理、知识和编程能力。它支持多语言,包括中文、英语、法语等十种语言,并且在80多种编程语言上受过训练,如Python、Java等。此外,它还具备代理中心能力和先进的数学及推理能力。
人类中心语言模型和模拟器的领导者
Nous Research专注于开发以人为中心的语言模型和模拟器,致力于将AI系统与现实世界用户体验对齐。我们的主要研究领域包括模型架构、数据合成、微调和推理。我们优先开发开源、人类兼容的模型,挑战传统的封闭模型方法。
大型语言模型,支持多语言和编程语言文本生成。
Nemotron-4-340B-Base是由NVIDIA开发的大型语言模型,拥有3400亿参数,支持4096个token的上下文长度,适用于生成合成数据,帮助研究人员和开发者构建自己的大型语言模型。模型经过9万亿token的预训练,涵盖50多种自然语言和40多种编程语言。NVIDIA开放模型许可允许商业使用和派生模型的创建与分发,不声明对使用模型或派生模型生成的任何输出拥有所有权。
评估大型语言模型作为全栈开发者的能力
FullStack Bench是一个多语言的全栈编程基准测试,涵盖了广泛的应用领域和16种编程语言的3K测试样本,显著推动了代码语言模型在现实世界代码开发场景中的相关能力。该产品代表了编程语言模型在全栈开发领域的应用,其重要性在于能够评估和提升模型在实际编程任务中的表现,对于开发者和AI研究者来说都是一个宝贵的资源。
基于仓颉编程语言构建的 LLM Agent 开发框架。
CangjieMagic 是一个基于仓颉编程语言构建的 LLM Agent 开发框架,支持多种功能,包括任务智能规划和模块化调用。该框架旨在提升应用程序的智能和创造力,适合开发者使用。
处理长文本的大型语言模型
LongLLaMA 是一个大型语言模型,能够处理长篇文本。它基于 OpenLLaMA,并使用 Focused Transformer (FoT) 方法进行了微调。它能够处理长达 256k 标记甚至更多的文本。我们提供了一个较小的 3B 基础模型(未经过指令调整),并在 Hugging Face 上提供了支持更长上下文的推断代码。我们的模型权重可以作为现有实现中 LLaMA 的替代品(适用于最多 2048 个标记的短上下文)。此外,我们还提供了评估结果和与原始 OpenLLaMA 模型的比较。
AI驱动开发环境,集成AI Flow到编码工作流程中。
Windsurf AI Directory 提供了一个精选的资源、教程和指南集合,旨在为Windsurf AI Editor这一下一代AI驱动开发环境赋能。Windsurf AI Editor通过集成AI Flow到编码工作流程中,促进了开发者与AI的协作,提高了开发效率和质量。它通过提供AI编程伙伴Cascade、生产力特性、高级开发技术等,助力开发者构建交互式游戏、复杂的商业应用和革新的Web开发。
MarsCode,一款集成AI编程助手的集成开发环境,让编程更高效。
MarsCode是一个基于云的编程集成开发环境(IDE),通过内置的AI编程助手,提供代码补全、代码生成、代码解释、智能优化建议等功能,大幅提高开发效率。它支持一键式弹性部署,无需配置即可初始化开发环境,支持多模板创建项目,满足不同开发需求。MarsCode以其快速、稳定、无需下载和配置的特点,成为编程领域的创新产品。
开源代码语言模型,提升编程智能。
DeepSeek-Coder-V2是一个开源的Mixture-of-Experts (MoE) 代码语言模型,性能与GPT4-Turbo相当,在代码特定任务上表现卓越。它在DeepSeek-Coder-V2-Base的基础上,通过6万亿token的高质量多源语料库进一步预训练,显著增强了编码和数学推理能力,同时保持了在通用语言任务上的性能。支持的编程语言从86种扩展到338种,上下文长度从16K扩展到128K。
汇总和比较全球主要AI模型提供商的价格信息
AIGCRank大语言模型API价格对比是一个专门汇总和比较全球主要AI模型提供商的价格信息的工具。它为用户提供最新的大语言模型(LLM)的价格数据,包括一些免费的AI大模型API。通过这个平台,用户可以轻松查找和比较OpenAI、Claude、Mixtral、Kimi、星火大模型、通义千问、文心一语、Llama 3、GPT-4、AWS和Google等国内外主要API提供商的最新价格,确保找到最适合自己项目的模型定价。
使用大型语言模型生成机器人模拟任务
GenSim利用大型语言模型生成大量的机器人模拟任务,支持目标导向生成和探索性生成两种模式,可用于多任务策略训练和任务级别泛化。使用GPT4扩展了现有基准测试10倍以上,支持超过100个任务,通过有监督微调和评估多个LLM,包括微调的GPT和Code Llama,生成机器人模拟任务的代码。最小的模拟到真实世界的适应后,预训练在GPT4生成的模拟任务上的多任务策略在真实世界中展现了更强的转移能力,超过基线25%。
用于提示工程的开源可视化编程环境
ChainForge是一款开源的可视化编程环境,专注于提示工程。它可以让你评估提示和文本生成模型的稳健性,超越了简单的案例证据。我们认为,提示多个大型语言模型、比较它们的响应并测试关于它们的假设,应该不仅容易,而且有趣。ChainForge提供了一套工具,以最小的努力评估和可视化提示(和模型)的质量。换句话说,它旨在让大型语言模型的评估变得简单。ChainForge开箱即用地支持测试提示注入攻击的稳健性、测试响应格式的一致性、发送大量参数化提示并导出到Excel文件、验证同一模型不同设置的响应质量、测量不同系统消息对ChatGPT输出的影响等。
轻量级语言模型编程库,将提示视为函数。
ell是一个轻量级的语言模型编程库,它将提示视为函数,而不是简单的字符串。ell的设计基于在OpenAI和创业生态系统中多年构建和使用语言模型的经验。它提供了一种全新的编程方式,允许开发者通过定义函数来生成发送给语言模型的字符串提示或消息列表。这种封装方式为用户创建了一个清晰的接口,用户只需关注LMP所需的数据。ell还提供了丰富的工具,支持监控、版本控制和可视化,使得提示工程从一门黑艺术转变为一门科学。
大规模基础世界模型,生成多样的3D可操作环境
Genie 2是由Google DeepMind开发的一款大规模基础世界模型,能够基于单一提示图像生成无尽的、可操作的、可玩的3D环境,用于训练和评估具身智能体。Genie 2代表了深度学习和人工智能领域的一大进步,它通过模拟虚拟世界及其行动后果,展示了在大规模生成模型中的多种紧急能力,如物体交互、复杂角色动画、物理模拟等。Genie 2的研究推动了新的创意工作流程,用于原型化交互体验,并为未来更通用的AI系统和智能体的研究提供了新的可能性。
首款AI代理型集成开发环境(IDE),让开发者与AI的协作流畅无间。
Windsurf Editor是Codeium推出的首款AI代理型IDE,它不仅集成了Codeium的所有功能,还提供了无与伦比的性能和用户体验,让开发者能够与AI无缝协作。该产品代表了编程领域的最新技术,通过AI的深度集成,提供了代码自动补全、代码理解和重构、命令建议和执行等高级功能,极大地提高了开发效率和代码质量。Windsurf Editor的定价策略和市场定位旨在为专业开发者提供高端的编程工具,以满足他们对高性能和高效率的需求。
为开发者提供数据库管理工具,通过AI生成模拟数据,简化本地开发环境的数据配置。
Snaplet是一个面向开发者的数据库管理工具,它通过AI技术生成与生产环境相似的模拟数据,用于本地开发环境、端到端测试和调试。它支持TypeScript配置,提供类型安全性和自动化值及关系更新,帮助开发者更高效、安全地管理开发环境中的数据。
© 2026 AIbase 备案号:闽ICP备08105208号-14