Windows Agent Arena

简介:

用于测试和开发AI代理的可扩展开源框架

功能:

支持150多个多样化的Windows任务,涵盖文档编辑、网页浏览、系统任务、编程、视频观看和实用工具。

提供确定性的任务评估,使用自定义脚本来生成每个任务结束时的奖励。

支持Azure云平台的并行化,大幅缩短基准测试评估时间。

使用Docker容器和Windows 11虚拟机,提供灵活的本地执行和安全的云并行化。

引入了新的多模态代理Navi,展示了在Windows导航任务中的性能。

提供Navi代理的定量和定性分析,以及未来研究的挑战和机遇。

需求人群:

"目标受众为AI研究人员、软件开发者和需要在Windows环境中自动化复杂任务的企业。WAA提供了一个平台,使他们能够开发和测试能够理解屏幕内容、规划行动并使用工具的AI代理。"

浏览量:16

s1785318098921236

打开站点

构建AI去赚钱
s1785341518918206
类似产品

© 2024     AIbase    备案号:闽ICP备08105208号-14

隐私政策

用户协议

意见反馈 网站地图